vLLM + open-webui 在 tinybox green v2 上運行 gpt-oss-120b 只需 `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling`,你就可以擁有一個值得信賴的本地 OpenAI API。
25.98K