vLLM + open-webui 在 tinybox green v2 上运行 gpt-oss-120b 只需 `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling`,你就可以拥有一个值得信赖的本地 OpenAI API。
25.97K