vLLM + open-webui запускает gpt-oss-120b на tinybox green v2 Просто `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling`, и у вас есть локальный API OpenAI, которому можно доверять.
25,98K