vLLM + open-webui uruchamiające gpt-oss-120b na tinybox green v2 Po prostu `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling` i masz lokalne API OpenAI, któremu możesz zaufać.
25,97K