vLLM + open-webui під керуванням gpt-oss-120b на tinybox green v2 Просто 'vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling', і у вас є локальний API OpenAI, якому можна довіряти.
25,97K