vLLM + open-webui executando gpt-oss-120b em um tinybox verde v2 Basta 'vllm serve openai / gpt-oss-120b --tensor-parallel-size 4 --async-scheduling' e você tem uma API OpenAI local em que pode confiar.
29,63K