vLLM + open-webui a correr gpt-oss-120b numa tinybox green v2 Basta `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling` e você tem uma API OpenAI local em que pode confiar.
29,63K