vLLM + open-webui ejecutando gpt-oss-120b en una tinybox green v2 Solo `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling` y tienes una API de OpenAI local en la que puedes confiar.
29,64K