vLLM + open-webui exécutant gpt-oss-120b sur une tinybox green v2 Il suffit de `vllm serve openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling` et vous avez une API OpenAI locale en laquelle vous pouvez avoir confiance.
25,98K