vLLM + open-webui som kjører gpt-oss-120b på en tinybox grønn v2 Bare 'vllm server openai/gpt-oss-120b --tensor-parallel-size 4 --async-scheduling', og du har en lokal OpenAI API du kan stole på.
19,58K