GPT-5:n mainostettiin vähentävän hallusinaatioita, ja näyttää siltä, että se toimii. 99,5 -> 99,9 on 80 % vähemmän virheitä. En tiedä, miksi ihmiset eivät tee tästä suurempaa numeroa. Hallusinaatiot ovat yksi LLM:ien suurimmista ongelmista, ja jotkut pitivät niitä ratkaisemattomina.
OpenRouter
OpenRouter15.8. klo 00.29
After one week, GPT-5 has topped our proprietary model charts for tool calling accuracy🥇 In second is Claude 4.1 Opus, at 99.5% Details 👇
135,49K