Рандомізоване дослідження 3 LLM показує, що вони не готові до публічного використання @NatureMedicine
«У нашій роботі ми виявили, що жодна з протестованих мовних моделей не була готова до впровадження у безпосередній догляді за пацієнтами. Незважаючи на високі результати лише LLM, як за існуючими бенчмарками, так і за нашими сценаріями, медична експертиза була недостатньою для ефективного пацієнта турбуєшся."
23