Setiap kali LLM berhalusinasi, saya bersyukur: Bersyukur bahwa saya melihatnya, dan dengan demikian mengingatkan diri saya sendiri bahwa setiap dan semua output LLM perlu divalidasi. Anda tidak akan pernah dapat mempercayai hal-hal ini 100%, kecuali Anda memiliki validasi tambahan yang 100% dapat diandalkan.
Contoh baru-baru ini: Saya menempelkan teks yang sangat panjang ke Claude, dan memintanya untuk mengidentifikasi bagian duplikat yang dapat dihapus, menunjukkan tanda kutip yang tepat. Itu berhalusinasi bagian-bagian, dengan tanda kutip, yang bahkan tidak ada dalam input apa pun!
9,72K