.@AnkythShukla 在播客上提出了一個大膽的主張: 「比開發者更好,比設計師更好,比 CEO 和商業人士更好,PM 基本上處於一個應該擁有評估的地位。他們擁有業務、客戶和技術的知識。」 這是一個結構性論點,而不是意見。這就是為什麼它重要: > 工程師理解模型。他們不理解客戶對「良好輸出」的定義。 > 設計師理解體驗。他們不理解非確定性系統的技術限制。 > 商業領導者理解投資回報率。他們不理解 LLM 評判是什麼或如何校準一個。 > PM 坐落於三者的交集。這正是 AI 評估所要求的 - 一個能夠將業務需求轉化為可衡量的評估標準的人,然後驗證 AI 在生產中是否實際滿足這些標準。 AI 評估不是重新品牌的 QA 測試。這是一個根本新的學科。而 PM 是自然的擁有者。 完整的集數逐步解析了確切的指標、工具和 LLM 評判框架。