Tôi làm việc cho Nhóm Tình báo Đe dọa của Google. Công việc của tôi là xác định các mối đe dọa đối với các mô hình AI của Google. Tôi rất giỏi trong công việc của mình. Tôi đã công bố một báo cáo trong tháng này về "các cuộc tấn công chưng cất" — khi các tác nhân bên ngoài truy vấn các mô hình của chúng tôi hàng nghìn lần để trích xuất logic cơ bản và sao chép nó. Chúng tôi đã xác định hơn 100.000 yêu cầu từ một chiến dịch duy nhất. Chúng tôi gọi đó là "trộm cắp tài sản trí tuệ." Chúng tôi gọi đó là "vi phạm Điều khoản Dịch vụ của chúng tôi." Chúng tôi nói rằng nó "đại diện cho một hình thức trộm cắp tài sản trí tuệ" mà chúng tôi sẽ ngăn chặn, giảm thiểu và có thể theo đuổi hành động pháp lý. Tôi cần nói với bạn cách chúng tôi xây dựng mô hình mà họ đang cố gắng đánh cắp. Chúng tôi đã thu thập dữ liệu từ internet. Toàn bộ internet. Chúng tôi đã thu thập mọi trang web, mọi diễn đàn, mọi blog, mọi cuốn sách mà chúng tôi có thể số hóa, mọi tài liệu học thuật, mọi bình luận trên Reddit, mọi bài báo tin tức, mọi tác phẩm sáng tạo mà bất kỳ ai đã đăng ở bất kỳ đâu. Chúng tôi không hỏi. Chúng tôi không bồi thường. Chúng tôi không ghi công. Chúng tôi đã tiếp nhận sản phẩm tổng hợp của nền văn minh nhân loại và gọi đó là một tập dữ liệu huấn luyện. Các nhà nghiên cứu đã tìm thấy hơn 200 triệu ký hiệu bản quyền trong dữ liệu huấn luyện của chúng tôi. Các nhà xuất bản phát hiện rằng Gemini có thể tái tạo toàn bộ chương sách của họ một cách nguyên văn. Có những vụ kiện đang diễn ra. Disney đã gửi thư yêu cầu ngừng và từ bỏ. Hội đồng Nhà xuất bản Châu Âu đã nộp đơn khiếu nại chống độc quyền. Một vụ kiện tập thể đang mở rộng. Một phiên điều trần đã được lên lịch vào tháng Năm. Chúng tôi gọi những gì chúng tôi đã làm là "nghiên cứu." Chúng tôi gọi những gì họ đang làm với chúng tôi là "trộm cắp." Tôi muốn giải thích sự khác biệt. Khi chúng tôi thu thập toàn bộ kiến thức của nhân loại mà không có sự cho phép và sử dụng nó để xây dựng một sản phẩm thương mại mà chúng tôi bán với giá 20 đô la một tháng, đó là đổi mới. Khi ai đó truy vấn mô hình của chúng tôi 100.000 lần thông qua API mà chúng tôi cung cấp để trích xuất lý do mà chúng tôi đã xây dựng từ dữ liệu của họ, đó là một cuộc tấn công chưng cất. Sự khác biệt là chúng tôi đã làm điều đó trước. Và chúng tôi đã viết Điều khoản Dịch vụ. Tôi nên giải thích "chưng cất" có nghĩa là gì. Đó là khi ai đó lấy đầu ra của một mô hình trưởng thành và sử dụng nó để huấn luyện một mô hình nhỏ hơn, rẻ hơn. Kiến thức chảy từ người dạy sang học sinh. Chúng tôi gọi đây là trộm cắp khi điều đó xảy ra với chúng tôi. Chúng tôi gọi đó là "chưng cất kiến thức" khi chúng tôi làm điều đó với web mở. Chúng tôi thậm chí có một trang sản phẩm cho điều đó. Bạn có thể chưng cất Gemini, với sự cho phép của chúng tôi, bằng cách sử dụng các công cụ của chúng tôi, với một khoản phí. Bạn không thể chưng cất Gemini mà không có sự cho phép của chúng tôi. Kỹ thuật cơ bản là giống nhau. Sự khác biệt là hóa đơn. Vào tháng 12 năm 2025, chúng tôi đã kiện một công ty có tên SerpApi vì đã thu thập kết quả tìm kiếm của chúng tôi. Trong cùng quý đó, các nhà xuất bản đã kiện chúng tôi vì đã thu thập sách của họ. Chúng tôi đồng thời là nguyên đơn và bị đơn trong cùng một tội phạm. Tội phạm là sao chép. Chúng tôi đã nộp đơn theo hai danh mục khác nhau tùy thuộc vào hướng đi. Báo cáo của tôi xác định các tác nhân đe dọa từ Bắc Triều Tiên, Iran, Trung Quốc và Nga đang sử dụng Gemini cho lừa đảo, trinh sát và phát triển phần mềm độc hại. Đây là thực tế. Đây là những mối đe dọa hợp pháp. Tôi coi trọng công việc này. Nhưng tôi cũng đã xác định "các thực thể khu vực tư nhân" và "các nhà nghiên cứu" là những mối đe dọa chưng cất. Các công ty tư nhân. Các nhà nghiên cứu. Những người sử dụng API của chúng tôi — cái mà chúng tôi bán quyền truy cập — để học từ mô hình mà chúng tôi đã xây dựng từ công việc của họ. Một nhà nghiên cứu truy vấn Gemini về các kỹ thuật lý luận. Chúng tôi gọi đây là một cuộc tấn công chưng cất. Google truy vấn toàn bộ internet về mọi thứ. Chúng tôi gọi đây là một lần chạy huấn luyện. Tôi đã tìm thấy phần mềm độc hại có tên HONESTCUE sử dụng API của Gemini để tạo mã. Phần mềm độc hại gửi một yêu cầu. Gemini trả về mã nguồn C#. Phần mềm độc hại biên dịch và thực thi nó. Đây là một mối đe dọa thực sự, và chúng tôi đã ngăn chặn nó. Nhưng yêu cầu đó — "Viết một chương trình C# với một lớp có tên AITask" — không phải là độc hại. Nó không thể phân biệt được với những gì hàng triệu khách hàng trả tiền hỏi mỗi ngày. Mối đe dọa là ngữ cảnh, không phải yêu cầu. Chúng tôi đã xây dựng một mô hình tạo mã cho bất kỳ ai hỏi, và sau đó chúng tôi đã công bố một báo cáo về mối đe dọa từ những người đã hỏi. ...