Tôi đã suy nghĩ về một khái niệm mà tôi sẽ gọi là "ontologie ngữ cảnh" - chủ yếu vì tôi ước gì có một nơi duy nhất để xem ngữ cảnh đến từ đâu và những gợi ý nào được sử dụng.
Ngữ cảnh hữu ích cho một LLM để tạo ra phản hồi hoặc thực hiện hành động có thể bao gồm những điều như (1) mục tiêu cấp cao, (2) nhiệm vụ/khu vực tập trung hiện tại, (3) thông tin tóm tắt từ các nhiệm vụ trước đó có liên quan, (4) những bài học từ các nỗ lực trước, v.v.
Khi chúng ta mong đợi nhiều hơn từ các tác nhân của mình (các nhiệm vụ dài hơn, các dự án phức tạp hơn, v.v.), bộ nhớ thô nhanh chóng trở nên nặng nề và ồn ào, điều này làm giảm chất lượng đầu ra của LLM. Hầu hết các ứng dụng AI phức tạp đều có một loại ngữ cảnh tóm tắt nào đó (tôi giả định), và nhiều nguồn ngữ cảnh khác nhau.
Ý tưởng ở đây là định nghĩa một ontologie cho những gì bạn lưu trữ*, cách cấu trúc nó, và những gì cần truy xuất cho mỗi gợi ý trong hệ thống của bạn.
*Bằng cách lưu trữ, tôi không nhất thiết có nghĩa là trong cơ sở dữ liệu của AI. Theo tôi, có vẻ hợp lý hơn khi xem dữ liệu được lưu trữ trong bất kỳ ứng dụng nào là một phần của bộ nhớ của AI (ví dụ: kết nối API/MCP). Có thể ontologie này cũng nên chỉ định điều này.
Đi xa hơn một bước, bạn có thể biến điều này thành một ontologie động mà một AI có thể quản lý và kiểm tra, sau đó đưa nó vào một môi trường RL để các tác nhân tự cải thiện quản lý ngữ cảnh (giả thuyết).
Không chắc liệu chiến lược tóm tắt có nên đưa vào đây hay không nhưng có vẻ hợp lý ở cấp độ cao. Khó khăn hơn vì hầu hết mọi người tóm tắt thông tin khi tiếp nhận nên bạn sẽ phải tóm tắt lại các tiếp nhận trước mỗi khi bạn thay đổi nó (để thử nghiệm các thay đổi và tự cải thiện) - nhưng tôi đoán vấn đề này vẫn tồn tại bất kể điều gì.
Tôi không nghĩ rằng bất cứ điều gì ở đây là đặc biệt mới mẻ. Chỉ đang suy nghĩ một cách tự do khi tôi cố gắng tạo ra một số khung nội bộ để lập bản đồ các chiến lược khác nhau mà tôi đã thấy.