Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Andrej Karpathy ủng hộ việc giới thiệu một thuật ngữ mới liên quan đến "kỹ thuật ngữ cảnh" trong phát triển phần mềm AI sử dụng LLMs.
Và thuật ngữ này từ lâu đã có vẻ rất cần thiết. Mỗi khi tôi giải thích cho mọi người cách chúng tôi phát triển AuditAgent của Nethermind, một trong những khía cạnh chính, bên cạnh việc sử dụng chuyên môn trong lĩnh vực (bảo mật web3) và sử dụng các mô hình AI tốt nhất có sẵn (từ OpenAI, Anthropic và Google), và các công cụ cho LLM, chính là "kỹ thuật ngữ cảnh".
Đôi khi có một câu nói "ngữ cảnh là vua," và điều đó thực sự đúng. LLMs, dù là những mô hình lớn tiên tiến hay những LLM nhỏ được tối ưu hóa, đều là một công cụ mạnh mẽ, nhưng giống như bất kỳ công cụ nào, nếu nó nằm trong tay sai, bạn sẽ nhận được kết quả kém hứa hẹn hơn nhiều so với những gì bạn có thể đạt được nếu làm việc với chúng một cách chính xác. Và quản lý (hoặc kỹ thuật) ngữ cảnh thực sự là một lĩnh vực phức tạp và không được mô tả rõ ràng, đang liên tục phát triển, và nó thực sự xuất hiện như một sự mở rộng của khái niệm kỹ thuật prompt, vốn đã có một số ý nghĩa tiêu cực.
Tổng thể, Andrej đã liệt kê các khía cạnh chính liên quan đến kỹ thuật ngữ cảnh (trên ảnh chụp màn hình thứ hai), nhưng trong mỗi nhiệm vụ cụ thể, mọi người đạt được kết quả xuất sắc phần lớn thông qua thử nghiệm và sai sót, mỗi lần đơn điệu cố gắng chọn các yếu tố ngữ cảnh phù hợp thực sự cần thiết ở giai đoạn giải quyết vấn đề này, thu thập các tiêu chuẩn cho mỗi giai đoạn, xem xét các chỉ số, chia tập dữ liệu thành kiểm tra, xác thực, và nhiều hơn nữa.
Bạn nghĩ gì về "kỹ thuật ngữ cảnh"?

25 thg 6, 2025
+1 cho "kỹ thuật ngữ cảnh" hơn là "kỹ thuật nhắc nhở".
Mọi người liên kết các nhắc nhở với những mô tả nhiệm vụ ngắn mà bạn sẽ đưa cho một LLM trong việc sử dụng hàng ngày của bạn. Khi mà trong mọi ứng dụng LLM công nghiệp, kỹ thuật ngữ cảnh là nghệ thuật và khoa học tinh tế của việc lấp đầy cửa sổ ngữ cảnh với thông tin chính xác cho bước tiếp theo. Khoa học vì làm điều này đúng đắn liên quan đến mô tả nhiệm vụ và giải thích, ví dụ ít shot, RAG, dữ liệu liên quan (có thể đa phương thức), công cụ, trạng thái và lịch sử, nén... Quá ít hoặc sai hình thức và LLM không có ngữ cảnh đúng cho hiệu suất tối ưu. Quá nhiều hoặc không liên quan và chi phí của LLM có thể tăng lên và hiệu suất có thể giảm xuống. Làm điều này tốt là rất không đơn giản. Và nghệ thuật vì trực giác hướng dẫn xung quanh tâm lý LLM của tinh thần con người.
Ngoài kỹ thuật ngữ cảnh, một ứng dụng LLM phải:
- phân chia vấn đề một cách chính xác thành các luồng điều khiển
- đóng gói các cửa sổ ngữ cảnh một cách chính xác
- gửi các cuộc gọi đến các LLM đúng loại và khả năng
- xử lý các luồng UIUX tạo ra-xác minh
- còn nhiều hơn nữa - rào chắn, bảo mật, đánh giá, song song, tiền lấy trước, ...
Vì vậy, kỹ thuật ngữ cảnh chỉ là một phần nhỏ trong một lớp phần mềm dày đang nổi lên không đơn giản mà phối hợp các cuộc gọi LLM riêng lẻ (và nhiều hơn nữa) thành các ứng dụng LLM đầy đủ. Thuật ngữ "bọc ChatGPT" đã trở nên nhàm chán và thực sự, thực sự sai.
484
Hàng đầu
Thứ hạng
Yêu thích