thực sự thích bài báo này từ openai về cách mọi người sử dụng chatgpt. nhu cầu về suy diễn sẽ tiếp tục bùng nổ trong 1-2 năm tới. rõ ràng là một phần đáng kể trong đó sẽ cần truy cập thời gian thực vào web. hôm nay, các lựa chọn mà các công ty AI có là: thu thập dữ liệu từ google, thu thập dữ liệu từ bing (đã ngừng cung cấp api), hoặc xếp hạng lại các kết quả tìm kiếm đã lưu/cache với mạng nơ-ron (một số công ty khởi nghiệp đang làm điều này). không cái nào trong số này thực sự có thể mở rộng. hôm nay, Grass được các công ty sử dụng để cung cấp một lượng lớn dữ liệu đào tạo (2-3 petabyte mỗi ngày), hầu hết trong số đó là đa phương thức. khi nhu cầu tính toán cho suy diễn chuyển đổi từ đào tạo, chúng tôi mong đợi cùng một cơ sở hạ tầng đang được sử dụng để thu thập dữ liệu đào tạo sẽ được sử dụng cho Truy xuất Ngữ cảnh Trực tiếp.