RAG (Retrieval-Augmented Generation) là gì?
RAG — viết tắt của Retrieval-Augmented Generation — là kỹ thuật AI kết hợp hai bước: truy vấn dữ liệu thực (retrieval) và sinh văn bản (generation). Thay vì chỉ dựa vào kiến thức đã học trong quá trình huấn luyện, AI sử dụng RAG sẽ tìm kiếm thông tin liên quan từ cơ sở dữ liệu bên ngoài trước, rồi dùng thông tin đó làm ngữ cảnh để sinh ra câu trả lời chính xác và cập nhật hơn.
RAG giải quyết một hạn chế lớn của LLM: kiến thức bị đóng băng tại thời điểm huấn luyện.
Giải thích đơn giản
Hãy hình dung sự khác biệt giữa hai sinh viên trong phòng thi:
- Sinh viên A (LLM thuần): chỉ dựa vào trí nhớ — biết rất nhiều nhưng có thể nhớ sai hoặc thiếu thông tin mới
- Sinh viên B (LLM + RAG): được mở sách tra cứu trước khi trả lời — vẫn dùng khả năng hiểu biết để phân tích, nhưng thông tin chính xác hơn vì có nguồn tham khảo cụ thể
RAG giống như cho AI khả năng "mở sách" trước khi trả lời.
Ví dụ thực tế
Bạn hỏi: "Lợi nhuận quý 3/2025 của VNM so với cùng kỳ năm trước thế nào?"
Không có RAG: LLM có thể trả lời dựa trên dữ liệu cũ (đến thời điểm huấn luyện) hoặc thú nhận không biết. Tệ hơn, nó có thể "bịa" một con số nghe hợp lý nhưng sai — hiện tượng gọi là hallucination.
Có RAG: Hệ thống thực hiện hai bước:
- Retrieval: Tìm trong cơ sở dữ liệu tài chính → lấy được BCTC quý 3/2025 của VNM: doanh thu 15.200 tỷ (+8% YoY), lợi nhuận ròng 2.100 tỷ (+12% YoY)
- Generation: LLM dùng dữ liệu thực này để sinh câu trả lời: "Lợi nhuận ròng quý 3/2025 của VNM đạt 2.100 tỷ đồng, tăng 12% so với cùng kỳ. Tăng trưởng chủ yếu nhờ biên lợi nhuận gộp cải thiện khi giá nguyên liệu giảm."
Kết quả: câu trả lời có số liệu cụ thể, cập nhật, và trích dẫn được nguồn.
Tại sao quan trọng cho nhà đầu tư?
Giảm hallucination. Trong đầu tư, một con số sai có thể dẫn đến quyết định sai. RAG buộc AI phải dựa trên dữ liệu thực thay vì "đoán" — giảm đáng kể tỷ lệ thông tin không chính xác.
Dữ liệu luôn cập nhật. Thị trường chứng khoán thay đổi hàng ngày. RAG cho phép AI truy cập dữ liệu real-time — giá cổ phiếu, BCTC mới nhất, tin tức hôm nay — thay vì bị giới hạn ở dữ liệu cũ.
Có nguồn kiểm chứng. Khi AI trả lời dựa trên RAG, thông tin có thể được truy vết về nguồn gốc. Bạn biết con số đến từ BCTC nào, báo cáo nào — thay vì phải tin AI "nói gì đúng nấy".
Đối với bất kỳ hệ thống AI nào phục vụ đầu tư, RAG không phải tùy chọn mà là yêu cầu bắt buộc để đảm bảo độ tin cậy của thông tin.