RAG (Retrieval-Augmented Generation)

Kỹ thuật AI kết hợp truy vấn dữ liệu thực (retrieval) với sinh văn bản (generation) để trả lời chính xác hơn.

RAG (Retrieval-Augmented Generation) là gì?

RAG — viết tắt của Retrieval-Augmented Generation — là kỹ thuật AI kết hợp hai bước: truy vấn dữ liệu thực (retrieval) và sinh văn bản (generation). Thay vì chỉ dựa vào kiến thức đã học trong quá trình huấn luyện, AI sử dụng RAG sẽ tìm kiếm thông tin liên quan từ cơ sở dữ liệu bên ngoài trước, rồi dùng thông tin đó làm ngữ cảnh để sinh ra câu trả lời chính xác và cập nhật hơn.

RAG giải quyết một hạn chế lớn của LLM: kiến thức bị đóng băng tại thời điểm huấn luyện.

Giải thích đơn giản

Hãy hình dung sự khác biệt giữa hai sinh viên trong phòng thi:

RAG giống như cho AI khả năng "mở sách" trước khi trả lời.

Ví dụ thực tế

Bạn hỏi: "Lợi nhuận quý 3/2025 của VNM so với cùng kỳ năm trước thế nào?"

Không có RAG: LLM có thể trả lời dựa trên dữ liệu cũ (đến thời điểm huấn luyện) hoặc thú nhận không biết. Tệ hơn, nó có thể "bịa" một con số nghe hợp lý nhưng sai — hiện tượng gọi là hallucination.

Có RAG: Hệ thống thực hiện hai bước:

  1. Retrieval: Tìm trong cơ sở dữ liệu tài chính → lấy được BCTC quý 3/2025 của VNM: doanh thu 15.200 tỷ (+8% YoY), lợi nhuận ròng 2.100 tỷ (+12% YoY)
  2. Generation: LLM dùng dữ liệu thực này để sinh câu trả lời: "Lợi nhuận ròng quý 3/2025 của VNM đạt 2.100 tỷ đồng, tăng 12% so với cùng kỳ. Tăng trưởng chủ yếu nhờ biên lợi nhuận gộp cải thiện khi giá nguyên liệu giảm."

Kết quả: câu trả lời có số liệu cụ thể, cập nhật, và trích dẫn được nguồn.

Tại sao quan trọng cho nhà đầu tư?

Giảm hallucination. Trong đầu tư, một con số sai có thể dẫn đến quyết định sai. RAG buộc AI phải dựa trên dữ liệu thực thay vì "đoán" — giảm đáng kể tỷ lệ thông tin không chính xác.

Dữ liệu luôn cập nhật. Thị trường chứng khoán thay đổi hàng ngày. RAG cho phép AI truy cập dữ liệu real-time — giá cổ phiếu, BCTC mới nhất, tin tức hôm nay — thay vì bị giới hạn ở dữ liệu cũ.

Có nguồn kiểm chứng. Khi AI trả lời dựa trên RAG, thông tin có thể được truy vết về nguồn gốc. Bạn biết con số đến từ BCTC nào, báo cáo nào — thay vì phải tin AI "nói gì đúng nấy".

Đối với bất kỳ hệ thống AI nào phục vụ đầu tư, RAG không phải tùy chọn mà là yêu cầu bắt buộc để đảm bảo độ tin cậy của thông tin.

Thuật ngữ liên quan

Chat ZaloGọi ngay