Professional Documents
Culture Documents
Genai Rag
Genai Rag
Genai Rag
APPLICATION
6.53
SERVICE
GEN AI
Video Music Poem
BRAND
NEW
THINGS
Superman
AGI
GENAI ARTIFICIAL
GENERAL
INTELLIGENCE
Banking customer
PAST DATA service
RELATED
https://content.dataiku.com/lg-chem-mfg-success-story 2
GENAI – MÔ HÌNH ỨNG DỤNG RAG (RETRIEVAL AUGMENTED GENERATION)
https://content.dataiku.com/lg-chem-mfg-success-story 3
GENAI – RAG, LÀ GÌ?
RAG (Retrieval Augmented Generation)
• Các LLM có 2 khả năng đặc biệt
• Tri thức nền tảng (gọi là pre-trained model từ nguồn dữ liệu train ban đầu)
• Khả năng lý luận-reasoning (pre-trained model tiếp tục được finetune từ
dữ liệu dạng Q-A khả năng lý luận “tự xuất hiện”)
• Để có thể áp dụng LLM vào dữ liệu đặc thù của tổ chức thì:
• Cần gắn thêm dữ liệu của tổ chức vào LLM (gọi là tăng cường
(augmented), bổ sung vào nguồn tri thức ban đầu)
• Khả năng lý luận vẫn giữ nguyên từ pre-trained model . Tuy nhiên tổ chức
có thể tiếp tục bổ sung dữ liệu dạng Q-A theo dạng history, few-shot
prompting để tăng các lý luận đặc thù của tổ chức.
4
GENAI – MÔ HÌNH ỨNG DỤNG RAG (RETRIEVAL AUGMENTED GENERATION)
RAG
OpenAI was
spending approximately $700,000 per day to
keep up with the demand for ChatGPT.
Microsoft is reportedly losing an average of
$20 per user per month on its AI code
generator
5
MÔ HÌNH ỨNG DỤNG CỦA RAG Knowledge Graph DB
Embedings vector DB
LLM
Chatbot
OpenAI
Gemini
Mixtral
LLAMA
Tổ chức có thể tích lũy dữ liệu của mình vào các database kiểu mới dạng lưu trữ ngữ nghĩa (Vector DB store),
để từ đó có thể tìm kiếm dạng ngữ nghĩa
RAG là bài toán ứng dụng quan trọng và khó, tuy concept dễ hiểu nhưng khó vì dữ liệu nguồn sẵn có của tổ
chức rất lớn và đa dạng cần tính sáng tạo khi triển khai có thể tạo khác biệt, là cơ hội kinh doanh của
HAS
6
NORMAL RAG TECHNIC
9
Data Load + Data Store: OCR – Web scrap – Flow Designer – Vector GraphDB
10
CÔNG CỤ XÂY DỰNG RAG OPENSOURCE ĐÃ READY
12
GENAI – RAG, OTHER FACTORS?
13
THANK YOU