บทนำ
Agentic RAG คือการนำ Autonomous AI Agent มาผสานเข้ากับ RAG pipeline แบบดั้งเดิม โดย Agent จะไม่ได้ทำแค่ retrieval อย่างเดียว แต่จะ "คิด" ได้เอง — วิเคราะห์ query, วางแผน approach, เลือก tools/sources ที่เหมาะสม, ประเมินผลลัพธ์ที่ได้ และ retry/เปลี่ยนกลยุทธ์เมื่อจำเป็น
ทำไม RAG แบบเดิมถึงไม่พอ?
RAG แบบดั้งเดิม (Traditional RAG)
RAG หรือ Retrieval-Augmented Generation แบบดั้งเดิมทำงานง่ายๆ:
- รับคำถามจากผู้ใช้
- ไปค้นหาข้อมูลจาก vector database
- เอาข้อมูลที่เจอมาให้ LLM สรุป
- ตอบคำถาม
ปัญหาของ RAG แบบเดิม:
ถามแล้วค้นไม่เจอ → ตอบผิดหรือบอกว่าไม่รู้ คำถามซับซ้อนที่ต้องค้นจากหลายแหล่ง → ทำไม่ได้ ไม่สามารถปรับเปลี่ยนกลยุทธ์การค้นหาเองได้ ตาม McKinsey 58% ขององค์กรที่ใช้ RAG พบว่า "multi-step reasoning" เป็นข้อจำกัดอันดับ 1
Agentic RAG แตกต่างยังไง?
Agentic RAG แทนที่จะทำตาม pipeline ตายตัว จะให้ AI Agent เป็นคน "คิด" ว่าจะทำยังไง: วิเคราะห์คำถาม ก่อนว่าซับซ้อนแค่ไหน ต้องการอะไรบ้าง วางแผน ว่าจะค้นจากไหน ใช้ tool อะไร กี่ขั้นตอน เลือก tools/sources เอง ได้ เช่น ค้นเว็บ, ดึงจาก database, เรียก API ประเมินผลลัพธ์ ว่าคำตอบที่ได้ดีพอไหม ลองใหม่ ถ้าคำตอบไม่ดี เปลี่ยนวิธีค้นแล้ววนซ้ำ
เปรียบเทียบ: RAG แบบเดิม = ห้องสมุดที่มีเจ้าหน้าที่หนังสือให้ (ค้นแล้วส่ง) / Agentic RAG = นักวิจัยที่วางแผน ค้นหาหลายแหล่ง ประเมินข้อมูล แล้วสรุปให้
สถาปัตยกรรมของ Agentic RAG
ส่วนประกอบหลัก
1. Planner/Router
วิเคราะห์ query แล้วตัดสินใจว่าจะใช้ approach ไหน คำถามง่าย → ส่งไป RAG แบบเดิม (เร็วและประหยัด) คำถามซับซ้อน → ส่งไป multi-step agent pipeline
2. Tool-calling Agents
Agent ที่สามารถเรียกใช้ tools ต่างๆ ได้ เช่น: Web search SQL query Vector database lookup API calls Document parsers
3. Verification Loop
ตรวจสอบว่าข้อมูลที่ได้มาเชื่อถือได้ไหม ถ้ายังไม่ดี → ปรับ query แล้วค้นใหม่ ทำซ้ำจนกว่าจะได้คำตอบที่น่าพอใจ
เทียบ RAG แบบเดิม vs Agentic RAG
| ด้าน | RAG แบบเดิม | Agentic RAG |
|---|---|---|
| การค้นหา | ค้นครั้งเดียว | ค้นหลายครั้ง หลายแหล่ง |
| การวางแผน | ไม่มี | วางแผน approach เอง |
| การใช้ tools | ใช้แค่ vector search | เลือกใช้ tools ได้หลายแบบ |
| การปรับปรุง | ไม่สามารถ retry ได้ | ตรวจสอบแล้วลองใหม่ได้ |
| ความซับซ้อน | ง่าย ตั้งค่าน้อย | ซับซ้อนกว่า แต่เก่งกว่า |
| ต้นทุน | ถูกกว่า | แพงกว่า (ใช้ token มากกว่า) |
ใช้กรณีไหนถึงคุ้ม?
ควรใช้ Agentic RAG:
งานวิจัยที่ต้องค้นจากหลายแหล่ง — เช่น วิเคราะห์ตลาด ต้องดูข่าว งบการเงิน ข้อมูลคู่แข่ง ระบบตอบคำถามที่ต้องแม่นยำ — เช่น medical, legal, financial advice งานที่มี multi-step reasoning — ต้องตอบคำถามที่แตกย่อยได้หลายชั้น Enterprise knowledge management — องค์กรที่มีข้อมูลกระจายอยู่หลายระบบ
ไม่จำเป็นต้องใช้:
คำถามง่ายๆ ที่ RAG แบบเดิมตอบได้ งานที่ต้องการความเร็วมาก (Agentic RAG ช้ากว่าเพราะต้องคิดหลาย step) งานที่ไม่ซับซ้อนและค้นจากแหล่งเดียวพอ
LLM ไหนเหมาะกับ Agentic RAG?
จากข้อมูลปัจจุบัน (2026): GPT-5.2 และ Claude Opus 4.6+ — เก่งเรื่อง tool use และ multi-step reasoning เหมาะเป็น planner/agent หลัก GPT-5-mini หรือ Gemini 2.5 Flash — ตัวเลือกประหยัดสำหรับ routing/planning step โมเดลเล็ก — ใช้ได้สำหรับ tasks ที่ไม่ซับซ้อน
สรุป
Agentic RAG คือก้าวต่อไปของ RAG — จากที่เคยเป็น "ระบบค้นหา + สรุป" แบบตายตัว กลายเป็น "ระบบที่คิด วางแผน และตัดสินใจเองได้" โดยฝัง AI Agent เข้าไปใน pipeline ทำให้ระบบสามารถจัดการคำถามที่ซับซ้อน ค้นจากหลายแหล่ง ตรวจสอบผลลัพธ์ และปรับเปลี่ยนกลยุทธ์ได้เอง แต่สิ่งสำคัญ: Agentic RAG ไม่ได้มาแทน Traditional RAG — สำหรับงานที่เรียบง่าย RAG แบบเดิมยังเร็วและประหยัดกว่า แต่สำหรับงานที่ต้องการความแม่นยำ ซับซ้อน และต้องให้ AI "คิด" มากขึ้น Agentic RAG คือคำตอบ แหล่งอ้างอิง: https://crazyrouter.com/en/blog/agentic-rag-build-smarter-ai-agents-retrieval-augmented-generation-2026