Agentic RAG: เมื่อ RAG ไม่พอ ต้องให้ Agent คิดเอง

บทนำ

Agentic RAG คือการนำ Autonomous AI Agent มาผสานเข้ากับ RAG pipeline แบบดั้งเดิม โดย Agent จะไม่ได้ทำแค่ retrieval อย่างเดียว แต่จะ "คิด" ได้เอง — วิเคราะห์ query, วางแผน approach, เลือก tools/sources ที่เหมาะสม, ประเมินผลลัพธ์ที่ได้ และ retry/เปลี่ยนกลยุทธ์เมื่อจำเป็น

ทำไม RAG แบบเดิมถึงไม่พอ?

RAG แบบดั้งเดิม (Traditional RAG)

RAG หรือ Retrieval-Augmented Generation แบบดั้งเดิมทำงานง่ายๆ:

รับคำถามจากผู้ใช้

ไปค้นหาข้อมูลจาก vector database

เอาข้อมูลที่เจอมาให้ LLM สรุป

ตอบคำถาม

ปัญหาของ RAG แบบเดิม:

ถามแล้วค้นไม่เจอ → ตอบผิดหรือบอกว่าไม่รู้ คำถามซับซ้อนที่ต้องค้นจากหลายแหล่ง → ทำไม่ได้ ไม่สามารถปรับเปลี่ยนกลยุทธ์การค้นหาเองได้ ตาม McKinsey 58% ขององค์กรที่ใช้ RAG พบว่า "multi-step reasoning" เป็นข้อจำกัดอันดับ 1

Agentic RAG แตกต่างยังไง?

Agentic RAG แทนที่จะทำตาม pipeline ตายตัว จะให้ AI Agent เป็นคน "คิด" ว่าจะทำยังไง: วิเคราะห์คำถาม ก่อนว่าซับซ้อนแค่ไหน ต้องการอะไรบ้าง วางแผน ว่าจะค้นจากไหน ใช้ tool อะไร กี่ขั้นตอน เลือก tools/sources เอง ได้ เช่น ค้นเว็บ, ดึงจาก database, เรียก API ประเมินผลลัพธ์ ว่าคำตอบที่ได้ดีพอไหม ลองใหม่ ถ้าคำตอบไม่ดี เปลี่ยนวิธีค้นแล้ววนซ้ำ

เปรียบเทียบ: RAG แบบเดิม = ห้องสมุดที่มีเจ้าหน้าที่หนังสือให้ (ค้นแล้วส่ง) / Agentic RAG = นักวิจัยที่วางแผน ค้นหาหลายแหล่ง ประเมินข้อมูล แล้วสรุปให้

สถาปัตยกรรมของ Agentic RAG

ส่วนประกอบหลัก

1. Planner/Router

วิเคราะห์ query แล้วตัดสินใจว่าจะใช้ approach ไหน คำถามง่าย → ส่งไป RAG แบบเดิม (เร็วและประหยัด) คำถามซับซ้อน → ส่งไป multi-step agent pipeline

2. Tool-calling Agents

Agent ที่สามารถเรียกใช้ tools ต่างๆ ได้ เช่น: Web search SQL query Vector database lookup API calls Document parsers

3. Verification Loop

ตรวจสอบว่าข้อมูลที่ได้มาเชื่อถือได้ไหม ถ้ายังไม่ดี → ปรับ query แล้วค้นใหม่ ทำซ้ำจนกว่าจะได้คำตอบที่น่าพอใจ

เทียบ RAG แบบเดิม vs Agentic RAG

ด้าน	RAG แบบเดิม	Agentic RAG
การค้นหา	ค้นครั้งเดียว	ค้นหลายครั้ง หลายแหล่ง
การวางแผน	ไม่มี	วางแผน approach เอง
การใช้ tools	ใช้แค่ vector search	เลือกใช้ tools ได้หลายแบบ
การปรับปรุง	ไม่สามารถ retry ได้	ตรวจสอบแล้วลองใหม่ได้
ความซับซ้อน	ง่าย ตั้งค่าน้อย	ซับซ้อนกว่า แต่เก่งกว่า
ต้นทุน	ถูกกว่า	แพงกว่า (ใช้ token มากกว่า)

ใช้กรณีไหนถึงคุ้ม?

ควรใช้ Agentic RAG:

งานวิจัยที่ต้องค้นจากหลายแหล่ง — เช่น วิเคราะห์ตลาด ต้องดูข่าว งบการเงิน ข้อมูลคู่แข่ง ระบบตอบคำถามที่ต้องแม่นยำ — เช่น medical, legal, financial advice งานที่มี multi-step reasoning — ต้องตอบคำถามที่แตกย่อยได้หลายชั้น Enterprise knowledge management — องค์กรที่มีข้อมูลกระจายอยู่หลายระบบ

ไม่จำเป็นต้องใช้:

คำถามง่ายๆ ที่ RAG แบบเดิมตอบได้ งานที่ต้องการความเร็วมาก (Agentic RAG ช้ากว่าเพราะต้องคิดหลาย step) งานที่ไม่ซับซ้อนและค้นจากแหล่งเดียวพอ

LLM ไหนเหมาะกับ Agentic RAG?

จากข้อมูลปัจจุบัน (2026): GPT-5.2 และ Claude Opus 4.6+ — เก่งเรื่อง tool use และ multi-step reasoning เหมาะเป็น planner/agent หลัก GPT-5-mini หรือ Gemini 2.5 Flash — ตัวเลือกประหยัดสำหรับ routing/planning step โมเดลเล็ก — ใช้ได้สำหรับ tasks ที่ไม่ซับซ้อน

สรุป

Agentic RAG คือก้าวต่อไปของ RAG — จากที่เคยเป็น "ระบบค้นหา + สรุป" แบบตายตัว กลายเป็น "ระบบที่คิด วางแผน และตัดสินใจเองได้" โดยฝัง AI Agent เข้าไปใน pipeline ทำให้ระบบสามารถจัดการคำถามที่ซับซ้อน ค้นจากหลายแหล่ง ตรวจสอบผลลัพธ์ และปรับเปลี่ยนกลยุทธ์ได้เอง แต่สิ่งสำคัญ: Agentic RAG ไม่ได้มาแทน Traditional RAG — สำหรับงานที่เรียบง่าย RAG แบบเดิมยังเร็วและประหยัดกว่า แต่สำหรับงานที่ต้องการความแม่นยำ ซับซ้อน และต้องให้ AI "คิด" มากขึ้น Agentic RAG คือคำตอบ แหล่งอ้างอิง: https://crazyrouter.com/en/blog/agentic-rag-build-smarter-ai-agents-retrieval-augmented-generation-2026