에이전틱 RAG 완벽 가이드: 고정 파이프라인을 넘어 스스로 사고하는 검색-추론
기존 RAG(Naive RAG)는 대부분 검색 -> 생성의 고정 경로로 동작합니다.
하지만 실제 질문은 정보 부족, 검색 실패, 다단계 추론이 빈번하기 때문에 단일 패스로는 한계가 있습니다.
이 지점에서 필요한 개념이 Agentic RAG입니다.
1. Agentic RAG란?
Agentic RAG는 LLM이 단순 생성기를 넘어 추론(Reasoning) + 행동(Action)을 결합해 문제를 해결하는 RAG 패턴입니다.
- Naive RAG: 정해진 검색 결과를 그대로 요약
- Agentic RAG: 상황을 판단해 검색/재검색/검증/도구 호출을 반복
핵심 루프는 보통 ReAct(Reason + Act) 패턴으로 설명합니다.
- Thought: 지금 무엇이 부족한지 판단
- Action: 검색/API/계산기/DB 질의 같은 도구 실행
- Observation: 결과를 관찰하고 다음 행동 결정
이 루프를 통해 답변 품질을 점진적으로 개선합니다.
2. 왜 필요한가? (Naive RAG의 한계 돌파)
2.1 복합 질문 처리
예: "A와 B의 2023년 실적을 비교해줘"
단일 검색이 아니라, 다중 검색 + 비교 연산이 필요합니다.
2.2 검색 품질 자기 보정
검색 결과가 질문과 어긋나면,
- 키워드 재작성
- 다른 리트리버 사용
- 웹 검색 보강 같은 재시도를 수행할 수 있습니다.
2.3 도구 확장성
벡터 DB 외에도 SQL, 웹 검색, 코드 실행기, 사내 API 등 다양한 도구를 선택적으로 활용합니다.
3. 대표 패턴 3가지
3.1 CRAG (Corrective RAG)
- 검색 결과 품질을 먼저 평가(Grading)
- 품질이 낮으면 외부 검색으로 보강
- 품질이 충분하면 바로 생성 단계 진입
3.2 Self-RAG
- 모델이 자기 답변을 스스로 검토
- 근거 기반성(Faithfulness)과 질문 적합성(Relevance) 점검
- 필요 시 답변 수정 또는 재검색
3.3 Adaptive RAG
- 질문 난이도를 먼저 분류
- 단순 질문: 저비용 빠른 경로
- 복잡 질문: 에이전트 루프 경로
즉, 정확도와 비용/지연 시간을 함께 최적화하는 전략입니다.
4. 구현 스택
LangGraph
LangChain 생태계에서 에이전트 상태와 루프를 설계하기 가장 적합한 도구입니다.
- Node: 검색, 평가, 생성, 검증 등의 단계
- Edge: 조건 분기(재시도/종료/보강)
- State: 중간 결과와 의사결정 근거 저장
복잡한 제어 흐름(반복/분기/롤백) 구현에 강합니다.
CrewAI / AutoGen
멀티 에이전트 협업 시 유용합니다.
- 검색 담당
- 분석 담당
- 리포트 담당
역할 분리를 통해 복합 업무 자동화를 구성할 수 있습니다.
Function Calling (Tool Use)
최신 모델의 함수 호출 기능을 활용해 외부 도구를 안전하게 연결합니다.
5. Naive RAG vs Agentic RAG
| 구분 | Naive RAG | Agentic RAG |
|---|---|---|
| 제어 흐름 | 선형(Linear) | 반복/적응(Iterative) |
| 의사결정 | 고정 규칙 | 상황 기반 동적 결정 |
| 구현 난이도 | 낮음 | 높음 |
| 정확도 잠재력 | 중간 | 높음 (검증·재검색) |
| 비용/지연 | 낮음 | 높음 (다중 호출) |
| 적합 시나리오 | 단순 QA/요약 | 복합 분석/리서치/자동화 |
6. 실무 적용 원칙
에이전트는 강력하지만 공짜가 아닙니다.
- LLM 호출 횟수 증가 -> 비용 상승
- 루프 증가 -> 지연 시간 증가
- 제어 실패 시 무한 루프 위험
따라서 모든 질의에 적용하기보다,
- 근거 신뢰성이 중요한 질의
- 다단계 추론이 필요한 질의 에만 선택적으로 활성화하는 것이 현실적입니다.
결론
Agentic RAG는 "더 많이 아는 RAG"가 아니라,
상황을 판단하고 스스로 수정하는 RAG입니다.
단순 지식 주입을 넘어 실제 문제 해결형 시스템을 만들려면,
검색-생성 파이프라인에 에이전트적 제어를 전략적으로 결합해야 합니다.
한 줄 요약: 에이전트는 RAG의 성능 상한을 올리지만, 엔지니어링의 핵심은 정확도와 비용의 균형 설계에 있습니다.