안녕하세요, AI 서비스 & 솔루션 프로바이더 베스핀글로벌입니다.
AWS re:Invent 2025의 [Build Advanced Search with Vector, Hybrid, and AI Techniques]을 확인해보시기 바랍니다.

☑️ Keynote

세션명	Build Advanced Search with Vector, Hybrid, and AI Techniques
세션코드	ANT314
발표일자	2025.12.3
강연자	Jon Handler, Bobby Mohammed, Ryosuke Sudo
키워드	1. Open Search 2. Hybrid Search 3. Agentic Search 4. Reranking 5. MCP 6. Multimodal
핵심 내용	1. 하이브리드 검색 고도화 - 어휘 기반 검색과 벡터 검색을 결합하고 RRF 알고리즘을 활용해 최적의 검색 관련성을 도출하는 하이브리드 검색 고도화 방안을 제시하였습니다. 2. 실제 비지니스 성과 입증 - 일본 Recruit사의 사례를 통해 하이브리드 검색 및 리랭킹 기술로 검색 실패율 90% 감소와 예약률 10% 증가라는 실제 비즈니스 성과를 입증하였습니다. 3. 에이전트 검색(Agentic Search) 지원 - 복잡한 추론과 멀티턴 대화를 수행하는 에이전트 검색을 위해 장·단기 메모리, 멀티모달 임베딩, MCP 등 필수 인프라 기능을 소개하였습니다. 4. 성능 및 비용 최적화 전략 - 디스크 기반 검색, 양자화, S3 기반 벡터 스토리지 통합을 통해 벡터 검색 성능을 2.5배 향상시키면서 비용을 절감하는 최적화 전략을 설명하였습니다.
요약	하이브리드 검색을 Lexical·Vector 결합과 RRF로 고도화하고, 일본 Recruit 사례로 검색 실패율 90% 감소·예약률 10% 증가 성과를 입증하였습니다. 에이전트 검색을 위한 메모리·멀티모달·MCP 기능을 소개하였으며, 디스크 기반 검색·양자화·S3 스토리지로 성능 2.5배 향상과 비용 절감을 달성하는 방안을 제시하였습니다.

Build Advanced Search with Vector, Hybrid, and AI Techniques

OpenSearch 기반의 하이브리드 검색과 에이전트 검색 구현 및 성능·비용 최적화 전략에 대해 소개합니다.

1. OpenSearch 서비스 개요 및 비전

1-1. OpenSearch Service의 진화

커뮤니티 주도 및 완전 관리형: 커뮤니티 주도로 운영되며 Linux Foundation 산하 오픈 거버넌스 프로젝트이고, AWS에서는 완전 관리형 서비스(Amazon OpenSearch Service)로 제공하여 배포·운영·패치를 자동화해 운영 편의성을 제공합니다.
성능 및 비용 효율성: 초기 버전 대비 전체 성능이 약 11배 향상되며, 벡터 검색 및 로그 분석을 위한 다양한 비용 최적화 옵션(티어링 스토리지 등)을 제공합니다.
Serverless 옵션: 인프라 관리 없이 컬렉션(Collection) 생성만으로 데이터를 수집하고 검색할 수 있는 서버리스 아키텍처를 지원합니다.

1-2. 검색 기술의 발전 단계

Lexical(어휘적) → Semantic(의미론적) → Hybrid(하이브리드) → Agentic(에이전트):
단순 키워드 매칭에서 시작하여 문맥을 이해하는 벡터 검색으로 확장하고, 이를 결합한 하이브리드 검색으로 발전하며, 최종적으로 스스로 추론하고 작업을 수행하는 에이전트 검색으로 진화합니다.

2. 검색 품질 향상을 위한 하이브리드 검색 (Hybrid Search)

2-1. Lexical vs Semantic Search

Lexical Search (BM25): 정확한 단어 매칭에 강점이 있으나 오타나 동의어 처리에 취약하고 문맥 파악이 어렵습니다.
Semantic Search (Vector): 문맥과 의미를 파악하여 추상적 질문을 처리하는 데 탁월하지만 정확한 키워드 매칭에는 약점이 있습니다.

2-2 .하이브리드 검색 구현 및 스코어링

상호 보완적 접근: 어휘적 검색의 정확성과 벡터 검색의 문맥 이해력을 결합하여 최상의 관련성을 도출합니다.
스코어링 방식(Normalization & Combination): 두 검색 결과의 점수를 정규화하여 산술 평균 등으로 결합합니다.
RRF(Reciprocal Rank Fusion): 각 검색 결과의 순위를 기반으로 가중치를 부여하여 결합하는 방식으로, 이상치에 강하고 별도의 가중치 튜닝 없이도 안정적인 성능을 보입니다.

3. 고객 성공 사례: Recruit Co., Ltd. (Hot Pepper Gourmet)

3-1. 도입 배경 및 과제

일본 최대 식당 예약 플랫폼 ‘Hot Pepper Gourmet’을 운영하였습니다.
일본어 특성상 띄어쓰기가 없어 형태소 분석 실패 시 검색 품질 저하가 발생하였습니다.
오타(예: ‘sushi’ vs ‘susho’) 및 특정 고유명사 검색에 한계에 직면하였습니다.

3-2. 해결 방안: 사용자 맞춤형 하이브리드 검색

아키텍처 개선: OpenSearch 내장 하이브리드 기능에서 나아가, 어휘적 점수와 벡터 점수를 분리 추출한 뒤 LightGBM 기반의 리랭커(Reranker)를 통해 최종 순위를 재조정하는 ‘Custom Hybrid Search’를 구현합니다.
도메인 특화 튜닝: 일반적인 LLM 대신 식당 이름 등 도메인 특화 어휘에 맞춰 파인 튜닝된 경량화 BERT 모델을 사용하여 성능을 최적화합니다.

3-3. 비즈니스 성과

검색 품질 향상: 검색을 통한 예약 건수가 10% 증가하였습니다.
실패율 감소: 검색 결과가 0건인 'Zero-hit' 비율이 90% 감소에 달성하였습니다.

4. 차세대 검색: 에이전트 검색 (Agentic Search)

4-1. 에이전트 워크로드의 특징

단발성 쿼리가 아닌, 목표 달성을 위해 지속적으로 추론하고 반복 수행하는 다중 턴(Multi-turn) 구조입니다.
실시간성이 중요하며, 단순 정보 검색을 넘어 도구(Tools) 사용 및 외부 데이터 접근이 필요합니다.

4-2. OpenSearch의 에이전트 지원 기능

추론 루프(Reasoning Loop) 지원: 복잡한 사용자 질문을 하위 작업으로 분해하고, 필요한 도구와 데이터를 스스로 판단하여 실행하는 지능형 검색 지원입니다.
에이전트 메모리(Agentic Memory): 대화 맥락 유지를 위한 단기/장기 메모리 및 세션 히스토리 관리 기능 제공. 단순 LLM 컨텍스트 윈도우 확장의 비용/성능 한계를 극복합니다.
멀티모달 임베딩(Multimodal Embeddings): Amazon Nova 모델과 통합하여 텍스트, 이미지, 오디오, 비디오 등 6가지 모달리티를 단일 벡터 공간에 통합 저장 및 검색이 가능합니다.
MCP (Model Context Protocol) 지원: AI 모델이 외부 데이터 및 도구에 안전하게 접근할 수 있도록 표준화된 프로토콜(MCP) 클라이언트 및 서버 기능을 제공합니다.

5. 성능 향상 및 비용 최적화 (Performance & Cost)

5-1. 성능 개선

최신 OpenSearch 버전(3.3 이상) 기준, 이전 버전 대비 전체 성능이 11배 향상되었습니다.
벡터 검색 속도 2.5배 향상으로 대규모 에이전트 워크로드 처리가 가능합니다.

5-2 .비용 효율적 아키텍처

디스크 기반 벡터 검색 (Disk-based Vector Search): 메모리(RAM) 대신 디스크를 활용하여 대용량 벡터 데이터를 저렴하게 처리하면서도 성능 저하를 최소화합니다.
양자화 (Quantization): 벡터 데이터의 크기를 줄여 메모리 사용량을 절감하고 검색 속도를 향상합니다.
S3 기반 벡터 스토리지: 자주 액세스하지 않는 콜드 데이터나 대규모 벡터 데이터를 Amazon S3에 저장하고 OpenSearch에서 조회하는 티어링(Tiering) 구조를 지원하여 획기적인 비용 절감을 가능하게 합니다.

6. 마무리

OpenSearch는 단순 검색 엔진을 넘어, AI 애플리케이션을 위한 통합 벡터 데이터베이스로 진화 중입니다.
하이브리드 검색을 통한 정확도 향상과 에이전트 검색을 통한 지능형 애플리케이션 구축을 동시에 지원하며, 엔터프라이즈급 성능과 비용 효율성을 제공합니다.