 |
|
안녕하세요, AI 서비스 & 솔루션 프로바이더 베스핀글로벌입니다.
AWS re:Invent 2025의 [Build Advanced Search with Vector, Hybrid, and AI Techniques]을 확인해보시기 바랍니다.
|
☑️ Keynote
| 세션명 |
Build Advanced Search with Vector, Hybrid, and AI Techniques |
| 세션코드 |
ANT314 |
| 발표일자 |
2025.12.3 |
| 강연자 |
Jon Handler, Bobby Mohammed, Ryosuke Sudo |
| 키워드 |
1. Open Search
2. Hybrid Search
3. Agentic Search
4. Reranking
5. MCP
6. Multimodal |
| 핵심 내용 |
1. 하이브리드 검색 고도화
- 어휘 기반 검색과 벡터 검색을 결합하고 RRF 알고리즘을 활용해 최적의 검색 관련성을 도출하는 하이브리드 검색 고도화 방안을 제시하였습니다.
2. 실제 비지니스 성과 입증
- 일본 Recruit사의 사례를 통해 하이브리드 검색 및 리랭킹 기술로 검색 실패율 90% 감소와 예약률 10% 증가라는 실제 비즈니스 성과를 입증하였습니다.
3. 에이전트 검색(Agentic Search) 지원
- 복잡한 추론과 멀티턴 대화를 수행하는 에이전트 검색을 위해 장·단기 메모리, 멀티모달 임베딩, MCP 등 필수 인프라 기능을 소개하였습니다.
4. 성능 및 비용 최적화 전략
- 디스크 기반 검색, 양자화, S3 기반 벡터 스토리지 통합을 통해 벡터 검색 성능을 2.5배 향상시키면서 비용을 절감하는 최적화 전략을 설명하였습니다.
|
| 요약 |
하이브리드 검색을 Lexical·Vector 결합과 RRF로 고도화하고, 일본 Recruit 사례로 검색 실패율 90% 감소·예약률 10% 증가 성과를 입증하였습니다.
에이전트 검색을 위한 메모리·멀티모달·MCP 기능을 소개하였으며, 디스크 기반 검색·양자화·S3 스토리지로 성능 2.5배 향상과 비용 절감을 달성하는 방안을 제시하였습니다.
|
|
Build Advanced Search with Vector, Hybrid, and AI Techniques
OpenSearch 기반의 하이브리드 검색과 에이전트 검색 구현 및 성능·비용 최적화 전략에 대해 소개합니다.
|
1. OpenSearch 서비스 개요 및 비전
1-1. OpenSearch Service의 진화
- 커뮤니티 주도 및 완전 관리형: 커뮤니티 주도로 운영되며 Linux Foundation 산하 오픈 거버넌스 프로젝트이고, AWS에서는 완전 관리형 서비스(Amazon OpenSearch Service)로 제공하여 배포·운영·패치를 자동화해 운영 편의성을 제공합니다.
- 성능 및 비용 효율성: 초기 버전 대비 전체 성능이 약 11배 향상되며, 벡터 검색 및 로그 분석을 위한 다양한 비용 최적화 옵션(티어링 스토리지 등)을 제공합니다.
- Serverless 옵션: 인프라 관리 없이 컬렉션(Collection) 생성만으로 데이터를 수집하고 검색할 수 있는 서버리스 아키텍처를 지원합니다.

1-2. 검색 기술의 발전 단계
- Lexical(어휘적) → Semantic(의미론적) → Hybrid(하이브리드) → Agentic(에이전트):
단순 키워드 매칭에서 시작하여 문맥을 이해하는 벡터 검색으로 확장하고, 이를 결합한 하이브리드 검색으로 발전하며, 최종적으로 스스로 추론하고 작업을 수행하는 에이전트 검색으로 진화합니다.
|
2. 검색 품질 향상을 위한 하이브리드 검색 (Hybrid Search)
2-1. Lexical vs Semantic Search
- Lexical Search (BM25): 정확한 단어 매칭에 강점이 있으나 오타나 동의어 처리에 취약하고 문맥 파악이 어렵습니다.
- Semantic Search (Vector): 문맥과 의미를 파악하여 추상적 질문을 처리하는 데 탁월하지만 정확한 키워드 매칭에는 약점이 있습니다.
2-2 .하이브리드 검색 구현 및 스코어링
- 상호 보완적 접근: 어휘적 검색의 정확성과 벡터 검색의 문맥 이해력을 결합하여 최상의 관련성을 도출합니다.
- 스코어링 방식(Normalization & Combination): 두 검색 결과의 점수를 정규화하여 산술 평균 등으로 결합합니다.
- RRF(Reciprocal Rank Fusion): 각 검색 결과의 순위를 기반으로 가중치를 부여하여 결합하는 방식으로, 이상치에 강하고 별도의 가중치 튜닝 없이도 안정적인 성능을 보입니다.

|
3. 고객 성공 사례: Recruit Co., Ltd. (Hot Pepper Gourmet)
3-1. 도입 배경 및 과제
- 일본 최대 식당 예약 플랫폼 ‘Hot Pepper Gourmet’을 운영하였습니다.
- 일본어 특성상 띄어쓰기가 없어 형태소 분석 실패 시 검색 품질 저하가 발생하였습니다.
- 오타(예: ‘sushi’ vs ‘susho’) 및 특정 고유명사 검색에 한계에 직면하였습니다.
3-2. 해결 방안: 사용자 맞춤형 하이브리드 검색
- 아키텍처 개선: OpenSearch 내장 하이브리드 기능에서 나아가, 어휘적 점수와 벡터 점수를 분리 추출한 뒤 LightGBM 기반의 리랭커(Reranker)를 통해 최종 순위를 재조정하는 ‘Custom Hybrid Search’를 구현합니다.
- 도메인 특화 튜닝: 일반적인 LLM 대신 식당 이름 등 도메인 특화 어휘에 맞춰 파인 튜닝된 경량화 BERT 모델을 사용하여 성능을 최적화합니다.

3-3. 비즈니스 성과
- 검색 품질 향상: 검색을 통한 예약 건수가 10% 증가하였습니다.
- 실패율 감소: 검색 결과가 0건인 'Zero-hit' 비율이 90% 감소에 달성하였습니다.

|
4. 차세대 검색: 에이전트 검색 (Agentic Search)
4-1. 에이전트 워크로드의 특징
- 단발성 쿼리가 아닌, 목표 달성을 위해 지속적으로 추론하고 반복 수행하는 다중 턴(Multi-turn) 구조입니다.
- 실시간성이 중요하며, 단순 정보 검색을 넘어 도구(Tools) 사용 및 외부 데이터 접근이 필요합니다.
4-2. OpenSearch의 에이전트 지원 기능
- 추론 루프(Reasoning Loop) 지원: 복잡한 사용자 질문을 하위 작업으로 분해하고, 필요한 도구와 데이터를 스스로 판단하여 실행하는 지능형 검색 지원입니다.
- 에이전트 메모리(Agentic Memory): 대화 맥락 유지를 위한 단기/장기 메모리 및 세션 히스토리 관리 기능 제공. 단순 LLM 컨텍스트 윈도우 확장의 비용/성능 한계를 극복합니다.
- 멀티모달 임베딩(Multimodal Embeddings): Amazon Nova 모델과 통합하여 텍스트, 이미지, 오디오, 비디오 등 6가지 모달리티를 단일 벡터 공간에 통합 저장 및 검색이 가능합니다.
- MCP (Model Context Protocol) 지원: AI 모델이 외부 데이터 및 도구에 안전하게 접근할 수 있도록 표준화된 프로토콜(MCP) 클라이언트 및 서버 기능을 제공합니다.

|
5. 성능 향상 및 비용 최적화 (Performance & Cost)
5-1. 성능 개선
- 최신 OpenSearch 버전(3.3 이상) 기준, 이전 버전 대비 전체 성능이 11배 향상되었습니다.
- 벡터 검색 속도 2.5배 향상으로 대규모 에이전트 워크로드 처리가 가능합니다.

5-2 .비용 효율적 아키텍처
- 디스크 기반 벡터 검색 (Disk-based Vector Search): 메모리(RAM) 대신 디스크를 활용하여 대용량 벡터 데이터를 저렴하게 처리하면서도 성능 저하를 최소화합니다.
- 양자화 (Quantization): 벡터 데이터의 크기를 줄여 메모리 사용량을 절감하고 검색 속도를 향상합니다.
- S3 기반 벡터 스토리지: 자주 액세스하지 않는 콜드 데이터나 대규모 벡터 데이터를 Amazon S3에 저장하고 OpenSearch에서 조회하는 티어링(Tiering) 구조를 지원하여 획기적인 비용 절감을 가능하게 합니다.

|
6. 마무리
- OpenSearch는 단순 검색 엔진을 넘어, AI 애플리케이션을 위한 통합 벡터 데이터베이스로 진화 중입니다.
- 하이브리드 검색을 통한 정확도 향상과 에이전트 검색을 통한 지능형 애플리케이션 구축을 동시에 지원하며, 엔터프라이즈급 성능과 비용 효율성을 제공합니다.

|
|
|