안녕하세요, AI 서비스 & 솔루션 프로바이더 베스핀글로벌입니다.
AWS re:Invent 2025의 [SNR201]을 확인해보시기 바랍니다.

☑️ Keynote

세션명	A leader's guide to agentic AI
세션코드	SNR201
발표일자	2025.12.02
강연자	Ishit Vachhrajani
키워드	ㆍ고(高) 자율성 에이전트 & 에이전틱 시스템 ㆍ자율성 스펙트럼과 Goal-based 오케스트레이션 ㆍ 리더십 4대 축: 거버넌스·리스크·조직 구조·문화 ㆍ Intelligence–Context–Trust 아키텍처 & 컨텍스트 엔지니어링 ㆍ Guardrails·자동 추론 기반 신뢰 확보 ㆍ 에이전트 플랫폼 & Inference 프리미티브
핵심 내용 및 요약	ㆍ지금은 단순 자동화가 아니라 고(高) 자율성 에이전트를 조직 차원에서 설계·운영해야 하는 시기이며, 자율성 수준에 따라 '스크립트 → 어시스턴트 → Goal 기반 에이전트 → 다중 에이전틱 시스템'으로 나뉨 · 에이전틱 시스템은 목표 지향성, 자원 활용, 기억, 학습·적응, 사람에게 적절한 에스컬레이션을 갖춘 ‘고자율성 동료’에 가깝고, 모델 성능 향상과 비용 하락으로 이런 시스템의 실전 적용이 가능해짐 · 리더십은 기존의 '결정론·정확성·톨게이트' 중심에서 벗어나, 거버넌스, 리스크, 조직 구조, 문화를 에이전트에 맞게 재설계해야 함(이사회–CEO 모델, 트레이딩 플로어식 리스크, 면역 시스템형 조직, 연구실 문화) · 비즈니스 프로세스는 '제때 지급' 같은 로우 레벨 목표가 아니라 '현금 흐름 최적화' 처럼 상위 비즈니스 목표 중심으로 재정의되고, Goal-based 에이전트와 오케스트레이터가 여러 기능을 가로질러 실행을 담당함 · 에이전트를 제대로 활용하려면 지능(Intelligence)–컨텍스트(Context)–신뢰(Trust) 구조와 Guardrails, 메모리·툴 접근, Observability 같은 플랫폼을 갖춰야 하며, 특히 개발·고객 케어·지식 작업·레거시 현대화 영역부터 단계적으로 적용하는 것이 효과적임

1. 고자율성 에이전트와 자율성 스펙트럼

1.1 자율성 단계 구조

• 스크립트 자동화: 반복적·예측 가능한 작업을 고정된 규칙과 코드로 처리하는 가장 낮은 단계. RPA·배치 작업 등 '정해진 시나리오 안에서만' 움직임입니다.
• 어시스턴트·챗봇: 검색·요약·Q&A 등 정보 제공에는 유용하지만, 실제 시스템 변경이나 프로세스 완료 능력은 제한적 → '설명은 잘하지만 직접 일은 못 하는 동료'에 가깝습니다.
• Goal 기반 에이전트: '이 벤더 인보이스를 정책에 맞게 처리해라' 처럼 목표를 입력 받아 필요한 단계를 쪼개고 여러 시스템·툴을 호출하며 업무를 끝까지 수행합니다.
• 다중 에이전틱 시스템: 여러 에이전트가 협업하면서 복잡·애매한 비즈니스 목표를 단계적으로 분해·해결하는 수준. 이 레벨에서 조직이 체감하는 비즈니스 임팩트가 가장 높습니다.

1.2 에이전틱 시스템의 핵심 행동

• 목표 지향성: 상위 목표(현금 흐름 최적화, 고객 문제 해결 등)를 입력으로 받아 중간 태스크를 스스로 설계하고 완료까지 가져갑니다.
• 자원 활용: ERP, CRM, 지식 베이스, 조직도, 역할·권한 등의 자원을 인지하고 상황에 맞는 도구·데이터를 선택해 사용합니다.
• 기억과 학습: 고객·벤더별 이력, 과거 예외 처리 경험을 기억하고, 피드백을 반영해 다음 의사 결정의 품질과 속도를 높여 갑니다.
• 에스컬레이션: 단순 오류 알림이 아니라 '사람이 개입해야 신뢰가 올라가는 포인트' 를 인식해 적절한 타이밍에 사람을 루프에 포함됩니다.

1.3 에이전트 시대가 온 이유

• 태스크 길이와 복잡도의 확대: LLM이 처리할 수 있는 '태스크의 길이·단위' 가 약 7개월마다 두 배씩 늘어나고 있으며, 예전에는 한두 문장의 질문-답변 수준이었지만, 이제는 여러 단계가 있는 업무 플로우 전체를 에이전트에게 위임할 수 있는 수준에 도달합니다.

2. 리더십 멘탈 모델 전환 – 거버넌스·리스크·조직·문화

2.1 거버넌스: 톨게이트 → 이사회–CEO 모델

• 기존: 프로세스가 특정 지점에서 멈추고 체크 리스트로 승인 받는 톨게이트 방식(연 1~몇 회 감사, 사전 승인 위주). 에이전트 수백·수천 개 시대에는 속도와 스케일에서 한계가 있습니다.
• 전환: 이사회–CEO 관계처럼 상위 전략·비전·가드레일을 정하고, 정책 엔진이 이를 실시간 집행합니다.
• 일부 의사 결정은 반드시 사람·위원회의 승인이 필요(이사회 안건)합니다.
• 나머지 영역에서는 에이전트가 자율적으로 실행하되, 리더는 정기적인 리뷰와 모니터링으로 방향·규칙을 보정합니다.

2.2 리스크: 공장 바닥 → 트레이딩 플로어

• 기존: '200만 달러 이상은 VP 승인, 1,000만 달러 이상은 CFO 승인'과 같은 고정 임계값 중심 승인 체계가 있습니다.
• 전환: 트레이딩 플로어처럼 개별 딜이 아니라 포트폴리오 단위 리스크를 실시간 모니터링합니다.
• 에이전트마다 허용 범위를 정하고, 손실·드리프트가 일정 수준을 넘으면 서킷 브레이커가 작동해 자동 중단·에스컬레이션이 진행됩니다. 규칙을 잘 지키고 안전하게 행동하는 에이전트에게는 더 큰 '유동성·권한'을 부여합니다.

2.3 조직 구조: 기능별 수직 → Objective 중심 스웜 구조

• 기존: 구매·입고·물류·재무 등 기능별 수직 조직이 기본 단위, 고객 문제 해결에는 부서 간 핸드오프가 여러 번 발생합니다.
• 전환: 면역 시스템 비유처럼, 문제 근처의 팀·에이전트가 즉시 스웜을 이루어 대응합니다.
• 중앙 '뇌'의 승인, 복잡한 회의를 기다리는 대신, 목표(Objective)를 기준으로 크로스펑셔널하게 움직입니다. 에이전트는 Org Chart에 묶이지 않고, 추구하는 목표에만 제한되도록 설계됩니다.

2.4 문화: 정확성·복종 → 실험·학습·지능 확장

• 기존: 항상 정답에 가깝게 맞추는 사람·프로세스에 높은 평가·보상을 주고, 실패·편차는 줄여야 할 버그로 인식합니다.
• 전환: 연구실(Research Lab) 문화처럼 실험과 실패를 전제로 하고, 실패 사례를 기록·공유하여 조직 차원의 학습 재료로 활용합니다.
• 에이전트 시대 확장의 대상은 ‘복종(Obedience)’이 아니라 지능(Intelligence)과 적응력이라는 메시지를 리더십이 명확히 해야 합니다.

3. 프로세스 재상상 – Goal-based 오케스트레이션

3.1 전통적 프로세스 구조

목표가 '단계별 업무를 정확히 수행'하는 데 머무는 경우, 프로세스는 부서·기능 단위로 쪼개져 순차적 핸드오프 구조가 됩니다. 각 단계의 KPI는 명확하지만, 전체 관점에서 보면 예외 처리와 최적화가 어렵고 리드타임이 길어지는 경향이 있습니다.

3.2 목표 재정의와 에이전틱 프로세스

에이전틱 시스템에서는 '단일 단계의 정확성' 이 아니라 상위 비즈니스 목표(예: 현금 흐름 최적화, 리스크 최소화)가 1차적인 최적화 대상이 됩니다. 에이전트는 동일한 규칙·정책 아래에서도 과거 이력, 현재 환경(시장 상황, 시스템 상태), 글로벌 제약(예산, 리스크 한도) 등을 고려해 태스크별 다른 전략을 선택합니다.

3.3 Goal-based 에이전트와 오케스트레이터

• Planner 에이전트: 상위 목표를 입력받아 이를 일련의 세부 태스크로 분해하고, 각 태스크에 필요한 역할·툴·데이터를 정의합니다.
• Orchestrator: 여러 기능(구매, 입고, 재무, 지원 등)을 가로질러 개별 에이전트·시스템을 호출하고, 실행 순서·병렬성·에스컬레이션 전략을 조정합니다.

결과적으로, 전체 리드 타임이 줄어들고, 예외 처리가 자동 루프 안에 포함되며, 사람 개입은 '고난이도·고가치 의사 결정 지점'에 집중됩니다.

4. 기술·아키텍처 – Intelligence, Context, Trust

4.1 Intelligence: 지능–속도–비용의 균형

• Use case마다 지능(정확성)–속도–비용의 우선순위가 상이합니다.
• 규제·법률 영역: 정확성이 최우선, 응답 지연 허용 가능합니다.
• 실시간 고객 응대: 완벽성 보다 '충분히 정확하면서 빠른 응답'이 중요합니다.

하나의 모델로 모든 요구를 충족시키기 어렵기 때문에, 오픈소스·자체·서드파티를 포함한 멀티 모델 전략이 필요합니다. 모델 선택 시 '이 태스크에 필요한 추론 난이도·지연 허용도·비용 한도' 를 기준으로 조합하는 설계가 요구됩니다.

4.2 Context: 컨텍스트 엔지니어링
4.2.1 컨텍스트의 역할

LLM은 본질적으로 다음 토큰 예측기이므로, 우리가 어떤 컨텍스트를 주느냐에 따라 ‘환각’의 방향이 달라집니다. 단순 프롬프트 설계 수준을 넘어, 에이전트가 긴 워크플로우와 조직 내부 구조를 이해할 수 있도록 하는 컨텍스트 엔지니어링이 핵심 역량으로 부상합니다.

4.2.1 주요 구성 요소

• 관계(Relationship): 산업·도메인별 개체 간 관계를 Knowledge Graph로 표현해, '무엇이 무엇과 연결되어 있는지'를 명시적으로 제공합니다.
• 의미(Semantics): Vector DB를 활용해 사용자의 애매한 표현도 의미적으로 가까운 문서·데이터와 연결합니다. (키워드 일치가 아닌 의미 기반 검색)
• 메모리(Memory):
  ✓ 역할 메모리: 당신은 어떤 도메인·조직을 위한 에이전트인가
  ✓ 절차 메모리: 각 시스템을 어떻게 사용하는가, 어떤 순서로 툴을 호출하는가
  ✓ 의미 메모리: 회사 정책·전략·도메인 지식
  ✓ 일화 메모리: 특정 고객·벤더·케이스별 과거 경험

• 문서 구조화: PPT·PDF·위키에 흩어진 SOP·프로세스·정책을 Markdown 등 구조화 포맷으로 변환해 에이전트가 heading·리스트·테이블을 구조적으로 이해할 수 있게 합니다.
• 툴 접근(MCP): MCP 같은 표준 인터페이스로 여러 시스템·툴을 USB-C 포트처럼 일관된 방식으로 연결, 에이전트가 다양한 도구를 동적으로 호출할 수 있게 합니다.

4.3 Trust: Guardrails와 자동 추론
4.3.1 Guardrails

중앙 정책 레이어로서 Guardrails를 정의해 금지어·금지 행위, 산업별 규제, 재무 조언·법률 조언 제한, PII 필터링, 반품·보안 정책 등을 모델 종류와 무관하게 일관되게 적용됩니다. 에이전트가 답을 생성할 때마다 Guardrails가 정책과의 일관성을 체크하고, 필요 시 응답을 수정·차단·에스컬레이션합니다.

4.3.2 자동 추론(Automated Reasoning)

자동 추론은 에이전트·프로그램이 “정해진 규칙을 올바르게 따랐는지”를 수학적으로 검증하는 기술입니다. 개별 케이스를 샘플링해 테스트하는 방식이 아니라, 가능한 모든 입력 공간에 대해 성질이 유지된다는 증거를 찾는 접근입니다. 이 기법을 통해 할루시네이션과 정책 위반 가능성을 크게 줄이고, 특히 세무·규제·보안·접근 제어 영역에서 기계적으로 검증된 신뢰를 제공합니다.

5. 에이전트 플랫폼, Inference 프리미티브, 시작 전략

5.1 에이전트 플랫폼의 필수 요소

• 에이전트별 런타임 격리: 한 에이전트의 오류·오작동이 전체 시스템으로 전파되지 않도록 보호합니다.
• 메모리·아이덴티티·권한 관리: 에이전트가 누구를 대신해 일하는지, 어떤 데이터·툴에 접근 가능한지 명확하게 제어합니다.
• 연결 게이트웨이: 다양한 SaaS·온프렘 시스템에 대한 통합 접근 계층을 말합니다.
• Observability: 로그·트레이싱·메트릭을 통해 에이전트 행동을 모니터링하고, 튜닝·감사·리스크 분석을 가능하게 하는 관찰 가능성 레이어입니다.

5.2 Inference as a Primitive

• 과거: 컴퓨트 + 스토리지만 있으면 대부분의 애플리케이션을 구축 가능합니다.
• 앞으로: 추론(Inference)이 컴퓨트·스토리지와 동급의 기본 빌딩 블록(Primitive)으로 자리 잡았습니다.

'얼마나 많은 추론을, 어떤 품질·비용·지연으로 사용할 수 있는가'가 아키텍처 설계의 핵심 제약 조건이 됩니다.

5.3 시작 전략

에이전트는 단계가 고정된 단순 워크플로우에는 필요 없고, 도구 선택이 동적이고, 예외 처리·학습·적응이 중요하며, 규칙·정책과 실제 데이터 사이에서 패턴 매칭이 많이 일어나는 영역에 가장 적합합니다. 초기에는 기술 부채가 크고 지식 작업 비중이 높은 도메인을 중심으로 작은 범위의 에이전트를 설계·배포하고, 거버넌스·리스크·조직·문화 모델과 함께 확장하는 것을 권장합니다.

6. 마무리