안녕하세요, AI 서비스 & 솔루션 프로바이더 베스핀글로벌입니다.
AWS re:Invent 2025의 [Build observable AI agents with Strands, AgentCore, and Datadog
(sponsored by Datadog)]을 확인해보시기 바랍니다.

☑️ Keynote

세션명 Build observable AI agents with Strands, AgentCore, and Datadog
(sponsored by Datadog)
세션코드 AIM233
발표일자 2025.12.03 
강연자 Kunal Batra(Datadog), Du`An Lightfoot(AWS)
키워드 1. Operational visibility
2. Strands-based agent
3. Datadog LLM Observability
4. performance tuning
핵심 내용 및 요약  ㆍ운영 가시성(Operational visibility)은 AI 에이전트를 실제 프로덕션 환경에서 운영하는 데 필수이며, 이는 불투명한 LLM의 동작을 측정 가능하고 개선 가능한 워크플로우로 전환해 줄 수 있습니다.

Build observable AI agents with Strands, AgentCore, and Datadog
(sponsored by Datadog)

Strands-Based에이전트를 구축하고, 이를 Amazon Bedrock AgentCore에 배포하며, Datadog LLM Observability로 텔레메트리를 처리하는 과정을 단계별로 다룹니다.

 

1. Why Observability Matters

1-1. AI 에이전트 행동의 불투명함 

대형 언어 모델(LLM)을 기반으로 한 AI 에이전트는 내부적으로 어떻게 결정을 내렸는지 외부에서 알기 어렵습니다. 이 때문에 문제가 생겼을 때 원인 파악이 힘들고, 결과의 신뢰성과 일관성을 보장하기 어렵습니다.

1-2. 운영 환경에서 안정적인 동작이 필요

프로덕션 환경에서 AI 에이전트를 운영하려면 단순히 “잘 작동하는 것처럼 보이는 답”이 아니라,

  • 어떤 입력을 받았고,
  • 어떤 과정을 거쳐서 결정을 내렸으며,
  • 어떤 도구나 리소스를 호출했는지

이런 과정이 기록되어야 합니다. 그래야만 문제 해결, 품질 개선, 성능 최적화가 가능하기 때문입니다.

1-3. 투명한 추적으로 개선 

AI 에이전트의 전체 행동 흐름(프롬프트, 툴 호출, 응답 과정 등)을 추적하면:

  • 사용자가 의도한 결과와 실제 결과 사이의 괴리를 분석할 수 있고,
  • 에이전트가 비효율적으로 동작하는 부분을 찾아내어 개선할 수 있습니다.

이러한 추적 및 분석 과정 자체가 에이전트를 계속 발전시키는 방법이 됩니다.

 

2. Build & Deploy with AWS Strands + AgentCore

2-1. Strands Based 형태로 Agent 설치

에이전트의 목적, 프롬프트 흐름, 도구 사용 등을 정의하고 실행 과정 전체를 추적 가능한 구조로 만듭니다. 

2-2. AgentCore

해당 에이전트를 프로덕션 서비스로 배포하고 스케일링, LLM 호출 관리, 보안, API 제공 등 운영 기능을 맡기며
안정적으로 실행되게 합니다. 

 

3. The AWS Generative AI Well Architected Lens

3-1. 안정적인 생성형 AI시스템을 위한 6대원칙

  • 안정성(Reliability)
  • 보안(Security)
  • 비용 최적화(Cost Optimization)
  • 성능 효율성(Performance Efficiency)
  • 운영 우수성(Operational Excellence)
  • 지속적 개선(Sustainability)

3-2. LLM 기반 에이전트에 적용할 때의 체크포인트 

  • 프롬프트 관리
  • 모델 선택 및 버전 관리
  • 데이터 품질 및 안전성
  • Guardrails(안전장치) 적용
  • 관찰성(Observability) 확보
  • 책임 있는 AI(Responsible AI) 고려

3-3. Strands + AgentCore + Datadog 구조가 Lens 기준을 충족하는 방법 설명

  • 추적 가능성 확보
  • 보안 정책 적용
  • 성능/비용 모니터링 가능
  • 운영 품질 지속 개선 가능

 

4. Operationalizing the Generative AI Lens with Datadog

4-1. LLM Observability 구현 - Datadog의 LLM Observability 기능 활용

  • 프롬프트 흐름
  • 모델 응답
  • 툴 호출
  • 토큰 사용량
  • 에러로그

등을 엔드투엔드로 추적하여 Lens에서 요구하는 “운영 우수성·투명성·품질관리”를 충족시킵니다. 

4-2. 성능/비용 최적화 – Datadog 메트릭

  • 모델별 latency
  • token 비용
  • 호출량 증가 패턴
  • 비효율적인 체인/에이전트 단계

등을 분석하여 성능 효율성 및 비용 최적화 기준을 실무에서 적용합니다. 

4-3. 보안/프라이버시 거버넌스 적용 – Datadog

  • 민감 데이터 접근 감시
  • Guardrails 위반 탐지
  • 비정상적인 에이전트 행동 모니터링

등을 감시하여 보안(Security) 및 책임 있는 AI(Responsible AI) 요구 사항을 충족시킵니다. 

4-4. 품질 개선의 지속적 루프

에이전트의 추론 실패나 품질 저하 현상을 Datadog에서 자동 탐지하고, Strands/AgentCore와 연계해 지속적으로 에이전트 품질을 개선하는 구조를 구축합니다.