안녕하세요, AI 서비스 & 솔루션 프로바이더 베스핀글로벌입니다.
AWS re:Invent 2025의 [Opening Keynote with Matt Garman]을 확인해보시기 바랍니다.

☑️ Keynote

세션명 Opening Keynote with Matt Garman
세션코드 KEY001
발표일자 2025.12.01
강연자 Matt Garman
키워드 1. AI 칩 (Nvidia, Trainium)
2. Amazon Nova
3. Agentic AI
4. Kiro & 개발자 Agent
핵심 내용 및 요약 ㆍAWS는 전년 대비 20% 성장과 더불어 3나노 공정의 Trainium3 칩과 전용 인프라 서비스인 AI Factories를 공개하며 강력한 AI 하드웨어 리더십을 입증했습니다.
ㆍ차세대 자체 파운데이션 모델인 Amazon Nova 시리즈와 기업 데이터를 효율적으로 결합할 수 있는 Nova Forge를 출시하여 생성형 AI 생태계를 대폭 확장했습니다.
ㆍ단순한 AI 활용을 넘어 자율적으로 목표를 수행하는 Agentic AI 시대를 선언하며, 자율 에이전트 'Kiro' 및 에이전트 관리/평가 도구를 새롭게 선보였습니다.

Opening Keynote with Matt Garman

키노트 대부분의 내용은 AI 관련 신규 서비스 소개와 고객 사례로 진행되었습니다.

1. AWS 성장

AWS는 전년 대비 20% 성장하여 1,320억 달러 규모의 비즈니스로 자리 잡았습니다. 특히 지난 12개월 동안 매출 증가액이 220억 달러에 달하는데, 이는 포춘(Fortune) 500대 기업 중 절반 이상의 연간 매출보다 큰 규모입니다.
대표 스토리지 서비스인 S3에는 500조 개의 객체와 수백 엑사바이트의 데이터가 저장되어 있으며  매일 초당 2억 건이 넘는 요청을 처리하고 있습니다.
Amazon Bedrock을 통해 10만 개 이상의 기업에서 AI 추론을 지원하고 있습니다. 또한 Bedrock Agent Core SDK는 출시 몇 달만에 200만 회 이상의 다운로드를 기록하였습니다.
최초의 양자 컴퓨팅 칩 프로토타입인 Ocelot을 출시하였습니다.

 

2. AI INFRASTRUCTURE

AWS는 GPU 운영에서 업계 최고 수준의 안정성을 자랑합니다. NVIDA와 15년 이상 협력하여 GPU 클러스터 신뢰성에서 경쟁사를 압도합니다.

1) P6e GB300 출시

NVIDIA의 최신 GB300 NVL72 시스템으로 구동되며 가장 까다로운 AI 워크로드를 위한 최고의 컴퓨팅을 제공하는 인스턴스 타입이 출시되었습니다.

2) AWS AI Factories

고객은 자체 데이터센터에 AWS 전용 AI 인프라를 구축하여 독점적으로 사용할 수 있는 서비스입니다.
고객의 기존 데이터센터 공간 및 전력을 활용하고 Trainium Ultra 또는 Nvidia GPU를 포함한 AI 인프라와 SageMaker와 Bedrock과 같은 서비스를 이용할 수 있습니다.

3) AWS Trainium3

AWS Trainium은 AI 워크로드에서 최고의 가격 대비 성능을 제공하도록 설계된 맞춤형 AI칩입니다.

여담으로 AWS Trainium2는 AI 학습용 AI칩이지만, 대부분의 고객사는 추론용으로 사용하고 있습니다. 실제로 Amazon Bedrock의 대부분 추론도 AWS Trainium2에서 구동되고 있으며 Claude의 최신 모델도 AWS Trainium2에서 실행되고 있습니다.

작년 AWS Trainium3 출시 예고 이후 오늘 Trainium3 Ultra Server를 정식 출시하였습니다.
AWS 최초의 3나노 AI칩을 탑재하였으며 컴퓨팅 성능은 4.4배 증가, 메모리 대역폭은 3.9배 증가하였지만, 1MW(메가와트) 당 5배 많은 AI 토큰을 처리하여 대규모 AI 학습 및 추론을 위한 업계 최고의 가격 대비 성능을 제공합니다.

추가적으로 Trainium4에 대한 설계를 진행 중입니다.

 

3. 생성형 AI 모델 플랫폼

모두가 AI를 활용하기 위해서는 안전하고 확장 가능하며 기능이 풍부한 추론 플랫폼이 필요합니다. AWS에서는 Amazon Bedrock을 통해 생성형 AI 어플리케이션을 빠르게 개발하는데 도움을 줍니다.
Bedrock을 통해 1조개 이상의 토큰을 처리하는 고객의 수가 50개가 넘는 것으로 확인됩니다. 

1) Amazon Bedrock 신규 모델 출시

Open-Weight 모델인 Google의 Gemma, MiniMax AI의 Minimax M2, MoonshotAI의 Kimi k2, NVIDIA Neotron 모델을 정식 출시하였습니다.
또한, Mistral AI의 Mistral Large 3와 Ministral 3가 Bedrock을 통해 최초 공개되었습니다.

2) Amazon Nova2 출시

비용 최적화와 낮은 지연 시간, 최첨단 수준의 지능을 제공하는 것을 목표로 하는 Amazon 자체 FM인 Nova의 차세대 버전이 새롭게 출시하였습니다.
- Lite: 빠르고 비용 효율적인 추론 모델.
- Pro: 복합한 워크로드를 위한 가장 지능적인 모델
- Sonic: 모든 어플리케이션에서 실시간으로 인간과 유사한 대화형 AI를 구현하는 차세대 음성 모델
- Omni: 텍스트, 이미지, 비디오, 오디오를 Input으로 지원하고 텍스트와 이미지 생성을 Output으로 지원하는 멀티모탈 추론 및 이미지 생성 모델.

3) Nova Forge

기업은 고유의 데이터를 활용하여 AI 모델을 효과적으로 사용하고자 하고 기업의 데이터를 모델에 반영하기 위해서는 “모델 구축”을 하거나, “오픈 웨이트 모델 튜닝”을 통해 자체 모델을 구현할 수 있습니다.
하지만, “모델 구축”은 많은 시간과 비용, 전문 지식을 필요로 합니다. “오픈 웨이트 모델 튜닝”은 실제 강화 학습과 미세 조정 기술을 사용하여 가중치를 조절할 수 있지만 실제로 이것의 효과는 한계가 있는 것으로 확인됩니다.

AWS 80%정도 훈련된 체크포인트 모델과 기업 고유의 데이터를 섞어 훈련하여 사용할 수 있는 모델을 Nova Forge 모델로 제공합니다. 이를 통해, 핵심적인 추론 능력을 저해하지 않으면서 기업 도메인에 대한 지식을 이해하는 모델을 만들 수 있습니다.
 

 

4. Agentic AI Platform

AWS는 Amazon Bedrock AgentCore를 통해 모듈식으로 규모에 맞는 에이전트를 안전하게 구축, 배포, 운영할 수 있는 서비스를 제공합니다. 오늘 AgentCore에 대한 추가 기능을 출시하였습니다.

1) Policy in AgentCore

Policy는 에이전트가 예측 가능하고 의도에 맞게 행동하도록 제어 정책을 제공합니다.

2) AgnetCore Evaluations

“Trust, but verify(신뢰하되 검증하라)”의 원칙에 따라 에이전트가 정확하고 적절한 행동을 하고 있는지를 파악해야 합니다.
AgentCore Evaluations 기능을 통해 에이전트의 품질을 지속적으로 검사하고 평가할 수 있습니다.
사용자가 지정한 특정 기준에 따라 에이전트의 행동을 분석하며 일반적읜 품질의 13가지 사전 평가 정보를 함께 제공합니다.

5. 개발자 Agent

1) Amazon Quick

기업 내부의 모든 정형/비정형 데이터를 연결하여 모든 사용자에 AI 경험을 제공할 수 있습니다.

 

2)  Amazon Transform

AI 기반 레거시 플랫폼에 대한 현대화 과정을 지원하는 서비스로 AWS Transform Custom 출시를 통해 거의 모든 코드, API, 프레임워크, 런타임, 언어에 대한 현대화를 지원합니다.

 

3) Kiro Autonomous Agent

Agentic AI를 활용하여 최고의 성과를 내기 위해서는

  1. 광범위한 목표 지향으로 전환합니다. 개별 작업 단위가 아닌 광범위한 목표를 두고 에이전트에 지사하는 방식으로 전환합니다.
  2. 순차적인 구조가 아닌 병렬 작업 확장을 통해 에이전트 작업량을 확장합니다.
  3. 인간의 개입을 최소화하고 에이전트가 최대한 업무를 수행하도록 자율성을 부여합니다. 예시로 개발자가 자는 시간동안 백그라운드에서 에이전트가 백로그를 처리하는 방식을 사용합니다.

추가적으로 Startup을 대상으로 KIRO를 1년동안 사용할 수 있는 프로모션을 진행한다고 합니다.

4)  AWS Security Agent

코드 및 설계 보안 검토, Pen 테스트 자동화의 과정을 지원합니다.

 

5)  AWS DevOps Agent

장애 발생 시 근본 원인 분석 및 해결책 제안을 지원하며 CI/CD를 지원합니다.

 

6. 신규 서비스 출시 안내

마지막 10분은 이번에 새롭게 출시된 25개의 서비스에 대해 쏟아내는 시간이 있었습니다. 마치 타임어택처럼 신규 서비스의 출시를 알렸습니다.

컴퓨팅

  1. Intel Xeon 6기반 차세대 X 패밀리 X8i 출시
  2. AMD EPYC 기반 대용량 메모리 인스턴스 X8aedz 패밀리 출시
  3. C8a 패밀리 출시
  4. C8ine 패밀리 출시
  5. M8azn 패밀리 출시
  6. M3 Ultra/M4 Max Mac 인스턴스 출시

서버리스

  1. Lambda Durable Functions (장기 실행 워크로드 지원)

스토리지

  1. S3 최대 객체 크기 50TB로 증액
  2. S3 배치 작업 속도 10배 향상
  3. S3 Tables 인텔리전트 티어링
  4. S3 Tables 자동 복제 기능
  5. Amazon FSx NetApp ONTAP을 위한 S3 Access Point

  6. S3 Vectors 정식 출시(GA)

  7. OpenSearch GPU 가속을 활용한 10배 빠른 vector indexes 지원

데이터 및 보안

  1. EMR Serverless 스토리지 프로비저닝 제거
  2. GuardDuty for ECS/EC2 확장
  3. Security Hub GA
  4. CloudWatch 통합 로그 저장소

데이터베이스

  1. RDS for SQL Server와 RDS for Oracle 스토리지 256TB로 확장
  2. RDS for SQL Server 라이선스 비용 절감을 위한 Optimize CPU 지원
  3. RDS for SQL Server Developer Edition
  4. Database Savings Plans(신규) 출시