안녕하세요, AI 서비스 & 솔루션 프로바이더 베스핀글로벌입니다.
AWS re:Invent 2025의 [How AWS and Next Gen Stats Redefine Football Intelligence]을 확인해보시기 바랍니다.

☑️ Keynote

세션명 How AWS and Next Gen Stats Redefine Football Intelligence
세션코드 SPF103
발표일자 2025.12.03
강연자 Cynthia Freeland, Mike Band, Julie Souza, Greg Olsen
키워드 1. AWS ML
2. Amazon SageMaker
3. Amazon S3
핵심 내용 및 요약 ㆍNextGen Stats는 AWS와의 10년간의 파트너십을 통해 단순한 속도 측정에서 AI와 데이터 과학을 활용하는 방향으로 진화하고 있습니다.
ㆍ현재는 완성도 높은 예측 모델과 복잡한 데이터 포인트(예: 완료 확률, 수비 커버리지) 분석이 가능해짐. 데이터 분석은 선수들의 건강 및 안전 관리에도 활용되어, 특정 플레이(예: 스위블 힙 드롭 태클)의 부상 위험도를 20배 높게 측정합니다. 규칙 변경(예: 킥오프 규칙) 시뮬레이션에도 데이터가 사용되어, 부상률을 낮추고 리턴율을 79% 높이는 성과를 보였습니다. 
ㆍ분석가들은 복잡한 데이터(예: 기대 대비 완료율)를 팬들이 이해하기 쉬운 '스토리'로 가공하여 전달하는 중요한 역할을 수행합니다. Big Data Bowl은 팬들에게 데이터 분석 기회를 제공하며, 실제 NFL 스태프의 약 8명/년을 배출하는 인재 파이프라인 역할을 하고 있습니다.
ㆍ미래에는 2D에서 3D 포즈 추정 데이터로 전환되어, 팔 각도, 릴리스 포인트 등 더욱 정교한 분석이 가능해질 전망입니다.
ㆍ데이터 분석은 인간의 직관(Gut)을 대체하는 것이 아니라, 70%의 직관을 30%의 데이터로 검증하는 도구로 활용되어 의사결정의 최적화를 돕고 있습니다.

How AWS and Next Gen Stats Redefine Football Intelligence

 

1. 초기 데이터 수집 및 발전

1-1.초기 DATA 수집

NFL은 센서를 통해 어깨 패드와 볼 칩에서 속도, 시간, 거리 등의 데이터를 수집하였습니다.

 

1-2 이후 발전

초기 분석은 단순했지만, 현재는 AI와 예측 도구의 힘을 빌려 훨씬 더 발전된 분석이 가능해졌습니다. NextGen Stats는 기술 발전에 따라 더욱 흥미롭고 예측 가능하며 몰입도 높은 분석으로 진화하고 있습니다.

 

2. 초기 데이터 분석의 한계와 NGS 도입

2-1. 초기 데이터의 모호성

2016년 당시, 타이릭 힐의 최고 속도가 22.96mph라는 정보만으로는 그 속도가 '좋은지' 판단하기 어려웠습니다.

2-2. NGS 도입 이전의 상황

약 10년 전에는 박스 스코어 통계에 의존, Pro Football Focus나 Sports Info Solutions 같은 회사들이 수동으로 데이터 기록했습니다. GSIS(주요 박스 스코어 서비스)를 통해 야드, 태클, 터치다운 등 100년 이상 된 기본 통계만 파악 가능했습니다.

2-3. NGS 도입과 데이터 수집

2015년, 모든 선수의 어깨 패드에 RFID 칩 두 개를 장착함으로써 XY 추적 데이터를 생성하였고 초기에는 데이터 저장, 수집, 처리 및 통계 도출에 집중하였습니다.
이후 속도, 거리에서 완료 확률(completion probability), 수비 커버리지 등 훨씬 복잡한 데이터 포인트로 발전할 수 있었습니다.

3. 선수 관점에서의 데이터 의미 변화

3-1. 선수 시절

2007년 리그에 합류했을 때부터 2015년까지는 박스 스코어 통계만 의존하였습니다. 코치들이 제공하는 스카우팅 리포트는 총 허용 야드, 실점, 러싱/패싱 야드, 성공률 등 거시적인 수치에 국한되었습니다.
현재는 이러한 통계에 제로(0)분을 할애하며, 이 통계들은 좋은 팀과 나쁜 팀을 구분하는 데 완전히 무관하다고 평가합니다. 당시에는 게임 필름 평가와 수동 분석이 주를 이루었으며, 지오 트래킹, 속도, 위치, 분리 야드 등의 메트릭은 없었습니다.

 

3-2. 선수 은퇴 후

2015년부터 현재(2025년)까지 데이터 분석은 제로에서 6000까지 기하급수적으로 성장하였습니다. 2021년 첫 경기를 중계할 때 제공받은 정보와 현재 실시간으로 제공되는 정보는 비교할 수 없을 정도로 발전해 있습니다. Olsen은 데이터를 준비 과정의 거대한 자원으로 받아들이고, 데이터를 통해 경기를 보는 렌즈를 즐기고 있습니다.

3-3. 분석가로서의 데이터 활용

Olsen은 분석팀에게 수비 스타일(싱글 하이 세이프티 여부, 라인 오브 스크리미지 선수 수, 압박 여부, 존/맨 커버리지 등)의 핵심 포인트를 요청하였습니다.
과거에는 필터링을 위해 수많은 수동 작업을 거쳤지만, 이제는 단 한 번의 이메일이나 전화로 팀이나 전략에 대한 모든 정보를 얻을 수 있게 되었습니다.
분석팀은 다운별 행동, 블리츠 유형(DB, LB 등)을 실시간에 가깝게 평가하여 방대한 샘플 사이즈 분석, 이를 간단한 스프레드시트로 제공합니다. 이로 인해 2개월 동안 필름을 보는 것보다 더 많은 정보를 얻을 수 있게 되었습니다.

 

4. AWS와의 협업과 데이터 과학 역량 강화

4-1. AWS ProServe 팀과의 협업

AWS는 단순히 요청을 들어주는 것이 아니라, NGS 팀과 함께 구축하며 팀 역량을 향상시킵니다. AWS는 NGS 팀의 역량을 끌어올리는 '물'과 같습니다.

4-2. 기술 아키텍처의 발전

한 번 배운 기술(예: 팀의 커버리지를 식별하는 신경망 모델 구축)을 다른 곳(예: 리시버가 달린 경로 추정)에도 동일한 아키텍처로 적용할 수 있게 되었습니다. NGS 팀은 데이터 과학 관점에서 더 똑똑해지고 역량이 강화되었으며, Redis 및 Memcached 엔진 모두에 대한 99.99% 고가용성을 보였습니다.

4-3. 모델링 기술의 진화

초기에는 XGBoost 및 트리 기반 모델을 사용했으나, 현재는 딥러닝 신경망을 구축하고 AI 영역으로 진입하였습니다. 이는 좁은 AI(Narrow AI)에서 더 일반적인 솔루션(General Solutions)으로 나아가는 AI 물결의 진화와 같다고 볼 수 있습니다.

4-4. 지속적인 프로젝트와 역량 확보

지난 9년간 매년 AWS와 머신러닝 프로젝트를 진행하며 다음 프로젝트에 적용할 지식을 습득하였습니다. AWS의 도움으로 자체적으로 수행하기 어려운 어려운 과제에 착수할 수 있게 되었으며, 매년 도구, 지식, 전문성을 갖추게 되었습니다.

5. 데이터 분석의 두 가지 차원: 기술과 스토리텔링

5-1. 데이터 생산과 해석

데이터 채굴, 해석, 정보 생산의 기술적 수준이 존재합니다.

 

5-2. 스토리텔링 및 교육의 책임

분석가와 방송인은 데이터가 왜 중요한지, 코치와 선수가 데이터를 어떻게 활용하여 결정을 내리는지 시청자에게 옹호하고 설명할 책임이 있습니다.
또한 분석가들이 제공하는 자료는 일반적인 용어(layman's terms)로 번역되어야 합니다. 예상 완료율(completion percentage over expected)과 같은 복잡한 데이터를 시청자가 익숙한 축구 용어로 풀어 설명해야 합니다. 분석가들은 시청자에게 위협적이거나 이해하기 어려운 방식이 아닌, 코치 회의나 콤바인 평가에서 사용되는 방식으로 데이터를 전달해야 합니다. 
이 데이터는 프리에이전시 결정, 선수 영입 등 모든 32개 팀에서 실시간으로 일어나고 있는 일의 근거가 됩니다. 
미디어는 이 데이터를 위협적이지 않고 이해하기 쉬운 방식으로 전달하는 데 더 노력해야 합니다.

5-3. 데이터의 목적과 실용성

데이터는 의미가 있어야 하며, 팬을 똑똑하게 만들거나 코치 결정, 선수 훈련 등에 영향을 미치는 목적이 있어야 합니다.
분석가는 팬들에게 데이터를 전달하는 대사(envoy or ambassador) 역할을 수행합니다.
생산 기술 측면에서는 수비 경고(defensive alerts)와 같이 잠재적인 상황을 시각적으로 보여주어 시청자의 눈길을 사로잡는 방식으로 데이터를 활용해야 합니다.
이는 데이터를 참여를 유도하고 소외시키지 않는 실용적인 구성 요소입니다.

 

6. 경기 주간 분석 프로세스: 화요일부터 목요일까지

6-1. 스포츠 분석의 일반화

스포츠는 사람들이 자신의 직업에서 해야 할 일을 운영화(operationalizing)하는 데 유용한 트로이 목마 역할을 합니다.

6-2. 화요일 아침의 분석 시작

월요일 밤 경기가 끝난 후 화요일 아침, 분석은 상대 팀 전체의 경향성을 파악하는 것에서 시작됩니다. 분석팀(NGS 분석가 10명)은 빌스의 오펜시브 코디네이터인 조 브래디의 오펜스에 집중합니다. 예를 들어, 빌스가 듀오(duo) 플레이를 반복적으로 사용했다는 테이프 상의 내용을 데이터로 입증하고, 이를 인사이트(Insights)로 만들어 내러티브를 구축합니다.

6-3. 분석 패킷 전달 및 협업

분석팀은 10명의 NGS 분석가가 준비한 초기 패킷을 Greg Olsen 팀에 전달합니다. 목요일쯤에는 질문을 할 수 있도록 피드백 기회를 제공합니다. 분석가들은 컴퓨터 뒤에서 데이터베이스와 대시보드를 활용하여 즉석에서 조회 가능합니다. Olsen의 축구 IQ와 직감이 맞는지 검증하거나 반박하는 것이 분석팀의 일상적인 업무입니다.

6-4. 실시간 지원

금요일 밤에는 2점 전환 결정과 같은 사안에 대해 실시간 이메일을 통한 리서치를 지원합니다. 이 모든 과정은 팬들을 코치와 같은 수준으로 끌어올려 경기를 더 스마트하게 이해하도록 돕는 것을 목표로 합니다.

6-5. 데이터 활용의 순환

Olsen은 초기 패킷을 통해 일반적인 포인트를 얻고, 이후 필름을 보면서 사전 지식을 바탕으로 더 명확한 맥락을 가지고 경기를 시청합니다. 분석팀의 데이터 없이는 1선 다운에서 상대가 어떤 커버리지를 사용하는지 등 수많은 변수를 파악하는 것이 불가능하며, 이는 단순한 '좋은 캐치'를 넘어 왜 일어나는지에 대한 설명이 필수적입니다.
예를 들어, 빌스가 1다운에서 95%의 높은 패스 비율을 보인다면 이는 비정상적인(abnormal) 행동이며, 그 이유(상대 팀의 약점 등)를 데이터가 뒷받침하여 원인과 결과를 설명할 수 있게 됩니다.

7. NextGen Stats의 진화: 5억 데이터 포인트와 선수 안전

7-1. 데이터 규모

NextGen Stats는 시즌 동안 약 5억 개의 데이터 포인트를 피드받으며, 이 데이터는 주간 단위로 5억 개의 데이터 포인트를 생성하며, 선수 건강 및 안전 정보를 제공합니다.

 

7-2. 선수 건강 및 안전 포털

속도, 시간, 거리 데이터 외에도 광학 추적(optical tracking)과 카메라를 통해 골격 자세(skeletal pose)를 포착하여 부상 위험 지점을 이해합니다. 리그는 2년 전 선수 건강 및 안전 포털을 32개 클럽에 제공했으며, 이 포털 도입 후 결장 경기 700회가 감소하였습니다.

 

7-3. 규칙 제정의 데이터 기반 최적화

스위블 힙 드롭 태클(Swivel hip drop tackle)은 일반적인 패스/런 플레이보다 20배 높은 부상률을 유발하는 것으로 확인되었습니다. 킥오프 규칙 변경은 다음과 같은 문제를 해결하기 위해 시뮬레이션되었습니다. (킥오프 시 2배의 부상률과 4배의 뇌진탕률 발생.) 
10,000시즌 분량의 데이터를 시뮬레이션하여 리턴율 증가와 부상률 감소라는 두 가지 목표를 최적화하였으며, 이 규칙 변경은 킥오프 부상률을 일반 플레이 수준으로 낮추었고, 9주차 기준으로 킥오프 리턴율이 79% 증가하였습니다.

7-4. 데이터 활용의 확장

장비와 규칙이 변화하고 있으며, 판타지 AI 어시스턴트와 같이 생성형 AI를 활용하여 팬들의 라인업 구성을 돕는 등 재미있는 방식으로 데이터가 사용되고 있습니다. 모든 것의 기반은 대규모 복잡한 데이터를 이해하는 데 있습니다.

8. AI와 데이터의 결합: 판타지 AI 어시스턴트와 연구 편집기

8-1. 판타지 AI 어시스턴트

AWS의 도움으로 개발되었으며, NGS가 동력을 제공하는 여러 제품 중 하나입니다. NFL은 NFL.com, NFL Plus, 비디오 게임, AI 등 다양한 플랫폼에서 데이터를 활용하는 방법을 모색 중입니다. 판타지 AI 어시스턴트 개발 시, 데이터는 있었으나 AI 전문성이 부족했고 AWS가 보완하였습니다.

8-2.연구 편집기(Research Editor)

10명의 분석가 팀이 모든 선수와 팀에 대해 3~4줄의 설명을 작성하는 작업을 수행합니다. AI 어시스턴트는 분석가들의 작업을 편집하여 형식, 어조, 통계 등이 완벽하게 전달되도록 보장합니다. 인간 연구원 중심으로, AI에게 연구를 맡기지 않고 인간 분석가가 연구하고 AI가 작성하는 것을 돕는 방식으로 접근합니다. 
목표는 분석가를 대체하는 것이 아니라, 그들의 업무 속도를 2배로 높여 주간 인사이트 생산량을 늘리는 것입니다. 인간의 맥락은 대체 불가능하며(예: 루이스 아나루모 DC가 떠난 후 벵골스 수비가 무너진 맥락), AI는 인간 분석가를 보조하여 더 빠르고 최적으로 일할 수 있도록 돕는 미래를 지향합니다.

9. 미래 전망 및 AI의 역할

9-1. 데이터의 실시간 적용과 지연 시간 문제

현재 그래픽은 방송사의 발언을 실시간으로 반영하는 데 어려움이 있습니다. 방송사가 말하고 그래픽이 준비되어 화면에 나올 때까지 지연 시간(lag time)이 발생하기 때문입니다. 이 때문에 실시간 통신이 중요하며, 지연 시간을 줄일수록 방송사가 그래픽을 더 많이 활용할 수 있습니다.
해결책으로 실시간 폐쇄 자막(closed captioning) 데이터를 읽어 AWS 엔지니어가 그래픽을 생성하도록 하는 방안을 제안합니다.

 

9-2.  3D 데이터와 새로운 경험

현재 2D에서 3D 데이터 수집으로 전환하는 첫 해이며, Sony Hawkeye 시스템을 사용합니다. 이는 60Hz 속도의 27포인트 전체 자세 추정(full pose estimation)을 가능하게 하여, 팔 각도, 릴리스 포인트, 스탠스 등 새로운 변곡점을 열어줄 것입니다.
이 데이터는 팬들이 집에서 경기를 시청하는 방식에도 영향을 미칠 것입니다. 몬스터 주식회사(Monsters Inc.) 게임: 다음 주 월요일 밤 ESPN에서 램스 대 이글스 경기를 몬스터 주식회사 아바타를 사용하여 실시간에 가깝게 재현하는 경기 예정입니다.
목표는 통계뿐만 아니라 경험을 통해 데이터를 전달하는 것입니다.

 

10. 데이터가 대체할 수 없는 영역과 비즈니스 리더를 위한 교훈

10-1. 분석가가 콜러(Caller)를 대체할 수 있는가?

분석은 도구일 뿐이며 정답이 아닙니다. 코치는 선수의 발목 부상 여부, 심리 상태, 라커룸 상황 등 데이터가 측정하지 못하는 맥락을 알고 있습니다.

10-2. 머니볼 시대의 교훈 (빌리 빈)

빌리 빈은 초기 스프레드시트를 받았을 때도 직관(gut)을 사용하기 위해 데이터를 회수했으며, 분석 30%, 직관 70%의 비율을 고수했습니다. 데이터는 20~30년간 훈련된 직관을 지원, 검증, 확인하는 도구입니다.
데이터는 엘리트 선수와 최악의 선수를 구분하는 데는 쉽지만, 중간 영역(messy middle)을 개선하는 데 유용합니다.

10-3. 비즈니스 리더가 배울 점 (커뮤니케이션과 투자)

명확한 소통: 기술팀(Mike)은 가능한 것의 매개변수를 명확히 전달해야 하고, 비기술 리더(Greg)는 무엇을 원하는지 명확히 질문해야 하며 이 상호작용이 중요합니다. 
데이터 투자: 모든 비즈니스에는 데이터가 있으며, 리더는 데이터를 구조화하고, 통찰력을 얻고, 미래를 예측하는 모델링에 투자해야 합니다.
모르는 것을 인정: 모델의 결함을 인정하고 수용하는 자세가 필요합니다.
맥락에 맞는 소통: 기술적 청중에게는 신경망을 언급할 수 있지만, Greg와 같은 축구 전문가에게는 축구 용어로 소통해야 합니다.
데이터 전문가가 되면 데이터 기반 의사결정에 더 자신감을 가질 수 있습니다.

11. 예측의 어려움과 데이터의 한계

11-1. 예측의 어려움

예측은 동일한 게임(even game), 즉 공격 대 공격을 가정하고 시작해야 합니다. 스트립 색(strip sacks), 인터셉션, 픽 식스(pick sixes)와 같은 변수는 예측에 포함할 수 없습니다.
예시: 캐롤라이나 팬서스가 램스를 이긴 것은 스태퍼드가 연속 인터셉션을 당했기 때문이며, 이는 예측 모델에 반영할 수 없는 변수입니다.
라이브 스포츠에서는 이러한 예상치 못한 사건이 발생하기 때문에 예측이 어렵습니다.

12. 하위 레벨 적용 및 비즈니스 교훈 요약

12-1. 하위 레벨 축구로의 확산

장비(헬멧)의 변화는 이미 대학 및 고등학교 수준으로 트리클 다운(trickle down)되었습니다. NFL이 힙 드롭 태클을 금지하면 다른 모든 곳도 금지하게 되며, 이는 모든 스포츠에 영향을 미칩니다. 
특히 여성 스포츠의 건강 및 안전에 대한 투자와 연구가 필요합니다. XY 추적 데이터는 충돌 측정을 가능하게 하며, 선수 건강 부서는 부상으로 이어지는 요소를 측정합니다. 코치들은 NFL과 동일한 수준의 헬멧을 중학생들에게 사용합니다.

12-2.  비즈니스 리더를 위한 교훈 (요약)

소통의 중요성: 기술적인 부분과 통찰력(인사이트)을 명확하게 주고받는 양방향 소통이 핵심입니다.
데이터 투자: 모든 비즈니스는 데이터를 구조화하고, 통찰력을 얻고, 미래를 예측하는 모델링에 투자가 필수적입니다.
모르는 것을 인정: 모델의 결함을 인정하고 수용하는 자세 필요합니다.
맥락화: 데이터를 전문가의 언어(축구 용어)로 맥락화하여 전달해야 하며, 이는 데이터 기반 의사결정의 자신감으로 이어집니다.