3년 전 GPT-4가 백만 토큰당 30달러를 받던 시절이 있었다. 2026년 봄, 같은 수준의 지능은 10센트에 쓸 수 있다. 99.7% 하락. 비용이 바닥을 치는 동안 가치를 가져가는 쪽은 “모델”이 아니라 “배관공”들이다.
McKinsey의 2025년 말 글로벌 설문(105개국 1,993명)에 따르면 88%의 기업이 AI를 정기적으로 사용하고 있지만, EBIT(영업이익)의 5% 이상을 AI에서 끌어내는 기업은 **고작 6%**에 불과하다. 쓰는 데는 성공했지만, 돈으로 연결하는 데는 대부분 실패하고 있다.
flowchart LR A["비용 폭락 99.7%<br/>(GPT-4→Nano)"] --> B["모델=공산품<br/>6개 제공사 동일 품질"] B --> C["가치 이동<br/>오케스트레이션·워크플로우"] C --> D["실행: 워크플로우 재설계<br/>+ 에이전트 확장"]
🧠 치트시트: AI 비용 폭락 시대의 3가지 전략
- 모델 선택에 시간 쏟지 말고, 워크플로우 재설계에 투자하라
- 반복 작업은 에이전트로 자동화하고, 사람은 판단에 집중하라
- 월간 AI 예산의 20% 이상을 “통합·운영”에 배분하라
3년 만에 99.7%: 실제 가격 변화
숫자로 보면 충격적이다. 2023년 3월 GPT-4가 출시될 때 백만 입력 토큰당 30달러, 출력은 60달러였다. 2026년 봄 기준 주요 모델 가격은 이렇게 바뀌었다.
| 모델 | 입력(백만 토큰) | 출력(백만 토큰) | 비고 |
|---|---|---|---|
| GPT-4 (2023.3) | $30.00 | $60.00 | 원래 가격 |
| GPT-4.1 Nano | $0.10 | $0.40 | 99.7%↓ |
| GPT-5 Nano | $0.05 | $0.40 | 2026 현재 최저가 |
| GPT-5.2 | $1.75 | $14.00 | 현재 플래그십 |
| Gemini 2.5 Flash | $0.30 | — | Google 경쟁 모델 |
| DeepSeek V3 | $0.014 | — | 중국 오픈소스, 2,000배↓ |
| Llama 4 Scout | $0.08 | — | Meta 오픈소스 |
2023년에 월 8001,000만 원 들던 엔터프라이즈 챗봇이 2026년에는 515만 원 수준에서 동등한 품질로 돌아간다. MIT FutureTech 연구팀(NeurIPS 2025 발표)에 따르면 추론 비용은 매년 5~10배씩 떨어지고 있으며, 특정 벤치마크 점수를 달성하는 데 필요한 컴퓨팅은 2년 만에 50배 감소했다.
출처: OpenAI 공식 가격표, Implicator PRO Briefing(2026.3.24), IntuitionLabs 분석(2026.2.28 업데이트)
88%는 쓰는데 6%만 돈이 된다
McKinsey의 State of AI 2025 보고서가 밝히는 현실은 차갑다.
- **88%**의 기업이 최소 한 개 부서에서 AI를 정기 사용 (전년 78%에서 상승)
- 3분의 2가 여러 부서에서 사용, 절반이 3개 부서 이상
- 하지만 EBIT에 AI 기여를 인정하는 기업은 **39%**뿐
- 그중에서도 5% 이상의 EBIT 영향을 내는 기업은 전체의 6%
나머지 82%는 뭘 하고 있을까. 파일럿을 돌리고 있다. 부서 하나에서 테스트하고, PPT에 “AI 도입”이라고 적어놓고, 거기서 멈춘다. McKinsey는 이를 “Pilot Purgatory”(파일럿 연옥)라고 부른다.
성공하는 6%는 뭘 다르게 할까
McKinsey가 “AI High Performer”로 분류한 6%의 공통점은 명확하다.
- 워크플로우를 근본적으로 재설계한다. 기존 프로세스에 AI를 얹는 게 아니라, AI가 중심이 되도록 업무 자체를 다시 짠다. 일반 기업보다 워크플로우 재설계 확률이 3배 높다.
- 에이전트를 빠르게 도입한다. 62%의 기업이 에이전트를 실험 중이지만, High Performer는 이미 확장 단계다. 에이전트 도입률이 일반 기업의 3배.
- 경영진이 직접 쓴다. AI를 “IT팀에 맡기는” 게 아니라 임원진이 모범을 보인다. 리더십 커밋ment가 일반 기업의 3배.
- 디지털 예산의 20% 이상을 AI에 배분한다. 투자 없이 성과만 기대하는 조직과의 차이.
미니 사례 1: 재설계 vs 얹기 A사는 기존 이메일 작성 프로세스에 ChatGPT만 추가했다. 결과: 작성 시간 10% 감소. B사는 이메일 → 검토 → 승인 전체 흐름을 AI 에이전트가 초안 작성 → 규칙 기반 자동 검토 → 사람은 예외만 승인으로 재설계했다. 결과: 작성 시간 70% 감소, 에러율 40% 감소.
가치는 “배관”으로 이동했다
1881년 미국 사우스캐롤라이나의 한 면방이 증기기를 전동기로 바꿨다. 하지만 배관은 그대로 두었다. 생산성은 오르지 않았다. 스탠퍼드 경제학자 폴 데이비드가 1990년 논문에서 지적한 대로, 전기의 진정한 가치는 “발전기”가 아니라 **“배선도”**에 있었다.
2026년의 AI도 같은 궤적을 걷고 있다.
- 모델은 이미 공산품이다. 6개 제공사가 동등한 품질을 경쟁 가격에 판매한다.
- 가치를 만드는 건 모델 자체가 아니라 오케스트레이션, 데이터 플라이휠, 워크플로우 통합, 컴플라이언스다.
- 2026년 Q1에만 AI 인프라 M&A가 110억 달러 이상 발생했는데, 모델 회사 인수는 단一件도 없었다. 전부 “배관” 회사들이다.
미니 사례 2: Anthropic의 전환 Anthropic은 2025년 초까지 “더 나은 모델”로 경쟁했다. 2026년 봄, 연간 매출 25억 달러(런레이트 140억)의 절반 이상이 기업 구독에서 나온다. Claude Code, Cowork 같은 오케스트레이션 제품이 핵심이다. Microsoft가 $30/user 월 구독으로 Anthropic의 에이전트 인프라를 Copilot에 탑재했다.
내일부터 당장 할 5가지
영상이 강조한 “다섯 가지”를 실행 가능한 항목으로 바꾸면 이렇다.
- AI 비용을 다시 계산하라. 2023년 기준으로 예산을 잡고 있다면, 지금 가격으로 다시 계산. 아마 1/100 이하일 것이다. 절약한 예산을 “통합·운영”에 재배분.
- 한 개 워크플로우를 완전히 재설계하라. AI를 기존 업무에 얹지 말고, AI가 중심이 되는 흐름으로 다시 짠다. 가장 반복이 많은 업무부터.
- 에이전트를 작게 시작하라. 이메일 분류, 문서 초안, 데이터 요약 같은 단일 작업부터 에이전트를 붙인다. 성공하면 인접 업무로 확장.
- 측정 지표를 고정하라. “AI를 쓴다”가 아니라 “완료 시간, 재작업률, 에러율” 같은 숫자를 1주 단위로 추적.
- 경영진이 먼저 쓰라. 임원이 직접 AI로 주간 보고서를 작성하고, 회의록을 AI로 정리하는 걸 보여주면 조직 전체의 속도가 달라진다.
flowchart TD A["현재 상태 진단"] --> B{"비용 재계산"} B --> C["워크플로우 1개 재설계"] C --> D["에이전트 파일럿"] D --> E["1주 단위 KPI 측정"] E --> F["성공 → 인접 업무 확장"]
핵심 장면 (원문 발화 기반)
- 00:01 — “AI 비용이 3년 만에 99%”
- 01:07 — “순간 갑자기 끌어넘쳐서 세상 밖으로”
- 02:17 — “놀라운 건요. 실패한 기업들의”
- 03:26 — “우리 업무가 왜 이렇게 돌아가는지”
챕터/타임스탬프
- 0:00 — 인트로 — AI 비용 99% 하락
- 0:11 — 오늘 다룰 5가지
- 0:29 — 현실 변화: 2023 vs 2026
- 0:40 — AI의 지수적 발전
- 0:56 — 끓는점 비유
- 1:10 — 비용은 내려가고, 성능은 올라가고
- 1:24 — 젠슨황이 한 말
- 1:44 — 첫 번째 진실: 88% vs 6%
다음 읽기
- 08. 로컬 LLM 7계열 실전 치환 가이드
- 11. AI 코딩 도구 비교 2026
- 24. CLAUDE.md 지워? 컨텍스트 재설계 가이드
- 33. Agent Teams vs Subagent 실전 판단 기준
영상 메타
- 채널: 메이커 에반 | Maker Evan
- 제목: AI 비용 99% 폭락, 아직도 안 쓰면 진짜 늦었습니다
- 게시 시각(원문): 2026-03-23T14:00:43+00:00
- 영상: https://www.youtube.com/watch?v=TW8VlZNl7gc
- 썸네일: https://i1.ytimg.com/vi/TW8VlZNl7gc/hqdefault.jpg
AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료(McKinsey State of AI 2025, Implicator PRO Briefing 2026.3.24, OpenAI 공식 가격표)를 교차 확인해 정리했습니다.
