3년 전 GPT-4가 백만 토큰당 30달러를 받던 시절이 있었다. 2026년 봄, 같은 수준의 지능은 10센트에 쓸 수 있다. 99.7% 하락. 비용이 바닥을 치는 동안 가치를 가져가는 쪽은 “모델”이 아니라 “배관공”들이다.

McKinsey의 2025년 말 글로벌 설문(105개국 1,993명)에 따르면 88%의 기업이 AI를 정기적으로 사용하고 있지만, EBIT(영업이익)의 5% 이상을 AI에서 끌어내는 기업은 **고작 6%**에 불과하다. 쓰는 데는 성공했지만, 돈으로 연결하는 데는 대부분 실패하고 있다.

flowchart LR
    A["비용 폭락 99.7%<br/>(GPT-4→Nano)"] --> B["모델=공산품<br/>6개 제공사 동일 품질"]
    B --> C["가치 이동<br/>오케스트레이션·워크플로우"]
    C --> D["실행: 워크플로우 재설계<br/>+ 에이전트 확장"]

🧠 치트시트: AI 비용 폭락 시대의 3가지 전략

  • 모델 선택에 시간 쏟지 말고, 워크플로우 재설계에 투자하라
  • 반복 작업은 에이전트로 자동화하고, 사람은 판단에 집중하라
  • 월간 AI 예산의 20% 이상을 “통합·운영”에 배분하라

3년 만에 99.7%: 실제 가격 변화

숫자로 보면 충격적이다. 2023년 3월 GPT-4가 출시될 때 백만 입력 토큰당 30달러, 출력은 60달러였다. 2026년 봄 기준 주요 모델 가격은 이렇게 바뀌었다.

모델입력(백만 토큰)출력(백만 토큰)비고
GPT-4 (2023.3)$30.00$60.00원래 가격
GPT-4.1 Nano$0.10$0.4099.7%↓
GPT-5 Nano$0.05$0.402026 현재 최저가
GPT-5.2$1.75$14.00현재 플래그십
Gemini 2.5 Flash$0.30Google 경쟁 모델
DeepSeek V3$0.014중국 오픈소스, 2,000배↓
Llama 4 Scout$0.08Meta 오픈소스

2023년에 월 8001,000만 원 들던 엔터프라이즈 챗봇이 2026년에는 515만 원 수준에서 동등한 품질로 돌아간다. MIT FutureTech 연구팀(NeurIPS 2025 발표)에 따르면 추론 비용은 매년 5~10배씩 떨어지고 있으며, 특정 벤치마크 점수를 달성하는 데 필요한 컴퓨팅은 2년 만에 50배 감소했다.

출처: OpenAI 공식 가격표, Implicator PRO Briefing(2026.3.24), IntuitionLabs 분석(2026.2.28 업데이트)

88%는 쓰는데 6%만 돈이 된다

McKinsey의 State of AI 2025 보고서가 밝히는 현실은 차갑다.

  • **88%**의 기업이 최소 한 개 부서에서 AI를 정기 사용 (전년 78%에서 상승)
  • 3분의 2가 여러 부서에서 사용, 절반이 3개 부서 이상
  • 하지만 EBIT에 AI 기여를 인정하는 기업은 **39%**뿐
  • 그중에서도 5% 이상의 EBIT 영향을 내는 기업은 전체의 6%

나머지 82%는 뭘 하고 있을까. 파일럿을 돌리고 있다. 부서 하나에서 테스트하고, PPT에 “AI 도입”이라고 적어놓고, 거기서 멈춘다. McKinsey는 이를 “Pilot Purgatory”(파일럿 연옥)라고 부른다.

성공하는 6%는 뭘 다르게 할까

McKinsey가 “AI High Performer”로 분류한 6%의 공통점은 명확하다.

  1. 워크플로우를 근본적으로 재설계한다. 기존 프로세스에 AI를 얹는 게 아니라, AI가 중심이 되도록 업무 자체를 다시 짠다. 일반 기업보다 워크플로우 재설계 확률이 3배 높다.
  2. 에이전트를 빠르게 도입한다. 62%의 기업이 에이전트를 실험 중이지만, High Performer는 이미 확장 단계다. 에이전트 도입률이 일반 기업의 3배.
  3. 경영진이 직접 쓴다. AI를 “IT팀에 맡기는” 게 아니라 임원진이 모범을 보인다. 리더십 커밋ment가 일반 기업의 3배.
  4. 디지털 예산의 20% 이상을 AI에 배분한다. 투자 없이 성과만 기대하는 조직과의 차이.

미니 사례 1: 재설계 vs 얹기 A사는 기존 이메일 작성 프로세스에 ChatGPT만 추가했다. 결과: 작성 시간 10% 감소. B사는 이메일 → 검토 → 승인 전체 흐름을 AI 에이전트가 초안 작성 → 규칙 기반 자동 검토 → 사람은 예외만 승인으로 재설계했다. 결과: 작성 시간 70% 감소, 에러율 40% 감소.

가치는 “배관”으로 이동했다

1881년 미국 사우스캐롤라이나의 한 면방이 증기기를 전동기로 바꿨다. 하지만 배관은 그대로 두었다. 생산성은 오르지 않았다. 스탠퍼드 경제학자 폴 데이비드가 1990년 논문에서 지적한 대로, 전기의 진정한 가치는 “발전기”가 아니라 **“배선도”**에 있었다.

2026년의 AI도 같은 궤적을 걷고 있다.

  • 모델은 이미 공산품이다. 6개 제공사가 동등한 품질을 경쟁 가격에 판매한다.
  • 가치를 만드는 건 모델 자체가 아니라 오케스트레이션, 데이터 플라이휠, 워크플로우 통합, 컴플라이언스다.
  • 2026년 Q1에만 AI 인프라 M&A가 110억 달러 이상 발생했는데, 모델 회사 인수는 단一件도 없었다. 전부 “배관” 회사들이다.

미니 사례 2: Anthropic의 전환 Anthropic은 2025년 초까지 “더 나은 모델”로 경쟁했다. 2026년 봄, 연간 매출 25억 달러(런레이트 140억)의 절반 이상이 기업 구독에서 나온다. Claude Code, Cowork 같은 오케스트레이션 제품이 핵심이다. Microsoft가 $30/user 월 구독으로 Anthropic의 에이전트 인프라를 Copilot에 탑재했다.

내일부터 당장 할 5가지

영상이 강조한 “다섯 가지”를 실행 가능한 항목으로 바꾸면 이렇다.

  1. AI 비용을 다시 계산하라. 2023년 기준으로 예산을 잡고 있다면, 지금 가격으로 다시 계산. 아마 1/100 이하일 것이다. 절약한 예산을 “통합·운영”에 재배분.
  2. 한 개 워크플로우를 완전히 재설계하라. AI를 기존 업무에 얹지 말고, AI가 중심이 되는 흐름으로 다시 짠다. 가장 반복이 많은 업무부터.
  3. 에이전트를 작게 시작하라. 이메일 분류, 문서 초안, 데이터 요약 같은 단일 작업부터 에이전트를 붙인다. 성공하면 인접 업무로 확장.
  4. 측정 지표를 고정하라. “AI를 쓴다”가 아니라 “완료 시간, 재작업률, 에러율” 같은 숫자를 1주 단위로 추적.
  5. 경영진이 먼저 쓰라. 임원이 직접 AI로 주간 보고서를 작성하고, 회의록을 AI로 정리하는 걸 보여주면 조직 전체의 속도가 달라진다.
flowchart TD
    A["현재 상태 진단"] --> B{"비용 재계산"}
    B --> C["워크플로우 1개 재설계"]
    C --> D["에이전트 파일럿"]
    D --> E["1주 단위 KPI 측정"]
    E --> F["성공 → 인접 업무 확장"]

핵심 장면 (원문 발화 기반)

  • 00:01 — “AI 비용이 3년 만에 99%”
  • 01:07 — “순간 갑자기 끌어넘쳐서 세상 밖으로”
  • 02:17 — “놀라운 건요. 실패한 기업들의”
  • 03:26 — “우리 업무가 왜 이렇게 돌아가는지”

챕터/타임스탬프

  • 0:00 — 인트로 — AI 비용 99% 하락
  • 0:11 — 오늘 다룰 5가지
  • 0:29 — 현실 변화: 2023 vs 2026
  • 0:40 — AI의 지수적 발전
  • 0:56 — 끓는점 비유
  • 1:10 — 비용은 내려가고, 성능은 올라가고
  • 1:24 — 젠슨황이 한 말
  • 1:44 — 첫 번째 진실: 88% vs 6%

다음 읽기

영상 메타

AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료(McKinsey State of AI 2025, Implicator PRO Briefing 2026.3.24, OpenAI 공식 가격표)를 교차 확인해 정리했습니다.