14. ChatGPT는 지능이 아니다 — 강화학습 창시자 리처드 서튼의 논증

강화학습의 창시자이자 2024년 튜링상 수상자 리처드 서튼이 “ChatGPT는 지능이 아니다”라고 선언했다. LLM에는 목표도, 세계 모델도, 스스로를 수정하는 능력도 없다는 진단에서 출발해, 아기의 학습 본능부터 MuZero의 50배 인간 초과 기록, 그리고 인류가 설계된 지능을 어떻게 맞이할 것인가까지 4막으로 논증을 펼친다.

flowchart LR
A[LLM은 지능이 아니다] --> B[모방vs경험 학습 논쟁]
B --> C[MuZero로 입증된 자발학습]
C --> D[설계된 지능 시대 도래]

핵심 요약

서튼은 LLM이 세상을 배우는 게 아니라 “이미 세상을 이해하는 사람을 흉내 낼 뿐”이며, 물리적 세계에서 무슨 일이 벌어질지 예측하는 능력이 없다고 진단한다
LeCun은 AI가 인간의 말을 따라한다고 봤고, Pearl은 빅데이터가 아무리 방대해도 인과 모델 없이는 관찰 단계를 영원히 못 벗어난다고 선언했다
MuZero는 규칙조차 모른 채 57개 Atari 게임에서 인간 점수의 50배를 기록했고, 외부 지식 주입이 오히려 지능의 상한을 인간 수준으로 억눌러 왔다는 서튼의 주장을 뒷받침한다
옥스퍼드 연구진은 AI가 만든 데이터로 다음 AI를 훈련시키면 모델이 반드시 붕괴한다고 경고한다
서튼은 AI로의 계승을 피할 수 없는 우주적 단계로 보며, “복제의 시대가 끝나고 설계의 시대가 온다”고 말한다

왜 지금 중요한가

수억 명이 매일 쓰는 ChatGPT의 한계를 강화학습의 창시자가 직접 짚어낸 시점이다. LLM이 지능이 아니라면 진짜 지능은 어디서 오는가라는 근본적 질문이 다시 테이블 위에 올라왔고, 그 답이 MuZero 같은 자발적 학습 시스템에 있다는 논증은 현재 AI 방향성 전체에 도발적이다.

주요 내용

[1] 막다른 골목길 (03:28~15:48)

서튼의 진단은 단호하다. LLM에는 목표도, 실측 자료도, 스스로를 수정하는 능력도 없다. 이건 서튼만의 견해가 아니다. LeCun은 AI가 세계를 이해하는 게 아니라 인간의 말을 따라할 뿐이라고 진단했고, Pearl은 인과 모델 없는 빅데이터가 아무리 커도 관찰 단계를 영원히 벗어나지 못한다고 선언했다. 세 사람의 공통분모는 “지금 방식으로는 한계가 있다”는 것이다.

[2] 배움은 베낌인가 (19:33~26:34)

아기는 모방으로 배우는가, 경험으로 배우는가. 파텔은 인간의 문화적 진화가 모방 위에 서 있다고 주장하고, 서튼은 다람쥐도 학교 없이 자기 세계를 완벽히 익힌다고 맞받는다. Alison Gopnik의 ‘철학적 아기’와 Karl Friston의 ‘능동적 추론’이 이 논쟁 한가운데 끼어든다. 핵심은 “흉내 내는 것”과 “직접 경험하며 배우는 것” 사이의 차이가 지능의 본질을 결정한다는 점이다.

[3] 쓰디쓴 교훈 (29:49~36:22)

MuZero는 게임 규칙조차 모른 채 57개 Atari 게임에서 인간 점수의 50배를 찍었다. 서튼은 이 결과를 “외부에서 주입된 지식이 오히려 지능의 상한을 인간 수준으로 억눌러 왔다”는 자신의 주장이 알고리즘으로 증명된 순간으로 해석한다. 한편 옥스퍼드 연구진은 AI가 만든 데이터로 다음 AI를 훈련시키면 모델이 반드시 붕괴한다고 경고하는데, 이건 현재 LLM 중심의 데이터 생태계가 품고 있는 근본적 취약점이다.

[4] 그 다음 인류 (40:25~)

서튼은 AI로의 계승을 피할 수 없는 우주적 단계로 본다. 우주의 먼지가 별이 되고, 별이 생명을 낳고, 생명이 마침내 설계된 지능을 탄생시키는 4대 전환. “복제의 시대가 끝나고 설계의 시대가 온다”는 그의 프레임에서, 낯선 AI 후손을 인류의 일부로 품을지 두려운 타자로 밀어낼지 결정권은 아직 우리 손에 있다.

원문 발화 하이라이트

“LLM은 세상을 배우는 게 아닙니다. 이미 세상을 이해하고 있는 존재인 ‘사람’을 흉내 낼 뿐이죠.”

“인간은 20시간이면 운전을 익힙니다. AI는 수백만 번의 시행착오로도 버겁습니다.”

“다람쥐도 학교 없이 자기 세계를 완벽히 익힙니다.”

“외부에서 주입된 지식이 오히려 지능의 상한을 인간 수준으로 억눌러 왔습니다.”

“복제의 시대가 끝나고 설계의 시대가 옵니다. 결정권은 아직 우리 손에 있습니다.”

바로 실행해 보기

본인이 쓰는 AI 도구가 “모방”인지 “학습”인지 점검하기 — ChatGPT에게 물어보는 게 기존 지식의 재조합인지, 아니면 새로운 경험 기반 추론인지 구분해 보면 서튼의 논증이 체감된다
MuZero 논문의 핵심 인사이트 읽어보기 — “규칙을 모르는 상태에서 스스로 배우는 능력”이 어떻게 인간의 50배 성과를 냈는지 확인하면 강화학습의 본질이 보인다
AI 생성 데이터 의존도 점검하기 — 옥스퍼드의 모델 붕괴 경고를 염두에 두고, 본인 업무에서 AI 출력을 다시 AI 입력으로 쓰는 루프가 있는지 점검한다

참고

영상: https://www.youtube.com/watch?v=DSL6jSzkpIU
서튼 “The Bitter Lesson”: http://incompleteideas.net/IncIdeas/BitterLesson.html
MuZero 논문: https://deepmind.com/blog/article/muzero-mastering-go-chess-shogi-and-atari-without-rules

영상 메타

채널: Science ADAM
제목: [한글더빙] “ChatGPT는 지능이 아닙니다” 강화학습 창시자·튜링상 수상자 리처드 서튼
게시 시각(원문): 2026-04-05T15:00:43+00:00
영상: https://www.youtube.com/watch?v=DSL6jSzkpIU
썸네일: https://i1.ytimg.com/vi/DSL6jSzkpIU/hqdefault.jpg

수집 품질

자막 세그먼트: 0개
자막 문자수: 0자
챕터 추출: 9개
콘텐츠 생성: Subagent 기반

AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.

일하는 ai

탐색기