메이커 에반은 자신의 유튜브 제작 과정을 공개하면서, 어디까지 자동화하고 어디서 사람이 직접 잡아야 하는지를 꽤 솔직하게 설명한다. 맥OS 추천, 클로드 코드 중심의 작업 환경, 썸네일용 스킬 정의, 세션 관리 기준까지 한 번에 묶여 있어서 유튜브 자동화를 운영 관점에서 보는 재미가 있다.
flowchart LR A[유튜브 제작 전 과정을 자동화하고 싶다] --> B[윈도우 버그와 검수 누락, 모델 한계가 걸린다] B --> C[맥OS와 클로드 코드 중심으로 스킬을 수동 트리거한다] C --> D[자료 조사부터 썸네일까지 1시간 안에 영상 1편을 만든다]
핵심 요약
- 유튜브 제작 워크플로우는 자동화가 가능하지만, 에반은 검수 과정이 빠지는 문제 때문에 아직 수동 트리거를 유지하고 있다.
- 작업 환경은 윈도우보다 맥OS를 더 추천하고, 제대로 하려면 맥북 프로급 장비를 권하면서 약 225만 원 정도를 언급한다.
- 헤르메스나 오픈클로 기반 자동화 개발은 미래 트렌드로 보지만, 실제 버그 사례를 봤기 때문에 지금 단계에서는 신중하게 본다.
- 세션이 20%를 넘으면 성능 저하가 체감됐고, 업계에서는 30~40% 정도에서 클리어하라는 조언이 나온다고 말한다.
- 썸네일 작업에서는 캡션 세이프 에어리어, 컬러 팔레트, 디자인 가이드, 레이아웃 패턴을 스킬에 정의해 두고 여러 시안을 뽑아 고른다.
왜 지금 중요한가
이 라이브에서 눈에 들어오는 건 자동화 자체보다 운영 기준이다. 클로드 코드, 코덱스, 안티그래비티처럼 이름만 나열하는 게 아니라, 어떤 도구가 가이드를 잘 지키고 어떤 도구는 결과가 흔들리는지 경험 기준으로 잘라 말해서 실무 감각이 또렷하다.
주요 내용
맥북과 맥OS를 먼저 권하는 이유
에반은 노트북을 산다면 맥북을 추천한다고 말한다. 이유는 분명하다. 윈도우에서는 클로드나 챗GPT를 쓸 때 버그가 많고, 한글이 깨지는 이슈 같은 제약도 자주 보인다는 것. 제대로 세팅하려면 맥북 프로급을 추천하면서 가격은 약 225만 원 정도를 언급한다.
우분투에 대해서는 GUI가 불편해서 개발자용에 가깝다고 본다. 반대로 비개발자라면 익스텐션이나 데스크탑 앱이 더 편할 수 있다고 하면서도, 본인은 버그 때문에 터미널을 쓴다고 설명한다. 편의성보다 안정성을 먼저 잡는 선택이다.
자동화는 가능하지만, 검수 때문에 아직 수동으로 돌린다
자료나 옆에 보이는 산출물은 기본적으로 스킬을 트리거해서 만들고 있다고 말한다. 워크플로우 형태로 전부 엮어서 완전 자동화하는 것도 가능하지만, 그렇게 되면 검수 과정이 조금씩 빠져서 현재는 그렇게 하지 않는다고 한다.
여기서 가장 중요한 문장은 모델 신뢰도에 대한 평가다. 에반은 “아직 모델이 좀 멍청해서” 현재는 수동으로 트리거한다고 말한다. 자동화 자체를 부정하는 게 아니라, 자동화 뒤에 사람이 끼어드는 구조를 유지하는 쪽에 가깝다.
헤르메스·오픈클로 평가는 냉정하고, 세션 관리 기준은 구체적이다
헤르메스처럼 스킬이 자동으로 만들어지는 계열은 거의 못 쓴다고 본다. 미래 트렌드일 수는 있어서 공부는 계속하지만, 그런 개발을 과장해 파는 분위기는 믿지 않는다고 말한다. 실제로 그렇게 만든 제품에서 버그가 엄청 나는 걸 목격했고, 그 문제가 꽤 크리티컬했다고 덧붙인다.
용도 구분도 명확하다. 간단한 업무 처리 비서 정도는 괜찮지만, 조교를 키워 개발하고 결제까지 붙이는 수준은 지금으로선 버그 덩어리에 가깝다고 본다. 개인용으로도 조금 애매하다고 하면서, 클로드 데스크탑 앱에 루틴이나 스케줄을 붙이면 구독 요금제 안에서 웬만한 건 다 된다고 본다.
세션 운영 팁도 바로 써먹을 만하다. 1M 기준 세션이 30~40% 정도 찼을 때 클리어하라는 조언을 많이 들었고, 본인도 20%가 넘으면 성능이 조금 안 좋아지는 게 체감된다고 말한다.
썸네일 스킬 정의와 지원 도구 범위가 꽤 선명하다
후반부에서는 리모션용 스킬을 어떻게 정의해 두는지 보여 준다. 유튜브 에디터 스킬 안에 캡션 세이프 에어리어, 컬러 팔레트, 디자인 가이드, 레이아웃 패턴을 넣어 두고, 디자인에 맞게 생성되도록 가이드를 세세하게 지정해 놨다고 설명한다. 썸네일도 한두 개가 아니라 여러 개를 뽑고, 그중 세 개가 특히 마음에 들어 그걸로 업로드하겠다고 말한다.
제작 속도도 구체적이다. 자료 조사부터 영상 만들기까지 한 시간 만에 영상 하나가 나왔다고 정리하고, 본인 M1 맥북 프로에서는 인코딩이 10분 정도 걸린다고 한다. 현재 지원 환경은 클로드 코드와 안티그래비티 두 가지이며, 코덱스는 스킬 가이드라인을 잘 지키지 않아 결과가 이상하게 나왔다고 말한다. 가장 안정적인 건 클로드 코드라는 결론도 분명하다.
원문 발화 하이라이트
- [11:35] “그렇게 됐을 때 그 검수 과정이 조금씩 빠져 가지고 좀 현재는 좀 안 하고 있어요.”
- [11:42] “아직 모델이 좀 멍청해서 현재는 수동으로 트리거를 좀 하고 있습니다.”
- [11:46] “근데 자동화가 불가능한 건 아니에요. 딸각으로 해 가지고 완전 전체 워크플로우를 자동화가 가능하긴 합니다.”
- [12:24] “자동으로 만들어지는 친구들은 거의 못 쓴다고 보시면 돼요.”
- [13:22] “그걸로 개발을 해서 막 결제 붙이고 이런 거는 그냥 지금으로서는 버그 덩어리라고 보시면 돼요.”
- [01:20:56] “한시간 만에 지금 영상 하나가 나왔네요. 자료 조사부터 시작해서 영상 만들기.”
바로 실행해 보기
- 맥OS 기준으로 작업 환경을 먼저 고정하고, 윈도우에서 겪는 한글 깨짐이나 버그 때문에 작업이 흔들리는지부터 점검한다.
- 자료 조사, 산출물 생성, 썸네일 생성은 스킬로 트리거하되 업로드 전 검수는 직접 넣어서, 완전 자동화보다 수동 검수 포함 루틴으로 먼저 돌려 본다.
- 썸네일 스킬에 캡션 세이프 에어리어, 컬러 팔레트, 디자인 가이드, 레이아웃 패턴을 정의해 두고 여러 시안을 뽑은 뒤, 마음에 드는 후보를 골라 비교한다.
참고
영상 메타
- 채널: 메이커 에반 | Maker Evan
- 제목: 3개월만에 구독자 3만명 찍은 유튜브 자동화 스킬 대공개
- 게시 시각(원문): 2026-05-17T22:13:28+00:00
- 영상: https://www.youtube.com/watch?v=5u9y0N5TKb4
- 썸네일: https://i2.ytimg.com/vi/5u9y0N5TKb4/hqdefault.jpg
수집 품질
- 자막 세그먼트: 1376개
- 자막 문자수: 22165자
- 챕터 추출: 0개
- 콘텐츠 생성: Subagent 기반
AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.
