메이커 에반은 유튜브 운영을 “개별 작업 모음”이 아니라 결과물이 다음 입력으로 넘어가는 파이프라인으로 다시 짰다. 그 결과 대본 한 편에 하루가 걸리던 흐름이 사흘에서 1시간, 익숙해진 뒤에는 30분까지 줄었고, 지금은 하루 한 편이 최소한 나오는 구조가 됐다고 설명한다.
flowchart LR A[대본·썸네일·업로드마다 막히는 유튜버의 고통] --> B[TTS 실험과 기존 도구의 한계 확인] B --> C[스크립트 라이터·에디터·퍼블리셔를 한 파이프라인으로 설계] C --> D[사흘 걸리던 제작을 30분~1시간대로 단축]
핵심 요약
- 유튜브 시작 초반에는 대본 한 편에 하루가 꼬박 걸렸고, 업로드 직전에도 두 시간을 망설일 만큼 제작 병목이 컸다고 말한다.
- TTS를 여러 서비스로 시험했지만 톤이 평평하고, 강조가 안 되고, 한국어 호흡이 어색하고, 무엇보다 자기 채널 같지 않아서 결국 접었다.
- 직접 만든 도구는
유튜브 스크립트 라이터,유튜브 퍼블리셔,유튜브 에디터세 가지이며, 각각 대본·메타데이터·인포그래픽 영상 제작을 맡는다. - 핵심은 도구 개수가 아니라 연결 방식이다. 한 도구의 결과물이 다음 도구의 입력이 되도록 설계해서 사람이 중간에 자료를 옮길 필요를 줄였다.
- 실제 운영 루틴은 웹서치로 주제를 고르고, 스크립트 라이터로 초안을 만든 뒤, 두 단계로 다듬고, 파트별 녹음 후 에디터와 퍼블리셔로 마무리하는 흐름이다.
왜 지금 중요한가
이 영상이 흥미로운 지점은 단순히 “AI 도구를 썼다”가 아니라, 채널 운영 전체를 하나의 생산 시스템으로 다뤘다는 데 있다. 특히 업로드 자체는 아직 수작업으로 남겨두고, 어디까지 자동화하고 어디서 사람이 개입할지를 구분하는 판단이 실무 관점에서 꽤 현실적으로 들린다.
주요 내용
유튜브를 막히게 만든 건 편집보다 흐름이었다
처음에는 머릿속에 할 말은 많은데 글로 옮기면 어디서부터 시작해야 할지 모르겠고, 썸네일과 제목도 매번 고민이었다고 한다. 영상을 다 만들어 놓고도 업로드 버튼을 누르기 전에 두 시간을 망설였고, 3일에 영상 한 편 올리는 것도 버거웠다고 말한다. 그러다 “기존 도구가 내 워크플로우에 안 맞으면 내가 직접 만들면 되잖아”라는 쪽으로 생각이 바뀌면서, 본인이 쓸 도구를 직접 만들기 시작했다.
TTS를 접은 이유는 속도보다 채널 정체성이었다
처음에는 AI 목소리로 내레이션을 뽑고 영상과 자막만 얹는 방식을 기대했다. 하지만 실제 사용 후 평가는 꽤 단호하다. 톤이 평평해서 1분만 들어도 졸리고, 중요한 단어 강조가 안 되며, 한국어 특유의 호흡과 어조가 어색하다는 것이다. 가장 결정적인 이유는 “내 채널인데 남이 떠드는 느낌”이었고, 그래서 TTS 대신 직접 녹음하되 녹음 시간을 줄이는 방향으로 전략을 바꿨다.
세 가지 도구를 따로 만든 게 아니라 한 파이프라인으로 묶었다
유튜브 스크립트 라이터는 주제를 넣으면 후킹 패턴, 분량 길이, 패턴 인터럽트 주기, CTA 위치까지 포함된 구조를 바탕으로 파트 1 후킹부터 파트 12 마무리까지 대본을 만든다. 유튜브 퍼블리셔는 스크립트를 넣으면 제목 후보 다섯 개, 타임스탬프가 박힌 설명, 썸네일 문구 세 개, 키워드 세 개를 뽑는다. 유튜브 에디터는 녹음본을 넣으면 Remotion 기반으로 자막과 인포그래픽을 붙여 영상을 만든다. 이 셋을 이어 붙여 스크립트 → 녹음 → 영상 → 제목/설명/썸네일로 넘어가게 만든 것이 이 영상의 핵심 설계다.
실제 하루 제작 루틴은 4단계로 굴러간다
아침에는 유튜브 웹서치 도구를 켜고 큰 주제 영역 하나에 키워드 두세 개를 던진다. 여기서 검색이 늘고 있는 키워드, 상위 영상 요약, 최근 트렌드를 보고 5분에서 10분 안에 그날의 주제를 고른다. 그다음 스크립트 라이터가 만든 초안을 두 단계로 다듬는데, 먼저 자신의 말투로 톤을 손보고, 다음으로 개인 경험과 실제 사례를 끼워 넣는다. 이후에는 8분짜리 영상을 네 파트 정도로 나눠 녹음하고, 녹음본을 기반으로 클로드코드와 유튜브 에디터로 인포그래픽 영상을 만든 뒤, 퍼블리셔로 제목 후보 5개·설명란 한 벌·썸네일 문구 3개·키워드 3개를 생성한다. 업로드는 아직 수작업으로 하고, 업로드 뒤에는 유튜브 스튜디오에서 데이터를 확인한다.
원문 발화 하이라이트
- “[00:07] 비결은 딱 하나. 제가 직접 만든 도구들로 채널 운영 전체를 한 흐름으로 묶었다는 거예요.”
- “[02:33] 가장 결정적이었던 건요. 제가 만든 영상에 제 목소리가 아닌게 들어가니까 영상이 제것 같지가 않았어요.”
- “[05:14] 하나의 파이프라인으로 이어지게 설계했다는 것이 핵심이에요.”
- “[05:53] 사실상 채널 운영이 자동화된 거예요.”
- “[09:42] 지나고 보니까 그게 채널 정책성을 살린 가장 큰 결정이었어요.”
바로 실행해 보기
- 주제 선정부터 바꿔본다. 큰 주제 하나를 정한 뒤 키워드 두세 개만 넣고, 검색량이 적당하면서 상위 영상이 아직 깊게 다루지 않은 각도를 찾는다.
- 대본 작성은 초안 생성과 사람 손질을 분리한다. 먼저 구조화된 초안을 뽑고, 그다음 말투 수정과 개인 사례 추가를 각각 한 번씩만 돌려서 시간을 고정한다.
- 녹음과 편집도 한 번에 하지 말고 파트 단위로 쪼갠다. 녹음본을 기준으로 자막·인포그래픽·메타데이터 생성이 이어지도록 입력과 출력을 연결하면 반복 작업이 줄어든다.
참고
영상 메타
- 채널: 메이커 에반 | Maker Evan
- 제목: 사흘 → 30분, 도구 3개로 끝낸 유튜브 자동화
- 게시 시각(원문): 2026-05-21T09:53:26+00:00
- 영상: https://www.youtube.com/watch?v=pLuyyV8VMfU
- 썸네일: https://i1.ytimg.com/vi/pLuyyV8VMfU/hqdefault.jpg
수집 품질
- 자막 세그먼트: 299개
- 자막 문자수: 5414자
- 챕터 추출: 23개
- 콘텐츠 생성: Subagent 기반
AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.
