오픈AI의 새 이미지 생성 모델, 코드팩토리 표현으로는 덕테입을 나노바나와 직접 붙여 본 비교 영상입니다. 결론은 꽤 단순해요. 특히 한국어가 많이 들어가는 이미지에서는 덕테입이 압도적으로 자연스럽고, 작은 글자나 기울어진 글자 스타일까지 더 잘 유지한다는 쪽입니다.

flowchart LR
A[한국어 이미지 생성 한계] --> B[덕테입 vs 나노바나 직접 비교]
B --> C[텍스트 밀도·스타일 유지·일관성 확인]
C --> D[한국어 중심 서비스는 GPT 전환 권장]

핵심 요약

  • 코드팩토리는 이미 이미지 생성을 서비스에 통합하고 있다면 GPT 쪽으로 바꾸는 게 좋겠다고 결론부터 말한다
  • 가장 큰 차이는 한국어 생성 능력으로, 책 본문처럼 작은 글자가 빽빽한 장면에서 덕테입이 훨씬 자연스럽다
  • 컨설팅 스타일 PPT 슬라이드처럼 정보 밀도가 높은 이미지에서도 덕테입이 작은 한글을 더 안정적으로 표현한다
  • 만화와 패션 시트 비교에서는 덕테입이 원본 캐릭터와 스타일을 더 일관되게 유지하는 쪽으로 평가된다
  • 영어에서 쓰던 기울어진 글자 스타일을 한국어로 옮기는 테스트에서도 덕테입이 더 높은 스타일 보존력을 보였다고 정리한다

왜 지금 중요한가

이미지 생성 모델 비교는 이제 예쁜 그림 한 장 뽑는 수준을 넘었습니다. 문서, PPT, 포스터, 패션 시트, 영상 자산처럼 실제 제품과 마케팅에 바로 들어가는 출력물이 중요해졌죠. 이 영상은 그중에서도 한국어를 많이 다루는 서비스라면 어떤 모델이 더 바로 실전에 쓸 만한지 꽤 명확하게 보여 줍니다.

주요 내용

첫 번째 비교는 한국어가 빽빽한 책 페이지다

코드팩토리가 가장 먼저 테스트한 건 “펼쳐진 책의 양면이 전부 한국어 본문 텍스트로 빼곡하게 채워진 이미지”입니다. 왼쪽이 덕테입, 오른쪽이 나노바나인데, 확대해 보면 차이가 바로 보인다고 설명합니다.

덕테입 쪽은 정말 사람이 타이핑한 책을 찍은 것처럼 보일 정도로 한글 완성도가 높다고 평가합니다. 특히 나노바나가 원래 어려워하던 복잡한 글자 조합도 더 안정적으로 나온다고 말하죠. 반면 나노바나는 작은 글자일수록 깨지고, 읽기 애매한 글자가 많이 나온다고 짚습니다.

덕테입도 아주 복잡한 구간에서는 픽셀이 살짝 깨지는 느낌이 있긴 하지만, 한국어가 많이 들어가는 이미지 생성이라면 승부가 나 있다고 정리합니다.

두 번째 비교는 정보 밀도가 높은 컨설팅 스타일 슬라이드다

다음 테스트는 맥킨지, BCG, 베인 스타일의 정보 밀도가 높은 단일 PPT 슬라이드 이미지입니다. 둘 다 전체적인 레이아웃은 잘 만들었지만, 작은 글자 품질에서 차이가 벌어진다고 설명합니다.

나노바나는 글자가 작아질수록 픽셀이 깨지는 느낌이 확실하고, 비슷한 크기의 텍스트에서도 AI 티가 더 난다고 말합니다. 반대로 덕테입은 실제로 사람이 타이핑한 것 같은 한글을 더 안정적으로 보여 준다고 평가합니다.

코드팩토리는 특히 전략 기획 팀 같은 작은 텍스트를 예로 들면서, 같은 정도의 크기에서도 나노바나는 깨지고 덕테입은 비교적 선명하다고 짚습니다. 그래서 젠스파크 같은 이미지 기반 PPT 생성 서비스들에도 꽤 큰 변화가 생길 수 있다고 봅니다.

만화와 연속 이미지 쪽에서는 스타일 일관성이 더 중요해진다

세 번째 비교는 만화입니다. 한 장의 망가 이미지를 만들고, 그걸 기반으로 연속된 이미지를 생성해 얼마나 컨시스턴시를 유지하는지 보려는 테스트였다고 설명합니다.

보이는 구간 기준으로 코드팩토리는 이미지의 화려함 자체에는 덕테입 쪽에 더 높은 점수를 줍니다. 나노바나도 꽤 잘 만들었고 글자도 이 정도면 잘 쓴 편이라고 보지만, 덕테입이 전반적으로 더 강한 인상을 준다고 평가합니다.

중간 자막 일부는 비어 있지만, 뒤이어 나오는 패션 시트 비교에서는 차이가 다시 분명해집니다. 첫 번째 스마트 캐주얼 이미지를 기반으로 패션 시트를 만들게 했더니, 덕테입은 원본 인물과 아이템을 훨씬 더 정확하게 가져왔고, 나노바나는 포즈가 바뀌고 새로 찍은 것 같은 느낌이 난다고 말합니다.

스타일 보존, 특히 한국어 폰트 스타일 보존이 핵심 포인트다

후반부의 흥미로운 비교는 영어로 기울어진 글자를 쓴 포스터를 만들고, 그걸 그대로 한국어로 바꿔 달라고 한 테스트입니다. 코드팩토리는 여기서 글자 스타일이 그대로 유지되는지가 궁금했다고 말합니다.

덕테입은 영어에서 쓰던 눕혀진 스타일을 한국어에도 꽤 비슷하게 옮겨 왔다고 평가합니다. 실제로 비교해 보면 이질감이 거의 없고, AI가 한 글자씩 써 준 것 같은 느낌이라고 설명합니다.

반면 나노바나는 영어 버전은 완성도가 높지만, 한국어로 넘어오면 글자가 “오뚝 서 버린” 느낌이 강하다고 말합니다. 결국 한국어 텍스트의 밀도뿐 아니라, 스타일을 옮기는 능력에서도 덕테입 쪽이 우세하다는 결론입니다.

최종 판단은 텍스트가 많은 서비스일수록 더 단순해진다

영상 끝부분에서 코드팩토리는 오픈AI가 쌀알 위에 GPT 이미지 2 같은 글자를 쓴 예시까지 보여 주며, 이번 모델은 글자 표현 능력이 믿기지 않을 정도로 좋아졌다고 정리합니다.

그래서 이미지 생성, 슬라이드 생성, 영상 생성 서비스들이 덕테입을 도입하기 시작하면 정말 많은 영역에서 큰 변화가 날 것 같다고 말합니다. 그리고 특히 한국어를 많이 표현해야 하는 이미지 생성이라면, 본인 기준으로는 여지없이 덕테입이 승자라고 못 박습니다.

원문 발화 하이라이트

  • [00:18] “지금 이미 이미지 제너레이션을 여러분의 서비스에 통합을 하고 있다라면은 무조건 GPT로 바꾸시는게 좋을 것 같습니다.”
  • [00:29] “한국어를 생성하는 능력에서 나노바나랑 비교했을 때 엄청난 차이가 나요.”
  • [03:46] “덕이 같은 경우에는 역시나 진짜 타이핑한 것 같은 느낌이 훨씬 더 잘 드는 되게 완성도 높은 한글을 보여주고 있어요.”
  • [10:21] “덕태입이 확실히 더 한국어를 작은 글자에서도 잘 표현을 한 거를 볼 수가 있고”
  • [11:35] “꽤나 비슷한 느낌으로 한국어가 이렇게 작성이 된 거로 볼 수가 있어요.”
  • [14:03] “한국어를 많이 표현하는 이미지 제너레이션을 한다라고 하면은 저는 여지없이 덕테입이 무조건 승차라고 생각을 해요.”

바로 실행해 보기

  • 지금 쓰는 이미지 생성 모델이 있다면 예쁜 이미지 말고 빽빽한 한국어 본문, 정보 밀도 높은 PPT 한 장, 작은 한국어 캡션 세 가지로 먼저 비교해 보세요. 영상처럼 작은 글자 품질이 갈리는 순간, 실무용으로 쓸 수 있는지 바로 드러납니다
  • 캐릭터나 제품 컷을 반복 사용해야 한다면 한 장만 뽑지 말고, 원본 한 장을 만든 뒤 같은 인물 기준으로 패션 시트나 연속 장면을 다시 생성해 보세요. 코드팩토리가 본 차이도 결국 “처음 이미지를 다음 작업까지 얼마나 일관되게 끌고 가느냐”였습니다
  • 영어 포스터를 먼저 만들고 그 스타일을 그대로 한국어로 옮겨 달라고 시켜 보세요. 단순 번역이 아니라 기울기, 텍스트 분위기, 글자 배치를 같이 유지하는지 보면 어떤 모델이 실제 마케팅 자산 제작에 더 가까운지 빠르게 판단할 수 있습니다

참고

영상 메타

수집 품질

  • 자막 세그먼트: 421개
  • 자막 문자수: 7634자
  • 챕터 추출: 7개
  • 콘텐츠 생성: Subagent 기반

AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.