이 영상은 오픈AI가 새로 공개한 이미지 생성 모델과 제미나이 나노 바나나 프로를 정면으로 붙여 보는 비교 테스트다. 코드팩토리는 특히 한국어 텍스트 생성, 작은 글자 표현, 스타일 유지, 참조 기반 일관성에서 차이가 크게 난다고 보고, 서비스에 이미지 생성을 통합하고 있다면 GPT 계열로 바꾸는 게 좋겠다고까지 말한다. 데모는 추상적인 벤치마크가 아니라 책 본문, 컨설팅 슬라이드, 만화, 패션 시트, 한국어 폰트 스타일, 쌀알 속 초소형 텍스트처럼 아주 실무적인 장면으로 구성돼 있다.

flowchart LR
A[이미지 생성 품질 비교 필요] --> B[한국어·문서·스타일·참조 일관성 테스트]
B --> C[덕테잎과 나노 바나나 정면 비교]
C --> D[한국어와 미세 텍스트에서는 덕테잎 우세]

핵심 요약

  • 영상의 전체 결론은 명확하다. 이미지 생성을 서비스에 붙이고 있다면 덕테잎, 즉 GPT 계열이 훨씬 유리하다는 판단이다
  • 가장 큰 차이는 한국어였다. 펼쳐진 책 양면을 한국어 본문으로 빽빽하게 채우는 테스트에서 덕테잎은 실제 인쇄물처럼 보였고, 나노 바나나는 깨지거나 읽기 어려운 글자가 많이 나왔다
  • PPT 슬라이드 테스트에서도 둘 다 구성은 잘했지만, 작은 한글과 정보 밀도가 높아질수록 덕테잎 쪽이 더 타이핑한 것 같은 결과를 보여줬다
  • 참조 이미지 기반 일관성에서도 덕테잎이 강했다. 패션 시트 생성에서 1번 이미지를 거의 그대로 유지해 옷 구성과 액세서리까지 정확히 반영했다
  • 영어의 기울어진 스타일을 한국어로 옮기는 테스트와 쌀알에 GPT 이미지 2를 숨기는 초미세 텍스트 테스트에서도 덕테잎이 확실히 앞섰다

왜 지금 중요한가

이미지 생성 성능 차이는 이제 단순히 그림이 예쁘냐의 문제가 아니다. 발표자가 보여준 예시는 책 본문, 컨설팅 슬라이드, 패션 시트, 포스터처럼 실제 제품 화면과 마케팅 자산에 바로 연결되는 종류들이다. 특히 한국어를 많이 써야 하는 서비스라면 작은 글자 품질 하나가 결과물의 신뢰도를 거의 결정해 버린다.

주요 내용

한국어 본문이 빽빽한 책 페이지에서 격차가 크게 났다

첫 테스트는 아주 직관적이다. 펼쳐진 책 양면에 한국어 본문 텍스트가 가득한 이미지를 만들어 달라는 프롬프트다. 왼쪽이 덕테잎, 오른쪽이 나노 바나나 프로 결과인데, 발표자는 확대했을 때 차이가 바로 보인다고 말한다.

덕테잎 쪽은 글자가 정말 잘 작성돼 있고, 원래 생성이 어려웠던 복잡한 한글 조합도 꽤 자연스럽게 나온다. 발표자는 이 정도면 진짜 책을 찍은 것 같다고 표현할 정도다. 반면 나노 바나나는 , 처럼 보이는 글자 근처에서 형태가 무너지고, 읽는 사람 입장에서 타이핑된 텍스트라고 보기 어려운 결과가 많이 나온다. 아주 작은 글자, 빽빽한 글자, 섬세한 텍스트일수록 AI 티가 더 강하게 난다는 얘기다. 덕테잎도 복잡한 글자가 한꺼번에 엮일 때 약간 픽셀이 깨지는 부분은 있지만, 영상의 판단은 분명하다. 한국어가 많이 들어가는 이미지 생성은 덕테잎이 승자다.

컨설팅 스타일 PPT 슬라이드에서도 작은 한글 품질이 갈랐다

두 번째 테스트는 메켄지, BCG, 베인 스타일의 고밀도 단일 슬라이드를 이미지로 만드는 작업이다. 둘 다 전체 구성은 제법 잘 만든다. 문제는 작은 텍스트다.

발표자는 나노 바나나는 글자가 작아질수록 픽셀이 깨지는 느낌이 뚜렷하다고 말한다. 반대로 덕테잎은 작은 크기에서도 정말 타이핑한 것 같은 한글을 보여준다고 평가한다. 특히 오른쪽 아래의 전략 기획 팀 같은 텍스트를 예로 들면서, 비슷한 크기인데도 나노 바나나는 벌써 깨져 보이고 덕테잎은 또렷하게 유지된다고 짚는다. 이 차이 때문에 발표자는 이미지 기반 PPT나 슬라이드덱을 자동 생성하는 서비스들에도 꽤 큰 변화가 올 수 있다고 본다.

만화와 패션 시트에서는 참조 유지력 차이가 드러났다

세 번째 비교는 만화다. 한 장의 망가 이미지를 만든 뒤, 그걸 기반으로 연속 이미지를 생성해서 캐릭터와 장면의 컨시스턴시를 보려는 테스트다. 자막 중간 일부는 잘려 있지만, 보이는 설명만으로도 방향은 분명하다. 발표자는 이미지의 화려함에서는 덕테잎에 표를 주고 싶다고 말하고, 나노 바나나도 꽤 잘 만들었으며 글자도 이 정도면 잘 써졌다고 평가한다.

이후 이어지는 패션 시트 테스트에서는 차이가 더 분명하다. 첫 번째 스마트 캐주얼 이미지를 기준으로 패션 시트를 만들게 했더니, 덕테잎은 1번 이미지를 기반으로 블레이저, 셔츠, 슬랙스, 스니커스, 액세서리까지 정확하게 뽑아낸다. 반면 나노 바나나는 1번을 기반으로 만들긴 했지만 포즈가 바뀌고, 완전히 가져온 느낌보다는 새로 찍은 것 같은 결과가 나온다. 얼굴도 덕테잎 쪽이 더 잘 유지되고, 같은 의상 계열을 재정리하는 능력 역시 안정적으로 보인다는 게 영상의 평가다.

한국어 스타일 유지와 초소형 텍스트는 거의 결정타에 가깝다

후반부에서 가장 흥미로운 테스트는 영어 포스터를 먼저 만든 뒤, 그 스타일을 한국어로 그대로 옮길 수 있는지 보는 장면이다. 두 모델 모두 처음에는 기울어진, 즉 아이탤릭 스타일의 영어 문구를 만든다. 그다음 이를 한국어로 다시 만들어 달라고 했을 때 덕테잎은 영어에서 보이던 눕혀진 스타일을 꽤 비슷하게 유지한다. 발표자는 실제 존재하는 폰트인지는 모르겠지만, 영어의 스타일이 한국어 작성에도 그대로 옮겨 왔다고 볼 수 있을 정도라고 말한다.

반대로 나노 바나나는 한국어로 오면서 글자가 서 버린다. 발표자는 나노 바나나는 한국어 폰트가 하나밖에 없는 것 같은 느낌이라고 표현한다. 덕테잎은 AI가 글자를 하나씩 써 내려간 것 같은 인상을 주고, 영어와 한국어 사이를 돌려 보아도 이질감이 적다는 것이다.

마지막으로 오픈AI가 테스트한 사례도 보여 준다. 쌀을 부어 놓은 그림 안에 쌀 한 톨 크기로 GPT 이미지 2라는 글자가 숨어 있는데, 확대하면 픽셀화되긴 해도 누가 봐도 그 문구였다는 걸 알 수 있을 정도라고 설명한다. 여기서 발표자는 글자를 표현하는 능력이 압도적으로 늘었고, 현실적인 이미지 생성 능력도 나노 바나나보다 조금 더 높아진 것 같다고 정리한다.

원문 발화 하이라이트

“이미 이미지 제너레이션을 여러분의 서비스에 통합을 하고 있다라면은 무조건 GPT로 바꾸시는게 좋을 것 같습니다.”

“한국어를 생성하는 능력에서 나노바나랑 비교했을 때 엄청난 차이가 나요.”

“이 정도면 진짜 책을 찍은 게 아닐까라는 생각이 들 정도로 정말 완성도가 높고요.”

“덕테입은 진짜 AI가 하나씩 하나씩 글자를 쓴 거 같은 느낌이에요.”

“한국어를 많이 표현하는 이미지 제너레이션을 한다라고 하면은 저는 여지없이 덕테입이 무조건 승차라고 생각을 해요.”

바로 실행해 보기

  1. 한국어가 많은 실제 업무 이미지로 바로 비교해 본다. 책 본문, PPT, 포스터, 카드 뉴스처럼 작은 한글이 많이 들어가는 장면을 같은 프롬프트로 양쪽 모델에 넣어 본다
  2. 참조 이미지 유지력을 꼭 따로 본다. 캐릭터, 패션 컷, 제품 사진처럼 같은 인물과 아이템을 후속 이미지로 재구성해야 하는 작업에서 차이가 크게 난다
  3. 폰트 스타일과 초소형 텍스트까지 체크한다. 단순히 글자가 보이느냐보다 영어 스타일이 한국어로 유지되는지, 아주 작은 크기에서도 타이핑처럼 읽히는지를 확인해야 실제 서비스 품질을 가늠할 수 있다

참고

  • 영상: 왕의 귀환! 방금 나온 덕테잎 vs 나노 바나나 심층 비교! 앙

영상 메타

수집 품질

  • 자막 세그먼트: 421개
  • 자막 문자수: 7634자
  • 챕터 추출: 7개
  • 콘텐츠 생성: Subagent 기반

AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.