코드팩토리는 Sonnet 5를 오퍼스와 코덱스 옆에 두고 디자인 능력과 코딩 능력을 같은 기준으로 비교했다. 결론은 호들갑 떨 정도의 신모델은 아니지만, 밀리언 토큰당 2달러라는 가격 때문에 API로 붙여 쓰는 팀이라면 그냥 지나치기 어렵다는 쪽에 가깝다.

flowchart LR
A[Sonnet 5의 실제 경쟁력] --> B[오퍼스보다 낮지만 4.6보다 넓어진 가격 대비 성능 범위]
B --> C[웹 디자인과 오프라인 퍼스트 코딩을 싱글 프롬프트로 비교]
C --> D[구독제 전환보다는 API 비용 최적화 후보로 의미가 생김]

핵심 요약

  • Sonnet 5는 Sonnet 4.6보다 능력치가 올라갔지만 오퍼스 4.8보다는 조금 덜 나왔다고 정리했다.
  • 입력 기준 가격이 밀리언 토큰당 2달러라서, 오퍼스와 비교하면 2.5배 차이 나는 비용 구조가 가장 큰 장점으로 소개됐다.
  • 발표자는 가격 대비 퍼포먼스 차트에서 Sonnet 5가 낮은 비용 구간부터 맥스 구간까지 선택 폭이 넓어진 점을 중요하게 봤다.
  • 디자인 테스트에서는 오퍼스가 호버, 숫자, 애니메이션, 월간·연간 결제 전환, 다크·라이트 모드, 모바일 대응까지 가장 안정적으로 보였다.
  • 오프라인 퍼스트 테스트에서는 오퍼스와 Sonnet 5가 미디엄 기준으로 만족스러웠고, 코덱스는 큐가 계속 1로 남는 장면 때문에 로직이 어색하다고 평가했다.

왜 지금 중요한가

이 비교는 코덱스로 넘어간 사람이 많아진 상황에서, 실제로 다른 모델과 놓고 보면 Sonnet 5가 어디쯤 서 있는지 확인하려는 맥락에서 나왔다. 발표자는 구독제 사용자가 이 영상 하나 때문에 모델을 바꿀 일은 거의 없다고 보면서도, API를 서비스에 탑재하는 사람에게는 저렴한 모델의 성능 향상이 바로 수익성과 연결된다고 짚었다.

주요 내용

Sonnet 5를 볼 때 먼저 체크한 건 절대 성능이 아니라 가격 대비 성능

발표자는 Sonnet 5가 새 모델이라고 해서 크게 호들갑 떨 수준은 아니라고 선을 긋는다. 대신 Sonnet 4.6보다는 좋아졌고 오퍼스 4.8보다는 조금 낮다는 상대 평가 위에, 입력 기준 밀리언 토큰당 2달러라는 가격을 함께 올려놓는다. 에이전틱 서치 기반 평가 차트에서도 이 관점을 유지한다. 오퍼스는 로우까지 내려와도 기본 비용이 높고, Sonnet 5는 비용을 아끼고 싶을 때 더 낮은 구간까지 내려갈 수 있다. 반대로 맥스까지 올리면 가격은 거의 비슷한데 Sonnet 5 쪽 퍼포먼스가 조금 낮다는 설명도 같이 붙는다.

웹 디자인 비교는 같은 프롬프트, 다른 완성도로 갈렸다

디자인 평가는 제미나이가 심판 역할로 만든 20줄 이내 프롬프트를 사용했고, 결과물은 모두 싱글 프롬프트로 생성했다. 주제는 데이터 플로우 서비스였다. 오퍼스는 마우스 호버 때 움직임과 실제 숫자, 애니메이션이 모두 잘 작동했고, 스크롤 아래 그리드도 대체로 안정적이었다. 연간 결제와 월간 결제 전환도 잘 됐고, 모바일 인스펙트에서 다크·라이트 모드 스위칭과 레이아웃 유지까지 확인됐다. 코덱스는 더 큰 히어로 섹션과 밝게 빛나는 스타일을 보여줬지만, 한국어 기반 화면에 영어가 섞였고 푸터와 배너가 어색하다는 평가를 받았다. 발표자는 결국 디자인 능력치 차이는 이제 취향 차이에 가깝다고 말하면서도, 같은 결과라면 Sonnet 쪽이 훨씬 저렴하다고 정리한다.

오프라인 퍼스트 코딩 테스트는 동기화 상태와 데이터 유지가 갈랐다

두 번째 비교는 에이전틱 코딩 능력을 보기 위한 오프라인 퍼스트 과제였다. 오퍼스 결과에서는 카드 추가와 삭제가 잘 됐고, 오른쪽 위에 all change saved 같은 상태가 보였으며, 움직일 때마다 syncing 1 표시로 실제 동기화 여부를 확인할 수 있었다. 네트워크를 토글한 뒤에도 새로고침 시 데이터가 남았고, 다시 온라인으로 돌리면 변경 사항이 저장됐다. 코덱스도 드래그와 큐잉은 됐지만, 오프라인 상태에서 변화를 줘도 큐가 계속 1로 남아 있어서 발표자가 로직이 조금 잘못된 것 같다고 판단했다. 새로고침 뒤 데이터 유지 자체는 됐지만, 큐 동작은 납득하기 어렵다는 쪽이었다.

Sonnet 5는 투박한 UI 대신 시뮬레이션 항목을 더 보여줬다

Sonnet 5는 디자인만 놓고 보면 발표자가 “기원전” 느낌이라고 농담할 정도로 투박했다. 하지만 기능 확인 장면은 더 구체적이었다. 카드 이동은 잘 됐고, 지연율을 1000으로 둬 1초 뒤 동기화되는 시뮬레이션도 보여줬다. 오프라인 상태로 전환하면 항목이 대기중으로 들어가고, 새로고침 뒤에도 오프라인 우선 데이터가 그대로 유지됐다. 여기에 실패율 50%를 걸고 삭제와 추가를 섞어 테스트했을 때는 일부는 반영되고 하나는 대기중으로 남는 장면도 확인했다. 발표자가 미디엄 기준으로 만족스러웠다고 꼽은 쪽이 오퍼스와 Sonnet 5였던 이유가 바로 이 구간에서 드러난다.

원문 발화 하이라이트

  • [00:48] “우리가이 능력치는 가격 대비 비교를 해 봐야 되죠.”
  • [00:54] “밀리언 토큰당 2달러이기 때문에 우리 오퍼스랑 비교하기에는 2.5배나 차이가 나니까 그 기준으로는 이런 능력치는 굉장히 훌륭하다라고 볼 수가 있겠죠.”
  • [02:16] “소넷 4.6보다 훨씬 더이 범위가 넓어진 거를 볼 수 있어요.”
  • [05:39] “이 디자인 능력치는 그냥 취향 차이에 가깝습니다.”
  • [09:44] “저렴한 모델이 계속 나오고 저렴한 모델들이 퍼포먼스가 높아질수록 수익 극대화가 될 수 있기 때문에”

바로 실행해 보기

  • 같은 20줄 이내 프롬프트로 데이터 플로우 랜딩 페이지를 세 모델에 각각 생성시켜 호버 애니메이션, 숫자 변화, 월간·연간 결제 전환, 다크·라이트 모드, 모바일 깨짐 여부를 한 표로 비교한다.
  • 오프라인 퍼스트 예제를 만들어 카드 추가, 삭제, 드래그 이동, 네트워크 토글, 새로고침 후 데이터 유지, 온라인 복귀 뒤 동기화 상태 표시를 순서대로 확인한다.
  • API에 모델을 붙여 쓰는 환경이라면 Sonnet 5를 밀리언 토큰당 2달러 후보로 넣고, 낮은 비용 구간과 맥스 구간에서 결과 차이와 호출 비용을 함께 측정해 본다.

참고

영상 메타

수집 품질

  • 자막 세그먼트: 315개
  • 자막 문자수: 5726자
  • 챕터 추출: 0개
  • 콘텐츠 생성: Subagent 기반

AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.