이 영상은 Anthropic의 Managed Agents를 왜 이런 구조로 만들었는지 인프라 관점에서 설명합니다. 콘솔 실습부터 세션 복구, 서버리스형 과금 방식까지 한 흐름으로 연결해 보여 줍니다.
flowchart LR A[에이전트 운영 복잡도] --> B[Managed Agents 콘솔 구성] B --> C[에이전트·세션·환경·볼트 조합] C --> D[장기 작업과 서버리스형 비용 효율]
핵심 요약
- Managed Agents는 Anthropic이 생각하는
가장 효율적인 하네싱을 인프라 관점에서 구현한 방향성이라고 코드팩토리는 설명한다 - 콘솔은 퀵스타트, 에이전트, 세션, 환경, 볼트로 나뉘며, 채팅으로 인프라를 올리고 실행 로그와 권한, 크리덴셜을 분리 관리할 수 있게 돼 있다
- 예제로는 노션과 슬랙 같은 MCP 서버를 붙인 서포트 에이전트를 보여 주고, 에어비앤비 숙소 운영 지원처럼 실제 업무 시나리오에 바로 연결한다
- 이 구조의 핵심 장점은 세션 로그, 에이전트 정의, 볼트의 크리덴셜이 남기 때문에 환경에 문제가 생겨도 마지막 세션부터 다시 이어서 돌릴 수 있다는 점이다
- 비용은 모델 토큰 비용과 세션 런타임 비용으로 나뉘며, 런타임은 세션이 실제로 러닝 상태일 때만 시간당 0.08달러로 청구된다고 설명한다
왜 지금 중요한가
로컬에서 클로드 코드를 잘 돌리는 것과, 실제 서비스용 에이전트 시스템을 운영하는 건 완전히 다른 문제입니다. 이 영상은 바로 그 차이를 짚으면서, 왜 API 체이닝과 세션 관리, 권한 분리, 크리덴셜 저장이 들어간 구조가 필요한지를 실무 언어로 설명합니다.
주요 내용
시작점은 기능 소개보다 인프라 관점의 하네싱이다
영상 초반에 코드팩토리는 이 기능을 조금 늦게 다루는 이유부터 말합니다. 이게 도대체 뭐가 좋은 거야라는 질문이 나올 수밖에 없기 때문에, 제대로 설명할 시간이 필요했다는 거죠. 그래서 오늘은 개인 의견보다 Anthropic이 직접 설명한 인프라 관점의 생각을 따라가며 보겠다고 합니다.
핵심 정의도 여기서 나옵니다. Managed Agents는 Anthropic이 생각하는 매우 주관적인 하네싱 방식의 방향성이 인프라 레벨에서 구현된 형태라고 설명합니다. 즉, 그냥 새 UI가 아니라 에이전트 운영 방식을 추상화한 시스템으로 보는 게 맞다는 이야기입니다.
콘솔 구조는 퀵스타트, 에이전트, 세션, 환경, 볼트로 분리된다
코드팩토리는 클로드 콘솔 안의 Managed Agents 화면을 직접 보여 주며 각 탭 역할을 풀어 줍니다. 퀵스타트는 아래에 있는 여러 요소를 한 번에 다루면서 채팅으로 인프라를 올릴 수 있는 진입점으로 설명합니다.
에이전트는 우리가 일반적으로 아는 에이전트 정의 자체입니다. 어떤 기능을 수행할지 정하는 곳이죠. 세션은 실제로 채팅이나 인스트럭션으로 작업을 돌렸을 때 생기는 로그가 담기는 공간입니다. 환경은 에이전트가 실행될 수 있는 런타임 환경이고, 여기서 권한 설정도 조정할 수 있다고 말합니다. 마지막 볼트는 별도 서비스 이름 그대로 크리덴셜을 관리하는 기능입니다.
코드팩토리는 이 네 가지를 조합하는 것이 Anthropic 관점의 효율적인 하네싱이라고 정리합니다. 즉, 실행 정의와 실행 이력, 실행 환경, 비밀 정보를 분리한 뒤 조합해서 운영하는 방식입니다.
예제는 노션과 슬랙을 붙인 숙소 서포트 에이전트다
설명을 쉽게 하기 위해 코드팩토리는 서포트 에이전트 템플릿을 고릅니다. YAML과 JSON 형태라서 이해하기 어렵지 않다고 말하고, 여기에 노션과 슬랙 MCP 서버를 연결합니다.
예제 시나리오는 에어비앤비 숙소 지원입니다. 노션 페이지 안에 숙소 사용 가이드, 와이파이 정보 같은 내용을 넣어 두면, 시스템이 그 정보를 가져와 세션 안에서 답변이나 작업을 수행하는 구조라고 설명합니다. 이미 사업을 하고 있는 사람이라면 얼마나 쉽게 셋업할 수 있는지, 또 얼마나 효율적으로 인프라 관리를 할 수 있는지 감이 올 거라고 말하죠.
여기서 중요한 반론도 미리 받아칩니다. 그냥 클로드 코드 써서 로컬에서 돌리면 되는 것 아니냐는 반응이 나올 수 있지만, 실제 AI 서비스를 운영해 보면 API를 쓰지 않고, 에이전트를 체이닝하지 않고는 구현할 수 없는 기능이 많다고 설명합니다. 특히 트래픽에 따라 스케일링해야 하기 때문에, 이건 로컬 사용 관점에서 만들어진 시스템이 아니라는 점을 분명히 합니다.
세션 복구와 메타 하네스 개념이 이 설계의 핵심이다
후반부에서는 왜 이런 구조가 필요한지 더 추상화해서 설명합니다. 진행했던 과정이 세션에 남고, 에이전트 정의도 독립적으로 남고, 볼트 안의 크리덴셜도 저장되기 때문에 새로운 환경을 만든 뒤 마지막 세션부터 다시 시작할 수 있다는 거죠.
코드팩토리는 이걸 두고 문제가 생겨도 연속적으로 작업을 이어 갈 수 있는 하네스라고 설명합니다. 그리고 Managed Agents를 특정 한 가지 미래 하네스에만 묶이지 않는 메타 하네스라고 부릅니다. 다양한 하네스를 지원하는 범용 인터페이스를 가진 시스템이라는 해석입니다.
결국 이 레이어들은 AI 에이전트 시대의 추상화 계층으로 이해하면 된다고 정리합니다. 아직 생각하지 못한 프로그램과 운영 방식까지 수용할 수 있도록 일반화된 인프라 레이어를 제공한다는 설명입니다.
가격은 모델 비용과 세션 런타임 비용으로 나뉜다
마지막 파트는 가격 구조입니다. 코드팩토리는 비용 요소가 두 가지라고 말합니다. 하나는 우리가 익숙한 모델 프라이싱, 즉 어떤 모델을 쓰느냐와 입력, 출력 토큰에 따라 붙는 비용입니다. Opus, Sonnet, Haiku에 따라 달라지는 그 비용 그대로 간다는 설명입니다.
다른 하나는 세션 런타임 비용입니다. 이건 세션이 실제로 돌아가는 시간에만 붙고, 시간당 0.08달러라고 말합니다. 중요한 건 러닝 상태일 때만 청구된다는 점입니다. 에이전트 정의, 환경, 볼트 자체에는 비용이 붙지 않고, 실제 실행하거나 툴콜을 하는 구간만 취합해서 과금된다고 설명합니다.
코드팩토리는 이 구조를 서버리스와 매우 비슷하다고 봅니다. 쓰지 않을 때 비용을 내지 않고, 직접 인프라를 관리하지 않아도 되는 장점이 있기 때문입니다. 그래서 장시간 유휴 구간이 있는 워크로드나, 인프라 관리 비용까지 함께 계산해야 하는 팀이라면 꽤 진지하게 검토할 만한 신규 도구라고 정리합니다.
원문 발화 하이라이트
- [00:31] “엔트로픽이 생각하는 인프라스트럭처 관점에서의 하네싱 기법”
- [01:00] “굉장히 주관적인 하네싱이 어떻게 되는지에 대한 방향성이 인프라 관점에서 구현이 돼 있다”
- [03:03] “실제 AI 서비스를 굴렸을 때는 우리가 API를 사용하지 않고 그리고 또 우리가 에이전트를 만들어서 그 체이닝을 해 가지고 하지 않고서 구현을 할 수가 없는 기능들이 굉장히 많아요.”
- [13:42] “마지막에 멈췄던 이 세션 정보로부터 다시 작업을 시작을 하면은”
- [14:27] “다양한 하네스를 지원하는 범용 인터페이스를 갖춘 시스템이다”
- [16:08] “세션을 실행하는 한시간당 0.08달러를 여러분들이 지불하게 되고요.”
바로 실행해 보기
- 지금 운영 중인 에이전트 워크플로우를
에이전트 정의,세션 로그,실행 환경,크리덴셜네 덩어리로 나눠 적어 보세요. 이 영상의 핵심도 바로 그 분리 구조였습니다. 어디가 섞여 있는지만 봐도 왜 운영이 불편한지 바로 드러납니다 - 로컬에서만 돌리는 자동화가 있다면, 트래픽이 붙었을 때 무엇을 API 체이닝과 세션 단위로 바꿔야 하는지 체크해 보세요. 코드팩토리가 강조한 것도 “로컬에서 되느냐”보다 “서비스로 운영되느냐”였습니다
- 비용 비교를 할 때는 모델 토큰 비용만 보지 말고, 실제로 작업이
러닝 상태인 시간과 유휴 시간을 따로 계산해 보세요. 세션 런타임이 시간당 0.08달러라는 기준을 두고, 현재 인프라 비용과 비교해 보면 서버리스형 운영이 유리한지 감이 훨씬 빨리 옵니다
참고
영상 메타
- 채널: 코드팩토리 Code Factory
- 제목: 앤트로픽이 말하는 가장 효율적인 Harnessing. Managed Agents! 앙
- 게시 시각(원문): 20260413
- 영상: https://www.youtube.com/watch?v=IAEV_fUAdWk
- 썸네일: https://i.ytimg.com/vi/IAEV_fUAdWk/maxresdefault.jpg
수집 품질
- 자막 세그먼트: 597개
- 자막 문자수: 10828자
- 챕터 추출: 0개
- 콘텐츠 생성: Subagent 기반
AI 생성 도구를 활용해 초안을 구성했고, 원영상 발화와 공개 자료를 교차 확인해 정리했습니다.