기본 콘텐츠로 건너뛰기

AI는 전지전능하지 않다 — 클로드 코드 두 달 쓰고 깨달은 것

thumbnail

Photo by insung yoon on Unsplash

AI한테 다 맡기면 잘 될 줄 알았습니다. 두 달 써보니, 나무 가꾸는 것과 똑같더라고요. 가지치기 안 하면 사방으로 뻗어나가기만 합니다.

이번 주 실리콘밸리에서 열린 AI 컨퍼런스에서 재밌는 이야기가 나왔습니다. AI 스타트업 Meibel의 CEO가 "모든 걸 AI한테 넣으면 토큰만 수백만 개 날린다"고 했고, 현장 엔지니어들은 AI 에이전트 시스템을 "혼란스럽다(chaotic)"고 표현했습니다.

엔비디아 CEO 젠슨 황이 "AI 에이전트가 다음 ChatGPT"라고 했는데, 정작 만드는 사람들은 아직 안정적이지 않다고 인정한 겁니다. 저도 클로드 코드를 두 달 동안 매일 쓰면서 비슷한 걸 느꼈습니다.


AI는 전지전능하지 않았다

처음에는 솔직히 기대가 컸습니다. AI한테 시키면 뭐든 되겠지. 블로그 글도 쓰고, 코드도 짜고, 일정도 관리하고. 실제로 그렇게 시켰습니다.

결과가 어땠냐면, 되긴 됩니다. 근데 방향이 없으면 AI가 만들어내는 게 점점 늘어납니다. 불필요한 기능을 추가하고, 물어보지도 않은 걸 "개선"하고, 한 번에 너무 많은 걸 하려고 합니다. 나무로 치면 가지가 사방으로 뻗어나가는 상태입니다.

CNBC가 보도한 것처럼, 실리콘밸리 현장에서도 같은 얘기가 나옵니다. AI 에이전트 시스템은 여러 부분이 서로 연결되어 있어서, 한쪽을 바꾸면 다른 쪽이 흔들립니다. "상호의존성이 이걸 어렵게 만든다, 사실 혼란스럽기까지 하다"는 게 현장 엔지니어의 말입니다.

가지치기 없는 AI는 일을 늘린다

제가 두 달 동안 가장 많이 한 일이 뭔지 아십니까. AI한테 일을 시키는 게 아니라, AI가 만들어낸 것 중에서 필요 없는 걸 쳐내는 일이었습니다.

블로그 글 하나를 쓰라고 시키면 글은 나옵니다. 그런데 거기에 불필요한 서론이 붙고, 같은 말을 돌려서 반복하고, 있어 보이려고 어려운 단어를 섞습니다. 그걸 다 걷어내고 나면 남는 건 원래 제가 말하려던 핵심 두세 줄입니다.

코드도 마찬가지였습니다. "이거 만들어줘"라고 하면 잘 만듭니다. 그런데 시키지 않은 에러 처리, 안 쓸 옵션, "나중에 필요할 수 있는" 기능까지 덤으로 붙여놓습니다. 나무가 양분을 가지 끝까지 보내느라 정작 열매 맺을 에너지가 없는 것과 같습니다.

뾰족하게 쓰는 게 답이었다

깨달은 건 단순합니다. AI한테 "알아서 해"라고 하면 안 됩니다. "이것만 해"라고 해야 합니다.

저는 지금 AI한테 일을 시킬 때 세 가지를 먼저 정합니다.

1 이번에 할 일이 정확히 뭔가

"블로그 글 써줘"가 아니라 "이 뉴스를 비개발자 시각에서 해석해서, 3000자 이내로 써줘." 범위를 좁히면 AI가 딴짓할 여지가 줄어듭니다.

2 하지 말아야 할 것은 뭔가

"어려운 전문 용어 쓰지 마", "시키지 않은 기능 추가하지 마", "같은 말 반복하지 마." 안 할 것을 알려주면 가지가 덜 뻗어나갑니다.

3 끝나면 뭐가 나와야 하는가

완성된 결과물의 형태를 미리 정해둡니다. "HTML 파일 하나", "캡션 텍스트 200자". 출구를 정해놓으면 AI가 그쪽으로 수렴합니다.

나무를 가꿀 때도 똑같습니다. 어디로 자랄지 정해주고, 쓸데없는 가지는 쳐내고, 양분이 갈 곳을 배분하는 겁니다. AI도 마찬가지입니다. 어떤 데이터를 넣을지 골라주고, 어디로 갈지 방향을 잡아주고, 안 쓸 기능은 쳐내야 합니다.

실리콘밸리도 같은 결론을 내리고 있다

Fortune은 올해 3월 기사에서 "AI 에이전트의 능력은 늘고 있지만 신뢰성은 따라가지 못하고 있다"고 보도했습니다. 기업 현장에서 AI 에이전트가 맡은 작업 3건 중 1건이 실패한다는 데이터도 나왔습니다.

토큰 비용도 문제입니다. 투자자 제이슨 칼라카니스는 자기 조직에서 클로드 API 에이전트 비용이 하루 300달러, 연간 약 1억 6천만 원까지 치솟았다고 밝혔습니다. 근데 그 에이전트가 실제로 대체한 업무는 직원 업무의 일부에 불과했습니다.

AI가 못하는 게 아니라, 뭘 시킬지 명확하지 않은 채로 시키니까 이것저것 다 하려다 토큰만 소모하는 겁니다. 나무한테 "알아서 자라"라고 해놓고 열매가 안 열린다고 불평하는 것과 같습니다.


자주 묻는 질문 (FAQ)

Q. AI를 뾰족하게 쓴다는 게 구체적으로 뭔가요?

한 번에 한 가지만 시키는 겁니다. "블로그 글 쓰고 이미지도 만들고 SNS 캡션도 써줘"가 아니라, 글 쓰기 → 검수 → 캡션 작성을 단계별로 나눠서 시키면 각 결과물의 품질이 확 올라갑니다.

Q. 비개발자도 AI를 이렇게 관리할 수 있나요?

오히려 비개발자가 유리합니다. 개발자는 AI한테 복잡한 시스템을 한 번에 만들라고 시키는 경향이 있는데, 비개발자는 "이거 하나만 해줘"라고 말하는 게 자연스럽습니다. 그게 정확히 맞는 방법입니다.

Q. 클로드 코드 말고 다른 AI도 마찬가지인가요?

네. ChatGPT든 제미나이든, 범위를 안 좁히면 AI는 기본적으로 "많이 만들어내려고" 합니다. 어떤 AI를 쓰든 가지치기 원칙은 동일합니다.


정리하며

실리콘밸리에서 수십억 달러를 쏟아붓는 사람들도 AI 에이전트의 토큰 낭비와 혼란을 인정하고 있습니다. AI를 두 달 써본 비개발자인 제가 느끼는 것도 결국 같습니다. AI는 전지전능하지 않습니다. 도구입니다. 좋은 도구는 쓰는 사람이 방향을 잡아줘야 진짜 힘을 발휘합니다.

나무는 뿌리가 튼튼하고 가지치기가 제대로 되어야 열매를 맺습니다. AI도 똑같습니다. 명확한 목표라는 뿌리를 내리고, 불필요한 것을 쳐내는 가지치기를 꾸준히 해야 쓸 만한 결과가 나옵니다. "AI한테 다 맡기면 된다"는 시대는 아직 안 왔습니다. 어쩌면 안 올 수도 있습니다. 지금 중요한 건, 내가 AI로 뭘 할 건지 뾰족하게 정하는 일입니다.


#멜론AI인사이트 #AI인사이트 #ClaudeCode #생산성

이 글이 도움됐다면 다음 글도 확인해보세요

AI가 다 해주는 시대, 남는 경쟁력은 실행력과 판단력뿐이다 →

참고 자료
· CNBC — Silicon Valley's AI agent hiccups: Wasted tokens and 'chaotic' systems
· Fortune — AI agents are getting more capable, but reliability is lagging
· CIO Korea — 토큰 비용이 연봉 넘는 시대 온다? AI 에이전트 과금 폭증에 IT 업계 경고

댓글

이 블로그의 인기 게시물

Opus 4.7 제대로 쓰는 법 — Claude Code 팀이 공유한 실전 팁 6가지 2026

Photo by Joshua Woroniecki on Unsplash Opus 4.7로 바꿨는데 "음... 좀 나아진 것 같기도?"로 끝났다면, 모델이 아니라 쓰는 방식이 문제입니다. Claude Code를 만든 팀이 직접 몇 주간 써보고 깨달은 것을 공유했습니다. 솔직히 저도 그랬습니다. Opus 4.7 나왔다길래 바로 써봤는데, 처음엔 "뭐가 달라졌지?" 싶었습니다. 그런데 Boris Cherny(Claude Code 팀)의 팁을 보고 워크플로우를 바꿨더니, 체감이 확 달라졌습니다. 매일 이 블로그를 Claude Code로 운영하면서 하나씩 적용해본 기록입니다. 광고 자리 (AdSense 승인 후 교체) 핵심 요약 — 6가지 팁 한눈에 팁 한줄 요약 적용 방법 Auto mode 권한 프롬프트 자동 판단 Shift+Tab /fewer-permission-prompts 반복 허락 묻기 제거 /fewer-permission-prompts 입력 Recaps 긴 작업 후 요약 자동 제공 자동 (Opus 4.7 기본 탑재) Focus mode 중간 과정 숨기고 결과만 /focus 입력 Effort level 생각 깊이 직접 조절 /effort 입력 검증 수단 제공 AI가 스스로 결과를 확인하게 테스트/브라우저/Computer use 연결 1. Auto mode — 옆에서 지켜보지 마세요 "이 명령어 실행해도 될까요?" — Cla...

Claude Design 제대로 쓰는 법 — Anthropic 디자이너가 공유한 실전 팁 7가지 2026

Photo by Balaji Padmanabhan on Unsplash Anthropic에서 7개 제품을 동시에 담당하는 디자이너가 있습니다. 혼자서요. 그게 가능한 이유가 Claude Design입니다. 캔버스 도구처럼 쓰면 답답한 이 도구, 제대로 쓰는 법을 정리했습니다. Figma나 Sketch 같은 캔버스 기반 도구에 익숙한 사람일수록, Claude Design을 처음 만지면 어색합니다. 레이어도 없고, 드래그 앤 드롭도 없으니까요. 그런데 이건 다른 동물입니다. Anthropic 버티컬 팀 디자이너 Flo Merboy가 X에 올린 스레드에서 직접 공유한 팁 7가지를 보면, 왜 이 도구가 워크플로우 자체를 바꾸는 물건인지 감이 옵니다. 광고 자리 (AdSense 승인 후 교체) 1. 디자인 시스템부터 세팅하라 — 준비 1시간이 수십 시간을 아낀다 작업 시작할 때 디자인 시스템과 주요 화면을 먼저 잡아두는 데 한 시간 정도 투자하세요. 이게 없으면 매번 "이 버튼은 둥근 모서리에 초록색이고 높이는 40px이고..." 하고 설명해야 합니다. 한 번 세팅해두면 이후에는 "로그인 버튼 추가해줘"로 끝납니다. 컴포넌트를 설명하고 스타일을 맞추는 반복 작업이 통째로 사라져요. 2. 엔지니어와 실시간으로 이터레이션하라 Claude Design의 진짜 힘은 속도입니다. 대화 중에 "이렇게 하면 어때요?" 하면 바로 화면이 뜹니다. 이게 무슨 의미냐면, 한 번의 미팅에서 새 기능 디자인을 마무리할 수 있다는 뜻입니다. 높은 레벨에서 개념과 제약을 얘기하면서, 그게 바로 구현되는 모습을 보는 협업. 예전 방식으로는 불가능했던 겁니다. 기획 → 시안 요청 → 대기 → 피드백 → 수정 → 대기, 이 루프가 한 자리에서 끝납니다. 광고 자리 (AdSense 승인 후 교체) 3. C...

ChatGPT 메모리가 이제 보입니다 — 환각 52% 줄인 GPT-5.5 Instant의 진짜 변화 2026

Photo by Andy Luo on Unsplash OpenAI가 ChatGPT를 조용히 바꿨습니다. 새 기본 모델 GPT-5.5 Instant가 나왔고, 환각이 절반 가까이 줄었습니다. 그런데 더 중요한 건 따로 있습니다. 이제 ChatGPT가 답을 어디서 가져왔는지 사용자에게 보여주기 시작했다는 점입니다. [AdSense 상단] 무엇이 바뀌었나 2026년 5월 5일, OpenAI는 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체했습니다. 가장 눈에 띄는 숫자는 환각률입니다. 의학·법률·금융처럼 잘못된 답이 실제로 손해로 이어지는 분야에서, 새 모델은 이전(GPT-5.3 Instant)보다 환각된 주장을 52.5% 적게 만들어냈다고 OpenAI는 자체 평가에서 밝혔습니다. 수학 추론(AIME 2025)에서는 점수가 65.4에서 81.2로 올랐고, 멀티모달 추론(MMMU-Pro)에서도 69.2에서 76으로 향상됐습니다. 속도는 이전 모델 수준을 그대로 유지했다는 게 OpenAI의 설명입니다. 그런데 진짜 변화는 모델 성능이 아니라 메모리 소스 표시 기능 입니다. ChatGPT는 이제 답변을 만들 때 참고한 과거 대화, 업로드 파일, 연결된 Gmail 정보를 사용자에게 보여줍니다. 사용자는 잘못된 출처를 삭제하거나 수정할 수 있습니다. 다른 사람과 채팅을 공유해도 메모리 소스는 본인만 볼 수 있습니다. 왜 이게 큰 변화일까요 지금까지 ChatGPT를 쓰면서 가장 답답했던 순간을 떠올려보면, 대부분 같은 종류의 답답함이었을 겁니다. "이 답이 도대체 어디서 나온 거지?" AI는 자신감 있게 답하지만, 그 자신감의 근거를 사용자가 검증할 방법이 없었습니다. 환각이라는 단어가 늘 따라다닌 이유입니다. 메모리 소스가 보이기 시작했다는 건, AI 답변에 처음으로 추적 가능한 흔적 이 생겼다는 뜻입니다. 비개발자 입장에서 이건 단순한 UI 추가가 아닙니다. 그동안 ...