기본 콘텐츠로 건너뛰기

클로드 코드 왕초보 가이드 10편 — AI 비용 아끼는 7가지 습관 2026

thumbnail

Photo by SHASHANK K on Unsplash

Claude Code를 신나게 쓰다가 월말에 청구서를 보고 놀란 적 있다면, 원인은 대부분 같습니다. "비싼 모델로 간단한 일을 시켰거나, 대화를 너무 길게 끌었거나." 오늘 정리하는 7가지 습관이면 같은 작업을 하면서도 비용을 절반 이하로 줄일 수 있습니다.

"나는 구독제(Pro/Max)인데 비용이 왜 중요하지?" 이렇게 생각할 수 있습니다. 구독제도 사용량에 따라 속도 제한이 걸립니다. 한마디로, 돈이 아니라 "속도"를 아끼는 겁니다. 습관을 들이면 같은 구독료로 훨씬 많은 작업을 처리할 수 있습니다.


토큰 — AI 비용의 기본 단위

AI는 글자가 아니라 "토큰"이라는 단위로 텍스트를 처리합니다. 핸드폰 데이터에 비유하면 이해가 쉽습니다.

  • 핸드폰 데이터 — 영상 보면 많이 쓰고, 텍스트 메시지는 거의 안 씀
  • AI 토큰 — 긴 파일 읽히면 많이 쓰고, 짧은 질문은 거의 안 씀

한국어 기준 대략 2~3글자가 1토큰입니다. 영어는 한 단어가 보통 1토큰. 즉 한국어가 영어보다 토큰을 더 많이 씁니다. "안녕하세요"는 약 3~4토큰, "Hello"는 1토큰입니다.

비용이 뛰는 3가지 상황

상황 왜 비용이 뛰나 체감 비유
큰 파일을 통째로 읽힐 때 수천 줄 파일 = 수천 토큰이 한 번에 소모 고화질 영상 스트리밍
대화를 너무 길게 끌 때 AI는 매번 전체 대화를 다시 읽음 같은 영상을 계속 다시 재생
비싼 모델로 간단한 일을 시킬 때 Opus 급으로 파일 이름 변경 같은 일을 시킴 택시 타고 편의점 가기

모델별 비용 — 같은 일인데 가격이 다르다

Claude Code에서 쓸 수 있는 모델은 크게 3가지입니다. 능력이 다르고, 비용도 다릅니다.

모델 성능 비용 수준 적합한 작업
Haiku 가볍고 빠름 저렴 파일 정리, 이름 변경, 간단한 질문
Sonnet 균형 중간 코드 작성, 문서 정리, 일반 작업
Opus 최고 성능 비쌈 복잡한 분석, 대규모 리팩토링, 전략적 판단

핵심은 간단합니다. 간단한 일에 비싼 모델을 쓰면 낭비입니다. 파일 이름 바꾸는 데 Opus를 쓸 필요 없고, 복잡한 분석에 Haiku를 쓰면 결과물이 부실합니다.

구독제(Pro/Max) 사용자도 해당됩니다. 구독제는 돈이 더 나가는 건 아니지만, 비싼 모델을 남발하면 속도 제한(Rate Limit)에 더 빨리 걸립니다. 같은 구독료로 더 많이 쓰려면 모델 선택이 중요합니다.

비용 아끼는 7가지 습관

1 /cost로 현재 비용 확인하기

지금 대화에서 토큰을 얼마나 썼는지 바로 확인할 수 있습니다. 가계부를 안 쓰면 돈이 어디서 새는지 모르는 것과 같습니다.

/cost

현재 세션의 토큰 사용량과 예상 비용이 표시됩니다. 작업 중간중간 확인하는 습관을 들이면, 어떤 작업이 비용을 많이 쓰는지 감이 잡힙니다.

2 /clear로 대화 초기화하기

주제가 완전히 바뀔 때는 이전 대화를 끌고 가지 마세요. AI는 매번 전체 대화를 다시 읽기 때문에, 관계없는 과거 대화가 쌓이면 매 응답마다 토큰이 낭비됩니다.

/clear

깨끗한 상태에서 새 작업을 시작합니다. 8편에서 다뤘던 "새 대화 시작"과 같은 원리입니다.

3 /compact로 대화 압축하기

같은 작업을 이어가야 하는데 대화가 길어졌다면, /clear 대신 /compact를 씁니다. 핵심 맥락은 유지하면서 불필요한 내용을 정리합니다.

/compact 파일 변경 내역 위주로 정리해줘

방향을 지정하면 더 효과적입니다. 대화 30분 이상 지속되면 한 번씩 실행하세요.

4 구체적으로 요청하기

AI한테 모호하게 시키면, AI가 이것저것 탐색하느라 토큰을 더 씁니다. "알아서 해줘"보다 "정확히 뭘 해줘"가 비용도 적고 결과도 좋습니다.

Before — 모호한 요청 이 프로젝트 좀 정리해줘
After — 구체적인 요청 /src/components 폴더에서 사용하지 않는 파일 목록만 알려줘

구체적인 요청은 AI가 읽어야 할 파일 수를 줄이고, 응답도 짧아집니다. 토큰 절약의 가장 기본입니다.

5 작업에 맞게 모델 바꾸기

간단한 작업에는 가벼운 모델을 쓰세요. Claude Code 안에서 모델을 바꾸는 건 한 줄이면 됩니다.

/model haiku # 간단한 작업에
/model sonnet # 일반 작업에
/model opus # 복잡한 작업에

파일 이름 바꾸기, 간단한 질문 같은 건 Haiku면 충분합니다. 복잡한 분석이나 대규모 코드 작업에만 Opus를 꺼내세요.

6 CLAUDE.md 간결하게 유지하기

7편에서 CLAUDE.md를 만드는 법을 배웠습니다. 유용한 파일이지만, 너무 길면 매 대화 시작마다 토큰을 잡아먹습니다. AI가 세션을 시작할 때 이 파일을 통째로 읽기 때문입니다.

  • 핵심 규칙만 남기고 나머지는 삭제
  • 예시가 너무 많으면 대표적인 것 1~2개만 유지
  • 주석이나 설명이 길면 한 줄로 요약

CLAUDE.md가 50줄 이상이라면 한번 다이어트를 검토해 보세요.

7 .claudeignore로 불필요한 파일 차단하기

프로젝트 폴더에 AI가 읽을 필요 없는 파일이 있으면, .claudeignore 파일로 차단할 수 있습니다. .gitignore와 문법이 같습니다.

# .claudeignore 예시
node_modules/
*.log
dist/
*.min.js

AI가 탐색하는 파일이 줄어들면, 그만큼 토큰도 절약됩니다. 특히 node_modules 같은 거대한 폴더가 있다면 반드시 차단하세요.


구독제 사용자를 위한 추가 팁

Pro나 Max 구독제를 쓰고 있다면, 비용보다 "속도 제한"이 관건입니다. 아래 두 가지 명령어를 알아두세요.

/stats — 사용 패턴 확인

/stats

현재 구독의 사용 패턴을 보여줍니다. 어떤 모델을 얼마나 썼는지, 속도 제한에 얼마나 가까운지 파악할 수 있습니다.

/fast — 빠른 모드 토글

/fast

Fast Mode를 켜면 같은 모델이 더 빠르게 응답합니다. 모델이 바뀌는 게 아니라, 출력 속도가 빨라지는 겁니다. 대신 속도 제한(Rate Limit)을 좀 더 빨리 소모합니다.

Fast Mode 핵심: 같은 Opus 모델인데 응답이 더 빨라집니다. 모델 자체가 바뀌는 건 아닙니다. 빠른 응답이 필요할 때 켜고, 속도 제한이 걱정될 때 끄면 됩니다. 간단한 작업에 비용을 아끼려면 /fast보다 /model haiku가 맞습니다.

자주 묻는 질문 (FAQ)

Q. Pro 구독인데 /cost를 찍으면 금액이 나오나요?

구독제에서는 실제 청구 금액이 아니라 "토큰 사용량"이 표시됩니다. 종량제(API)를 쓸 때만 실제 비용이 나옵니다. 구독제 사용자는 사용량 패턴을 파악하는 용도로 참고하면 됩니다.

Q. 모델을 바꾸면 이전 대화 내용이 사라지나요?

아닙니다. /model 명령어로 모델을 바꿔도 대화는 그대로 유지됩니다. 다음 응답부터 바뀐 모델이 적용될 뿐입니다. 부담 없이 작업 중간에 전환해도 됩니다.

Q. .claudeignore를 설정하면 AI가 아예 그 파일을 못 보나요?

맞습니다. .claudeignore에 등록된 파일과 폴더는 AI의 탐색 대상에서 완전히 제외됩니다. 나중에 해당 파일을 AI에게 보여줘야 한다면, .claudeignore에서 해당 항목을 삭제하면 됩니다.


시리즈 전체 목차


정리하며

관점 한 스푼: AI 비용 관리는 결국 "내 시간의 가치"를 아는 것과 같습니다. 한 달에 커피 두 잔 값으로 수십 시간을 아끼는 도구인데, 거기서 몇 백원을 더 아끼겠다고 불편하게 쓰면 본말이 전도됩니다. 진짜 중요한 건 "낭비를 줄이는 것"이지 "안 쓰는 것"이 아닙니다. 택시비가 아까워서 안 타는 게 아니라, 편의점 갈 때는 걸어가고 공항 갈 때만 타는 겁니다. 오늘 정리한 7가지 습관은 그 판단 기준을 만드는 일입니다.


#멜론 AI 인사이트 #Claude Code #초보자 가이드 #비개발자 #AI 비용 절약

다음 편: AI와 안전하게 협업하는 법

11편: Git — 곧 공개 →

참고 자료
· Anthropic 공식 문서 — Claude Code Documentation
· Anthropic 공식 문서 — Claude Code CLI Usage

댓글

이 블로그의 인기 게시물

Opus 4.7 제대로 쓰는 법 — Claude Code 팀이 공유한 실전 팁 6가지 2026

Photo by Joshua Woroniecki on Unsplash Opus 4.7로 바꿨는데 "음... 좀 나아진 것 같기도?"로 끝났다면, 모델이 아니라 쓰는 방식이 문제입니다. Claude Code를 만든 팀이 직접 몇 주간 써보고 깨달은 것을 공유했습니다. 솔직히 저도 그랬습니다. Opus 4.7 나왔다길래 바로 써봤는데, 처음엔 "뭐가 달라졌지?" 싶었습니다. 그런데 Boris Cherny(Claude Code 팀)의 팁을 보고 워크플로우를 바꿨더니, 체감이 확 달라졌습니다. 매일 이 블로그를 Claude Code로 운영하면서 하나씩 적용해본 기록입니다. 광고 자리 (AdSense 승인 후 교체) 핵심 요약 — 6가지 팁 한눈에 팁 한줄 요약 적용 방법 Auto mode 권한 프롬프트 자동 판단 Shift+Tab /fewer-permission-prompts 반복 허락 묻기 제거 /fewer-permission-prompts 입력 Recaps 긴 작업 후 요약 자동 제공 자동 (Opus 4.7 기본 탑재) Focus mode 중간 과정 숨기고 결과만 /focus 입력 Effort level 생각 깊이 직접 조절 /effort 입력 검증 수단 제공 AI가 스스로 결과를 확인하게 테스트/브라우저/Computer use 연결 1. Auto mode — 옆에서 지켜보지 마세요 "이 명령어 실행해도 될까요?" — Cla...

클로드 코드 왕초보 가이드 11편 — Git으로 작업 안전하게 저장하기 2026

Photo by carmen dominguez on Unsplash 클로드 코드 왕초보 가이드 — 11편 전체 목차 보기 Claude Code로 파일을 수정하다가 "아, 아까 그 버전이 더 나았는데" 싶은 적 있으신가요? Ctrl+Z를 연타해도 돌아가지 않는 그 순간. Git을 쓰면 무한 Ctrl+Z가 됩니다. 비개발자도 세 마디면 끝납니다. AI한테 파일을 고치라고 시키면, 파일이 순식간에 바뀝니다. 한 번이면 괜찮은데 두세 번 고치다 보면 "처음 버전이 나았다"는 생각이 듭니다. 문제는 그때 이미 처음 버전이 사라져 있다는 겁니다. 광고 자리 (AdSense 승인 후 교체) 왜 저장이 따로 필요한가 일반적인 문서 작업이라면 Ctrl+S 하나로 충분합니다. 하지만 Claude Code와 함께 작업하면 상황이 다릅니다. AI가 한 번에 여러 파일을 동시에 수정합니다 "이것도 고쳐줘"를 3번 반복하면 원본이 어땠는지 기억이 안 납니다 Ctrl+Z는 현재 열려 있는 파일 하나만 되돌립니다 "2시간 전 상태로 통째로 돌아가고 싶다"는 불가능합니다 Git은 이 문제를 해결합니다. 작업 폴더 전체를 특정 시점으로 되돌리는 타임머신입니다. Google Drive vs Git — 뭐가 다른가요 "Google Drive도 버전 기록이 있잖아요?"라고 생각하실 수 있습니다. 맞습니다. 하지만 성격이 다릅니다. 항목 Google Drive Git 저장 방식 자동 저장 (알아서 됨) 직접 저장 (내가 "저장해줘"라고 해야 됨) 저장 단위 ...

ChatGPT 메모리가 이제 보입니다 — 환각 52% 줄인 GPT-5.5 Instant의 진짜 변화 2026

Photo by Andy Luo on Unsplash OpenAI가 ChatGPT를 조용히 바꿨습니다. 새 기본 모델 GPT-5.5 Instant가 나왔고, 환각이 절반 가까이 줄었습니다. 그런데 더 중요한 건 따로 있습니다. 이제 ChatGPT가 답을 어디서 가져왔는지 사용자에게 보여주기 시작했다는 점입니다. [AdSense 상단] 무엇이 바뀌었나 2026년 5월 5일, OpenAI는 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체했습니다. 가장 눈에 띄는 숫자는 환각률입니다. 의학·법률·금융처럼 잘못된 답이 실제로 손해로 이어지는 분야에서, 새 모델은 이전(GPT-5.3 Instant)보다 환각된 주장을 52.5% 적게 만들어냈다고 OpenAI는 자체 평가에서 밝혔습니다. 수학 추론(AIME 2025)에서는 점수가 65.4에서 81.2로 올랐고, 멀티모달 추론(MMMU-Pro)에서도 69.2에서 76으로 향상됐습니다. 속도는 이전 모델 수준을 그대로 유지했다는 게 OpenAI의 설명입니다. 그런데 진짜 변화는 모델 성능이 아니라 메모리 소스 표시 기능 입니다. ChatGPT는 이제 답변을 만들 때 참고한 과거 대화, 업로드 파일, 연결된 Gmail 정보를 사용자에게 보여줍니다. 사용자는 잘못된 출처를 삭제하거나 수정할 수 있습니다. 다른 사람과 채팅을 공유해도 메모리 소스는 본인만 볼 수 있습니다. 왜 이게 큰 변화일까요 지금까지 ChatGPT를 쓰면서 가장 답답했던 순간을 떠올려보면, 대부분 같은 종류의 답답함이었을 겁니다. "이 답이 도대체 어디서 나온 거지?" AI는 자신감 있게 답하지만, 그 자신감의 근거를 사용자가 검증할 방법이 없었습니다. 환각이라는 단어가 늘 따라다닌 이유입니다. 메모리 소스가 보이기 시작했다는 건, AI 답변에 처음으로 추적 가능한 흔적 이 생겼다는 뜻입니다. 비개발자 입장에서 이건 단순한 UI 추가가 아닙니다. 그동안 ...