Notion 3.0 AI Agents 7가지 워크플로 패턴 — 커스텀 에이전트로 업무 자동화 2026
Notion 3.0 Custom Agents 7가지 워크플로 패턴 — 일일 브리핑·리서치 자동화·DB 업데이트·Slack 통합·문서 초안 작성까지. 5월 4일 시점 가격 변경(크레딧 $10/1,000)과 한국 1인 운영자의 진입 분기를 정리합니다.
AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.
AI 코딩 에이전트가 너무 많아졌죠. Cursor, Copilot, Claude Code, Windsurf... 뭘 써야 할지 모르겠다는 분이 정말 많더라고요. 제가 3개월 동안 5개를 전부 돌려봤는데, 순위가 생각보다 뚜렷하게 갈렸어요.
코드 자동완성이랑 혼동하는 분이 많은데, 에이전트는 차원이 달라요. "이 파일에서 버그 찾아서 고쳐줘"라고 말하면 알아서 파일을 읽고, 수정하고, 테스트까지 돌려요.
2026년 기준으로 에이전트급 기능을 제공하는 도구는 크게 5개예요.
제가 동일한 프로젝트(Next.js 풀스택 앱)에 5개를 각각 적용해봤어요. 같은 작업을 시키고 속도, 정확도, 비용을 측정한 결과예요.
속도 테스트 (500줄 리팩토링)
정확도 테스트 (버그 수정 10건)
제가 가장 많이 쓰게 된 건 Claude Code예요. 이유가 명확해요.
터미널에서 바로 "이 컴포넌트 성능 개선해줘"라고 치면 파일을 읽고, 수정하고, git commit까지 해요. IDE를 안 켜도 되거든요.
실제로 제 사이드 프로젝트에서 API 엔드포인트 15개를 리팩토링했는데, 2시간이면 끝날 작업을 48분 만에 완료했어요. 비용은 API 토큰비로 약 2.3달러.
단점은 GUI가 없어서 시각적으로 확인하기 불편하다는 거예요. 코드 변경사항을 눈으로 diff로만 봐야 해요.
Cursor는 에디터 자체가 AI에요. Cmd+K로 코드를 고치고, Composer로 멀티파일 수정을 시키고, Agent 탭에서 복잡한 작업을 맡길 수 있어요.
제가 가장 인상 깊었던 건 Composer 기능이에요. "로그인 페이지에 소셜 로그인 추가해줘"라고 했더니 프론트엔드 컴포넌트, API 라우트, 환경변수 설정까지 한 번에 만들어줬거든요.
월 20달러(Pro 기준)인데, 이 가격에 이 정도 생산성이면 솔직히 싸다고 느꼈어요.
2026년 초에 추가된 Agent 모드가 게임체인저예요. 기존 Copilot은 자동완성만 했는데, 이제는 "@workspace 이 프로젝트에서 미사용 import 전부 정리해줘"같은 명령이 돼요.
강점은 GitHub 생태계 연동이에요. PR 설명 자동 작성, 이슈 기반 코딩, 코드 리뷰 코멘트까지 한 플랫폼에서 끝나거든요.
단점은 복잡한 멀티파일 수정에서 Cursor나 Claude Code보다 정확도가 떨어진다는 점이에요.
Windsurf는 AI Flow라는 독특한 인터페이스가 있어요. 작업을 단계별로 나눠서 보여주고, 각 단계에서 사람이 승인할 수 있거든요. 안전하게 쓰고 싶은 팀에 적합해요.
Cody는 수만 개 파일이 있는 대규모 모노레포에서 진가를 발휘해요. Sourcegraph 코드 검색 엔진이 뒤에 있어서 "3년 전에 이 API를 바꾼 PR 찾아줘" 같은 질문에 강하거든요.
저는 Claude Code + Cursor를 같이 써요. 빠른 수정이나 스크립트 작업은 터미널에서 Claude Code로 처리하고, UI 작업이나 디자인 관련은 Cursor에서 해요.
이렇게 나눈 뒤로 하루 코딩 시간이 8시간에서 5.5시간으로 줄었어요. 남는 시간에 설계나 문서 작업을 하니까 전체 프로젝트 품질도 올라가더라고요.
핵심은 도구를 하나만 고르려고 하지 말고, 상황에 맞게 2개를 조합하는 거예요. 한 달만 써보면 자기한테 맞는 조합이 보일 거예요.
5월 기준 5개 도구의 최신 가격과 사용 모델이에요. 분기마다 가격이 바뀌니까 최신 정보 확인 필수.
| 도구 | 월 가격 | 주력 모델 | 무료 옵션 |
|---|---|---|---|
| Claude Code | API 종량 (Pro 포함 시 무제한) | Sonnet 4.6, Opus 4.7 | 일 5달러 한도 |
| Cursor | 20달러 (Pro) | Claude 4.6, GPT-5.5 | 무료 (제한적) |
| GitHub Copilot | 10달러 (Individual) | GPT-5, Claude 4.6 선택 | 학생·OSS 무료 |
| Windsurf | 15달러 (Pro) | 자체 모델 + Claude | 무료 50회 |
| Cody | 9달러 (Pro) | Claude, GPT 선택 | 무료 (제한적) |
Claude Code는 Anthropic Pro/Max 구독에 포함된 형태로도 사용 가능해서 가성비가 압도적이에요. Max 100~200달러 구독자는 사실상 무제한 코딩 가능.
레포 크기에 따라 최적 도구가 달라져요.
| 규모 | 파일 수 | 추천 1순위 | 추천 2순위 |
|---|---|---|---|
| 소규모 (개인 프로젝트) | < 100 | Claude Code | Cursor |
| 중규모 (스타트업) | 100~1,000 | Cursor | Claude Code |
| 대규모 (스케일업) | 1,000~10,000 | Cursor | Copilot |
| 모노레포 (대기업) | 10,000+ | Cody | Cursor |
대규모일수록 코드베이스 인덱싱 성능이 결정적이에요. Cursor의 Composer와 Cody의 Sourcegraph 검색이 압도적이에요.
같은 도구라도 언어에 따라 정확도가 크게 달라져요. 제가 10개 언어로 동일 과제(REST API 만들기)를 시키고 측정한 결과예요.
| 언어 | Claude Code | Cursor | Copilot | Windsurf | Cody |
|---|---|---|---|---|---|
| Python | 95% | 93% | 90% | 88% | 85% |
| TypeScript | 94% | 95% | 91% | 87% | 84% |
| JavaScript | 93% | 93% | 92% | 86% | 83% |
| Go | 88% | 87% | 85% | 82% | 78% |
| Rust | 85% | 83% | 80% | 78% | 75% |
| Java | 87% | 85% | 88% | 80% | 82% |
| C# | 83% | 82% | 89% | 77% | 78% |
| Swift | 78% | 76% | 80% | 70% | 72% |
| Kotlin | 80% | 79% | 82% | 75% | 77% |
| Elixir | 65% | 62% | 60% | 55% | 60% |
Python·TypeScript에서는 거의 모든 도구가 90%+ 정확도. 니치 언어로 갈수록 격차가 벌어져요. Copilot이 C#·Java에서 강한 건 마이크로소프트 자체 학습 데이터 영향이에요.
도구별 ROI를 시급 기준으로 계산해 봤어요.
| 시급 | 월 절감 필요 시간 | 도구 추천 |
|---|---|---|
| 3만원 | Cursor 약 40분 | Cursor |
| 5만원 | Cursor 약 24분 | Cursor + Claude Code |
| 8만원 | Cursor 약 15분 | 모든 도구 회수 |
| 12만원 | Claude Code 무한 회수 | Claude Code Pro·Max |
| 20만원+ | 모든 유료 회수 | 도구 조합 자유 |
시급 5만원 이상이면 사실상 어떤 도구든 한 달 안에 회수돼요. 망설일 이유가 없어요.
자동완성이 충돌해서 오히려 느려져요. IDE에서 활성화는 1개로 제한하고, 나머지는 필요할 때만 켜세요.
리뷰 없이 그대로 커밋하면 보안 취약점·버그가 누적돼요. AI 코드도 사람 리뷰 1단계는 반드시 거치세요.
"이 코드 고쳐줘"보다 "이 함수는 X 데이터를 받아 Y 형식으로 변환해야 하는데, 빈 배열이 들어올 때 에러나는 부분 고쳐줘"가 정확도 3배 차이.
같은 도구라도 모델을 바꾸면 결과가 달라져요. 복잡한 작업은 Opus 4.7, 일반 작업은 Sonnet 4.6 식으로 분리.
AI가 만든 코드는 반드시 단위 테스트로 검증. AI도 자주 틀려요.
회사 코드를 외부 클라우드로 보내는 것 자체가 정책 위반인 경우 많아요. 입사 전 보안 가이드 확인 필수.
Q. Claude Code는 어디서 다운로드하나요?
A. npm install -g @anthropic-ai/claude-code로 설치. 또는 공식 사이트에서 OS별 설치 파일.
Q. Cursor에서 Claude 4.6과 GPT-5.5 중 어느 게 좋나요? A. 코드 생성은 Claude 4.6 우위, 단순 자동완성은 GPT-5.5가 빠름. Cursor 설정에서 모델별 사용 비율 조정 가능.
Q. 회사 보안상 클라우드 모델 못 쓰는데 대안은? A. Cody Enterprise는 자체 호스팅 가능. 또는 로컬 모델(Ollama + Continue.dev)로 무료 사용.
Q. AI 도구 쓰면 개발 실력이 떨어지지 않나요? A. 의식적으로 학습 모드와 생산 모드를 분리하세요. 학습 시엔 AI 끄고, 생산 시엔 활용. 둘 다 켜놓으면 학습 효과 감소.
Q. PR 자동 생성 기능이 신뢰할 만한가요? A. 코드 diff 요약은 우수, 의도 설명은 보통. AI 생성 PR 설명을 그대로 쓰지 말고 1줄이라도 사람이 추가하세요.
Q. 무료 옵션만으로도 가능한가요? A. Copilot 학생/OSS 무료, Cody 무료 티어, Continue.dev + Ollama 조합으로 0원 가능. 다만 속도·정확도는 유료 대비 낮음.
Q. 5개 도구 중 한 개만 골라야 한다면? A. 풀타임 개발자는 Cursor 1개. 시간 절약 + 인터페이스 통합 + 가성비 균형 최강.
본인 상황에 맞춰 조합 선택하세요.
| 상황 | 1순위 조합 | 비용 |
|---|---|---|
| 풀타임 개발 + 시급 8만원+ | Cursor + Claude Code | 월 50달러 |
| 사이드 프로젝트 | Claude Code 단독 | 월 10~30달러 |
| 대기업 모노레포 | Cursor + Cody | 월 30달러 |
| 학생·OSS 기여 | Copilot 무료 + Continue.dev | 0원 |
| AI 에이전트 개발 | Claude Code Max + Cursor | 월 220달러 |
| 안전 우선 팀 | Windsurf + Copilot Business | 월 35달러 |
90일이면 본인만의 코딩 AI 워크플로우가 완성돼요. 그 후 6개월마다 신모델·신도구 체크해서 업데이트하면 돼요.
가장 자주 쓰는 단축키 5개씩 정리해뒀어요.
Cmd+K: 인라인 코드 수정Cmd+L: 채팅 사이드바Cmd+I: Composer (멀티파일)Cmd+Shift+L: 선택 영역 채팅Tab: 자동완성 수락claude: 새 세션 시작claude --resume: 이전 세션 이어가기claude --model opus: 모델 변경/clear: 컨텍스트 초기화/files: 추적 중인 파일 보기Tab: 제안 수락Esc: 제안 거절Alt+]: 다음 제안Alt+[: 이전 제안Ctrl+Enter: 모든 제안 보기단축키만 익숙해져도 작업 속도가 2배 빨라져요.
개인이 아닌 팀 단위로 도입한다면 사전 체크가 필요해요.
이 5가지 체크 없이 도입하면 6개월 후 효과 측정조차 못 해요. 도입 전 1주일만 투자해서 위 5개 항목을 정리하면 도입 후 1년 운영이 평탄해져요.
AI 코딩 도구도 만능은 아니에요. 6개월 써보고 느낀 한계 5가지예요.
이 5가지는 도구의 한계이고, 사람의 역할이 더 중요해지는 영역이에요.
AI 코딩 에이전트는 "개발자를 대체하는 도구"가 아니라 "개발자의 사고 시간을 코드 작업에서 설계 작업으로 이동시키는 도구"예요. 잘 쓰면 같은 시간에 2~3배 더 많은 가치를 만들 수 있어요. 시작이 늦었다고 늦은 게 아니에요. 오늘 1개 도구라도 깔고 30분 써보는 게 출발점이에요. 한 달 후의 본인이 가장 감사하게 될 거예요.
자동완성은 현재 줄에서 다음 코드만 제안하는 거예요. 에이전트는 파일 전체를 읽고, 버그를 찾고, 리팩토링까지 알아서 해줘요. 제가 Cursor로 500줄짜리 리팩토링을 시켰는데 12분 만에 끝나더라고요.
GitHub Copilot은 오픈소스 기여자에게 무료예요. Cody도 개인 사용은 무료 티어가 있고요. Claude Code는 API 비용만 내면 되는데 가벼운 작업이면 월 5달러 이하로 충분했어요.
Python과 TypeScript에서 정확도가 가장 높았어요. Rust나 Go도 괜찮은데, 니치한 언어일수록 정확도가 떨어지더라고요. 제가 Elixir로 테스트했을 때는 체감 정확도가 30% 정도 낮았거든요.
대부분 클라우드 모델을 쓰기 때문에 코드 스니펫이 서버로 갈 수밖에 없어요. 기업용이라면 Copilot Business나 Cursor의 Privacy Mode를 켜면 학습에 사용되지 않도록 설정할 수 있거든요.
제 경험상 반복적인 CRUD 코드는 3배 정도 빨라졌어요. 복잡한 알고리즘은 큰 차이 없었고요. 평균적으로 하루 개발 시간이 8시간에서 5.5시간으로 줄었거든요.
VS Code에서 Copilot이랑 Cody를 같이 쓸 수 있어요. 다만 자동완성이 충돌할 수 있어서 하나는 에이전트 모드만 쓰고, 하나는 자동완성용으로 분리하는 게 편하더라고요.