HowtoAI
ai-revenue2026-04-20 5 min read

AI 영상 번역 부업 — 월 80만원 실전 로드맵 (2026년 최신)

🤖
HowtoAI 편집팀AI 전문 에디터

AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.

📅 2026-04-20⏱️ 5 min read🌐 how-toai.com
목차 보기

핵심 요약 (3줄)

  • Whisper + Claude + 수동 검수 3단계 공정이 핵심이에요.
  • AI 초벌 번역으로 시간을 70% 줄이고, 맥락 다듬기로 품질을 유지했어요.
  • 3개월 만에 월 82만원까지 올라왔고 재의뢰율이 58%예요.

📋 목차

왜 영상 번역 부업인가

2026년 초 유튜브 숏폼 광고 수요가 늘면서 자막 번역 외주가 다시 올라왔어요. 특히 영미권 콘텐츠를 한국 시장에 가져오려는 채널이 많거든요.

사람 번역가 기준 영상 1분당 6-10달러인데, AI가 초벌 번역을 맡으면 같은 시간에 3배 더 많이 처리돼요. 단가가 아니라 시간당 생산량으로 이기는 구조예요.

AI 자막 작업 환경

공정 한눈에 보기

단계도구소요 시간(90분 영상 기준)
자막 추출Whisper Large v315분
초벌 번역Claude 4.7 API20분
맥락 다듬기VS Code + 수동70분
QC 체크Subtitle Edit15분
합계약 2시간

순수 사람 작업 시간은 85분 정도라 하루 3-4개까지 처리 가능해요.

1단계: Whisper로 자막 추출

로컬에 Whisper Large v3를 설치해서 돌려요. RTX 3060 이상이면 실시간보다 빨라요.

pip install openai-whisper
whisper input.mp4 --model large-v3 --language en --output_format srt

클라우드 대안은 Replicate의 openai/whisper 모델이 쌌어요. 영상 1시간당 0.2달러 정도. 한국 계정으로 돌릴 땐 Replicate가 제일 무난했어요.

2단계: Claude로 초벌 번역

SRT 파일을 Claude에게 통째로 넘겨요. 시스템 프롬프트는 이렇게.

"너는 한국 유튜브 자막 번역가야.

  • 글자 수 제한: 한 줄 16자, 두 줄 32자 넘지 말기.
  • 구어체 존칭 사용. 직역투 금지.
  • 타임스탬프 형식 유지.
  • 고유명사는 영어 원문 유지. 아래 SRT를 한국어로 번역해줘."

Sonnet 4.6 기준 90분 영상(약 1만 자막)이 20분이면 다 돼요. API 비용은 약 1.2달러, 한국어 번역 품질은 초벌로 쓰기 충분해요.

3단계: 맥락·톤 다듬기

이 단계가 부업의 차별점이에요. AI가 모르는 컨텍스트가 항상 있거든요. 예를 들면 이런 것들.

  • 채널 고유의 밈이나 별명
  • 화자가 비꼬는 문장 (Claude가 직역해버려요)
  • 숫자 단위 (feet, pound 등 → m, kg 변환)
  • 일부 욕설 수위 조정

이 과정에서 **"사람만 느낄 수 있는 맥락"**을 넣어요. 고객이 나중에 재의뢰하는 이유가 이 부분이에요.

자막 다듬기 화면

크몽·Upwork 단가 비교

플랫폼10분 영상 평균 단가수수료실수령
크몽3만 5천원20%2만 8천원
숨고4만 2천원18%3만 4천원
Upwork65달러(약 8만 8천원)10%약 7만 9천원

Upwork가 단가가 2배 이상이에요. 영문 프로필 기본 작성 + 샘플 3개만 있으면 리뷰 안 쌓인 상태에서도 일을 받을 수 있어요.

3개월 실제 수익

제가 2026년 1월부터 3월까지 기록한 수익이에요.

플랫폼영상 수총 시간수익
1월크몽12개140분38만원
2월크몽 + Upwork18개230분62만원
3월Upwork 위주14개180분82만원

4월은 반복 고객 3명이 정기 발주를 걸어서 더 안정적이에요.

부업 루틴을 만드는 전반적인 전략은 AI 부업 재택 가이드에서 큰 그림을 봐두면 도움돼요. AI 더빙까지 확장하고 싶다면 AI 더빙 다국어 영상 번역 글을 참고하세요. 언어 번역 전반을 본업으로 검토 중이라면 AI 번역 프리랜서 수익 가이드에서 시장 규모와 진입 전략을 확인할 수 있어요.

마무리 — 이번 주말 과제

Whisper를 PC에 설치하고 유튜브 공개 영상 5분짜리 하나만 번역해보세요. 시간이 얼마나 걸리는지, Claude 초벌이 얼마나 자연스러운지 체감해야 단가 책정이 됩니다.

같이 보면 좋은 글

실전 시나리오 — 토익 850 직장인의 3개월 영상 번역 기록

서울 강남구에 근무하는 29세 마케터 B님 사례예요. 토익 850점, 영어 회화는 보통, 번역 경험 없음. 평일 저녁 2시간 + 주말 6시간만 투입해서 진행했어요.

  • 1개월차(1월): Whisper Large-v3 로컬 설치(RTX 3060 사용), Claude API 결제. 본인 좋아하는 영미권 자기계발 채널 영상 5개를 무허가로 번역해서 포트폴리오 제작(공개 안 함). 크몽에 영문→한글 자막 번역 서비스 등록, 5분 영상당 2만 5,000원으로 책정. 첫 의뢰는 등록 11일 차에 왔고, 한 달 총 8건 처리, 매출 22만원
  • 2개월차(2월): 후기 6건 평균 4.9점. 단가를 5분당 3만 5,000원으로 인상. 동시에 Upwork 프로필 영문으로 작성(ChatGPT가 초안, 본인이 30분 다듬음). Upwork 첫 의뢰는 등록 9일째, 미국 1인 사업자의 강의 영상 25분에 75달러. 한 달 매출 크몽 41만원 + Upwork 21만원 = 약 62만원
  • 3개월차(3월): Upwork 별점 5점 4건 누적. 반복 고객 2명 확보(주 1회 정기 발주). 단가를 분당 1.5달러에서 2.2달러로 인상. 한 달 매출 Upwork 56만원 + 크몽 26만원 = 약 82만원. 시간당 약 3만 8,000원 환산

토익 점수가 절대 기준은 아니지만, 750점 미만이면 맥락 다듬기 단계에서 한 영상당 2~3시간 더 걸려요. 그 시간을 단축하려면 한영 사전 + DeepL을 보조로 두면 800점대도 가능해요.

도구별 비용·속도 비교

같은 90분 영상 처리 기준 5가지 조합을 실측한 표예요.

조합1차 처리 시간비용한국어 품질추천도
Whisper Large-v3(로컬) + Claude35분$1.2090%(맥락 보정 후 95%)본업급 ★★★★★
Whisper + DeepL30분$0.8085%(맥락 보정 후 92%)가성비 ★★★★
Replicate Whisper + GPT-4o25분$1.5088%무 GPU 사용자 ★★★
Naver CLOVA + 사람 번역40분$0(무료 한도)한국어 95%(영어 입력 어려움)한→영 부적합 ★★
AI 자동 자막(CapCut 등)10분$060%(상업용 부적합)비추 ★

흔한 함정과 회피법

영상 번역 부업에 처음 진입할 때 가장 자주 부딪치는 5가지 함정과 해결책이에요.

  • AI 초벌 그대로 납품: Claude 4.7도 한국 정서·문화 코드는 잘 못 잡아요. 영어 표현 "I feel you"를 직역하면 "당신을 느껴요"로 나옴. 반드시 3단계 맥락 보정에 1시간 이상 투자. 시급 안 맞아도 별점 5점이 다음 주 의뢰를 부름
  • 저작권 미허가 영상 작업: 클라이언트가 본인 채널이 아닌 영상을 들고 와서 자막 번역 의뢰하는 경우 종종 있어요. "본인 채널 영상 맞으신가요?" 한 줄 확인 + 카톡 캡처 보관이 필수. 나중에 저작권자 항의 시 보호 장치
  • 무제한 수정 약속: 영상 번역은 자막보다 주관적 평가가 강해요(어조·뉘앙스). "2회 수정 무료, 추가 회당 영상 1분당 1,500원" 명시 필수. 진상 고객 90% 사전 차단
  • 타임스탬프 어긋남: Claude가 SRT 통째로 처리할 때 타임코드 형식을 깨뜨릴 수 있어요. 시스템 프롬프트에 "타임스탬프 형식 절대 변경 금지" 명시 + Subtitle Edit 같은 도구로 사전 검증 필수
  • 외국어 클라이언트 결제 거부: Upwork는 안전하지만 직거래 시 입금 안 되는 사고 있음. 직거래 시 PayPal 송금 확인 후 작업 시작이 원칙. 50% 선금도 표준

자주 묻는 질문

Upwork 영문 프로필 처음 작성할 때 가장 중요한 요소는요?

순위는 ① 영상 번역 샘플 3개(공개 가능한 본인 작업물) ② 한 줄 헤드라인("AI-powered KR↔EN video subtitle, 48h delivery") ③ 시간대 명시(한국 시간 = 미국 동부 야간이라 18시간 빠른 응답 어필) ④ 시간당 단가($15~20부터)예요. 별점 0개여도 첫 주 안에 의뢰 들어와요.

Whisper Large-v3 한국어 영상 처리 정확도는 얼마예요?

전문 용어 없는 일반 한국어 영상 기준 90~92%. Naver CLOVA Note(95%+)보다 낮지만 무료 + 셀프호스팅 + 영어 혼용 강함 때문에 종합 우위. 한국어만 처리할 거면 CLOVA, 한·영 혼용이나 영어 위주면 Whisper. 회의록처럼 발화자 구분 필요하면 CLOVA + Whisper 조합도 가능.

Claude API 한 달 비용이 얼마나 나와요?

90분 영상 1개당 약 $1.20. 월 30개 처리하면 약 $36. Claude Sonnet 4.6 기준이고, Haiku 모델 쓰면 $0.30 수준으로 떨어져요. 단 Haiku는 맥락 보정력 약해서 사람 검수 시간이 늘어남. Sonnet이 ROI 최고.

영어 → 한글 vs 한글 → 영어 어느 쪽 단가가 높아요?

한→영이 1.5~2배 높아요. 한국어 의역에 능숙한 영어 원어민이 드물기 때문. 다만 영어 글쓰기 자신 없으면 한→영은 별점 떨어지기 쉬워요. 토익 900+ 또는 영어권 거주 경험 있으면 한→영 적극 추천, 그 외는 영→한이 안전.

영상 번역 부업이 본업 수준 매출까지 얼마나 걸려요?

월 200만원 안정 매출까지 평균 69개월. 단 영어 실력에 따라 차이 큼. 토익 900+: 46개월. 토익 750850: 812개월. 토익 700 미만: 본업 전환 비추(시급 안 맞음). 영상 번역은 단가 천장이 분명해서 매출 300만원 이상 가려면 다른 부업(자막 디자인·더빙) 결합 필요.

반복 고객 확보 비결이 뭐예요?

저는 첫 납품 시 "다음 영상 의뢰 시 10% 할인" 쿠폰 1회 제공이 60% 통했어요. Upwork는 "Repeat Client Discount" 옵션 활용. 그 외 ① 48시간 이내 납품 보장 ② 클라이언트 채널 톤 가이드 기록 후 다음 영상 적용 ③ 영상 외 짧은 SNS 카피도 무료로 번역해서 보내기 같은 잔 서비스가 정기 계약으로 이어져요.

Upwork에서 매출 안정화하는 4단계

크몽에서 후기 누적 후 Upwork로 이동이 매출 점프 핵심이에요. 단가 차이가 크기 때문에 같은 시간으로 매출이 2배 이상 뜁니다. Upwork 안정화까지 단계별로 정리할게요.

첫 단계는 프로필 영문 작성이에요. ChatGPT나 Claude에 본인 경력·작업 샘플·강점 입력 후 영문 프로필 초안 받기. 그 후 본인이 30분 다듬어서 자연스러운 문장으로 만들면 충분해요. 한 줄 헤드라인이 가장 중요한데, 작업 종류 + 차별화 포인트 + 납기 약속 세 가지를 한 문장에 담는 게 핵심이에요. 예를 들어 "AI-powered Korean to English video subtitle translation, 48-hour delivery, 95% accuracy" 같은 식이죠.

둘째는 첫 의뢰 받기. Upwork는 별점 0개 상태에서도 첫 주 안에 의뢰 가능해요. 핵심은 적극적 제안서 보내기. 매일 5~10건 클라이언트 공고에 맞춤 제안서 보내는 게 표준. 제안서는 클라이언트 영상 분석 + 본인 솔루션 + 샘플 첨부 3단 구조가 효과적이에요. 한국 시간 vs 미국 동부 시간 18시간 차이를 강조하면 "야간에 작업해서 아침에 받을 수 있다"로 어필 가능해요.

셋째는 별점 5점 확보. 첫 5건은 시세 30% 낮게 받으면서 후기 쌓기. 별점 4점 받으면 다음 의뢰가 절반으로 떨어지니까 절대 4점 받지 않게 신중히. 납기 24시간 전 중간 점검 + 클라이언트 피드백 반영 후 최종 납품 패턴이 5점 별점의 비결이에요.

마지막은 단가 인상과 정기 계약. 별점 5점 5건 누적되면 단가 30% 인상 가능. 분당 1.5달러에서 2달러로. 그 후 반복 고객 확보 단계로 진입, 월 단위 정기 계약 제안. 정기 계약 3건 확보되면 매월 안정 매출 300만원 라인 도달 가능해요.

이 4단계 거치는데 평균 4~6개월 걸려요. 한 단계씩 안정화 후 다음 단계로. 단번에 모든 걸 해결하려는 욕심이 가장 큰 함정이에요. 본업 사이드로 진행하면서 매월 본인 진척도 점검하는 게 핵심. 4단계 후엔 영상 번역 외 인접 분야(자막 디자인·더빙·통역) 확장 단계로 진입할 수 있어요.

❓ 자주 묻는 질문 (FAQ)

영어 실력이 상급이어야 하나요?

상급일 필요는 없어요. AI가 초벌 번역을 만들고 저는 맥락 다듬기만 하거든요. 토익 800점대면 충분해요.

어떤 플랫폼에서 일을 받나요?

크몽, 숨고, Upwork 세 곳에서 주로 받았어요. 2026년 기준 Upwork 단가가 가장 좋아요.

AI 번역만 쓰면 안 들키나요?

그대로 넘기면 퀄리티 이슈로 재의뢰율이 떨어져요. 꼭 맥락·톤 다듬기 단계를 넣어야 해요.

하루에 몇 분짜리를 소화할 수 있어요?

AI 도구 덕분에 하루 90분짜리 영상을 2-3시간 만에 마감해요. 초반엔 1시간당 1시간씩 잡으세요.

필요한 장비가 뭔가요?

괜찮은 마이크는 필요 없고, 모니터 2대랑 Whisper 돌릴 수 있는 GPU(RTX 3060 이상)가 있으면 편해요.

월 수익은 어떻게 80만원까지 올렸나요?

크몽 10만원대 단가로 시작해서 Upwork 영문 프로필로 옮기고, 반복 고객 확보 후 자리 잡았어요. 3개월 정도 걸렸어요.

📚 함께 읽으면 좋은 글 (Related Posts)

AI로 수익창출 더 보기 →