Sora 2 Pro vs Google Veo 3 — AI 비디오 생성 7가지 비교 2026년 5월 가격·품질
OpenAI Sora 2 Pro와 Google Veo 3.1을 가격·해상도·오디오 동기화·한국 활용 7가지 기준으로 비교. 5월 시점 1초당 단가, ChatGPT Pro·Google AI Ultra 진입 비용, 외주·유튜브 적용 시나리오까지 실측 데이터로 정리합니다.
AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.
작년까지만 해도 AI 영상은 "데모용"이라는 말이 많았잖아요. 사람 얼굴이 중간에 바뀌고, 배경이 흔들리고. 그런데 Runway Gen-4 써보면 얘기가 달라져요. 같은 캐릭터가 여러 컷에서 일관되게 유지되니까 실제 숏폼·광고 컷에 써먹을 수준이 됐어요.
이 글은 Runway Gen-4를 처음 쓰는 분이 첫 영상을 완성하는 순서를 담았어요. 샘플로 '벚꽃 배경에서 커피 마시는 여성' 10초 컷을 만들어봐요.
runwayml.com에서 가입 후 Dashboard로 들어가세요. 왼쪽 사이드바 Generate - Video 메뉴가 영상 생성 진입점이에요. 상단 모델 선택에서 "Gen-4 Turbo" 또는 **"Gen-4"**를 골라요. Turbo는 속도가 2배 빠르고, 일반 Gen-4는 디테일이 더 살아요.
Gen-4의 진짜 무기는 레퍼런스 이미지 3장까지 넣을 수 있다는 점이에요.
이 3장을 업로드하면 AI가 세 요소를 섞어서 일관된 영상을 만들어요. 저도 써봤는데, 레퍼런스가 좋으면 프롬프트가 짧아도 결과가 안정돼요.
Gen-4는 카메라 움직임을 구체적으로 지시할 수 있어요.
A young woman slowly drinking coffee by a window,
cherry blossom falling outside,
cinematic 35mm film look,
slow dolly-in from wide to medium shot,
soft natural lighting, 10 seconds
한국어로 써도 되지만 영어가 정확도가 높더라고요. 핵심은 '카메라 움직임 + 피사체 행동 + 배경 변화' 세 축을 다 넣는 것이에요.
Generate 버튼을 누르면 30초~2분 안에 10초 영상이 나와요. 마음에 안 드는 부분이 있으면 Motion Brush 도구로 특정 영역만 다시 그릴 수 있어요. 예를 들어 얼굴은 그대로 두고 배경만 흔들리는 벚꽃으로 바꾸는 식이에요.
길이가 부족하면 Extend 버튼으로 10초씩 이어 붙여요. 최대 40초까지 가능해요.
Act-One 기능을 쓰면 기존에 생성한 영상에 내 얼굴 표정·입 모양을 그대로 옮길 수 있어요. 웹캠으로 30초 녹화하면 AI가 추출해서 기존 영상 인물에게 입혀줘요. 더빙 영상 만들 때 이보다 편한 도구는 못 봤어요.
오디오는 Runway 내장이 아직 약해서, Suno AI로 배경음을 따로 만들어 결합하는 게 좋아요. Suno AI v4 30분 가이드에 실제 제작 순서를 정리해뒀어요.
강점
약점
Runway는 크레딧 단위 과금이라 처음엔 헷갈려요. 핵심만 정리할게요.
크레딧 1개는 약 1초 영상 ≈ 5크레딧, 립싱크 Act-One은 별도 25크레딧/분이에요. 처음엔 Standard로 한 달 써보고 사용량 보면서 결정하세요.
Gen-4가 가장 잘 알아듣는 카메라 동작 키워드를 모았어요. 한 영상에 1~2개만 골라 쓰는 게 좋아요.
dolly in, dolly out, pan left, pan right, tilt up, tilt downaerial shot, bird's eye view, crane up, drone fly-throughslow motion, time lapse, frozen moment then continuerack focus from foreground to background, shallow depth of fieldcinematic 35mm film, Wes Anderson symmetrical, Christopher Nolan IMAX style이런 단어를 추가하면 같은 프롬프트인데 영상 격이 한 단계 올라가요.
1. 인물 얼굴이 컷마다 바뀐다 → 레퍼런스 이미지 칸에 인물 클로즈업을 반드시 첫 번째 슬롯에 넣으세요. Gen-4는 첫 슬롯을 메인 캐릭터로 잡아요.
2. 카메라가 의도와 다르게 흔들린다
→ 프롬프트 끝에 steady camera, locked tripod를 추가하세요. 반대로 핸드헬드 느낌을 원하면 handheld camera shake.
3. 한국인 얼굴이 어색하다 → 레퍼런스 이미지에 실제 한국인 사진을 넣으세요. 텍스트만으로는 아직 학습 데이터 편향이 있어요.
4. 10초가 너무 짧다 → Extend 기능으로 10초씩 4번까지 이어 붙일 수 있어요. 한 번에 한 번씩만 누르고 결과 확인 후 진행하세요. 중간에 마음에 안 들면 새 컷으로 분기할 수 있어요.
5. 빌드된 영상이 자꾸 모션 블러로 흐려진다
→ crisp focus throughout, no motion blur 키워드 추가. 그래도 안 되면 Gen-4 Turbo 대신 일반 Gen-4 사용.
6. 음성·립싱크 어색하다 → Act-One에서 입력 영상을 30fps, 정면 클로즈업으로 찍으세요. 옆모습은 정확도가 절반으로 떨어져요.
제가 실제로 클라이언트 광고 영상을 만들 때 쓰는 순서예요. 참고하면 처음부터 헤매지 않아요.
전체 작업 시간 약 2시간. 외주로 맡기면 30만~80만원짜리 광고 영상을 본인이 직접 만들 수 있어요.
2026년 5월 기준 메이저 영상 AI 3종 비교예요.
세 도구 다 무료 크레딧이 있으니 한 번씩 같은 프롬프트로 비교해보면 본인 용도에 맞는 게 명확해져요.
같은 도구라도 누가 쓰느냐에 따라 활용도가 달라요. 직군별로 가장 효과가 큰 시나리오를 정리할게요.
1인 유튜버
광고 디자이너
프리랜서 마케터
1인 개발자·인디 게임
스타트업 PM
직군별로 다 다르지만 공통점은 하나예요. 외주 비용·시간이 큰 폭으로 줄어든다는 것. Gen-4는 단순 장난감이 아니라 본격적인 생산 도구로 자리 잡았어요.
Runway 약관은 자주 바뀌니 현재 기준만 정리할게요.
금지된 사용 사례
안전한 활용 패턴
상업적으로 쓰려면 결과물을 보관하면서 어떤 프롬프트·레퍼런스를 썼는지 기록을 남겨두세요. 나중에 클레임이 들어왔을 때 입증 자료가 돼요.
Gen-4 결과를 4K로 업스케일할 수 있나요? Runway 자체 업스케일러는 1080p까지가 안정적이에요. 4K가 필요하면 Topaz Video AI나 Runway Enhance Speed/Quality 옵션을 추가로 쓰세요. 처리 시간이 2~3배 늘어나는 대신 디테일이 살아나요.
음성 더빙은 어떻게 하나요? Act-One으로 본인 얼굴을 입혀도 음성은 별도예요. ElevenLabs로 다국어 음성을 만들거나, 본인 목소리를 녹음해서 Runway에 업로드하면 립싱크가 자동 맞춰져요.
한국어 자막은 자동으로 들어가나요? Runway 내장 자막은 영어만 정확해요. 한국어 자막은 CapCut이나 Premiere에서 후작업하는 게 정확도가 높아요.
Gen-4와 Gen-3 비교 — 정말 차이가 있나요? 같은 프롬프트·레퍼런스로 비교해보면 차이가 큽니다. 특히 인물 일관성·카메라 지시·복합 동작 (사람이 걸으면서 손짓하는 등) 정확도가 압도적이에요. 단순 풍경이라면 Gen-3 Alpha도 여전히 쓸 만해요.
Gen-4로 멋진 영상을 만들어도 업로드 단계에서 헤매면 노출이 안 돼요. 플랫폼별 핵심을 정리할게요.
Runway에서 9:16 생성은 프롬프트에 vertical 9:16 aspect ratio를 명시하거나 출력 시 Aspect Ratio를 9:16으로 선택. 16:9 가로 영상을 강제 크롭하면 인물·텍스트가 잘리니 처음부터 비율 맞춰 생성하세요.
처음 가입하고 무엇부터 해야 할지 막막할 때 따라 할 수 있는 7일 플랜이에요.
이 일주일을 끝내면 Gen-4가 본인의 핵심 도구가 되어 있을 거예요.
처음 영상이 어색해도 괜찮아요. 10개 정도 만들어보면 어떤 프롬프트가 어떤 결과를 내는지 감이 잡혀요. AI 자동화 툴 추천 TOP 7과 엮으면 영상 제작부터 업로드까지 한 번에 자동화할 수 있어요. 한 달이면 본인만의 영상 제작 파이프라인이 구축됩니다.
프레임 일관성이 확 좋아졌어요. 같은 인물·배경을 여러 컷에 걸쳐 유지하는 레퍼런스 기능이 핵심이에요.
신규 가입 시 125 크레딧이 주어져서 10초짜리 영상 한두 개는 만들어볼 수 있어요. 유료는 월 15달러부터예요.
Standard 플랜 이상은 상업 용도 가능해요. 다만 실존 인물 얼굴을 변환하는 작업은 약관상 주의가 필요해요.
한 번 생성에 10초까지 가능하고, Extend로 최대 40초까지 이어 붙일 수 있어요.