Gemini 3.1 Pro 컴퓨터 유즈 첫주 실측 — 브라우저 자동화 7가지 시나리오 2026
Gemini 3.1 Pro Computer Use 첫 주 실측 후기 — 브라우저 자동화·쇼핑·예약·리서치 7가지 시나리오 실제 성공률과 처리 시간. 5월 시점 ChatGPT Operator와 비교 + 한국 사용자 진입 비용까지 정리합니다.
AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.
이미지 AI 좀 진지하게 다뤄보고 싶은데, 어디서 시작해야 할지 막막하셨죠?
저도 처음엔 Midjourney만 쓰다가 한계를 느끼고 ComfyUI로 넘어왔어요. 막상 설치하려고 보니까 README가 영어인 데다 용어가 어려워서 며칠을 헤맸거든요.
오늘은 그때 제가 알았으면 좋았을 정보들을 30분 가이드로 정리했어요. 따라 하면 오늘 안에 첫 이미지 생성까지 끝나요.
ComfyUI는 Stable Diffusion 계열 모델을 돌리는 노드 기반 인터페이스예요.
Midjourney 사용법 완벽 가이드와 비교하면 차이가 뚜렷해요:
저는 둘 다 써봤는데, 결국 ComfyUI로 정착했어요. 이유는 비용도 비용이지만 워크플로우를 내가 100% 제어할 수 있다는 점이 컸어요.
특히 LoRA, ControlNet, 인페인팅 같은 고급 기능을 자유롭게 조합할 수 있어요.
설치 전에 확인할 항목 3가지예요.
저는 RTX 5060 Ti 8GB로 SDXL을 1장당 5초에 생성하고 있어요. 4K 업스케일까지 포함해도 20초면 끝나요.
SSD 100GB 정도는 비워두는 게 좋아요. 모델은 한 번 받으면 계속 늘어나거든요.
ComfyUI 포터블 버전을 받으면 Python이 내장돼 있어서 별도 설치가 필요 없어요. 초보자는 무조건 포터블 버전을 추천해요.
GitHub의 ComfyUI 공식 릴리스 페이지에서 Windows 포터블 버전(약 1.5GB)을 다운로드하세요.
압축을 풀면 ComfyUI_windows_portable 폴더가 생겨요. 이 폴더 안에서 모든 작업이 끝나요.
처음에는 SDXL 베이스 모델 1개만 받아도 충분해요.
sd_xl_base_1.0.safetensors (Hugging Face에서 검색)ComfyUI\models\checkpoints\ 폴더다운로드가 끝나면 폴더에 그대로 넣기만 하면 돼요.
run_nvidia_gpu.bat 파일을 더블클릭하면 끝이에요.
검은 콘솔 창이 뜨고 잠시 후 자동으로 브라우저가 열려서 ComfyUI 인터페이스가 보일 거예요. 주소는 보통 http://127.0.0.1:8188이에요.
처음 실행하면 기본 기능만 있어요. ComfyUI Manager를 설치하면 모델/노드/워크플로우를 GUI로 관리할 수 있거든요.
설치 방법: custom_nodes 폴더에 ComfyUI-Manager를 git clone 하면 끝이에요.
저는 이거 설치 안 하고 며칠 고생했어요. 무조건 처음에 같이 설치하세요.
기본 워크플로우가 이미 로드되어 있어요. 프롬프트만 바꿔서 "Queue Prompt" 버튼을 누르면 첫 이미지가 생성돼요.
추천 프롬프트:
5~10초 후에 오른쪽에 이미지가 나타나면 성공이에요.
VRAM이 부족하다는 뜻이에요. 해결책 3가지:
--lowvram 플래그 추가 (run 배치 파일 수정)models/checkpoints 폴더에 넣고 ComfyUI를 재시작해야 해요. 또는 Refresh 버튼을 누르세요.
해당 노드의 의존성 모델이 없다는 뜻이에요. ComfyUI Manager의 "Install Missing Custom Nodes"로 한 번에 해결돼요.
기본 텍스트→이미지가 익숙해지면 다음 단계로 넘어가세요.
각 기능은 AI 이미지 생성 프롬프트 예시 모음에서 다룬 프롬프트 작성법과 함께 익히면 효과가 두 배예요.
ComfyUI는 처음엔 복잡해 보이지만 첫 이미지를 뽑고 나면 오히려 쉽다는 게 느껴져요.
오늘 당장 할 일이에요:
30분이면 충분해요. 시작이 반이거든요.
2026년 들어 ComfyUI 생태계에 큰 변화가 있었어요. SDXL이 여전히 표준이지만, FLUX.1과 SD 3.5가 점점 메인스트림으로 올라오고 있어요. 5월 기준 추천 베이스 모델은 이래요.
| 모델 | 크기 | VRAM | 강점 | 추천 용도 |
|---|---|---|---|---|
| SDXL 1.0 | 6.5GB | 8GB | 안정성, LoRA 생태계 풍부 | 일반 작업 |
| FLUX.1-dev fp8 | 12GB | 16GB | 사진급 실사, 손·텍스트 정확 | 실사 인물·썸네일 |
| FLUX.1-schnell | 6.5GB | 12GB | 4스텝 초고속 생성 | 빠른 시안 |
| SD 3.5 Large | 17GB | 20GB | 복잡한 프롬프트 이해 | 다중 객체 |
| SD 1.5 (LCM) | 4GB | 4GB | 노트북 RTX 3050에서도 작동 | 저사양 환경 |
저는 메인으로 FLUX.1-dev fp8 + Super Realism LoRA를 쓰고 있어요. RTX 5060 Ti 16GB에서 1장당 8~12초로 사진 같은 결과물이 나와요. 일반 SDXL은 5초인데 품질 차이가 크다고 느껴서 FLUX로 갈아탔어요.
ComfyUI는 노드 기반이라 워크플로우를 직접 짜는 게 매력이지만, 초보자는 검증된 워크플로우 5개를 순서대로 익히는 게 빨라요.
가장 기본인 7노드 워크플로우예요. CheckpointLoader → CLIP Text Encode(긍정) → CLIP Text Encode(부정) → KSampler → VAE Decode → Save Image. 이 흐름이 모든 워크플로우의 베이스예요.
스타일이나 캐릭터를 추가 학습한 LoRA를 끼우는 워크플로우. LoraLoader 노드 1개만 추가하면 돼요. 같은 프롬프트라도 LoRA 하나로 완전히 다른 분위기가 나와요.
기존 이미지의 포즈·구도·선화를 유지하면서 새로 그리는 워크플로우. Preprocessor + ControlNet Apply 2개 노드 추가. 인물 포즈 통일에 결정적이에요.
이미지의 특정 부분만 다시 그리는 워크플로우. 마스크 적용 + KSampler를 마스크 기반으로 동작시키면 돼요. 얼굴 수정, 배경 교체에 유용.
생성한 이미지를 SUPIR이나 Ultimate SD Upscale로 4K까지 키우는 워크플로우. 썸네일이나 인쇄용으로 필요해요.
LoRA와 확장 노드는 무한히 많지만 초보자가 꼭 깔아야 할 5개만 추려봤어요.
3개를 1년씩 써본 비교표예요.
| 항목 | Midjourney | DALL-E 3 | ComfyUI |
|---|---|---|---|
| 월 비용 | 10~60달러 | ChatGPT Plus 20달러 | 0원 (전기료만) |
| 시작 난이도 | 매우 쉬움 | 매우 쉬움 | 어려움 |
| 제어 자유도 | 낮음 | 낮음 | 매우 높음 |
| 모델 선택 | 1개 (자체) | 1개 (자체) | 수천 개 |
| 상업적 사용 | 유료 플랜 | 가능 | 모델별 라이선스 확인 |
| 사진 품질 | 우수 | 우수 | 최상 (FLUX 기준) |
저는 빠른 시안은 Midjourney, 본격 작업은 ComfyUI로 나눠 써요. ComfyUI는 진입 장벽이 높지만 한 번 익히면 비용·자유도에서 압도적이에요.
--medvram 또는 --lowvram 플래그 필수. run 배치 파일 수정.models/checkpoints 외 models/loras, models/controlnet 등 폴더별 위치 정확히 지키세요.--port 8189 같이 변경.Q. ComfyUI로 만든 이미지를 상업적으로 써도 되나요? A. 베이스 모델 라이선스에 따라 달라요. SDXL은 상업 사용 가능, FLUX.1-dev는 비상업, FLUX.1-schnell은 상업 가능. 반드시 모델별 라이선스 확인.
Q. AMD 라데온 그래픽카드에서도 돌아가나요? A. 가능하지만 ROCm 설정이 까다로워요. Linux 환경 권장. Windows는 DirectML 사용 가능하지만 속도가 NVIDIA 대비 절반 이하.
Q. M1/M2 맥에서 돌아가나요? A. 돌아가지만 메모리 통합 구조라 16GB 이하면 SDXL 한 장에 30초 이상 걸려요. 32GB 이상 권장.
Q. 한 번 설치 후 업데이트는 어떻게 하나요?
A. update 폴더의 update_comfyui.bat 더블클릭. 매주 한 번 정도 업데이트하면 새 기능 자동 적용.
Q. ControlNet 모델은 SDXL용·SD 1.5용이 다른가요? A. 네, 베이스 모델 호환성이 엄격해요. SDXL 모델에는 SDXL용 ControlNet만 동작.
Q. NSFW 필터링은 어떻게 되나요? A. ComfyUI 자체는 필터 없음. 모델에 따라 다르며, 본인이 NSFW Filter 노드를 워크플로우에 추가할 수 있어요.
90일이면 ComfyUI를 일상 도구로 쓸 수 있어요. 핵심은 한 번에 다 익히려 하지 말고 1단계씩 안정화하면서 올라가는 거예요.
VRAM 용량에 따라 최적 조합이 달라져요.
| VRAM | 추천 모델 | 추천 워크플로우 | 1장 생성 시간 |
|---|---|---|---|
| 4GB | SD 1.5 + LCM LoRA | 기본 t2i | 약 8초 |
| 6GB | SD 1.5 + LCM | t2i + 작은 LoRA | 약 6초 |
| 8GB | SDXL | t2i + LoRA | 약 7초 |
| 12GB | SDXL + ControlNet | t2i + 인페인팅 | 약 9초 |
| 16GB | FLUX.1-dev fp8 | t2i + ControlNet + 업스케일 | 약 12초 |
| 24GB | FLUX.1-dev full + SD 3.5 | 멀티모델 동시 운영 | 약 15초 |
본인 그래픽카드 VRAM에 맞춰 시작 모델을 선택하세요. 8GB 미만이면 SDXL은 무리고 SD 1.5로 시작이 안전해요.
비공식 사이트의 모델은 악성코드 위험이 있어요. 검증된 사이트만 사용하세요.
특히 .pickletensors 확장자는 코드 실행 위험이 있으니 .safetensors만 다운로드하세요.
설치 후 빠르게 익히려면 외부 자료가 필수예요. 검증된 5가지예요.
이 5개만 활용해도 ComfyUI 학습 곡선이 1/3로 줄어요. 특히 Civitai와 OpenArt는 다른 사람 워크플로우를 다운로드해서 분해·재조립하면서 배우는 게 가장 빠른 학습법이에요.
ComfyUI에서 자주 쓰는 단축키 5개예요. 익히면 작업 속도가 2배 빨라져요.
ComfyUI의 매력은 "내가 100% 제어한다"는 자유도예요. Midjourney가 잘 만들어진 자동차라면, ComfyUI는 부품부터 직접 조립하는 키트예요. 처음엔 답답하지만 한 번 익히면 다른 도구로 돌아가기 어려워요. 30분의 설치 시간이 평생의 이미지 생성 자유를 가져다줍니다.
네, 완전 무료 오픈소스예요. GitHub에서 다운로드해서 본인 PC에 설치해서 사용해요.
NVIDIA RTX 3060(8GB) 이상 권장해요. RTX 5060 Ti 8GB에서 SDXL 모델이 1장당 5초 정도 걸려요.
VRAM 6GB 이상 그래픽카드 탑재 노트북이면 가능해요. 다만 발열 관리가 중요해요.
ComfyUI는 노드 기반이라 워크플로우를 시각적으로 설계해요. A1111은 탭 기반이라 초보가 쓰기 쉽지만 자유도가 낮아요.
Hugging Face와 Civitai에서 SDXL, Flux, SD 1.5 모델을 무료로 받을 수 있어요. 라이선스만 확인하세요.
기본은 영어지만 ComfyUI-Manager 확장으로 한글화 가능해요. 메뉴는 영어에 익숙해지면 더 빨라요.