최근 AI 커뮤니티를 둘러보셨다면, Reddit에서 올라온 ‘Omni’ 관련 스크린샷을 보고 다들 “이게 뭐지?” 하는 반응을 보였던 장면을 한 번쯤 보셨을 겁니다. 이 Omni는 구글의 새로운 AI 영상 생성 모델로 추정되며, 현재는 Gemini 앱 내부에 숨겨진 채 공식 공개만 기다리고 있는 기능처럼 보입니다.
자연스럽게 온라인에서는 같은 질문이 이어지고 있습니다. 구글 Gemini Omni는 과연 무엇일까요? 이 글에서는 지금까지 알려진 정보와 아직 불확실한 부분, 그리고 정식 출시를 기다리지 않고 지금 바로 활용할 수 있는 대안까지 함께 정리해드립니다.

1부. 유출로 드러난 정체: Gemini Omni란 무엇인가?
Gemini Omni 이슈는 대부분의 AI 유출 사례처럼 시작됐습니다. 한 사용자가 Gemini 앱에서 낯선 기능을 발견해 온라인에 공유했고, 이후 많은 사람들이 직접 확인에 나섰죠. Reddit 사용자 Zacatac_391는 Gemini 앱 안에서 ‘Gemini Omni로 만들기(Create with Gemini Omni)’라는 팝업을 목격했다고 전했으며, 해당 팝업은 이를 새로운 영상 생성 모델처럼 소개하고 있었습니다.
이 작은 발견이 크게 주목받은 이유는, 구글이 이미 Veo라는 강력한 AI 영상 생성 기술을 보유하고 있기 때문입니다. 여기에 Gemini와 결합된 새로운 영상 모델까지 추가된다면, 업계의 기대가 커질 수밖에 없습니다.

9to5Google와 Android Authority의 초기 보도 역시 비슷한 맥락입니다. Gemini Omni는 현재 Gemini 앱 내에서 영상 생성 모델 형태로 포착되고 있으며, 구글의 Veo 기술과 연결되어 있을 가능성이 높지만 아직 공식 확인된 상태는 아닙니다.
언제쯤 사용할 수 있을까?
현재 Gemini Omni는 아직 모든 사용자에게 정식 공개된 기능으로 보이지는 않습니다. 일부 사용자만 팝업을 일시적으로 확인했으며, 접근도 제한적이고 불안정한 상태로 전해지고 있습니다. 실제로 한 Reddit 게시물에서는 앱을 다시 실행한 뒤 해당 인터페이스가 사라졌다는 후기도 있어, 구글이 제한된 테스트 형태로 기능을 시험 중일 가능성이 높습니다.
다만 구글 I/O 2026 일정이 가까워지고 있는 만큼, 머지않아 공식 발표가 이뤄질 가능성은 충분합니다.
2부. Gemini Omni의 주요 기능: 지금까지 알려진 내용
Gemini Omni는 아직 정식 출시 전이기 때문에, 현재 공개적으로 확인할 수 있는 정보는 앱 팝업, Reddit 사용자 테스트, 그리고 일부 기술 매체 보도에 한정됩니다. 따라서 아래 기능들은 초기 정황을 바탕으로 정리한 내용이며, 정식 출시 시 세부 사양은 달라질 수 있습니다.
현재까지 거론되는 핵심 기능은 다음과 같습니다.
| 기능 | 설명 |
| AI 영상 생성 | Gemini 채팅창에 간단한 프롬프트를 입력하면 짧은 영상을 자동으로 생성 |
| 비디오 리믹스 | 기존 영상의 분위기, 스타일, 연출 방향을 새로운 형태로 재구성 |
| 채팅 기반 영상 편집 | 복잡한 편집 툴 조작 없이, 텍스트 설명만으로 영상 편집 작업 수행 |
| 템플릿 활용 | 미리 준비된 스타일이나 구조를 바탕으로 빠르게 영상 제작 가능 |
Gemini Omni에서 특히 주목할 만한 부분은 Gemini 앱과의 통합 방식입니다. 별도의 AI 영상 생성 플랫폼으로 분리되는 것이 아니라, 기존의 채팅 기반 워크플로우 안에서 영상 생성, 편집, 리믹스까지 한 번에 요청할 수 있는 형태로 보입니다. 즉, 사용자는 복잡한 기술 지식 없이도 Gemini에게 원하는 결과를 설명하듯 요청하는 방식으로 영상을 만들 수 있게 되는 셈입니다.
Gemini Omni는 Veo보다 더 뛰어날까?
이 질문에 지금 당장 단정적으로 답하기는 어렵습니다. 현재로서는 Gemini Omni가 Veo 기술을 기반으로 확장된 형태이거나, Veo의 활용 범위를 Gemini 환경 안에서 넓힌 모델일 가능성이 더 커 보입니다. 완전히 별개의 독립 모델이라고 보기에는 아직 정보가 부족합니다.

초기 데모와 사용자 반응을 보면, Gemini Omni는 사용 편의성과 프롬프트 이해 측면에서 꽤 강한 인상을 남기고 있습니다. 특히 채팅 환경 안에서 바로 영상 편집까지 이어질 수 있다는 점은, 단순 프롬프트 입력 중심의 기존 생성형 툴보다 훨씬 실용적으로 느껴집니다.
다만 결과물의 품질, 장면 일관성, 세밀한 제어력, 실제 제작 환경에서의 안정성까지 포함해 Veo보다 우위에 있다고 판단하기에는 아직 이릅니다. Veo는 이미 시네마틱한 영상 품질과 오디오 처리 측면에서 강점을 인정받고 있으며, Seedance나 Kling 같은 다른 AI 영상 모델 역시 각기 다른 장점을 갖고 있습니다. 따라서 구글의 공식 발표와 실제 사용 사례가 더 축적되기 전까지는, Gemini Omni의 성능 우위를 섣불리 단정하지 않는 편이 안전합니다.
3부. 초기 테스트 결과: Gemini Omni가 만든 영상은 어떤 수준일까?
단순한 소문으로만 치부하기엔, 이미 온라인에는 Gemini Omni로 제작된 것으로 알려진 영상 예시가 몇 편 공유되고 있습니다. 아직 정식 출시 전임에도 불구하고, 이 데모들은 꽤 높은 완성도를 보여주며 많은 관심을 끌고 있습니다.
대표적인 예시 두 가지를 함께 살펴보겠습니다.
예시 1: 교수의 수학 강의 장면
프롬프트: "전통적인 칠판 앞에서 한 교수가 삼각함수 공식을 단계별로 증명하며 직접 풀이를 적어 내려갑니다."
이 영상이 특히 인상적인 이유는, 겉보기보다 구현 난도가 높은 장면이기 때문입니다. AI 영상 생성 모델은 일반적으로 읽을 수 있는 글씨, 자연스러운 손동작, 논리적으로 이어지는 칠판 구성, 그리고 인물의 일관된 외형을 동시에 안정적으로 구현하는 데 어려움을 겪는 경우가 많습니다.
- 교실 분위기가 자연스럽게 표현됨
- 교수 캐릭터의 존재감이 비교적 현실감 있게 유지됨
- 교육용 프롬프트의 의도를 전반적으로 잘 반영함
- 장면 구성이 다른 AI 생성 영상보다 안정적으로 느껴짐
- 손동작이 완벽하게 자연스럽지는 않음
- 칠판 글씨의 연결감이나 연속성이 일부 장면에서 흔들릴 수 있음
예시 2: 고급 레스토랑 디너 장면
프롬프트: “바닷가의 고급 레스토랑 야외 데크에서 두 남자가 원형의 흰 테이블보가 깔린 테이블에 도착합니다. 테이블 위에는 풍성한 식기와 센터피스가 놓여 있고, 한 명은 짧은 수염과 당당한 자세가 인상적인 50대 아프리카계 미국인 신사로 맞춤 슈트를 입고 있습니다. 두 사람은 파스타를 먹으며 인사를 나누고, 차분하게 대화를 이어갑니다.”
두 번째 예시는 훨씬 더 복잡한 장면입니다. 음식이 등장하는 영상은 AI 모델이 특히 어려워하는 분야로 꼽히는데, 접시와 식기, 손의 움직임, 입의 동작, 음식의 형태 유지, 장면 간 객체 일관성까지 자연스럽게 맞아떨어져야 하기 때문입니다. 이 디너 장면은 첫인상에서는 상당히 시네마틱하고 세련돼 보이지만, 자세히 보면 AI 특유의 오류도 좀 더 뚜렷하게 드러납니다.
- 전체적인 장면 분위기가 영화처럼 연출됨
- 조명과 공간 무드가 세련되게 표현됨
- 복수 인물이 등장하는 장면도 어느 정도 안정적으로 처리함
- 음식의 형태나 위치가 갑자기 바뀌거나 어색하게 변할 수 있음
- 먹는 동작과 장면 흐름이 완전히 자연스럽게 맞물리지는 않을 수 있음
초기 평가 요약
| 테스트 항목 | 초기 인상 |
| 영상의 현실감 | 매우 뛰어남 |
| 프롬프트 이해도 | 전반적으로 강력함 |
| 인물 동작 표현 | 좋은 편이지만 완벽하진 않음 |
| 손과 사물의 일관성 | 아직 보완이 필요함 |
| 음식과의 상호작용 | 추가 개선 필요 |
| 오디오 품질 | 기대감은 높지만 아직 충분한 검증은 부족함 |
| 전체적인 잠재력 | 매우 높음 |
보너스. AI 영상을 지금 바로 만들고 싶다면? 필모라 활용법
Gemini Omni는 분명 기대를 모으는 기능이지만, 아직 정식 출시 전인 만큼 당장 활용하기는 어렵습니다. 하지만 지금 바로 AI 영상이 필요한 사용자라면 마냥 기다릴 수만은 없겠죠. 그런 점에서 원더쉐어 필모라는 이미 실전에서 활용할 수 있는 훨씬 현실적인 대안이 됩니다.

필모라에서는 Veo 3.1 기반 AI 영상 생성 기능을 바로 활용할 수 있어, 고품질 영상을 훨씬 빠르게 제작할 수 있습니다. 특히 AI 텍스트 동영상 변환와 AI 이미지 동영상 변환 기능을 통해 텍스트나 이미지만으로도 손쉽게 영상을 만들 수 있습니다. 여기에 Sora 2, Seedance 2.0, ToMoviee 2.5 등 다양한 모델까지 지원해, 하나의 툴 안에서 폭넓은 AI 영상 제작 경험을 제공하는 점도 큰 강점입니다.

Gemini Omni를 기다리는 동안 필모라가 좋은 선택인 이유
| 필요한 기능 | 필모라에서 가능한 해결 방식 |
| 지금 바로 AI 영상 생성 | 텍스트-비디오, 이미지-비디오 기능으로 즉시 제작 가능 |
| 구글 계열 최신 영상 기술 활용 | Veo 3.1 기반 생성 기능을 필모라에서 바로 사용 가능 |
| AI 결과물의 후편집 | 트리밍, 크롭, 색보정, 효과 추가, 클립 교체까지 한 번에 가능 |
| SNS용 영상 빠른 제작 | 자막, 템플릿, 음악, 트랜지션 등을 손쉽게 추가 가능 |
| 생성과 편집의 통합 관리 | 하나의 소프트웨어 안에서 생성부터 편집, 내보내기까지 지원 |
필모라의 가장 큰 장점은 생성 이후의 편집 통제력이 뛰어나다는 점입니다. 일반적인 AI 생성 툴은 원하는 결과가 나올 때까지 여러 번 다시 생성해야 하고, 그 과정에서 시간과 크레딧이 많이 소모될 수 있습니다. 반면 필모라는 생성된 영상을 바로 편집 타임라인으로 가져와 트리밍, 트랜지션 추가, 텍스트 삽입, 샷 교체, 색보정, 효과 적용, 자막 추가, 최종 내보내기까지 한 번에 이어서 작업할 수 있습니다.
지금 필모라로 AI 영상 만들기
다행히 필모라에서 Veo 3.1 기반 AI 영상을 만드는 과정은 비교적 간단합니다. 처음 사용하는 분도 따라 할 수 있도록 공식 가이드와 영상 튜토리얼이 제공되므로, 아래 내용을 참고하면 바로 AI 영상 제작을 시작할 수 있습니다.
5부. 마무리
구글 Gemini Omni는 차세대 AI 영상 생성 경험을 보여줄 가능성이 큰 모델입니다. 특히 대화하듯 영상을 만들고, 리믹스하고, 편집할 수 있는 방향성은 앞으로의 AI 영상 제작 방식이 어떻게 바뀔지를 잘 보여줍니다. 다만 현재는 아직 공식 출시 전 단계인 만큼, 기대감과 함께 신중한 시선도 필요합니다.
만약 지금 당장 AI 영상을 제작해야 한다면, 필모라는 훨씬 더 현실적이고 실용적인 선택이 될 수 있습니다. Veo 3.1을 비롯한 다양한 최신 모델을 활용한 AI 영상 생성은 물론, 생성 이후의 편집·보정·내보내기까지 한 번에 이어서 작업할 수 있기 때문입니다. Gemini Omni가 곧 다가올 미래라면, 필모라는 이미 지금 바로 활용할 수 있는 AI 영상 제작 워크플로우라고 할 수 있습니다.
구글 Gemini Omni FAQ
-
Gemini Omni는 기존 Gemini 앱과 별도의 앱인가요?
아니요. 현재까지 알려진 정보에 따르면, Gemini Omni는 기존 Gemini 앱 안에 새로운 모델 또는 기능 옵션 형태로 추가될 가능성이 높습니다. 따라서 별도의 앱을 새로 다운로드해야 하는 방식은 아닐 것으로 보입니다. -
Gemini Omni는 무료로 사용할 수 있나요?
아직 정확한 요금 정책은 공개되지 않았습니다. 일부 보도와 사용자 후기에서는 Gemini의 유료 AI 플랜과 연결될 가능성이 언급되고 있으며, 사용 횟수 제한이 적용될 수 있다는 추정도 나오고 있습니다. 다만 이는 정식 발표 전 정보이므로, 최종 정책은 출시 이후 확인이 필요합니다. -
Omni로 장편 영화도 만들 수 있나요?
현재까지 알려진 범위에서는, Gemini Omni는 짧고 고품질의 영상 생성에 더 적합한 방향으로 보입니다. SNS 콘텐츠, 데모 영상, 콘셉트 시각화처럼 짧은 형식에는 잘 맞을 수 있지만, 장편 영화 제작까지 바로 지원하는 단계는 아닌 것으로 보입니다. -
Omni에서 직접 만든 영상이 아닌 파일도 편집할 수 있나요?
초기 UI 설명에는 ‘Video Remixing’ 기능이 언급되어 있어, 사용자가 업로드한 기존 영상을 새로운 스타일로 재구성하거나 편집할 가능성은 있어 보입니다. 다만 실제 지원 범위와 편집 방식은 공식 출시 이후에야 정확히 확인할 수 있습니다.

