[아이뉴스24 윤소진 기자] 글로벌 인공지능(AI) 시장이 언어 중심의 챗봇 경쟁에서 시각 중심의 비전모델로 빠르게 이동하고 있다. 구글의 ‘나노바나나(Nano Banana)’가 전 세계 SNS 크리에이터와 디자이너 사이에서 폭발적인 반응을 얻으며 ‘비전모델 시대’를 열자 오픈AI가 최신 영상 생성 모델 ‘소라 2(Sora 2)’로 맞불을 놨다.
![나노바나나와 소라2가 대결하는 모습을 AI로 제작한 이미지. [사진=나노바나나 제작]](https://image.inews24.com/v1/fde7e7487192af.jpg)
비전모델은 이미지나 영상을 이해하고 생성하도록 학습한 시각 인식형 AI를 말한다. 딥러닝 기반의 컴퓨터 비전 기술을 바탕으로 이미지 분류, 객체 탐지, 생성 등 다양한 시각 작업을 수행하며, 최근에는 텍스트와 영상을 함께 처리하는 멀티모달 AI의 핵심 기술로 급부상하고 있다.
'AI 포토샵' 나노바나나가 뭐길래
나노바나나는 지난 8월 출시된 구글 제미나이 2.5 Flash Image 모델을 말한다. 피사체 일관성 유지와 정밀한 이미지 편집 성능이 뛰어나며, 빠른 처리 속도로 실시간 편집이 가능하다는 점이 특징이다. 배경 제거, 객체 교체, 다중 이미지 융합 등을 지원해 상업용 콘텐츠 제작과 마케팅 이미지 생성에 적합하다.
간단한 자연어 프롬프트로도 정교한 편집이 가능하며, 구글 생태계와 API를 통해 접근할 수 있어 콘텐츠 제작의 효율성을 크게 향상시킨다. 나노바나나는 중국에 이어 두번째로 큰 온라인 인구를 보유한 인도에서 사용률 1위로 부상했다.
인도 경제매체 더 이코노믹 타임즈는 "나노바나나는 구글 생태계와 API를 통해 실시간 협업이 가능한 이미지 생성 도구로, 속도와 정밀도 면에서 현존 AI 중 가장 우수하다”고 평가했다.
제미나이 무료 사용자도 나노 바나나 관련 주요 기능을 대부분 자유롭게 쓸 수 있다. 다만 하루에 생성할 수 있는 이미지의 수가 제한돼 있다. 이미지 1장 생성 비용은 약 0.04달러(한화 50원 미만)에 불과하며, 나노바나나 웹페이지에서 일반 사용자용으로 월12달러 베이직(75장), 19.5달러의 프로(400장), 월 80달러 맥스(800장) 요금제를 제공한다.
틱톡 대항마?…소라2, 영상AI 새 기준
소라2는 오픈AI가 지난달 30일 공식 출시한 차세대 영상 생성 모델이다. 영상 내 물리 법칙을 정밀하게 반영하고, 텍스트 프롬프트만으로 장면 전환과 연속성 제어가 가능하다. 사용자는 자신의 얼굴과 음성을 영상에 삽입할 수 있는 '카메오(Cameo)' 기능을 활용할 수 있으며, 배경음과 효과음, 음성까지 실시간 동기화된다.
모바일 앱으로도 출시돼 틱톡 스타일의 짧은 영상 제작 및 공유가 용이하다. 디지털 신원 보호 및 부적절 콘텐츠 모니터링 기능까지 갖춰 AI 딥페이크 문제에 대응한다. 미국과 캐나다에 초대 기반 서비스로 출시 후 첫 이틀간 16만 건 이상의 앱 설치를 기록했으며, 미국 앱스토어 전체 1위에 올랐다. 한국에서는 아직 사용할수 없다.
IT전문매체 테크크런치는 "소라2는 물리적 정확성과 오디오·영상의 동기화 기능에서 혁신적 진전을 이뤘다”며 “틱톡형 AI 영상 앱 ‘Sora’를 함께 출시해 소셜 콘텐츠 제작 시장을 정면으로 겨냥했다”고 평가했다.
구글의 나노바나나와 오픈AI의 소라2는 각각 이미지와 영상이라는 다른 영역을 공략하며 ‘보는 AI’ 경쟁의 양 축을 형성하고 있다. 나노바나나가 정지 이미지를 중심으로 한 편집·상업 디자인 혁신에 초점을 맞췄다면, 소라2는 스토리텔링과 영상 표현의 확장성으로 시장을 선도하고 있다.
업계 관계자는 업계 관계자는 “생성형 AI의 주도권이 텍스트에서 이미지·영상으로 이동하고 있다”며 “AI가 언어를 해석하는 수준을 넘어 인간의 시각적 사고를 재현하는 단계로 진화하고 있다. 향후 경쟁력의 핵심은 얼마나 자연스럽고 맥락 있는 비전을 구현하느냐에 달려 있다”고 말했다.
/윤소진 기자(sojin@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기