구글, AI 이미지 생성 모델 나노 바나나 2 공개: 핵심 포인트 정리

구글이 새로운 이미지 생성 모델 나노 바나나 2(Gemini 3.1 Flash Image)를 공개했어요. 이번 모델은 기존 나노 바나나 Pro의 고급 기능을 유지하면서도, Flash급 속도를 결합한 것이 특징입니다. 아래에서 이번 업데이트의 핵심 업데이트 사항을 소개해 드릴게요.

실세계 지식 기반 이미지 생성

이번 모델은 제미나이의 실세계 지식과 웹 검색 기반 정보를 활용해 특정 대상 표현의 정확도를 높였다고 해요. 이러한 이해도를 바탕으로 인포그래픽을 생성하거나, 노트 필기를 다이어그램 변환할 수도 있고, 데이터 시각화 이미지 제작도 할 수 있습니다.

예를 들어 위의 예시 이미지에 쓰인 프롬프트는 ‘water cycle’이라는 개념만 제시했을 뿐, 구체적인 단계별 내용을 포함하지 않았음에도 실제 지식을 기반으로 이미지를 완성한 모습이에요.

이미지 속 텍스트 표현 및 번역 개선

이미지 내 텍스트도 보다 정확하고 읽기 쉽게 생성할 수 있도록 개선되었다고 해요. 또한 이미지 안의 문구를 다른 언어로 번역하거나 로컬라이징할 수 있는 기능도 지원합니다. 구글은 이 기능이 마케팅 목업이나 카드 디자인처럼 텍스트 정확도가 중요한 작업에 활용될 수 있다고 설명했는데요, 특히 글로벌 배포를 전제로 한 시안 제작에서 활용 범위를 넓히려는 의도가 보입니다.

번역 텍스트 성능이 궁금해서 직접 나노 바나나 2로 예시 이미지를 한국어로 번역해보았어요. 원본 이미지를 그대로 유지한 채 텍스트만 깔끔하게 교체된 모습입니다. 다만 영문 버전의 Comic 폰트 스타일까지 구현해 내지는 못하네요. 한글 이미지 생성에서는 일반적인 고딕/명조 계열 폰트만 구현되고 그 이상은 어렵다는 점을 아직 고려해야겠습니다.

캐릭터 및 오브젝트 일관성 강화

나노 바나나 2는 한 번의 요청에서 최대 5명의 캐릭터 유사도 및 최대 14개 오브젝트의 정확도 유지를 지원한다고 해요. 구글은 이를 통해 스토리보드 제작이나 내러티브 기반 작업에서 입력 요소의 외형을 안정적으로 유지할 수 있다고 설명했습니다. 여러 장면을 이어 제작하는 시리즈형 비주얼 작업 대응이 강화된 업데이트라고 볼 수 있어요.

프로덕션 대응 이미지 스펙 지원

생성되는 이미지의 비율도 다양해졌어요. 512px ~ 4K 해상도 범위에서 다양한 종횡비 제어가 가능하고, 향상된 조명과 텍스처를 지원합니다. 구글은 소셜 포스트부터 와이드 스크린 배경까지 여러 출력 환경에서 선명도를 유지하도록 설계했다고 설명했습니다.

이미지 생성 스타일 템플릿 추가

AI 이미지 생성 전문가가 아니어도 쉽게 기능에 접근할 수 있는 이미지 생성 템플릿도 추가되었습니다. 챗GPT가 GPT Image 1.5 모델로 업데이트할 때 추가했던 기능인데 제미나이 환경에도 만들어졌네요. 제미나이 새 대화창에서 ‘이미지 생성’ 모드를 선택하면 템플릿 화면이 활성화됩니다.

이미지 생성 퀄리티 자체는 나노 바나나 Pro 모델의 보급형으로 느껴지지만 여러 편의성이 개선된 점이 눈에 띕니다. 아래의 구글 블로그 원문 페이지에서 더 많은 이미지 생성 예시와 실제 프롬프트를 확인해 보세요.

구글 블로그에서 자세히 보기

by 레이디러너