Google이 Gemini Nano Banana, 이미지 생성 모델을 출시했을 때 기술 커뮤니티는 그 성능뿐만 아니라 기이한 이름인 Nano Banana에 대해서도 궁금해했습니다.
최근 Gemini, 그룹의 제품 디렉터인 데이비드 샤론 브라다는 'Made by Google' 팟캐스트에서 전체 이야기를 들려주었고 그것은 놀라울 정도로 흥미로운 이야기입니다.
샤론에 따르면 나노 바나나라는 이름은 원래 니나라는 구글 직원이 서둘러 붙인 임시 식별 코드일 뿐입니다.
그녀는 사용자가 개발자를 알 수 없는 익명의 AI 모델을 경험할 수 있는 플랫폼인 LM Arena,에 테스트 모델을 보냈습니다.
trang 비밀을 유지하려면 니나는 무작위 가명을 입력해야 합니다. 그녀는 새벽 2시 30분경에 그 이름을 생각해냈습니다. 그것은 단지 재미있는 선택일 뿐입니다. 눈은 의도적인 것이 아닙니다.'라고 샤론은 말했습니다.
그러나 LM Arena 사용자들이 이 모델 특히 나노 바나나라는 이름을 좋아하기 시작하면서 놀라운 일이 일어났습니다.
mim 우리는 모든 사람들이 그것을 그렇게 부른다는 것을 깨달았습니다. 그래서 bia는 이름을 바꾸는 대신 그대로 유지하기로 결정했습니다.'라고 Sharon은 말했습니다.
재미있는 이름 뒤에는 Google 이미지 제작 기술의 획기적인 발전이 있습니다. Gemini Nano Banana는 얼굴의 일관성과 캐릭터의 정체성을 유지하는 능력이 있습니다. 이는 이전의 많은 AI 모델의 약점이었습니다.
“처음으로 브라를 시도했을 때 저는 제 사진을 업로드하고 AI에게 저를 우주에 배치해 달라고 요청했습니다. 결과는 정말 놀라웠습니다. 왜냐하면 그것은 AI가 만든 왜곡된 복사본이 아니라 여전히 저였기 때문입니다.”라고 샤론은 회상했습니다.
얼굴 특징을 유지하고 동시에 유연하게 창의력을 발휘하는 능력은 나노 바나나가 구글 이미지 AI 라인에서 큰 진전을 이루는 데 도움이 되었으며 어도비의 DALL·E 3 찬드 미저니 또는 파이어플라이와 같은 도구와 직접 경쟁합니다.
Google의 Greenfield라는 내부 그룹은 나노 바나나를 다양한 창의적인 도전에 몰아넣었습니다. '긴 의자와 감자를 결합하라'는 요청을 받았을 때 모델은 즉시 '쿠크 포테이토' 이미지를 만들었습니다. 즉 소파에 있는 감자를 게으르지만 재치 있게 의미합니다. 이것은 AI의 상황 이해 능력과 개념의 유연한 조합에 대한 증거입니다.
이러한 실험을 통해 나노 바나나는 아름다운 이미지를 만들 뿐만 아니라 보고 아이디어를 이해하고 디지털 아트 광고 및 디자인 분야에서 새로운 응용 가능성을 열었습니다.
모델의 성공은 Google이 창의성 인식 및 개인화가 조화롭게 결합된 새로운 AI 세대 이미지에 강력한 베팅을 하고 있음을 보여줍니다. 눈은 한밤중의 장난으로 여겨지는 '나노 바나나'에서 시작됩니다.