Nano Bananaで画像制作はどこまで変わるのか

AI活用・生成技術

画像生成AIの品質向上により、生成画像を実務に活用できる場面が広がっています。
Nano Bananaの画像生成・編集性能を検証し、
文字入り画像や部分補正、多言語変換などの実用性を確認しました。

はじめに

 近年、生成AIの進化は著しく、テキスト処理にとどまらず、画像や動画といったクリエイティブ分野においても急速な発展を遂げています。
 数年前までは、画像生成AIによって出力されたビジュアルは、細部の破綻や不自然さが残ることが多く、実務で使用するためには人の手による微調整やレタッチが不可欠でした。
 しかし現在では、モデルの高度化により、生成された画像そのものをそのまま業務に活用できるレベルにまで品質が向上しています。

 本レポートでは、こうした進化の中でも特に注目されている、Google DeepMind が開発した画像生成モデル「Nano Banana」を対象とし、その性能や特徴、実務における有用性について検証を行います。

※本検証に使用した画像素材は、Adobe Stockを利用しています。


Nano Bananaについて

 本章では、モデル構成および利用方法を整理します。

モデル構成と特徴

 Nano Bananaは単一のモデルではなく、用途や性能に応じて複数のバリエーションが存在します。主なモデルは以下の3種です。

Nano Banana(初期モデル)
 初期にリリースされたモデルであり、基本的な画像生成機能を備えています。現在は後継モデルの登場により、性能面ではやや見劣りします。

Nano Banana Pro
 高精細な画像生成およびテキスト描画能力を強化した上位モデルです。特にインフォグラフィックや文字入り画像において、高い精度を発揮します。

Nano Banana 2
 最新世代の標準モデルです。生成速度、指示理解、一貫性のバランスが大きく向上しており、実務用途に適したモデルとなっています。

 リリース時期としては、Nano Banana→ Nano Banana Pro → Nano Banana 2 の順で進化しており、性能面においても同様に向上しています。
 特にNano Banana 2は、総合性能(速度・安定性・指示再現性)に優れ、現行の標準モデルとして位置付けられています。一方、Nano Banana Proは一部の高精細表現やテキスト描画において優位性を持っています。

 本検証では、最新モデルであるNano Banana Pro および Nano Banana 2を対象とします。


利用方法

 Nano Bananaの利用方法は大きく2つに分類されます。

① Geminiチャットから利用する方法

 まず、Google Gemini(https://gemini.google.com/app)へアクセスします。

 ツールバーから「画像を作成」を選択し、「画像のスタイル」を指定することで、生成するビジュアルの方向性を決定できます。

 その後、チャットスペースに生成したい画像の内容をテキスト(プロンプト)として入力し、画像生成を実行します。

 Geminiにおける画像生成では、基本的に最新モデルであるNano Banana 2が自動的に使用されます。ユーザー側で特別な設定を行う必要はなく、生成時には「Nano Banana 2を読み込んでいます」といったログが表示されます。

 なお、より高性能なNano Banana Proを利用するためには、Google AIの有償サブスクリプションへの加入が必要です。

 また、無料プランでは、1日あたり数枚(概ね3枚程度)の生成制限が設けられています。


② 他サービスからの利用

 Nano Bananaは単体サービスとしてだけでなく、他のアプリケーションの内部モデルとしても利用されています。

 代表的な例として、Adobe Fireflyが挙げられます。Fireflyでは「パートナーモデル」として以下のモデルが利用可能です。

 Fireflyにおける画像生成では、枚数制限ではなくAdobeクレジットが消費される仕組みとなっています。消費量は使用するモデルの性能に応じて増加します。

 当社環境では、社員単位で契約しているサブスクリプションにより、月間4,750クレジットが付与されています。この条件下では、Nano Banana Proを最高設定(4K)で使用した場合でも、月間で約60枚弱の画像生成が可能です。


他生成サービスとの比較

 現状の生成AI環境において依然として高い性能を持つ ChatGPT 5.4Nano Banana Pro について、同一テーマで画像生成を行い比較したところ、日本語テキストの描画精度に明確な差が見られました。

テーマ:Nano Bananaの仕組みについてのインフォグラフィック

Nano Banana Pro

Chat GPT 5.4

 ChatGPT 5.4では、日本語の文字形状が崩れたり、一部の文字が判別しにくくなったりする傾向が見られ、実務で使用するには手動での再調整が必要となる場面がありました。
 一方、Nano Banana Proで生成した画像では、日本語テキストの崩れが比較的少なく、可読性を保った状態で出力される傾向が確認できました。

 今回の比較結果からは、Nano Banana Proは特に文字入り画像やインフォグラフィック用途を意識した出力に強みを持っている一方で、ChatGPT 5.4は構図理解や指示追従性には優れるものの、日本語テキストの正確な描画という点では不安定さが残ると考えられます。

 このことから、図版内に日本語テキストを直接含める必要がある用途においては、Nano Banana Proの方が実務適性が高い傾向を読み取ることが出来ました。
 反対に、画像そのものの構成案作成や、ラフイメージの生成、あるいは後工程で別途テキストを組み込む前提の用途であれば、ChatGPT 5.4も十分に有効であるといえます。

人物を維持したままの画像生成

 Nano Bananaでは、人物やキャラクターの顔立ち、雰囲気、髪型といった特徴を維持したまま、異なるシーンへ変換する画像生成が可能です。

 従来の画像生成AIでは、同一人物を維持することが難しく、顔や印象が変化してしまうケースが多く見られましたが、Nano Bananaでは同一人物として認識できるレベルで特徴を保持したまま、シーンのみを自然に変化させることが可能です。

ビジネスシーンの人物をサッカー選手に

 このことから、人物を軸とした複数パターンのビジュアル制作においては、実用性のある技術であると考えられます。

部分補正(ピンポイント編集)

 Nano Bananaでは、画像全体を大きく変化させることなく、特定の要素のみをピンポイントで修正する部分補正が可能です。

 従来の画像生成AIでは、一部を変更しようとすると、意図しない箇所まで変化してしまうケースが多く、再生成を繰り返す必要がありました。
 しかしNano Bananaでは、対象部分のみを限定的に変更し、それ以外の構造や構図を維持したまま編集を行うことが比較的安定して行えます。

ネクタイの色を変更

犬種を変更

長靴の色を変更

テキストの一部を変更

 インフォグラフィック内の文章において、テキストの一部のみをプロンプトから修正

 いずれのケースにおいても、変更対象以外への影響は最小限に抑えられており、自然な仕上がりが確認できました。
 このことから、Nano Bananaは単なる生成だけでなく、既存画像の修正・差し替えといった実務的な用途においても高い有用性を持つ技術であると考えられます。

多言語変換

 Nano Bananaでは、既存の画像に含まれるテキストを別言語へ変換する、いわゆる多言語変換にも対応しています。

 今回の検証では、日本語で作成したポスター画像を基に、英語版のビジュアルを生成しました。その結果、単純な文字置き換えにとどまらず、レイアウトやデザインバランスを維持したまま、自然な英語表現へ変換されていることが確認できました。

 従来の手法では、テキストの翻訳後にレイアウトを再調整する必要がありましたが、Nano Bananaを用いることで、翻訳とビジュアル再構成を同時に行うことが可能です。

複数画像の要素を組み合わせた生成

 Nano Bananaでは、複数の参考画像を基に、それぞれの要素を組み合わせた新たな画像を生成することが可能です。

人物画像と別途用意したアイテム画像を組み合わせ、特徴を維持したままビジュアルを生成

参考画像

生成結果

個別に用意した複数の人物写真を基に、「会議室で議論しているシーン」というテーマで画像生成
参考画像

生成結果

 従来の画像生成AIでは、複数の要素を統合しようとすると、いずれかの特徴が失われたり、全体が不自然になるケースがありましたが、Nano Bananaでは各要素の関係性を保ちながら統合する能力が確認されました。

 このことから、人物・衣装・小物などを組み合わせたビジュアル制作や、複数素材を元にしたイメージ生成において、実用性の高い技術であると考えられます。

URLからの図解生成

 Nano Bananaでは、URLで指定されたWebサイトの情報を基に、内容を整理・要約し、インフォグラフィックとして視覚化することが可能です。

 Nano Banana Proは、単なる画像生成にとどまらず、テキスト情報や構造を理解した上で図解化する能力を備えており、企業情報や手順、データなどを整理してビジュアル化する用途に適しています。

 今回の検証では、当社サイト(https://www.meisho-do.co.jp/)のURLを入力し、その全体構造や事業内容を分析させた上で、1枚のインフォグラフィックとしてまとめる生成を行いました。その結果、ページ単位の情報を単に並べるのではなく、内容を分類・要約し、関係性を整理した構造化された図解が生成されました。

 従来は、サイト分析・情報整理・レイアウト設計・デザイン作成といった工程を個別に行う必要がありましたが、Nano Bananaを用いることで、これらの工程を一括して処理することが可能となります。

画像の一部削除

 Nano Bananaでは、画像内の不要な要素を削除し、周囲の情報から自然に補完する部分削除が可能です。

 当社では従来、画像補正作業にAdobe Photoshopを使用して対応していますが、Nano Bananaを用いることで、専門的な操作を行うことなく、自然な仕上がりで不要物を除去できることが確認されました。

 今回の検証では、以下のような編集を行いました。

電柱と電線を削除

歩道の木々を削除

目玉焼きを削除

 いずれのケースにおいても、削除対象以外の構造は概ね維持され、自然な画像として成立していることが確認されました。
 一方で、当社の画像補正業務においては、元画像との数ミリ単位のズレも許容されない案件も存在します。そのような厳密な精度が求められるケースでは、従来通りPhotoshopによる手動補正が必要となります。

 しかし、ある程度の調整が許容される用途においては、Nano Bananaは効率的な画像補正手段として十分に活用可能な技術であると考えられます。

 また、以前オウンドメディアにて公開した「当社技師 vs AI|画像補正の検証」において実施した、「町並みから電線のみを削除する」検証についても、今回改めてNano Bananaを用いて再検証を行いました。

元画像

 前回、Adobe PhotoshopのAI機能を用いて同様の処理を行った際には、電線自体は削除できていたものの、電線と建物が重なっていた箇所において、ぼやけや形状の崩れが発生する結果となっていました。特に、建物など情報量の多い部分では補完精度にばらつきが見られ、削除ツールを適用した箇所ではわずかな解像度低下や歪みも確認されていました。

前回、PhotosShopのAI機能で補正したもの

 一方、今回Nano Bananaを用いて同様の処理を行った結果、目立った破綻やぼやけはほとんど見られず、細部まで自然に補完されていることが確認できました。建物の輪郭や構造も維持されており、元画像との違和感もほとんどありません。

Nano Bananaで補正

 さらに作業工程の観点においても大きな差が見られました。前回は電線部分を手動で選択し、削除処理を繰り返す必要があり、作業完了までに約45分を要していましたが、Nano Bananaでは画像を入力し「電線を削除する」と指示するのみで処理が完了し、作業時間は約5分程度に短縮されました。

 以上の結果から、Nano Bananaは補正精度と作業効率の両面において従来手法を上回る可能性があり、特に大量処理や迅速な対応が求められる業務において有効な手段であると考えられます。

人物レタッチ

 Nano Bananaでは、人物写真に対して細部を自然に補正する人物レタッチも可能です。

 当社の画像補正業務においては、髪の乱れや肌の質感調整など、細かなレタッチ作業を行うケースがありますが、Nano Bananaを用いることで、専門的な操作を行わずに自然な補正を実現できることが確認されました。

風で浮いた髪を抑える

しわやほうれい線を軽減

 いずれのケースにおいても、人物の個性や質感を損なうことなく、違和感の少ない仕上がりが確認されました。
 一方で、細部まで厳密なコントロールが求められる案件においては、従来通り専用ツールによる調整が必要となる場合もありますが、一般的な用途においては、効率的な人物補正手段として活用可能な技術であると考えられます。

拡張描画

 Nano Bananaでは、既存画像の外側を自然に描き足し、構図を拡張する拡張描画が可能です。

 組版やレイアウト設計においては、「もう少し余白が欲しい」「画像比率を変更したい」といった要望が発生することがありますが、追加素材を用意できない場合も少なくありません。そのようなケースにおいて、Nano Bananaは有効な手段となります。

ズームアウトして天地左右を拡張

縦長画像から横長画像に変更

 いずれのケースにおいても、元画像との連続性を保ちながら自然に描画が拡張されており、大きな構図の破綻も見られませんでした。

 一方で、細部まで厳密な再現性が求められる案件では慎重な確認が必要となりますが、一般的な制作業務においては、素材不足を補う有効な手段として活用可能であると考えられます。

ライティング補正(明暗の調整)

 Nano Bananaでは、画像内の明暗バランスを調整し、被写体を見やすく補正するライティング補正が可能です。

強い影がかかっている人物画像に対し、陰影部分を明るく補正

 従来の画像補正においては、露出やシャドウ調整を手動で行う必要があり、部分ごとの調整には一定のスキルが求められますが、Nano Bananaでは意図を指示するだけで適切な補正が自動的に行われる点が特徴です。

 このことから、逆光や影の影響を受けた写真の補正、人物の視認性を高める用途において、効率的かつ実用的な補正手段として活用可能であると考えられます。

さいごに

 本検証を通じて、Nano Bananaは単なる画像生成AIではなく、画像生成・編集の両面において高い実用性を持つ技術であることが確認できました。

 画像生成や画像編集そのものは、これまでも様々なAIツールで実現されてきましたが、Nano Bananaは特に、正確性の高さと破綻しにくい安定性の面で優れており、従来よりも実務に近い水準で活用できる可能性があると感じられました。

 特に、部分補正不要物削除人物レタッチ拡張描画ライティング補正といった比較的シンプルな画像補正作業においては、専門的な操作を必要とせず、短時間で一定品質の結果が得られる点は大きな利点です。

 一方で、元画像との厳密な一致やミリ単位の精度が求められる案件においては、依然として従来の専用ツールや手作業による調整が必要です。そのため、すべての業務を直ちに置き換えるものではなく、用途に応じて使い分けることが重要であると考えられます。

 しかし、ある程度の調整が許容される制作物や、スピードが求められる補正作業においては、Nano Bananaは当社業務の中でも部分的に十分活用可能な技術であると考えられました。

関連記事

記事一覧

コメント

この記事へのコメントはありません。

TOP
CLOSE