2025年5月14日

アップデート1.44：Google最新AI「gemini-2.5-pro-preview-05-06」「gemini-2.0-flash-preview-image-generation」搭載！チャットでの画像生成や高度な文章処理が可能に

アップデート項目

2025/5/14のアップデート内容を紹介します。

Google Geminiよりマルチモーダル対応最新モデルを2種追加しました。AIチャットを通じた画像生成や、より高度な長文テキストの理解・生成が可能となり、皆様のクリエイティブな活動や業務効率化をさらにサポートできるようになります。

また、従来は”AIチャット”と”AIデザイン”の画面を行き来が必要でしたが、「チャット画像生成：Gemini-2.0-flash」を選択いただくと”AIチャット”で画像生成まですべて完結することができます。

今回追加されたテキスト生成モデル

モデル名	Maison AI 表記モデル名
gemini-2.0-flash-preview-image-generation	チャット画像生成：Gemini-2.0-flash
gemini-2.5-pro-preview-05-06	高性能：Gemini-2.5-pro

※以下、Maison AI表記モデル名で表示させていただきます。

追加された新モデルのご紹介

今回追加された2つの「Gemini」モデルは、それぞれ特徴が異なります。

◼︎チャット画像生成：Gemini-2.0-flash

特徴: Googleの高速かつ高性能なマルチモーダル生成モデルです。テキスト指示に基づき、MaisonAIの[AIチャット]機能内で画像を生成することができます。優れた速度で、創造性豊かな画像やテキストを生み出します。

◼︎高性能：Gemini-2.5-pro

特徴: Googleの思考と推論能力が強化された最上位モデルの一つです。マルチモーダルな理解（※MaisonAIでは現在テキスト入力に対応）、高度なコーディング、そして特に長大なテキストデータ（最大約500,000文字）の処理能力に優れています。MaisonAI搭載の他モデルと比較しても高いAI性能と高速な処理速度を誇ります。（2025年5月14日時点、Artificial Analysis.aiのデータに基づく）

Maison AI

表記モデル名

特徴

外部参照

ファイル解析

画像解析

出力

速度

精度

コスト

文字数

チャット画像生成：Gemini -2.0-flash

Googleのマルチモーダル生成モデル（試験運用版）。優れた速度で高度にテキストや画像を生成できるモデル。

◯

テキスト/画像

中速

中

低

500,000文字

高性能：Gemini-2.5-pro

Googleの思考と推論の強化モデル。マルチモーダル理解、高度なコーディングなど。

◯

テキスト

高速

最高

高

500,000文字

※現在、Maison AIでは音声ファイル、画像ファイルは利用できません。

AIモデル指数比較　

（2025年5月14日時点、Artificial Analysis.aiのデータに基づく）

グラフ引用元：Artificial Analysis.ai

マルチモーダルとは

異なる種類のデータや情報（例えば、テキスト、画像、音声など）を組み合わせて処理する方法です。これにより、より豊かな理解や表現が可能になります。

項目	マルチモーダル	シングルモーダル
扱う情報の種類	複数の種類 (例: 文字＋画像、文字＋音声、画像＋音声など) ※現在、Maison AIでは音声は対応しておりません	1つの種類 (例: 文字だけ、画像だけ、音声だけ)
情報の扱い方	複数の情報を組み合わせて、一緒に理解	単一の入力に基づいた学習・推論
例えるなら	目で見たり、耳で聞いたり、同時に状況を理解する人間	文字だけを読む、音だけを聞くなど、特定の機能に特化した装置
AIでの具体例	・写真の内容を言葉で説明・声で画像生成を指示・動画の内容を要約	・文章を翻訳・写真から物体を検出・音声を文字起こし
身近な技術/製品例	・最新AIチャットボット (画像/音声入力対応) ・スマートスピーカー・動画の自動字幕	・従来のテキスト検索エンジン・音楽再生アプリ・シンプルな画像編集ソフト

チャット画像生成：Gemini-2.0-flash ユースケース

コーディネート変更

チャットで相談しながらそのまま画像を生成し、その後も続けて部分的に変更を加えることが可能です。

下記のタイプの職種の方にはとても相性が良いモデルです。

アイデアをすぐに形にしたいクリエイター
直感的な操作で気軽に画像生成を試してみたいAI初心者
素材を早く用意したいSNS担当者

※こちらのモデルは、AIエージェント、AIテンプレートでの動作が不安定となります。AIチャットでの利用をお勧めします。

ユースケース紹介

ユースケース	説明
マルチアングル	モチーフやデザインを維持したまま、特定の方向だけでなく、背面や横向きの視点からのマルチアングル画像を生成できます。
フィッティング	画像内の特定のアイテムを指定し、他のアイテムに置き換えた画像を生成することができます。
カラー変更	画像内の特定のアイテムを指定し、異なるカラーに変更した画像を生成できます。
テキスタイル変更	画像内の特定のアイテムを指定し、異なるパターンに変更した画像を生成できます。
背景変更	モデルや衣装はそのままに、背景だけを変更することができます。
絵型作成	画像内のアイテムの絵型を生成することができます。

高性能：Gemini-2.5-pro 活用シーン

広大なコンテキストウィンドウ（一度に処理できる情報量）と高度な推論能力が魅力です。精度を重視するタスクに最適です。

大量ドキュメントの読解・要約: 数百ページに及ぶ報告書や論文、契約書などをアップロード（テキストとして入力）し、その要点や分析結果を瞬時に把握できます。
複雑な質疑応答: 自然言語処理精度の理解が飛躍的に向上し、専門知識が必要な質問や、複数の情報を組み合わせないと回答できないような複雑な問いに対しても、的確な回答を導き出します。
高品質なコンテンツ生成: ブログ記事、レポート、企画書など、長文かつ論理的な構成が求められる文章作成を強力にサポートします。こちらのアップデート情報もGemini 2.5 Pro で添削しています。

使い方

[アカウント設定]から[テキスト生成モデル] から利用されたいモデルを選択して[変更]を押してください。
「チャット画像生成:Gemini-2.0-flash」は画像生成が可能ですが、チャットをしながら画像生成を行うマルチモーダルタイプのため、「AIチャット」から利用してください。履歴もAIデザインではなく「テキスト」から確認することができます。