
ファイル参照機能を活用するためのコツ
生成AIを最大限に活用するためのTIPSをお届けします!今回はMaison AIの「ファイル参照機能」に焦点をあて、その効果的な使い方と実践方法について解説します。この機能を正しく理解し使いこなせば、より高精度な情報を得られるだけでなく、業務の効率化にもつながります。
Apr 7, 2025
プロンプト必要な基本要素を理解し、プロンプトに盛り込もう
プロンプトとは、生成AIに対して「どのような画像を生成してほしいか」を具体的に指示するテキスト入力です。適切なプロンプトが書かれていないと、AIは意図を正確に把握できず、期待通りの画像が生成されません。しかし、適切なプロンプトを作成すれば、AIはあなたのアイデアをより相応しく視覚的に表現できます。
そのためには、「被写体」、「視点や構図」、「画風や描写」の3つの基本要素を理解し、それらをプロンプトに盛り込むことが重要です。具体的かつ詳細な指示を与えることで、AIはあなたの意図を正確に読み取り、理想的な画像を生成することが可能になります。
プロンプトの基本要素
1. 被写体
2. 視点や構図
3. 画風や描写
ファイル参照機能とは
Maison AIでは、ファイル参照機能を使って、プロンプトと一緒に様々な形式のファイルをアップロードし、AIに内容を参照させることができます。 これにより、例えば、ドキュメントファイルの要約やエクセルファイルのデータ分析など、従来のプロンプト入力だけでは難しかった作業も簡単に指示できるようになります。
プロンプトを工夫して上手に活用しよう
ファイル参照機能は、アイデア次第で活用の幅が大きく広がります。 しかし、その可能性を最大限に引き出すためには、ファイルと一緒に送信するプロンプトの書き方が重要になります。 プロンプトの書き方が誤っていたり、不十分な場合、ファイル参照機能がうまく機能せず、期待した結果を得られない可能性があります。 プロンプトを工夫することで、より的確で質の高いアウトプットを引き出すことができます。

少し極端な例ですが、画像の中身を説明してもらいたい時にただ「教えて」とだけ送ります。
そうすると、画像の説明をしないばかりか、「この画像に関しての具体的な情報を認識することはできません。」となります。
これは、ファイル参照機能自体がうまく動作していないように見受けられます。
プロンプトによるファイル参照エラーの例


上の写真では、画像をアップロードし「何が写っているか説明してください」と指示すると、サイバーパンク風の女性や衣装のディテールなどを正確に述べました。
一方で、同じ画像を「教えて」とだけ送ると、「具体的な情報を認識できませんでした」との回答に。
ほんの少しの言い回しの違いが、AIの反応を大きく変える可能性があります。

そこでどの程度のプロンプト精度が必要なのかを検証します。
今回の検証では画像ファイルと同時に3種類の精度の異なるプロンプトを送信し、ファイル参照機能に差異が出るのかを調べます。
調査
Maison AIのファイル参照機能におけるプロンプトの精度が、ファイル内容の読み取り結果にどう影響するかを検証しました。その際、次のような手順と条件で実験を実施しました。
1. AIモデル4種類 と 精度別プロンプト3種類 を用意
各プロンプトは画像内容の説明を依頼するものとし、具体性の違いによって以下の3つに分類しました。
1. GPT 4o
2. GPT 4o-mini
3. Gemini 1.5 Pro
4. Gemini 1.5 Flash
高精度プロンプト: 「何が映っているか説明してください。」
中精度プロンプト: 「これは何ですか。」
低精度プロンプト: 「教えて。」
AIモデル4種類 × 精度別プロンプト3種類 = 12組み合わせをすべて検証。各組み合わせについて、3回ずつ繰り返しテストを実施しました。
右の表が調査結果です。
評価項目としてはざっくり、
・一回のやり取りで画像の説明をしてくれるか。
・ファイルの内容が正しく読み取られるか。
をポイントとしています。
このテスト結果から、高精度と中精度のプロンプトはどのモデルでも大きな差異はなく安定した出力を行ったのがわかります。
それに対し、低精度のプロンプトではモデルごとに違いがあることがわかりました。
特にGeminiシリーズはファイルを読み取れないこともあり、プロンプトの重要性が伺えます。
下の表が調査結果です。
評価項目としてはざっくり、
・一回のやり取りで画像の説明をしてくれるか。
・ファイルの内容が正しく読み取られるか。
をポイントとしています。
このテスト結果から、高精度と中精度のプロンプトはどのモデルでも大きな差異はなく安定した出力を行ったのがわかります。
それに対し、低精度のプロンプトではモデルごとに違いがあることがわかりました。
特にGeminiシリーズはファイルを読み取れないこともあり、プロンプトの重要性が伺えます。
調査結果

【表の見方】
✅=一回のやり取りで画像内の説明をしてくれた
🟥=画像ファイルを読み取れなかった
⬜︎=一回で画像の説明はしなかったが、ファイルは読み取れた。
精度の低いプロンプトだと、AIの機能を充分に発揮できない場合がある。
普段から高精度プロンプトを書けるように意識しよう。

高精度プロンプトを使おう
今回の調査結果から、精度の低いプロンプトだとAIの機能がうまく活用しきれないということがわかりました。
AIに要求通りの仕事をしてもらうためのプロンプトには「何を」「どのように」して欲しいか、の情報が不可欠です。また、冗長であったり、曖昧でわかりにくい文章ではなく、端的に簡潔にプロンプトを書くこともポイントです。
日頃から、このようなプロンプトを書くように意識することで、AIを使いこなす力も身につきます。ぜひ高精度プロンプトを習得して日々のAI利用に活用ください!




高精度、中精度のプロンプトであれば、どのモデルでも問題なく要求した出力を行う。
低精度のプロンプトではモデルごとに差異はあるが、要求通りの出力ができない場合が多い。
日頃から高精度のプロンプトを使う癖をつけて、よりAIを活用していきましょう!

OpenFashion インターン
佐々木 みれ
国際ファッション専門職大学/ファッションクリエイション学科在学
2年生の夏からインターンを始める。最新のファッションテックと伝統的な繊維産業に関心があり勉強中。