「最新のGemini 3.1 Pro、結局どうなの?」
SNSでは「Claudeを超えた!」「いや、まだ微妙…」と様々な意見が飛び交っていますが、AI初心者にとっては「で、結局どれを使えばいいの?」というのが本音ではないでしょうか。
この記事では、そんなあなたの疑問に答えるため、実際の操作画面をふんだんに使って、Gemini 3.1 Proの実力を徹底的にレビューします。難しいベンチマークの話は一切なし。この記事を読めば、あなたが本当にGemini 3.1 Proを使うべきかどうかが分かります。
この記事で分かること
- ✅ Gemini 3.1 Proの「賢さ」はどれくらい進化したのか
- ✅ 嘘をつかなくなった?最新情報の回答精度
- ✅ PowerPoint資料作成やWebアプリ開発は得意?苦手?
- ✅ 現状、ClaudeやChatGPTと比べてどちらが優れているのか
目次
- 検証1:本当に賢くなった?「ウェブグラウンディング性能」
- 検証2:自分のことを理解してる?「自己認識能力」
- 検証3:資料作成能力を比較!「PowerPoint生成」
- 検証4:Webアプリ開発能力を比較!「GASコード生成」
- 結論:結局Gemini 3.1 Proは「買い」なのか?
検証1:本当に賢くなった?「ウェブグラウンディング性能」
AIがインターネット上の最新情報を正確に参照して回答する能力を「Webグラウンディング」と呼びます。従来のGeminiは、この能力が弱く、事実と異なる情報(ハルシネーション)を答えることがありました。Gemini 3.1 Proで、この弱点は克服されたのでしょうか。
意地悪な「ひっかけ問題」でテスト!
存在しない「GPT-5.3」というモデルについて、あえて質問を投げかけてみました。これは、AIが情報の真偽を正しく判断できるかを試すテストです。
ChatGPTのGPT-5.3の評判はどうですか?

▲ 存在しないモデル「GPT-5.3」について質問を投げかける
するとGemini 3.1 Proは、よく似た名前の「GPT-5.3-Codex」という実在する開発者向けモデルについての情報だと正しく解釈し、その評判をまとめてくれました。これは、従来のモデルでは見られなかった驚くべき精度です。
さらに、「GPT-5.3は?」と追加で質問すると、「コーディング特化ではない汎用型のGPT-5.3のことですね。それはまだ出ていません」と、ユーザーの意図を正確に汲み取り、明確に回答してくれました。

▲ ユーザーの意図を正確に理解し、汎用モデルは存在しないと回答
💡 ポイント
Gemini 3.1 Proは、Web上の情報を正確に参照し、嘘や間違いの少ない回答ができるように大きく進化しました。リサーチや情報収集の精度が格段に向上したと言えるでしょう。
検証2:自分のことを理解してる?「自己認識能力」
次に、Gemini自身に関する質問をしてみました。AIが自分に搭載されている機能や、関連する技術について正しく答えられるかは、信頼性を測る上で重要な指標です。
1. 画像生成モデル「Nano Banana Pro」について
Geminiに搭載されている画像生成モデル「Nano Banana Pro」について質問したところ、「私(Gemini)が画像生成や画像編集を行うために搭載している最新鋭の画像生成モデルです」と、明確かつ正確に回答しました。以前のモデルでは、自社の機能についてさえ正しく答えられないことがあったため、これも大きな進歩です。

▲ 自身に搭載された画像生成モデルについて正確に説明
2. APIで利用可能な最新モデルについて
開発者がプログラムを通じてGeminiの機能を利用する際に使う「API」。このAPIで使える最新モデルを尋ねたところ、これも「Gemini 3」シリーズであると正しく回答しました。以前は古いモデル名を答えてしまい、開発者が混乱する原因となっていましたが、この問題も解決されています。

▲ 開発者向けの情報も、最新かつ正確に回答できるようになった
💡 ポイント
Gemini 3.1 Proは、自身の機能や関連情報に関する質問にも正確に答えられるようになりました。これにより、開発者や、より専門的な使い方をしたいユーザーにとっても信頼できるツールに進化したと言えます。
検証3:資料作成能力を比較!「PowerPoint生成」
ビジネスシーンで多用されるPowerPoint資料の作成能力を、ライバルであるClaude Opus 4.6と比較検証しました。同じ決算書のPDFファイルを渡し、どちらがより「プロレベル」のスライドを作成できるかを競います。
Claude Opus 4.6の作品
まず、Claudeが作成したスライドがこちらです。ネイビーとティールを基調とした統一感のあるデザインで、グラフや図を効果的に使い、情報を視覚的に分かりやすくまとめています。正直、人間が数日かけて作るレベルのクオリティです。

▲ グラフやアイコンを多用した、非常にデザイン性の高いスライド

▲ データの比較表や棒グラフも自動で生成
Gemini 3.1 Proの作品
一方、同じ指示でGemini 3.1 Proが作成したスライドがこちら。白を基調としたシンプルなデザインで、要点はまとまっていますが、Claudeと比較するとかなりあっさりした印象です。デザイン性や情報の視覚化という点では、物足りなさを感じます。

▲ 白背景でテキストが中心のシンプルなスライド


💡 ポイント
デザイン性の高い、いわゆる「おしゃれな」資料作成においては、現状Claude Opus 4.6に軍配が上がるようです。Geminiは情報をまとめるのは得意ですが、それを視覚的に魅力ある形に仕上げる能力はまだ発展途上と言えるでしょう。
検証4:Webアプリ開発能力を比較!「GASコード生成」
Google Apps Script(GAS)を使い、簡単なWebアプリケーションを作成する能力も比較しました。GASは、GmailやスプレッドシートといったGoogleのサービスを自動化する際によく使われるプログラミング言語です。
1. 採用応募フォーム
まず、採用応募フォームの作成を依頼しました。
Claude(Sonnet 4.6)は、職種選択から基本情報、スキル、動機確認まで、複数のステップに分かれた本格的なフォームを生成。入力項目も豊富で、デザインもおしゃれです。驚くべきは、指示していない「希望給与」や「入社可能時期」といった項目まで「採用フォームなら必要だろう」と推測して追加してくれた点です。

▲ ステップ表示や豊富な入力項目を備えた、気が利くフォームを生成
一方、Gemini 3.1 Proが作成したのは、必要最低限の項目に絞られたシンプルなフォーム。デザインもクリーンですが、Claudeのような「気の利き方」は見られませんでした。

▲ 指示された内容を忠実に再現した、シンプルなフォーム
2. 社内リソース予約Bot
次に、会議室や社用車の予約ができるチャットBotの作成を依頼しました。
Claudeは、現在の空き状況を確認するためのクイックアクションボタンを配置するなど、ユーザーが使いやすいような工夫が見られるUIを設計しました。

▲ ユーザーの次のアクションを予測したボタンが配置されている
Geminiも同様のBotを作成できましたが、Claudeのようなサジェスト機能はなく、よりシンプルなチャット画面となりました。

▲ 使い方の一例は示すものの、シンプルなインターフェース
💡 ポイント
Webアプリ開発においても、Claudeの方が「気が利く」提案をしてくれる傾向にあります。Geminiは指示に忠実なコードを生成しますが、Claudeはユーザーの最終的な目的を理解し、より良い体験のための機能を追加してくれることがあります。
結論:結局Gemini 3.1 Proは「買い」なのか? {#結論}
今回の検証結果をまとめます。
| 機能 | Gemini 3.1 Pro | Claude 4.6(Opus & Sonnet) | 勝者 |
|---|---|---|---|
| 最新情報の精度 | ◎ | ○ | Gemini |
| 自己認識能力 | ◎ | ○ | Gemini |
| PowerPoint作成 | ○ | ◎ | Claude |
| Webアプリ開発 | ○ | ◎ | Claude |
Gemini 3.1 Proは、リサーチや情報収集といった「正確性」が求められるタスクにおいて、目覚ましい進化を遂げました。 以前のように嘘をつくことが減り、信頼できるアシスタントになったと言えます。Google Workspaceを契約しており、追加料金なしで使える方にとっては、非常に強力なツールになるでしょう。
一方で、資料作成やアプリ開発といった「創造性」や「提案力」が求められるタスクでは、まだClaudeに一日の長があります。
最終的には、ベンチマークの数字に惑わされず、あなたが何をしたいのかによって使い分けるのが最適です。ぜひご自身の目で、その実力を試してみてください。
📌 この記事が役に立ったら
ぜひ実際にGemini 3.1 Proを試してみてください。使ってみた感想や、他にも比較してほしいことがあれば、コメントで教えていただけると嬉しいです!

コメント