「結局、営業はどのAIを使えばいいのか」——この問いに、もう一つの最強モデルを探すかたちで答えるのはやめたほうがいい。2026年6月、Claude Opus 4.8、GPT-5.5、Gemini 3.1 Proという主要3モデルが出揃ったいま、現場で成果を出しているチームの答えはシンプルだ。仕事ごとに最適なモデルへ振り分ける。これを使い分け、あるいはマルチモデル・ルーティングと呼ぶ。
結論を先に置く。営業の武器としてのAIは、一本に絞った瞬間に弱くなる。提案ロジックを練るときと、大量のメール草案を量産するときでは、求める性能もコストも違うからだ。本記事では、3モデルの素の実力を整理したうえで、営業タスクごとにどのモデルへ振り分けるべきかを対応表で示す。読み終えたとき、あなたの手元には特定モデルの一時的な順位ではなく、半年後も使える判断軸が残る。
まず押さえる:3モデルの素の実力
性能の話から入る。ただし、営業はコードを書かない。だから以下のベンチマーク数値は「複雑な仕事を、どれだけ正確に、どれだけ自律的にこなせるかの目安」と読み替えてほしい。数値そのものより、各モデルの得意分野の輪郭をつかむことが目的だ。
| 項目 | Claude Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|
| 公開 | 2026年5月28日 | 2026年(同時期) | 2026年(同時期) |
| 料金(入力/出力・100万トークン) | $5 / $25(約795円 / 約3,975円) | $5 / $30(約795円 / 約4,770円) | 定性評価のみ |
| 文脈長 | 最大100万トークン | 大規模 | 大規模 |
| 際立つ強み | 正直さ・長文処理・自律作業 | ターミナル系作業 | マルチモーダル・Google連携 |
Claude Opus 4.8の核心は「正直さ」にある。自らが書いたコードの欠陥を見逃す割合が、前世代比でおよそ4分の1まで下がった。営業に翻訳すれば、提案書のロジックの穴やコンプライアンス上の危うい表現を、見栄えよく取り繕わずに指摘してくれる性質だ。長く複雑な作業を任せたときの信頼性で優位に立つ。
数値でも傾向は一致する。複雑な課題を自律的に解くSWE-bench Proでは、Opus 4.8が69.2%、GPT-5.5が58.6%。PC操作を伴うタスクのOSWorld-Verifiedでも83.4%対78.7%でOpusが上回る。一方、ターミナル中心の作業を測るTerminal-Bench 2.1ではGPT-5.5が78.2%、Claudeが74.6%でGPT-5.5が逆転する。要するに、込み入った長丁場の作業はOpus、特定の手順を素早くさばく作業はGPT-5.5に分がある、という棲み分けだ。
Gemini 3.1 Proについては、ここでは数値で語らない。代わりに性格を押さえる。画像・音声・文書をまたいで扱うマルチモーダル、そしてGoogle WorkspaceをはじめとするGoogleエコシステムとの連携、大規模な文脈処理が持ち味だ。スプレッドシートやスライドの中で完結させたい業務と相性がいい。
「最強1つ」がコストを壊す理由
ここで多くのチームがつまずく。最も賢いモデルを1つ選び、すべての業務をそこに流す。一見、合理的だ。しかし出力料金を見てほしい。Opus 4.8は出力$25(約3,975円)、GPT-5.5は$30(約4,770円)。いずれも100万トークンあたりだ。これらは賢い反面、単価が高い。なお本記事のドル換算は1ドル=約159円(2026年5月末時点)に基づくおおよその目安であり、実際のレートは変動する。
問題は、営業の日常業務の多くが「賢さを必要としない大量処理」だという点だ。定型メールの草案、問い合わせフォームの一次仕分け、リードリストの整理。こうした単純作業を高単価モデルに流せば、コストは静かに膨らむ。逆に、提案ロジックの構築のような頭脳労働を安価なモデルに任せれば、品質が落ちる。
だからプロは振り分ける。複雑な分析と信頼性が要る仕事はOpus 4.8へ、ターミナル的な定型処理やトークン量がかさむ作業はGPT-5.5へ、大量かつ単純な作業はより安価で高速なモデルへ。この使い分けによって、単一モデル運用と比べてコストを30〜50%削減できるとされる。賢さを、必要なところにだけ集中投下する考え方だ。
なお、料金には文脈の長さも効く。Opus 4.8は最大100万トークンの長文を扱え、約27万トークンを超える長いセッションでは定額的に料金が効いてくるため、規模が大きくなるほど割安になる場面がある。長尺の資料をまとめて読ませる用途では、この特性が効く。
記事の山場:営業タスク別・推奨モデル対応表
ここからが本題だ。性能比較を、明日の業務の言葉に翻訳する。下表を、自分のチームのタスクリストと照らし合わせてほしい。
| 営業タスク | 推奨モデル | 理由 |
|---|---|---|
| 提案ロジックの構築・競合分析 | Claude Opus 4.8 | 論理の穴を正直に指摘。長文の文脈を保持 |
| コンプライアンス表現のチェック | Claude Opus 4.8 | 危うい表現を取り繕わず指摘する正直さ |
| 長尺RFPの読み込み・要点抽出 | Claude Opus 4.8 | 最大100万トークンの長文処理 |
| 半年ぶんの議事録の通読・傾向分析 | Claude Opus 4.8 | 大量の文脈をまとめて扱える |
| 大量メール草案の量産 | より安価/高速なモデル | 量とコスト重視。賢さは過剰 |
| リードの一次仕分け | より安価/高速なモデル | 単純判断の繰り返しに最適 |
| Google Workspace上の資料作成 | Gemini 3.1 Pro | スライド・スプレッドシートとの連携 |
| 画像・図表を含む資料の読み取り | Gemini 3.1 Pro | マルチモーダルの強み |
読み解きの軸は二つだ。一つ目は「正直さと長文がいるか」。提案や競合分析、コンプラ確認のように、間違いを取り繕われると致命傷になる仕事はOpus 4.8に寄せる。二つ目は「量とコストが主役か」。メール草案やリード仕分けのように、賢さより回転数が効く仕事は安価なモデルへ流す。そしてGoogleの世界で完結させたい業務はGeminiに任せる。この三分割が、使い分けの骨格になる。
コピペで使える:マルチモデル振り分けプロンプト
使い分けの考え方は分かった。では、目の前のタスクをどのモデルに振るべきか迷ったとき、どう判断するか。以下のプロンプトを、判断に使っているAI(どれでもよい)に貼って相談するとよい。
あなたは営業チームのAI活用アドバイザーだ。
これから渡す営業タスクを、以下の3つの振り分け先のどれに流すべきか判定してほしい。
【振り分け先】
A. 高性能モデル(複雑な分析・正直さ・長文が必要なとき)
B. 安価・高速モデル(量が多く、単純な処理のとき)
C. エコシステム連携モデル(Google Workspace等の中で資料を作るとき)
【判定ルール】
- 間違いが許されない/論理の正しさが成果を左右する → A
- 同じ作業を大量に繰り返す/コストを抑えたい → B
- スプレッドシートやスライドの中で完結させたい → C
【出力形式】
1. 推奨振り分け先(A/B/C)
2. 理由(1文)
3. そのモデルへ渡すときの注意点(機密情報の有無など)
それでは、次のタスクを判定してほしい:
「(ここに自分の営業タスクを書く。例:競合3社と自社の提案書を比較し、勝ち筋を整理する)」
このプロンプトの狙いは、最強モデル探しという発想から、タスク起点の判断へ思考を切り替えることにある。一度この型で考える癖がつけば、新しいモデルが出ても慌てずに棚卸しできる。
羅針盤としての注意点
最後に、航海士として二つ釘を刺しておく。
一つは、数値の賞味期限だ。本記事のベンチマークや料金は2026年5月時点のもので、モデルは数か月単位で更新される。半年後には順位が入れ替わっているかもしれない。だからこそ、固有の数値を暗記するのではなく、使い分けの考え方そのものを持つことが効く。考え方は陳腐化しない。
もう一つは、機密データの扱いだ。顧客情報や契約内容といった機密を渡す前に、各社の利用範囲とデータ取り扱いポリシーを必ず確認すること。便利さに引きずられて、入れてはいけない情報を入れてしまう事故が最も怖い。振り分けプロンプトの出力に「機密情報の有無」を含めたのは、この一手間を習慣化するためだ。
Next Action
明日から動くために、まず一つだけやってほしい。自チームの営業タスクを10個書き出し、本記事の対応表に従ってA(高性能)・B(安価高速)・C(連携)の3つに仕分けてみることだ。
仕分けが終わったら、最も件数の多いカテゴリから着手する。多くのチームでは、メール草案やリード仕分けといったBの作業が最多になるはずだ。そこを安価なモデルに寄せるだけで、コスト削減の効果が最初に見える。次に、提案ロジックや競合分析というAの中核業務を高性能モデルに集約し、品質を底上げする。最強の1つを探すのではなく、タスクごとに最適へ振り分ける。その第一歩は、紙とペンでのタスクの棚卸しから始まる。


コメント