まもなく終わろうとしている2025年は、「AI推論元年」と呼ばれています。
代表的なAI業界レポート「State of AI Report 2025」では、「2025年は推論が現実になった年(the year reasoning got real)」と明言しています。従来のように膨大なデータから「もっともらしい答え」を生成するAIではなく、人間のように考える「推論型AI」が本格的に登場しているのです。
この記事では、推論型AIの中核能力のひとつである「AI多段階推論」に注目します。AI多段階推論が注目されている背景や、コンタクトセンター運営への貢献について解説しますので、ぜひご参考ください。
海外の最新コールセンターシステムやデジタル・コミュニケーションツールを、19年間にわたり日本市場へローカライズしてきた株式会社コミュニケーション・ビジネス・アヴェニューが解説します。
【この記事が解決するお悩み】
- 2026年に向けて、AIトレンドの最前線をキャッチしておきたい
- 今後のコンタクトセンターにおけるAI活用の展望を知りたい
- コンタクトセンターにおけるAIのコストやセキュリティ、専門性などを再検討している
日本政府が注目するソブリンAIとは|海外の最新動向と「オンプレ前提ではない」本... - TPIJ by CBA |
AI多段階推論とは
多段階推論とは、一つのAIモデルが一度に全てを処理するのではなく、複数のステップに分けて段階的に推論を行う方法のことです。
現在は、主に2つの意味で使われています。
1. 複数のLLMを内容・目的・用途に合わせて使い分ける手法
例: 第1段階 → 情報抽出/第2段階 → 要約/第3段階 → 意図推定/第4段階 → 最終回答生成
2. 1つの処理を複数回のLLM推論で実施する手法
例: 1回目 → 問題の構造化/2回目 → 解決プロセスの生成/3回目 → 出力内容の検証
いずれの場合も、「AIが一度の推論で完結しない」という点が共通しています。
AIが変えた2025年のCX:導入から再設計へ―2026年を読み解く5つのキーワード - TPIJ by CBA |
AI多段階推論が注目される背景
AI多段階推論が注目されている背景には、いくつかの理由があります。ここでは、AIの発展に伴い近年顕在化してきたニーズに焦点を当てて見ていきます。
LLMの巨大化と、SLMによる軽量化への移行ニーズ
これまでは、「LLM(大規模言語モデル)の大規模化」がAIの発展と密接に関係していて、「大きいモデルほど性能が高い」といった流れで開発競争が進んできました。しかし近年、LLMの大規模化に伴い、開発・学習コストの増大や、モデルサイズに対する性能向上の頭打ちといった課題が顕在化しています。
大規模モデルのトレーニングには、膨大なGPUリソースと電力が必要です。その結果、オンプレミスでの運用は現実的ではなく、クラウド利用が前提となるケースは珍しくありません。こうした状況は、とくにセキュリティやデータ主権が重視される医療・金融業界において、導入ハードルを引き上げる要因にもなっています。
一方で、多大なコストをかけてモデルを一回り大きくしても、達成できる性能向上は数%程度にとどまる…いわゆる「スケーリングのジレンマ」も指摘されています。
こうした背景のもとで注目を集めているのが、「SLM(小規模言語モデル)」です。Hugging Faceコミュニティにおけるモデルのダウンロード動向によれば、LLMよりもSLMの人気の方が高い傾向がうかがえます。
SLMの特長は、LLMと比べた軽量性・コストの低さ・高いカスタマイズ性にあります。SLMはパラメータが少ないため計算資源を大幅に削減でき、メモリやストレージの容量を抑えられます。その結果、リアルタイム性の求められる業務や、オンデバイスAIとしての活用に適しています。
また、軽量化されているがゆえに、業界特有のニーズに特化したチューニングをしやすく、企業ごとあるいは業務ごとの用途に最適化されたAIを構築しやすいという点も利点です。
このような流れを背景に、近年では「LLM単体で完結させる推論」だけでなく、複数のSLMやLLMを役割ごとに組み合わせる多段階推論という考え方が注目されるようになっているのです。
情報抽出や分類・整理、判断・要約といったそれぞれの工程に適したモデルを組み合わせて使い分けることで、精度・安定性・コスト・セキュリティのバランスを取っていくというアプローチです。
コンタクトセンターを例に考えると…
人手不足が続くコンタクトセンターでは、問い合わせ内容の複雑化・多様化が進んでいます。その上、AIに期待する役割が各問い合わせ要件や目的によって異なるため、単一のAIモデルによる一括処理では十分な効果を発揮できないケースも少なくありません。
だからこそ、処理を段階的に分け、適切なモデルの組み合わせも含む「AI多段階推論」はチェックしておくべき手法と言えるのです。
AI多段階推論の最新動向
最新の音声認識エンジン「AmiVoice Communication Suite」には、「AI多段階推論」機能が搭載されています。最近追加されたこの機能は、通話内容に応じて複数の生成AIを使い分け、段階的に処理を行っていくものです。
具体的には、第1段階の生成AIが通話内容を「住所変更」や「カード紛失」といったカテゴリに分類し、第2段階の生成AIが各カテゴリに最適化されたプロンプトを用いて要約を生成します。
この多段階アプローチにより、生成AIによる処理精度の向上を実現しています。
▶複数LLMを使い分けられる企業向けAIプラットフォーム「GIDR.ai(ガイダーエーアイ)」
AIガバナンスで想定するべき4大リスクとその対策 - TPIJ by CBA |
AI多段階推論の4つのメリット
では、AI多段階推論を採用することで、具体的にどのようなメリットが得られるのでしょうか。とくにコンタクトセンターのような実運用の現場を想定すると、その効果はより明確になります。
ハルシネーションや推論ミスの抑制
多段階推論においては、たとえば1段目の生成AIが出力した結果を、2段階目の生成AIで内容の整合性や妥当性について検証・補完するといった使い方が可能です。
また、各段階のプロンプトをシンプルに保てるので、複雑なプロンプト設計による推論ミスを誘発しにくい点もメリットです。
各問い合わせへの柔軟な対応
コンタクトセンターでは、問い合わせの内容や目的が多岐にわたります。単純なFAQ対応もあれば、状況整理や応対履歴の参照が必要な複雑なケースもあります。
要約を重視するケースや、情報抽出を優先するべきケース、判断ロジックを重視するべきケースなど、問い合わせの種類に応じて処理フローを切り替えることが可能です。
運用コストの最適化
すべての処理を高性能なLLMで実行する必要はありません。多段階推論では、AIに実行させる処理の難易度や重要度に応じて、安価なSLMと高性能なLLMを使い分けることができます。
たとえば、一次的な分類や抽出はSLMで実行し、最終的な判断や要約のみを高性能モデルに任せるといった構成です。これにより、業務効率化と精度を維持しながら、運用コストを最適化していけます。
日本語対応していないモデルの活用
抽出や中間推論の段階では、ユーザーではなくAIがデータを理解できる出力があれば問題ありません。そのため、英語のみに対応しているLLMやSLMを、2段階目や3段階目の推論に組み込むことができます。
1回の推論で日本語出力まで実現しようとすると、利用できるモデルの選択肢は限られます。一方、多段階推論であれば、業務や用途に応じて最適なモデルを柔軟に設計できるのです。
ドロイドがオペレータの隣に座る日ー2025年、CX戦略を成功に導く「AI対応性」とは? - TPIJ by CBA |
AI多段階推論の課題と解決へのアプローチ
ここまでは非常に有用かつ理想的な多段階推論ですが、もちろん課題も存在します。
代表的なものが、「文脈の順序が乱れることで、回答の正確性が大きく損なわれる」という課題です。
この課題に対して有効とされているのが「Context Repetition(=CoRe)」という手法です。CoReは、同じ文脈を繰り返しモデルに提示することで、モデルが最適な情報順序を認識しやすくさせるというアプローチです。
CoReを発表したソウルの大学研究チームによれば、正しい順序が保証されていなかった多段階推論において、最大30%のF1スコア向上が確認されました。さらに、合成タスクでは精度が最大70%まで向上したと報告されています。
今後CoReの考え方がマルチモーダルAIへと適用されていけば、コンタクトセンターにおいてより安定性と信頼性の高いAI多段階推論が実現するかもしれません。
AI活用に課題を抱える日本企業―導入を阻む5つの神話と、現場・経営をつなぐ3つの... - TPIJ by CBA |
最後に
AI活用が本格化する中で、顧客接点であるコンタクトセンターに求められているのは、「より賢いAI」ではなく、今の業務にフィットし、安定して使い続けられるAIです。つまり、SLMを含めた「AI多段階推論」は、コンタクトセンターでの活用における一つの選択肢となり得るでしょう。
多段階推論もCoReも、まだ登場したばかりの手法ですが、これからの顧客接点をさらにレベルアップさせる可能性を秘めている手法です。2026年における発展を楽しみにしましょう。
