生成AIをはじめとするAIツールを顧客接点に組み込もうとすると、「コンテンツの構造化が大変」という問題にぶつかることがあります。とくにAIに読み込ませたいマニュアルコンテンツが大量にあるエンタープライズ企業は「コンテンツの構造化」をいかに効率よく行うかがAIを運用するカギとなります。

今回は、カスタマーサービスにおいてAIを活用する際に直面する「コンテンツの構造化」や「ハルシネーション」という課題について取り上げます。課題解決に役立つRAG技術についても解説するので参考にしてください。

海外の最新コールセンターシステムやデジタル・コミュニケーションツールを、17年間にわたり日本市場へローカライズしてきた株式会社コミュニケーション・ビジネス・アヴェニュー(CBA)が解説します。

カスタマーサービスに生成AIを導入する課題2つ

生成AIをカスタマーサービスで活用しようとすると、以下の2つの点が課題となります。

  • ハルシネーション
  • 大量のコンテンツの構造化

それぞれの課題について説明します。

ハルシネーション

ハルシネーションとは、AIが事実とは違う内容をもっともらしく回答する現象のことです。この現象の原因は、AIがネット上に存在する大量のデータで学習をした際に、間違った情報も学習してしまうことに起因します。

さらに、生成AIは特定の単語の次につながる確率が高い単語を予測して回答を生成していきます。正確な回答よりも、文脈に沿った回答を生成する傾向があるためにハルシネーションが起きてしまいがちです。

大量のコンテンツの構造化

お客さまに情報を提供するタッチポイントに生成AIを導入するには、企業が保有しているコンテンツをAIに学習させなければなりません。企業が保有しているコンテンツには以下のものが含まれます。

  • ユーザーマニュアル
  • 製品資料
  • ナレッジ資料

多くの場合、上記のコンテンツはPDFなどフォーマットで管理されていることでしょう。しかし、PDFのままではAIは学習できません。このAIが学習できない状態のデータのことを「非構造化データ」と呼びます。「非構造化データ」AIに学習させるには、HTML5やMarkdownのような「構造化データ」へ変換しなければなりません。

実は、「構造化データ」へ変換する作業がエンタープライズ企業であるほど課題となっています。なぜでしょうか。原因は3つあります。

  • コンテンツの量が膨大
  • コンテンツのフォーマットが多岐にわたる
  • 品質が低いコンテンツが含まれている

大きな企業であるほど扱う製品の数は増え、各製品に関連する資料の数は膨大となります。しかも同じ製品なのに、部署ごとに違った資料を作成し、保有している場合があります。

コンテンツのフォーマットにはPDF以外にも、画像、動画、音声などの種類があります。各フォーマットに適した構造化の方法やツールは違ってきます。フォーマットに合わせて構造化していく作業は膨大になります。

企業が保有するコンテンツには品質が低いものが含まれます。品質の低さというのは、不正確な情報や古い情報が含まれているというだけではありません。AIが学習するのに適していないという意味も含まれています。たとえば、不要な改行が多い、特殊文字が使われている、誤字脱字があるといったことです。コンテンツの内容をチェックし、品質を均一化する作業は大変です。

ハルシネーション対策としてRAG技術を活用しよう

カスタマーサービスで生成AIを活用する際に心配するのが「お客さまにウソの情報を伝えてしまう」という点です。どのようにハルシネーションを防げるのでしょうか。ハルシネーション対策として、RAG技術が注目されています

RAGとは

RAGとは、Retrieval Augmented Generationの略で、検索拡張生成という意味があります。特定のデータベースに保管されている情報を検索し、大規模言語モデル(LLM)に正確な回答を生成させる仕組みです。

たとえばRAG技術を活用すると、ハルシネーションが起きるようなネット上の情報に基づく一般的な回答をさせるのではなく、自社のデータベースにある製品情報だけを検索させ、企業としての正確な回答を生成させることができます

RAGと生成AIの違い

生成AIとは、学習済みのデータを活用して独自の回答を生成できるAI技術です。

RAG技術とは、特定のデータベースにアクセスして情報を検索することで、生成AIの回答の質を向上させていく技術となります。指定されたデータベースにある最新の情報を都度検索するため、正確な回答を生成できます。

コンテンツの構造化に「RAG搭載のAIプラットフォーム」を活用しよう

大企業にはさまざまな種類のマニュアルコンテンツが存在します。「大量のデータを構造化するのが大変」「多岐にわたるフォーマットを構造化するのが面倒」と感じるかもしれません。

RAG搭載のAIプラットフォームを活用することで、大量のコンテンツを構造化するという課題を解決できます。最新のAIプラットフォームには、どのような特徴があるのでしょうか。

一例として弊社が扱っている「GIDR AI(ガイダーエーアイ)」を使って説明していきます。

「GIDR AI(ガイダーエーアイ)」の特徴は5つあります。

  1. さまざまなフォーマットデータを構造化
  2. 精度の高い構造化
  3. セキュリティ重視のデータ運用
  4. 各種LLM・CRM・チャットボットと連携ができるプラットフォーム
  5. 幅広いユースケース

RAG搭載のAIプラットフォーム「GIDR AI(ガイダーエーアイ)」がオススメなのは、以下のような企業です。

  • 「活用したいデータの量と種類が多くて途方に暮れている企業」
  • 「データの構造化から顧客接点の部分までを丸投げしたいエンタープライズ企業」
  • 「ハルシネーションやセキュリティの心配がないドメインでLLM運用をしたい企業」
  • 「AI運用のための準備ではなく、カスタマーサクセスのための準備に注力したい企業」

では、5つの特徴について見ていきましょう。

1. さまざまなフォーマットデータを構造化

「GIDR AI(ガイダーエーアイ)」は、企業が保有するPDF、動画、WEBサイト、メール、音声認識データなどのコンテンツを構造化していけます。企業は自社が持っているコンテンツを提供するだけで、あとの面倒な構造化はシステムが実施していきます。

編集可能なPDFファイルだけではなく、スキャンされただけの画像タイプのPDFも構造化できます。これまで構造化するのが難しかった動画であっても、構造化していけます。

2. 精度の高い構造化

「GIDR AI(ガイダーエーアイ)」では、データの構造化という作業を全自動で行なうわけではありません。7割を自動化、3割は人間が介入して行なっていきます(※)。

人間によるチェックが入るので、精度の高い構造化が実現できます。システムと人間の作業フローが効率的なため、年間18万ページの構造化をすることが可能です。

※自動化と人間による作業の配分は扱うケースごとに異なります。

3. セキュリティ重視のデータ運用

構造化するコンテンツには個人情報が含まれることがあります。「GIDR AI(ガイダーエーアイ)」では、機密情報に関係する部分をマスキングをすることが可能です。

使用する大規模言語モデル(LLM)のドメインも制御できるため、セキュリティ管理がしやすいという特徴もあります。

セキュリティやコンプライアンスに配慮したプラットフォーム設計になっています。

4. 各種LLM・CRM・チャットボットと連携ができるプラットフォーム

「GIDR AI(ガイダーエーアイ)」は、APIでいろいろなLLM・CRM・チャットボットと連携が可能です。LLMにはさまざまな種類があります。

Azure Open AI、GCP Vertex AI、AWS Bedrockなど、それぞれの得意分野を持ったLLMを柔軟に選んで運用していけます。

5. 幅広いユースケース

RAG技術を活かした「GIDR AI(ガイダーエーアイ)」はカスタマーサービスだけでなく、幅広く活用していける製品です。

以下のようなユースケースがあります。

学習用の電子書籍

「GIDR AI(ガイダーエーアイ)」と連携している電子書籍を購入すると、効率的な学習を行えます。

読者が電子書籍に質問をすると、書籍内の情報をもとにAIが回答を生成して答えてくれます。逆にAIが質問をし、回答が間違っていると、ヒントを出して読者を正しい回答へと導いていきます。

学生向けの電子書籍で活用できるユースケースです。コールセンターの研修でも応用することができるでしょう。

SV・オペレーターのサポート

コールセンターシステムと「GIDR AI(ガイダーエーアイ)」を連携させることで、SVの業務サポートを効果的に行えます

たとえば、「GIDR AI(ガイダーエーアイ)」がオペレーターと顧客のすべての会話を聞き、内容を分析し、クレーム対応などSVのサポートが必要と判断すればポップアップで知らせてくれます。

オペレーターに対しては、会話を分析しながら、顧客対応に必要なナレッジを表示したり、役立つスクリプトを生成したりしてサポートしていきます。

「GIDR AI(ガイダーエーアイ)」に直接顧客対応させることも可能です。

RAG技術以外のコンテンツの処理方法とは

他にも大量のコンテンツを構造化する方法として、データパイプラインの活用があります。しかし、データパイプラインは基本的にデータ収集と統合がメインとなります。カスタマーサービスに必要なFAQやナレッジにまで、コンテンツを整備してくれるわけではありません。

「そもそもコンテンツを構造化しない」という方法もあります。Amazon KendraやAzure Cognitive Searchなどのクラウド検索サービスを活用する方法です。クラウド検索サービスには、データを非構造化のまま検索できるメリットがあります。しかし、コストの問題や、回答精度の検証が面倒といった課題があります。

大量のコンテンツデータを丸投げし、「コンテンツの構造化」から「顧客対応」までを一気通貫で実現できるのが、RAG搭載のAIプラットフォームの利点です。

最後に

エンタープライズ企業では「コンテンツの構造化が大変だ」と感じることがあるかもしれません。さらに、ハルシネーション対策も必要となってくるでしょう。RAG技術を搭載したAIプラットフォームを使うなら課題を克服し、顧客接点に安心して生成AIを活用していけます。

「RAG技術の活用がいまいちイメージできない」「生成AIとRAG技術の運用をするために自社は何をすればよいかわからない」という方はお気軽にお問い合わせください。

「GIDR AI(ガイダーエーアイ)」をはじめとしたRAG搭載のAIプラットフォームを活用して、企業が保有する大量のコンテンツを使ったカスタマーサクセスを実現していきましょう。

まとめFAQ

Q1. 生成AIとは何ですか?
生成AIとは、学習済みのデータを活用して独自の回答を生成できるAI技術です。文章や画像、音声などのさまざまなコンテンツを生成することができます。

Q2. ハルシネーションとは何ですか?
ハルシネーションとは、AIが事実とは違う内容をもっともらしく回答する現象のことです。この現象の原因は、AIがネット上に存在する大量のデータで学習をした際に、間違った情報も学習してしまうことに起因します。

Q3. RAG技術とは何ですか?
RAG技術とは、Retrieval Augmented Generationの略で、検索拡張生成という意味があります。特定のデータベースに保管されている情報を検索し、大規模言語モデル(LLM)に正確な回答を生成させる仕組みです。

Q4. コンテンツの構造化とは何ですか?
コンテンツの構造化とは、AIが学習できるようにデータを整理することです。PDFや動画などの非構造化データを、HTML5やMarkdownなどの構造化データに変換していきます。

Q5. 「GIDR AI(ガイダーエーアイ)」とは何ですか?
「GIDR AI(ガイダーエーアイ)」とは、RAG技術を搭載したAIプラットフォームです。企業が保有する大量のコンテンツを構造化し、顧客接点のために生成AIを活用しやすい環境を提供します。さまざまなフォーマットコンテンツの構造化、セキュリティ重視のデータ運用、各種LLM・CRM・チャットボットとの連携といった特徴があります。