未来を創る生成AI｜これからは、コレ！｜ITソリューション&サービスならコベルコシステム

2023年11月01日

未来を創る生成AI
～仕組みとビジネス活用～

生成AIの基本的な仕組み
生成AIの課題　～ハルシネーション～
生成AIの課題への対応策　～グラウンディング～
生成AI活用において重要な手法　～プロンプトエンジニアリング～
生成AIに自律的に考え行動させる手法　～ReAct～

現在、生成AI ^※1が注目を集めています。生成AIとは、人間が話す言語（自然言語）を理解し、流暢な文章を生成することができるAIです。アイデア出し、メール作成、文章の要約、プログラム作成といった様々なシーンで活用することができ、日本でも多くの企業、自治体、学校などで活用され始めています。
生成AI関連のサービスに関しては、2023年3月に発表され生成AIの先駆けとなったChatGPTを皮切りに、Google、Microsoft、IBM、AWSなど様々な会社が生成AIを開発・サービス提供を始めており、生成AIの分野は盛り上がりを見せています。

生成AIの基本的な仕組み

生成AIは、膨大な量の文書データから、言語の主語・動詞などの構造や、「この単語の後にはこの単語が来やすい」といった文脈を事前に学習しています。その事前学習した言語の構造や文脈を利用することで、人間が質問をした際、その質問の次に続く可能性の高い単語を並べていき、それを繰り返すことで、人間が作成したような流暢な文章を作成することができます。

図1：生成AIの基本的な仕組み
(クリックして拡大できます)　

生成AIの課題　～ハルシネーション～

素晴らしい能力を持っている生成AIですが、誤った内容をあたかも正しい内容のように回答してしまうハルシネーション（幻覚）という課題が指摘されています。
ハルシネーションについて実際に検証してみました。ChatGPTに「神戸の特産物は何ですか？」と質問した場合、いくつかの特産品を回答してきました。1つ目の回答を見てみると、神戸の有名なブランド牛である「神戸牛」についての正しい内容を回答してくれています。しかし、5番目の回答では「神戸布（こうべぬの）」という存在しない架空の特産物が回答されました。このように、生成AIは誤った内容を回答してしまう場合があることが確認できました。

図2：ハルシネーション（幻覚）の例
(クリックして拡大できます)　

ハルシネーションは、前述した「学習済みの文章の単語の文脈をもとに、次に続く可能性の高い単語を並べて、確率的に文章を生成する」生成AIの仕組みが原因で起きるため、完全に防ぐことはできません。そのため、生成AIを活用する際には、生成された内容を鵜のみにするのではなく、正しい情報かどうか吟味する必要があります。

生成AIの課題への対応策　～グラウンディング～

ハルシネーションを起こしにくくする手法として、グラウンディングがあります。
グラウンディングとは、生成AIに正しい内容の参照情報を与え、その参照情報をもとに回答を生成させることで、正しい内容を回答させることができる手法です。
先ほどと同じ兵庫県の特産品の例で検証してみましょう。神戸の特産品について質問する点は先ほどと同様ですが、違う点として、「[参照情報]をもとに、兵庫県の特産物を教えてください。[参照情報] …」というように神戸の特産品を特集しているWebサイトの文面を参照情報として与えた上でChatGPTに質問しました。その結果、ChatGPTは誤った内容を回答せず、与えた正しい情報に基づいて正しい内容を回答してくれました。

図3：グラウンディングの例
(クリックして拡大できます)　

グラウンディングを活用することで、生成AIに自社の社内文書を参照させて社員の質問に回答させる「社内版ChatGPTアプリ」を構築^※2できたり、ハルシネーションを起こしにくくしたりすることができたりするため、生成AIをビジネスや社内業務に活用しやすくなります。

生成AI活用において重要な手法　～プロンプトエンジニアリング～

生成AIを活用する際に重要な手法として、生成AIを効果的に利用するためのプロンプト（質問・指示）を作成する「プロンプトエンジニアリング」があります。
生成AIは膨大な情報量を学習しており多くの可能性を秘めていますが、最大限の力を引き出すためには生成AIが理解しやすいプロンプトを与えることが重要です。効果的なプロンプトを作成するには、「具体的にする」、「順序立てる」、「例示する」、「指示を明確にする」などのポイントを意識して作成すると良いと言われています。
効果的なプロンプトを作成できる技術者のことを「プロンプトエンジニア」と呼び、AI関連の新たな職種として注目されています。

図4：プロンプトエンジニアリングの例（議事録からの要点の抽出）
(クリックして拡大できます)　

生成AIに自律的に考え行動させる手法　～ReAct～

グラウンディング、プロンプトエンジニアリングの手法を用いることで、生成AIに人間のように自律的に思考・行動させることを可能にした、ReAct（Reasoning and Acting）^※3という手法があります。
ReActを活用すれば、生成AIに行わせたい課題をプロンプトで与えるだけで、生成AIはその課題を解決するのに何をすべきか考え、ツールを用いて課題を解決することができます。

具体例で見てみましょう。仮に2023年のプロ野球セントラル・リーグの優勝チームの監督を知りたいとしましょう。もし、通常のChatGPTにそのことについて質問したとしても、ChatGPTが学習している情報は2021年9月までの情報とされており、2023年の情報については正しく答えることができません。
しかしReActを用いることで、図5のように生成AIが「質問の内容から行うべき行動を考え、それに応じて与えられたツール（今回の例ではWeb検索ツール）を利用しながら、必要な情報を取得する」という思考と行動を繰り返すことで、最終的に「岡田彰布監督」という正しい答えを回答することができます。

図5：ReActの例
(クリックして拡大できます)　

ReActの内部では、グラウンディングを「ツールによって得られた情報をもとに回答するため」、プロンプトエンジニアリングを「思考・行動を繰り返して回答を生成するよう、生成AIに指示するため」に用いています。このような工夫によって、生成AIが事前に学習していない情報でも、自律的に必要な情報を取得し課題を解決することが可能です。
ReActの活用例としては、生成AIにWeb検索ツールを利用させて最新の時事情報について回答できるチャットボットを作成したり、プログラムを実行するためのツールを利用させてデータ分析を自動で行わせたりすることが考えられます。このようにReActは、これまで自動化できなかった高度な業務にも適用することができるため、幅広い分野への活用が期待できます。

おわりに

生成AIは、人間が話す言語（自然言語）を理解し、流暢な文章を生成することができ様々なシーンで活用することができますが、誤った内容を回答するハルシネーションなどの課題もあります。そのような課題を正しく理解したうえで利用すれば、大変有用なツールです。
生成AIの分野は進歩のスピードが非常に速く、2023年9月末にはChatGPTの新機能として、自然言語だけでなく画像や音声も読み込んで理解して回答を生成できる「GPT-4V」という機能が発表されました。また、生成AIの活用手法についても、日々様々な手法が研究・提案されています。進化を続ける生成AIに今後も注目です。

※1:一般に、生成AIは「画像や人間が話す言葉（自然言語)を生成するAI」の総称ですが、この記事では主に自然言語の生成AIについて言及します。
※2：ビジネスで利用する場合は、生成AIに社外秘情報を与えることになるため、セキュリティ面の検討が別途必要です。
※3：ReAct: Synergizing Reasoning and Acting in Language Models
https://arxiv.org/abs/2210.03629 　

2023年11月