HOME > ニュース > Gadgetニュース
ガジェット 公開日 2023/05/23 06:40
「ChatGPT」だけではない“対話型AI”。Google「Bard」や「Bing」との違い、それぞれの特徴とは
【連載】西田宗千佳のネクストゲート 第39回
Googleは5月10日(米太平洋時間)に開催した開発者会議「Google I/O 2023」の基調講演で、同社の最新大規模言語モデル「PaLM 2」と、チャットAIサービス「Bard」への導入を発表した。
同時にBardは多言語対応の強化を発表し、すでに日本語と韓国語で利用可能になっている。これによって、「ChatGPT」「Bing チャット検索(以下Bing)」「Bard」という、3つのチャットAIサービスが日本語で使えるようになったわけだが、それぞれはどう違うのだろうか? 少し簡単にまとめてみたい。
ただ、ここでは「どれが賢いか」という話には踏み込まない。事例によって結果が違いすぎるし、急速に変化している領域なので、短時間で確たる答えを提示するのは現実的ではなく、誠実なやり方でもないと考えているからだ。
読者の方々には本記事でどのような機能があり、どのような方向性のサービスなのかを把握した上で、各自実際に使ってみていただきたいと思う。
3つのチャットAIを考える時には、まずその構造の違いを理解しておいた方がいい。現状のチャットAIは、背後に「大規模言語モデル(LLM)」を使ったジェネレーティブAIがあり、その上にチャットを介して利用者がAIに質問し、回答を得る仕組みが重なっている、と考えればいい。
ニュースなどでは「ChatGPT」という単語をAIの代名詞のように使っているが、実際にはあくまで「AIを使うためのユーザーインターフェース」であり「AIを使ったサービス」の1つである。
例えば、ChatGPTは現状「GPT-3.5」と「GPT-4」という2つのLLMに対応しているが、回答が返ってくる速度も、回答内容も違う。答えを生成するLLMが異なっているからだ。2つ用意されている理由は、GPT-3.5の方が圧倒的に反応速度が速いためであり、GPT-4との使い分けが推奨されている。
ちなみにGPT-3.5とGPT-4では、解答の冒頭に入るアイコンの色が異なる。GPT-3.5では緑で、GPT-4ではマゼンタだ。
冒頭で述べたように、BardはGoogleの開発したLLMである「PaLM 2」で動作している。ただし今年2月に英語版として発表された際には、LLMに「LaMDA」を使っていた。その後、3月に英語版をテスト公開するのに合わせて「PaLM」へ移行し、さらに今回「PaLM 2」へ移行したとされている。同じBardでも、その向こうで動いているLLMが逐次切り替わっているため、回答も変化していると思われる。
ただし、Bardのサービス内では返答したLLMの名称に「LaMDA」が使われている場合も多々見受けられる。このあたりはGoogle内でもまだ混乱している部分があるのかもしれない。
またサービスの特徴として、「同じ内容について3つの解答案を用意する」ことが挙げられる。これはBardが「人と協力してコンテンツを生み出す」ことを目的としているためだ。文章のテイストは多様であるので、あえて複数の選択肢を提示することで、「AIは1つの正解を示すような存在ではない」と主張したいのだろう。
Bingに関しては、さらに少し複雑になる。BingはLLMとして、OpenAIからGPT-4の提供を受けて利用している。ではGPT-4で動くChatGPT=Bingか、というとそうではない。ChatGPTはあくまで「チャットサービス」だが、Bingは「検索サービス」である。
ChatGPTの使うGPT-4は「2021年9月まで」にネットに存在した情報で学習が行われている。GPT-3.5については情報がないが、より前の情報で学習したものと考えていいだろう。だからそのまま使うと、最新の情報は学習内容に含まれないので出てこない。
そこでマイクロソフトは、「Prometheus」という技術を作った。この技術はGPT-4と連動して動くもので、チャットの会話から検索キーワードを作り出し、ネット検索をした上でGPT-4に渡して、滑らかな文章の回答を作る。同時に、答えとなる文章の根拠となった情報が含まれるウェブサイトを「索引」のような形で表示する。
結果として、現状Bingは「検索サービスとしてのAIチャット」としては、もっとも使いやすいものになっている。
ただ少し混乱しやすい話になってくるのだが、つい先日、ChatGPTにも「Webブラウジング」機能が搭載され、GPT-4を使って最新の情報を検索できるようになった。ただし、この機能が使えるのは有料版の「ChatGPT Plus」(月額20ドル)の契約者のみである。
この機能でウェブ検索する手法はBingに似ているようだ。まず、チャットの内容から回答を導き出すのに必要なキーワードをピックアップし、それでネット検索を行った上で各ページの内容を読み、さらにまとめ直す。Bingと同じように索引もつくが、ソースのページ自体は隠され、あまり目立たない。
Bardに関してもChatGPTと同じく、本来は検索エンジンとイコールではないのだが、どうやら内部でウェブ検索も行っているようで、最新の情報を聞いてもちゃんと回答してくれる。ただし、どのような手法を使っているかは不明だ。なおBardの場合、「Googleで検索」というボタンを押すと、対話から関連する検索トピックを生成し、直接的にネット検索できるようになっている。
また、英語での極めて限定的な機能提供ではあるが、Googleのネット検索そのものにジェネレーティブAIを組み込んだSearch Generative Experience(SGE:生成サーチ体験)」もBardにはある。こちらはおそらく、Bingをより進化させたような構造になるだろう。
こう考えると、それぞれのチャットAIは、価値や方向性が違うのも見えてくる。ChatGPTやBardは、ネット検索というより「AIにたずねながら作業をする」クリエイティブなもの、という位置付けだし、Bingはやはりネット検索だ。
ただし、Bingにしても答えの傾向を「創造的」に変えると回答は大幅に変わり、使い道がかわってくる印象を受ける。そういったことを踏まえつつ、あなたの用途にはどれが適切か、考えながら試してみてほしい。
同時にBardは多言語対応の強化を発表し、すでに日本語と韓国語で利用可能になっている。これによって、「ChatGPT」「Bing チャット検索(以下Bing)」「Bard」という、3つのチャットAIサービスが日本語で使えるようになったわけだが、それぞれはどう違うのだろうか? 少し簡単にまとめてみたい。
ただ、ここでは「どれが賢いか」という話には踏み込まない。事例によって結果が違いすぎるし、急速に変化している領域なので、短時間で確たる答えを提示するのは現実的ではなく、誠実なやり方でもないと考えているからだ。
読者の方々には本記事でどのような機能があり、どのような方向性のサービスなのかを把握した上で、各自実際に使ってみていただきたいと思う。
■LLMの上にサービスが乗っかった「チャットAI」、OpenAIは2つのGPTを活用中
3つのチャットAIを考える時には、まずその構造の違いを理解しておいた方がいい。現状のチャットAIは、背後に「大規模言語モデル(LLM)」を使ったジェネレーティブAIがあり、その上にチャットを介して利用者がAIに質問し、回答を得る仕組みが重なっている、と考えればいい。
ニュースなどでは「ChatGPT」という単語をAIの代名詞のように使っているが、実際にはあくまで「AIを使うためのユーザーインターフェース」であり「AIを使ったサービス」の1つである。
例えば、ChatGPTは現状「GPT-3.5」と「GPT-4」という2つのLLMに対応しているが、回答が返ってくる速度も、回答内容も違う。答えを生成するLLMが異なっているからだ。2つ用意されている理由は、GPT-3.5の方が圧倒的に反応速度が速いためであり、GPT-4との使い分けが推奨されている。
ちなみにGPT-3.5とGPT-4では、解答の冒頭に入るアイコンの色が異なる。GPT-3.5では緑で、GPT-4ではマゼンタだ。
■3つの回答を用意するGoogleの「Bard」
冒頭で述べたように、BardはGoogleの開発したLLMである「PaLM 2」で動作している。ただし今年2月に英語版として発表された際には、LLMに「LaMDA」を使っていた。その後、3月に英語版をテスト公開するのに合わせて「PaLM」へ移行し、さらに今回「PaLM 2」へ移行したとされている。同じBardでも、その向こうで動いているLLMが逐次切り替わっているため、回答も変化していると思われる。
ただし、Bardのサービス内では返答したLLMの名称に「LaMDA」が使われている場合も多々見受けられる。このあたりはGoogle内でもまだ混乱している部分があるのかもしれない。
またサービスの特徴として、「同じ内容について3つの解答案を用意する」ことが挙げられる。これはBardが「人と協力してコンテンツを生み出す」ことを目的としているためだ。文章のテイストは多様であるので、あえて複数の選択肢を提示することで、「AIは1つの正解を示すような存在ではない」と主張したいのだろう。
■「検索」として作られたBing
Bingに関しては、さらに少し複雑になる。BingはLLMとして、OpenAIからGPT-4の提供を受けて利用している。ではGPT-4で動くChatGPT=Bingか、というとそうではない。ChatGPTはあくまで「チャットサービス」だが、Bingは「検索サービス」である。
ChatGPTの使うGPT-4は「2021年9月まで」にネットに存在した情報で学習が行われている。GPT-3.5については情報がないが、より前の情報で学習したものと考えていいだろう。だからそのまま使うと、最新の情報は学習内容に含まれないので出てこない。
そこでマイクロソフトは、「Prometheus」という技術を作った。この技術はGPT-4と連動して動くもので、チャットの会話から検索キーワードを作り出し、ネット検索をした上でGPT-4に渡して、滑らかな文章の回答を作る。同時に、答えとなる文章の根拠となった情報が含まれるウェブサイトを「索引」のような形で表示する。
結果として、現状Bingは「検索サービスとしてのAIチャット」としては、もっとも使いやすいものになっている。
■ChatGPTやBardにも「ネット検索」要素が
ただ少し混乱しやすい話になってくるのだが、つい先日、ChatGPTにも「Webブラウジング」機能が搭載され、GPT-4を使って最新の情報を検索できるようになった。ただし、この機能が使えるのは有料版の「ChatGPT Plus」(月額20ドル)の契約者のみである。
この機能でウェブ検索する手法はBingに似ているようだ。まず、チャットの内容から回答を導き出すのに必要なキーワードをピックアップし、それでネット検索を行った上で各ページの内容を読み、さらにまとめ直す。Bingと同じように索引もつくが、ソースのページ自体は隠され、あまり目立たない。
Bardに関してもChatGPTと同じく、本来は検索エンジンとイコールではないのだが、どうやら内部でウェブ検索も行っているようで、最新の情報を聞いてもちゃんと回答してくれる。ただし、どのような手法を使っているかは不明だ。なおBardの場合、「Googleで検索」というボタンを押すと、対話から関連する検索トピックを生成し、直接的にネット検索できるようになっている。
また、英語での極めて限定的な機能提供ではあるが、Googleのネット検索そのものにジェネレーティブAIを組み込んだSearch Generative Experience(SGE:生成サーチ体験)」もBardにはある。こちらはおそらく、Bingをより進化させたような構造になるだろう。
こう考えると、それぞれのチャットAIは、価値や方向性が違うのも見えてくる。ChatGPTやBardは、ネット検索というより「AIにたずねながら作業をする」クリエイティブなもの、という位置付けだし、Bingはやはりネット検索だ。
ただし、Bingにしても答えの傾向を「創造的」に変えると回答は大幅に変わり、使い道がかわってくる印象を受ける。そういったことを踏まえつつ、あなたの用途にはどれが適切か、考えながら試してみてほしい。