より素早い応答、自然な会話が可能に
Amazon「Echo」は新プロセッサー「AZ1」でさらに賢く! 本社幹部が語った開発背景
Amazonがスマートスピーカー「Amazon Echo」シリーズの新ラインナップを発表した。
米AmazonでAmazon EchoシリーズのVice Presidentを勤めるMiriam Daniel(ミリアム・ダニエル)氏が、日本記者によるグループインタビューに答え、同社が独自にエッジAIエンジン「AZ1」を開発し、新しいAmazon Echoシリーズの全モデルに載せた理由などを語った。
Amazonが日本でも10月下旬から発売を開始するEchoシリーズの製品に関する詳細は別記事でお伝えしている通りだ。Alexa対応のスマートスピーカーはAmazon Echo、Amazon Echo Dot with Clock、Amazon Echo Dotの3機種が、10月22日から日本国内でも順次出荷開始する。
ほかにも10インチのディスプレイを搭載するスマートディスプレイ「Echo Show 10」がデザインを一新して生まれ変わった。日本では年内の出荷開始を控える。
新しいスマートスピーカーのAmazon Echoシリーズは球体デザインに統一された。球体になった背景には、メカっぽさを廃してインテリアに馴染みやすいデザインを目指したという理由だけでなく、サイズをコンパクトに保ったまま音質向上を図る狙いがあったのだという。
ただ、Amazon Echo Dotは第3世代モデルまで、アイスホッケーのパックのように平たい形状だった。新しいEcho Dotシリーズは球体になったことで少しサイズが大きくなってしまったようにも見えるが、ダニエル氏は「音質を良くするために球体デザインとしていますが、サイズは大きくなっていません。設置に必要な底面のフットプリントサイズはコンパクトなまま抑えています」と説明する。
■すべてのEchoシリーズに搭載された新開発の「AZ1」エンジン
新しいAmazon Echoシリーズには、全てのモデルにAmazonが独自に開発した第1世代の「AZ1 Neural Edge Processor」(以下:AZ1エンジン)が載っている。
上位モデルのEchoとディスプレイを搭載したEcho Show 10はメインプロセッサーのスペックが高く、十分な容量のメモリを積んでいることから、AZ1エンジンの性能をフルに引き出せるという。
「この新しいエッジAIプロセッサーが搭載されたことで、主にAmazon Echoシリーズの機械学習アルゴリズムのパフォーマンスが向上します。ユーザーがデバイスをインストールして使う場所の通信環境にもよりますが、従来のように音声によるコマンド入力をクラウドAIを介して応答する場合と比べ、新しいEchoシリーズのレスポンスは、100ミリ秒単位で速くなります。例えばIoTスマートホーム機器のリモコン操作などがより快適に感じられると思います」(ダニエル氏、以下同)。
エッジデバイス側の処理が完了すると、機器の操作履歴がクラウドに送られ、セキュアに管理される。現状と同じように、Alexaを使って音声操作の履歴を消去することも可能だ。
■Alexaによる自然な音声会話は日本語対応も準備中
AmazonがAZ1エンジンを開発した背景には、Alexaによるコミュニケーションを、人間同士の自然な会話に近づけることが大きな目的としてあったそうだ。
「Alexaとの会話にもたつきを感じてしまうと、音声操作にも違和感が出てしまいます。そのためにはエッジAIの処理性能を高めて、処理を滑らかにこなすことが必要になると考えました」
「クラウドAIには潤沢な処理パフォーマンスがあります。ただ一方で、音声で入力されたコマンドへの応答はいったんクラウド処理を間に介することになるため、処理に遅延が発生してしまいます。そこでエッジ側のデバイスにAI処理の負担を分散させることで、レスポンスの精度と速度を高めています」
将来はAZ1エンジンをより高度な処理や用途にも展開できるよう、アルゴリズムのブラッシュアップを今後絶えず続けていくとダニエル氏は前置きし「AZ1はまだはじめの一歩を踏み出して“DAY1”を迎えたばかりです。当初は音声処理の応答速度向上を中心に活躍しますが、今後の成長にもぜひご期待ください」と呼びかけた。
新しいEchoシリーズは、AZ1エンジンにより、まるで人と話しているような自然な連続会話に対応したり、ユーザーが入力した音声コマンドの中にAlexaが理解できない箇所が含まれている場合はそこを聞き直し、次回同様のコマンドが入力された場合には機敏に対応する自己学習処理機能を搭載した。これらの機能は、新しいEchoシリーズが発売された後、日本でも使えるようになるのだろうか。
ダニエル氏はどちらの機能も、最終的には日本も含めて世界中に展開したいと答えている。その時期がいつになるか明言は避けたものの、日本語対応は年内を目標に進めたいと意気込みを語っていた。
■子どもも楽しめるEchoシリーズ
Alexaの音声認識が高機能化する事例には、Echoシリーズの全モデルが搭載する「Alexa Voice Profiles for Kids」もある。
親が同意したうえで、子どもの声のプロファイルをAlexaに登録しておくと、子どもがEchoシリーズに向かって発声した時に、AI音声が自動的に子どもモードに移行する。その後は子どもに話しかけるような口調で応答を返すようになる。
宅内に複数のEchoシリーズのデバイスが設置されていても、Alexaに登録されている声紋を認識し、全てのデバイスが子どもの発声をトリガーにして、同じ機能を提供する。
子どもの声紋は、おおむね3歳から5歳前後の声から正確な認識ができるそうだ。Amazonが提供する子ども向けコンテンツのオールインワン定額サービス「Amazon Kids+」の対象年齢は3歳から12歳前後のため、Voice Profileの最適化もその程度の年齢を対象にチューニングしたという。
子どもが音楽や動画の再生をリクエストすると、子ども向けのコンテンツを探して再生する。子どもが児童書を音読する際に、読み聞かせをAI音声によりサポートするAlexa Sidekick機能もある。なおAlexaの子ども向け機能はアメリカ国内向けに提供される。
■Echo Show 10は見守りカメラにもなるスマートディスプレイ
Amazon Echo Show 10は内蔵カメラを使って“できること”が大幅に拡張されている。
例えば在宅ワークのツールとしても活用できるようにAlexaビデオコールは複数人数によるグループ通話に対応したほか、BtoB向けのツールとしてAmazonが提供しているビデオ会議システム「Amazon Chime」や、サードパーティ製のソリューションでは「Zoom」も使えるようになる。
ユーザーの音声コマンドを検知すると、カメラとマイクを載せたディスプレイがユーザーの側に振り向く機能も搭載する。ビデオ通話に役立つ機能だが、これをAmazonがアメリカで提供する自宅警備機能の「Alexa Guard」に連携させると、Echo Show 10が防犯カメラのようにも機能する。また、留守中にペットの様子を見守るカメラにもなる。Echo Show 10に搭載されるカメラとAZ1エンジンによって、高度な動体検知とアプリケーションに合わせた処理が行われるという。
■IoT向けワイヤレスネットワーク「Amazon Sidewalk Bridge」とは?
近距離無線を使ったAmazon独自開発のIoTデバイス向けワイヤレスネットワーク「Amazon Sidewalk Bridge」も、どんなことができるようになるのか気になる機能だ。本機能は、サービスイン当初はアメリカ国内のみで提供される。ダニエル氏は今後に向けて、Alexaが使える全ての地域に対応を広げていきたいとコメントしている。
今回発表されたSidewalk Bridgeは、Bluetooth BLEの技術をベースに互換性のあるIoT機器を操作するものだが、Sidewalkの技術自体は、900MHz帯の無線通信も規格化しており、上位のEchoとEcho Show 10はBluetooth BLEと900MHz帯の両方をサポートしている。
ダニエル氏は「新しいEchoデバイスをはじめ、今回はオンライン形式で開催したイベントでAmazonが発表した製品やサービスはすべて、ユーザーの皆様の生活をより豊かにすることをひとつのテーマとしています。現在は多くの方々がまだ大変な環境の中で暮らしていますが、新しいEchoシリーズのコミュニケーション機能や、ご自宅で安全に暮らすためのサービスをぜひ活用してほしい」と語った。
米AmazonでAmazon EchoシリーズのVice Presidentを勤めるMiriam Daniel(ミリアム・ダニエル)氏が、日本記者によるグループインタビューに答え、同社が独自にエッジAIエンジン「AZ1」を開発し、新しいAmazon Echoシリーズの全モデルに載せた理由などを語った。
Amazonが日本でも10月下旬から発売を開始するEchoシリーズの製品に関する詳細は別記事でお伝えしている通りだ。Alexa対応のスマートスピーカーはAmazon Echo、Amazon Echo Dot with Clock、Amazon Echo Dotの3機種が、10月22日から日本国内でも順次出荷開始する。
ほかにも10インチのディスプレイを搭載するスマートディスプレイ「Echo Show 10」がデザインを一新して生まれ変わった。日本では年内の出荷開始を控える。
新しいスマートスピーカーのAmazon Echoシリーズは球体デザインに統一された。球体になった背景には、メカっぽさを廃してインテリアに馴染みやすいデザインを目指したという理由だけでなく、サイズをコンパクトに保ったまま音質向上を図る狙いがあったのだという。
ただ、Amazon Echo Dotは第3世代モデルまで、アイスホッケーのパックのように平たい形状だった。新しいEcho Dotシリーズは球体になったことで少しサイズが大きくなってしまったようにも見えるが、ダニエル氏は「音質を良くするために球体デザインとしていますが、サイズは大きくなっていません。設置に必要な底面のフットプリントサイズはコンパクトなまま抑えています」と説明する。
■すべてのEchoシリーズに搭載された新開発の「AZ1」エンジン
新しいAmazon Echoシリーズには、全てのモデルにAmazonが独自に開発した第1世代の「AZ1 Neural Edge Processor」(以下:AZ1エンジン)が載っている。
上位モデルのEchoとディスプレイを搭載したEcho Show 10はメインプロセッサーのスペックが高く、十分な容量のメモリを積んでいることから、AZ1エンジンの性能をフルに引き出せるという。
「この新しいエッジAIプロセッサーが搭載されたことで、主にAmazon Echoシリーズの機械学習アルゴリズムのパフォーマンスが向上します。ユーザーがデバイスをインストールして使う場所の通信環境にもよりますが、従来のように音声によるコマンド入力をクラウドAIを介して応答する場合と比べ、新しいEchoシリーズのレスポンスは、100ミリ秒単位で速くなります。例えばIoTスマートホーム機器のリモコン操作などがより快適に感じられると思います」(ダニエル氏、以下同)。
エッジデバイス側の処理が完了すると、機器の操作履歴がクラウドに送られ、セキュアに管理される。現状と同じように、Alexaを使って音声操作の履歴を消去することも可能だ。
■Alexaによる自然な音声会話は日本語対応も準備中
AmazonがAZ1エンジンを開発した背景には、Alexaによるコミュニケーションを、人間同士の自然な会話に近づけることが大きな目的としてあったそうだ。
「Alexaとの会話にもたつきを感じてしまうと、音声操作にも違和感が出てしまいます。そのためにはエッジAIの処理性能を高めて、処理を滑らかにこなすことが必要になると考えました」
「クラウドAIには潤沢な処理パフォーマンスがあります。ただ一方で、音声で入力されたコマンドへの応答はいったんクラウド処理を間に介することになるため、処理に遅延が発生してしまいます。そこでエッジ側のデバイスにAI処理の負担を分散させることで、レスポンスの精度と速度を高めています」
将来はAZ1エンジンをより高度な処理や用途にも展開できるよう、アルゴリズムのブラッシュアップを今後絶えず続けていくとダニエル氏は前置きし「AZ1はまだはじめの一歩を踏み出して“DAY1”を迎えたばかりです。当初は音声処理の応答速度向上を中心に活躍しますが、今後の成長にもぜひご期待ください」と呼びかけた。
新しいEchoシリーズは、AZ1エンジンにより、まるで人と話しているような自然な連続会話に対応したり、ユーザーが入力した音声コマンドの中にAlexaが理解できない箇所が含まれている場合はそこを聞き直し、次回同様のコマンドが入力された場合には機敏に対応する自己学習処理機能を搭載した。これらの機能は、新しいEchoシリーズが発売された後、日本でも使えるようになるのだろうか。
ダニエル氏はどちらの機能も、最終的には日本も含めて世界中に展開したいと答えている。その時期がいつになるか明言は避けたものの、日本語対応は年内を目標に進めたいと意気込みを語っていた。
■子どもも楽しめるEchoシリーズ
Alexaの音声認識が高機能化する事例には、Echoシリーズの全モデルが搭載する「Alexa Voice Profiles for Kids」もある。
親が同意したうえで、子どもの声のプロファイルをAlexaに登録しておくと、子どもがEchoシリーズに向かって発声した時に、AI音声が自動的に子どもモードに移行する。その後は子どもに話しかけるような口調で応答を返すようになる。
宅内に複数のEchoシリーズのデバイスが設置されていても、Alexaに登録されている声紋を認識し、全てのデバイスが子どもの発声をトリガーにして、同じ機能を提供する。
子どもの声紋は、おおむね3歳から5歳前後の声から正確な認識ができるそうだ。Amazonが提供する子ども向けコンテンツのオールインワン定額サービス「Amazon Kids+」の対象年齢は3歳から12歳前後のため、Voice Profileの最適化もその程度の年齢を対象にチューニングしたという。
子どもが音楽や動画の再生をリクエストすると、子ども向けのコンテンツを探して再生する。子どもが児童書を音読する際に、読み聞かせをAI音声によりサポートするAlexa Sidekick機能もある。なおAlexaの子ども向け機能はアメリカ国内向けに提供される。
■Echo Show 10は見守りカメラにもなるスマートディスプレイ
Amazon Echo Show 10は内蔵カメラを使って“できること”が大幅に拡張されている。
例えば在宅ワークのツールとしても活用できるようにAlexaビデオコールは複数人数によるグループ通話に対応したほか、BtoB向けのツールとしてAmazonが提供しているビデオ会議システム「Amazon Chime」や、サードパーティ製のソリューションでは「Zoom」も使えるようになる。
ユーザーの音声コマンドを検知すると、カメラとマイクを載せたディスプレイがユーザーの側に振り向く機能も搭載する。ビデオ通話に役立つ機能だが、これをAmazonがアメリカで提供する自宅警備機能の「Alexa Guard」に連携させると、Echo Show 10が防犯カメラのようにも機能する。また、留守中にペットの様子を見守るカメラにもなる。Echo Show 10に搭載されるカメラとAZ1エンジンによって、高度な動体検知とアプリケーションに合わせた処理が行われるという。
■IoT向けワイヤレスネットワーク「Amazon Sidewalk Bridge」とは?
近距離無線を使ったAmazon独自開発のIoTデバイス向けワイヤレスネットワーク「Amazon Sidewalk Bridge」も、どんなことができるようになるのか気になる機能だ。本機能は、サービスイン当初はアメリカ国内のみで提供される。ダニエル氏は今後に向けて、Alexaが使える全ての地域に対応を広げていきたいとコメントしている。
今回発表されたSidewalk Bridgeは、Bluetooth BLEの技術をベースに互換性のあるIoT機器を操作するものだが、Sidewalkの技術自体は、900MHz帯の無線通信も規格化しており、上位のEchoとEcho Show 10はBluetooth BLEと900MHz帯の両方をサポートしている。
ダニエル氏は「新しいEchoデバイスをはじめ、今回はオンライン形式で開催したイベントでAmazonが発表した製品やサービスはすべて、ユーザーの皆様の生活をより豊かにすることをひとつのテーマとしています。現在は多くの方々がまだ大変な環境の中で暮らしていますが、新しいEchoシリーズのコミュニケーション機能や、ご自宅で安全に暮らすためのサービスをぜひ活用してほしい」と語った。