HOME > インタビュー > 実はAIと音声認識の老舗。東芝がスマートスピーカーを発売する理由

<山本敦のAV進化論 第150回>

実はAIと音声認識の老舗。東芝がスマートスピーカーを発売する理由

公開日 2017/12/07 10:00 山本 敦
  • Twitter
  • FaceBook
  • LINE


東芝は音声認識のノウハウを培ってきた

とはいえ、東芝は何もない所からいきなりスマートスピーカーを開発したわけではない。東芝の技術開発拠点である東芝研究開発センターでは、1960年代から音声入力エンジンや人工知能の技術に取り組んできた。音声インターフェースの認識精度に深く関わる機械学習・ディープラーニング、音声認識とテキスト化、その精度を高めるための整音処理技術にも長く蓄積してきた資産があり、これまでにもカーナビゲーションの音声認識システムなど様々な分野に採用されてきた。その東芝独自の技術によって、TH-GW10は高性能な音声認識を実現できていると西岡氏が語っている。

「機械学習の認識精度は、音声データに含まれる特徴点の抽出方法にも深く関わってきます。東芝にはレグザのタイムシフトマシン搭載機モデルに採用してきた、たくさんの録画番組の中から見たい番組をすぐに探せる『ざんまいスマートアクセス』のボイス検索機能にも同様の技術を乗せており、これまでに磨き上げてきたノウハウがあります」(西岡氏)。

東芝グループの東芝デジタルソリューションズでは、日本語による音声認識に対応するコミュニケーションAIエンジン「RECAIUS(リカイアス)」の開発にも取り組んでいる。今年の9月に東芝映像ソリューションが行ったスマートスピーカーの発表会では、TH-GW10にリカイアスを組み込んで日本語による応答にも対応するプロトタイプのデモンストレーションも披露された。

西岡氏によれば、このリカイアスはスマートスピーカーを使った音声によるスマートホームのコントロールに適したAIエンジンなのだという。

「リカイアスはユーザーが入力した音声コマンドに対して、ある程度の言葉のゆらぎを吸収しながら、想定したシナリオに沿って確実性の高い応答を行うことができるAIアシスタントです。コマンドに対する反応が予想しづらいチャットボット型のAIアシスタントに比べて、スマート家電のコントロールやBtoBの業務用途のアプリケーションには確実で正確な応答性能が求められるので、そうなると決められた応答を確実にこなせるシナリオベースによるAIの方が、理にかなう部分があります。スマートスピーカーを通して、あるいはスマート家電に直に組み込む形も想定しながら機器をコントロールするAIエンジンの可能性を探るために、現在プロトタイプによる検証も進めています」(西岡氏)。

音声コントロールに適したAIエンジンの可能性を探っているという

例えばAIをテレビやエアコンなどにビルトインする場合は、短いフレーズのコマンドに対して確実に応答できるシナリオベースによるAIのふるまいが適している。現在、リカイアスの対話はすべてクラウド側での処理で行われているが、今後は様々なデバイスに必要な機能だけを切り分けて搭載される形になれば、オンデバイスによる処理だけでまかなえる可能性もみえてくる。

そうなれば、現在スマートスピーカーが注目されるフィーチャーの一つになりつつあるAIとの自然会話などシナリオベースのAIが苦手とする部分や、クラウドベースのサービス、スマートホーム連携については、AmazonのAlexaもビルトインするスタイルも想定できそうだ。石橋氏もその可能性は有り得ると答えている。

「リカイアスは日本語の認識精度が高いAIエンジンであると考えています。そこに今回東芝映像ソリューションが発売するスマートスピーカーに搭載した整音処理技術など、音声コマンドを高精度にピックアップする集音まわりの技術を組み合わせることで、ある程度騒音に囲まれる環境でも正確なコマンド応答が実現できます。そうなれば、コンシューマーの生活環境に限らず、オフィスや店舗など商業設備向けのスマートソリューションにも当社が提案できるソリューションを広げていくことが可能になります」(石橋氏)

さらに「リカイアスは、音声コマンドのテキスト変換処理の間に組み込むシナリオエンジンを換えることで、様々なお客様が必要とするサービスに合わせたカスタマイズができる自由度の高さも特徴としています」と語る石橋氏は、東芝グループの資産を活かしながら今後ソフトウェア、ハードウェアの両面で多様なニーズに応えられる強みをアピールしていきたいとした。

もうひとつAIのカスタマイズに関わる東芝ならではの取り組みと言えば、東芝デジタルソリューションズが開発する「コエステーション」(関連ニュース)もある。膨大な「声」のデータベースをつくり、スマートスピーカーをはじめとするアウトプットデバイスなど様々なサービスのカスタマイズに活用できるプラットフォームだ。今後東芝映像ソリューションが開発するスマートスピーカーなどの製品がカスタマイズされた声を採用する可能性は十分にあると石橋氏が語っている。

コエステーションのコンセプトイメージ

では、日本市場に向けた東芝のスマートスピーカーに関連する製品やサービスの展開についてはどのように考えているのだろうか。石橋氏に訊ねた。

石橋氏は現時点ではまだ「日本の展開についてはまた時期が来たら詳しくお話ししたい」と踏み込んだかたちでのコメントは避けたが、一方では日本国内ではBtoBtoCのビジネスモデルを軸にしながら、パートナーとなる事業者と手を組む形でコンシューマーに製品やサービスをリーチしていく形を検討したいとも述べている。

その際には先に触れた東芝グループの資産であるAIエンジンのリカイアスなどを最適な形で組み込んだ「専用機としての強み」を掲げていくことになる。例えば今後レグザにより高性能なAIエンジンが組み込まれて、おすすめ番組のレコメンドや、膨大な数のタイムシフトマシンによる録画番組の検索がさらに使いやすくなるかもしれない。モノづくりの最前線をリードしてきた日本のメーカーならではのスマートビジネスが、これからどのように進化を遂げていくのか注目したい。

(山本 敦)

前へ 1 2

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE