HOME > インタビュー > 日本に「音声操作」は根付くか? 多くの音声認識デバイスを開発、Cerevo 岩佐氏に聞く未来像

<山本敦のAV進化論 第137回>

日本に「音声操作」は根付くか? 多くの音声認識デバイスを開発、Cerevo 岩佐氏に聞く未来像

公開日 2017/07/05 10:30 山本 敦
  • Twitter
  • FaceBook
  • LINE


こうした様々な音声認識や機械学習技術を、ユーザーにストレスを感じさせることなくスムーズに使えるよう仕上げていくのが、メーカーの腕の見せどころと岩佐氏は語る。技術の組み合わせやアルゴリズムの作り込みなど、細かなチューニングがユーザー体験の差として現れてくる。

ユーザーがデバイスに話しかけている時に発生するタイムラグを不自然に感じさせないよう、インタラクションを洗練させることにも力を注いでいる。岩佐氏はこう説明する。「例えばタチコマに質問すると、“うーん、えーと”といった具合に一瞬悩むそぶりを見せながら動きます。その2〜3秒のアクションの合間にコマンドを解析して返事を生成しているのですが、退屈させない仕草をタチコマが見せてくれることでユーザーがタチコマとスムーズなコミュニケーションを楽しむことができます」。

手や指先によるクリックやタップ操作の場合、コマンドが実行されるまでのタイムラグに敏感になりがちだが、音声による操作はたいていの場合、ユーザーが手も動かしたりほかの行為に意識を集中させていることが多いため、多少のタイムラグが気にならない場合もある。Lumigentでは、ユーザーの音声コマンドにしっかり反応していることをLEDの明滅や音で知らせる工夫も凝らした。

岩佐氏は1/8 タチコマのように、大人のユーザーをターゲットにしたスマート・トイを今後も大きく伸びるカテゴリーに位置づけている。インターネットやエレクトロニクスの技術が進化すれば人々に余裕が生まれ、余暇や趣味に使える時間の重要性に目が向くようになるからだ。実際に1/8 タチコマは発表後も非常に良い反響を得ているという。

なお「SR2プロジェクト」の次のアイデアについても岩佐氏に聞いてみた。岩佐氏は「色々と思案中だが、チャレンジしてみたいアイテムは山ほどある」と答える。「ドミネーターはアニメのコスプレ文化にもフィットして人気を集めました。コスプレ市場はこれから世界中で大きく成長するとみています。Cerevoでは従来ハンドメイドでモノづくりをしていた業界にソフトウェアやサービス、電気電子回路の組み込み、無線通信などのデジタル技術を持ち込むことで革新を起こしたいと考えています」。

音声認識技術は“自然対話”の完成度により浸透する

岩佐氏は今年の年末ごろに音声認識技術がブレイクするだろうと予想しているが、はたしてそれは日本人の生活にも定着するだろうか。日本人の内向的な本質が邪魔をし、音声による家電のインターフェースは海外ほどヒットしないという見方もある。

「今年の年末ごろに音声認識技術がブレイクする」と岩佐氏

岩佐氏は「音声認識による操作を恥ずかしく感じることはなくなるだろう」とし、最新音声認識エンジンによる自然対話の完成度の高さを、その理由の一つに挙げる。「アマゾンのAlexaは、私が経験した限りでは驚くほど自然なインタラクションを実現しています。ユーザーが恥ずかしさを感じることなく、家電機器とコミュニケーションができるレベルです。あとは日本語化の出来映え次第で日本国内でも受け入れられると期待しています」。

Googleが年内の国内発売を予告する「Google Home」や、直近ではアップルがSiriを搭載する「HomePod」、LINEが日本語対応のClovaを搭載する「WAVE」など、インテリジェンスを備えた“スマートスピーカー”がいま注目を集めているが、Lumigentのように、スマートスピーカーから入力された音声コマンドを受けて動くスマート家電にも注目して欲しいと岩佐氏は呼びかける。

アンプやオーディオプレーヤーが音声認識技術を取り込むと、例えば「ジャズが聴きたい」「ノラ・ジョーンズの新曲を聴かせて」といった具合に話しかけるだけで、よりスマートに音楽が再生できるようになる。同等の音楽再生操作は、現在北米で発売されているアマゾンのAlexa搭載スマートスピーカーなどでは既に実現できている。

同じ流れの中で今後、テレビやメディアプレーヤーなどオーディオビジュアル機器のインターフェースも大きく変貌を遂げていくかもしれない。

(山本 敦)

前へ 1 2 3

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

関連リンク

トピック: