公開日 2017/08/30 09:30
<山本敦のAV進化論 第143回>
2次元大勝利! ソニーのバーチャルアナウンサー「沢村碧」に会ってきた
山本 敦
文字原稿を音声合成エンジンで自然な発話に変換して、CGで作成されたバーチャルアナウンサー「沢村碧(さわむら みどり)」が読みあげてくれる「アバターエージェントサービス」をソニーが共同通信デジタルと一緒に発表、BtoB向けに提供を始めた。
今回は特別に編集部が作成したニュース原稿を沢村碧アナに読んでもらった。まずはぜひその動画をご覧いただいて、サービスの雰囲気を体験してみてほしい。
本稿では、同サービスの開発を担当するソニーの倉田宜典氏、城井 学氏にその詳細を訊ねてきた。
■アバターエージェントサービスは誰がつくってる?
倉田氏は元もとソニーのエンターテインメントロボット「AIBO(アイボ)」や二足歩行ロボット「QRIO(キュリオ)」の開発チームに所属して、当時はクラウドを使わずに製品ローカルで処理をしていた音声合成・対話システムのシナリオ制作などに関わってきた。
「それぞれの製品が開発を終了した後も、ソニーでは将来の家電機器に必須の要素技術となるであろう音声コントロールを“ナチュラルユーザーインターフェース”と呼んで研究・開発を進めてきました」(倉田氏)
倉田氏は現在ソニーとソニーモバイルコミュニケーションズの両社に籍を置いて、アバターエージェントサービスのプロデューサーとして事業化のリーダーシップを取っている。ソニー本社ではアバターエージェントサービスとしてビジネス化する方向で技術を育てながら、片方のソニーモバイルからは「Xperia Ear」や「Xperia Touch」など、同じ要素技術をベースにした音声UIを搭載する商品を発売している。
城井氏はアバターエージェントサービスのプロジェクトリーダーであり、ソニーモバイルがMWCなどのイベントにプロトタイプを出展してきた「Xperia Agent」関連ニュース)の商品企画担当者でもある。
ソニー全体として長年取り組んできた音声ユーザーインターフェースに関する技術とサービスが、今回バーチャルアナウンサーとして新しい展開を迎えることになった。“沢村碧”に関してはシステム全体の機能仕様を決めるところから、製作したアバターの細かな表情や動きの設定、声優の選定に至るまで倉田氏・城井氏の仕事は多岐にわたる。
なお、声優の寿美菜子さんは沢村碧だけでなく、Xperia Earの音声UIも担当している。
ソニーが近年に発売したコンシューマーエレクトロニクス商品としては「SmartBand Talk」(関連ニュース)や、以前に本連載でも取り上げた“踊る”Bluetoothスピーカー「BSP60」(関連ニュース)にもアバターエージェントサービスと同じ音声UIの要素技術が使われている。さらにその技術をベースにインタラクティブ性を強化したシステムも、ソニー・ミュージックコミュニケーションズがAndroidデバイス向けにGoogle Playストアで配信するアプリ「めざましマネージャー」に乗っている。
「SmartBand Talkでは東芝デジタルソリューションズの合成音声作成ツール『ToSpeak』シリーズから、標準セットとして提供されている声をそのまま使っていました。Xperia Earから同じプラットフォームをベースに当社が特注したカスタムボイスを使っています。さらに、いま3つのバージョンを配信しているめざましマネージャーアプリも、それぞれのキャラクターの声優を起用したカスタムボイス仕様です」(倉田氏)
■“沢村碧”には、ソニーのどんな技術が使われている?
ソニーの新たなサービス形態であるバーチャルアナウンサー・沢村碧はどのような技術によって構成されているのだろうか。倉田氏に訊いた。
「アバターエージェントサービスについては様々な構成要素を束ねながら、キャラクターを動かしたり、細部をカスタマイズして商品として作り込んで独自のユーザー体験を提供するところにソニー独自のノウハウが活きています。いわゆる音声認識や音声合成の技術については全体のサービスを成り立たせるための“パーツ”として捉えているので、それらはケースバイケースでベストな技術を調達して組み合わせればよいと考えています」(倉田氏)
アバターエージェントサービスの制作環境はPC用アプリケーションとして落とし込まれている。制作者はニュース原稿をテキストで入力して、キャラクターの動作やカメラワークなど、用意されているプリセットの中から選んで設定するだけ。CG制作や映像機器、PCの詳しい知識がなくてもキャラクターが声でニュースを読みあげる動画ファイルを簡単に作ることができる。ソニーにとってのパートナーである共同通信デジタルはニュース作成に関わるノウハウの提供、およびアプリケーションツールの販売を担当する。
■沢村碧アナがニュースを読み上げるまでの流れ
ここからは、アプリケーションの詳細に踏み込んでいきたい。
今回は特別に編集部が作成したニュース原稿を沢村碧アナに読んでもらった。まずはぜひその動画をご覧いただいて、サービスの雰囲気を体験してみてほしい。
本稿では、同サービスの開発を担当するソニーの倉田宜典氏、城井 学氏にその詳細を訊ねてきた。
■アバターエージェントサービスは誰がつくってる?
倉田氏は元もとソニーのエンターテインメントロボット「AIBO(アイボ)」や二足歩行ロボット「QRIO(キュリオ)」の開発チームに所属して、当時はクラウドを使わずに製品ローカルで処理をしていた音声合成・対話システムのシナリオ制作などに関わってきた。
「それぞれの製品が開発を終了した後も、ソニーでは将来の家電機器に必須の要素技術となるであろう音声コントロールを“ナチュラルユーザーインターフェース”と呼んで研究・開発を進めてきました」(倉田氏)
倉田氏は現在ソニーとソニーモバイルコミュニケーションズの両社に籍を置いて、アバターエージェントサービスのプロデューサーとして事業化のリーダーシップを取っている。ソニー本社ではアバターエージェントサービスとしてビジネス化する方向で技術を育てながら、片方のソニーモバイルからは「Xperia Ear」や「Xperia Touch」など、同じ要素技術をベースにした音声UIを搭載する商品を発売している。
城井氏はアバターエージェントサービスのプロジェクトリーダーであり、ソニーモバイルがMWCなどのイベントにプロトタイプを出展してきた「Xperia Agent」関連ニュース)の商品企画担当者でもある。
ソニー全体として長年取り組んできた音声ユーザーインターフェースに関する技術とサービスが、今回バーチャルアナウンサーとして新しい展開を迎えることになった。“沢村碧”に関してはシステム全体の機能仕様を決めるところから、製作したアバターの細かな表情や動きの設定、声優の選定に至るまで倉田氏・城井氏の仕事は多岐にわたる。
なお、声優の寿美菜子さんは沢村碧だけでなく、Xperia Earの音声UIも担当している。
ソニーが近年に発売したコンシューマーエレクトロニクス商品としては「SmartBand Talk」(関連ニュース)や、以前に本連載でも取り上げた“踊る”Bluetoothスピーカー「BSP60」(関連ニュース)にもアバターエージェントサービスと同じ音声UIの要素技術が使われている。さらにその技術をベースにインタラクティブ性を強化したシステムも、ソニー・ミュージックコミュニケーションズがAndroidデバイス向けにGoogle Playストアで配信するアプリ「めざましマネージャー」に乗っている。
「SmartBand Talkでは東芝デジタルソリューションズの合成音声作成ツール『ToSpeak』シリーズから、標準セットとして提供されている声をそのまま使っていました。Xperia Earから同じプラットフォームをベースに当社が特注したカスタムボイスを使っています。さらに、いま3つのバージョンを配信しているめざましマネージャーアプリも、それぞれのキャラクターの声優を起用したカスタムボイス仕様です」(倉田氏)
■“沢村碧”には、ソニーのどんな技術が使われている?
ソニーの新たなサービス形態であるバーチャルアナウンサー・沢村碧はどのような技術によって構成されているのだろうか。倉田氏に訊いた。
「アバターエージェントサービスについては様々な構成要素を束ねながら、キャラクターを動かしたり、細部をカスタマイズして商品として作り込んで独自のユーザー体験を提供するところにソニー独自のノウハウが活きています。いわゆる音声認識や音声合成の技術については全体のサービスを成り立たせるための“パーツ”として捉えているので、それらはケースバイケースでベストな技術を調達して組み合わせればよいと考えています」(倉田氏)
アバターエージェントサービスの制作環境はPC用アプリケーションとして落とし込まれている。制作者はニュース原稿をテキストで入力して、キャラクターの動作やカメラワークなど、用意されているプリセットの中から選んで設定するだけ。CG制作や映像機器、PCの詳しい知識がなくてもキャラクターが声でニュースを読みあげる動画ファイルを簡単に作ることができる。ソニーにとってのパートナーである共同通信デジタルはニュース作成に関わるノウハウの提供、およびアプリケーションツールの販売を担当する。
■沢村碧アナがニュースを読み上げるまでの流れ
ここからは、アプリケーションの詳細に踏み込んでいきたい。