HOME > インタビュー > 2次元大勝利! ソニーのバーチャルアナウンサー「沢村碧」に会ってきた

<山本敦のAV進化論 第143回>

2次元大勝利! ソニーのバーチャルアナウンサー「沢村碧」に会ってきた

公開日 2017/08/30 09:30 山本 敦
  • Twitter
  • FaceBook
  • LINE


アバターエージェントサービスのアプリケーションでは、1本の動画を各ニュース記事ごとのプロジェクト単位で作成・管理していく。原稿をテキストボックスに文字を入力すると、音声認識専用の文法に従った「中間言語」も同時に自動生成される。中間言語とは、テキストを読みあげる際のアクセントや間合いなどの情報を記号化して本文に含めた文字列のこと。それぞれの記号が持つ意味を理解すれば読みあげの抑揚を変えたり、様々な手直しもできる。

アプリケーションは分かりやすく、かつシンプルに誰でもニュースが作成できるような仕様となっている

動画部分はオープニングとエンディング、本編といった具合にキューシート形式で管理されている。例えばオープニング動画のカメラワークをプリセットから選んで、タイトル動画、沢村碧のあいさつ動画、オープニングトークなどの有無を細かく指定することなどができる。スタジオセットの背景や、キャラクターの衣装も複数のパターンから選べるし、キャラクターの背景に静止画などを取り込んで表示するバーチャルセット機能も搭載する。テキストの入力と、すべての設定項目を決め込んだら動画をプレビューして出力。動画のフォーマットはMP4とMOVが選択可能で、解像度はフルHDとしている。

ひとつのプロジェクトをニュース記事単位で作り込む仕様としたのは、ニュース1件単位で差し替えが容易にできるようにしたかったからであると城井氏が説明する。あるニュースの情報が突然アップデートされて内容が古くなってしまった時にも、臨機応変に情報を書き換えたり追加・削除ができるので、全体に及ぼす影響を最小化できるメリットがある。

ニュース記事ごとに管理することで、状況に柔軟に対応できるようになっている

ニュース1件あたりのテキスト量は目安で300文字前後とした。その理由について城井氏は、元もとターゲットにしていた商用サイネージのニュース尺は、およそ2〜3分前後が視聴者を飽きさせない最適な長さであり、文字分量に換算するとだいたい200〜300文字程度だったからであると説いている。そこには、ソニーが昨年の8月に東京渋谷の街頭ビジョンで複数回行った実証実験から得たノウハウも活きているようだ。

沢村碧アナがPHILE WEBの紹介を読み上げる動画を視聴してみると、ナレーションと動画のリップシンクがスムーズで、キャラクターの声がとても聞きやすいのでニュースの内容が自然に染みてくる。一方で、ナレーションの尺度が長くなると、キャラクターの顔の表情や、ちょっとした体の動きのパターンがやや乏しいようにも感じてくる。

極めて自然に原稿を読み上げる沢村碧。中間言語のコツを掴むと、沢村碧が読みやすい原稿が作成できるという

城井氏によれば現在の技術でも動きのパターンはいかようにでも作り込めるが、今回はニュースを真面目に、なるべくフラットな表情とテンションで伝えることを優先してこのような仕様に収めているそうだ。今後サービスの提供先などから得たフィードバックを元に仕様の拡張も検討していくという。

見事オーディションを勝ち抜いた沢村碧のシンデレラストーリー

実証実験の段階では、実は沢村碧のほかに森下真帆という大人っぽいビジュアルのバーチャルキャラクターがいた。どちらも人気作品『ソードアートオンライン』のキャラクターデザインを手がける作画監督の足立慎吾氏に依頼してつくったキャラクターだ。沢村碧が厳しいオーディションを勝ち抜くことができた理由を倉田氏に訊ねた。

「最初は足立氏に、沢村碧と森下真帆、さらにもう一人のキャラクターデザインを制作していただきました。もう一人のキャラクターはいちばん“アニメっぽい”テイストでした。今回はニュートラルなテンションでニュースを読みあげる、バーチャルアナウンサーとしての役目にフィットする雰囲気が大事だったので、たくさんのアンケートも取った結果、最もフィットする沢村碧を選びました。お客様が複数のキャラクターを選択できる仕様も検討してみたのですが、かえって使いづらくなってしまうと考えて1人に絞り込みました」(倉田氏)

足立慎吾氏がデザインした沢村碧には、出身地などの設定や衣装パターンも用意されている

声優に寿美菜子さんを抜擢した背景についてもうかがった。

沢村碧やXperia Earの音声合成エンジンには寿美菜子さんの声が相性が良く、また別の音声合成エンジンであれば違う声との相性が良い可能性があるという

「寿さんの声がナレーション向きであるだけでなく、アバターエージェントサービスやXperia Earに採用している音声合成エンジンと相性がよく、声を気持ち良く聞けたことが大きな理由です。ほかにもいくつかの声を試してみたのですが、実際に聞いてみると声が痩せてしまいニュースの内容が聴き取りづらくなるパターンがありました。感性領域での評価なのかもしれませんが、音声合成のエンジンやアルゴリズムごとにマッチする声というものがあるようです」(倉田氏)

こうして沢村碧を主人公に迎えたアバターエージェントサービスは、現在法人向けのPC用アプリケーションソフトとして出荷を開始している。ひとつの採用事例として、9月30日から開催を予定する「第72回・えひめ国体/第17回・えひめ大会」のPR用動画、ならびにニュース番組に沢村碧キャスターが登場してイベントを盛り上げる。動画は愛媛新聞が制作する。

ソニーのブラビアやスマートスピーカーと融合する可能性は?

ソニーではアバターエージェントに関わるビジネスをどのように育てていこうとしているのだろうか。倉田氏と城井氏に考えをうかがった。

次ページSAOや冴えカノとのコラボも?

前へ 1 2 3 次へ

この記事をシェアする

  • Twitter
  • FaceBook
  • LINE

トピック: