放送業界向けに新たなサービス事業領域を拡大
パナソニック、音声認識を活用した文字起こしサービス「P-VoT」ベータ版を開始
パナソニック システムソリューションズ ジャパン(株)は、音声処理・音声認識技術を活用した文字起こしサービス「P-VoT」のベータ(β)版サービスの提供を、2019年6月13日から放送業界向けに開始する。なお本件の正式商用サービス開始は2019年度内に予定されている。
本サービスは、パナソニックがこれまで放送業界で培ってきたシステム技術、映像/音声処理技術を活用し、報道現場をはじめとした放送コンテンツ制作における、放送原稿制作業務の効率化・サポートするもの。具体的には、記者が動画・音声ファイルをパナソニッククラウドサービスにアップロードすると、制作現場からの戻りを待つことなく修正・編集することが可能となり、番組原稿作成業務のワークフローが40%効率化するものと想定される。
本サービスは、多層のニューラルネットワーク(Deep Neural network: DNN)技術(AI技術)を用いた高精度な音声認識により、幅広いジャンルの文字起こしに対応。グループデータ管理による複数人での修正・編集が可能としており、現場担当者がリクエスト(アップロード)、事務所での修正・編集担当者が認識結果を確認・編集できる。また認識の完了・結果の通知は登録されたユーザのみに通知され、担当者間による個別メールでの送付がないため、利便性と安全性を兼ね備えた情報管理・運用が可能だという。
ウェブブラウザで利用可能であり、リクエスト(アップロード)からテキストの修正作業まで行うことができる。そのため、特別な機器・設備を必要とせず導入できる。修正インターフェースも効率的であり、編集画面で文字をクリックすると、文字起こしした音声の位置から頭出しプレビュー再生を開始する。
再生中はプレビュー動画/音声に追従して音声認識結果にマーキング。映像・音声から発声位置を探しだす作業もクリックひとつで可能。また将来的には、プロダクトとシステムと連携することで、運用ワークフローとシームレスな連携も予定されているという。
パナソニックでは、同社がこれまで培ってきた画像・音声処理技術、システム技術と運用ノウハウをクラウドで提供するとしており、これらにより新たなサービス事業領域を拡大、社会課題である「働き方改革」に貢献するとともに、放送という情報社会インフラの永続的な安心・安全の維持・発展に貢献していくとしている。
本サービスは、パナソニックがこれまで放送業界で培ってきたシステム技術、映像/音声処理技術を活用し、報道現場をはじめとした放送コンテンツ制作における、放送原稿制作業務の効率化・サポートするもの。具体的には、記者が動画・音声ファイルをパナソニッククラウドサービスにアップロードすると、制作現場からの戻りを待つことなく修正・編集することが可能となり、番組原稿作成業務のワークフローが40%効率化するものと想定される。
本サービスは、多層のニューラルネットワーク(Deep Neural network: DNN)技術(AI技術)を用いた高精度な音声認識により、幅広いジャンルの文字起こしに対応。グループデータ管理による複数人での修正・編集が可能としており、現場担当者がリクエスト(アップロード)、事務所での修正・編集担当者が認識結果を確認・編集できる。また認識の完了・結果の通知は登録されたユーザのみに通知され、担当者間による個別メールでの送付がないため、利便性と安全性を兼ね備えた情報管理・運用が可能だという。
ウェブブラウザで利用可能であり、リクエスト(アップロード)からテキストの修正作業まで行うことができる。そのため、特別な機器・設備を必要とせず導入できる。修正インターフェースも効率的であり、編集画面で文字をクリックすると、文字起こしした音声の位置から頭出しプレビュー再生を開始する。
再生中はプレビュー動画/音声に追従して音声認識結果にマーキング。映像・音声から発声位置を探しだす作業もクリックひとつで可能。また将来的には、プロダクトとシステムと連携することで、運用ワークフローとシームレスな連携も予定されているという。
パナソニックでは、同社がこれまで培ってきた画像・音声処理技術、システム技術と運用ノウハウをクラウドで提供するとしており、これらにより新たなサービス事業領域を拡大、社会課題である「働き方改革」に貢献するとともに、放送という情報社会インフラの永続的な安心・安全の維持・発展に貢献していくとしている。