パナソニック、音声認識を活用した文字起こしサービス「P-VoT」ベータ版を開始

公開日 2019/04/18 15:48 Senka21編集部徳田ゆかり

パナソニックシステムソリューションズジャパン（株）は、音声処理・音声認識技術を活用した文字起こしサービス「P-VoT」のベータ（β）版サービスの提供を、2019年6月13日から放送業界向けに開始する。なお本件の正式商用サービス開始は2019年度内に予定されている。

本サービスは、パナソニックがこれまで放送業界で培ってきたシステム技術、映像／音声処理技術を活用し、報道現場をはじめとした放送コンテンツ制作における、放送原稿制作業務の効率化・サポートするもの。具体的には、記者が動画・音声ファイルをパナソニッククラウドサービスにアップロードすると、制作現場からの戻りを待つことなく修正・編集することが可能となり、番組原稿作成業務のワークフローが40％効率化するものと想定される。

「P-VoT」サービスイメージ

本サービスは、多層のニューラルネットワーク（Deep Neural network: DNN）技術（AI技術）を用いた高精度な音声認識により、幅広いジャンルの文字起こしに対応。グループデータ管理による複数人での修正・編集が可能としており、現場担当者がリクエスト（アップロード）、事務所での修正・編集担当者が認識結果を確認・編集できる。また認識の完了・結果の通知は登録されたユーザのみに通知され、担当者間による個別メールでの送付がないため、利便性と安全性を兼ね備えた情報管理・運用が可能だという。

ウェブブラウザで利用可能であり、リクエスト（アップロード）からテキストの修正作業まで行うことができる。そのため、特別な機器・設備を必要とせず導入できる。修正インターフェースも効率的であり、編集画面で文字をクリックすると、文字起こしした音声の位置から頭出しプレビュー再生を開始する。

再生中はプレビュー動画／音声に追従して音声認識結果にマーキング。映像・音声から発声位置を探しだす作業もクリックひとつで可能。また将来的には、プロダクトとシステムと連携することで、運用ワークフローとシームレスな連携も予定されているという。

パナソニックでは、同社がこれまで培ってきた画像・音声処理技術、システム技術と運用ノウハウをクラウドで提供するとしており、これらにより新たなサービス事業領域を拡大、社会課題である「働き方改革」に貢献するとともに、放送という情報社会インフラの永続的な安心・安全の維持・発展に貢献していくとしている。

この記事をシェアする

	AV／シアター記事 RSS
	ファイルウェブX（旧Twitter）
	ファイルウェブFacebookページ
	ホームシアターファイルFacebookページ

パナソニック、音声認識を活用した文字起こしサービス「P-VoT」ベータ版を開始

関連リンク

トピック

関連記事