公開日 2023/05/31 09:48

＜NHK技研公開＞独自の画像解析AIを活用した映像自動要約技術。SNSでの番組紹介などで活用

3DCGのカメラ位置を自動選択する技術も紹介

編集部：長濱行太朗

NHK放送技術研究所の最新の研究開発成果を一般に公開するイベント「技研公開2023」が、6月1日～4日の期間に開催される。今回、イベントに先立ってプレス向け公開が行われた。

「技研公開2023」は6/1から開催

NHK技研が目指す「Future Vision 2030-2040」の実現に向けた、「イマーシブメディア」「ユニバーサルサービス」「フロンティアサイエンス」の3つの重点分野の研究技術が披露された。本稿では、「フロンティアサイエンス」の分野から、AIを活用した番組制作支援、撮影位置自動選択技術などについての研究技術を紹介していく。

「メディアを支える研究」と「未来を創る研究」に基づいた、14項目の研究成果を展示

■画像解析AIを活用した映像自動要約技術

NHK技研が「ネット配信向けショート動画」の制作支援を目的として開発した、独自の画像解析AIを活用した番組映像自動要約システムを展示している。本技術は、既に実用されている技術のひとつであり、例えばNHK金沢放送局では、Twitterで番組内容を紹介する際などに使用されている。このように、放送局発信によりSNSなどで番組を紹介するケースなどが増加しているという。

ニュース映像自動要約システムは、多くの放送局で実用されている

技術的内容としては、元の番組映像から画像解析AIによって、重要なシーンをAIスコアの結果に基づいて、指定した要約番組の長さに合わせて自動抽出していく。この“重要なシーン”というのは、人・物・景色などの構図、ズームやパンなどのカメラワークなど、学習済みの画像特徴のデータから、AIスコアを付けている。

画像解析AIは、人手によって編集した要約映像で使われた映像区間と使われなかった映像区間の膨大なデータに基づいている

今回の展示では、元の番組映像から、「作成するもの」の項目から「ダイジェスト動画」「予告動画」が選択でき、「番組ジャンル」の項目も「指定なし」「ドキュメンタリー」「ロケ番組」「Nスぺ風」から選ぶことができていた。そして「生成する要約動画尺の目安」を決定するだけで、自動で要約動画を生成できるとのこと。

画像解析AIによるスコアの高い映像区間を抽出し、指定した番組の尺に合わせて自動で要約動画を作成する

また、画像解析AIに基づいて作成された要約動画で、例えば権利的に使用できないシーンが上がっていたり、別のシーンのほうが重要だった場合、そこから動画区間を差し替えることもできるほか、動画区間の順番も入れ替えていくことも可能だという。AIによる解析時間は、例えば30分番組であれば、その半分の15分程度で済むようだ。

「ニュース映像自動要約」のシステムも紹介されている。ニュース映像の場合、アナウンサー部分とVTR部分などが存在するが、映像は画像解析AIでVTR部分から映像を抽出し、さらに音声認識とキーワード解析を同時に行うことでアナウンサーのコメントと内容が合っている映像区間をVTR部分から抽出することができる。音声はアナウンサー部分を利用する。

ニュース映像自動要約では、画像解析AIだけでなく、音声認識、キーワード解析も行い、要約動画を生成している

■“人が良い”と感じる映像に基づきカメラ位置を自動選択

3DCGの映像制作を支援する技術である「3次元空間の撮影位置自動選択技術」では、複数の3Dモデルで構成されているシーンにおいて、“人が良い”と感じる映像を撮影するための適切な仮想カメラの位置を、独自のアルゴリズムによって自動で算出する。

映像を比較し、“人が良いと感じる”視点の評価データを学習させたアルゴリズムを採用。アルゴリズムによるスコアの高い視点の映像を導き出す

撮影位置を算出するアルゴリズムは、実際に2つの画像を比較実験して、“人が良い”と感じる主観評価データを大量に収集することで進化させてきたという。従来では、シーン内に複数の3Dモデルがある場合、手前と奥のモデルが被ってしまったりすることで、適切な撮影位置を予測することが困難であったが、アルゴリズムを導入することによって、自動選択のスコアが高い位置を選出することが可能になったとのこと。

シーンを各モデルに分解した後、そのオブジェクトの特徴を抽出し、その特徴が映像の良さに影響する度合いをスコアで示していく

デモブースでは、空間再現ディスプレイを用い、3DCG内で実際に家具を動かし配置し、レイアウトが終わった後、リアルタイムで計測を行い、すぐに最適な構図を提示していた。

撮影位置を自動で選択してくれるアルゴリズムによって、どのように適切な撮影位置を算出するのか、その過程をデモで体験できる

技研公開の会期は、前述のとおり6月1日～4日まで。入場料は無料で、事前予約の必要もない。

この記事をシェアする

1	ビックカメラ、「ブラックフライデー」セールを11/16より開始。ECサイトでは11/15 22時より先行販売スタート
2	可愛すぎる、でも本格派のCDプレーヤー。Shanling「EC Smart」で始めるデスクトップCDオーディオのススメ
3	USB-Cで何ができる？！iPhoneユーザーなら知っておきたい「できること」総ざらい
4	【ミニレビュー】グランプリ受賞の実力、フルテックの電源ケーブル「Origin Power NCF（G）」
5	実は独自の “平面” 形状！？新型振動板によるトゥルーサウンド、B＆W「Pi8」「Pi6」の魅力に迫る
6	初めてのスクリーンならシアターハウス「WCBシリーズ」が推し！高コスパで“王道シアター”
7	耳を塞がない “軟骨伝導” の音質が大幅アップ！オーディオテクニカ「ATH-CC500BT2」をシーン別にチェック
8	ビクター、“ブランド史上最軽量”のノイキャン搭載ワイヤレスヘッドホン「HA-S99N」
9	ハイエンド・ブックシェルフスピーカーの新たな息吹。音楽職人が立ち上げた新興英国ブランド・KUDOS
10	ビクター、イヤーカフ型の耳を塞がないイヤホン“nearphones”「HA-NP1T」。独自「フレキシブルアジャスト」機構を採用

＜NHK技研公開＞独自の画像解析AIを活用した映像自動要約技術。SNSでの番組紹介などで活用

■画像解析AIを活用した映像自動要約技術

■“人が良い”と感じる映像に基づきカメラ位置を自動選択

関連リンク

トピック

関連記事