HOME > ニュース > AV&ホームシアターニュース
公開日 2001/09/14 18:28
日立、MPEG−7に準拠した映像検索技術を開発
●日立製作所中央研究所は、大容量のデジタル映像から見たいシーンを瞬時に検索するMPEG−7準拠の映像検索技術を開発した。本技術は、映像検索のための目印として映像に加える“画像特徴量”を大幅に節減し、画像特徴量の蓄積に必要なコストや検索時間を半減することが可能である。ISO/IECの次期国際標準MPEG-7(Moving Picture Experts Group Phase 7)に提案し、最終委員会草案に採択されている。
ブロードバンド時代の到来とともに、テキスト、映像、音声がすべてデジタル化され、オフィスや家庭においてもマルチメディア・コンテンツを大量に蓄積する時代が近づいている。このため大量のコンテンツの中から、自分の欲しいデータを瞬時に提示したり自動収集したりする手段が、以前にも増して重要となる。現在、ISO/IEC において、マルチメディア検索を目的とした標準規格MPEG-7の規格化が進められ、当社もこれに参画している。MPEG-1、MPEG-2、MPEG-4が映像・音声データの圧縮方式に関する標準規格であるのに対し、MPEG-7は音声や画像、映像などの各マルチメディア・コンテンツについて、検索時の照合に用いるためのデータ(タグ情報)の記述方式を制定しようとするもの。
このような背景のもと、日立製作所中央研究所では、ユーザが指定した映像と色や構図が似通った映像シーンを見つけ出す、類似映像高速検索技術を開発した。各映像シーンに付加するタグ情報の記述量を従来方式の半分以下にすると共に、照合のための新アルゴリズムを開発し、高速且つ高精度での検索を可能とした。技術の特長は以下の通りである。
(1)映像特徴量の低コスト記述方式:同じ特徴量が連続するフレーム画像を一まとめにし、まとめたフレーム画像群毎に特徴量を記述する方式を開発した。これによって、 映像中のフレーム画像1枚ごとに特徴量を記述していた従来法に比べて、特徴量の記述量を平均20%程度に低減し、画像特徴量の蓄積に必要なコストを半減することが可能となった。1枚のCD−ROMに、約1年分の映像の特徴記述を蓄積できる。
(2)映像シーンの高速照合方式:映像検索を行う際の映像シーンの照合方式として、上記の技術によって、まとめられたフレーム画像同士の特徴量を直接比較するアルゴリズムを開発した。これによって、検索時間を従来方式の平均50%に短縮することが可能となった。
今回開発した技術は、数十MHz程度の動作速度の組込みCPU、DSPへのソフトウェア実装が可能であり、映像端末等への搭載が可能である。開発技術を用いると、24時間分のテレビ映像データベースの中から、指定シーンの検索が1秒以内(450MHz程度のCPUの場合)で実現可能となる。
今回開発した技術は、検索精度を保持しながら検索に必要なデータの蓄積コストや検索時間を大幅に低減することが可能。この技術は、放送局や大学などにおける大規模なデジタルアーカイブシステムから民生用ホームビデオサーバに至るまで、大量のデジタル映像の検索に応用可能である。今後、開発技術を、当社MPEG-4映像管理配信システム「MEDIAHALL」に適用していくとともに、モバイル、高速インターネット向けの映像配信システムや、映像アーカイブシステム、映像製作支援システムへ展開していく予定。
なお、本技術の一部は通信・放送機構(Telecommunications Advancement Organization of Japan; TAO)からの委託研究「情報家電向けコンテンツ表現システムの研究開発」にて開発している。
ブロードバンド時代の到来とともに、テキスト、映像、音声がすべてデジタル化され、オフィスや家庭においてもマルチメディア・コンテンツを大量に蓄積する時代が近づいている。このため大量のコンテンツの中から、自分の欲しいデータを瞬時に提示したり自動収集したりする手段が、以前にも増して重要となる。現在、ISO/IEC において、マルチメディア検索を目的とした標準規格MPEG-7の規格化が進められ、当社もこれに参画している。MPEG-1、MPEG-2、MPEG-4が映像・音声データの圧縮方式に関する標準規格であるのに対し、MPEG-7は音声や画像、映像などの各マルチメディア・コンテンツについて、検索時の照合に用いるためのデータ(タグ情報)の記述方式を制定しようとするもの。
このような背景のもと、日立製作所中央研究所では、ユーザが指定した映像と色や構図が似通った映像シーンを見つけ出す、類似映像高速検索技術を開発した。各映像シーンに付加するタグ情報の記述量を従来方式の半分以下にすると共に、照合のための新アルゴリズムを開発し、高速且つ高精度での検索を可能とした。技術の特長は以下の通りである。
(1)映像特徴量の低コスト記述方式:同じ特徴量が連続するフレーム画像を一まとめにし、まとめたフレーム画像群毎に特徴量を記述する方式を開発した。これによって、 映像中のフレーム画像1枚ごとに特徴量を記述していた従来法に比べて、特徴量の記述量を平均20%程度に低減し、画像特徴量の蓄積に必要なコストを半減することが可能となった。1枚のCD−ROMに、約1年分の映像の特徴記述を蓄積できる。
(2)映像シーンの高速照合方式:映像検索を行う際の映像シーンの照合方式として、上記の技術によって、まとめられたフレーム画像同士の特徴量を直接比較するアルゴリズムを開発した。これによって、検索時間を従来方式の平均50%に短縮することが可能となった。
今回開発した技術は、数十MHz程度の動作速度の組込みCPU、DSPへのソフトウェア実装が可能であり、映像端末等への搭載が可能である。開発技術を用いると、24時間分のテレビ映像データベースの中から、指定シーンの検索が1秒以内(450MHz程度のCPUの場合)で実現可能となる。
今回開発した技術は、検索精度を保持しながら検索に必要なデータの蓄積コストや検索時間を大幅に低減することが可能。この技術は、放送局や大学などにおける大規模なデジタルアーカイブシステムから民生用ホームビデオサーバに至るまで、大量のデジタル映像の検索に応用可能である。今後、開発技術を、当社MPEG-4映像管理配信システム「MEDIAHALL」に適用していくとともに、モバイル、高速インターネット向けの映像配信システムや、映像アーカイブシステム、映像製作支援システムへ展開していく予定。
なお、本技術の一部は通信・放送機構(Telecommunications Advancement Organization of Japan; TAO)からの委託研究「情報家電向けコンテンツ表現システムの研究開発」にて開発している。