Loading...
Please wait, while we are loading the content...
Similar Documents
Automatic Generation of a Multimedia Encyclopedia from TV Programs
| Content Provider | Semantic Scholar |
|---|---|
| Author | Miura, Kikuka Yamada, Ichiro Sumiyoshi, Hideki Yagi, Nobuyuki Okumura, Manabu Tokunaga, Takenobu |
| Copyright Year | 2008 |
| Abstract | 放送局では多種多様な番組が大量に制作されており,効 率的な番組の蓄積と有効利用も求められている.NHKでは, 現在,NHKアーカイブスとして約60万本もの番組を蓄積 しており,そのうち約6,000本を公開ライブラリーとして一 般向けに提供している.しかし,大部分の番組は新たな番 組制作のために局内で参照される程度で,充分活用されて いるとは言いがたい.放送番組には,良質で信頼性の高い 情報が豊富に含まれるため,重要な情報を取出せればそれ らを新たなコンテンツサービスの資源として利用できる. われわれはそのサービスの一つに,マルチメディア百科事 典を考えている.放送された番組から特定のシーンや情 報を抽出し,それらを集めて映像データベースを構築する ことで,映像付きの百科事典として活用する.例えば,自 然や動物を扱う番組からは動物が映っている映像区間や, 肉食・夜光性といった習性など,紀行番組からは歴史建造 物やその土地の行事など,料理番組からは料理レシピなど, あらゆる番組からさまざまな知識を収集することを想定し ている. 番組をマルチメディア百科事典のような用途に活用する ためには,番組のどの映像区間に何(被写体)が映っている のかという情報(メタデータ)が重要な役割を果たす.しか し,番組のほとんどはメタデータを付与されていない状態 にあり,大量の番組に人手で付与していては多大な時間と コストがかかる.そこでわれわれは,自動で番組を解析し てメタデータを生成する研究を進めている.特に,映像 の被写体が何であるかは,映像を2次利用する上で重要な 情報であるが,画像認識による解析は番組映像のようにあ らゆる条件の被写体を特定するには困難であり,映像とと もに扱われる文字,音声や言語情報を材料とするのが現実 的だと思われる. 総務省では,聴覚障害者のために2007年までに付与可能 なすべてのテレビ番組で字幕放送を行うことを目標に掲げ ており,字幕放送番組が近年急激に増加している.この字 幕情報(以後,「クローズドキャプション」)は,番組中の出 演者の発話内容やナレーションをもとに作成されている. そのため,映像内容を説明した文章を多く含んでおり,映 Abstract This paper proposes a method for automatically generating a multimedia encyclopedia composed of video clips using closed-caption text information. The goal is to automatically index each video segment of the television program by the principal video object. We focus on several features of the closed-caption text style in order to identify the principal video objects. Using Quinlan's C4.5 decision-tree learning algorithm and the predicted accuracies of production rule indicators, we extract one object noun for each video shot. To show the effectiveness of the method, we conducted experiments on the extraction of video segments in which animals appear in twenty television programs on animals and nature. We obtained a precision rate of 74.6 percent and a recall rate of 51.4 percent on the extraction of video segments in which animals appear, and generated a multimedia encyclopedia comprising 322 video clips showing 82 kinds of animals. |
| Starting Page | 110 |
| Ending Page | 116 |
| Page Count | 7 |
| File Format | PDF HTM / HTML |
| DOI | 10.3169/itej.62.110 |
| Volume Number | 62 |
| Alternate Webpage(s) | https://www.cl.c.titech.ac.jp/_media/publication/616.pdf |
| Alternate Webpage(s) | https://doi.org/10.3169/itej.62.110 |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |