Loading...
Please wait, while we are loading the content...
Similar Documents
Automatic Thesaurus Construction Using Web Browsing History
| Content Provider | Semantic Scholar |
|---|---|
| Author | Yasukawa, Michiko Yamada, Atsushi |
| Copyright Year | 2004 |
| Abstract | For effective and efficient browsing and collection of information on the web, it is needed that web pages which were browsed before are archived and easy to be re-browsed. However, precise words, which can search archived pages in need of a user, are not easy to hit upon the user's idea. In this paper, we propose a method of automatic thesaurus construction using web pages browsed by user. Such a thesaurus is helpful for query expansion in searching archived web pages. We also illustrate constructed thesauri with an example. Keyword Thesaurus, Web Browsing History, Personal Archiving System 1. はじめに 近年,あらゆる情報が Web 上で提供されるようにな ってきており,Web 上で提供される情報の効率的な検 索,収集,閲覧に対する要求はますます高まっている. 著者らは,これまでに,Web 上の情報の収集と閲覧を 支援する個人用アーカイブシステム [1]を提案してき た.個人用アーカイブシステムは,WWW キャッシュ の原理に基づくアーカイブ用のプロキシ(アーカイブ プロキシ)を用いて,ユーザが閲覧した Web ページの 複製を蓄積するシステムである.アーカイブデータと して蓄積されている,既に閲覧済みの Web ページ(以 下,閲覧済み Web ページと呼ぶ)を,ユーザが効率よ く再閲覧できるようにするためには,Web ページのカ テゴライズやフィルタリング,検索などの Web ページ に対するアクセス手段を提供することが必要となる. 我々はこれまでに,ユーザが一度閲覧した Web ペー ジを後で効率よく再閲覧できるようにすることを目的 として Web 検索エンジンに対する検索語の類似度を 用いた Web ページの関連付け手法 [2]を提案してきた. Web ページのカテゴライズ,フィルタリング,検索を 含む,より高度な Web ページの閲覧支援を可能とする ためには,キーワードの関連語リスト,すなわち,広 義のシソーラスが有用であると考えられる.そこで, 本論文ではユーザの閲覧済み Web ページをもとにし たシソーラス自動構築(図 1)を提案する. 一般に,ユーザが Web ページの検索・閲覧を行う理 由や目的,ユーザの閲覧済み Web ページの内容はさま ざまである.本論文では,閲覧済み Web ページの中で も特にユーザが興味を持ったある特定の主題について の Web ページを用いてシソーラスを自動構築し,閲覧 済み Web ページを検索する際の検索質問拡張などに, 自動構築したシソーラスを用いる,ということに焦点 |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | http://www.ieice.org/iss/de/DEWS/proc/2004/paper/I-2/I-2-04.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |