Loading...
Please wait, while we are loading the content...
Similar Documents
相関時系列データ集合の計算のための高速アルゴリズム Fast Algorithms for Correlated Time-series Set Computation 天方 大地
| Content Provider | Semantic Scholar |
|---|---|
| Author | Amagata, Daichi Hara, Takahiro |
| Copyright Year | 2017 |
| Abstract | 1. はじめに 時系列データは、連続的に観測されたデータのシーケン ス(列)である。時系列データの解析およびマイニングは、 行動分析、経済市場、センサネットワーク、およびデータ センタなどに代表される、大量のデータを生成する多くの アプリケーションにとって必要不可欠である。そのため、 クラスタリング[1]やクラス分類[2]、類似検索[3]等の分析 技術に関する研究が盛んに行われている。本論文では、時 系列データの相関の発見に関する問題に着目する。時系列 データの相関の発見も時系列データ分析の重要なツールと して知られている[4]。 多くのデータマイニングタスクにとって、与えられたデ ータ集合から未知のパターンを発見するツールは、そのデ ータ集合に潜在するルールや特徴を抽出する重要な役割を 果たす。互いに相関し合うデータの集合は、そのようなパ ターンを示すことが直感的に分かる。一般的に、データ集 合のサイズは非常に大きいため、ビジュアライゼーション により相関し合うデータを探索することは非現実的である。 そのため、与えられたデータ集合から、相関し合うデータ のみを効率的に抽出する問題に取り組む。ある 2 つの時系 列データttおよびtt′のピアソン相関をρρ(tt, tt′)とする。ユーザ が指定する出力の集合のサイズをkk、ピアソン相関の閾値 をθθとする。時系列データの集合 T が与えられた時、本問 題は、T の部分集合であるAAを計算する。AAは、|AA| = kkであ り、∀tt, tt′ ∈ AA に対して、ρρ(tt, tt′) ≥ θθを満たし、ρρ(tt, tt′)の最 小値が最大化されたものである。また、AAを相関時系列デ ータ集合と呼ぶ.(2 章にて定義を紹介する。)本問題は、 パターン検出、データ探索、および科学的観察のサポート に役立つ。例えば図1は、StarLightCurves1 データにおける 相関時系列データ集合(kk = 50,θθ = 0.8)を表しており、 50 個の時系列データ(光度曲線)がこのパターンを表して いる。光度曲線は、恒星で起きているイベントや内部で起 きている処理を表していることが知られている。そのため、 この問題で得た結果(図 1)から、専門家は頻繁に起きて いるイベントやデータが観測された時に何が起きていたか を知ることができる。 |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://www.ipsj.or.jp/award/9faeag0000004f1r-att/CD-002.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |