大規模クラスターデータに対する極値統計モデリングの開発

整理番号 2024a004
種別 一般研究-短期研究員
研究計画題目 大規模クラスターデータに対する極値統計モデリングの開発
研究代表者 吉田 拓真(鹿児島大学大学院理工学研究科・准教授)
研究実施期間 2024年5月13日(月) ~ 2024年5月17日(金)
研究分野のキーワード 極値統計学, スパースモデリング, 大規模クラスターデータ
本研究で得られた成果の概要 本研究は大規模クラスターデータにおけるリスク予測のための極値統計モデルの構築がテーマである.クラスターデータとは地域などの属性情報が付与されたデータで, 例えば日本全土の約1300の雨量の観測地点があり, 各観測所で降雨量がデータとして蓄積されている.この場合, 観測地点がクラスターに相当する. 豪雨災害など降雨量が多い場合, その定量的な災害リスク評価は防災行動の基準を与えるために必要なデータ科学である. このようなクラスターデータに対して極値統計モデリングによるリスクを予測する際にクラスターの関連を考慮したモデリングを行いたい.

本研究は各クラスターの極値モデルに含まれる形状パラメータをfused lasso由来のスパース法で推定し, いくつかのクラスターの分布が統合され同一視できることに着目したクラスター統合解析法を提案するものである.
本研究について, 現状は以下の成果が得られた:
(1) 極値従属性が高いクラスター同士にスパース法を適用し解釈性の高い統合が実現できた
(2) fused lassoの派生であるAdaptive fused lassoを利用するとより実情に合った統合が可能となり, 予測性能も向上した
(3) 簡便で高速なアルゴリズムを構成できた
(4) クラスター数が大きい大規模な気象データに有用であることが確認できた

今後はスパース項に含まれる調整パラメータの効率的な決定, 統計理論の構築, 提案モデリングのアルゴリズムの一般公開を目指し, 継続して研究を行う.

本研究で得られた成果を2024年度統計関連学会連合大会で報告予定である. そこで得られたコメント等を元に研究を改善し, 論文にまとめる予定である.

組織委員(研究集会)
参加者(短期共同利用)
吉田 拓真(鹿児島大学 大学院理工学研究科・准教授)
川野 秀一(九州大学 大学院数理学研究院 ・教授)