【アーカイブ配信】NumPyroを用いた実用的なベイジアンスパース回帰

実用的なベイジアンスパース回帰とはどのようなものなのか?NumPyroでの実装を交えて解説します。

本セミナーは、2024年8月30日に開催したアーカイブセミナーです。

【学習内容】

  • 馬蹄事前分布の定義と特徴を理解し、ベイズスパース回帰の理論を学べます。
  • NumPyroを用いた馬蹄事前分布を活用した回帰分析モデルの実装方法を習得できます。
  • Regularized Horseshoe PriorやDirichlet-Laplace Priorなど最新のベイズスパース回帰手法を理解できます。

【内容】

-NumPyroとは-

NumPyroは、Uber AI、マサチューセッツ工科大学、ハーバード大学等によって開発された確率的機械学習ライブラリです。Googleにより開発された高速数値計算ライブラリJAXを基盤としており、GPUを利用することで推論を加速させることが可能であるため、複雑なベイズモデルの構築と効率的なサンプリングを可能にし、高速で推論を行うことを可能とします。

-スパース回帰とは-

データ分析の文脈で「スパース性」と聞くとき、目的変数と相関しうる多くの共変量を含むデータセットの回帰分析において、これらの共変量のうちのわずかなものだけが意味のある相関を持つという仮定のことを意味していることが多い。スパース回帰とは、どの共変量が目的変数と相関を持つのか、そしてどの程度相関しているのかを可能な限りデータからの情報のみで推定する回帰手法である。

-ベイジアンスパース回帰とは-

スパース回帰の最も有名な手法はLASSO回帰です。これは回帰モデルのパラメーターに対してL1罰則(わかりやすく言えば大きな値を取ることに対する罰)を設けることで自動的に目的変数との相関の弱い変数からパラメーターの推定値を0に向かって縮小させます。しかし、元来のLASSOは推定量の不確実性の定量化ができません。一方でベイズ的アプローチはMCMCを用いることで不確実性の定量化が比較的容易であることは、ベイズ的な視点からスパース回帰をアプローチすることが望ましいとされる理由の一つです。ベイズ的アプローチでは罰則ではなく事前分布を通してスパース性を誘発させます。今回はその事前分布の中で近年最もよく使われているものの一つである馬蹄事前分布について取り上げます。

NumPyroでベイジアンスパース回帰を行うことの利点はいくつか挙げられます。まずパッケージの高度な抽象化によりMCMCの実装が大幅に簡素化されるため、推論アルゴリズムの実装とデバグに悩まされず、モデリングに時間を充てることができます。また、NumPyroのデフォルトの推論アルゴリズムであるハミルトニアンモンテカルロとNUTSは、高次元なデータセットや複雑なモデルであっても効率的に推論を行うことができます。さらに、NumPyroはGPUを用いて推論の一部を加速させることができるため、ビックデータにも対応できます。

本セミナーでは、馬蹄事前分布のモチベーションから出発し、馬蹄事前分布の定義と特徴について解説した後に、NumPyroを用いた具体的な実装方法を通して実用的な方法を紹介します。具体的には以下のトピックについて90分で解説します。

  1. ベイジアン回帰分析における変数選択とスパース回帰の手法をレビューし、なぜ、馬蹄事前分布はベイジアンスパース回帰の手法として人気なのかを解説します。
  2. 馬蹄事前分布の定義及びその特徴について深掘りします。
  3. 馬蹄事前分布の基礎を理解したのち、実際にNumPyroによる馬蹄事前分布を用いた回帰分析モデルを実装します。ここでは、講師がハンズオン形式で実演解説しながら、受講者の皆様にもお手元で実装していただくと効果的です。
  4. 馬蹄事前分布にとどまらず、近年の最新手法も紹介します。これには「正則化馬蹄事前分布」や「Dirichlet-Laplace事前分布」などが含まれます。

このセミナーを通じて、受講者はベイズスパース回帰の理論と実践に関する一貫した理解を得るとともに、NumPyroを用いた高度な回帰分析モデルの実装スキルを習得することを目指します。

【このような方におすすめ】

  • データサイエンティスト:ベイジアン回帰モデルやベイジアンスパース回帰を実務で使用したいと思っている方。
  • データアナリスト:日常的に回帰分析を行い、より精度の高いモデルを求めている方。スパース回帰やベイズモデリングの手法を学び、ご自身の実務に応用したいと考えている方。
  • 機械学習エンジニア:特にNumPyroやJAXといった新しいツールやライブラリを用いて、実際の使用方法を学びたい方。
  • ビジネスアナリストや意思決定者:実際に手を動かす立場ではないが、ビジネスにおける意思決定のためのデータ解析に関心のある方。特に、予測モデリングの精度向上や変数選択に関する知識をインプットし、意思決定や施策改善等に役立てたい方。
  • 大学院生 / 学部生:ベイズモデリングを用いて複雑なデータ解析を行う方。または、NumPyro・ベイズスパース回帰などに興味関心があり学習する意欲のある方。

【レクチャー】

  • 講義動画:84分
  • 講義資料
    • 拡張子:PDF
    • 部数:1部
  • 演習資料
    • 言語:Python(NumPyro)
    • 部数:1部

【講師】

段 暁然(インペリアル・カレッジ・ロンドン / オックスフォード大学 博士課程)

所属:インペリアル・カレッジ・ロンドン, オックスフォード大学 / 株式会社Nospare 事業責任者

個人HP

[最近の論文]

Longitudinal population-level HIV epidemiologic and genomic surveillance highlights growing gender disparity of HIV transmission in Uganda

Psychological distress and mental health service utilization disparities in disaggregated Asian American populations, 2006–2018.

Toward precision sleep medicine: variations in sleep outcomes among disaggregated Asian Americans in the National Health Interview Survey (2006–2018)

Estimating fine age structure and time trends in human contact patterns from coarse contact data: the Bayesian rate consistency model

Growing gender disparity in HIV infection in Africa: sources and policy implications

【受講料金】

¥11,000

ベーシックプラン

お支払いから1ヶ月間、いつでもどこでも受講できます。

※講義動画のダウンロードはできません。

【お申し込みから受講までの流れ】

  1. 本画面上部の「受講申込はこちら(外部サイトへ遷移します)」をクリックしてください。
  2. EDRIGHTというアーカイブセミナー受講プラットフォームに遷移しますので、お支払いをお願いいたします。
  3. お支払い完了後、すぐにセミナーを受講していただけます。(受講期間はお支払いから1ヶ月間です)

【注意事項】

  • セミナーの内容に関するご質問への対応は行なっておりません
  • ご購入後の返金は致しかねますので、予めご了承ください
  • 本ページの内容は予告なく変更する場合がございます
  • 主催者のやむを得ない事情や、天災地変その他の不可抗力の事態により、本セミナーの一部あるいは全部を掲載中止させていただく場合がございます

【お問い合わせはこちら】

万が一、セミナーの資料や動画が異なる、動画や資料が閲覧できないなどの不備がございましたら、運営へお問い合わせください。

問い合わせフォームはこちら