【アーカイブ配信】ランダムフォレストと因果推論の最前線を学ぶ:決定木からcausal forestsまでの理論と実践

causal forest の仕組みや、応用をする上で気をつけるべき点について演習を通して解説します

本セミナーは、2024年7月26日に開催したアーカイブセミナーです。

【学習内容】

  • 決定木を用いた因果推論に関する基礎事項(Causal trees, causal forests)を網羅的に学べます。
  • Causal forestsの理論的な性質や、結果の解釈の方法について1歩踏み込んだ内容を学べます。
  • R-package {grf}を用いて causal forestsを自分で動かすことで挙動について詳しく理解できます。

【内容】

統計的因果推論は、医学・疫学、マーケティングなど幅広い分野で注目を集めており、近年様々な書籍が出版されています。とりわけ、条件付き因果効果(特定のサブグループに対する処置効果、例えばある特徴を持つ個人に対する治療効果や広告効果)の推定は、Athey et al, (2019) で提案された causal forestsや、Hill et al,(2011)で提案された Bayesian additive regression trees (BART)を用いた方法、そのほか近年の meta-learnerの発展 に牽引され、高い注目が集まっています。

 

 本セミナーでは、ランダムフォレストを用いた異質性のある因果効果の推定手法である causal forest(Athey et al.,2019, 和名:因果フォレスト)を題材として取り上げ、causal forest の仕組みや、応用をする上で気をつけるべき点について丁寧に説明します。ランダムフォレストは分類や回帰に広く利用される機械学習アルゴリズムですが、比較的頑健性が高く、また高次元データの適用が可能である点などで、条件付因果効果の推定との相性が良い手法です。 

 初めに、causal forestを理解する上で必要となる知識である、決定木とランダムフォレストについて説明を行います。これらを踏まえ、causal forest を構成する学習器であるcausal treeを説明します。そして、causal treeのアンサンブル学習器である causal forestについて理論と実践の両面から説明を行います。 

 causal forest はRパッケージ {grf} で実装されている関係で、誰でも手軽に試すことができますが、どのような仕組みで causal forest が条件付き因果効果を推定しているのか、推定した結果をどのように扱えば良いのかについて理解するためには、理論的な側面からの理解が必要です。しかし、ランダムフォレストを支える理論の枠組みについてまとまっている書籍などは少なく、理論的な背景も複雑なため、独習するにはハードルが高いのが現状です。  

本セミナーの特徴は、大きく3つです。 

  • ランダムフォレスト/causal forestの基礎から最新の理論までを(複雑な議論を抜きに)直感的に、網羅して理解できる。 
  • causal forestを使用する利点と、ランダムフォレストに由来する手法としての弱点が理解できる。 
  • Rパッケージ {grf}を用いたcausal forestのシミュレーションを通して、理論とプログラムの出力結果の関係性を理解できる。 

また、本セミナーではcausal forestの応用事例として、擬似的なマーケティングデータ(キャンペーンの効果推定)を取り上げ、causal forestの実務への活かし方を紹介します。もちろん、例としてマーケティングを取り上げますが、医学・疫学への応用においても有用な内容となっております。 

【このような方におすすめ】

  • 異質性のある因果効果推定に興味があり、ランダムフォレストやcausal forestsの最新技術を学びたい方
  • データサイエンスに興味があり、統計的因果推論の理論と実践を深く学びたい方
  • マーケティングの効果測定に関心があり、統計的因果推論を活用してキャンペーンの効果を正確に評価したい方
  • 医療データを扱っていて、特定の治療法の効果をより正確に推定するための手法を学びたい方
  • Rプログラミングを使って機械学習モデルを実装したいが、その理論的背景も理解しておきたい方

【レクチャー】

  • 講義動画
    • 前半:53分
    • 後半:82分
  • 講義資料
    • 拡張子:PDF
    • 部数:1部
  • 演習資料
    • 言語:R言語
    • 部数:1部

【講師】

中村 知繁(順天堂大学 助教)

所属:順天堂大学健康データサイエンス学部 教授

学位:博士(工学)(慶應義塾大学)

個人HPはこちら

[経歴]

2024年7月 - 現在:順天堂大学, 大学院医学研究科 データサイエンスコース, 助教

2024年4月 - 現在:慶應義塾大学, 理工学部 数理科学科, 訪問助教

2023年4月 - 現在:順天堂大学, 健康データサイエンス学部, 助教

[最近の論文]

Time Series Quantile Regression Using Random Forests

層別化法と共変量釣り合い法による頑健な因果効果の推定

Causal Subclassification Tree Algorithm and Robust Causal Effect Estimation via Subclassification

[主な書籍等出版物]

画像診断2024年7月号Vol.44 No.8:臨床所見から考える婦人科画像診断, 齋田 司, 秀潤社, 2024年6月

【受講料金】

¥11,000

ベーシックプラン

お支払いから1ヶ月間、いつでもどこでも受講できます。

※講義動画のダウンロードはできません。

【お申し込みから受講までの流れ】

  1. 本画面上部の「受講申込はこちら(外部サイトへ遷移します)」をクリックしてください。
  2. EDRIGHTというアーカイブセミナー受講プラットフォームに遷移しますので、お支払いをお願いいたします。
  3. お支払い完了後、すぐにセミナーを受講していただけます。(受講期間はお支払いから1ヶ月間です)

【注意事項】

  • セミナーの内容に関するご質問への対応は行なっておりません
  • ご購入後の返金は致しかねますので、予めご了承ください
  • 本ページの内容は予告なく変更する場合がございます
  • 主催者のやむを得ない事情や、天災地変その他の不可抗力の事態により、本セミナーの一部あるいは全部を掲載中止させていただく場合がございます

【お問い合わせはこちら】

万が一、セミナーの資料や動画が異なる、動画や資料が閲覧できないなどの不備がございましたら、運営へお問い合わせください。

問い合わせフォームはこちら