causal forest の仕組みや、応用をする上で気をつけるべき点について演習を通して解説します
本セミナーは、2024年7月26日に開催したアーカイブセミナーです。
統計的因果推論は、医学・疫学、マーケティングなど幅広い分野で注目を集めており、近年様々な書籍が出版されています。とりわけ、条件付き因果効果(特定のサブグループに対する処置効果、例えばある特徴を持つ個人に対する治療効果や広告効果)の推定は、Athey et al, (2019) で提案された causal forestsや、Hill et al,(2011)で提案された Bayesian additive regression trees (BART)を用いた方法、そのほか近年の meta-learnerの発展 に牽引され、高い注目が集まっています。
本セミナーでは、ランダムフォレストを用いた異質性のある因果効果の推定手法である causal forest(Athey et al.,2019, 和名:因果フォレスト)を題材として取り上げ、causal forest の仕組みや、応用をする上で気をつけるべき点について丁寧に説明します。ランダムフォレストは分類や回帰に広く利用される機械学習アルゴリズムですが、比較的頑健性が高く、また高次元データの適用が可能である点などで、条件付因果効果の推定との相性が良い手法です。
初めに、causal forestを理解する上で必要となる知識である、決定木とランダムフォレストについて説明を行います。これらを踏まえ、causal forest を構成する学習器であるcausal treeを説明します。そして、causal treeのアンサンブル学習器である causal forestについて理論と実践の両面から説明を行います。
causal forest はRパッケージ {grf} で実装されている関係で、誰でも手軽に試すことができますが、どのような仕組みで causal forest が条件付き因果効果を推定しているのか、推定した結果をどのように扱えば良いのかについて理解するためには、理論的な側面からの理解が必要です。しかし、ランダムフォレストを支える理論の枠組みについてまとまっている書籍などは少なく、理論的な背景も複雑なため、独習するにはハードルが高いのが現状です。
本セミナーの特徴は、大きく3つです。
また、本セミナーではcausal forestの応用事例として、擬似的なマーケティングデータ(キャンペーンの効果推定)を取り上げ、causal forestの実務への活かし方を紹介します。もちろん、例としてマーケティングを取り上げますが、医学・疫学への応用においても有用な内容となっております。
中村 知繁(順天堂大学 助教)
所属:順天堂大学健康データサイエンス学部 教授
学位:博士(工学)(慶應義塾大学)
[経歴]
2024年7月 - 現在:順天堂大学, 大学院医学研究科 データサイエンスコース, 助教
2024年4月 - 現在:慶應義塾大学, 理工学部 数理科学科, 訪問助教
2023年4月 - 現在:順天堂大学, 健康データサイエンス学部, 助教
[最近の論文]
Time Series Quantile Regression Using Random Forests
Causal Subclassification Tree Algorithm and Robust Causal Effect Estimation via Subclassification
[主な書籍等出版物]
画像診断2024年7月号Vol.44 No.8:臨床所見から考える婦人科画像診断, 齋田 司, 秀潤社, 2024年6月
¥11,000
ベーシックプラン
お支払いから1ヶ月間、いつでもどこでも受講できます。
※講義動画のダウンロードはできません。
万が一、セミナーの資料や動画が異なる、動画や資料が閲覧できないなどの不備がございましたら、運営へお問い合わせください。