複数のデータをレコード単位で結合するためのデータリンケージの手法の基礎事項からその注意点までを解説します
本セミナーは、2024年6月17日に開催したアーカイブセミナーです。
本セミナーでは、異なるデータをレコード単位で結合するための手法であるデータリンケージの基礎的事項について説明を行います。データリンケージの手法によって特性の異なる様々なデータをリンケージ(結合)することにより、新たな調査・データ収集を行うことなく豊富な情報を持つデータを構築することが可能になります。
例えば、国立研究開発法人国立がん研究センタの研究グループは、国勢調査と人口動態統計(死亡票)の匿名化個票データのリンケージにより、日本人の教育歴ごとの死因別死亡率を推計しました。
データリンケージには大きく分けて以下の2種類の方法があります。
(1)完全照合(ExactMatching):各レコードを識別できる照合キー(共通一連番号,名称,所在地など)が利用できる場合、それらを基にレコードをリンケージする方法
(2)統計的マッチング(StatisticalMatching):各データに共通の情報を基に類似したレコードをリンケージする方法
本セミナーでは、これらの手法の理論的背景や研究・応用の事例、データリンケージの手法を実際のデータに適用する場合の留意点等について紹介・解説を行います。
データリンケージは、例えば、実務において出所の異なる様々なデータの名寄せなどに用いられるほか、性質の異なる複数のデータを結合した上で、こうした変数の豊富なデータに対して計量経済学の手法を適用した分析を行うなど、研究面での応用事例も多くあります。本セミナーでは、このような実務や研究におけるデータリンケージの活用事例についても紹介します。
データリンケージについては、国内外で様々な研究や実践の事例が多く蓄積されているものの、それらの理論的背景を体系的に解説し、実際のデータに活用する際の留意点などについて解説している日本語の書籍は、見当たりません。本セミナーでは、参考となる海外の文献や研究の内容についても紹介・解説を行います。
データリンケージの手法を手軽に活用できるRのパッケージも多く提供されており、本セミナーではこれらのパッケージとデータを用いた演習を通じて、データリンケージの手法の使用方法や適用時に留意すべき点を紹介し、「データリンケージの理論的背景や留意点等を理解した上で、それらの手法を実際のデータに活用できる」ようになることを目指します。
高部 勲(立正大学 教授)
[略歴]
2023年5月 - 現在:財務省, 財務総合政策研究所, 客員研究官
2023年4月 - 現在:公益財団法人統計情報研究開発センター, 客員研究員
2023年4月 - 現在:総務省, 統計技術アドバイザー
2022年8月 - 現在:総務省, 統計データ利活用センター, 統計データ二次的利用研究官
2022年4月 - 現在:統計数理研究所, 客員教授
2021年6月 - 現在:総務省 統計研究研修所, 客員教授
2021年4月 - 現在:立正大学, データサイエンス研究所, 所員
2021年4月 - 現在:滋賀大学, 特任教授
2021年4月 - 現在:立正大学, データサイエンス学部, 教授
¥11,000
ベーシックプラン
お支払いから1ヶ月間、いつでもどこでも受講できます。
※講義動画のダウンロードはできません。
万が一、セミナーの資料や動画が異なる、動画や資料が閲覧できないなどの不備がございましたら、運営へお問い合わせください。