ビジネスと技術の狭間で

データを活用して生きていく

疫学・公衆衛生統計講座を受けてきました

前回のブログを書いた4月は週5労働でしたが
6月からは週4に減らして働いています。
諸々のスケジューリングのしやすさなどから言っても週4が良いですね。

そんなところで都合よく週1程度で開催される統数研の公開講座を見つけました。
ism-rcmhds-2019-04.peatix.com

内容は、疫学で用いられる分析手法について広く基礎を学べるもので
受講料は全て無料という大変恵まれたものでした。

ターゲットは「大学や企業の生物統計家を中心とする医学系研究者」ということで
私はど真ん中のターゲットではありませんでしたが、
過去に医療分野でGLMMを用いた経時データ解析を行った経験があったり
最近でもマーケティング分野でコホート的な観点や因果推論の観点での分析が
必要になりそうだったので応募してみたところ
どの程度の倍率だったかは分かりませんが運よく当選して参加できました。

全9回(5日間)終わってみて想定通り非常に満足度が高い内容でしたので、
各回の内容と感想を簡単にまとめておこうと思います。

第1回

日時:2019年9月30日(月)15:30~17:00
講師:大橋靖雄 教授(中央大学
内容:疫学・公衆衛生学概論
感想:Public Healthは医療とは異なるというお話から始まり、
   発展の歴史、国内におけるEBMの弱さなどの説明。
   技術的な話はほとんどなかったものの、
   個人的には興味関心を高められる内容で面白かった。
   Public Healthは限られたリソースで如何に社会の利益を高めるかという
   オペレーションズリサーチ的な問題なのだという解説が印象に残った。

第2回

日時:2019年10月3日(木)13:30~15:00
講師:佐藤俊哉 教授(京都大学
内容:疫学I 疫学とはなにか?
感想:前半は大橋先生のお話にもあったDr. John Snowのコレラの話や、
   アスピリンとライ症候群の話を通して
   「自然実験」やさまざまな「バイアス」について説明。
   ケースコントロール研究において、以下のようなことが起こりやすいというのは
   注意していてもうっかりハマってしまいそうだなと思った。
    ・ライ症候群患児の親はアスピリンが使用されたことを思い出しやすい
     (Recall bias)
    ・アスピリンを投与された子供はライ症候群と診断されやすい
     (Diagnostic bias)
    ・ライ症候群にアスピリン使用があると報告されやすい
     (Reporting bias)

   観察研究においてバイアスが入ることは当然なので
   FDAの統計審査官のRobert Temple氏は
   「リスク比が3倍か4倍以上の結果でなければ忘れることにしている」と
   発言しているという余談も興味深かった。

   また「因果関係が証明されていないことを理由に
   公衆衛生対策が遅れてはならない」というメッセージも強く印象に残った。
   仮説が正しかった時と誤っていた時それぞれについて
   アクションを起こす利益と不利益を計算して判断がなされるべきという
   説明についてはまったくその通りで、これは公衆衛生に限らないことだなと。

第3回

日時:2019年10月3日(木)15:30~17:00
講師:佐藤俊哉 教授(京都大学
内容:疫学II 代表的な疫学研究:コホート研究とケース・コントロール研究
感想:後半は佐藤先生が関わった過去のプロジェクトを具体例として挙げての説明。
   サンプルサイズの決定は予算の制約を受けること、
   予算制約の中で効率性を高めるための
   二段階ケースコントロール研究があることなどが紹介された。
   前後半合わせて資料も説明も大変分かりやすかった。

第4回

日時:2019年10月11日(金)13:30~15:00
講師:中村隆 特任教授(神戸女子大学統計数理研究所名誉教授)
内容:年齢・時代・世代効果I
感想:統計数理研究所で実施している「日本人の国民性調査」を題材として
   その中で使われている統計モデルに関するお話。
   www.ism.ac.jp
   モデルに関する線形代数の操作については
   所々にみっちり説明があり大学1年生向けの講義の様な印象だった。
   ABIC(赤池ベイズ型情報量規準)を用いて
   モデル選択をしているとのことだったが
   その辺りについては詳しい解説はなく、やや消化不良。
   そんなに興味のある指標でないので構わない。

第5回

日時:2019年10月11日(金)15:30~17:00
講師:船渡川伊久子 准教授(統計数理研究所
内容:経時データ解析
感想:経時データ解析ではGLMMが頻繁に使われるとのことで
   線形モデルの基礎から丁寧に説明いただいた。
   説明は分かりやすかったがボリュームが多く
   後半はついていけない部分もあった。
   また、最後に少しだけ欠測(MCAR, MAR, MNAR)に関するお話もあった。

   冒頭に船渡川先生が書かれている本が紹介されていたが
   目次を見る限り、経時データ解析について気になることは網羅されていそう。
   (低い評価が付いてるのが気になるけど、、)
   

経時データ解析 (統計解析スタンダード)

経時データ解析 (統計解析スタンダード)

第6回

日時:2019年10月18日(金)13:30~15:00
講師:中村隆 特任教授(神戸女子大学統計数理研究所名誉教授)
内容:年齢・時代・世代効果II
感想:前回の続き。
   前回の講義ではモデルを意識するような説明が少なかったけれども
   今回はガッツリとした説明があった。
   自分としては手で解くモチベーションはないので丁寧過ぎて重かった。
   前回出てきたABICについても少し説明があったが
   依然としてどういう良さのある指標なのかなどの説明はなかった。
   今だとWAICを使っておけば間違いない?

第7回

日時:2019年10月18日(金)15:30~17:00
講師:篠崎智大 講師(東京理科大学
内容:因果推論I
感想:因果推論の基礎的なお話。
   全体を通して、どのような仮定の下に行える議論であるのかが
   明確に説明され非常に分かりやすかった。
   層別解析から始まり傾向スコアの導入も自然で
   一気にIPWまで説明があったが消化不良感は少ない。

第8回

日時:2019年11月11日(月)13:30~15:00
講師:丹後俊郎 センター長(医学統計学研究センター)
内容:健康指標のベイジアン推測
感想:ベイズ統計のざっくりした説明と空間統計での応用について紹介。
   複雑なモデルを使うほど生データの当てはまりについての検討を
   疎かにしがちなので、そこは注意しなければならないと強調されていた。

第9回

日時:2019年11月11日(月)15:20~16:50
講師:篠崎智大 講師(東京理科大学
内容:因果推論II
感想:前回の復習から丁寧に説明いただいたため、
   終盤の二重ロバスト推定の説明が薄く、惜しく思った。
   交絡を調整する基本方針は、層別できるなら層別するのがよく、
   交絡変数が多すぎて層別できないときは
   モデルを使うことで「層別できた場合」の結果を近似すれば良いらしい。
   ただ「回帰モデルから算出される値はあくまで近似であるので
   元のデータから素直に算出される値の方が正しい」というような
   説明については違和感があった。
   当然全てのモデルは間違っているのだけれども
   実測値から単純に計算した値の方が
   常により真実に近いわけではないと思うので、、

   傾向スコアを用いることで推定される効果が
   条件付き効果なのか周辺効果なのか意識するというのは重要なことだと思った。

   また、傾向スコアを求める際に
   暴露に強く関連する変数は含めるべきでないというのは知らなかった。
   これはモデルの判別力を高くし過ぎたくない
   (傾向スコアの分布を分離させすぎたくない)という都合があるらしい。
   実務的な変数選択について以下の論文に詳しくまとまっているとのこと。
   VanderWeele, European Journal of Epi 2019
   https://link.springer.com/content/pdf/10.1007%2Fs10654-019-00494-6.pdf

その他

いくつかの講義で触れられていた書籍。
今回の講座の内容と合致していて復習にも良さそうだったので購入した。
年明けぐらいまでには読みたい。

ロスマンの疫学 第2版

ロスマンの疫学 第2版

通常の公開講座は朝から開講されているので
いつもは脇目も降らず通り過ぎる立川駅だが、
午後からの開講ということもあり、いくつかお店を開拓した。

いずれも偶然見つけたり間違って入ってしまったお店だったが美味しかった。

retty.me

retty.me


f:id:fqz7c3:20190930143933j:plain
昭和記念公園手前の公園。
この日は曇っていたが広々としていて気持ち良かった。
統数研までモノレールを使わず歩いて行くのもリフレッシュできて良い。


最後に、オーガナイザーの船渡川先生および
全てのご講義いただいた先生方に感謝申し上げます。