霞と側杖を食らう

ほしいものです。なにかいただけるとしあわせです。[https://www.amazon.jp/hz/wishlist/ls/2EIEFTV4IKSIJ?ref_=wl_share]

メタアナリシスの変量効果モデルのDerSimonian-Lairdの方法の学習記録

【学習動機】

メタアナリシスの変量効果モデル(ランダム効果モデル, random effects model)で異質性つまり, 研究間の分散 \tau^2 を推定する方法としてよく使われるDerSimonian-Lairdの方法があるのだが, これが一目だとよく分からない. その周辺について, 少し調べてメモしていく.

【学習内容】

モデルのセッティング

メタアナリシスの変量効果モデル(random-effects model)では, K個の研究i の効果量(effect size)を \theta_iとし, この\theta_iは平均\theta, 分散\tau^2正規分布に従うとする(ここで, 正規分布を仮定しているが, 以下でモーメント法を使った\tau^2の推定量が出てくるが, これには分布形として正規分布に特定する必要はないはず. 平均と分散があれば十分なはず. 変量効果モデルが見えやすいから, ここでは特定している).

つまり,

 \hat{\theta_i} \sim N(\theta_i,\sigma_i^2) \\ \theta_i \sim N(\theta,\tau^2)

研究結果の統合によって\thetaを推定することがメタアナリシスの目的の一つであるのだが, その推定量は, 以下のように各研究の効果量の推定値をウェイトw_iで加重平均することで求められる.

 \hat{\theta}=\Sigma_{i=1}^{K}(w_i\hat{\theta_i})/\Sigma_{i=1}^{K}w_i

メタアナリシスでは研究間の異質性を評価することも重要であり, この変量効果モデルでは異質性は研究間の分散 \tau^2で表され, この推定量\hat{\tau^2}

\hat{\tau_{DL}}^2=max{(0, \frac{Q-(K-1)}{\Sigma_{i=1}^{K}w_i-(\Sigma_{i=1}^{K}w_i^2)/(\Sigma_{i=1}^{K}w_i)})}

ただし,  Q=\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\hat{\theta})^2

として推定できる.

ここまでで加重平均に使われるウェイト w_iについて特定していない. このウェイトによって手法が異なってくる. ウェイトを各研究の効果量の推定値の分散\hat{\sigma_i^2}の逆数を使って\hat{w_i}=\frac{1}{\hat{\sigma_i^2}}w_iに代入する手法がDerSimonian-Lairdの方法と呼ばれている. 他にもあるが, 現在よく使われているのはこの手法のようだ.

\hat{\theta_i}と独立である, \hat{\sigma_i^2}は真の分散\sigma_i^2の代用ができるという仮定が暗に置かれている.

本題

さて, 推定量\hat{\tau^2}があのような形になっているのか. 順を追って見ていく.

準備1

\hat{\theta_i}の期待値は

\begin{aligned} E[ \hat{\theta_i} | \theta_i ]=\theta_i \\ E[ \hat{\theta_i} ]=\theta \end{aligned}

\hat{\theta_i}の分散は

\begin{aligned} var( \hat{\theta_i} )=\sigma_i^2+\tau^2 \end{aligned}

準備2

\hat{\theta}=\Sigma_{i=1}^{K}(w_i\hat{\theta_i})/\Sigma_{i=1}^{K}w_i

\hat{\theta}の分散は

\begin{aligned} var( \hat{\theta} )=\frac{\Sigma_{i=1}^{K}w_i^2var(\hat{\theta_i})}{(\Sigma_{i=1}^{K}w_i)^2} \\\ =\frac{\Sigma_{i=1}^{K}w_i^2(\sigma_i^2+\tau^2)}{(\Sigma_{i=1}^{K}w_i)^2} \end{aligned}

 

準備3

統計量Qについて

\begin{aligned} Q = \Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\hat{\theta})^2 \\ = \Sigma_{i=1}^{K}w_i[(\hat{\theta_i}-\theta)-(\hat{\theta}-\theta)]^2 \\ =\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\theta)^2 - 2\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\theta)(\hat{\theta}-\theta)+\Sigma_{i=1}^{K}w_i(\hat{\theta}-\theta)^2 \\\ =\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\theta)^2 - 2(\hat{\theta}-\theta)\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\theta)+\Sigma_{i=1}^{K}w_i(\hat{\theta}-\theta)^2 \\ =\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\theta)^2 - 2(\hat{\theta}-\theta)(\hat{\theta}-\theta)\Sigma_{i=1}^{K}w_i+\Sigma_{i=1}^{K}w_i(\hat{\theta}-\theta)^2 \\ =\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\theta)^2 - (\hat{\theta}-\theta)^2\Sigma_{i=1}^{K}w_i \end{aligned}

準備4

統計量Qの期待値について

\begin{aligned} E[Q]=\Sigma_{i=1}^{K}E[w_i(\hat{\theta_i}-\hat{\theta})^2]\\ =\Sigma_{i=1}^{K}w_iE[(\hat{\theta_i}-\theta)^2] - E[(\hat{\theta}-\theta)^2]\Sigma_{i=1}^{K}w_i \\\ =\Sigma_{i=1}^{K}w_ivar(\hat{\theta_i}) - (\Sigma_{i=1}^{K}w_i)var(\hat{\theta}) \\\ =\Sigma_{i=1}^{K}w_i(\sigma_i^2+\tau^2) - (\Sigma_{i=1}^{K}w_i)\frac{\Sigma_{i=1}^{K}w_i^2(\sigma_i^2+\tau^2)}{(\Sigma_{i=1}^{K}w_i)^2} \\\ =\Sigma_{i=1}^{K}w_i(\sigma_i^2+\tau^2) - \frac{\Sigma_{i=1}^{K}w_i^2(\sigma_i^2+\tau^2)}{\Sigma_{i=1}^{K}w_i} \\\ =\tau^2(\Sigma_{i=1}^{K}w_i-\frac{\Sigma_{i=1}^{K}w_i^2}{\Sigma_{i=1}^{K}w_i})+(\Sigma_{i=1}^{K}w_i\sigma_i^2 - \frac{\Sigma_{i=1}^{K}w_i^2\sigma_i^2}{\Sigma_{i=1}^{K}w_i}) \end{aligned}

モーメント法

E[Q]\tau^2が出てくることでモーメント法を使って\tau^2を推定する動機が与えられる. (ここの説明が色々読んでみてもどれも簡素過ぎて分かりにくい気がする)

E[Q]=Q として, 推定値で置き換えていくと(ここ, 私の中でまだ完璧に理解できていない).,

 \hat{\tau}^2 = \frac{\Sigma_{i=1}^{K}w_i(\hat{\theta_i}-\hat{\theta})^2 - (\Sigma_{i=1}^{K}w_i\sigma_i^2 - \frac{\Sigma_{i=1}^{K}w_i^2\sigma_i^2}{\Sigma_{i=1}^{K}w_i})}{\Sigma_{i=1}^{K}w_i-\frac{\Sigma_{i=1}^{K}w_i^2}{\Sigma_{i=1}^{K}w_i}}

と推定量が得られる.

モーメント法によって得られた推定量だが, まだウェイトが特定されていない. ウェイトをw_i=1/\sigma_i^2とすると, DerSimonian-Lairdの方法による\tau^2の推定量が得られる. つまり,

 \hat{\tau}_{DL}^2 = \frac{Q - (K-1)}{\Sigma_{i=1}^{K}w_i-\frac{\Sigma_{i=1}^{K}w_i^2}{\Sigma_{i=1}^{K}w_i}}

ウェイトを別の量にして別の方法による推定量も得られる. つまり, DerSimonian-Lairdの方法による\tau^2の推定量はモーメント法によって得られた推定量の特殊ケースの一つなのである. 1ステップで反復計算不要なので手軽に得られる推定量なのでよく使われているが, 他にも推定量は多く提案されている(2ステップだったり, 反復計算ありだったり, そもそものモデルの枠組みがベイズの枠組みだったり). どの手法が良いのか, 数多くの研究が行われている. Veroniki et al.(2016)では, シミュレーション研究の結果から, PM(Paule and Mandel)の方法かREMLが推奨されている. イベントが滅多にない(rate)なケースや異質性が大きい(\tau^2が大きい)ケースはDerSimonian-Lairdの方法を使うのに注意が必要そう.

Higgins, Thompson and Spiegelhalter(2009)やLangan(2015)を読んでいると, 変量効果モデルでは 各研究内の分散\sigma_i^2は既知で各研究の推定値\hat{\sigma_i}^2で置き換えられるという仮定が暗黙に置かれていることが多いようだ(そうでなけれれば, \hat{\sigma_i}^2の不確実性も考慮しないといけなってもっとなるはず. この仮定が明示されていないせいで, 勉強していてとても混乱した)

【学習予定】

メタアナリシスに関する日本語文献は少なく, ネット上の情報の多くはメタアナリシスをやってみた程度のものしか見当たらないので, 日本語情報を充実させられたらと思っているので, また何か書いたら記事にしていこうと思う.

学習していた感想としては, いつもの変量効果モデルは観測値をモデル化するだけなのでデータの生成構造が明確なのでが, メタアナリシスの変量効果モデルは, 各研究の効果量を真の分布から生成するモデルを考えるわけだが, 各研究の中でのデータの生成は見ず, 要約された情報のみ観測されるため, データの生成構造が少し複雑になって難しいと感じた. 加重平均の議論も絡んでくるから分かりにくさが増える.

【参考文献】

・DerSimonian and Laird(1986)
“Meta-analysis in Clinical Trials”
https://pubmed.ncbi.nlm.nih.gov/3802833/
DL法の元論文.
“Random-effects model for meta-analysis of clinical trials: An update”というタイトルが2007年にDerSimonianとKackerによって書かれている.

・Borenstein, Rothstein, Hedges and Higgins(2009)
“Introduction to Meta-Analysis”
https://www.amazon.co.jp/dp/0470057246/ref=cm_sw_r_tw_dp_U_x_aoVVEbC468FHK
メタアナリシスの概要を把握したいならまずはこれか.

・丹後(2016)
『新版 メタ・アナリシス入門 ─エビデンスの統合をめざす統計手法─』 https://www.amazon.co.jp/dp/425412760X/ref=cm_sw_r_tw_dp_U_x_uvVVEbHAB8CCK メタアナリシスに関する数少ない日本語文献でありがたいのだが, 最初からこれだけで理解するには足りない気がする. まず概要を把握したいなら上のBorenstein, Rothstein, Hedges and Higgins(2009)から始めるといいと思う.

・Chen and Peace(2013)
“Applied Meta-Analysis with R”
https://www.amazon.co.jp/dp/1466505990/ref=cm_sw_r_tw_dp_U_x_LrVVEbPEFVNWE
Rのパッケージの使い方の前に, パッケージなしで計算の仕方を教えてくれるので良かった.
データは著者にメールしたらもらえる. Borenstein, Rothstein, Hedges and Higgins(2009)の次あたりに読んでみるといいかも.

・Schwarzer, Carpenter and Rücker(2015)
“Meta-Analysis with R”
https://www.amazon.co.jp/dp/3319214152/ref=cm_sw_r_tw_dp_U_x_cRVVEb6DJ0AF4

・Whitehead(2002)
“Meta-Analysis of Controlled Clinical Trials”
https://www.amazon.co.jp/dp/0471983705/ref=cm_sw_r_tw_dp_U_x_3tVVEb435EAZT
理解のヒントがあるかなと買ってみたけど, まだちゃんと読めてない.

・Langan(2015)
“Estimating the Heterogeneity Variance in a Random-Effects Meta-Analysis”
http://etheses.whiterose.ac.uk/13507/
博論ぽい. 変量効果モデルの異質性の分散の推定に関する論文で, このテーマに関して一番よくまとまっているように思う. 今回使ったのはVolume I.

・Higgins, Thompson and Spiegelhalter(2009)
“A re-evaluation of random-effects meta-analysis”
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2667312/
仮定とか整理されている

・超具体的至極簡単計算機番組作成指南講座
http://milkyway.sci.kagoshima-u.ac.jp/~kameno/MODELFIT/average_3.html
加重平均と誤差の話はこのへんが分かりやすいかも.

・Rukhin(2009)
“Weighted means statistics in interlaboratory studies”
https://www.semanticscholar.org/paper/Weighted-means-statistics-in-interlaboratory-Rukhin/088136d0bc86caf0fd8efe441272a40d782724db

・Cohrane(1952)
“The chi-square test of goodness of fit cochrane”
https://projecteuclid.org/euclid.aoms/1177729380
コクランの有名なやつ見つけたからメモ.

・Borenstein(2020)

"Research Note: In a meta-analysis, the I2 index does not tell us how much the effect size varies across studies"

https://www.sciencedirect.com/science/article/pii/S1836955320300163?via%3Dihub

今回は扱わなかった I^2 indexについてのリサーチノート.  “Introduction to Meta-Analysis”の著者の一人が書いてる. 偶然見かけて気になったのでここにメモ.

・Veroniki(2018)のスライド
“Methods to estimate the betweenstudy variance and to calculate uncertainty in the estimated overall effect size”
https://training.cochrane.org/sites/training.cochrane.org/files/public/uploads/resources/downloadable_resources/Methods%20to%20estimate%20the%20between-study%20variance%20and%20to%20calculate%20uncertainty%20in%20the%20estimated%20ove.pdf
分散推定の手法に関してまとまっているスライド. 2018年のものなので, 新しめの知見なはず. 手法の分類と性質を概観してくれて, 頭の整理が捗る.

・Veroniki et al. (2016)
“Methods to estimate the between-study variance and its uncertainty in meta-analysis”
https://onlinelibrary.wiley.com/doi/pdf/10.1002/jrsm.1164
上のスライドの元ネタ論文の一つ. 著者陣がメタアナリシスやネットワークメタアナリシスの論文でよく出てくるメンバーな気がする. メタアナリシスをやるなら, 必読論文な気がする. 2016年と割 と新しめの知見がまとまっているだろう. 2020年現在どうっているかまではまだ私は分かっていないが.

・長島先生の講義スライド

https://www.nshi.jp/contents/doc/meta/meta20191216.pdf

 

・自分の過去のブログ記事(2020)

moratoriamuo.hatenablog.com