これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。


2017/12/28 Benjamini-Hochberg 法 (1)

The New England Journal of Medicine 2017 年 12 月 21 日号に、早期産児の臍帯を結紮するタイミングについての臨床試験の結果報告が掲載された (N. Engl. J. Med. 377, 2445-2455 (2017).)。 私は最近、産科学に関心を寄せているので、この報告をチラリと拾い読みした。 そして、憤慨した。

この報告は、研究の背景についての記載が乏しいのでわかりにくく、参考文献に挙げられている Cochrane Database Syst. Rev. 8, CD003248 (2012). を参照する必要があった。 現在の主流派は、分娩に際して臍帯を速やかに結紮する。 しかし、これを 30 秒ないし 3 分程度、遅らせた方が良いのではないか、とする意見があるらしい。 というのも、母親から出て来た胎児を、やや低い場所に少しの時間置くと、胎盤や臍帯から胎児に血液が流れ込む。 体重の軽い早期産児の場合、この血液は無視できない量になり、新生児の予後を改善するのではないか、とする意見がある。

これに対し、今回の報告は、妊娠 30 週未満で生まれた児に対し、非盲検のランダム化比較対照試験を行ったところ、 結紮を遅らせることは予後を改善しなかった、とするものである。 しかし、この報告の解析は不適切である。 平たくいえば、著者らは「結紮を遅らせることは予後を改善しない」という結果を誘導するために、意図的に誤差を大きく評価したものと思われる。

著者らは、多重検定の問題について Benjamini-Hochberg 法を用いて解析したらしい。 Benjamini-Hochberg 法のやり方については、ここでは詳しく説明しないが、多重検定の教科書だけでなく、インターネット上にも解説した記載が多いので参照されると良い。 ただし、インターネット上の解説は、間違ってはいないものの、内容を真に理解して我が物とした上で書いたわけではなく、 教科書の記載を丸写ししたような記載も多いので、注意が必要である。

Benjamini-Hochberg 法が威力を発揮するのは、多数の検定を繰り返し、その大半の検定結果が「有意差あり」となるような場合である。 逆に、大半の検定は「有意差なし」となり、ごく一部でのみ「有意差あり」となるような場合の False Discovery Rate を評価するには、不当に厳しくなり、不適である。

False Discovery Rate とは何か、という点について、ここでは厳密には解説しないが、概ね次のような具合である。 たとえば、ある新薬を投与されたマウスにおいて、従来薬を投与されたマウスに比べ、遺伝子の発現具合がどう異なるかを、 マイクロアレイなり RNA シークエンシングなりの手法で解析したとする。 これらの薬は似た機序を持っているので、遺伝子の発現具合は、それほど大きくは違わないとしよう。 仮に 100,000 個の遺伝子 (非翻訳領域を含む) を調べたとして、たとえば 500 個の遺伝子だけで本当に発現具合が異なるとする。 実は厳密なことをいえば、この仮定は非現実的で、あり得ないのだが、それは別の話になるので、ここでは気にしないことにする。 さて、この状況において p = 0.01 を閾値として検定を行うと、1,000 個ぐらいの遺伝子が偽陽性となるであろう。それに対して真の陽性は 500 個なのだから、偽陽性より少ない。 つまり、検定で「有意差あり」となった 1,500 個の遺伝子のうち 1,000 個は偽陽性ということになるので、False Discovery Rate は 67 % である、と考える。

以上の議論において、我々は「500 個の遺伝子では本当に発現具合が異なる」という事実を最初から知っていると仮定したから簡単に False Discovery Rate を計算できたが、 実際には「何個の遺伝子で本当に発現具合が異なるか」は未知なので、この False Discovery Rate を正確に評価するのは難しい。 そこで、この False Discovery Rate を推定する様々な手法が編み出された。Benjamini-Hochberg 法も、その一つである。 しかし、詳細は別の機会に述べたいが、上述の例のように偽陽性が多い状況においては、Benjamini-Hochberg 法は無力である。 換言すれば、この手法は理論には整っているものの、実際に有効な場面は、かなり限られているのである。 そのことを、教科書を眺めただけで実際に統計を扱ったことがない者は、なかなか理解できない。

では、こうした状況において、どのような方法で解析すれば良いかというと、定説はない。 私は名古屋大学時代、この問題に少しばかり取り組んで、「こうすれば良いのではないか」という案をひねり出したものの、結局、未発表で終わってしまった。 たぶん、これを学術的な場で発表する機会は今後しばらく訪れないであろうから、いずれ、この日記かどこかに書こうと思う。

閑話休題、臍帯結紮の話に戻りたいのだが、だいぶ長くなってきた。続きは次回にしよう。


戻る
Copyright (c) Francesco
Valid HTML 4.01 Transitional