これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。


2017/07/19 不正な統計解析

この日記では、原則として、個人攻撃は行わない。 ただし、公表された論文の内容に対する攻撃は、行う。 科学者である以上、自身の研究を世に公開する以上、徹底的な科学的批判に曝されるのは当然であって、それを覚悟していない者は科学者たる資格がない。

今回、問題にするのはスペインの David Bernal-Bello を筆頭著者とする Autoimmun. Rev. 16, 461-468 (2017). である。 これは、全身性硬化症 (Systemic Sclerosis) の患者を対象にした後ろ向き研究であって、抗 PM/Scl 抗体陽性であることは発癌リスクであり、 またアスピリン投与を受けていることは発癌しにくい因子である、とする報告である。 しかし、この論文は統計解析の手法が著しく不適切であり、医学的価値がない。 著者は、統計学に無知であるか、あるいは悪意によって恣意的な結論を誘導したものと思われる。

この報告では、多重検定の取り扱いが不正なのである。 たとえば患者が全身性硬化症に対して受けた治療内容と発癌頻度の関係についての「解析」では、 治療内容毎に発癌した患者と発癌しなかった患者の間における p 値を計算し、たとえばアスピリン投与については「p < 0.05 であり有意差があった」としている。 しかし冷静に考えればわかるように、20 種類の治療内容について、それぞれ検定を行って p 値を計算したならば、 本当はどの治療内容についても差がなかったとしても、1 つぐらいは偶然に p < 0.05 となるような偏りが生じるのは自然なことである。 それが p 値というものの、そもそもの定義だからである。 だから、この場合、アスピリン投与について p < 0.05 であったとしても、それをもって「有意な差があった」とするのは不適切である。 このように、検定を繰り返す場合には、単に p 値が小さいことをもって「有意である」と主張することはできない。これが多重検定の問題である。

では、どのように扱うのが適切なのかというと、残念ながら定説はない。 最も単純なのは Bonferroni の方法であるが、これは不当に厳しすぎることが知られている。 Holm の方法は、Bonferroni 法よりは緩く、しかも論理的妥当性を保っているが、たぶん、今回の報告に Holm 法を適用したならば、全く有意差は出なかったであろう。 他には False Positive Rate で評価する流儀もあるが、これも、今回の報告に適用したならば、有意差は認められなかったと思われる。

著者が敢えて多重検定の問題を無視したのか、それとも単に多重検定の問題を知らなかったのかは、どうでも良い。 いずれにせよ著者の科学者としての程度が低いことには変わりがないからである。 問題なのは、こうした統計学的に不当な、はっきりいえば不正な解析を行っている論文が、公然と出版されていることである。 この論文を掲載した Autoimmunity Reviews という雑誌は、一部の研究者が好む Impact Factor でいえば 8.961 であり、割と評価が高い、ということになる。 しかし、この程度の論文を掲載しているようでは、この雑誌の科学的水準は低いと言わざるを得ない。

要するに、Impact Factor などというものはアテにならない。ピアレビューなどというものも、信用できない。 そして臨床医学をやっている人々には、統計学について、あまりにも無知であり、科学研究を遂行する能力に乏しい者が少なくない。


戻る
Copyright (c) Francesco
Valid HTML 4.01 Transitional