これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。


2014/12/04 学術論文

先日、ある論文を読んで、沸々と怒りが湧いてきた。 その論文は、いわゆる臨床研究の報告であって、ある種の患者の予後を統計学的に調べた、というものであった。 掲載していたのは、いわゆるインパクトファクターが 5 だか 6 だかある、その筋では権威があるとされる論文誌である。 その論文で結論として述べられていた内容自体は、これまで経験的に言われていたものと特に変わるところはないのだが、 それを統計学的にキチンと調べた、という点に、論文としての意義がある、と考えられたようである。 この論文には、二つの問題点があった。一つは解析手法としてロジスティック回帰分析を用いることの妥当性であり、 もう一つは統計誤差の解釈についてである。

ロジスティック回帰分析は、この種の統計解析で頻用される手法であるが、その理論的基礎については正しく理解していない研究者が少なくないように思われる。 この分析手法は、ある一つの結果が、複数の要因の複合的な影響により生じていると考える場合に、 各々の要因がどの程度の重要性を担っているかを解析するものである。 たとえば、大腸癌のリスク因子として性別、年齢、人種、喫煙習慣、食物繊維の摂取量、を検討する場合についていえば、 多数の患者について大腸癌発症の有無や、各因子の有無を調べた上で、 これらの因子がそれぞれ、どの程度、大腸癌の発症リスクを高めるかを統計学の力によって明らかにするのである。

もし、上述の説明により「フーム、そのような解析方法が存在するのか」などと納得した人がいるとすれば、 その人は、いささか心が純真であり過ぎるか、さもなければ科学的素養の乏しい人である。 上述のような、魔法のような便利な解析手法など、存在するはずがない、と直観するのが、科学者としての当たり前の感性である。 実際、ロジスティック回帰分析は「各因子は、互いに独立である」という強力な仮定に基づいている。 現実には、性別や年齢と、喫煙習慣や食物繊維の摂取量との間には相関があるだろうから、この仮定は満足されない。 すなわち、厳しい視点からすれば、こうした解析にロジスティック回帰分析は適用不能である。 もし、なんとか適用しようとするならば、相応の、何らかの特殊な工夫が必要なのである。 冒頭で述べた論文では、この独立性の仮定を満足していないにもかかわらず、何らかの工夫をした旨の記述がなかった。

また、統計を議論するならば、誤差のことを忘れるわけにはいかない。 たとえば大腸癌の罹患率の調査結果に男女差があったとしても、それが単なる統計的な誤差の範囲でないことを示さなければ、 「大腸癌の罹患率には男女差がある」という結論を導くことはできない。 それにもかかわらず、この論文では、統計誤差の議論が全くなされていなかった。 試しに私が統計誤差を自分で計算してみると、論文中で「差があった」と述べられている項目のうち少なからぬものは、統計誤差の範疇であった。

私は、著者は一体何者なのかと思って調べてみた。 すると、どうやら、某大学の、ご立派な肩書を持つセンセイ方のようである。 ということは、たぶん真相は、次のようなものであろう。 著者らは、ロジスティック回帰分析を用いることの理論上の問題や、統計誤差の問題については、よくよく理解しているはずである。 しかし、他に適切な解析方法がみあたらないため、問題点は敢えて無視して、何くわぬ顔でロジスティック回帰分析を行ったのであろう。 また、統計誤差をまともに検討すると、統計学的に有意な差があまり生じないために、敢えて誤差を議論しなかったのであろう。 そして、これを掲載した論文誌の編集者も、調査自体には意義を認めていたために、解析手法の問題については敢えて目をつぶったのであろう。

要するに、著者も編集者も、学問を冒涜しているのである。 あのような論文を読んで怒りを感じない者は、科学者ではない。


戻る
Copyright (c) Francesco
Valid HTML 4.01 Transitional