これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。


2017/07/17 弁別と p 値を巡る詐術

医者の多くは、統計学を識らない。それ故に、臨床においても、研究においても、統計の詐術が蔓延している。 これには、論文を書く側が悪意をもって読者を欺いている場合と、書く側も統計に無知であるが故に誤謬を犯している場合とがあるが、いずれにせよ、論者の罪である。 科学者としては、不勉強であること自体が悪だからである。

ひとくちに「臨床研究」といえば範囲は広いが、何か二つの群を鑑別する方法を検討するような研究について考える。 たとえば、手術に際してのハイリスク群とローリスク群の患者を事前に鑑別する、とか、 ある種の臨床検査において、本当のシグナルとノイズとを鑑別する、とかいう状況を想像していただければ良い。 具体例を示すとわかりやすいのだろうが、悪口になるので、ここでは敢えて挙げないことにする。

程度の低い臨床研究で、しばしばみかけるのが、両群の間に t 検定か何かを適用して p 値が低い、有意差があった、 だから、この方法は両群の鑑別に有用と思われる、というような論法である。 統計学の見地から申し上げれば、笑止である。何の意味もない。そもそも検定とは何か、ということを理解していないから、そういう過ちを犯すのである。

Fisher's exact test にせよ t 検定にせよ、この種の「検定」というものは、「両群が全く同じ確率分布に従っているとはいえない」ということを示すためのものである。 検査所見によって患者を二群にわけた場合について考えれば、両群では、そもそも生理学的あるいは病理学的状態が異なるのだから、 手術の転帰が「全く同じ確率分布に従う」などということは、ありえない。 すなわち、充分な標本数があれば有意差が生じることは、初めからわかっているのである。それを実際に計数して「有意差あり」という結論を確認することには、何の意味もない。 ひょっとすると諸君は「やってみなければ、本当に有意差が生じるかどうか、わからないではないか」と言うかもしれぬ。 しかし、それは誤りである。やらなくても、有意差が出ることはわかっている。 それがわからないのは、単に、諸君が不勉強だからである。

両群の弁別、という観点からすれば、なおさら意味がない。 自称研究者の中には「両群で有意差があったから、このパラメーターを用いてハイリスク群とローリスク群にわけることができる」というような論法を用いる者がいるが、 これは統計学的に正しくない。 たとえば、ある検査値が、ハイリスク群の患者で 100 ± 20, ローリスク群の患者で 106 ± 20, であったとする。 両群の患者数がそれぞれ 100 人であったとすると、標準誤差は両群共に 2 であるから、t 検定で p = 0.05 を閾値とすれば、両群には有意差がある。 上述の自称研究者の論理に従えば、この検査値によってハイリスク群とローリスク群を鑑別できそうだ、ということになるが、もちろん、それは事実に反する。 両群ともに標準偏差が 20 もあるのだから、たとえば、ある患者で検査値が 95 であったとしても、それがローリスク群である可能性は充分にある。 いくら有意差があったところで、この検査値によって両群を弁別することなど、到底、不可能なのである。

「検定」という操作の意味をよく考えもせず、漠然とした非論理的思考によって物事を処理しようとするから、こういう過ちが生じる。 が、無知な相手を欺くには便利なので、こういう統計もどきが、臨床医学論文と称する文献の中には頻出しているのが現状である。


戻る
Copyright (c) Francesco
Valid HTML 4.01 Transitional