これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
いわゆる多変量解析に対する批判は、過去に何度も書いてきた。 多変量解析というのは、結果、つまり死亡や治癒といった現象が、様々な要因、 たとえば年齢だとか病変の組織型だとかによって複雑に規定されている状況において、 それぞれの要因がどれだけ結果に影響しているかを解析するものをいう。
医学、特に臨床医学の分野では、多変量解析としてロジスティック回帰分析や Cox の比例ハザードモデルが用いられることが多い。 これらの手法それ自体は、理論的にも無理がなく、問題ない。 また、こうした手法を使えば、様々な臨床的要因が、どれだけ予後に影響しているのかを評価することができる、ようにみえる。 が、むろん、そのような魔術のような手法が現実に存在するはずはなく、素人にはみえにくい部分に、陥穽が存在する。
ロジスティック回帰分析や Cox の比例ハザードモデルが交絡因子をほぐすことができるのは、「各々の因子は互いに独立である」という仮定を用いているからである。 この仮定こそが、これらの解析法の核心なのであって、これを満足しない状況においては、これらの手法は全く意味のある結論を出さない。 逆に、このくらい強力な仮定を使わなければ、複雑に絡み合った因子を理論的に分解することなど、到底、かなわぬ。 ところが現実には、このような仮定が満足されることは稀なのだから、現実の問題に対してはロジスティック回帰分析や Cox の比例ハザードモデルは無力である。
多変量解析を実際に行った者なら、様々なパラメーターをいじることで結果は大きく変動することを知っているだろう。 あるいは、それを駆使して「なんとか有意差を出した」という経験もあるかもしれない。 いうまでもなく、そうやって創造した「結果」は、学術的には意味がなく、データの捏造に近い。 良く言っても「不適切な多重検定」にあたる。 そのあたりを理解していない者が、実に多い。
過日、月刊「病理と臨床」2016 年 3 月号を読んでいて、私はフンガイした。 ある記事において、肺癌のある組織型について「多変量解析でも独立した予後因子であった」と書かれていたのである。 もしや、と思い、この記事が引用している元論文を調べた。 案の定、その論文が使っていたのは Cox の比例ハザードモデルであった。
上述のように、Cox の比例ハザードモデルによって疾患の予後因子を調べる場合、それらの因子が互いに独立であることを事前に確定しておかねばならない。 独立性を前提として、それぞれの因子が、どれだけ強い影響を与えているのかを調べるのが Cox の比例ハザードモデルなのである。 それを理解していれば、「多変量解析でも独立した予後因子であった」などと書くはずがない。
医学者を称する人の大半は、統計学を知らずに、統計学をブラックボックスとして使っているのが現状である。 が、思い出されるのは、学生時代の臨床実習で、ある診療科における論文の抄読会に参加した時のことである。
詳しい内容は忘れたが、その抄読会で紹介されたのは臨床試験の結果報告であり、ロジスティック回帰分析を用いたものであった。 私は、「各因子の独立性は検証されているのでしょうか」と質問した。 発表者は私の質問の意図を理解できないようであったので、すかさず、中堅クラスの医師が介入した。 「彼の言う通り、こうした多変量解析は、各因子の独立性を前提として行うものであって、結果をみて独立かどうかを判定すべきものではない。 その意味において、この論文の解析は、いささか疑わしい。」という具合であった。
このあたりは、さすが名古屋大学である。