これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
なぜか、医学研究では「有意差」という言葉が好んで用いられる。 しかも恐ろしいことに、この言葉を使っている者の多くは、「有意差」という言葉の統計学的意味をよく理解していないように思われる。 今は臨床志向が強い学生であっても、たぶん就職すれば上司の命によって論文を読み、あるいは学位取得を目的として大学院に進み、 カンファレンス等で「有意差が云々」と発表することになるのであろうから、こうした統計学の基礎を理解していくことは重要である。
臨床試験において、新薬 A の有効性を確認するためには、どうするか。 二重盲検を行い、一つの群には新薬 A を、もう一つの群には従来薬 B を、投与し、転帰をみるのが普通である。 結果として「『どちらの群も、転帰は同じようなものである』と解釈するのは無理がある」ということになれば、「有意差があった」ということになる。 たとえば、致死率の高い疾患について、A 投与群における致死率が PA ± σA, B 投与群における致死率が PB ± σB と推定されたとしよう。 この σA や σB をどのように推定するか、という問題にも非常に重要で深淵な議論があるのだが、 今回の主題からは逸れるので割愛する。
簡便な方法として正規分布を仮定し、数学的な議論を省略して結論を述べれば A 群と B 群の致死率の差は (PB - PA) ± σ, ただし σ = (PA2 + PB2)1/2 である。 もし PA > PB であれば A が B より優れているとは考えにくいので論外であるから、 ここでは PA < PB の場合のみ考える。 統計学の詳細な議論は省略するが、正規分布を仮定する場合には 「実際には両者の致死率に差異がないにもかかわらず、たまたま統計的なばらつきによって PB - PA > 3 σ となる確率は 0.1 % 程度であるから、この場合、 「『どちらの群も同じ致死率である』と解釈するのは無理がある」といえる。すなわち「有意差があった」ということになる。
ここでは PB - PA の値自体は評価されていない点が問題である。 たとえば PB = 0.200, P A = 0.199 であっても、σ < 0.001 であれば「有意差あり」なのである。 だいたい研究論文には医療経済の概念が欠如しているから、有意差さえあれば、その差の大きさはあまり議論されないことが多い。
一方で、「二つの群に差異がない」ことを主張する際に、「有意差がない」という表現する人が稀にいるが、これは誤りである。 いい加減な実験や調査で、σの値が大きければ、実際には両群に大きな差があったとしても、統計的には「有意差なし」となるのである。 もし「両群に差がない」ことを主張したいのであれば、適当な正の値 d を設定して「『両群の差は d 以上である』と解釈するのは無理がある」ことを示す必要がある。 すなわち、先の例でいえば |PA - PB| < d - 3 σ であることが示されれば、 信頼度 99.9 % で、両群の差は d 未満である。
しかし不思議なことに、このように「両群に差がない」ことを示す論文は、世の中に多くない。 これが、実験的に「差がない」ことを示すのが困難な例が多いためなのか、 それとも「差がない」という主張の学術的価値が、しばしば不当に低く評価されるためであるのかは、不明である。 冷静に科学の目でみれば、「理論的には差が生じると予想される二群の間に、実際には差が生じなかった」ということを証明するのは、 「理論的に差が生じると予想された二群の間に、実際に差が生じた」という論文よりも、より重要であるように思われる。