これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。


2017/10/23 統計学的有意差と真の差

ある人から 4 年ほど前の記事 についてコメントをいただいた。 「有意差はないが、確かに差がみられる」という表現を私がケナした点について、 「有意差があるかどうか」と「本当に差があるかどうか」を分離して考えるべきではないか、というのである。

その人の指摘した通り、この両者は、明確に分離して考えねばならない。これは、次のような例で考えると良いだろう。

まず「緑膿菌に対して、ペニシリン G を投与するのとピペラシリンを投与するので、転帰に差は生じるだろうか?」という問題を考える。 緑膿菌は基本的にペニシリン G に耐性であるが、ピペラシリンには感受性である。 これについては 昨年書いた。 そこで、仮にペニシリン G とピペラシリンを比較する臨床試験を行って「有意差なし」という結果が出たとする。

細菌学的に、ペニシリン G は緑膿菌に無効であり、ピペラシリンは基本的に有効なのだから、理論的に考えて、両者には差が生じるはずである。 それでも臨床試験で有意差が生じなかったのは、何らかの理由により統計誤差が大きく、「真の差」が誤差に埋もれてしまったのだ、と考えるべきである。 この場合、「統計的有意差はないが、本当は差がある」ということになる。

ただし、この場合、初めから差があることはわかっているので、そもそも統計学的検定を行う意味がない。 検定の結果がどうであれ「差はある」という結論は変わりないのだから、検定するだけ無駄なのである。 その意味では、統計的有意差を議論している時点で既におかしい、ともいえる。 世の中には、こういう「結果ありき」で、ハクをつけるためだけの形式的な検査が少なくないので、注意しなければならない。

次に「梅毒に対して、ペニシリン G を投与するのとメロペネムを投与するので、転帰に差は生じるだろうか?」という問題を考える。 細菌学的には、梅毒菌は例外なくペニシリン G 感受性であると考えられているし、キチンとした検証はされていないものの、メロペネムなどのカルバペネムにも感受性と推定される。 それならば、投与量が適切である限り、どちらを投与しても同様に有効なはずである。 とはいえ、何らかの事情で in vivo ではペニシリン G とカルバペネムの間で差が生じる、という可能性もなくはない。 話は逸れるが、「ペニシリン G の方がカルバペネムより有効である」という可能性もある、という点に注意が必要である。 たとえば週刊 The New England Journal of Medicine の 9 月 28 日号の Case Records (N. Engl. J. Med. 377, 1274-1282 (2017).) でも、 暗に「レプトスピラに対し、メロペネムはペニシリン G より効果が劣る可能性がある」という意味の内容が述べられている。 遺憾なことに、メロペネムの方が「強い抗菌薬」であるかのように錯覚している医者も稀ではないようだが、そういう者は細菌学や薬理学を勉強しなおさないと恥ずかしいし、 こうした議論についていけないであろう。

閑話休題、理論的にはペニシリン G もメロペネムも同じ結果になると予想されるが、もしかすると理論が不完全かもしれないので、統計学的検定で確認することは有益である。 そこで臨床試験を行ったところ「有意差はないが、少し差があるような印象を受ける」ような結果になったとする。 この場合は「両者に差がある」とは、もちろん、いえぬ。というのも、「その程度の差は偶然に生じることも考えられる」というのが「有意差はない」という言葉の意味だからである。

冒頭の「有意差はないが、確かに差がみられる」というのは、この後者のパターンの文脈であった。 理論上は差があるかないかわからないが、統計的には「有意ではない」程度の差があるようにみえた、という状況で「確かに差がみられる」と述べていたのである。 これは、統計学を無視した暴論である。 もし、この「差があるようにもみえる」という状況を議論したいのなら、たとえば 95 % 信頼区間を考えるのは有益であろう。


戻る
Copyright (c) Francesco
Valid HTML 4.01 Transitional