これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
常々、私は、医学科生や研修医向けに推薦できる統計の入門書はないものかと思っていた。 本当は、小針アキ宏『確率・統計入門』(岩波書店, 1973 年) のような、古典的なキチンとした教科書を読むのが良いのだろうが、 現実的には、一般の医学科生や研修医には荷が重いであろう。 ある日、「臨床検査」であっただろうか、医学書院が発行している雑誌を眺めていた際に、標題の書物の広告が目に入った。 「今日から使える」という、いかにもアンチョコ的なタイトルは気に入らなかったが、なかなか真面目な内容の書物であるようなので、さっそく、購入してみた。
結論としては、この書物は、医学科生や研修医向けの統計入門書としては非常に良い。 数式を使った定量的な議論はされていないから、この書物だけでは統計をキチンと扱えるようにはならないが、 統計学の基本的な考え方、基礎的な事項については、概ね、網羅的に記載しており、明らかに不適切な記述も少ない。 また、
ただ, 外れ値だからといって解析から外してよいわけではありません。 データが明らかに測定ミスなどの間違いだった場合を除いてデータの削除は絶対に避けてください。 また削除したときは, どのデータをなぜ削除したかを必ず論文に表記する必要があります。
というような、現実に横行していると考えられる不正なデータ処理、改竄について釘を刺す記載もなされている。 また、本来は正規分布ではないであろうデータに対して t 検定を用いる、といった、 医学研究と称する論文でしばしばみかける不正なデータ処理についても、注意を促している。
このように、同書は、医師が論文を読んだり書いたりするための基礎的な統計学の教養として、十分とはいえないが、入門としては満足できる内容といえよう。 ただし、どうにも容認できない点が二つ、ある。
一つは「確率」という語の使い方についてである。 著者の新谷氏は、いわゆる生物統計学の専門家ではあるが、物理学への造詣は深くないとみえる。 19 ページの「コラム」には、次のような内容が記載されている。
私がエール大学在学中に学んだ基礎統計の講義で教授が行ったデモンストレーションを思い出します。 教授は「今から投げるチョークが床にあらかじめつけられた印の位置に落ちるかどうかの確率を計算します」と言いながらチョークを投げました。 チョークが宙に浮いているとき「はい, 確率はまだ存在しますね」そして床に落ちた瞬間に「はい, 確率が今消滅しました」と言いました。 チョークが床に落ちた瞬間に, どの位置に落ちたかはもう ``決まっているので'' 確率計算すること自体に意味がなくなってしまうと教授は言いたかったのでしょう。(以下略)
教授は「確率 probability」ではなく「可能性 possibility」と言ったのではないかと思うのだが、もし「確率」と言ったのならば、この教授の言葉は正しくない。 チョークが投げられた時点で、チョークの運動や周囲の風の動きなどを含めて考えれば、既に、印の位置に落ちるかどうかは決定されているといえる。 つまり、これは確率事象ではないのである。 ただし、現実的には、我々にはチョークの落ちる位置を正確に予想することはできないので、その意味で「可能性」という言葉を使うのは、間違いではない。
臨床的なことでいえば、ある患者に、その薬が効くかどうかは確率によって決まるものではない。 単に、我々の科学力が不足しているために、効果を予め言い当てることができないに過ぎないのである。 そこで未来を占う手段として何らかの確率モデルを使うことは不適切とはいえないが、その結果は作為的なものにならざるを得ない。 従って、「確率」というものが、天与のもの、神の決めたまうものとして存在するかのように考えるのは、誤りである。 「確率事象なのか、単に我々が知らないだけなのか」を区別することの重要性は、物理学の分野では量子論を巡ってよく知られているが、 医学においては無頓着な者が多いようで、困る。この区別の医学における重要性については、一年ほど前に書いた。 この問題は、素人にとってはなかなか難解であり、確率論の入門における最大の難所なのであるが、そこに言及していない点は、この書物の一つの問題点である。
もう一つの問題点は多変量解析についてである。 新谷氏は、101 ページで次のように述べている。
通常ランダム化の行われていない観察研究では, 効果を明らかにしたいリスク因子と絡みあってさまざまな因子がアウトカムに影響を及ぼすため, それらの因子 (交絡因子) の影響を補正する手段として, 多変量回帰分析が有効であることを Lesson 4 でお話ししました。 回帰分析にこれらの交絡因子を説明変数として加えることにより, 数学的に交絡の影響を取り除きます。
回帰分析の手法は多様であるが、たとえば、しばしば用いられるロジスティック回帰分析は、説明変数が互いに独立である、ということを前提とした理論である。 しかし現実には、この仮定が本当に満足されることは、むしろ稀である。 そのように、理論の前提が満足されていない回帰分析の結果は、もちろん信用できないし、事実に反する結果が得られてしまうことも多い。 新谷氏は、そうした問題を私などよりもずっと熟知しているはずであるが、統計初学者には難しすぎる内容であるとして、敢えて言及しなかったのだろう。 それは理解できるが、しかし、結果として、まるで多変量解析が万能であるかのような錯覚を読者に与えているように思われる。 この点も、この書物の重大な問題点であると言わざるを得ない。
このように、いささかの問題点はあるものの、私のような粘着質な者でさえ問題点を二つしか挙げられなかった、と考えることもできる。 そうしてみると、この書物は、非常に優れた統計学の入門書であるといえよう。