これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、
1 記事 1 ファイルとして形成し直したものです。
簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
2013/09/17 医学部のための統計学 (1)
残念ながら昨今の医学科のカリキュラムでは、統計学は非常に軽視されている。
国家試験でもあまり難しいことは問われないらしく、
結局、統計学がよくわからなくても、医師になる上で障害とはならない。
しかし 8 月 30 日にも書いたが、統計学や誤差の取り扱いは、臨床医学において本当は極めて重要なはずである。
その一方で、統計学の教科書は何やら数式が多く、言っていることがわかりにくく、
読んでいると眠たくなってしまうものである。
そこで何回かに分けて、統計学の基本的な考え方を、医学的な例を挙げながら説明してみようと思う。
もし、それなりの内容ができたなら、別にコーナーを設けてまとめて掲載するつもりである。
名古屋大学医学部医学科四年生の A 君は、大腸癌のマーカーとして、蛋白質 B が有力なのではないかと考えた。
すなわち、健常者の血液中には B はほとんど検出されないのに対し、
大腸癌患者の血液中には B がたくさん含まれるのではないか、との仮説を立てたのである。
そこで A 君は消化器外科の C 博士に相談して研究を行い、次のような測定結果を得た。
健康な医学部医学科生 3 人の血液中の B の濃度を測定したところ、
0.05 mg/dL, 0.02 mg/dL, 0.06 mg/dL であった。
大腸癌の患者 3 人から得た血液について、本人の同意を得た上で B の濃度を測定したところ、
0.07 mg/dL, 0.10 mg/dL, 0.29 mg/dL であった。
さて、A 君は測定結果を得たものの、これをどう解釈すれば良いか悩み、
多少は統計学の心得があるという同級生の K 君に相談した。
ここでは、いろいろな考え方があるだろうが、まずは代表的と思われる五つの考え方を検討する。
- 健常者の中で最も高濃度であった例では 0.06 mg /dL であり、
患者の中で最も低濃度であった例では 0.07 mg /dL であるから、
患者は常に健常者よりも高い濃度の B を持っていたといえる。
- 健常者では平均 0.04 mg/dL, 患者では平均 0.15 mg/dL であったから、
患者の血液は健常者の血液よりも高い濃度の B を有するといえる。
- 健常者の血中 B 濃度は 0.043 mg/dL ± 0.021 mg/dL であり
患者の血中 B 濃度は 0.153 mg/dL ± 0.119 mg/dL であるから、
有意水準 5% で t 検定をすると有意差なしとなる。
すなわち B は大腸癌患者の血中で濃度が高いとはいえない。
- 健常者の血中 B 濃度は 0.043 mg/dL ± 0.021 mg/dL であるが、
患者の一人において 0.29 mg/dL という非常に高い値が測定された。
このことから、大腸癌患者の一部では、血中の B が非常に多くなるといえる。
- Mann-Whitney 検定をすると p = 0.05 であるから、
大腸癌患者では、割と血中 B 濃度が高くなりそうである。
どの考え方が、実験結果に対する検定の方法として、最も正しいものであろうか。
- K 君 「君は正しい検定方法を知りたいようだが、最初に言いたいことは、
『一般論として正しい検定方法などは存在しない』ということだよ。」
- A 君 「どういう意味だい。教科書には、どういう場合にはどういう検定をやれば良いか、
詳しく書いてあるではないか。」
検定とは、仮説を論理的に厳密な形で定めた上で、その仮説と実験結果が矛盾しないかどうかを調べる行為である。
従って、まずは仮説を明確にしなければ、検定のしようがない。
では、A 君の研究において、検定されるべき仮説とは何か。
- A 君 「決まっているではないか。『大腸癌患者の血液中には、健常者の血液中よりも
高い濃度で B が含まれている』という仮説を検定したいのだよ。」
- K 君 「それでは曖昧すぎる。論理的に厳密な形で仮説を示してくれ給え。」
- A 君 「論理的に厳密とは、どういう意味だい。」
- K 君 「君は『大腸癌の患者血中には必ず健常者よりも多くの B が含まれている』と言っているのか、
『大腸癌の患者血中には健常者よりも多くの B が含まれていることがある』と言っているのか、
それとも何か別の意味なのか、一体、何を言っているのだ。」
おわかりか。A 君が述べている仮説は、よくよく考えると意味が曖昧で、漠然としている。
これでは論理的に正しい検定など、行いようがないのである。
このように考えると、さきほど示した五つの考え方はいずれも、ある意味において「正しい検定」だといえる。
順番にみていこう。
(1) まず「大腸癌患者の血中 B 濃度は、健常者の血中 B 濃度よりも『必ず』高い」という仮説を立てたとする。
実際に測定を行い、この仮説と矛盾する現象が確認されなければ、とりあえず仮説は守られていると考える。
この場合、上述の 1. の考え方を用いることは合理的であろう。
- A 君 「待ってくれ。僕は合計 6 人の血液しか測定していないんだぞ。
たまたま、血中濃度が偏った人達を集めてしまったのかもしれないじゃないか。」
- K 君 「そんなことは知らないよ。それが気になるなら、もっとたくさん測ればいいじゃないか。
6 人だけ測定して、その結果から仮説が破られなかったのだから、
とりあえず正しそうだ、ということで良いではないか。」
- A 君 「君は知らないだろうが、測定するのはイロイロと大変なんだ。面倒なんだよ。
測定する手間を省いて何とか合理的な結論を出すのが統計学だろう。もったいぶらずに、教えてくれよ。」
- K 君 「統計学は、そんな魔法の学問じゃないよ。君は、もしかして t 検定か何かのことを言っているのかい。」
- A 君 「以前、講義で聴いたけれど、いまいち t 検定というものが何だかよくわからないんだ。」
続きは後日
2013/10/01 修正
Copyright (c) Francesco