これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、
1 記事 1 ファイルとして形成し直したものです。
簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
2013/09/17 医学部のための統計学 (2)
A 君と K 君が議論しているところに、たまたま同級生の O 君が通りかかった。
彼は工学部出身の編入生であり、やはり統計学に詳しい人物である。
- K 君 「もし 100 人分の血液を測定したらどうなるか、ということを君は知りたいのだろうが、
実際には 6 人分しか測っていないのだから、そんなこと、
わかるわけないじゃないか。神様じゃないんだから。」
- O 君 「面白そうな話をしているね。確かにわかるわけないが、推測することはできるだろ。」
- A 君 「助けてくれよ、O 君。K 君が意地悪なんだ。一体、僕はどうすれば良いんだい。」
- O 君 「正規分布を仮定してしまえば良いのさ。」
つまり、こういうことである。
健常者については三人分の測定を行ったわけだが、その三つの試料の平均は
0.043 mg/dL であり、不偏分散は 4.33 x 10-4 mg2/dL2
であり、その平方根は 0.021 mg/dL となる。
- O 君 「詳しい理論的根拠は教科書を読めばわかるが、とにかく、
健常者の血液から得られる B の濃度は、平均 0.043 mg/dL,
標準偏差 0.021 mg/dL の正規分布に従うと推定できるのさ。」
- K 君 「推定するのは君の勝手だが、その推定が、本当に正しいと思うのかい。」
- O 君 「正しいわけがないだろ。」
- A 君 「おいおい、初心者にもわかるように説明してくれよ。」
平均 N, 標準偏差 s の正規分布に従う統計量は、たとえば、次のような性質を持つ。
この統計量が N + s より大きい値を取る確率と
N - s より小さい値を取る確率は等しく、それぞれ 16% 程度である。
同様に N + 2s より大きい値を取る確率は 2.3% であり、
N - 3s より小さい値を取る確率は 0.2% にも満たない。
しかし逆に、0.1% よりは高い確率で、N - 3s より小さな値を取ることがある、ともいえる。
- K 君 「A 君の例でいえば、2% の確率で 0.001 mg/dL よりも小さく、
0.1% よりは高い確率で -0.020 mg/dL より小さな、負の濃度を取ることになるね。フフフ。」
- O 君 「負の濃度なんてのは、あるわけがないから、この推定はおかしい、と K 君は言っているのさ。」
- A 君 「そりゃ推定なんだから、厳密には違うだろうけど、だいたいは合っているんだろう。」
- O 君 「さてね。K 君も言っていたが、神様じゃないんだから、合っているかどうかなんて、わからないよ。
むしろ、実際には 3 人分しか測定していないのだから、合わなくても当然なんじゃないか。」
- A 君 「では、どうして君は、正規分布を仮定すれば良いなどと無責任なことを言ったのだ。」
- O 君 「他に、どうしようもないからさ。合っているか間違っているかなんて誰にもわからないのだから、
こういうのは『仮定しました』と宣言してしまえば、誰からも文句を言われないのさ。」
統計学の教科書では「正規分布を仮定すると」などとさりげなく書いてあり、
さも当然の仮定であるかのような顔をしているが、実際には、この程度の意味でしかない。
もちろん、測定を 3 人分ではなく、もっとたくさん反復して行えば、良い推定が得られるかもしれないが、それは別の話である。
- A 君 「ふむ、わかった。僕としては論文が通りさえすれば、それで良いのだ。
で、正規分布を仮定すると、それから何がわかるんだい。」
- K 君 「さりげなく、とんでもないことを言うね。君には科学者の良心がないのか。」
- O 君 「そう言うなよ。世の中、こんなもんだ。」
続きは後日
Copyright (c) Francesco