これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。


2017/12/29 Benjamini-Hochberg 法 (2)

前回紹介した N. Engl. J. Med. 377, 2445-2455 (2017). に対する批判の続きである。

この非盲検のランダム化比較対照試験は、妊娠 30 週未満で生まれた早期産児について、 臍帯を直ちに結紮する群と、30 秒ないし 3 分程度遅れて結紮する群とで、予後を比較するものである。 予後は、死亡あるいは重大な合併症を来すかどうか、で判定する。 重大な合併症というのは、重大な中枢神経系障害などであって、死亡も含めて 13 項目が評価対象とされている。 業界用語でいえば、「死亡または重大な合併症を来たしたかどうか」が primary outocme であって、 その 13 項目についてが secondary outcome である。

まず primary outcome については、相対リスクは 1.00, 95 % 信頼区間は 0.88-1.13 と報告された。 これについて著者らは、結論として

delayed clamping of the umbilical cord did not result in a lower incidence of the primary outcome

と述べているが、不適切である。 たぶん「有意差なし」ということを言っているのだろうが、過去に何度も書いている通り、 「有意差なし」という結果は「差がない」という意味ではなく、「統計誤差が大きく、よくわからない」という意味である。 むしろ、95 % 信頼区間が 0.88-1.13 であるということは、遅延結紮は最大で 12 %、重大な合併症を減らす可能性がある、といえる。期待はできる結果なのである。 非劣性試験の考え方をすれば「遅延結紮は重大な合併症を 12 % 以上は減らさなかった」とは統計学的に言えるが、「重大な合併症を減らさなかった」とまでは言えない。 それなのに上述のような誤った内容が記載されたのは、著者や査読者が統計学に無知だからであろうか。 たぶん、違うだろう。

統計学的には、遅延結紮は重大な合併症を最大で 12 % 減らすようであるが、最大で 13 % 増やす可能性もあり、何ともいえない、というのが正確である。 しかし「何ともいえない」ではセンセーショナルではない。 むしろ、統計学的には不適切であっても「primary outcome の頻度を減らさなかった」と書いてしまった方が、臨床医受けは良いであろう。 平たくいえば、他の論文に引用されやすくなる。 結果として The New England Journal of Medicine の impact factor を引き上げる効果が期待できる。 そういう思惑の下に、このような不正確な記述がなされたものと思われる。 学術的には、邪である。

ここまでは臨床医療統計でよくある「不適切な解析」なので、ちょっと詳しい人なら、容易に見抜けるであろう。 しかし secondary outocome については、かなりわかりにくいので、「ちょっと詳しい」程度の医師では騙されるかもしれない。

Secondary outocome の筆頭は「死亡」であって、相対リスクは 0.69, 95 % 信頼区間は 0.49-0.97 と、遅延結紮群の方が少なそうな結果であった。 しかし、これは多重検定を行ったものであるから、Benjamini-Hochberg 法で補正すると p = 0.39 となり、有意な差ではない、と著者らは述べている。

本当だろうか。 次回、この多重検定の詐術を攻撃する。


戻る
Copyright (c) Francesco
Valid HTML 4.01 Transitional