これは http://mitochondrion.jp/ に掲載している「医学日記」を、諸般の便宜のために、 1 記事 1 ファイルとして形成し直したものです。 簡単なプログラムで自動生成しているので、体裁の乱れなどが一部にあるかと思われますが、ご容赦ください。
過日、北陸医大 (仮) において、主に研修医を対象としたセミナーに伴って開催された「薬剤情報提供会」においてのことである。 これは、某製薬会社の MR (Medical Representative) が、自社製品についての「情報提供」を行うという趣旨の、15 分ほどの会である。 この MR 氏の話の中で、自社製品を類似の先行薬剤とを比較する「非劣性試験」の結果が示されていた。 非劣性試験というのは、新しい薬剤や治療法が、従来のものと比較して効能の点で「劣っていない」ということを示すための試験である。 遺憾なことに、一般的な医師や医学科生は統計学について無知であるから、こうした試験の内容をよく理解することができない。 そこで、キチンと内容を吟味することなしに製薬会社の主張を鵜呑みにし、結果として患者に不利益を与えている、というのが現状である。 非劣性試験についての入門的な解説は専門家の手によるものをはじめとして、 インターネット上に数多くあるが、その多くは、一般的な医師にとっては難解に過ぎるか、あるいは内容が不正確であるかの、どちらかであろう。
さて、その MR 氏が示した「非劣性試験」の結果について、私は、いわゆる非劣性マージンを大きく設定しすぎなのではないか、という趣旨の質問をした。 しかし、どうやら MR 氏は「有意差なし」と「非劣性」の区別を明確に理解していなかったようであり、質問の意図が伝わらなかった。 率直に申し上げるが、不勉強に過ぎる。怠慢であると言わざるを得ない。 もっとも、その程度の学識の者が MR として北陸医大に派遣される背景には、我々の側の落ち度もあるだろう。 これまで我々は、MR に対して学術的に真摯な議論を行わず、ナァナァの関係を築いてきたために、MR 側にも油断が生じたのではないか。
何をもって「非劣性」とするか、という指標として、一般的な基準は存在しない。 ここでは例として「新薬による治療奏効率が、従来薬に比べて劣っていない」ことを示す場合について考える。 もちろん「奏効率」という語の意味は曖昧であり、このあたりをうまく細工すれば、試験結果をある程度、任意に操作することができるのだが、ここでは問題にしないことにしよう。
まず臨床試験において、新薬と従来薬の奏効率を調べ、両者の差 (新薬の奏効率 - 従来薬の奏効率) を計算するわけだが、当然、ある程度の統計誤差は生じる。 そこで 95 % 信頼区間を調べるのが普通である。ここで、いかなる統計モデルを採用するかによって、95 % 信頼区間をある程度、自由に操作することができる。 そうしたテクニックを駆使すれば、新薬を実際以上に有効にみせかけることも可能なのだが、そうした問題についても、ここでは議論しないことにしよう。
さて、奏効率の差が正であれば新薬の方が優れている、ということになるし、もし負であれば従来薬の方が優れている、ということになる。 つまり、もし 95 % 信頼区間の下限が正であるならば、まぁ、まず間違いなく新薬の方が優れている、といえる。 これを確認するのが「優越性試験」である。 一方、95 % 信頼区間が 0 をまたいでいる、つまり区間の下限が負で上限が正であるならば、新薬と従来薬のどちらが優れているのかは、何ともいえない。 この状態を「有意差なし」という。 以前にも何度も書いているが、「有意差なし」とは「わからない」という意味なのであって、「同じ」という意味ではないのである。
では、非劣性、とは、どういう意味か。 「有意差なし」の場合について、仮に、95 % 信頼区間の下限が -5 % であったとする。 これは、ひょっとすると奏効率は新薬の方が低いかもしれないが、しかし、その差は 5 % 以内である、ということになる。 このとき、「5 % ぐらいなら、臨床的に重大ではないから、気にしないことにする」という立場をとるならば、この結果をもって「新薬の非劣性が示された」と言うのである。 つまり「非劣性」とは、「劣っているかもしれないが、その程度は僅かである」という意味なのである。 そして、「どの程度までなら劣っていても許容するか」という幅のことを、「非劣性マージン」などと呼ぶ。 もちろん、非劣性マージンをいくつに設定すべきか、などという問題に客観的で明確な決まりはないので、製薬会社の設定したマージンを鵜呑みにしてはいけない。