坂本(以下太字):世界のトップレベルの腫瘍専門医に語っていただく「Big Oncologistに聞く」では、今回ベルギーからInternational Drug Development Institute(IDDI)、Executive directorのMarc Buyse先生をお迎えしています。先生には、結腸・直腸癌のメタアナリシス、さらに生物統計学者として参加されている結腸・直腸癌の臨床試験についてお話しを伺いました。
メタアナリシスには大規模な無作為化試験が必須
先生は米国ハーバード大学で結腸・直腸癌のメタアナリシスをスタートされ、次にEORTCに移られてすばらしい業績を残されました。これまでの研究について、順を追ってお話しいただけますか。
はい。私はハーバードでThomas Chalmers先生およびAnne Zeleniuch-Jacquotte先生とともに、結腸・直腸癌における補助療法についてメタアナリシスを開始しました。しかしその際に得られた分析結果は、きわめて難解なものでした。分析対象とした試験の規模が小さく、結果が不一致だったため、結局、化学療法の効果についての確証は得られなかったのです。
本研究については、「Why we still don’t know」というサブタイトルをつけて論文として発表しました(JAMA. 1988; 259: 3571)。ただし、本論文はメタアナリシスから最終的結論を導き出したものではなく、その意義を訴え、当時ほとんどなかった無作為化大規模試験の実施を訴えるものでした。
当時行われていた多くの試験での集積症例数は400〜500例程度でしたね。
400例ならば大規模でした。我々とほぼ同時期にRichard Peto氏らが実施した乳癌のメタアナリシスなどから、大規模試験でなければ有意な差が得られないことが示されました。私は、今日の腫瘍学における最善のエビデンスは、無作為化されていない単一アームの第U相試験ではなく、無作為化大規模試験から得られると考え、無作為化試験のメタアナリシスを研究課題としてきているのです。
進行性結腸・直腸癌に関するメタアナリシスの経緯
次に先生は、進行性結腸・直腸癌のメタアナリシスに進まれました。とりわけ5-FU単独療法とLV/5-FU療法を比較し、すばらしい業績をあげていらっしゃいます。
当時5-FUにLVを加えるとRRが上昇することは知られていましたが、長期のエンドポイントや生存期間については特に検討されていませんでした。 我々はまず、最初のメタアナリシスで、LV併用によりRRが約2倍にもなることを報告しました(J Clin Oncol. 1992; 10:896)。
それは大きな効果ですね。しかし、延命効果はみられなかったのですよね。
そうなのです。当時の手元にあった研究データでは、OS期間にベネフィットは認められませんでした。しかし振り返ってみると、5-FU単独とLV/5-FUレジメで5-FUが同量でないというミスを犯していました。このため、LV併用ではRRだけでなくOSも改善するという事実を見逃していたのです。
データを改訂し、「Journal of Clinical Oncology」誌に再度結果を報告しました(J Clin Oncol. 2004; 22: 3766)。新たな解析では追跡期間をさらに長期として対象研究の数を増やした上で、同量の5-FU のもと、5-FU単独とLV/5-FUの比較を実施しています。現在では、きわめて質の高い、説得力のあるデータを検討した結果、LVの併用によりRRにもOSにも改善がみられると明言することができます。この事実は現在広く認識されています。
膨大な解析が明らかにしたLV併用の有用性
そのメタアナリシスは、進行性結腸・直腸癌に対する最善の治療に関し、患者個人のデータを土台とした膨大な作業を実施して、まとめたものといえますね。それにより、LV/5-FU療法が5-FU単独療法よりも明らかに優れているという結論が得られたのですね。
その通りです。この結果に疑問の余地はないと思います。
LV/5-FU療法が5-FU単独よりもはるかに優れているという臨床試験は多くありますが、先生方のメタアナリシスはなかでも最も明確なエビデンス、すなわちレベル「1A」のエビデンスを示しています。
メタアナリシスの大きなメリットは、ある試験結果だけに焦点を絞るのではなく、すべての試験結果を1つに集め、トータルな形でエビデンスを検討していくところだと私は考えています。無作為化試験をまとめていくことで、レベル「1A」のような信頼性の高い結果が得られるのです。
ただしメタアナリシスで難しいのは、同じ疑問を検討した試験だけを組み入れなければならないという点です。試験によって検討事項が違ったり、投与量が違ったりする場合は、若干作業が困難となります。統計学的に不均一性を評価する手法もあり、その原因を探ることも可能となっていますが、不均一性があまりに大きいと治療効果をまとめることがとても困難になりますね。
このようにメタアナリシスは過去を振り返り、すべてのデータの意味を理解するために有効です。また、既存のレジメに新たな化学療法を加えていく上でも役立っていると思います。
大規模無作為化試験を対象として個人データまで遡る
では、正確なメタアナリシスに重要かつ不可欠なものとは何でしょうか。
先ほど述べたように、最も情報を得られるのは無作為化試験です。非無作為化の第II相試験には対照群がなく、患者の選定によって異なる結果が出る点が問題です。ですから必ず無作為化データを利用し、さらに患者個人のデータまで遡って分析します。
各試験が適切に無作為化されていれば、必ずしも患者個人のデータまで戻る必要はないのではありませんか。
いろいろな見解がありますが、私は患者個人のデータまで戻る必要があると強く確信しています。この作業により、無作為化された患者全員が分析に含まれているか、追跡がいずれの治療群でも同様か、無作為化自体が適切かをチェックできます。
たとえば以前、早期の結腸・直腸癌の補助療法に関し、肝動注療法に関するメタアナリシスを行いました。ここで最も大きな問題となったのが、驚くほど有効な治療効果、特に肝転移に有効性が報告されている70年代後半の試験(Br Med J. 1977; 2:1320)でした。メタアナリシスをしてみると、この試験は他のものとまったく異なり、極端な結果を示していることが明らかでした。こうした試験を含めると、最終的にバイアスのかかった分析結果となってしまいます。
そうした試験をどのように見分けていらっしゃるのでしょうか。
まず、きわめて極端な結果が出ている試験は少し疑ってみます。もちろん、偶然そうした結果が出た場合もありますが。しかし先ほどの試験では、カテーテルが門脈に留置できるかどうか判断する以前に無作為化が行われ、その後割り付け通りに治療を受けていない患者がいたことが明らかになっています。患者個人のデータを検証できれば、こうした問題を検出できるのです。
試験を実施した研究者との連携がポイント
臨床試験が適正に無作為化され、適正に実施されていることを、順を追って1つひとつ評価し、まとめていくのですね。
その通りです。個々の試験を検討し、すべてに問題がないか、無作為化したグループや予後因子にバランスの欠けたところがないかチェックしていきます。たとえば、無作為化の手順と日付を調べ、1つのグループだけに長い手順を要していれば、何か問題があることが明らかです。その場合、その試験を慎重にチェックします。
次に感度分析を行います。結果がその試験を組み入れるか否かで大きく左右されれば、何か問題があると考えられます。重要なもう1つのポイントは、試験を実際に行った研究者と連絡を取り合うことです。試験実施者全員を結集して、メタアナリシスを全員の共同作業にするのです。そうすることで研究者側からのコメント、批評、新しいアイデアの提供が可能となり、研究者側でもメタアナリシス技法をチェックすることができます。これはきわめてオープンで共同作業的なプロセスです。文献から一部の数字を抽出するだけであれば、その試験を実施した研究者にはコメントするチャンスがありません。これは学術的にみて正当なアプローチではないように思います。フェアではなく、データを活用する上でも最善の方法ではないでしょう。
研究者たちとの連絡、データ収集や確認、再分析などは膨大な作業量となりますが、そこから得たデータの質はそれに値するものとなります。
1 2 3 次のページへ >>
▲このページのトップへ