はじめに

1.目的

現在の高齢化社会における造血器腫瘍患者の増加に加え,新規治療薬の開発も精力的に進められる中,日常臨床において最善の治療法の選択と実践は必ずしも容易ではなくなってきた。さらに,がん診療の「均てん化」を目的とした施策が実施され,血液専門医のみならず臨床腫瘍医にとっても造血器腫瘍患者に対する「標準的治療」の実施が求められるようになった。こうした状況下で,日本血液学会としても「造血器腫瘍診療ガイドライン」を作成することにより社会的要求に応えることとなった。

本ガイドラインは,医療者や患者が適切な判断や決断を下せるように支援することを目的とし,その利用により診療の質の向上と均てん化,患者ケアの向上を目指すものである。本ガイドラインは日本および海外のエビデンスに基づいたEBM の手法を用いて作成されたが,わが国の保険診療も考慮に入れている1)。第1 版としては医療従事者を主な対象としている。

もとより診療ガイドラインは,あくまで特定の対象と条件下での複数の試験成績を根拠とし,その中での平均的なエビデンスを示したものにすぎず,それを外挿あるいは敷衍して論ずることを保証するものではない。臨床の場における意思決定には,臨床研究によるエビデンスとともに医療の現状と環境,患者の価値観の三者が密接に関連し,それを統合することが医療者の専門職としての能力とされる。したがって,実際の診療においては医療担当者が個々の患者の状況に応じて専門的に総合判断することが求められる。この意味で,診療ガイドラインは医師の裁量に影響するが,それを拘束するものではない2)。また,本診療ガイドラインの遵守の有無により法的責任が医療担当者や本ガイドラインに帰すものではない3)

2.作成の経緯

わが国では厚生省(当時)により1999 年から診療ガイドライン策定の検討が開始された。日本癌治療学会においても2001 年から臓器別のがん診療ガイドライン作成が推進され,各領域専門学会に協力が要請された。造血器腫瘍に対する「抗がん剤適正使用ガイドライン」は,2005 年に日本癌治療学会における抗がん剤適正使用ガイドライン作成委員会の中で造血器腫瘍の項目も作成され,Int J Clin Oncol : 10 Suppl June 2005 に掲載された。その後,さらに本格的な「造血器腫瘍診療ガイドライン」作成の必要性が高まり,日本血液学会において2011 年5 月に造血器腫瘍診療ガイドライン作成委員会が設置され,作成が開始された。その後,評価委員会により3 度の査読ならびに評価を受け,日本血液学会会員のパブリックコメントを受けた後,日本血液学会理事会の承認を得て公開された。

3.作成方法

造血器腫瘍は由来する細胞系列により病型が多岐にわたる。本ガイドラインでは,白血病,リンパ腫,骨髄腫,および支持療法を対象とし,各病型ごとに2〜5 名の作成委員を任命し,さらに各病型を統括する責任者と全体を統括する委員長を設置した。全体の調整は各病型の責任者と全体を統括する委員長が主として行った。本ガイドライン作成にあたっては,EBM の手法を採用し,日本医療機能評価機構EBM 医療情報部Minds の方針を参照した1)

全体の章立ては各病型ごとに行い,総論,治療アルゴリズム,アルゴリズムの簡潔な解説,clinical question(CQ)の設定と解説,とした。第1 版は,全体を一冊にまとめる方針とし,CQ の数を必須なものに限定した。また,エビデンスレベルが高いにもかかわらず日本では未承認の薬剤または適応外の薬剤を含む治療法については,日本の保険診療では使用できない旨を明記した上で記載した。

1)Clinical question の選定

CQ は各グループが分担して原案を作成した。対象は,初期治療,初回再発および支持療法として,救援療法については一定のエビデンスレベルがある場合に選択した。

2)文献検索

各CQ におけるキーワードを基に一次資料の網羅的な文献検索を行うと同時にハンドサーチによる検索を行った。検索データベースはPudMed および医学中央雑誌を用いた。また,エビデンスレベルの高い重要な学会抄録も対象に含めた。検索した文献を吟味した上で,各CQ に対する解説を作成した。この段階では,国内外の既存のガイドライン等の二次情報を活用した。文献は各CQ において検索した文献のうち重要なものを掲載し,構造化抄録を作成した。作成した試案は,2 回にわたり各グループ内で相互に査読を行い修正した。その後,独立した評価委員会の評価に基づき修正したのち最終版とした。

3)エビデンスレベル

文献のエビデンスレベルについては,各研究機関より種々のものが提案されている。本ガイドラインでは,このうち米国National Cancer Institute(NCI)のComprehensive Cancer Database のPhysician Data Query(PDQ ®)において用いられているエビデンスレベルの表示法を採用した4)。すなわちPDQ 編集委員会におけるエビデンスレベルの公式順位分類により,試験結果を「研究デザインの強さ」および「エンドポイントの強さ」の2 つの尺度に基づいて順位づけして表示した(表1)。エビデンスレベルは各CQ の参考文献の末尾および構造化抄録に記載した。

4)推奨グレード

推奨グレードの表示形式についても種々のものが提案されている。推奨案は,エビデンスのレベルとエビデンスの数と結論のばらつき,臨床的有効性の大きさ,臨床上の適用性,有害性や費用に関するエビデンスの各要素を勘案して総合的に判断される。また,複数の信頼し得るエビデンスがあるが,利益と害が拮抗している場合,あるいは明確なエビデンスがないか質が低い場合は明確な推奨が困難となる。こうした場合は,エキスパート・オピニオンを参考にしたエビデンスと臨床医の経験を客観的に調和させるコンセンサスという形を取らざるを得ない。造血器腫瘍の臨床試験においてはランダム化比較試験の成績が提示されている場合は必ずしも多くはなく,第Ⅱ相試験の成績に基づいて判断せざるを得ない場合も多い。そこで本ガイドラインではNational Comprehensive Cancer Network(NCCN) Clinical Practice Guideline in Oncologyが採用しているエビデンスとコンセンサスによるカテゴリー(2011 年版)の一部改変したものを用いた5)NCCN のグレードはカテゴリー3 までであるが,CQ のうち強く否定される課題についてはカテゴリー4 を設け,否定が明確に示されるようにした(表2)。また,本ガイドラインでは費用対効果に関する判断は含んでいない。

表1 エビデンスレベル
エビデンスレベルは,「研究デザインの質」および「研究エンドポイントの質」の2 つのスケールで評価するNCI-PDQ による尺度を用いた。

研究デザインの質
  1. ランダム化比較試験  
    1. ダブルブラインド
    2. ブラインドなし
  2. ランダム化されていない前方視的比較試験
  3. 症例集積研究
    1. ポピュレーションベースの継続的症例集団
    2. ポピュレーションベースではない継続的症例集団
    3. 継続的ではない症例集団
研究エンドポイントの質
  1. 全生存
  2. Cause-specific survival
  3. 質の高いQOL 研究
  4. 間接的なエンドポイント
    1. 無イベント生存割合または期間(event-free survival:EFS)
    2. 無病生存割合または期間(disease-free survival:DFS)
    3. 無増悪生存割合または期間(progression-free survival:PFS)
    4. 治療反応割合など(tumor response rate)

注)NCI(National Cancer Institute)におけるPDQ®(Physician Data Query)で用いられているエビデンスレベル[Levels of Evidence for Adult and Pediatric Cancer Treatment Studies(PDQ®http://www.cancer.gov/cancertopics/pdq/levels-evidence-adult-treatment/HealthProfessional/page1]を採用した。

このエビデンスレベルの表記の不明確な点については,名古屋大学医学部造血細胞移植情報管理・生物統計学 熱田由子先生にNCI に問い合わせいただき以下の注釈を加えた。

癌治療研究に関して,NCI は,上記のレベルを公開し,これをもとに個々の研究のエビデンスレベルを検討する一つの尺度としている。尺度としては,「研究デザインの質」および「研究エンドポイントの質」の二つのスケールで評価し,個々の研究の総合的なエビデンスレベルの概要を把握する。しかし,NCI も,このエビデンスレベル尺度を常に用いるべきと言っているわけではなく,専門分野により,あるいは目的により,研究者があるいは学会などが異なった分け方を行うことを否定しているわけではない。2 つの尺度により,例えば以下のように研究のエビデンスレベルを表現できる。

1iiA :Phase Ⅲ RCT(盲検なし)で,OS がエンドポイント

3iiiDiv:Phase Ⅱ single arm trial で,治療反応率がエンドポイント

ただし,NCI-PDQ では,以下のような事項は2 つのスケールの評価対象に含まれていないことに留意する必要がある。

  • 前方視的研究か,後方視的研究か
  • 観察研究か,介入を規定して実施する臨床試験か
  • 治療毒性の評価
  • 観察された点推定値(OS など)の信頼区間の幅
  • 臨床研究(臨床試験)の規模
  • 臨床試験におけるデータ管理などの質管理程度
  • 研究に必要とされた費用

研究デザインの質

  1. ランダム化比較試験
    1. ダブルブラインド
    2. ブラインドなし

    注)

    • は,ランダム化前後および介入治療経過中においても,医師にもブラインドされていることが必要である。
    • RCT のメタアナリシスの場合もこの項(1.)に入る。メタアナリシスをより上位のレベルとする規準もあるが,NCI-PDQ では,小規模RCT のメタアナリシスが大規模RCT の結果と一致しないことがしばしばあることや,研究者によって同じclinical question を検討するメタアナリシスの別の研究結果が異なることもあり,RCT と同じ項(1.)に含められている。
    • RCT の主要評価項目ではないサブセット解析に関しては,次の項(2.)に入るが,研究計画時に明確な仮説およびパワー・症例数設定がされていた場合は(1.)に含める場合もある。
    • Phase Ⅲ RCT は基本的にこの項に入ると考えられる。
    • Randomized phase Ⅱ trial は通常はこの項には含まれない(NCI の説明によると,標準治療群がコントロール群として設定されていた場合にはこの項に含まれる場合があるということである)。
    • サブセット解析や副次的評価項目の解析結果を引用した場合は,主要評価項目に関するエビデンスレベルの後に,その解析の評価項目に関するエビデンスレベルを下線を付して併記した(例:1iiA/2Div)。
  2. ランダム化されていない前方視的比較試験

    注)

    • 比較試験だが,ランダム化されていない場合もこの項(2.)に含める。
    • Historical control との比較は,この項に含めない。
  3. 症例集積研究
    1. ポピュレーションベースの継続的症例集団
    2. ポピュレーションベースではない継続的症例集団
    3. 継続的ではない症例集団

    注)

    • 稀な疾患や,治療内容によっては,可能である研究デザインの質レベルが3 となる場合もあるので,必ずしもこれのみで研究の意義を評価するものではない。
    • 選択バイアスの可能性や,研究対象が母集団を代表しているかという点を重視し,外的妥当性がより高いと考えられる研究対象であるかどうかにより,3 の内部でからに分かれている。
    • PhaseⅠdose finding study や,単群のphase Ⅱ trial は,患者選択規準・除外規準を用いて選択された集団における研究であるため,本レベルでは3iii に分類される。
    • Randomized phase Ⅱ trial は一般的には新規治療どうしを選択デザインあるいはスクリーニングデザインなどで比較する研究であるが,これも3iii に含む。

研究エンドポイントの質

  1. 全生存
  2. Cause-specific survival
  3. 質の高いQOL 研究
  4. 間接的なエンドポイント
    1. 無イベント生存割合または期間(event-free survival:EFS)
    2. 無病生存割合または期間(disease-free survival:DFS)
    3. 無増悪生存割合または期間(progression-free survival:PFS)
    4. 治療反応割合など(tumor response rate)

    注)

    がんの研究エンドポイントの質を評価するレベルとして,上記が設けられている。長期生存の評価が最もレベルが高く,評価者の評価により個々の症例のエンドポイントが変わりうるもの(よりsubjective なもの)かどうか,という点が重視されている。しかし,がんの治療薬あるいは治療方法の開発により,生存期間が延長し,より間接的なエンドポイント(代替エンドポイント)を研究のエンドポイントとして用いらざるを得ないものも存在する。

表2 推奨グレード
日血ガイドライン委員会の推奨グレード*

カテゴリー1 高レベルのエビデンス(例:ランダム化比較試験)に基づく推奨で,統一したコンセンサスが存在する。
カテゴリー2A 比較的低レベルのエビデンスに基づく推奨で,統一したコンセンサスが存在する。
カテゴリー2B 比較的低レベルのエビデンスに基づく推奨で,統一したコンセンサスは存在しない(ただし大きな意見の不一致もない)。
カテゴリー3 いずれかのレベルのエビデンスに基づく推奨ではあるが,大きな意見の不一致がある。
カテゴリー4** 無効性あるいは害を示すエビデンスがあり,行わないよう勧められるコンセンサスが存在する。

NCCN の「エビデンスとコンセンサスによるカテゴリー2011 年版」に基づきNCCN Guidelines ®の許諾を得て改変した。NCCN のカテゴリーは現在改訂されているが,本ガイドラインの次回改訂時には最新版を参照する予定である5)

**否定的推奨については,統一したコンセンサスがある場合に限り,否定的推奨であることを明確にするためカテゴリー4 を設けた。
また,カテゴリー4 は一般診療としての否定的推奨を意味しており,適切な研究計画と倫理指針に従った臨床試験での実施を否定しているわけではない。

4.改訂と公開

本ガイドラインは,3〜4 年を目処に定期的に改訂を予定する。この間に重要なエビデンスが明らかになった場合は逐次改訂を考慮する。また,幅広い利用のため小冊子として出版する他,学会のホームページで公開する。本ガイドライン第1 版は対象を医療者に限るが,今後は患者の視点に立ったガイドラインの作成も予定している。本ガイドラインの利用普及により,診療内容への影響,患者アウトカムの改善が望まれる。さらに,その検証のため遵守状況のモニタリングも必要である。

5.資金と利益相反

本ガイドラインの作成のための資金は日本血液学会の支援により得られた。本ガイドラインの内容は特定の営利・非営利団体,医薬品,医療機器企業などとの利害関係はなく,作成委員は利益相反の状況を日本血液学会に開示している。

疾患別作成委員会委員長 大西一功

参考文献

1) Minds 診療ガイドライン作成の手引き2007.Minds 診療ガイドライン選定部会 監修.福井次矢ほか 編集.医学書院.東京.2007

2) 中山健夫.診療ガイドライン:適切な作成・利用・普及に向けて.日児腎誌.2008;21(2):157-65.

3) 長澤道行ほか.診療ガイドラインの新たな法的課題.日本医事新報.2010;4504:54-64.

4) National Cancer Institute : PDQ ® Levels of Evidence for Adult and Pediatric Cancer Treatment Studies. Bethesda, MD : National Cancer Institute. Date last modifi ed <08/26/2010>. Available at :http://cancer.gov/cancertopics/pdq/levels-evidence-adult-treatment/HealthProfessional. Accessed <09/05/2013>.

5) NCCN Categories of Evidence and Consensus adapted with permission from the NCCN Clinical Practice Guidelines in Oncology( NCCN Guidelines®) for Chronic Myelogenous Leukemia V. 2011. © 2013 National Comprehensive Cancer Network, Inc. All rights reserved. The NCCN Guidelines ® and illustrations herein may not be reproduced in any form for any purpose without the express written permission of the NCCN. To view the most recent and complete version of the NCCN Guidelines, go online to NCCN. org. NATIONAL COMPREHENSIVE CANCER NETWORK ®, NCCN ®, NCCN GUIDELINES ®, and all other NCCN Content are trademarks owned by the National Comprehensive Cancer Network, Inc.