肺癌治療に関する情報誌:Lung Cancer Cutting Edge(LCCE)
2018年01月号vol.77
LCCE 特集:座談会

肺癌におけるPD-L1免疫染色の判定

tokusyu_photo1

後藤:非小細胞肺癌に対する免疫チェックポイント阻害薬は現在2種類が承認されており、そのバイオマーカーとしてPD-L1免疫染色が行われています。本日は、病理医としてその判定に携わっていらっしゃる国立がん研究センター 先端医療開発センター臨床腫瘍病理分野の石井源一郎先生、国立がん研究センター中央病院 病理・臨床検査科の元井紀子先生、慶応義塾大学病院 病理診断科の林雄一郎先生と、臨床医の立場から国立がん研究センター東病院 呼吸器内科の葉清隆先生をお迎えし、PD-L1免疫染色の意義や課題についてお話を伺います。

陽性率50%と1%をどう考えるか

後藤:免疫チェックポイント阻害薬、特にペムブロリズマブの使用にあたっては、初回治療開始前に免疫染色を用いて腫瘍細胞におけるPD-L1の発現を確認することが求められています。まずは判定の基本的な考え方について、病理医の先生方にご意見を伺いたいと思います。

石井:PD-L1の発現率は症例によってさまざまで、私たちが用いる免疫染色の判定基準の中では、二者択一の診断法(陰性vs陽性)とは異なって発現率の値を評価する、すなわち定量性が求められる判定になっています。具体的には、ペムブロリズマブに対する効果予測としては発現率が50%以上の症例をhigh expression(高発現)、1%以上をlow expression(低発現)、それ以外をno expression(発現なし)と判定し、陽性率そのものも併記することが推奨されています。そして、肺癌診療ガイドライン(2016年版)ではこの判定に基づいて治療法が決定されます。

後藤:高発現、低発現、あるいは発現なしは、正確に判定できるのでしょうか?

石井:カットオフ値の1%、50%というところであれば、特にhigh expressionの症例に関しては、ぶれは少ないはずです。

元井:病理検査として、染色試薬、自動免疫染色装置を指定されたプロトコルに則り染色されたものを、マニュアルに従って評価した場合は、一定の再現性が期待できると考えてよいと思います。

後藤:定量的に陽性率が示されていますが、どの程度実際の発現割合を反映しているのでしょうか?

石井:1%というカットオフを考えた場合、自分の評価したものが真のパーセンテージを反映しているのかというところは難しい部分があります。

林:私が判定を行う場合は、1%と50%というカットオフ値を重要視しながらも、すべて5%刻みでも判定しており、例えば25%と30%の違いなども意識しています。

元井:48%など1桁部分の数字まで厳密に判定するのは現実的ではないと思うのですが、5%刻みというのは、妥当な区分かと思います。腫瘍全体の中での陽性率を評価するときに、どのようなアルゴリズムでパーセンテージを求めているかというところには評価者間の違いがあるかもしれません。

林:私は全体で何%というだけではなく、何分の1というイメージでも判定しています。例えば10%だと10分の1、15%だとだいたい7-8分の1というように。

石井:標本が大きい場合には、何ヵ所か数えて、その平均を取りますね。サーティフィケーションのときに、私は自分の感覚と、他の先生方との一致率を自分で調整していました。

後藤:一桁レベルの判定は困難だというご意見もありましたが、1%の判定というのは果たして本当に可能なのでしょうか?

林:1%を超えているかどうかの判定は、もっと陽性率が高いところでの区分とは大きく異なります。陽性細胞というのは認識が容易なので、あるかどうかという視点ではそれほど難しくはないのです。もちろん、マクロファージなのか腫瘍細胞なのかという見極めや、陽性になっている箇所が非常に少ないときは母数のカウントが必要になるなど、困難なケースもあります。

元井:困難なケースに対処するため、当院では2名で判定するようにしています。ダブルチェックという意味もあるのですが、同じような判定基準で見ていると、判断が難しい症例でも次第に判定結果がほぼ一致するようになります。その意味では、病理医の習熟度にも左右されます。

国立がん研究センター 先端医療開発センター臨床腫瘍病理分野 石井 源一郎 先生

石井:こう見えたらこれは1%、これは50%というように、病理医がそれを自分の判定基準として持てるようになることが重要ですね。その意味では、カットオフ値の50%という値そのものに難しさがあるわけではなく、仮にそれが60%、70%であったとしても、考え方は変わらないだろうと思います。

後藤:個人的な習熟度が問題になると思いますが、判定の標準化、再現性は本当に大丈夫なのでしょうか?

元井:一定のトレーニングと経験を積めば、専門医資格を持つ病理医なら、1%以上、50%といったカテゴリーの中で概ね合致させることはできると思います。ただ、この検査は、同じ切片内でのコントロールがない中で陽性の基準を決めなければいけない方法なので、薄い染色の場合などで陽性・陰性の判断が病理医間で異なってくる可能性が問題になります。全国の病理医を対象とした評価法トレーニングの経験からは、コンセンサススコアを基準として、どのような集団の中で見ても、ほぼ一致するような症例もある一方、評価結果が大きく異なる症例もあります。

林:病理医間での判定の違いに加えて、どのようなところで迷うかというところを重点的に検討していくことが必要だと思います。判定には影響しないとしても、パーセントや見た目で何分の1という判断に、若干の違いは出てくるはずですので。

元井:判定に迷う点としては、染色強度(インテンシティintensity)が弱い場合、下限をどこから陽性に取るかという基準が合わせにくいところではないかと思います。また、ボーダーラインの症例をどう考えるかというところも難しいと思います。カットオフ値前後の症例をどうするか。実際の判定の現場では、個人的には迷った場合に上の方に取る、つまり50%前後であれば高発現、1%あるか微妙であれば低発現の方に入れている、ということも一定の割合であります。

国立がん研究センター東病院 呼吸器内科 後藤 功一 先生(司会)

後藤:それは患者さんの治療機会を逃さないことを考えて診断しているということでしょうか。単純に標本だけを見て判定しているわけではないと。

元井:もちろん根拠は標本に求めますが、グレーゾーンでどちらにも解釈できるような場合にどちらに決めるかとなったとき、患者さんの治療選択肢を増やしたい、患者さんの利益になるような判定をしたいという気持ちはあります。

林:1%のカットオフ値の1%と、50%における49%と51%というのはまったく違う問題だと思います。私の場合は、40%に見えたときは40%とスコアを付けていますが、45%だと思ったときには、50%にしています。

石井:私の場合は、何ヵ所か取って、その平均値を四捨五入するのか、切り上げにするのかという決まりだけを作っておく形にしています。基本的には切り上げにしているのですが、それは引き上げるという意味合いではなく、例えば36%だった場合には、その6をどうするかというだけの基準です。ですので、36%だった場合には、40%にします。

後藤:このあたりの議論は、臨床医の立場からはいかがでしょうか。

国立がん研究センター東病院 呼吸器内科 葉 清隆 先生

葉:患者さんのことを考えた病理判定というのは、大変素晴らしいことだと思います。PD-L1の判定について、臨床医の立場で述べさせて頂きます。現行のガイドラインでは、PD-L1発現率が50%以上であれば、一次治療としてペムブロリズマブが使用できます。この場合の50%以上というのは、抗がん剤よりも免疫チェックポイント阻害薬の効果が期待できそうだから、抗がん剤よりも先に使用することを考えるという意図で設けられたカットオフ値です。そのため、仮に実際には40%程度の症例が無理に50%以上の強発現に分類されると、もしかすると効果が期待できない免疫チェックポイント阻害薬を、抗がん剤よりも先に使用してしまうということが起こるかもしれません。その意味では、強発現に関してはむしろ少し厳しめに判定していただいても良いかもしれません。逆に、1%のカットオフ値に関しては、ここで陰性と判断されると免疫チェックポイント阻害薬は使えなくなります。例えば、染色強度が薄い場合などでも、陰性ではなく1%と判断頂ければ、先々で患者さんの使用する機会を失わずに済むのではないかと思います。

免疫染色と肺癌のheterogeneityを克服する

後藤:PD-L1免疫染色の判定において、定量的な部分とは別に、質的な評価の難しさはどこにあるのでしょうか。

石井:ひとつは肺癌の腫瘍細胞は非常にヘテロな集団であり、まず腫瘍細胞を認識することが大きな関門になるということです。例えば、腫瘍細胞に取り囲まれた正常細胞は染色されているように見えるので誤認されやすい。

元井:乳癌や神経内分泌腫瘍に比べると、肺癌は組織型が多彩で、腫瘍細胞の形や腫瘍組織を構成している細胞の種類、つまり免疫細胞や間質細胞との関係性が非常に複雑なので、母数としての腫瘍細胞の取り方も難しいといえます。

慶応義塾大学病院 病理診断科 林 雄一郎 先生

林:heterogeneityは組織学的なものだけでなく、PD-L1の発現そのものにもあります。つまり、明らかに高発現の領域と全く染まっていない領域とがあり、その中でも組織と相関している場合としていない場合があります。例えば、退形成性変化が見られるような領域には強く染まって、それ以外の分化度の高いような腺癌の領域にはまったく染まってないというようなパターンがあります。

元井:PD-L1評価の注意点として、マクロファージも陽性になってしまうという点です。特に肺癌の診断に慣れていない方には、マクロファージと腫瘍細胞の識別が難しいのではないかと思います。

石井:明らかに大きさで分かるものや腫瘍の周囲にあるものは区別するのは難しくありませんが、腫瘍の中に浸潤している大型のマクロファージ(tumor-associated macrophage:TAM)があるとき、それはマクロファージに陽性なのか、腫瘍細胞に陽性なのかを識別することは容易ではありません(図1参照)。

図1

林:インテンシティ、染色強度も非常に大きな問題だと思います。強陽性に発現しているものに関しては分かりやすいのですが、免疫染色はバックグラウンドに少し色が付いてしまうことがあるので、染色が薄いときにどこまでを膜の陽性と捉えられるのか。実際にはここに個人差が生じているのではないかと思います。染色の濃淡は連続変数ですから、ある一定の薄さを自分の中で設定できればいいのですが、なかなかそれが難しいですね。

後藤:再現性の高い判定結果を得るためにはどのような方法があり得るでしょうか?

石井:当院で、腫瘍面積と陽性細胞の割合を機械的に算出したことがあります。そのときは機械による陽性率と病理医が判断した陽性率とを比較して、人間の方が陽性率が高めに出るということがわかりました。私個人としては、そういったデータを集めながら、客観性を持たせるために最終的には機械にやらせたほうがいいのではないかと考えています。例えば病理医は腫瘍細胞だけを認識して、その部分をマーキングする。あとは機械にこの評価にフィードバックを与え、どの程度の染色強度を陽性としてみなすのかを学習させれば、最終的には陽性率を全て機械的に算出させるということはできるかもしれません。

国立がん研究センター 中央病院 病理・臨床検査科 元井 紀子 先生

元井:少なくとも免疫染色過程に関しては、人間が行うよりも自動免疫染色装置(機械)のほうが再現性は高いです。機械的なエラーもゼロとは言えないのですが、従来のマニュアル染色法よりも一定の結果が得られます。同様のことが、評価段階でもいえると思います。例えば乳癌バイオマーカー検査では、既に機械による自動判定が市販されるところまで進んでいます。ただし、肺癌の場合は、組織のheterogeneityが高いため、まず腫瘍細胞を認識するところが難しいと思われますので、すぐに機械化できるかというと、若干疑問です。

石井:現状では、少なくともここ1~2年でできるという話ではありませんので、私たちができることとしては、なるべく病理医間での一致率を上げて、それによって安定した結果を臨床医にお返しするということが重要ではないかと思います。

免疫チェックポイント阻害薬のバイオマーカー探索について

後藤:現在、肺がんの遺伝子スクリーニングネットワーク(LC-SCRUM-Japan)において、免疫チェックポイント阻害薬のバイオマーカー探索が進行中です。

葉:LC-SCRUM-IBISは、肺癌免疫療法におけるバイオマーカーの探索を目的に2017年2月から開始された研究です。今回お集まりの病理の先生方を含めて、全国の施設がこの研究に参加しており、PD-L1の免疫染色は4種類の抗体(22C3、28-8、SP142、SP263)を使って解析しています。加えて、腫瘍の体細胞変異についても全エクソームシーケンスでの網羅的な解析を予定しています。予定登録数は1000例、登録期間は2年を予定しており、2017年12月時点ですでに登録数は500例を超えています。先に話題に出ました、国内のPD-L1診断の統一化もこの研究の狙いのひとつです(図2参照)。

図2 LC-SCRUM-IBISの研究の流れ

石井:LC-SCRUM-IBISの結果と、臨床情報、さらにはゲノム情報を統合的に用いた解析が今後重要な意味を持ってくると思われます。また、この4つの抗体の染色性を基にした、あるいはその組み合わせから新しい何かをつくり出すことができれば、さらなる改良に結び付くのではないかと思います。

葉:実臨床では、免疫チェックポイント阻害薬の効果が出る患者さんがある一定の割合で存在することは間違いありませんが、その反面、全く効果がない患者さんも存在するという印象があります。したがって、効果を予測できる何らかのバイオマーカーが必ずあるのではないかと考えています。例えば、PD-L1の免疫染色の強発現と体細胞変異の数が多いという因子を組み合わせれば、より効果が高い症例を選別できるという報告もあります。ただ、それに該当しなくても効果が出る患者さんもいますので、今後、LC-SCRUM-IBISで新たなバイオマーカー解析も検討できればと考えています。

後藤:PD-L1の免疫染色の特性を踏まえて、臨床医と病理医が連携を深めていくにはどのような情報や意識を共有すべきでしょうか。

林:EGFR遺伝子変異や、ALK融合遺伝子などとは異なり、PD-L1はダイナミックマーカーですので、特に生検の場合はサンプリングの影響がかなり大きく出ます。その生物学的な背景の理解は共有しておく必要があると思います。

石井:プレアナリティカルな情報がかなり重要だということですね。例えば何%のホルマリンで固定したのか。あるいは普通のホルマリンなのか、中性緩衝液なのか。それから、一般に適さないとされる胸水検体の場合にどうするかが事前に協議されているかなど。そういった情報を常に病理医と臨床医の間で共有することが、良い評価判定につながるでしょう。

元井:検体採取から固定までは私たち病理医ではカバーできないところなので、そこは臨床医の先生やコメディカルの方々のご協力を得なければ、標準化はできないと思っています。

林:腫瘍細胞が100個未満のものや、壊死や変性が強い検体ではどうしても判定が難しく、参考値でお返ししなければいけないことも多いのですが、そのような場合に患者さんの全身状態を考慮しながら、再生検を行うかどうかということも議論できる環境になれば良いと思います。また、現時点の判定では染色強度は全く考慮されていないのですが、実際の場で染色強度の違いはかなり大きいので、それによる治療効果の違いがあるのかどうかというところも病理医としては気になるところです。

葉:一口に同じ50%以上と言っても、染色強度が低い場合もあれば、強い場合もあります。また、発現率も45%が50%に繰り上がったような場合もあれば、80~90%以上のかなりの陽性率の場合もあります。そうした詳細な情報を用いて、より適切に50%以上の中で区分していけば、効果予測を改善できる可能性があると思います。さらに、例えば腫瘍細胞のカウント数をふまえて、発現率に95%信頼区間をつけるなどすれば、より実際のPD-L1の発現状況を治療選択に反映できるかもしれません。

元井:現在は私たちが一方通行で検査結果を報告しているのですが、判定した結果が本当に治療効果として現れたのかどうかはぜひ知りたいところです。高発現と判定されたけれども効かなかった、というようなフィードバックも私たちにとっては判定方法を見直すきっかけになりますので。そして将来的には、LC-SCRUM-IBISの結果も含めて、どういった判定基準が一番適切なのかということを考えたいですね。

石井:同時に私たち病理医としては、判定基準が変化したり、仮に22C3以外のマーカーが出てくるような状況になった場合も対応できるように準備しておかなければいけません。特にAIに代表されるような技術革新もキャッチアップして、臨床医の方々と情報交換や議論ができるよう考えておく必要があると思います。

後藤:臨床医もPD-L1免疫染色の特徴と限界を理解した上で患者の治療に臨み、同時により有用なマーカーを探索することも継続していかなければならないですね。本日は、病理医と臨床医の相互理解を深める上で非常に意義のある議論ができたと思います。誠にありがとうございました。