為規(guī)范和指導我國治療晚期非小細胞肺癌藥物的臨床試驗設計和終點選擇,提供可參考的技術規(guī)范,國家藥品監(jiān)督管理局組織制定了《晚期非小細胞肺癌臨床試驗終點技術指導原則》,現(xiàn)予發(fā)布。
以下為文件全文:
晚期非小細胞肺癌臨床試驗終點技術指導原則
肺癌的發(fā)病率和病死率居全球和中國惡性腫瘤之首[1]。2015年中國新發(fā)腫瘤患者392.9萬例,死亡233.8萬例,新發(fā)肺癌78.7萬例,死亡63.1萬例[2]。非小細胞肺癌(non-small cell lung cancer,NSCLC)占肺癌總體的85%,大部分初診時已為晚期。近年小分子酪氨酸激酶抑制劑(tyrosine kinase inhibitors,TKI)、抗血管生成藥物和免疫檢查點抑制劑的應用已顯著提高了患者生存。
晚期NSCLC為抗腫瘤新藥研發(fā)的熱點領域,創(chuàng)新藥物眾多,臨床證據(jù)鏈日趨復雜,涌現(xiàn)出了復雜的終點指標和研究設計——包括替代終點、中間臨床終點和其它創(chuàng)新終點;并出現(xiàn)共同終點平行檢驗、復合終點序貫檢驗等復雜設計。現(xiàn)有指導原則尚不能涵蓋。因此,本文旨在闡述當前晚期NSCLC臨床試驗終點的一般性設計與審評考慮,期望為抗腫瘤藥物研發(fā)人員在晚期肺癌的臨床試驗設計和終點選擇上提供參考,科學、高效地確定藥物療效,提高臨床研發(fā)效率,使患者更早獲益。
本指導原則適用于支持晚期NSCLC適應癥注冊的臨床試驗設計及終點選擇。本指導原則所涉及的抗腫瘤藥物試驗設計同樣應遵循臨床試驗設計的一般原則,包括但不限于人用藥品注冊技術要求國際協(xié)調(diào)會議(international conference for harmonization,ICH)所發(fā)布的E8、E9、E10和E17等指導原則,以及國家藥品監(jiān)督管理局(National Medical Products Administration,NMPA)已發(fā)布的《抗腫瘤藥物臨床試驗終點技術指導原則》和《抗腫瘤藥物臨床試驗技術指導原則》等相關內(nèi)容。
本指導原則所涉及的觀點代表當前NMPA對晚期NSCLC臨床試驗設計和終點選擇的審評認識,不能涵蓋在抗腫瘤新藥研發(fā)中遇到的所有情況。鼓勵研發(fā)從業(yè)人員探索科學創(chuàng)新的終點和試驗設計,并及時與NMPA的審評部門溝通和交流。
當前晚期NSCLC的治療目標為延長生命和提高生活質量,關鍵注冊研究的試驗終點應能有效反映臨床獲益的指標或事件。上世紀九十年代前批準的抗腫瘤藥物多以總生存期(overall survival,OS)為主要終點。OS的定義明確、客觀穩(wěn)健,是反映患者生存獲益的金標準,但試驗耗時長且需較大樣本量。監(jiān)管部門為加速藥品上市、改善治療可及性,對難治疾病背景下具有突出臨床獲益的藥物實施加速審批,即允許使用可合理預測臨床獲益的替代終點,如:客觀緩解率(objective response rate,ORR)和無進展生存期(progression free survival,PFS)為主要終點支持新藥批準上市[3-5]。
近年晚期NSCLC的治療模式已從基于組織病理學的細胞毒化療,轉變?yōu)榛隍寗踊蛲蛔兊券熜ьA測生物標志物的分子靶向治療,以及免疫、細胞毒和抗血管生成等藥物聯(lián)合治療。監(jiān)管部門通?;谥苯拥呐R床獲益批準新藥,如OS的延長和腫瘤相關癥狀的改善,也可接受可預測臨床獲益的替代終點批準新藥,如較高的ORR和足夠的緩解持續(xù)時間(duration of response,DOR),監(jiān)管機構需要權衡替代終點和創(chuàng)新研究設計對臨床獲益評價的影響。本指導原則將對療效評估的一般性監(jiān)管要求及支持批準的終點選擇進行討論。
抗腫瘤藥物臨床試驗常用的終點依據(jù)來源可分為三類:基于死亡事件的終點,如OS及OS率;基于腫瘤測量的終點,如采用實體瘤療效評價標準(response evaluation criteria in solid tumors,RECIST)評估的ORR,或基于RECIST和訪視的至進展時間(time to progression,TTP)、PFS和至治療失敗時間(time to treatment failure,TTF)等;基于癥狀評估的終點如疼痛的減輕、生活質量(quality of life,QoL)等患者報告結果(patient report outcome,PRO)。
終點的選擇應結合腫瘤分期、既往治療和起效特點等因素綜合考量。
表1、晚期NSCLC藥物常用臨床試驗終點比較
|
終點 |
研究設計 |
優(yōu)點 |
缺點 |
|
OS |
·隨機對照試驗(randomized controlled trials,RCT) ·推薦盲法 |
·廣泛應用的臨床獲益終點 ·易于測量且精確 |
·隨訪時間較長,通常需較大樣本 ·易受交叉和后續(xù)治療影響 ·包括非腫瘤死亡 |
|
PFS |
·RCT ·推薦盲法 ·推薦盲態(tài)獨立中心評估(Blinded Independent Central Review,BICR) |
·與OS相比通常需要較少的樣本量、較短的隨訪時間 ·包括疾病穩(wěn)定 ·不受交叉和后續(xù)治療影響 ·通常基于客觀、定量評估 |
·統(tǒng)計學意義或不具有臨床意義,不總能轉化為總生存獲益 ·非精確測量,評價可存偏倚,特別是在開放標簽試驗中 ·不同試驗可有不同的評估間隔,結果受評估間隔影響,需頻繁影像學評估 |
|
TTP |
·同PFS |
·較PFS能更加客觀體現(xiàn)藥物的抗腫瘤作用 |
·不包括死亡,與OS的相關性低于PFS |
|
TTF |
·同PFS |
·綜合了藥物的有效性和耐受性特征,是綜合的臨床終點 |
·由于治療失敗停止治療的停藥判斷可受研究者的主觀影響,不如RECIST判斷的PD客觀 |
|
ORR |
·單臂試驗(single arm trial,SAT), ·單臂有條件批準的常用替代終點 ·獨立影像評估 推薦BICR |
·更小的樣本量、更快達到終點 ·更適于富集人群試驗 ·療效歸因于藥物,排除疾病自然進程 |
·不是臨床獲益的直接測量 ·不是對藥物活性的綜合測量 ·需結合緩解持續(xù)時間和疾病控制判斷 |
|
癥狀終點 |
·RCT ·推薦盲法 |
·患者臨床獲益的直接感受 |
·數(shù)據(jù)缺失和不完整較普遍 ·小變化的臨床意義不明確 ·缺乏經(jīng)過驗證的測量工具 可能有偏差,在不同治療組間評估時間上的可比性十分關鍵 |
OS定義為從隨機化到任何因素導致患者死亡的時間。OS的判定精確可靠,不易偏倚,常作為首選終點。以OS為主要終點的臨床試驗需采用隨機對照設計,常需較大樣本量和更長的隨訪時間,易受到交叉和后續(xù)治療影響。
OS率定義為自隨機化至指定時間節(jié)點同一試驗組內(nèi)生存的受試者所占的比例,為OS的中間臨床終點,在既往研究中可作為次要終點,隨機臨床試驗中,可通過OS率的比較觀察到治療組的獲益,如1年OS率。雖然OS率的計算精確可靠并將更早達到,但OS率通常作為描述性終點,OS率的評估更多受到時間選擇的影響,其臨床意義和統(tǒng)計學意義尚不明確,提前分析OS率將導致破盲不利于生存獲益的檢驗,現(xiàn)階段OS率多作為次要終點和支持性證據(jù)。
腫瘤臨床治療常基于病灶的影像學評估結果決策,腫瘤測量的終點被視為具有臨床獲益相關性。RECIST(目前為1.1版本)是目前廣泛應用于NSCLC的療效評價標準。隨著免疫檢查點抑制劑的使用,免疫治療療效評價標準(immune response evaluation criteria in solid tumors,iRECIST)開始應用于臨床試驗,但對照組為標準化療時不適用iRECIST判斷PFS。目前在以新藥注冊為目的的腫瘤免疫治療臨床試驗中,RECIST 1.1仍為最常用的腫瘤療效判定標準,推薦在單純免疫治療及“頭對頭”設計的免疫治療臨床試驗中增加iRECIST評估標準,并與傳統(tǒng)RECIST結果進行對比。
ORR定義為腫瘤體積縮小達到預先規(guī)定值并能維持最低時限要求的患者比例。ORR為完全緩解(complete response,CR)與部分緩解(partial response,PR)的比例之和,ORR不包括疾病穩(wěn)定(stable disease,SD),排除了疾病自然病程的影響,相比疾病控制率(disease control rate,DCR),ORR可更可靠反映藥物的抗腫瘤活性,是單臂臨床試驗常用替代終點。
DOR定義為腫瘤第一次評估為客觀緩解至第一次評估為PD或PD前任何原因死亡的時間,反映了ORR的持續(xù)時間。
PFS定義為從隨機化至出現(xiàn)腫瘤客觀進展或全因死亡的時間,是OS的替代終點。與TTP相比,PFS包括了任何原因導致的死亡,與OS相關性更高,且不受后續(xù)治療影響,是隨機對照設計臨床試驗最常用的替代終點。
TTP定義為從隨機化至出現(xiàn)腫瘤客觀進展的時間,不包括死亡。TTP能精確反映治療帶來的近期生存獲益,由于排除了死亡,TTP對治療臨床獲益的相關性差于PFS和TTF。
TTF定義為從隨機化至治療失敗或退出試驗的時間,退出試驗的原因可為患者要求、疾病進展、死亡或不良事件等。與PFS相比,TTF覆蓋了非疾病進展導致的退出,并可包括疾病進展后的繼續(xù)治療,是綜合的臨床終點。因TTF不能充分將藥物的療效和耐受性等因素區(qū)分,當前,不常用于抗腫瘤藥物確證性研究的主要研究終點。
TTP、PFS和TTF結果的判定均受訪視間隔設計和試驗質量的影響,如由失訪或在研究期間未觀察到終點事件而產(chǎn)生的刪失和截尾值過多,將影響以上終點結果的分析。
肺癌腦轉移患者的納入及終點指標考慮
腦轉移是導致晚期NSCLC疾病進展和治療失敗的重要原因,有癥狀患者需進行臨床干預。既往晚期NSCLC臨床試驗多排除腦轉移患者,或僅入組經(jīng)局部和系統(tǒng)治療病情穩(wěn)定的無癥狀腦轉移患者,因此臨床試驗結果不能反映藥物對腦轉移患者的療效,將導致重要有效性信息的缺失??紤]肺癌腦轉移高發(fā),且控制腦轉移為轉移性NSCLC重要治療目標,鼓勵基于藥物前期的臨床研究結果,在試驗中納入腦轉移患者。注意在基線收集完整準確的腦轉移信息,在療效評估中增加局部轉移獲益的評價,如顱內(nèi)緩解率、顱內(nèi)緩解持續(xù)時間和出現(xiàn)新的腦轉移至顱內(nèi)疾病進展時間等。
腫瘤患者癥狀和體征的改善被認為是直接的臨床獲益,而非替代終點。監(jiān)管當局可能基于顯著的癥狀改善(如惡性積液的控制、癌性乏力的改善和骨相關事件的改善等)批準新藥上市。復合癥狀終點中的不同癥狀指標應具有相似的臨床重要性,其臨床獲益不僅歸因于單個指標的改善,對復合終點進行分析時應對具體單個指標進行分析。
當以癥狀和體征的改善作為支持抗腫瘤藥物審批的主要終點時,應當能夠區(qū)分是腫瘤相關癥狀的改善還是試驗組藥物毒性的減小或缺失。如選擇具體癥狀緩解作為終點,受試者需在基線時存在該癥狀并且癥狀由疾病導致。
數(shù)據(jù)缺失、評價不充分將增加癥狀終點的評價復雜性,應嚴格執(zhí)行訪視計劃使訪視完成率均衡和最大化,統(tǒng)計分析計劃(statistical analysis plan,SAP)應說明如何處理缺失數(shù)據(jù),當患者停止治療時應該繼續(xù)收集可供分析的信息。應進行多種癥狀的前瞻性數(shù)據(jù)收集。存在多重檢驗情況時,需要在SAP中說明必要的一類錯誤控制方法。
我國晚期NSCLC具有高比例的驅動基因突變,其臨床試驗設計可根據(jù)有無療效預測生物標志物分為富集人群試驗和非富集人群試驗。
以腫瘤生物標志物富集人群的試驗設計,應考慮生物標志物和治療分線等因素:
1.生物標志物
生物標志物選擇:需明確具體的生物標志物命名,例如明確某表皮生長因子受體酪氨酸激酶抑制劑(epidermal growth factor receptor-tyrosine kinase inhibitor,EGFR-TKI)適用于EGFR第19外顯子缺失突變和第21外顯子L858R突變。晚期肺癌相關生物標志物的命名應遵循ICH E15。
生物標本要求:標本的取材、固定、儲運條件等可顯著影響判定結果,需明確研究可采納的生物標志物來源——原發(fā)灶、轉移灶或外周血(如ctDNA)等;明確標本的固定要求——石蠟包埋或新鮮冰凍組織;明確標本的儲運條件等。以上內(nèi)容應要在研究方案給予說明或細化為相應的標準操作規(guī)程。生物標本的采集、處理、運輸、儲運和處置的一般性原則應遵循ICH E18的相關要求。
伴隨診斷方法:在確定生物標志物和標本要求后,需明確伴隨診斷方法。
部分應用廣泛、效能已被證實的生物標志物伴隨診斷,如檢測EGFR敏感突變的測序法或突變擴增系統(tǒng)(amplification refractory mutation system,ARMS)法,可在本地實驗室檢測,不需明確伴隨診斷/診斷試劑盒。
尚未廣泛應用,正在臨床開發(fā)過程中的生物標志物伴隨診斷,如PD-L1表達、c-MET擴增和微衛(wèi)星不穩(wěn)定性高/錯配修復基因缺陷(high microsatellite instability/DNA mismatch repair deficiency,MSI-H/dMMR),需明確伴隨診斷方法/診斷試劑盒,并推薦采用中心實驗室(接受本地中心實驗室)。
鼓勵新藥和體外伴隨診斷試劑同步開發(fā)。如開發(fā)一個新生物標志物或檢測方法,在遞交上市申請時應提交充分的關于所選定生物標志物的驗證資料。建議在開展關鍵注冊臨床試驗前與監(jiān)管溝通討論所需提交的資料要求。應遵循ICH E16對遞交材料的背景、結構以及格式要求準備資料,逐步推進。
2.對治療分線的考慮:通常初治患者體能狀態(tài)好,耐受性優(yōu)于經(jīng)多線治療患者。因此,試驗設計時需考慮對既往治療線數(shù)進行分層。
應綜合疾病背景、藥物可及性、臨床需求、前期臨床試驗數(shù)據(jù)等因素,綜合決定以RCT或SAT支持新藥注冊。
3.RCT的設計和終點考慮:RCT是確證藥物療效最為可靠的方法,OS為反映抗腫瘤藥物臨床獲益的金標準,通常作為RCT的主要終點。隨著治療手段的豐富,OS不斷延長增加了評價難度,因此,單獨PFS或PFS與OS共終點可被接受作為初治晚期NSCLC注冊研究的主要終點。納入復發(fā)難治或無標準治療患者的RCT則仍推薦OS為主要終點。
選定主要研究終點的同時應確定試驗設計的設計——優(yōu)效、非劣效或是等效設計。當對照組為標準治療時,可接受優(yōu)效、非劣效或等效設計,選擇等效或非劣效假設時,申請人需要與監(jiān)管部門溝通等效或非劣效界值;當為安慰劑對照或試驗設計為加載設計(Add on)時,僅接受優(yōu)效設計,安慰劑對照臨床試驗設計推薦聯(lián)合最佳支持治療(best support care,BSC),以提高對受試者的保護。
在RCT試驗中,監(jiān)管機構鼓勵以合理的替代終點和預設的期中分析支持批準,在多臂RCT、預設期中分析、共同主要終點或擬對主要終點多重檢驗的情況下,需保障復雜設計下主要終點的總體一類錯誤值,控制在雙側0.05以下。
4.SAT的設計及終點考慮:在難治的疾病背景下觀察到新藥具有突破性療效時,申請人可與監(jiān)管機構溝通,考慮采用替代終點的SAT作為支持有條件批準的關鍵注冊研究,并通過后續(xù)確證性隨機對照試驗獲得完全批準。
SAT最大的局限是無對照帶來的偏倚,導致藥物療效評價的不確定性。因此,如考慮以SAT作為支持新藥加速批準的關鍵研究,應具備如下條件:
充分的歷史數(shù)據(jù):SAT的歷史對照數(shù)據(jù)應來自高級別循證醫(yī)學證據(jù)——具備相近年代、相同疾病背景和足夠樣本量的特點。數(shù)據(jù)可來自單個RCT、真實世界證據(jù)、系統(tǒng)回顧和meta分析的結果,并分析現(xiàn)階段下該數(shù)據(jù)的可靠性。
難治的疾病背景:SAT應在復發(fā)難治的、醫(yī)療需求亟待滿足的疾病中開展。SAT受試者應為目前標準治療失敗或無標準治療的患者人群。
以緩解率/客觀指標為主要終點:由于無對照設計及歷史對照的不確定性,SAT需慎重考慮主要研究終點。ORR定義準確、排除腫瘤自然病程并直接反映藥物的抗腫瘤療效。因此晚期NSCLC的SAT常采用ORR為主要終點。
預設的緩解率目標值:應預設ORR的目標值。目標ORR值95%的置信區(qū)間下限應在充分歷史數(shù)據(jù)基礎上結合產(chǎn)品自身早期臨床數(shù)據(jù)后,與監(jiān)管機構溝通共同確定。通常期望目標ORR值與歷史對照相比有較大提高,目標ORR值95%的置信區(qū)間下限需高于標準治療歷史數(shù)據(jù)上限[10]。
持續(xù)的緩解時間:在確定ORR達到既定標準基礎上,評價緩解持續(xù)時間非常重要,持續(xù)的緩解時間將增加治療獲益的穩(wěn)健性,較長的用藥時間也反映藥物的安全耐受性信息。
獨立評審委員會(independent review committee,IRC):SAT必須使用獨立影像評審委員會,以減少研究者偏倚,并采用研究者評價的ORR進行敏感性分析。
SAT上市后要求和模式:由于SAT為有條件的加速批準,申請人需在開展SAT前與監(jiān)管機構溝通完全批準的條件。通常情況下,在同一線患者中開展的RCT被視為嚴謹?shù)拇_證性臨床[11],因分子靶向治療不過分強調(diào)化療的分線,因此在前一線人群中具有嚴謹統(tǒng)計假設的確證性臨床試驗也可能被接受。監(jiān)管部門將結合目標疾病人群發(fā)病率、療效數(shù)據(jù)的強度、倫理要求等方面綜合考慮確證性研究的具體要求。無法完成RCT的罕見情況下,可依據(jù)真實世界數(shù)據(jù)支持完全批準。
晚期NSCLC中,因尚無明確的療效預測因子,細胞毒和抗血管藥物的臨床試驗常在非富集人群中開展(考慮組織學區(qū)分),部分免疫檢查點抑制劑也選擇非富集人群開展研究。
非富集試驗需著重考慮影響預后的因素(如病理組織學類型、ECOG體能狀態(tài)評分、既往治療和基線腦轉移等),并將重要預后因素分層。在非富集試驗中,治療分線是試驗主要終點選擇的重要依據(jù)。
現(xiàn)階段無驅動基因突變的晚期NSCLC的一線標準治療為以含鉑雙藥為基礎的聯(lián)合治療方案,可聯(lián)合抗血管或免疫治療。與富集人群的RCT設計相似,非富集人群一/二線治療的RCT可以選擇PFS為主要研究終點;二線后的研究推薦選擇OS為主要終點,但需考慮后續(xù)治療及交叉可能帶來的影響。免疫檢查點抑制劑的療效主要體現(xiàn)為部分患者的長期生存獲益,需在一線治療中關注OS獲益的評價,推薦將OS和PFS作為共同主要終點,或將OS作為唯一主要終點。免疫檢查點抑制劑的療效普遍具有延滯拖尾效應,因此不建議對主要終點在過少事件數(shù)(如不足計劃OS事件數(shù)50%)時開展期中分析。
維持治療的目的是鞏固一線治療獲益,延長至疾病進展時間。因此維持治療臨床試驗的主要終點宜與治療目標契合,可選擇PFS或TTF為主要終點;當維持治療的療效為遠期生存獲益時,應選擇OS為主要終點。
除生物標志物的考慮外,非富集人群與富集人群遵循相同的試驗設計和終點選擇。
在現(xiàn)階段晚期NSCLC的藥物研發(fā)中,不同研究終點的RCT設計,均在主要終點達到統(tǒng)計學顯著性后評價臨床價值。
現(xiàn)階段晚期NSCLC的治療目標是延長患者生命,提高生活質量。OS是反映生存獲益的直接終點,其臨床意義重于PFS等替代終點。后續(xù)治療是OS最大的影響因素,因此,在后續(xù)治療均衡的情況下,現(xiàn)階段國內(nèi)外專家考慮認為,在轉移性肺鱗癌中,2.5個月以上OS獲益被認為具有顯著的臨床價值,非鱗癌中3.25個月以上的OS獲益被認為具有顯著的臨床價值,目標HR的點估計值通常不高于0.80[12]。通常將風險比和中位獲益結合評價,認為兩者均達到具有更穩(wěn)健的OS獲益。
PFS為OS的替代終點,PFS獲益能否轉化為OS具有不確定性,多種非治療因素可使PFS的差異達到統(tǒng)計學意義——預后因素分層不均衡、選擇了較弱的對照治療、甚至療效評價時間點的設計等?,F(xiàn)階段晚期一線NSCLC中,肺鱗癌中3個月以上的PFS獲益具有顯著的臨床價值,非鱗癌中4個月以上的PFS獲益具有顯著的臨床價值,目標HR的點估計值通常不高于0.70[12]。
以ORR為主要終點時,核心考慮為全分析集IRC評價的ORR是否達到了預設目標值,并兼顧足夠的緩解持續(xù)時間。現(xiàn)階段下晚期NSCLC中,ORR 95%的置信區(qū)間下限需達到預設目標值。
晚期NSCLC是抗腫瘤藥物的研發(fā)熱點,伴隨新藥研發(fā),晚期NSCLC治療的證據(jù)鏈日益豐富,藥物臨床試驗的設計和終點選擇趨于復雜?,F(xiàn)階段下,延長生存時間和提高生活質量仍是晚期肺癌治療的核心目標,臨床試驗的終點選擇均以能夠客觀高效反映腫瘤治療臨床獲益為原則。科學的進步將推動抗腫瘤產(chǎn)品的研發(fā),鼓勵申請人與監(jiān)管機構溝通并探索創(chuàng)新的試驗設計和研究終點。本指導原則將基于晚期非小細胞肺癌臨床試驗的研究進展情況適時進行更新。
Copyright ? 2004-2025 健康一線-健康視頻網(wǎng)(vodjk.com)All rights reserved.