临床研究设计的基本原则(下)

(整期优先)网络出版时间:2019-02-22
/ 4


[关键词] 临床 研究设计 原则

健康网讯: 三、重复(Replication)的原则

(一)重复的概念和意义

“重复”即要求研究样本对于相应的总体具有代表性,它包含研究样本应具有

与相应总体的同质性和足够的样本含量的两个条件。这是为了保证从研究样本所获

取的信息、研究结论能外推及具有同一性质的别的病人。

从上面叙述可知,样本的代表性既具有“性质”方面的特征,也有“数量”方

面的要求。临床研究中,选取什么性质的样本,代表什么性质的总体,是由研究目

的所规定的。不同的研究目的要求纳入不同范围、性质、特征的研究对象。而同一

的研究目的,则要求纳入具有相同范围、性质、特征的研究对象,这也称研究对象

的“均一性”。与其说,研究样本对于相应总体具有“同质性”,不如说,从研究

样本所得到的结论只能推及于与样本具有相同范围、性质、特征的人群。

为了使从研究样本获取的研究结论具有外推性,除了“同质性”外,还必须有

足够的样本含量。由于临床医学的研究对象是人,生物学的差异是普遍地存在着,

并且无法以人为的方法加以控制和避免。同时,社会因素、自然环境、个体的思维

、情感等也都对个体的健康或疾病状况起重要影响。即使是同一疾病,不同个体的

差异也常常异常明显,表现为不同的临床过程、类型和预后。因此,如果仅仅从少

数或极有限的研究对象获取关于疾病病因、临床过程、诊治效能的信息,并据此推

导结论,显然是片面、不完整的,有时甚至可能是错误的。临床研究结论只有建立

在足够的样本含量基础之上,才有可能尽量减少偏倚和控制或识别机遇的影响。

(二)临床研究实施重复原则的常用措施

1、严格按照研究目的规定研究对象的性质与范围

临床研究常是以疾病作为研究的客体。对此,有关研究对象的性质与范围涉及

下列几个方面。

(1)诊断标准(Diagnostic Criteria):指能够正确诊断一个疾病或证候的现

行公认的标准。其来源有:

① 国际统一标准:如世界卫生组织(WHO)关于原发性高血压的诊断标准

;美国风湿病学会(ARA)关于类风湿性关节炎的诊断标准;

② 国内统一标准:包括政府主管部门,全国性学术组织制订的诊断标准;

③ 地方性学术组织制订的诊断标准;

研究者可根据实际情况按上述先后顺序进行选择。中药新药的临床试验常以中

医病、证为主体,或病、证结合为特征,因而中医病、证的诊断标准是需要首先考

虑的,如评价对于现代医学疾病的疗效时,同时也要有关于现代医学的疾病诊断标

准。

(2)纳入标准(Inclusive Criteria):指合格受试者所应具备的条件。在

一项具体研究中,被纳入研究的对象,除应符合诊断标准外,研究者还必须根据具

体的研究目的及实施的可行性,对纳入研究的对象的其它条件同时作出规定。一般

包括:

① 对于病情、病型、病期、病程的规定;

② 对年龄、性别、婚姻状况的规定;

③ 对职业、居住地、个人嗜好状况等的规定。

(3)排除标准(Exclusive Criteria):指不应该被纳入研究的条件。其目

的在于排除其它情况对于研究结论的影响

① 不符合诊断标准和纳入标准者。

② 虽符合诊断标准,但有下列情况之一者:

a同时患有其它病、证或合并症者;

b已接受有关治疗,可能影响对效应指标观测者;

c伴有影响效应指标观测、判断的其它生理或病理状况,如月经周期;心、肝

、肾损害,影响药物体内代谢者;

d某些特征人群如被纳入研究则有悖于医疗道德者,如孕妇、婴幼儿、未成年

人、高龄患者、过敏体质、病情危笃或疾病的晚期患者;

e不合作者,如不愿意接受研究措施或因患有精神病未能合作者;

f其它:如住地过远,未能随访者。

上述“排除标准”并非是绝对的。不同的研究目的常有不同的排除标准。如果

一项研究旨在观察药物在肝肾功能损害人群中的剂量选择,自然,排除标准中就不

应该将肝肾功能损害者列入其中。

值得指出的是,临床研究常需设立对照,若是不同总体间的比较,则对照人群

也应有相应的诊断、纳入和排除标准。某些研究,以健康人为受试者或对照人群时

,必需根据具体研究目的,予“健康人”以定义和标准。

诊断标准、纳入标准和排除标准是确定合格受试对象的互为补充、不可分割的

必备条件。研究者在临床研究的实施过程中必需十分严格地按照已制订的标准选择

研究对象,避免选择性偏倚的产生。可以设想,当进行一项旨在治疗湿热泄泻的临

床试验时,将脾虚泄泻者也纳入研究,必然影响对于该药的疗效评价。

2、保证临床研究足够的样本含量(Sample Size)

(1)决定样本含量的有关因素:一项临床研究,样本含量应该多大才能使样本对

总体具有代表性,这是一个极为复杂的问题,通常需要根据研究目的、设计类型、

专业要求和统计学要求而确定。例如队列研究与病例-对照研究,对样本含量大小

估算要求不一样。两样本比较和样本与总体比较的样本含量也不一样。现通过对临

床试验样本含量大小的估算加以说明。一般来说,随机对照平行试验所需的样本含

量与下列因素有关:

① 样本中所包含的个体的差异程度:个体之间的差异越大,所需观察的病例

数越多;反之,若个体之间差异较小,则所需观察之例数较少。例如,对于某一个

疾病的研究,若包含了病情程度不一的轻、中、重型病例,则对比于仅观察其中单

一的某一型所需的病例数要多。

② 组间效应差异的程度:组间效应差异越大,所需观察病例数越少;反之,

则所需观察病例数较多。预期两组有效率差异为30%时较20%时所需的病例数为少

。当然,不能为了减少观察病例数,不切合实际地过高估计试用药物的预期疗效,

因为这样无补于事,无法获得有意义的阳性结果。

③ 统计资料的性质:以计数资料或等级资料作组间效应比较时,所需的样本

含量较以计量资料作比较时要大。

④ 统计推断的严格程度:即以显著性检验为基础所进行的统计推断所得出的

结论与真实情况相符合的程度。用下列指标进行衡量。

aⅠ型错误:统计推断拒绝了实际上成立的无效假设(H0)。Ⅰ型错误的概率

用α表示,故又称α错误。在这里,Ⅰ型错误指的是,组间差异实际上

是不存在,统计推断的结果,却错误地承认组间差异的存在,又称假阳性。进行统

计推断时研究者需要对容许犯Ⅰ型错误的大小作出规定,通常是P≤0.05,因为在

这一范围内, 若作出拒绝 H0的推断,其所犯的Ⅰ型错误概率已很小,故承认这

一推断的正确性。P值越小,所需样本含量越大。

bⅡ型错误:统计推断的结果不拒绝实际上是不成立的H0,其出现的概率用β

表示,故也称β错误;或者说当组间的差异确实是存在时,统计推断却不承认该差

异的存在,故也称假阴性。β值越小,则所需的样本含量越大。根据实际情况,通

常规定β≤0.10,必要时可取β=0.2。

c把握度(Power):或称检验效能。当组间确实存在差异时,按所规定的α水

平,能发现组间差异的能力。把握度与Ⅱ型错误互补,两者的概率之和为1。若β

=0.10,则把握度=1-0.10=0.90,表示若组间确有差别时,通过100次的试

验,有90次能得出组间有差别的结论。把握度越高,则其所需样本含量越大。

(2)样本含量的估算:

①进行样本含量的估算的有关信息:

a由样本推及总体的信息:在临床试验中,主要是关于比较组的效应及其差异

。如比较两组率时应知道两组的率 P1与P2及它们的总体率之差δ(一般以P1-

P2估计之);要比较两均数时应知道两均数u1和u2及两总体均数之差与标准差

之比(u1-u2)/δ(一般用 1、 2 分别估计总体均数u1、u2,用两样本的合

并标准差估计δ)。

b统计推断的要求:确定a,β(或检验效能,Power);双侧检验或单侧检验。

上述参数和信息可以通过查阅有关类似研究的资料,或作预初试验而获得。研究者

也可根据专业知识要作出合理的假设。

②样本含量估算的举例:关于样本的估算,统计学家为此制定了各种计算公式

和专用表,各种情况下计算样本大小的方法和原理较为繁复,现仅结合例题介绍两

种临床试验常用的样本大小估算简查表。

a计数资料样本的估计(查表法):可查两样本率比较时所需样本含量简查表

(见表5-2)在使用此表时应事先做到:

·了解比较组(指对照组)的反应率,P1(%);

·根据所需由研究者自拟试验组的期望反应率,P2(%);

·得两率差值δ,δ=P2-P1;

·根据所需,确定α、β、Power;

查表5-2:表左侧 P1(较小率)栏纵行内找到较小的反应率或相近似数值所

在,从该数起向右与相应的δ行相交,按所规定的 Power(检验效能)读取相应数

字,即为每组所需的最少个体数。

例:设青霉素治疗慢性气管炎近期控制率仅为20%,现拟用某中药治疗,要求

该中药近期控制率须达40%才能有推广意义,设α=0.05,检验效能为90%,问需

多少病例才能得到两组比较具有显著性差异的结论?

已知P1=20 P2=40 δ=P2-P1=40-20=20

a=0.05 Power=90%

因该药疗效可高于或低于青霉素,故应查双向试验用表得:n=105, 则两组

共需105×2=210(人),即至少需210人才能得到两组比较具有显著性差异的结论

b计量资料样本的估计(查表法):可使用两样本均数比较时所需样本含量简

查表(见表5-3)。使用时应事先做到:

·了解比较组的标准差s;

·拟定实验组均数与比较组均数的期望差值δ;

·求出差值与对照组标准差的比值δ/s;

·确定a,β,Power;

例:假定根据以往经验,某型动脉硬化病人血清胆固醇含量标准差为30mg%,

现拟用某中药降低胆固醇,要求至少降低胆固醇50mg%才能应用于临床,问最少

需用多少病例才能使真正有效的中药能得出显著结果而被应用?(规定a=0.05,

Power=90%)。

已知对照组标准差s=30mg%

差值δ=50mg%

则δ/s=50/30=1.7

按双侧检验查表5-3得n=9 共需9×2=18例

即共需病人至少18例。

以上仅简单介绍适合于临床试验时计数资料和计量资料样本含量估算的查表法

。实际上,有关这方面的专用表为数不少,适用于不同情况。实际工作中,常碰到

许多情况是不能靠查表来解决的,应借助公式计算,最好是请教统计学家或有关人

员。

最后,请大家在阅读医学文献时,对于某些临床试验的结论,特别是得出阴性

结论的临床试验,有必要根据试验的样本例数N和所规定的a水平去检验该试验的

检验效能是否过低(即样本含量不足)。只有在检验效能较高的条件下,我们才能

比较有把握地接受这个结论。

表5-2两样本率比较时所需样本量(双侧)

------------------------------

较小率 δ=两组率之差(%)

(%) 10 15 20

------------------------------

10 260 130 79

15 330 160 95

20 390 185 105

------------------------------

表5-3 两样本均数比较时所需样本量

----------------------------------------

双侧 α 0.05 检验

δ/sβ 0.05 0.1 0.2

----------------------------------------

1.5 13 11 9

1.6 12 10 8

1.7 11 9 7

1.8 10 8 6

----------------------------------------

四、盲法(Blind Method)的原则

(一) 盲法的概念和意义

“盲法”是指临床研究过程指标的观测、数据的收集和结论的判断时,应在不

知道研究对象的分组前提下进行。

临床研究的目的在于对提出的假说得到一个可靠的,无偏倚的论证。偏倚,如

前所述,可以来自设计到结果分析的每一环节,既可以来自研究人员方面,也可以

来自研究对象方面。进行盲法的临床研究其主要目的就是为了克服可能来自研究者

或受试者的主观因素所导致的偏倚。此外,在非盲性临床治疗试验中,受试者可能

对新疗法尚有怀疑或对传统疗法已失去信心而中途退出试验,使研究结果难以得到

正确的评价。

(二) 盲法的实施

1、盲法的种类

(1)单盲法:在实施一个试验方案时,对于研究对象的分组或者所施加的研

究因素(如选用药物),只有研究者知道,而研究对象不知道。单盲法可以避免来

自受试者主观因素所导致的偏倚,但仍然无法克服来自研究者方面的偏倚。在实施

过程中,研究者还可能由于心理因素或其它原因对实验组和对照组给予不同的关注

;以安慰治疗作对照的研究中,出于某些原因,有些研究者很可能给予对照组添加

“补偿治疗”,而影响了研究结果的真实性。

(2)双盲法:在实施一个试验方案时,对于研究者的分组或者所施加的研究

因素(如选用药物),研究者(包括资料分析者)和研究对象双方都不知道。双盲

试验大大减少了来自研究者和研究对象两方面主观因素所造成的偏倚。

2、实施双盲方法的具体要求

(1)关于药物剂型与给药方法:实施双盲方法要求各组的药物在外观的形状

、大小、颜色,给药的途径、方法、次数上保持一致。药物临床试验时,若试验药

与对照药的剂型不一样,双盲法的实施可采取:试验药+与对照药剂型一样的安慰

剂;对照药+与试验药剂型一样的安慰剂,并分别编上密码。这称之为“双盲双摸

拟”方法。在不等的随机对照中,可按研究对象接受试验药物或对照药、按研究对

象的组别及其进入研究的序号事先混合统一编码。

(2)双盲方法的管理:实施双盲法过程中,需要有“局外”的管理、监督者

、他们仅参与设计、药物编码的控制与保密,资料的保管、分析等,他们并不直接

参加临床研究的观测和数据收集。临床研究结束并完成数据分析时,密码控制者予

以“揭盲”,“揭盲”时应有主要研究人员在场。 在临床研究过程中,如研究对

象出现可疑的严重不良反应或病情发生明显的进展,应予以“破盲”,并同时使用

必要的治疗措施。“破盲”应局限在较小范围内进行,尽量减少由于“破盲”对双

盲实施的影响。

(三)有关问题的讨论

1、“双盲”法并非适用于所有的临床研究,有些临床试验只能是非盲法的

例如探讨针灸疗法的疗效;比较手术疗法和保守疗法对某些疾病的疗效;评定

生活习性(饮食、运动和吸烟等)对疾病的影响等。中药临床试验,也可能因为药

物制剂的颜色、气味等而使双盲方法难以实施。在这种情况下,应采取措施使辅助

检查或实验室的研究人员仍然在不了解研究对象分组的情况下检测和分析结果,以

提高对观测指标判断的准确性。

临床试验的终点指标如果是明确的硬指标,如存活或死亡,则可以是非盲法的

2、临床试验中有所谓改良双盲性,即将试验分为两个阶段

第一阶段为公开期,将获得疗效者留下,无效者弃去;第二阶段为双盲试验期,将

“有效”者按随机方法分成实验组与对照组作双盲试验。如疗效差别有显著性,则

表示该效果系所试药物的作用。由于试验在不同的时期进行,改良双盲法的应用有

一定的局限性。

3、盲法实施,通常存在一定程度的伦理道德问题,应注意其可行性

在研究计划中,应针对由于盲法而可能出现的事件制定相应的具体措施,例如,该

如何为研究对象提供非特异性的基础治疗;在什么情况下应该“破盲”;以及“破

盲”后的“补救”方法等。

4、避免意外“破盲”

为保证双盲法的良好实施,提高研究人员,尤其是直接接触研究对象者对研究

计划的依从性是十分重要的。否则,无论如何严密的盲法都是难以保证意外“破盲

”的。