本文内容仅代表作者的观点,并不代表美国哈佛大学官方及其所属学院保健中心、国家研究资源中心和国家卫生研究所。
在2003年,美国食品与药品管理局(fda)批准了重组人生长激素治疗特发性矮身高(iss)儿童。fda的定义为治疗前的身高在年龄平均数下2.25 sds(1.2nd百分位数),而无基础疾病或gh缺乏。虽然预测成年身高不是使用gh治疗iss儿童的标准之一,但fda的标准包括了“生长速度不能使其成年身高达到正常范围之内”的说明。此外,fda确定了成年身高为男性63英寸(160cm)女性59英寸(150cm)的1.2nd百分位数界值。
根据gh治疗的iss适应症,现在美国有~400000名儿童具有gh治疗的资格。批准gh治疗iss依据了2项小样本的临床试验研究,一项研究(33名受试者监测到成年身高)是随机化、安慰剂对照试验,另一项(50名受试者监测到成年)是比较成年身高与预测成年身高的非盲、剂量反应试验。两项试验使用了bayley-pinneau (bp)的成年身高预测方法。其它应用gh治疗iss儿童的研究受到样本大小的限制。一项cochrane系统综述包括了10项随机对照试验研究中的741名iss儿童,平均治疗持续时间和身高的增长不同,结果组合证明1年的身高增长在0-0.7 sds。这项综述并未比较近成年身高与预测的成年身高。
批准对iss儿童以gh治疗,对于美国卫生保健系统带来明显的潜在成本。lee et al在2006年检验了fda用来支持批准的2项研究,来估价以gh治疗iss儿童的成本效益。所估价的成本效益为每英寸52000美元,如果治疗5年平均身高增长1.9英寸,每名儿童的成本增加接近100000美元。根据每名儿童的平均年成本,治疗所有符合条件的儿童的可能成本约为400亿美元。保险公司已经看到了这样的成本,因为许多公司拒绝覆盖iss的gh治疗。
通常使用预测的成年身高来评价矮身高儿童,因为gh治疗不能说明一名儿童的生长是否能达到1.2nd百分位数以上的身高。例如,对于体质性生长延迟儿童,当前的身高sd分值常常低于预测的和成年身高sds。因此,为了评价iss儿童是否适合于以gh治疗,内分泌医生经常使用预测方法来预测成年身高是否低于1.2nd,分别对应于男160cm和女150cm的成年身高。一项2006年的儿科内分泌医生调查表明,一致使用<5th百分位数作为决定gh治疗的预测身高目标。因为这样的预测结果对于决定是否以gh治疗至关重要,所以我们评价了所使用的预测成年身高公式的一致性。
方法
模拟样本
我们构建了1000名男孩和1000名女孩的模拟样本,具有典型的年龄、身高、体重、骨龄及父母身高的分布,包括有适当的上下限以及变量之间的相关关系。通过回顾临床医生数据,并根据grimberg et al为三级保健中心评估生长速度下降而对治疗者之间性别差异的比较研究,确定变量的分布。grimberg et al的研究发现了治疗者之间的性别、身高和父母身高中值的差异(一般来讲,女孩身高sds较男孩低)。
所有分析使用sas软件。生成两个三角形的随机年龄分布,男孩年龄范围在6-16岁,年龄高峰在13岁,女孩年龄范围6-14岁,年龄高峰在11岁。开始生成的样本为2500名男和2500名女,用于截断和删除,得到最终的1000男和1000女。对每一名儿童的身高、体重、骨龄和父母身高生成多变量正态z分值(平均数0,sd=1)。在文献中我们未能发现这些变量的相关系数,而是依据了我们的数据的观察分析。使用编制的随机数生成器程序使儿童身高和体重z分值之间的相关系数为0.90,父母身高之间为0.60,儿童身高与父母身高之间为0.50,儿童体重与骨龄之间为0.15,儿童骨龄与父母身高之间为0.15,其它z分值之间为0。而且,为了检验我们的结果对估价相关系数的灵敏性,我们完全取消了假定的相关系数,并在完全模拟中进行复制。
对初步样本进行位移和截平,以反映典型的矮身高的分布。对于女孩,身高分布移动-0.75 sds,体重分布移动-0.25sds。身高上限为-1sds,体重上限为 1sds,父母身高移动0.25 sds。z分值分布进一步截平,以消除极端值,删除体重低于-3 sds、男孩身高低于-4 sds和女孩身高低于-4.5 sds、父母身高低于-2.5 sds、以及生活年龄与骨龄差值超出±2 sds的数值。
使用美国儿童特定性别和年龄的标准值将身高和体重z分值转换为cm和kg。我们假定儿童的生活年龄与骨龄相差0±1岁(平均数±sd)。使用疾病控制和预防中心最大年龄(20岁)的标准值将父母身高z分值转换为cm,并计算出父母身高中值。在上述删除后,随机模拟样本剩下2680名,选择前1000名男和1000名女进行分析。
成年身高的预测
我们通过文献以及通过与认证的儿科内分泌医师访谈,挑选了3种成年身高预测方法。bp方法使用一系列儿童成年身高百分数表,根据儿童性别、年龄和骨龄来选择使用,可供选择的年龄范围在7-18岁,根据性别和骨龄忽略各末端值。
使用模拟的儿童性别、年龄和骨龄,我们确定适合使用的表中数据,计算预测的成年身高,975名男和991名女得到了预测的成年身高。
roche-wainer-thissen (rwt)方法直接根据儿童的身长、体重和骨龄,以及父母身高中值,使用特定性别和年龄的系数,计算预测的成年身高。如同使用rwt方法的文献,我们以站立身高加1.25cm为仰卧身长。rwt方法的系数表至女14岁、男16岁。
khamis-roche (kr)方法直接使用身高、体重、父母身高中值线性回归方程计算预测的成年身高,特定性别和年龄的回归系数由4-17.5岁。
我们应用了三种方法计算1000名男和1000名女的预测成年身高,并根据预测成年身高结果是否低于1.2nd百分位数分类。
统计分析
使用标准的统计量(平均数、sd、范围和pearson相关系数)描述模拟样本,证实符合预期的特征。以cm计算预测成年身高,并使用标准的生长图表转换成z分值和百分位数。每种指标的分布以1000名男和100名女的平均数和sd描述。使用spearman秩相关统计量配对比较不同方法预测结果。预测成年身高的分类以性别和预测方法分别列表。使用多种方法的k值,估价3种方法的一致性;使用cohen方法间的k值配对评价一致性。为了检验模拟的再现性,我们随机生成了新的30组1000名男和1000名女的身高、体重和年龄数据,来检验预测成年身高的可变性。为了检验模拟对假定参数的敏感性,我们在身高、体重、父母身高和骨龄之间的相关系数重复30次。
结果
表1为模拟样本的特征,与预期的分布和相关系数密切一致。男平均年龄11.5岁、女10.3岁,并且每一性别的例数相同。男孩平均身高为-2.03±0.66sds,女-1.50±0.76sds,反映了典型的矮身高病人。年龄、身高与体重之间密切相关,这些变量之间的相关系数范围男由88%至97%,女由77%至96%。其它的模拟变量相互之间无相关,也与身高、体重、年龄无相关,最大pearson相关系数为19%。
图1为一次模拟复制(1000名男和1000名女)中每种预测方法预测的成年身高的分布。在每图中红线标志为身高分布的1.2nd百分位数。虽然这个阈值不是使用gh治疗iss儿童的fda标准,但我们关注在1.2nd百分位数左右的分布以及预测身高的一致性。表2汇总了3种方法预测身高的分布和不同方法间一致性的统计量,数值为30次随机复制的平均数。bp法预测的男女成年身高最低,男平均预测身高比kr方法低7cm,女约低10cm。rwt方法预测的成年身高处于上述两种方法之间。我们发现不同方法之间预测成年身高<1.2nd百分位数的模拟病人比例显著不同(图1,表2),bp法预测成年身高<1.2nd百分位数的例数为男43%、女81%,而kr方法仅为男3%、女0.2%。bp和rwt预测的女孩矮身高的比例较大,而rk法预测的男孩矮身高比例较大。不同方法预测相同儿童成年身高的秩相关为中等强度(0.66-0.89)(表2)。该统计量未考虑上述三种方法平均预测身高的系统差异。不同方法预测身高<1.2nd百分位数的一致性κ值范围由0.42(男孩bp与rwt)至实际上的0(女孩kr与bp和rwt)之间。方法间的总一致性κ值为男0.21、女为负值(表2)。
30次复制中的变异是可以忽略的,平均身高的变动在0.1至0.2cm之间,平均z分值在0.02至0.04之间,成对κ至在0.00至0.05之间,其它参数也类似。取消身高、体重、父母身高和骨龄之间假定的相关系数的影响可忽略,仅对表2中小κ值衰减结果有一定的影响。
讨论
我们的研究评价了矮身高儿童使用的三种成年身高预测方法的变化,发现在这些普遍使用的方法之间存在宽大的差异。我们的结果表明,bp法预测的成年身高低于其它方法。这是第一项使用代表矮身高儿童大样本模型比较成年身高预测方法的研究。成年身高预测方法之间的变化对于临床决定和解释研究结果是重要的,许多研究方案和发表的gh治疗iss儿童的研究使用了近成年身高与预测的成年身高的比较为结束点,而且预测成年身高也被一些研究者用作为iss儿童对重组人胰岛素样生长因子-i和gh与促性腺激素释放激素激动剂联合治疗的生长反应的标志。
对iss儿童使用预测的成年身高作为结果变量应当小心解释,因为我们证明不同成年身高预测方法提供了不同的预测结果。此外,虽然最近关于使用gh治疗iss的共识声明承认成年身高预测的不准确性,但是却结论为预测成年身高可能有助于结合其它指标
决定gh的使用。因此,从业医生和研究者可能继续依赖于预测成年身高来做出决定。
和其它小样本研究所证实的一样,身高预测方法应用于不同病人群将导致或低或高的成年身高预测,准确性存在很大的差异。maes et al在62名男和28名女矮身高儿童,比较了三种身高预测方法的准确性,发现bp法对于矮身高男孩最准确,而twii法对于矮身高女孩最准确。因为twii法的骨龄评价方法与bp和rwt不同,所以我们未使用twii法。roemmich et al在23名无生长疾病男孩,比较了三种骨龄方法和成年身高预测方法,总体来说,twii方法过低预测了成年身高,而其它方法(bp、rwt方法和使用fels骨龄的rwt法)过高预测了成年身高。sperlich et al比较了49名体质性生长延迟男孩的bp、twii、rwt方法预测结果与成年身高,来分析成年身高预测的准确性。虽然预测的平均成年身高与平均成年身高显著相关,但个体成年身高与预测的成年身高之间表现出较大的偏差,>30%的实际成年身高与bp法预测的成年身高相差>5cm。也有报告研究了高身高儿童的成年身高预测,通过五种预测身高模型的比较,得出的结论为,这些方法都不是最好的和最准确的,每种方法都可在一定条件下应用,其准确性依受试者年龄、性别和骨龄而不同。
本文的局限性是使用了模拟的样本,但是,样本的生成反映了实际的矮身高评价的病人人群,并用于直接比较三种身高预测方法。尚需实际矮身高儿童大样本的前瞻性研究来估价不同身高预测方法的准确性。使用骨龄的身高预测方法都受到骨龄评价的影响,可能也引起身高预测的偏差和误差。
大部分临床医生都通过x线片与g-p标准的整体比较测定骨龄,而不是评价每块骨的成熟度计算平均骨龄。我们认为,这种普遍使用的比较方法并不是标准的使用方法,但对于本研究的目的来说,我们假定了骨龄是正确的。最近已经提出了一种新的使用自动骨龄评价的成年身高预测方法,这种方法消除了评价者间的可变性和系统偏差,减少了身高预测误差。虽然在欧洲已经批准这种方法的使用,但在美国仍有待于研究,而且也尚未得到广泛的应用。
即使有一致准确的骨龄评价结果,我们也注意到,g-p骨龄标准依据于1930s的美国白人儿童,可能不能推广到当代不同种族人群。loder et al发现,当将g-p标准应用于当代黑人女孩和白人男孩时,g-p标准的准确性下降。zhang et al.证实g-p标准未反映种族差异,过高估价了亚洲人和西班牙人儿童的骨龄。roemmich et al所做的比较强调了骨龄评价方法的差异,当以twii方法评价时骨龄最大,以g-p标准评价时骨龄最小。甚至对纵断研究的健康个体儿童,随时代的变迁骨龄的准确性也不同。总之,这些研究说明,甚至对理想环境条件下的当代儿童,骨龄评价也不是完全准确的。
结论
我们证实了普遍使用的三种方法预测的成年身高有宽大的差异。因为三种方法得出明显不一致的身高预测结果,所以有必要进一步研究,以确定哪种方法对于矮身高儿童的预测最准确,如果发现骨龄自动测定比人工测定更准确,那么自动测定方法有助于减少身高预测误差,并可更准确地比较不同成年身高预测方法。鉴于gh治疗iss儿童的医学、社会心理学以及所涉及的费用问题,父母、临床医生和研究者了解成年身高预测方法有相当大的不确定性是很重要的。