虽然人类的参考基因组(human reference genome)是目前最准确、最完整的脊椎动物基因组,但即使经过20年改进,完整的DNA串行始终存在缺口。现在,一组国际遗传学团队首次确定了人类X染色体从头到尾(端粒到端粒)的完整串行,没有空缺且准确性达到空前水准。

对一般人类来说,23对染色体中有一对称为性染色体(决定性别),女性的性染色体中有2条X染色体(X chromosome),男性则X、Y染色体各有1条,然而这2个X染色体并不相同,它们的DNA串行存有许多差异。
来自美国国立卫生研究院(NIH)国家人类基因组研究所(NHGRI)、加州大学圣克鲁斯分校、华盛顿大学医学院等20多个机构的科学家们,没有选择利用一般人类细胞的X染色体进行测序,而是挑选一种特殊细胞类型,它们具有2个相同的X染色体。
过去基因组测序遇到的一个大问题是,传统技术一次只能读取DNA的短片段,然后科学家将之一段一段拼凑起来,但当这些片段一遍又一遍重复时,拼装工作就变得困难重重,团队形容就像在组装单一色彩的拼图。
此外,X染色体最难探索的区域是高度浓缩的着丝粒(centromere),为了解决这个难题,研究团队使用新方法读取更长的DNA串行,其中一种称为纳米孔技术,让单个DNA分子穿过一个小孔,然后借由检测电流变化来进行测序,一次能读取数十万个碱基对,跨过曾经被当作难处理的区域。
最终,研究团队得以填补着丝粒的研究空白地带,包括发现约310万个之前映射不出的DNA碱基对,并发现在参考串行中有缺口的区域,实际上是变异最丰富的区域。
这项发现有助于解开更多人类疾病与生物学谜团,X染色体只是个开始,团队表示,他们计划在2020年底之前将其他染色体DNA串行全部测出,也许我们很快就会拥有完整的人类基因组串行。
新论文发布在《自然》(Nature)期刊。
(首图来源:pixabay)