Genome Research |长cfDNA更擅“预测”基因表达

cfDNA的片段模式被证明与众多生物学特性有关,包括核酸酶活性、DNA甲基化、核小体结构,mRNA表达水平,这些特征背后的生物学机制正得到广泛的研究。

 

例如,cfDNA分子的大小分析反映了cfDNA片段化模式的特征。通过短读长测序,发现了血浆cfDNA片段大小分布特点,即cfDNA主要集中在166bp的长度,并以10bp的周期缩短,表明了其核小体起源。

图1. 经典的cfDNA长短分布以及在chr12p11.1 loci.区域的不同覆盖和片段化末端模式[1]

       此外,cfDNA来自不同组织的碎片可能会携带可以追踪到其起源组织的信息。例如,孕妇中的胎儿cfDNA分子和癌症患者中的肿瘤cfDNA分子通常较短,这些发现促进了将cfDNA的长度信息用于疾病检测。

 

cfDNA通常被认为是一个短DNA的集合,不过在近些年,这一观念正在改变。利用长读长测序技术(SMRT/ONT)优势,在健康个体、孕妇和癌症患者的血浆DNA中发现了长达10Kb的cfDNA。因此,长读长测序技术可能揭示更广泛的cfDNA分子特征。

 

在先前的研究中,人们可以利用甲基化模式来探索长cfDNA分子的组织起源。然而,长分子的其他生物学特性仍在很大程度上未被探索。为此,卢煜明教授团队利用长读长测序技术对不同生理和病理来源的血浆cfDNA进行分析,探索了长cfDNA的不同基因组元件的起源,包括常染色质和异染色质区域,相关研究发表在Genome Research杂志上[2]

       利用长读测序对不同来源的血浆cfDNA进行分析显示,来自整个基因组的长cfDNA分布不均匀。与短cfDNA形成鲜明对比,长cfDNA在基因组常染色质区域富集,暗示其与基因表达相关。

图2. 相较于短cfDNA,长cfDNA在含有大量基因的染色体明带区域富集[2]

进一步分析不同长度cfDNA的丰度和转录活性的关联性发现,与短cfDNA相比,长cfDNA的丰度和mRNA基因表达水平之间的关系更强。此外,与短cfDNA相比,长cfDNA的甲基化程度较低。

 

图3. 长/短cfDNA与基因表达相关性[2]

研究还发现,长和短cfDNA在CpG位点周围表现出明显不同的片段模式。利用CpG位点周围的切割偏好,长分子和短分子的联合切割率可以区分肝癌患者和非肝癌受试者(AUC=0.87)。

图4. 利用cfDNA的CpG切割模式识别肝癌患者[2]

研究团队还进一步研究了不同核酸酶基因失活的敲除小鼠中,长cfDNA特征的变化。与野生型小鼠相比,在Dffb缺陷小鼠中,来自转录起始位点的长cfDNA比例较低,而在Dnase1l3缺陷小鼠中,其比例较高。

 

在未来,随着长读长技术的成熟,利用长cfDNA丰度和片段模式的癌症检测性能可以进一步提高。此外, 还需要一个更大的队列来验证这些生物标志物。综上,这项工作扩展了目前对长cfDNA分子片段特性的认识,为长cfDNA分子的生物学特性和潜在的临床应用提供了新的见解。

参考资料

1. An Y, Zhao X, Zhang Z, et al. DNA methylation analysis explores the molecular basis of plasma cell-free DNA fragmentation[J]. Nature communications, 2023, 14(1): 287.

2. Che H, Jiang P, Choy L L Y, et al. Genomic origin, fragmentomics, and transcriptional correlation of long cell-free DNA molecules in human plasma[J]. Genome Research, 2024: gr. 278556.123.

推荐阅读