苏格兰万人队列表观基因组关联研究揭示DNA甲基化与多种疾病之间的关系
发布时间:2023-09-01作者:信息来源:

  表观基因组关联研究(Epigenome-wide association studies,EWAS)将表观遗传信息如DNA甲基化与复杂疾病进行关联,揭示非遗传信息变异在复杂疾病的致病病因等方面的潜在作用,弥补了全基因组关联分析的不足。目前,针对复杂疾病的EWAS研究大体上可以分为两类,一类是患病分析(prevalence analyses),另一类是发病分析(incidence analyses)。前者是对整体人群的横向分析,后者是在未发病人群中进行纵向分析评估观察发病情况。

  然而,目前EWAS所选取的样本较小,通常少于1,000个样本,这限制了表观遗传与复杂疾病关联的发现。荟萃分析(Meta-analyses)虽然可以弥补样本量上的不足,但却忽视了不同研究之间的异质性。因此需要大队列的针对单一人群的EWAS研究以揭示多种复杂疾病的患病和发病状况。这种研究也会有助于开发常见疾病的血液甲基化分子标记。此外,也需要进行结构性的文献回顾以评估EWAS所发现的位点与疾病之间的相关性和一致性,从而进一步证明EWAS在揭示常见复杂疾病潜在分子机制中的实用性。

  近日,英国爱丁堡大学Riccardo E. Marioni 团队在PLOS Medicine上发表了文章Blood-based epigenome-wide analyses of 19 common disease states: A longitudinal, population-based linked cohort study of 18,413 Scottish individuals,通过对单个族裔大样本队列——18,413个苏格兰志愿者全血样本的752,722个CpG甲基化位点进行分析,评估了19疾病与DNA甲基化的关联性。

  首先,研究人员选择了Generation Scotland: the Scottish Family Health Study(GS)队列作为研究对象。GS由爱丁堡皇家学会于2001年提出,该计划以家庭结构为基础。参与者必须在35岁-65岁之间(后放宽到18-65岁),必须拥有一位直系亲属或兄弟姐妹。

  截止2023年5月,该计划已经招募了约7,000个家庭(有5,573个家庭,平均家庭成员数为4人,还有1,400名没有亲属参与的个体)共计24,000名志愿者(包括6,665名患者、16,007名家庭成员和1,288名未经邀请主动自愿参加的个体),这些志愿者均填写了相关调查如病史,个人健康数据,并被采集了血液、尿液等样本。

  研究人员选择了2006-2011年招募的18,413名志愿者,平均年龄47.5岁,女性占比58.8%,并将分析分成了两部分:

  1)患病分析(prevalence analyses),该组志愿者招募时已自述疾病状态并提供了血液样本;

  2)发病分析(incidence analyses),该组志愿者在14年随访中出现新发疾病。

  前一部分包括14种疾病:阿尔茨海默症、乳腺癌、慢性肾病、慢性颈背疼痛、慢阻肺、结直肠癌、2型糖尿病、缺血性心脏病、肺癌骨关节炎、帕金森病、前列腺癌、风湿性关节炎和中风。后一部分疾病包括19种:在前一部分的14种疾病的基础上加上新冠严重性、炎症性肠病、肝硬化、持久性新冠和卵巢癌。

  该工作的设计路线图

  接下来,研究人员利用Illumina Infinium?? MethylationEPIC Array芯片对18,413例志愿者的全血样本进行了DNA甲基化检测。通过年龄、性别、血细胞计数校正后发现了10种疾病里的1,340个显著相关(association),其中90%的相关是2型糖尿病、慢阻肺和慢性疼痛。当进一步纳入生活方式与人群结构校正后,发现7种疾病的78个相关。交叉对比发现有4种疾病的69个相关,其中2型糖尿病(52个CpG)、乳腺癌(10个CpG)、缺血性心脏病(6个CpG)、慢性肾病(1个CpG),具体相关基因信息可见下图。

  14种疾病的患病分析关联结果以及4种疾病的EWAS展示

  研究人员在分析了DNA甲基化与14种不同疾病的患病分析后,进一步分析了上述19种疾病的发病分析,通过年龄、性别、血细胞计数校正后发现了11种疾病里的14,237个显著相关(association),其中分别有11,305和2,657个与慢阻肺和2型糖尿病相关。当进一步纳入生活方式与人群结构校正后,发现5种疾病的79个相关。交叉对比发现有2种疾病的64个相关,其中2型糖尿病(58个CpG)、慢阻肺(6个CpG),具体相关基因信息可见下图。

  19种疾病的发病分析关联结果以及2种疾病的EWAS展示

  最后,研究人员对分析得到的Top CpGs进行了通路富集分析,发现仅有2型糖尿病以及缺血性心脏病得到了显著的通路富集,其代表性通路有胆固醇代谢以及酒精代谢。另外,通过多种计算模型分析,如柯克距离分析(Cook’s distance)、Harrell’s C-statistic等进一步确认了CpG关联的鲁棒性(Robust)。进一步,研究人员系统性查阅了已发表文献,发现患病分析中的69个关联中的11个,发病分析中64个关联中的8个已经被报道。

  总之,该项研究通过对单一人种的大规模队列进行表观基因组关联分析,发现了超过100多个CpG与疾病之间的关联,证明了血液DNA甲基化可以作为常见疾病的标志物,也提出在人类生物资源库扩充的背景下,对于疾病的关联分析应该在协变量策略、表型定义、报告指南等方面达成一致。

  此外,文章中使用了Illumina Infinium?? MethylationEPIC Array对样本进行了全基因组甲基化检测。2022年12月,因美纳发布了甲基化芯片产品的升级版本Infinium?? MethylationEPIC v2.0 BeadChip。全新上市的Infinium?? MethylationEPIC v2.0 BeadChip 以Infinium?? MethylationEPIC v1.0 BeadChip全基因组骨架为基础,超过935K CpG,覆盖增强子、CTCF结合位点和常见癌症驱动突变,并为甲基化分类方法用户优化了拷贝数变异(CNV)检出。

  Infinium?? MethylationEPIC v2.0 BeadChip可以相对低廉的单样本成本产出高度精准的DNA甲基化数据,并兼容从FFPE组织样本提取的DNA。相比于WGBS、RRBS和靶向甲基化测序相比,用EPIC v2.0获取全基因组DNA甲基化数据的成本显著降低,更适合大型队列研究中对大规模样本行进表观遗传标志物筛查。在表观基因组关联研究(EWAS)方面,目前大多数已发表的EWAS文章都是利用因美纳MethylationEPIC或其前代产品HumanMethylation450完成的,作为升级版的EPIC v2.0将会在未来进一步助力各种复杂疾病的EWAS分析。

  (来源:BioArt)

  原文出处:Hillary RF, McCartney DL, Smith HM, Bernabeu E, Gadd DA, Chybowska AD, Cheng Y, Murphy L, Wrobel N, Campbell A, Walker RM, Hayward C, Evans KL, McIntosh AM, Marioni RE. Blood-based epigenome-wide analyses of 19 common disease states: A longitudinal, population-based linked cohort study of 18,413 Scottish individuals. PLoS Med. 2023 Jul 6;20(7):e1004247. doi: 10.1371/journal.pmed.1004247. PMID: 37410739; PMCID: PMC10325072.

  链接:https://pubmed.ncbi.nlm.nih.gov/37410739/