50万人数据库UK Biobank使用介绍、数据申请攻略 您所在的位置:网站首页 数据银行教程 50万人数据库UK Biobank使用介绍、数据申请攻略

50万人数据库UK Biobank使用介绍、数据申请攻略

2024-06-28 22:48| 来源: 网络整理| 查看: 265

截止日前,在 PubMed 数据库中使用UK BioBank作为检索词,可以发现使用该数据库发表的学术论文已经高达9,869项,其中不乏医学顶级期刊 NEJM,Lancet、JAMA 及其子刊。其中,中国学者参与的研究也高达2426项。可以说,这是宝藏数据库,面向全球研究者开放共享。例如:NEJM:可改变危险因素对心血管疾病和死亡的影响,这项研究就使用UK BioBank数据库进行分析的。

一、什么是 UK BioBank?

UK BioBank(英国生物银行)是英国迄今以来规模最大的有关致病或预防疾病的基因和环境因子的信息资源库。目的是探求一些特定基因、生活方式和健康状况之间的关系,提高对一些遗传类疾病致病基因的理解,包括癌症、心脏病、糖尿病和一些特定的精神疾病。

该项目已经在英国境内采集 40 至 69 岁人群中 50 万份志愿者的基因信息和血液样本、生活方式及环境暴露数据,并跟踪记录他们之后数十年的健康医疗档案信息。

研究期间,所有疾病、药品处方以及参加者死亡等都将被记录在库,以供英国国家医疗服务体系(NHS)利用并管理,成为了全球少数大规模的人体生物健康信息库之一。

图片来源:网页截图

二、UK Biobank 数据库有哪些重要信息?

1、流调数据

(1)社会人口因素、吸烟和饮酒状况、家族史(常见癌症、心血管疾病等)和个体早期的一些暴露因素(出生体重、母乳喂养、母亲吸烟、儿童体型)等。

(2)环境因素。调查问卷考虑了大量潜在的环境暴露,选择被认为是常见疾病影响的指标,这些问题包括当前住址、出生时的居住地、职业和其他工作场所因素、被动吸烟暴露、室内空气污染和使用手机频率。

(3)饮食习惯。主要是包括食物频度问卷、24 小时饮食回忆和多天饮食回忆问卷。

(4)参与体育活动情况。主要是体力活动强度(剧烈、适度),体育活动频率,关于常见久坐活动的问题也被纳入。

(5)心理和认知状态。在心理状态方面,调查问卷的方法是在标准化问卷的基础上评估心理特质和情绪,并记录影响心理症状的严重事件及其医学表现。

2、体格检查

身体测量指标。当志愿者完成问卷后,接下来会进行一系列的身体测量过程,包括血压(和脉搏)、身高、体重、腰围、臀围、握力、肺活量、骨密度数据。

3、生物样本检测、组学检测

主要收集的血液数据和尿液数据,用于进行基因组,蛋白质组,代谢组学的检测。

2023年11月又发布了50万人的全基因组测序数据。详细见:UK biobank新增50万人全基因组数据,面向全球研究者开放共享

4、电子医疗记录数据

包括,死亡和癌症登记数据、入院诊断数据、全科医生数据、其他医疗(如处方、病理报告、影像报告、筛查)与健康有关的数据。

UK Biobank 数据库 大样本、前瞻性、精细化的特点

(图片来源:UK Biobank 官网)

这项数据库中,包含有大量的疾病数据。见下图:

Demographic and clinical characteristics UKB 50,000 WES participants UKB 500,000 participants Number of participants 49,960 502,543 Number of women (%) 27,243 (54.5) 273,460 (54.4) Age at assessment in years (Q1–Q3)a 58 (45–71) 58 (45–71) Body-mass index in kg m−2 (Q1–Q3)a 26 (21–31) 26 (21–31) Number of imaged participants (%)a 12,075 (24.1)b 21,407 (4.3)b,c Number of current and past smokers (%)a 17,515 (35.0) 216,482 (43.1) Townsend deprivation index (Q1–Q3)a −2.0 (−6.1, −2.1) −2.1 (−6.2, −1.9) Inpatient (ICD10) 3-digit codes per patient (Q1–Q3) 5 (2–9) 5 (2–9) Patients with ≥1 inpatient ICD10 diagnoses (%) 42,066 (84.2) 391,983 (78.0) Genetic ancestry assignmentd African (%) 1.49 1.24 East Asian (%) 0.54 0.51 European (%) 93.6 94.5 Cardiometabolic phenotypes Coronary disease (%) 3,340 (6.7) 35,879 (7.1) Heart failure (%) 300 (0.6) 4,399 (0.8) Type 2 diabetes (%) 1,541 (3.0) 17,261 (3.4) Respiratory Asthma (%) 8,250 (16.5) 68,149 (13.5) COPD (%) 741 (1.4) 7,438 (1.4) Oncology phenotypes Breast cancer in women (% in women) 1,657 (6.1) 16,772 (6.1) Ovarian cancer (% in women) 162 (0.6) 1,777 (0.6) Pancreatic cancer (%) 602 (1.2) 4,611 (0.9) Prostate cancer (% in men) 848 (3.7) 8,855 (3.9) Melanoma (%) 598 (1.1) 5,715 (1.1) Enhanced measuresa Hearing test (%) 40,546 (81.1) 167,011 (33.2) Visual acuity measured (%) 39,461 (78.9) 117,092 (23.2) IOP measured (left) (%) 37,940 (75.9) 111,942 (22.2) Autorefraction (%) 36,067 (72.1) 105,989 (21.0) Retinal OCT (%) 32,748 (65.5) 67,708 (13.4) Electrocardiogram at rest (%) 10,829 (27.1) 13,572 (2.1)   注:英国生物银行(UKB)外显子组测序联盟对454,787名UKB参与者的外显子组进行了测序。95.8% 的目标碱基覆盖深度为20X或更大。实验使用的是(Integrated DNA Technologies,IDT公司的)外显子组WES产品,我们在18,893个基因的编码区的3,900万个碱基对中鉴定了1,230万个变异,其中99.6%是稀有变异(次要等位基因频率 [MAF] 在所有人种中均


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有