精品国产自在现线不卡

科研功效

江涛传授团队《GPB》在线颁发中国脑胶质瘤基因组图谱 (CGGA) 数据库

字号: + - 14

      2021年3月,北京市神经内科研讨所、从属北京天坛病院江涛传授团队在国际生物信息学范畴权势巨子学术期刊《Genomics, Proteomics & Bioinformatics (GPB)》杂志在线颁发题为“Chinese Glioma Genome Atlas (CGGA): A Comprehensive Resource with Functional Genomic Data from Chinese Gliomas”的数据库论文。北京市神经内科研讨所赵征助理研讨员、张克难和王强威博士研讨生为配合第一作者,北京市神经内科研讨所、从属北京天坛病院江涛传授与保肇实副主任医师为通信作者。

image.png

      江涛传授团队历经十五年的脑胶质瘤临床样本堆集、患者持久随访和多维组学数据检测,构建了首此中国人群的脑胶质瘤功效基因组学数据库——中国脑胶质瘤基因图谱打算(CGGA)数据库。CGGA数据库向全天下研讨者收费公然了约2000例中国脑胶质瘤样本的功效基因组学数据,开辟了多个脑胶质瘤的可视化在线阐发东西,成为亚洲甚至全天下最大范围的脑胶质瘤医学信息工程。该任务为脑胶质瘤产生成长进程中的首要份子机制的深切探讨,为脑胶质瘤的份子分型和药物靶点研发供给指点,并为脑胶质瘤精准医学全链条的成长奠基根本,鞭策中国脑胶质瘤临床医治和迷信研讨的前进。自2019年6月,数据库上线后环球总拜候量逾6.7万次,此中包罗来自美英德意日等115个国度地域的诸多学者,数据库获多名国际着名传授撰文必定。停止今朝,已有颁发在Cell、Nature Cell Biology、Annals of Oncology等国际着名杂志的576篇论文援用数据库数据。

      脑胶质瘤是成人最罕见的颅内恶性肿瘤,年病发率约5-8/10万人。患者预后不良,常于手术后初期复发,给患者家庭及社会带来了庞大的经济和心思承担。最近几年来,跟着脑胶质瘤份子生物学研讨不时深切,愈来愈多的生物学标记物被发明并用于临床诊治。脑胶质瘤功效基因组学数据的周全搜集和同享有助于加快迷信研讨和临床转化,对临床医治对策和国度肿瘤防控政策的拟定具备首要指点意思。

      CGGA数据库是第一个完整的中国脑胶质瘤患者行列的外显子组、转录组、表观遗传组等多组学息库。该信息库的扶植包罗规范样本收罗、测序、阐发流程、数据存储与同享等。CGGA数据库供给了完整的脑胶质瘤临床信息、构造病理和份子病理等首要信息资本,此中最大随访时候逾15年。开辟了数个针对特定组学数据的可视化在线阐发东西。自上线以来,CGGA不时更新完美,丰硕数据内容、更新随访信息、晋升可视化成果。

      在CGGA数据库网站中,包罗CGGA、TCGA和Rembrandt行列的脑胶质样本组学数据和临床材料,一切数据基于MySQL 14.14停止构造存储。数据库首要在Java Servlet框架下编写开辟,并安排在Tomcat 6.0.44 web办事器上,其运转环境为CentOS 5.5 Linux。数据库的在线可视化阐发东西首要经由进程Perl和R剧本完成。CGGA网站可以或许或许在Chrome及Safari等支流阅读器中不变运转。数据库开辟构架设想如图1所示。

图片1.jpg

图1  CGGA数据库开辟构架表示图

      CGGA数据库可以或许或许在线可视化阐发全外显子组、转录组学及小RNA、DNA甲基化芯片平台等数据资本(图2A)。在全外显子组可视化阐发中,用户可针对其感乐趣的基因或基因调集可视化阐发脑胶质瘤中的渐变谱,以此来更好的探讨脑胶质瘤的遗传图谱(图2B,C)。另外,用户还可以或许摸索特定基因的遗传转变对脑胶质瘤患者预后的影响(图2D)。在该功效中,还供给了可视化阐发东西所利用的数据和运转剧本,以便用户可以或许更好的复现其阐发功效。

图片2.jpg

图2  CGGA数据库的首要内容及外显子数据阐发东西

      另外,CGGA数据库还供给了在线的全转录组、小RNA及DNA甲基化数据的可视化阐发东西(图3A)。用户可经由进程输出感乐趣的基因来查问在差别脑胶质瘤亚型中的散布环境(图3B)。其次,用户可以或许摸索感乐趣的基因对在特定脑胶质瘤亚型中的共抒发环境(图3C)。另外,用户可以或许针对本身感乐趣的基因探讨在差别脑胶质瘤亚型中的的预后代价(图3D)。响应的组学数据、临床数据和R剧本显现在响应功效局部,以便用户可以或许很好的复现可视化阐发的功效。

图片1.jpg

图3  CGGA转录组数据阐发示例

      CGGA数据库包罗了来自中国人群的2000余例脑胶质瘤样本的多维功效组学数据,其包罗全外显子组测序、转录组测序和表观遗传组学数据等。CGGA数据库以后已完成多维功效基因组学数据同享,经由进程丰硕多样的数据阐发功效和用户友爱的可视化阐发东西,为环球浩繁国度和地域科研职员供给首要的脑胶质瘤数据资本办事。CGGA数据库扶植仍在不时完美,未几未来咱们将丰硕诸如单细胞测序数据、影象组学数据等脑胶质瘤首要的数据资本。依靠北京市神经内科研讨所、都城医科大学从属北京天坛病院和中国脑胶质瘤合作组(CGCG),咱们将延续搜集脑胶质瘤构造样本,展开测序,补充更多的中国人群的功效组学数据。咱们希冀CGGA数据库可以或许或许为中国人群脑胶质瘤的根本和临床迷信研讨助力,鞭策中国脑胶质瘤研讨向前不时成长。