Simons基金会和明码生物科技世界最大自闭症数据库上线

来源:药明康德
2016-03-10 20:12:00

-大规模基因组学研究翻开新一页

-现在Simons Simplex Collection可以通过明码生物科技的临床发现分析工具进行云端查询,凝聚基因组和互联网,实现实时查询与合作

-- SSC是全球最大的自闭症数据库,包含来自自闭症患儿家庭的10,000个外显子数据可通过普通的网络连接查询

-- 作为数据标准,以及空前规模的自闭症基因组学研究的枢纽,SSC数据能够与世界上的其他主要数据库无缝对接

上海、美国麻省坎布里奇市、冰岛雷克雅末克市和纽约2016年3月10日电 /美通社/ -- 全球领先的基因组学信息及精准医学公司明码(上海)生物科技有限公司(WuXi NextCODE)和Simons基金会今天宣布,Simons Simplex Collection (SSC)现在可以在明码生物科技的WuXi NextCODE Exchange上进行查询。WuXi NextCODE Exchange是一种一体化的云端数据存贮、注释和发现系统。来自美国、加拿大、中国、法国、冰岛、澳大利亚、爱尔兰、巴西和卡塔尔的17家行业领先的研究机构的自闭症科学家们已经正式使用了WuXi NextCODE SSC 客户端。从今天起,该客户端向全球科学家开放,有意者可以通过注册WuXi NextCODE SSC来申请培训和使用,或者写邮件进行申请。

SSC包含近2,600个家庭的基因组序列数据和详细的临床表型数据,所有这些家庭均包含有一个患一种自闭症(autism spectrum disorder, ASD) 的儿童、正常的父母和兄弟姐妹。它是深化我们理解ASDs的重要资源,也是全球最大的专业性基因组序列数据库。正是由于明码生物科技数据库架构的计算效率,才使得如此大规模的数据运算成为可能。使用明码生物科技的一体化clinical discovery tools,SSC用户可以直接查询个人基因组数据、家系数据、或者整个数据库。不需要移动或者下载数据文件,就可以挖掘所有样本的GATK和FreeBayes突变;可以通过由归一化的全球标准序列数据在后台支持的、始终处于运行状态的可视化工具查看运算结果;或者与同行开展合作。数据存贮于可弹性扩展的、兼容HIPAA规则的明码生物科技云端,由DNAnexus提供后台技术支撑。

“SSC的设计初衷是成为大规模、开放性查询的发现引擎,并且取得了成功。我们很高兴与明码生物科技开展合作,进一步挖掘SSC的潜力,使它能够被全球自闭症研究者直接查询。” Simons Foundation Autism Research Initiative (SFARI)主任Louis Reichardt博士说,“数据上线便于它成为主要自闭症数据库网络的中枢,便于研究者构造更大规模的虚拟队列。我们邀请该领域的所有人使用它。”

“能与Simons基金会开展合作,我们感到非常激动和自豪。对于更好地理解、诊断和治疗ASD而言,我们认为这是翻开了全球合作的新一页。”明码生物科技COO Hannes Smarason先生说,“对于创建一个DNA互联网而言,把SSC导入WuXi NextCODE Exchange是一个里程碑式的事件,必将促进自闭症治疗研究的进展。而要解决这一复杂的难题,我们必须创建真正巨大的数据库。我们期待着与Simons基金会和自闭症团体的合作,来使这一资源变得更加完善,导入全基因组数据,持续扩大其规模、范围,以达成这一目标。”

“这是一个规则改变者。我们已经在使用明码生物科技客户端来验证和拓展新的发现、确认临床诊断,”波士顿儿童医院神经病学医生及助理教授Timothy Yu博士说,“这是大基因组学投资促进我们理解自闭症和其他种类复杂疾病的正确方式。由于我们以及越来越多的合作者拥有GOR格式的研究和诊断数据,我们已经感受到了大规模虚拟队列对于加快研究进度的影响,并且我们正在邀请我们的合作者也加入进来。”

SSC包含接近2600个ASD先征者以及他们的父母和表型正常的兄弟姐妹的全外显子测序数据和大于2000种表现型数据。客户端的特征包括:

所有SFARIGene和其他主要的ASD基因及其突变列表

所有主要的公开标准数据库

原始BAM测序数据的即时图形化展示

突变类聚以强化罕见突变的统计关联性

新生同源基因检测

携带者分析

预测的基因突变效应和等位基因频率过滤

定义表现型的性状选择器和报告生成器

其他来源数据的输入与功能整合