探索性大数据分析系统对基因组医学研究的帮助

消耗积分:1 | 格式:rar | 大小:0.6 MB | 2017-10-11

分享资料个

基于高性能计算集群这样的新一代测序器和快速演化分析平台，基因研究领域已经被海量数据淹没。众多基因、癌症、医学研究机构和制药公司不断产生的海量数据，已不再能被及时的处理并恰当的存储，甚至通过常规通讯线路进行传输都变得困难。而通常情况下，这些数据必须能被快速存储、分析、共享和归档，以适应基因研究的需要。于是他们不得不诉诸于磁盘驱动器及运输公司，来转移原始数据到国外的计算中心，这为快速访问和分析数据带来了巨大障碍。与规模和速度同等重要的是，所有基因组信息都能基于数据模型和类别被链接，并以机器或人类语言进行标注，这样智能化的数据就能被分解成方程式，在处理基因、临床和环境数据时应用于普通分析平台。
　　概述
　　机遇与挑战并存的基因组医学革命
　　自人类启动基因组计划以来，各项工程已逐步开始揭示人类基因组与疾病间关联的奥秘。随着测序技术的不断进步，仅用1000美元即可识别出基因组。
　　探索性大数据分析系统对基因组医学研究的帮助

　　图1 基因组医学技术进步的十年
　　人类基因组计划是首个用来确定人类基因组序列的科研项目。该项目历时13年，耗费近30亿美元，于2003年完成，是目前为止最大的生物学合作项目。从那时起，一系列的技术进步在DNA测序和大规模基因组数据分析中展露头脚，对单个人类全基因组进行测序的时间和成本随之急剧下降，下降速度甚至超过了摩尔定律。
　　探索性大数据分析系统对基因组医学研究的帮助

　　图2 DNA测序成本的快速下降
　　（自2001年以来，美国国家人类基因组研究所（NHGRI）对由美国国立卫生研究院（NIH）资助的测序中心所进行的所有DNA测序工作进行了跟踪，并统计了相关费用，这些信息已作为DNA测序的重要改进评估基准。图中展现出近年来DNA测序技术和数据产生流程的显著改善。来源：NHGRI，http://www.genome.gov/sequencingcosts/）
　　作为测序技术进步的一个例子，Illumina公司在2014年发布了新一代测序器HiSeq X10，它以每个基因组仅1000美元的成本，一年可解密18000个人类全基因组。这个所谓的“千元基因组技术”使人类全基因组测序比以往任何时候更廉价可行，并有望对医疗保健和生命科学行业产生巨大影响。
　　新技术和研究方法的成功同样带来了相当大的成本，海量数据成为亟待解决的难题：
　　基因组数据在过去的8年中，每5个月翻一番。基因编码项目为80％的基因组赋予了明确的含义，所以获取全基因组序列变得尤为重要。癌症基因组研究揭示了一组不同的癌细胞基因变体，通过全基因组测序的跟踪和监控，每次分析都会产生约1TB的数据。已有越来越多的国家启动了基因组测序项目，如美国、英国、中国和卡塔尔。这些项目动辄就会产生数以百PB级的测序数据。
　　对端到端架构的要求
　　为了满足基因医药研究对于速度、规模和智能化的苛刻要求，需要端到端参考架构涵盖基因计算的关键功能，如数据管理（数据集线器），负载编排（负载编排器）和企业接入（应用中心）等。为了确定参考架构（能力与功能）和映射解决方案（硬件与软件）的内容和优先级，需要遵循以下三个主要原则：
　　软件定义：即基于软件的抽象层进行计算、存储和云服务，以此定义基础架构和部署模式，以便在未来通过数据量和计算负载的积累进行基因组基础设施的增长和扩展。数据中心：以数据管理功能面向基因组研究、成像和临床数据的爆炸式增长。应用就绪：整合多种应用到一致的环境，提供数据管理、版本控制、负载管理、工作流编排，以及通过访问执行和监控等多种功能。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

对讲机原理、使用及纵图集
2024-06-18 82次下载

下载
马可尼IFR 2945A综合测试仪使用手册
2024-06-17 24次下载

下载
基于STM32微处理器为核心的水质监测系统
2024-06-11 22次下载

下载
IP2369支持PD3.1 快充输入输出协议支持2~6 节串联电池集成升降压功率最大充放电功率45W
2024-05-27 8次下载

下载
摩托罗拉P200写频软件
2024-06-17 6次下载

下载
LM321LV、LM358LV、LM324LV运算放大器数据表
2024-06-04 4次下载

下载

探索性大数据分析系统对基因组医学研究的帮助

数据分析工具下载

基于多源数据分析的变电站状态维护策略

车联网背景下大数据收集安全机制研究

大数据产业链构成分析

大数据在物流行业的应用

基于大数据分析LTE下行速率影响因素研究案例

工程大数据分析——汽车传感器数据应用

Python科学计算与数据分析

大数据环境下风险访问控制研究综述

基于计算分析的高可用弹性宏基因组学计算平台

从Excel到Python数据分析进阶指南资源下载

大数据分析如何解决汽车继电器异常资料下载

基于LabVIEW的电机振动数据分析平台

基于异质网络层次的基因节点表示学习方法

教育大数据可视化分析研究的综合分析

数据分析有哪些思维详细说明

水文大数据标准化方法和水文大数据共享平台关键技术的设计和资料概述

数据分析修炼手册教程免费下载

如何使用大数据进行用户用电行为分析平台的研究资料说明

如何使用大数据技术进行居民在夜间的情感变化研究资料分析

大数据的基础起源发展和处理流程应用及面临的挑战和展望

通径分析的详细介绍及其在医学研究中的应用中文资料概述

大数据与推荐系统

基于疾病信息网络的表型相似基因搜索

基于Spark Streaming的实时数据分析系统及其应用

一种轻量级的大数据分析系统

基因检测包含的技术及其中基因测序技术NGS的应用现状

GUIDE－seq和Digenome－seq等全基因组CRISPR 检测的关键技术介绍

设计多网络协议的Python网络编程的探索性指南

数据分析 高级分析入门

Sweetviz： 让你三行代码实现探索性数据分析

Sweetviz让你三行代码实现探索性数据分析

GPU助力基因组重测序分析

什么是大数据分析

人工智能如何改变基因组学？

社会计算结合大数据与人工智能算法解决社会问题

使用NVIDIA Clara Parabricks 3.8加速基因组分析

通过RAPIDS加速单细胞DNA和RNA基因组分析

Clara Parabricks 3.7可加速基因组的分析

微流控芯片技术在单细胞基因组学研究中的应用

NVIDIA Clara Parabricks助力基因组学和药物研究

北鲲云超算平台对于基因组学研究能够提供哪些帮助？

细分模型探索性数据分析和预处理

还在为大数据分析工具发愁？以下是2021最值得推荐的大数据分析工具

为什么基因组是决定一个人特征的独特遗传密码

大数据分析如何来增强

关于基因组分析的优势和特点

国产芯片助力全球首次实现手机个人全基因组测序分析

国产芯片助力全球首次实现手机个人全基因组测序分析

BI大数据分析系统,大数据可视化分析平台

大数据和数据分析区别

区块链基因组数据Shivom生态系统介绍

如何看懂R中的探索性数据分析(附R代码）

什么叫大数据分析

基因组医学中区块链出现的原因解析

什么是大数据分析？大数据分析的含义与目前形式

解读深度学习与大数据分析研究进展

区块链对基因组数据的保护

Xilinx FPGA在基因组测序中的优势

GeneData对基因组隐私保护研究进度有重大突破

下载排行榜

对讲机原理、使用及纵图集

马可尼IFR 2945A综合测试仪使用手册

基于STM32微处理器为核心的水质监测系统

IP2369支持PD3.1 快充输入输出协议支持2~6 节串联电池集成升降压功率最大充放电功率45W

摩托罗拉P200写频软件

LM321LV、LM358LV、LM324LV运算放大器数据表

数据分析高级分析入门

Sweetviz：让你三行代码实现探索性数据分析