除了名声赫赫的“人类基因组学计划”,在微观世界,还有一项基于材料计算和数据库的“材料基因组计划”。它极大地加速材料的研发,降低了材料发现的门槛和成本。
近日,曙光中标北京工业大学固体微结构与性能研究所材料研究平台项目。曙光将助力北工大在材料科学、凝聚态物理、纳米科学与技术等领域展开研究,通过搭建大型公共开放式共享研究平台(以下简称:研究平台),以信息化手段促进材料科学发展,也为科研院所高层次科研人才的培养的提供新途径。
汇集海量数据 揭开物质材料微观结构
目前,该研究平台以现有透射电子显微、扫描电子显微镜、扫描谱学显微仪器等实验设备为基础,通过自主设计、探索试制发展出一系列原位外场作用下跨尺度材料的力学性能与显微结构相关性的研究方法。
电子显微镜可以激发电子形成图像,以高分辨率模式将微米和纳米结构放大至千万倍,通过采集的大量2D平面信号和3D体信号,将产生海量的图像数据,这些数据可以让人们更深入地了解材料的相关性质,并能充分利用这些精度统一的信息去助力新材料的研发与探索。
该研究平台围绕材料的组份、结构和性能等基因组数据,重点进行数据资源及数据库体系建设,并开展数据服务、系统运维、技术研发、数据挖掘等一系列工作,对作为其重要基础架构的存储系统提出了极为严苛的要求。
具体方面,材料基因数据的主要类型为文本文件、图像文件、二进制文件等非结构化数据,对存储系统的主要要求集中在存储容量的大小和大文件的读写通量高低。同时,部分关键数据库、索引等结构化数据的处理,还要求存储系统具备较高 IOPS 和稳定的读写能力。业务系统存储、高性能存储和大容量存储能力为用户关注的重点。
高效分析解读 支撑材料科学探索创新
中科曙光打造云存储解决方案,通过Scale-Out横向扩展、IB+RDMA高速互联、内核态POSIX协议、智能SSD Cache及小文件聚合等技术,消除传统的Scale-up纵向扩展存储架构的性能局限性,解决材料基因应用中对海量大文件存储场景高聚合带宽、小文件存储场景高IOPS的存储需求。
其次,材料研究产生的数据正以每12-18个月10倍的速度快速增长,曙光ParaStor分布式存储系统可通过性能与容量的线性增长,满足存储系统对数据处理能力和扩展性的要求,并通过多种技术手段,从物理底层到逻辑层全方位保证存储系统高可靠性和高可用性,满足前端多种基因测序软件、多种业务应用的存储对接需求。
北京工业大学大型公共开放式共享研究平台,通过对材料大数据的积累、共享与挖掘,利用机器学习等更多新型人工智能方法将使材料数据库的整体性和优越性不断完善和提高,为新材料的研发提供更加智能的捷径。
责任编辑:haq
全部0条评论
快来发表一下你的评论吧 !