计算机系统的硬件体系结构已进入一个并行化的时代,共享存储系统上多核、众核微处理器正得到广泛应用,分布式存储系统上包含的并行处理节点数量越来越多,结构也越来越复杂.硬件体系结构上的并行化发展趋势带来两个显著问题:(1)如何让软件设计充分发掘硬件的并行处理能力,从而提高系统的性能;(2)在系统硬件规模不断扩大、复杂度越来越高的情况下,如何保证系统的可靠性.
任务并行程序设计模型已成为并行程序设计的主流,其通过发掘任务并行性来提高并行计算机的系统性能,提出一种支持容错的任务并行程序设计模型,将容错技术融入到任务并行程序设计模型中,在保证性能的同时提高系统可靠性.该模型以任务为调度、执行、错误检测与恢复的基本单位,在应用级实现容错支持.采用一种Buffer-Commit计算模型支持瞬时错误的检测与恢复;采用应用级无盘检查点实现节点故障类型永久错误的恢复;采用一种支持容错的工作窃取任务调度策略获得动态负载均衡,实验结果表明,该模型以较低的性能开销提供了对硬件错误的容错支持.
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !