×

基于树状结构Parzen估计方法的超参数优化方法

消耗积分:0 | 格式:pdf | 大小:2.05 MB | 2021-04-13

分享资料个

  宏基因组序列组装在计算和内存上面临着巨大挑战。 Sparc( Spark Reads Clustering)是基于 Apache Spark的宏基因组序列片段聚类算法,为来自下一代测序技术的数十亿测序片段聚类提供了一种可扩展的解决方案。但是, Sparc算法参数的设置是一项非常具有挑战性的工作。 Sparc算法拥有许多对算法性能有着很大影响的超参数,选择合适的超参数集对于充分发挥 Sparc算法的性能来说是至关重要的。为了提高 Sparc算法的性能,探索了一种基于树状结构 Parzen估计方法(TreParκ en estimator,TPE)的超参数优化方法,其能够利用先验知识髙效地调节参数,并通过减少计算任务加速寻找最优参数,达到最佳聚类效果,从而避免昂贵的参数探索。对长序列片段( Pacbio)和短序列片段(CAMI2)进行实验,结果表明,该方法在改善 Sparo算法性能方面有着良好的效果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !