为了从大量日常收集的航空安全信息中快捷、准确、高效地获取可能存在的安全隐患,为安全风险控制提供明确的改进方向,结合文本分析和机器学习对给定类型的航空安全信息根据其内容聚类是挖掘有效信息的重要基础。以2017年中囯民航收集的系统失效/卡阻/故障事件为样本,在 Python3.6环境下通过对文本预处理,采用对数的词频-逆文本频率(termfreqμ ency- inverse document frequency,TF-IDF)进行特征提取以及K- means方法,建立该样本信息的自动聚类模型,基于多维缩放( multi dimensional scale,MDS)降维输岀可视化结果。分析结果表眀,文本信息聚类和可视化能够快速自动地对信息整理归档,识别各样本信息之间相似程度,轻松锁定关键信息,为下一步风险管控提供有针对性的措施。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !