关键词:
贝叶斯网络
阿尔茨海默病
K2算法
因果效应
文献计量学
摘要:
随着科学技术的发展、数据量的增加,如何从大数据中获取有益信息,已成为研究的热点和难点。贝叶斯网络是从数据中表示不确定性知识的重要工具之一,但在准确率上仍不能满足某些实际需求。此外,文献数量的迅速增长,如何直观地表示众多文献所包含的知识变得愈发重要。因此,本文主要工作如下:1)本文提出了一种基于因果效应的贝叶斯网络结构学习方法。从数学上给出了节点优先度的定义,定量地描述了节点之间的优先次序。将节点优先度降序排列得到节点优先次序。利用节点优先次序和基于互信息的最大父节点数目估计结合K2算法学习初始化贝叶斯网络。通过互信息和BDe评分修正初始化网络得到最终学习结果。本文实验在ASIA网络和ALARM网络的20组数据中进行。结果表明,本文方法较MMHC算法准确率平均提升16%,标准差性能平均优化34%。2)本文提出了一种基于贝叶斯网络的文献知识表示方法。利用网络爬虫爬取了12万篇和阿尔茨海默病有关的文献关键词数据,通过本文提出的方法学习了关键词贝叶斯网络,人工构建了相应的贝叶斯网络衡量学习结果。实验结果表明,本文提出的基于贝叶斯网络的文献知识表示方法正确率为87.5%,学习结果覆盖了目前学术界认为的阿尔茨海默病病因三大假说,为文献计量学提供了新的思路和方法。