关注公众号,找书不迷路

《基于半监督与集成学习的文本分类方法》-唐焕玲

计算机类 admin 2个月前 (07-24) 26次浏览
《基于半监督与集成学习的文本分类方法》-唐焕玲

内容简介:

文本分类技术广泛应用于新闻媒体、网络期刊文献、数字图书馆、互联网等领域,是人类处理海量文本信息的重要手段。本书重点探讨了利用信息论中的评估函数量化特征权值的方法;基于权值调整改进Co-training的算法;利用互信息或CHI统计量构造特征独立模型,进行特征子集划分的方法;基于投票熵维护样本权重的BoostVE分类模型;融合半监督学习和集成学习的SemiBoost-CR分类模型。其中特征选择和权值调整方法、基于特征独立模型划分特征子集的方法适用于文本分类,其他算法不仅适用于文本分类,对机器学习和数据挖掘的其他研究也有较大的参考价值和借鉴作用。

下载地址:

此站大部分下载链接网盘和谐了,在新的网站更新维护。新的电子书网址:https://www.mq59.com

喜欢 (0)