| 暂存书架(0) | 登录

MARC状态:审校 文献类型:中文图书 浏览次数:73

题名/责任者:
Web中文舆情信息挖掘/王天志著
出版发行项:
北京:科学出版社,2020
ISBN及定价:
978-7-03-063546-4/CNY130.00
载体形态项:
192页:图;26cm
个人责任者:
王天志
学科主题:
互联网络-舆论-信息处理
中图法分类号:
G202
书目附注:
有书目 (第168-178页)
提要文摘附注:
本书首先论述网页提取:对网站链接进行过滤以缩小搜索范围,提高搜索准确度、效率和可行性;通过选择精当检索词、遴选相关主题词,增强搜索的精度和效率;根据HTML生成DOM树,根据不同模板类型进行正文抽取和正文过滤。其次阐述了文本的特征向量表示,用分词词典将中文文本进行分词,分词的过程中进行了歧义分析,将分词后的文本用特征向量表示,通过去停用词、进行词性标注、同义词替换等进行文本的特征降维。再讲述文本聚类与分类,包括文本特征加权、主成份分析和基于模糊矩阵的蚁群聚类。最后讲述文本的倾向性分析。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 书刊状态 还书位置 定位
G202/1014 2338130   北书院二楼     保留本 定位 北书院二楼
G202/1014 2338131   4楼北文化科学教体借阅室     可借 定位 4楼北文化科学教体借阅室
显示全部馆藏信息
借阅趋势

同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架