MARC状态:审校 文献类型:中文图书 浏览次数:85
- 题名/责任者:
- 解密搜索引擎技术实战:Lucene & Java精华版/罗刚等编著
- 版本说明:
- 第2版
- 出版发行项:
- 北京:电子工业出版社,2014
- ISBN及定价:
- 978-7-121-21732-6/CNY79.00 (含光盘)
- ISBN及定价:
- 978-7-89432-772-7 光盘
- 载体形态项:
- 501页:图;26cm+光盘1片
- 个人责任者:
- 罗刚 编著
- 学科主题:
- 互联网络-情报检索
- 中图法分类号:
- G254.92
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。此外还进一步介绍了实现准实时搜索的方法,展示了Solr的用法以及实现分布式搜索服务集群的方法。最后介绍了在地理信息系统领域和户外活动搜索领域的应用。
全部MARC细节信息>>