机读格式显示(MARC)
- 000 01532nam0 2200289 450
- 010 __ |a 978-7-121-21732-6 |d CNY79.00 (含光盘)
- 010 __ |a 978-7-89432-772-7 |b 光盘
- 099 __ |a CAL 012013153850
- 100 __ |a 20131218d2014 em y0chiy50 ea
- 200 1_ |a 解密搜索引擎技术实战 |A jie mi sou suo yin qing ji shu shi zhan |e Lucene & Java精华版 |f 罗刚等编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2014
- 215 __ |a 501页 |c 图 |d 26cm |e 光盘1片
- 330 __ |a 本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法。在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。此外还进一步介绍了实现准实时搜索的方法,展示了Solr的用法以及实现分布式搜索服务集群的方法。最后介绍了在地理信息系统领域和户外活动搜索领域的应用。
- 606 0_ |a 互联网络 |A hu lian wang luo |x 情报检索
- 701 _0 |a 罗刚 |A luo gang |4 编著
- 801 _0 |a CN |b ZJU |c 20131218
- 905 __ |a SCNU |f G254.92/6072/ -2