这就是搜索引擎

这就是搜索引擎

评分

★★★★★

ISBN

9787121148651

出版社

电子工业出版社 2012-01-01出版

作者

张俊林

分类

理论知识

内容简介
本书针对搜索引擎领域相关技术有非常全面性的描述,涉及到了搜索引擎研发中的几乎所有的重要技术点,同时对机器学习排序等学术前沿的研究方向做了总结与归纳,另外,还紧密结合Google等搜索引擎的实际体系结构和算法进行了归纳与分析,是理论与实践结合紧密的书籍。
AI简介
这是一本全面性和深入性都非常高的书籍,它针对搜索引擎领域相关技术有非常全面性的描述,涉及到了搜索引擎研发中的几乎所有的重要技术点,同时对机器学习排序等学术前沿的研究方向做了总结与归纳,另外,还紧密结合Google等搜索引擎的实际体系结构和算法进行了归纳与分析,是理论与实践结合紧密的书籍。 书籍的内容涵盖了搜索引擎的重要性和发展历程,包括搜索引擎为何重要,搜索引擎技术发展史,搜索引擎的3个目标,搜索引擎的3个核心问题,以及搜索引擎的技术架构。此外,书籍还详细介绍了网络爬虫的定义和作用,包括通用爬虫框架,优秀爬虫的特性,爬虫质量的评价标准,抓取策略,网页更新策略,暗网抓取,分布式爬虫等。 书中对搜索引擎索引进行了深入探讨,包括索引基础,单词词典,倒排列表,建立索引,动态索引,索引更新策略,查询处理,多字段索引,短语查询,分布式索引等。此外,还详细阐述了索引压缩的重要性,包括词典压缩,倒排列表压缩算法,文档编号重排序,静态索引裁剪等。 对于检索模型与搜索排序,书中也进行了深入的讲解,包括布尔模型,向量空间模型,概率检索模型,语言模型方法,机器学习排序,检索质量评价标准等。此外,还介绍了
阅读/下载地址