大数据搜索引擎原理分析

大数据搜索引擎原理分析

评分

★★★★★

ISBN

9787121352454

出版社

电子工业出版社 2018-11-01出版

作者

刘凡平

分类

数据库

内容简介
本书是畅销书升级版,向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及取得的成果,并以模块化的方式进行组织。本书着重介绍了机器学习在搜索引擎中的应用,包括中文分词、聚类、分类等核心的机器学习算法,并结合示例加以介绍和分析,使读者可以更好地理解机器学习在搜索引擎中的价值;同时,阐述了大数据给搜索引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引擎中构建知识图谱,以及进行日志反馈学习,可以使得搜索引擎更加智能。本书不仅适合作为互联网行业从业者的技术参考书,也适合作为搜索引擎爱好者的参考读物。
AI简介
这是一本深度剖析大数据时代搜索引擎技术的著作。该书首先概述了搜索引擎的过去、现在和未来,并指出大数据和人工智能对搜索引擎的影响。接着,书中详细介绍了搜索引擎的基本工作原理和技术,包括网络爬虫、索引构建、自然语言处理等。其中,特别强调了中文分词和词性标注在中文搜索中的重要性,以及语义相似度的计算方法。 书中还深入探讨了构建大数据存储引擎的必要性和方法,以及如何使用HBase等工具来实现这一目标。此外,该书还分析了分布式实时计算的重要性,并详细介绍了如何在搜索引擎中实现这一技术。 在搜索引擎的构建方面,该书详细阐述了搜索服务的体系结构,包括网络爬虫、索引、缓存、搜索和日志服务等模块。同时,书中还介绍了大数据分布式缓存的概念和重要性,以及如何使用这些技术来提升搜索性能。 书中还强调了用户日志的价值,并分析了如何通过用户日志来优化搜索引擎。这包括对用户搜索行为的分析,以及如何利用这些分析结果来提升搜索结果的相关性和用户体验。
阅读/下载地址