搜索引擎算法调研
标签:搜索引擎
Trie Tree 实现中文分词器
前言 继上一篇HashMap实现中文分词器后,对Trie Tree的好奇,又使用Trie Tree实现了下中文分词器。效率比HashMap实现的分词器更高。 Trie Tree 简介 Trie Tree,又称单词字典树、…
深入探讨PageRank(四):PageRank的危机及搜索引擎的未来
深入探讨PageRank(四):PageRank的危机及搜索引擎的未来 作为10多年前搜索引擎代表性的技术成果之一,PageRank创造了Google辉煌的10年,同时也缔造了Google搜索的时代。然而,…
PageRank介绍
今天给大家来剖析一下PageRank。什么是PageRank?PageRank是一种网页的排名算法,由Google创始人在1977年提出并应用在Goog…
使用Elasticsearch实现推荐系统
聚合:找出喜欢这部电影的人们同时还喜欢哪些电影 假设你运营了一个电影网站,你有很多用户,并且想知道如何推荐给这些用户他们喜欢的电影。一个办法是,把每个用户作为一个文档…
超大规模检索中的索引设计
超大规模检索中的索引设计 一 问题背景 1.1 业务背景 精准广告场景中,人群定向的常用方法是:根据各种不同的规则,将每一个用户(User)打上丰富的标签。与此同时,广告主(Member)在根据规则圈选投放人群时,系统也…
ElasticSearch多种搜索方式
上一章节主要介绍了ES的一些重要概念及简单的CRUD,本章内容将重点介绍ES的多种查询方式。ES在使用过程中,查询是最重要的应用场景。 一、Query String Search(‘Query String’方式的搜索)…
超大规模检索中的索引设计
超大规模检索中的索引设计 一 问题背景 1.1 业务背景 精准广告场景中,人群定向的常用方法是:根据各种不同的规则,将每一个用户(User)打上丰富的标签。与此同时,广告主(Member)在根据规则圈选投放人群时,系统也…
基于Tags的简单内容推荐的实现
原来为了简单方便,自己小网站上的文章页的相关内容推荐就是从数据库里随机抽取数据来填充一个列表,所以一点相关性都没有,更本没有办法引导用户去访问推荐内容。 算法选择 如何能做到相似内容的推荐呢,碍于小网站还跑在虚拟主机上(…
超大规模检索中的索引设计
超大规模检索中的索引设计 一 问题背景 1.1 业务背景 精准广告场景中,人群定向的常用方法是:根据各种不同的规则,将每一个用户(User)打上丰富的标签。与此同时,广告主(Member)在根据规则圈选投放人群时,系统也…
ElasticSearch多种搜索方式
上一章节主要介绍了ES的一些重要概念及简单的CRUD,本章内容将重点介绍ES的多种查询方式。ES在使用过程中,查询是最重要的应用场景。 一、Query String Search(‘Query String’方式的搜索)…
elasticsearch入坑到理解
为什么要用elasticsearch 随着你工作年限的增长,获得到的信息也越来越多。终于有一天你认识了elasticsearch。但是你真的知道为什么你的系统需要用es么? 什么是搜索? 百度:我们比如说想找寻任何的信息…