Elastic search还是Trie搜索/自动完成?
基于elasticsearch(ES)的方法
文档存储在DB中。一旦持久化给elasticsearch,它就会创建索引并将索引/文档(基于令牌生成器)存储在基于内存或磁盘的配置中。
用户键入3个字符后,它将搜索ES下的所有索引(可以配置为甚至对ngram进行索引),根据权重对它们进行排名并返回给用户
但是在阅读了谷歌的一些资源后,例如基于特里的搜索
看起来有些可伸缩产品还使用Trie
数据结构来进行基于前缀的搜索。
我的问题是,基于特里的方法是否可以很好地替代ES或ES在内部使用,Trie
还是我在这里完全错过了?
回答:
ES自动补全可以通过两种方式实现:
- 使用
prefix
查询 - 要么使用(edge-)ngrams
- 或使用完成提示
第一种选择是穷人的修养功能。我提到它是因为它在某些情况下很有用,但是如果您有大量文档,则应避免使用它。
第二个选项使用常规的ES索引功能,即它将标记文本,所有(edge-)ngram都将被索引,然后您可以搜索已被索引的任何前缀/中缀/后缀。
第三个选项使用不同的方法,并针对速度进行了优化。基本上,在索引类型的字段时completion
,ES将创建一个“有限状态转换器”并将其存储在内存中以实现超快速访问。
就实现而言,有限状态传感器接近特里。您可以查看这篇出色的文章,该文章显示了特里与有限状态传感器的比较
ES
7.2引入了一种称为的新数据类型search_as_you_type
,该数据类型本身就允许这种行为。有关更多信息,请访问:https :
//www.elastic.co/guide/en/elasticsearch/reference/7.2/search-as-you-
type.html
以上是 Elastic search还是Trie搜索/自动完成? 的全部内容, 来源链接: utcz.com/qa/411639.html