elasticsearch索引和关系数据库中的索引有什么区别?
似乎在elasticsearch中,您将在集合上定义索引,而在关系数据库中,您将在列上定义索引。如果整个集合都已建立索引,为什么需要对其进行定义?
回答:
不幸的是,使用了“索引”一词,这意味着ES和关系数据库中的一些事物(在编辑中非常不同),因为它们针对不同的用例进行了优化。
数据库中的“索引”是辅助数据结构,它使WHERE
查询和查询变得JOIN
快速,并且它们通常存储的值与表中显示的值完全相同。您仍然可以具有未建立索引的列,但随后WHERE
需要进行全表扫描,这在大型表上比较慢。
ES中的“索引”实际上是文档的示意图集合,类似于关系世界中的数据库。ES中可以有不同的“类型”的文档,这与dbs中的表非常相似。ES使您可以灵活地为每个文档的字段定义是否希望对其进行检索,搜索或同时进行搜索。有关这些选项的一些详细信息,可以从例如这里找到,也与_source
field(提交给ES的原始JSON)有关。
ES使用反向索引来有效地找到匹配的文档,但是最重要的是,它通常将字符串“标准化”为令牌,以便可以执行准确的自由文本搜索。例如,句子可能会拆分成单个单词,单词会被标准化为小写等,以便搜索“荷兰”将与文本“2015年荷兰假期”相匹配。
如果字段没有反向索引,则无法对其进行任何搜索(与dbs的全表扫描不同)。有趣的是,您还可以定义字段,以便可以使用它们进行搜索,但不能将其取回,这在减少磁盘使用和RAM使用非常重要时非常有用。
以上是 elasticsearch索引和关系数据库中的索引有什么区别? 的全部内容, 来源链接: utcz.com/qa/428699.html