Elasticsearch关系映射(一对一和一对多)

在我的elasticsearch服务器中,我只有一个索引http://localhost:9200/blog

(博客)索引包含多种类型。

如:http://localhost:9200/blog/postshttp://localhost:9200/blog/tags

在标签类型中,我创建了1000多个标签,并在帖子类型中创建了10个帖子。

例如:帖子

{   

"_index":"blog",

"_type":"posts",

"_id":"1",

"_version":3,

"found":true,

"_source" : {

"catalogId" : "1",

"name" : "cricket",

"url" : "http://www.wikipedia/cricket"

}

}

例如:标签

{   

"_index":"blog",

"_type":"tags",

"_id":"1",

"_version":3,

"found":true,

"_source" : {

"tagId" : "1",

"name" : "game"

}

}

我想将现有标签分配给博客帖子(即,关系=>映射)。

如何将标签分配给帖子映射?

回答:

您可以在Elasticsearch中使用4种方法来管理关系。在Elasticsearch博客文章-Elasticsearch

内部的关系管理中,对它们进行了很好的概述。我建议阅读整篇文章,以获取每种方法的更多详细信息,然后选择最能满足您的业务需求同时又在技术上适当的方法。

以下是这4种方法的重点。

  • 简单,快速,高效
  • 仅在保持一对一关系时适用
  • 无需特殊查询

  • 嵌套文档彼此存储在相同的Lucene块中,这有助于提高读取/查询性能。读取嵌套文档比同等的父/子更快。
  • 更新嵌套文档(父级或嵌套子级)中的单个字段会强制ES重新为整个嵌套文档编制索引。对于大型嵌套文档而言,这可能会非常昂贵
  • “交叉引用”嵌套文档是不可能的
  • 最适合不经常更改的数据

  • 子项与父项分开存储,但被路由到同一分片。因此,父级/子级在读取/查询时的性能略低于嵌套的性能
  • 父/子映射有一些额外的内存开销,因为ES在内存中维护“连接”列表
  • 更新子文档不会影响父文档或其他任何子文档,这可能会节省大型文档的大量索引
  • 使用“父/子”操作可能很难进行排序/评分,因为“有子/父”操作有时可能不透明

  • 您可以自己处理所有关系!
  • 最灵活,最行政
  • 可能会有所不同,具体取决于您的设置

以上是 Elasticsearch关系映射(一对一和一对多) 的全部内容, 来源链接: utcz.com/qa/433160.html

回到顶部