Elasticsearch关系映射（一对一和一对多）

Z时代
2024-01-10
分类：问答

在我的elasticsearch服务器中，我只有一个索引http://localhost:9200/blog。

（博客）索引包含多种类型。

如：http://localhost:9200/blog/posts，http://localhost:9200/blog/tags。

在标签类型中，我创建了1000多个标签，并在帖子类型中创建了10个帖子。

例如：帖子

{ "_index":"blog", "_type":"posts", "_id":"1", "_version":3, "found":true, "_source" : { "catalogId" : "1", "name" : "cricket", "url" : "http://www.wikipedia/cricket" } }

例如：标签

{ "_index":"blog", "_type":"tags", "_id":"1", "_version":3, "found":true, "_source" : { "tagId" : "1", "name" : "game" } }

我想将现有标签分配给博客帖子（即，关系=>映射）。

如何将标签分配给帖子映射？

回答：

您可以在Elasticsearch中使用4种方法来管理关系。在Elasticsearch博客文章-Elasticsearch

内部的关系管理中，对它们进行了很好的概述。我建议阅读整篇文章，以获取每种方法的更多详细信息，然后选择最能满足您的业务需求同时又在技术上适当的方法。

以下是这4种方法的重点。

简单，快速，高效
仅在保持一对一关系时适用
无需特殊查询
嵌套文档彼此存储在相同的Lucene块中，这有助于提高读取/查询性能。读取嵌套文档比同等的父/子更快。
更新嵌套文档（父级或嵌套子级）中的单个字段会强制ES重新为整个嵌套文档编制索引。对于大型嵌套文档而言，这可能会非常昂贵
“交叉引用”嵌套文档是不可能的
最适合不经常更改的数据
子项与父项分开存储，但被路由到同一分片。因此，父级/子级在读取/查询时的性能略低于嵌套的性能
父/子映射有一些额外的内存开销，因为ES在内存中维护“连接”列表
更新子文档不会影响父文档或其他任何子文档，这可能会节省大型文档的大量索引
使用“父/子”操作可能很难进行排序/评分，因为“有子/父”操作有时可能不透明
您可以自己处理所有关系！
最灵活，最行政
可能会有所不同，具体取决于您的设置

以上是 Elasticsearch关系映射（一对一和一对多）的全部内容，来源链接： utcz.com/qa/433160.html

Elasticsearch关系映射（一对一和一对多）

回答：

其他人也看了：