在not_analyzed字段上进行Elasticsearch通配符搜索

我有一个类似以下设置和映射的索引;

{

"settings":{

"index":{

"analysis":{

"analyzer":{

"analyzer_keyword":{

"tokenizer":"keyword",

"filter":"lowercase"

}

}

}

}

},

"mappings":{

"product":{

"properties":{

"name":{

"analyzer":"analyzer_keyword",

"type":"string",

"index": "not_analyzed"

}

}

}

}

}

我正在努力实现name现场通配符搜索的实现。我的示例数据如下:

[

{"name": "SVF-123"},

{"name": "SVF-234"}

]

当我执行以下查询时;

http://localhost:9200/my_index/product/_search -d '

{

"query": {

"filtered" : {

"query" : {

"query_string" : {

"query": "*SVF-1*"

}

}

}

}

}'

它返回SVF-123SVF-234。我认为,它仍然标记数据。它只能返回SVF-123

您能帮上忙吗?

提前致谢

回答:

如您在我的问题中所见,我已经开始审理案件。每当我更改了一部分设置后,一部分便开始工作,而另一部分则停止工作。让我给出我的解决方案历史记录:

我已将数据索引为默认值。这意味着,我的数据是analyzed默认的。这将在我这方面引起问题。例如;

当用户开始搜索诸如 的关键字时,系统将运行以下查询:

{

"query": {

"filtered" : {

"query" : {

"query_string" : {

"analyze_wildcard": true,

"query": "*SVF-1*"

}

}

}

}

}

和结果;

SVF-123

SVF-234

这是正常现象,因为name我的文档字段是analyzed。这将查询分为记号SVF1,并SVF与我的文档匹配,尽管1不匹配。我已经跳过了。我为我的字段创建了一个映射not_analyzed

{

"mappings":{

"product":{

"properties":{

"name":{

"type":"string",

"index": "not_analyzed"

},

"site":{

"type":"string",

"index": "not_analyzed"

}

}

}

}

}

但我的问题仍然存在。

经过大量研究,我想尝试另一种方法。决定使用通配符查询。我的查询是

{

"query": {

"wildcard" : {

"name" : {

"value" : *SVF-1*"

}

}

},

"filter":{

"term": {"site":"pro_en_GB"}

}

}

}

该查询有效,但是这里有一个问题。我的字段不再进行分析,我正在进行通配符查询。区分大小写是这里的问题。如果我像

一样搜索,它什么也不会返回。因为,用户可以输入小写版本的查询。

我将文档结构更改为;

{

"mappings":{

"product":{

"properties":{

"name":{

"type":"string",

"index": "not_analyzed"

},

"nameLowerCase":{

"type":"string",

"index": "not_analyzed"

}

"site":{

"type":"string",

"index": "not_analyzed"

}

}

}

}

}

我还增加了一个name名为的字段nameLowerCase。索引文档时,我将文档设置为:

{

name: "SVF-123",

nameLowerCase: "svf-123",

site: "pro_en_GB"

}

在这里,我将查询关键字转换为小写并在新nameLowerCase索引上进行搜索操作。并显示name字段。

我查询的最终版本是;

{

"query": {

"wildcard" : {

"nameLowerCase" : {

"value" : "*svf-1*"

}

}

},

"filter":{

"term": {"site":"pro_en_GB"}

}

}

}

现在可以了。还有一种使用multi_field解决此问题的方法。我的查询包含破折号(-),并且遇到了一些问题。

非常感谢@Alex Brasetvik的详细解释和努力

以上是 在not_analyzed字段上进行Elasticsearch通配符搜索 的全部内容, 来源链接: utcz.com/qa/398206.html

回到顶部