当查询文本为字母数字模式时,elasticsearch将返回所有记录

cnwbcb6i  于 2021-06-14  发布在  ElasticSearch
关注(0)|答案(1)|浏览(335)

我在elasticsearch中有一个索引,Map如下:

/price_validity_idx

{
  "mappings": {
    "properties": {
      "title":{
        "type": "text"
      },
      "validity":{
        "type": "boolean"
      }
    }
  }
}

这个索引中存储的数据如下所示:

{
 "title" : "16 USD product"
"validity": true
}
{
 "title" : "USD 5 refill"
"validity": true
}
.....
{
 "title" : "10 USD"
"validity": false
},
{
"title" : "Movies on Demand-Free of cost"
"validity": false
},
{
"title" : "One month subscription on Cash purchase"
"validity": true
}

因此,每当我对字段标题进行匹配查询时,查询文本为字母数字(例如USD5),标题中包含数字值的所有记录都会作为结果的一部分返回。
例如,curl-xget'/price\u validity\u idx'-d'{“query”:{“match”:{“title”:“USD5”}}
输出:(删除elasticsearch元信息以获得紧凑性)

{
 "title" : "16 USD product"
"validity": true
},
{
 "title" : "USD 5 refill"
"validity": true
},
{
 "title" : "10 USD"
"validity": false
}

但是,每当我对字段标题进行相同的匹配查询时,只要将数字作为查询文本(例如5),就会返回与数字匹配的特定记录。
当查询文本为字母数字(例如USD5)时,如何使其仅返回与精确数字值匹配的记录。由于某些业务限制,我将无法将Map类型更改为integer。另外,我将不能使用术语查询,因为字段也包含一些冗长的文本数据。
请帮忙,因为我是elasticsearch的新手。
使用的版本是elasticsearch-7.8.1

1yjd4xko

1yjd4xko1#

标准分析器是默认分析器,如果未指定,则使用该分析器。生成的令牌是 usd 以及 5 ,因此所有匹配这些标记的文档都将匹配搜索查询。
分析api

GET/ _analyze
{
  "analyzer" : "standard",
  "text" : "USD 5"
}

生成以下令牌:

{
  "tokens": [
    {
      "token": "usd",
      "start_offset": 0,
      "end_offset": 3,
      "type": "<ALPHANUM>",
      "position": 0
    },
    {
      "token": "5",
      "start_offset": 4,
      "end_offset": 5,
      "type": "<NUM>",
      "position": 1
    }
  ]
}

您可以使用match\短语查询来分析文本,并从分析的文本中创建短语查询。
搜索查询:

{
  "query": {
    "match_phrase": {
      "title": "USD 5"
    }
  }
}

搜索结果:

"hits": [
      {
        "_index": "64528215",
        "_type": "_doc",
        "_id": "2",
        "_score": 2.1446278,
        "_source": {
          "title": "USD 5 refill",
          "validity": true
        }
      }
    ]

编辑1:
您甚至可以将匹配查询与运算符一起使用 AND ,即用于解释查询值中文本的布尔逻辑

{
  "query": {
    "match": {
      "title": {
        "query": "USD 5",
        "operator": "and"
      }
    }
  }
}

相关问题