ElasticSearchngram评分是如何工作的？

f3temu5u 于 5个月前发布在 ElasticSearch

关注(0)|答案(1)|浏览(36)

我的索引中有两个文档。一个包含字段：

name: foo bar

字符串
和另一

name: foo xyz bar xyz foo xyz bar xyz foo xyz bar xyz foo xyz bar

型
我是这样使用ngram分析器的：

"analysis": {
  "analyzer": {
    "ngram_analyzer": {
      "tokenizer": "ngram_tokenizer"
    }
  },
  "tokenizer": {
    "ngram_tokenizer": {
      "type": "ngram",
      "min_gram": 3,
      "max_gram": 3,
      "token_chars": [
        "letter",
        "digit",
        "whitespace"
      ]
    }
  }
}

型
当我搜索foo bar时，第一个文档得到的分数比第二个高。这就是我想要的，但有人能解释一下这个评分是如何工作的吗？因为我知道ngram将它们分为3个字符长度，它是如何发现foo和bar在第一个文档中是顺序排列的，并为它分配更高的分数的？

elasticsearch

来源：https://stackoverflow.com/questions/51812704/how-does-elasticsearch-ngrams-scoring-work