nginx日志中的字节在elasticsearch中Map为字符串而不是数字

hiz5n14c  于 2021-06-15  发布在  ElasticSearch
关注(0)|答案(1)|浏览(244)

最近我部署了elk并开始通过logstash frowarder转发nginx的日志。
问题是,在elasticsearch(1.4.2)/kibana(4)中,请求的“bytes”值Map为字符串。
我使用随处可见的标准配置。
在logstash模式中添加了nginx日志的新模式:

NGUSERNAME [a-zA-Z\.\@\-\+_%]+                                                                                                                                                                                                                      
NGUSER %{NGUSERNAME}                                                                                                                                                                                                                                
NGINXACCESS %{IPORHOST:http_host} %{IPORHOST:clientip} \[%{HTTPDATE:timestamp}\] \"(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|%{DATA:rawrequest})\" %{NUMBER:response} (?:%{NUMBER:bytes}|-) %{QS:referrer} %{QS:agent} %{NUMBER:request_time:float} %{NUMBER:upstream_time:float}
NGINXACCESS %{IPORHOST:http_host} %{IPORHOST:clientip} \[%{HTTPDATE:timestamp}\] \"(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|%{DATA:rawrequest})\" %{NUMBER:response} (?:%{NUMBER:bytes}|-) %{QS:referrer} %{QS:agent} %{NUMBER:request_time:float}

为日志存储添加了这些配置

input {
  lumberjack {
    port => 5000
    type => "logs"
    ssl_certificate => "/etc/logstash/tls/certs/logstash-forwarder.crt"
    ssl_key => "/etc/logstash/tls/private/logstash-forwarder.key"
  }
}
filter {
    if [type] == "syslog" {
        grok {
            match => { "message" => "%{SYSLOGTIMESTAMP:syslog_timestamp} %{SYSLOGHOST:syslog_hostname} %{DATA:syslog_program}(?:\[%{POSINT:syslog_pid}\])?: %{GREEDYDATA:syslog_message}" }
            add_field => [ "received_at", "%{@timestamp}" ]
            add_field => [ "received_from", "%{host}" ]
        }
        syslog_pri { }
        date {
            match => [ "syslog_timestamp", "MMM  d HH:mm:ss", "MMM dd HH:mm:ss" ]
        }
    } else if [type] == "nginx" {
        grok {
            match => { "message" => "%{NGINXACCESS}" }
        }
        date {
            match => [ "timestamp" , "dd/MMM/YYYY:HH:mm:ss Z" ]
        }
        geoip {
            source => "clientip"
        }
    }
}
output {
  elasticsearch_http {
    host => localhost
  }
}

但在elsticsearch中,我将其视为字符串,即使我将“字节”定义为

(?:%{NUMBER:bytes:long}|-)

有人知道如何将“字节”存储为数字类型吗?
谢谢

wljmcqd8

wljmcqd81#

你跟我走对了 (?:%{NUMBER:bytes:long}|-) ,但“long”不是有效的数据类型。引用grok文档(重点):
您可以选择向grok模式添加数据类型转换。默认情况下,所有语义都保存为字符串。如果您希望转换语义的数据类型,例如,将字符串更改为整数,然后用目标数据类型作为后缀。例如 %{NUMBER:num:int} 使 num 从字符串到整数的语义。目前唯一支持的转换是 int 以及 float .
请注意,这并不控制elasticsearch端索引中实际使用的数据类型,只控制发送到elasticsearch的json文档的数据类型(这可能会影响es使用的Map,也可能不会影响es使用的Map)。在json上下文中,int和long没有区别;标量值可以是数字、布尔值或字符串。

相关问题