用于自定义日志的 Logstash Grok 过滤器

2024-03-15

我有两个相关问题。第一个是如何最好地处理具有“混乱”间距等的日志，第二个，我将单独询问，是如何处理具有任意属性值对的日志。（看：Logstash Grok 过滤器用于具有任意属性值对的日志 https://stackoverflow.com/questions/31884204/logstash-grok-filter-for-logs-with-arbitrary-attribute-value-pairs )

因此，对于第一个问题，我的日志行如下所示：

14:46:16.603 [http-nio-8080-exec-4] INFO  METERING - msg=93e6dd5e-c009-46b3-b9eb-f753ee3b889a CREATE_JOB job=a820018e-7ad7-481a-97b0-bd705c3280ad data=71b1652e-16c8-4b33-9a57-f5fcb3d5de92

Using http://grokdebug.herokuapp.com/ http://grokdebug.herokuapp.com/我最终能够想出以下适用于此行的 grok 模式：

%{TIME:timestamp} %{NOTSPACE:http} %{WORD:loglevel}%{SPACE}%{WORD:logtype} - msg=%{NOTSPACE:msg}%{SPACE}%{WORD:action}%{SPACE}job=%{NOTSPACE:job}%{SPACE}data=%{NOTSPACE:data}

使用以下配置文件：

input {
        file {
                path => "/home/robyn/testlogs/trimmed_logs.txt"
                start_position => beginning
                sincedb_path => "/dev/null" # for testing; allows reparsing
        }
}
filter {
        grok {
                match => {"message" => "%{TIME:timestamp} %{NOTSPACE:http} %{WORD:loglevel}%{SPACE}%{WORD:logtype} - msg=%{NOTSPACE:msg}%{SPACE}%{WORD:action}%{SPACE}job=%{NOTSPACE:job}%{SPACE}data=%{NOTSPACE:data}" }
        }
}
output {
        file {
                path => "/home/robyn/filteredlogs/trimmed_logs.out.txt"
        }
}

我得到以下输出：

{"message":"14:46:16.603 [http-nio-8080-exec-4] INFO  METERING - msg=93e6dd5e-c009-46b3-b9eb-f753ee3b889a CREATE_JOB job=a820018e-7ad7-481a-97b0-bd705c3280ad data=71b1652e-16c8-4b33-9a57-f5fcb3d5de92","@version":"1","@timestamp":"2015-08-07 T17:55:16.529Z","host":"hlt-dev","path":"/home/robyn/testlogs/trimmed_logs.txt","timestamp":"14:46:16.603","http":"[http-nio-8080-exec-4]","loglevel":"INFO","logtype":"METERING","msg":"93e6dd5e-c009-46b3-b9eb-f753ee3b889a","action":"CREATE_JOB","job":"a820018e-7ad7-481a-97b0-bd705c3280ad","data":"71b1652e-16c8-4b33-9a57-f5fcb3d5de92"}

这正是我想要的，但我觉得这是一个非常混乱的模式，特别是需要大量使用 %{SPACE} 和 %{NOSPACE} 。这对我来说表明我并没有真正以最好的方式做到这一点。我应该为十六进制 ID 创建更具体的模式吗？我认为我需要 loglevel 和 logtype 之间的 %{SPACE} 因为日志中 INFO 和 METERING 之间有额外的空间，但这也感觉很混乱。

另外，我如何获取日志时间戳来替换@timestamp，这似乎是logstash摄取日志的时间，这是我们不想要/不需要的。

显然，我刚刚开始使用 ELK 和 grok，因此也感谢指向有用资源的指针。

您可以使用现有的模式来代替NOTSPACE, it's UUID。此外，当只有一个空格时，无需使用SPACE模式，您可以将其省略。我也在使用USERNAME模式（可能命名错误）只是为了捕获http field.

所以事情会像这样，你只有一个SPACE模式来捕捉多个空间。

示例日志行：

14:46:16.603 [http-nio-8080-exec-4] INFO  METERING - msg=93e6dd5e-c009-46b3-b9eb-f753ee3b889a CREATE_JOB job=a820018e-7ad7-481a-97b0-bd705c3280ad data=71b1652e-16c8-4b33-9a57-f5fcb3d5de92

格洛克模式：

%{TIME:timestamp} \[%{USERNAME:http}\] %{WORD:loglevel}%{SPACE}%{WORD:logtype} - msg=%{UUID:msg} %{WORD:action} job=%{UUID:job} data=%{UUID:data}

Grok 会吐出这个：

{
  "timestamp": [
    [
      "14:46:16.603"
    ]
  ],
  "HOUR": [
    [
      "14"
    ]
  ],
  "MINUTE": [
    [
      "46"
    ]
  ],
  "SECOND": [
    [
      "16.603"
    ]
  ],
  "http": [
    [
      "http-nio-8080-exec-4"
    ]
  ],
  "loglevel": [
    [
      "INFO"
    ]
  ],
  "SPACE": [
    [
      "  "
    ]
  ],
  "logtype": [
    [
      "METERING"
    ]
  ],
  "msg": [
    [
      "93e6dd5e-c009-46b3-b9eb-f753ee3b889a"
    ]
  ],
  "action": [
    [
      "CREATE_JOB"
    ]
  ],
  "job": [
    [
      "a820018e-7ad7-481a-97b0-bd705c3280ad"
    ]
  ],
  "data": [
    [
      "71b1652e-16c8-4b33-9a57-f5fcb3d5de92"
    ]
  ]
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

用于自定义日志的 Logstash Grok 过滤器的相关文章

Logstash 索引文本文件

我想在 Elasticsearch 中导入一个文本文件该文本文件每行包含 3 个值经过几个小时的努力我还是没有完成非常感谢您的帮助安装了 Logstash 的 Elasticsearch 5 4 0 样本数据 username e
无法安装 Elasticsearch-5.x 的 Search Guard 插件

由于限制我不被允许从互联网上安装任何软件包所以这个命令对我来说安装没有用搜查卫士 https github com floragunncom search guard bin elasticsearch plugin install
当匹配有效时，简单术语查询不能与弹性一起使用

我在 Elastic 中有一个如下所示的 JSON 对象 source version 1 object id f1dcae27 7a6f 4fea b540 901c09b60a15 object name testFileName fo
无痛脚本 Elastic Search：尝试从文档访问值时出现变量未定义错误

我正在尝试按照官方文档学习 Elastic Search 中的无痛脚本编写 https www elastic co guide en elasticsearch painless 6 0 painless examples html ht
Logstash 配置，“如果字符串包含...”

因此我们假设我有一部分日志行如下所示 GET restAPI callMethod1 8675309 GET 匹配一个 http 方法并且 get 被提取其余部分匹配一个 URI 并且也被提取现在在logstash配置中假设我想
Logstash 与 log4j socketappender 不起作用

我正在尝试通过 log4j 套接字附加程序流式传输我的日志并尝试通过logstash log4j 输入插件检索相同的日志我的logstash配置看起来像 input log4j type gt socketlogs port gt 19
Logstash：Mutate { gsub ... } 不起作用

mutate add field gt eee gt 2016 uaie gsub gt eee 2016 2015 这确实会创建一个字段 eee 但 gsub 会not更新它为什么 add field 在底层过滤器成功时运行在您的情况
将特定的MDC字段附加到logstash日志中

我正在尝试将自定义字段添加到 logback spring xml 中的 Logstash Appender 中如下所示
docker nginx 容器的日志存储在主机的哪里

I use 默认 nginx 镜像 https hub docker com nginx 和Filebeat读取日志并发送给ELK 两个容器 nginx 容器和 Filebeat 容器都位于同一主机上这是 nginx 镜像的 Docke
Logstash 创建和访问数组

我想在用于设备的 Logstash 配置文件中创建一个数组然后通过我正在创建的新字段访问该数组值例子 filter array devicetype gt Cisco ASA Cisco 3750 mutate add field gt
Kibana 服务器尚未准备好甚至启动

我有1个主节点 master 和1个数据节点 node 1 我使用centos7作为操作系统主控 9200 root localhost kibana curl localhost 9200 name master cluster nam
用于自定义日志的 Logstash Grok 过滤器

我有两个相关问题第一个是如何最好地处理具有混乱间距等的日志第二个我将单独询问是如何处理具有任意属性值对的日志看 Logstash Grok 过滤器用于具有任意属性值对的日志 https stackoverflow com qu
如何动态（通过环境变量）激活/停用 logback 或 logback 附加程序？

有没有办法通过环境变量选择是否有 logback 附加程序我有一个 dockerized spring boot 微服务现在添加了 ELK 堆栈到目前为止效果很好但现在如果我想在没有 ELK 堆栈的情况下启动服务应用程序会抛出一个
是否可以通过 Elasticsearch 中的映射来更新索引中的现有字段？

我已经创建了一个索引它包含我的数据MySQL数据库我有几个字段string在我的表中我需要它们作为不同的类型 integer double in Elasticsearch 所以我知道我可以通过mapping如下 mappings m
在logstash中使用docker GELF驱动程序env/labels

Docker GELF 日志驱动程序允许env and labels日志选项 gelf 日志记录驱动程序支持 lab els 和 env 选项它添加了额外的密钥extra字段以下划线为前缀 ref https docs docker
将数据从 Dynamodb 发送到 Amazon Elasticsearch 的最佳方式

我想知道将数据从 dynamoDB 发送到 elasticsearch 的最佳方式是什么 AWS SDK js https github com Stockflare lambda dynamo to elasticsearch blob
将 CloudTrail 日志导入 Logstash

我正在尝试将日志从 CloudTrail 获取到 ElasticSearch 中以便我们可以更好地了解 AWS 账户中发生的情况我已经在我的机器 Ubuntu 14 04 上设置了 Logstash 和 ElasticSearch 并且
LogStash 无法从许可证中检索许可证信息。响应代码“401”通过 URL“http://elasticsearch:9200/_xpack”联系 Elasticsearch

我正在努力让 Docker LogStash 连接到 Docker ElasticSearch 并启用 xpack 安全性主要日志有 logstash 1 2020 05 20T22 41 03 950 WARN deprecation
如何在logstash.conf文件中创建多个索引？

我使用以下代码在logstash conf中创建索引 output stdout codec gt rubydebug elasticsearch host gt localhost protocol gt http index gt tr
聚合多个递归logstash

我正在使用带有输入 jdbc 的 Logstash 并且希望通过聚合将一个对象嵌入到另一个对象中如何使用添加递归即在另一个对象中添加一个对象这是一个例子 index my index type test id 1 version 1

随机推荐

分解量子态

我正在寻找采用由位组成的加权经典状态之和组成的任意量子态的算法如下所示 0000 gt 2 0011 gt 2 0100 gt 2 0111 gt 2 并使用张量积将其分解为更紧凑的形式如下所示 0 gt x 0 gt 1 gt x 0
循环或重复一组任务直到成功

我目前有一个包含任务文件的剧本在该任务文件中我想检查一个条件如果该条件的退出代码不等于 0 则应重复任务文件中的所有步骤我已经尝试了块和循环的一些变体但我还没有找到一种方法来使它执行我上面描述的操作目前我有这样的事情 tasks
eax如何存储大小大于4字节的返回值？

EAX在32位平台上用于存储函数的返回值我想知道如果函数的返回值的大小大于4个字节 eax如何处理在这种情况下操作系统可以将返回值保存在堆栈上并将堆栈地址存储在EAX中但是操作系统如何判断EAX中存储的值是返回值的地址还是实际上是
单括号和双括号 Numpy 数组的区别？

这两个 numpy 对象有什么区别 import numpy as np np array 0 0 0 0 np array 0 0 0 0 In 71 np array 0 0 0 0 shape Out 71 1 4 In 72 np
在 [FINE UPLOADER] 中显示以前上传的图像

我正在使用精细的上传器插件来上传图像图片上传工作正常我想做的是当图像上传后刷新页面时精细上传器应该显示以前上传的图像这是我的代码 accordion on shown bs collapse function activeShop
如何在 Laravel Eloquent 中使用带有子查询的内连接

注意这是 laravel 5 3 基本上当用户选择阿拉伯语翻译时我正在运行查询完整的 sql 如下所示 select s ref t text as ref ar FROM stores AS s INNER JOIN SELECT
在 SharePoint 2013 中以编程方式创建文件夹

目前我有在中创建文件夹的代码Documents运行时目录 using var context new Microsoft SharePoint Client ClientContext sharePointSite context Cred
方案中的河内塔（递归）

今天在scheme中写了如下代码但是求值错误请不要告诉我我编程很糟糕我知道这是一个经典的递归问题但我遇到了麻烦 define towers of hanoi n source temp dest if n 1 begin displ
解析 ISO 8601 值 24:00:00 的日期失败

我正在尝试解析来自数据源的传入日期无法更改它给了我 ISO 8601 格式示例的时间 2007 04 05T24 00 然而在 Net 中它无法将其解析为有效时间维基百科指出它应该是有效的格式维基百科 ISO 8601 http e
更少的 mixin 和变量

我有以下混合 iconFont color green font size 18px color color font size font size 如果我只想更改第二个变量值我需要编写第一个变量默认值吗 h1 iconFont gree
Drupal 7在自定义主题中覆盖jquery js文件

是否可以重写覆盖自定义模板脚本变量中使用的默认 Drupal 7 26 jquery 我的意思是js文件之一通过自定义主题来的一个我试过这个sites all MYTPL template php但它不起作用 scripts misc
不在映射中的字段包含在 ElasticSearch 返回的搜索结果中

我想使用 Tire gem 作为 ElasticSearch 的客户端来索引 pdf 附件在我的映射中我从 source 中排除附件字段以便附件不会存储在索引中并且未在搜索结果中返回 mapping source gt exclud
Visual Studio Android 模拟器网络不工作

I started using xamarin in visual studio and I installed visual studio android emulator Emulator works flawlessly but ne
编辑超链接 Excel 2010 宏

好的我想创建一个宏来替换超链接的一部分我的 Excel 文件中有大量的超链接有没有办法创建一个宏来做到这一点例如 www OldName com www Oldname com a www Oldname com b to www
C++ 非阻塞异步定时器

我读过很多关于这个问题的帖子但没有找到这个问题的答案我想制作一个在后台运行并在完成后执行某些操作的计时器类甚至我想一次调用多个异步倒计时的计时器我在搜索这个类时发现了它它似乎有效但不在后台我怎样才能将它转换为我想要的 Time
如何在jquery mobile中初始化页面？ pageinit 未触发

在 jquery 移动页面上初始化对象的正确方法是什么这事件文档 http jquerymobile com test docs api events html说使用 pageInit 没有该函数的示例但给出了绑定到的示例pagein
在 iphone 应用程序中使用来自 sharekit 的 twitter 时无法验证 OAuth

我正在 iphone 应用程序中使用 sharekit 实现 facebook 和 twitter 共享 Facebook 共享工作正常但 twitter 共享出现错误无法验证 OAuth 我遇到了同样的问题这解决了它 https g
使用 Fluent Nhibernate Table-Per-Subclass 策略时可以指定标识列吗？

我正在创建一个 Fluent N hibernate 子类映射目前看起来像这样 public class TaskDownloadMap SubclassMap
Github Actions，如何在作业步骤之间共享计算值？

是否有一种 DRY 方法可以使用 Github Actions 在多个作业步骤中计算和共享值在下面的工作流程 yml 文件中回声 GITHUB REF 剪切 d f3 GITHUB SHA 在多个步骤中重复 name Test Buil
用于自定义日志的 Logstash Grok 过滤器

我有两个相关问题第一个是如何最好地处理具有混乱间距等的日志第二个我将单独询问是如何处理具有任意属性值对的日志看 Logstash Grok 过滤器用于具有任意属性值对的日志 https stackoverflow com qu

用于自定义日志的 Logstash Grok 过滤器

用于自定义日志的 Logstash Grok 过滤器 的相关文章

随机推荐

热门标签

用于自定义日志的 Logstash Grok 过滤器的相关文章