FileBeat 收获问题

2024-02-27

我们使用 ELK 来控制我们的程序日志。在我们的 FileBeat 配置中，我们从中获取30种不同包含每秒更新的文件的路径（它仅在产品机器中每秒更新 - 在其他开发机器中，我们的日志要少得多）。我们的日志文件不会被删除，直到它们变旧并且我们停止使用它们（我们也不会修改它们的名称）。最近我们发现配置文件（.yml）中最后一个路径的日志从生产机器从未出现在 Kibana 中。

经过调查，我们意识到 FileBeat 停留在文件上是第一个路径，并且似乎永远不会到达最后一个路径。当我将最后两条路径的位置替换为开头时，FileBeat 开始在那里注册所有日志，然后收集它们。

我查阅了有关 FileBeat 配置的文档，看到了 close* 选项关闭选项配置 https://www.elastic.co/guide/en/beats/filebeat/current/configuration-filebeat-options.html#close-options这似乎是个好主意。但我还没有设法把它做好，我不确定 scan_Frequency 选项的建议时间是多少（目前默认为 10 秒）以及什么对我来说是最好的方式。

我试图改变关闭超时到 15 秒和扫描频率 to 2m

      close_timeout: 15s
      scan_frequency: 2m

我想在这里提出一些意见，我能做些什么来解决这个问题？我将配置放在这里是为了提供一些参考，并看看我是否遗漏了其他内容。

我的 filebeat.yml：（更改前）

      filebeat:
  # List of prospectors to fetch data.
  prospectors:
    # Each - is a prospector. Below are the prospector specific configurations
    -
      paths:
        - D:\logs\*\path1\a_*_Pri_app.log.txt
      input_type: log
      document_type: type1
      multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}'
      multiline.negate: true
      multiline.match: after
    -
      paths:
        - D:\logs\*\path2\b_*_Paths_app.log.txt
      input_type: log
      document_type: type2
      multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}'
      multiline.negate: true
      multiline.match: after
    -
      paths:
        - D:\logs\*\path3\c_*_R_app.log.txt
      input_type: log
      document_type: path3
      multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}'
      multiline.negate: true
      multiline.match: after
    -
      paths:
        - D:\logs\*\path4\d_*_d_app.log.txt
        - C:\logs\*\path4\d_*_d_app.log.txt
      input_type: log
      document_type: path4
      multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}'
      multiline.negate: true
      multiline.match: after

.....同上

 paths:
        - D:\logs\*\path27\S.Coordinator_Z.*.log*
        - C:\logs\*\path27\S.Coordinator_Z*.log*
      input_type: log
      document_type: path27
      multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}'
      multiline.negate: true
      multiline.match: after
    -
      paths:
        - D:\logs\*\path28\d_*_Tr_app.log.txt
        - C:\logs\*\path28\d_*_Tr_app.log.txt
      input_type: log
      document_type: path28
      multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}'
      multiline.negate: true
      multiline.match: after
    -
      paths:
        - D:\logs\*\R1_Output\R*\pid_*_rr_*
      input_type: log
      document_type: path29
      multiline.pattern: '<\?xml version="1\.0" encoding="UTF-8"\?>'
      multiline.negate: true
      multiline.match: after  
    -
      paths:
        - D:\logs\*\R2_Output\R*\pid_*_rr_*
      input_type: log
      document_type: path30
      multiline.pattern: '<\?xml version="1\.0" encoding="UTF-8"\?>'
      multiline.negate: true
      multiline.match: after

      registry_file: "C:/ProgramData/filebeat/registry"

经过长时间的调查，当我试图找到与我遇到的类似问题时solution，并在讨论弹性论坛尝试了我的运气之后。我设法解决了这个问题。

因为我在网上没有看到这个选项，所以我把它放在这里。

Filebeat 收集系统在同时处理大量打开的文件时显然有其限制。（一个已知的问题和弹性团队还提供了一堆配置选项来帮助处理这个问题并根据您的需要定制 ELK，例如配置选项 https://www.elastic.co/guide/en/beats/filebeat/current/configuration-filebeat-options.html#close-options）。我设法通过打开另外 2 个 Filebeat 服务来解决我的问题，我按以下方式配置它们的探矿者（A 的示例相同到 B）：

paths:
    - D:\logs\*\pid_*_rr_*
  input_type: log
  document_type: A 
  multiline.pattern: '<\?xml version="1\.0" encoding="UTF-8"\?>'
  multiline.negate: true
  multiline.match: after
  close_eof: true

这样，因为相互依赖地工作的服务 Filebeat 不断尝试操作它们（而不是“卡在”第一个探矿者身上）。

我通过这种方式使我的收获能力加倍。

在 Elastic 网站上提出讨论：讨论 https://discuss.elastic.co/t/filebeat-isnt-harvesting-the-logs-from-the-last-paths/106841/7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

FileBeat 收获问题的相关文章

在elasticsearch中过滤facet

我有一个如下查询 query query query string query s q filter ids values list ids facets destination terms field destination en hot
GitLab CI语法来编写FOR循环语句？

以下是 gitlab ci yml 文件中提到的脚本此 GitLab CI 配置有效但是当运行 CI CD 构建时作业会失败与 FOR 循环语法有关吗 deploy dv stage deploy dv variables GIT
如何在 GitHub 页面上添加与 index.md 共享相同主题的新页面？

目前我的 GitHub 帐户上有一个主页 https
使用 KMS 的 AWS RDS 加密是否会影响性能？

Amazon states https aws amazon com about aws whats new 2015 01 06 amazon rds encryption with kms mysql postgresql that 加
Togglz 我的 SpringBoot 的 Yml/Yaml 配置不起作用

尝试使用 Togglz 创建功能切换在我的应用程序中进行了以下配置代码 bootstrap yml togglz enabled true features FEATURE ONE true 功能枚举类 public enum AppF
弹性搜索模糊匹配，精确匹配首先显示

我想在查询中使用模糊匹配但精确匹配显示在结果的顶部我已经尝试过以下方法 return this gt client gt search array index gt self INDEX type gt self TYPE body g
ElasticSearch JavaAPI (SearchScroll)- search_context_missing_exception","reason":"找不到 id 的搜索上下文

我正在获取超过100k使用一个索引中的文档searchScroll并在所有字段中再添加一个字段100K文件然后再次将这些文档插入到另一个新索引中我正在使用SearchScrollapi 也在设置大小searchSourceBuilder
Elasticsearch：如何查询连接数？

如何询问我的 Elasticsearch 服务器现在有多少个连接这与插座数量相同吗我也不知道如何获得这些数字这与客户端的数量不同对吧因为每个客户端可能打开多个连接找不到任何相关信息但我确实发现您可以在 Elasticsearc
MATLAB 是否已有 YAML 库/解析器？

我想使用 YAML 跨多种语言交流一些数据将其视为与语言无关的序列化其中一种语言是 MATLAB 但我似乎找不到该语言的 YAML 库我在 Google 上检查了 matlab yaml 和 matlab yaml parse 似乎
如何修复 yaml 文件中的“此上下文中不允许映射值”错误？

我浏览过类似的问题并相信我已经应用了从答案中收集到的所有内容我有一个 yml 文件据我所知每个元素的格式都相同然而根据YamlLint com http www yamllint com
ElasticSearch 嵌套查询 - 排除父文档

尝试排除其中子文档之一与查询不匹配的顶级文档对于下面的示例我尝试排除其嵌套作业之一具有的所有文档current true 并与company name Elastic 但由于嵌套作业文档之一与current false和公司name E
ElasticSearch 定义自定义映射与默认“_doc”映射冲突

尝试创建自定义映射类型时会发生此问题为第一个插入弹性创建自定义映射后想要创建 doc映射类型和冲突就发生在这里第一步我创建一个映射 mappings properties field1 type keyword field2 type
ElasticSearch - 仅获取与搜索响应中所有顶级字段匹配的嵌套对象

假设我有以下文档 id 1 name xyz users name abc surname def name xyz surname wef name defg surname pqr 我只想获取与搜索响应中的所有顶级字段匹配的嵌套对象我
使用对象键作为 JSON 架构中的类型

假设我想根据 Intellij IDEA 中的 JSON 架构验证 YAML 文件该文件的结构如下 foo command touch tmp a txt I know I don t need this but it s an exam
无法使用docker在Apple Mac芯片M1上启动elasticsearch

在发布这个问题之前我浏览了许多链接例如 Kibana 无法在 Mac M1 上使用 docker 连接到 ElasticSearch https stackoverflow com questions 73160632 kibana c
从 azure pipeline.yml 将变量组参数传递到模板时出现问题

我已经声明了一个变量组Agile Connections 如下所示该组对任何管道没有任何限制我正在使用另一个名为 vars yml 的模板来存储一些其他变量 variables group Agile Connections name
如何使用ElasticSearch来实现社交搜索？

我正在尝试使用 ElasticSearch 创建具有社交功能的商业搜索我有一个企业目录用户可以通过不同的方式与这些企业进行交互通过查看它们检查它们等当用户搜索商家时我希望能够在结果顶部向他们显示他们的朋友与之互动过的商家或根据
Elasticsearch 关于“空索引”的查询

在我的应用程序中我使用了几个elasticsearch索引它们在初始状态下不包含索引文档我认为这可以称为空该文档的映射是正确且有效的该应用程序还有一个包含实体的关系数据库这些实体可能具有在 elasticsearch 中关联的
如何增加vm.max_map_count？

我正在尝试在 Ubuntu EC2 计算机 t2 medium 中运行弹性搜索但我收到消息最大虚拟内存区域 vm max map count 65530 太低至少增加到 262144 我怎样才能增加vm max map count v
Elasticsearch 在 Mac 上存储数据的位置

类似的问题this one https stackoverflow com questions 24694201 where are data files of elasticsearch on a standard debian inst

随机推荐

是否可以使用 C 中的系统 api 启动终止命令？如果没有其他选择？

我正在使用系统 api 启动命令我可以使用此 apiC C 我传递的命令有时可能会挂起因此我想在一定的超时后终止目前我将其用作 system COMMAND 我想像这样使用它使用独立于系统的 API 运行命令我不想使用 Creat
哪些范围的蓝牙 UUID 可用于供应商定义的配置文件？

我想建立一个简单的蓝牙低功耗使用自定义配置文件的基于应用程序所采用的配置文件服务特征描述符使用 16 位 UUID 如官方网站 http developer bluetooth org gatt profiles Pages Pro
“Request::is()”在 laravel 5.5 上不起作用，在 Blade 中

我正在尝试在活动菜单上设置活动类过去我用的是请求 is 函数为此但在新版本的 laravel 中它说未找到请求类当你正在使用blade您可以使用request https laravel com docs 5 5 helpers
命令“django-admin.py startproject mysite”无法识别

EDIT 我将 django admin py 的路径添加到我的系统路径中 C Users me Downloads Django 1 5 1 django bin 但即使在此之后当我尝试运行 django admin py startp
为什么%运算符有时输出正，有时输出负？

当我意识到一些奇怪的事情时我正在统一编写一个脚本在完成脚本后我在视觉工作室控制台项目中测试了我的实现 class Program static void Main string args Console WriteLine 3 5 1
ReactReducer真的应该是一个纯函数吗？

据说useReducer中使用的reducer函数是纯函数如果我没记错的话它的行为仅取决于它的输入参数因此使用相同的输入参数调用它两次会产生相同的效果从here https stackoverflow com questions 5
使用 Opencv 获取轮廓内的平均颜色

所以我决定开始一起学习Open CV和Python 我的第一个项目是检测相对静止的背景上的移动物体然后检测它们的平均颜色以对它们进行排序至少有 10 个物体需要检测我正在处理彩色视频到目前为止我设法删除背景识别轮廓可以选择获取
ASP.NET 身份二要素不起作用 - Cookie 问题？

背景我一直在使用Identity Sample微软团队提供的项目here http www asp net identity overview features api two factor authentication using sm
如何将图像中的字符和单词分割成轮廓

我有一些轮廓图像我想对其进行分割这基本上意味着我想将轮廓图像中的所有字符保存到单独的图像中但我得到了几张噪声图像以及所需的输出我想知道如何在不影响所需输出的情况下去除所有噪声图像我试图改变价值观w and h 这样我就可以最大限度
如何使用 Firebug 扩展调试 Greasemonkey 脚本？

我没有找到使用 Firebug 扩展调试 Greasemonkey 脚本的方法有谁知道如何做到这一点 Thanks 更新者 Mene S human 修复现在已被 Firefox 30 和 Firebug 2 破坏 Firefox 31m
带 dom-repeat 的 Polymer 1.0 动态模板

我有一个场景我想创建动态template将与 Polymer 一起使用的元素dom repeat 我当前的原型如下 JSbin演示 http jsbin com hitotahoqe edit js output var domRepea
org.openqa.selenium.NoSuchElementException：尝试通过 CssSelector 定位 card-fields-iframe 时，返回的节点 (null) 不是 DOM 元素

我正在尝试通过部分 id 来定位 iframe 对于这个方法我使用了 driver switchTo frame driver findElement By cssSelector iframe id card fields number
Java计算MD5哈希值

In http www anyexample com programming java java simple class to compute md5 hash xml http www anyexample com programmin
FireFox 中内容可编辑的光标位置/样式

我在 FireFox 3 中使用 contentEditable 时遇到问题我遇到的问题是在单击 div 后光标将出现在 div 上方或仅部分出现在 div 中直到我开始输入此时它的行为正确关于如何阻止这种情况发生有什么想法吗
为什么在 exec() 之前调用 quit() 不会退出应用程序？

为什么这个程序可以正常运行并显示主窗口我希望它会退出quit 在构造函数中调用主要 cpp include
Qt 5.0程序在QtCreator中运行但不在外部运行

这是上下文我在Windows 7 x64下用Qt开发了一个程序我已经升级到Qt 5 0 1 QtCreator 2 6 1 编译器VS2010 现在状态我的程序在 QtCreator 中运行良好但是当我在外面尝试时我收到了几个错误
在 Swift 中向 NSLayoutAnchor 约束添加乘数

锚约束简化了添加约束的过程但故事板中可用的乘数属性似乎并不适用于所有类型的约束例如作为根据这里的答案 https stackoverflow com questions 63042059 center uilabel created
使用 awk 删除包含唯一第一个字段的行？

希望仅打印具有重复第一个字段的行例如从看起来像这样的数据 1 abcd 1 efgh 2 ijkl 3 mnop 4 qrst 4 uvwx 应该打印出 1 abcd 1 efgh 4 qrst 4 uvwx 仅供参考我的数据中第一个字
hadoop/bin/hadoop 没有示例 jar

我安装了 hadoop 2 2 0 并尝试运行示例 wordcount 程序为此我首先使用以下命令将数据导入到 hdfs bin hadoop fs copyFromLocal home prassanna Desktop input
FileBeat 收获问题

我们使用 ELK 来控制我们的程序日志在我们的 FileBeat 配置中我们从中获取30种不同包含每秒更新的文件的路径它仅在产品机器中每秒更新在其他开发机器中我们的日志要少得多我们的日志文件不会被删除直到它们变旧并且我们停止使

FileBeat 收获问题

FileBeat 收获问题 的相关文章

随机推荐

热门标签

FileBeat 收获问题的相关文章