如何通过宁静向druid插入数据

2024-03-04

通过以下教程http://druid.io/docs/latest/tutorials/tutorial-loading-streaming-data.html http://druid.io/docs/latest/tutorials/tutorial-loading-streaming-data.html，我能够通过 Kafka 控制台将数据插入到 druid 中

卡夫卡控制台

规格文件如下所示

示例/索引/wikipedia.spec

[
  {
    "dataSchema" : {
      "dataSource" : "wikipedia",
      "parser" : {
        "type" : "string",
        "parseSpec" : {
          "format" : "json",
          "timestampSpec" : {
            "column" : "timestamp",
            "format" : "auto"
          },
          "dimensionsSpec" : {
            "dimensions": ["page","language","user","unpatrolled","newPage","robot","anonymous","namespace","continent","country","region","city"],
            "dimensionExclusions" : [],
            "spatialDimensions" : []
          }
        }
      },
      "metricsSpec" : [{
        "type" : "count",
        "name" : "count"
      }, {
        "type" : "doubleSum",
        "name" : "added",
        "fieldName" : "added"
      }, {
        "type" : "doubleSum",
        "name" : "deleted",
        "fieldName" : "deleted"
      }, {
        "type" : "doubleSum",
        "name" : "delta",
        "fieldName" : "delta"
      }],
      "granularitySpec" : {
        "type" : "uniform",
        "segmentGranularity" : "DAY",
        "queryGranularity" : "NONE"
      }
    },
    "ioConfig" : {
      "type" : "realtime",
      "firehose": {
        "type": "kafka-0.8",
        "consumerProps": {
          "zookeeper.connect": "localhost:2181",
          "zookeeper.connection.timeout.ms" : "15000",
          "zookeeper.session.timeout.ms" : "15000",
          "zookeeper.sync.time.ms" : "5000",
          "group.id": "druid-example",
          "fetch.message.max.bytes" : "1048586",
          "auto.offset.reset": "largest",
          "auto.commit.enable": "false"
        },
        "feed": "wikipedia"
      },
      "plumber": {
        "type": "realtime"
      }
    },
    "tuningConfig": {
      "type" : "realtime",
      "maxRowsInMemory": 500000,
      "intermediatePersistPeriod": "PT10m",
      "windowPeriod": "PT10m",
      "basePersistDirectory": "\/tmp\/realtime\/basePersist",
      "rejectionPolicy": {
        "type": "messageTime"
      }
    }
  }
]

I start realtime via

java -Xmx512m -Duser.timezone=UTC -Dfile.encoding=UTF-8 -Ddruid.realtime.specFile=examples/indexing/wikipedia.spec -classpath config/_common:config/realtime:lib/* io.druid.cli.Main server realtime

在 Kafka 控制台中，我粘贴并输入以下内容

{"timestamp": "2013-08-10T01:02:33Z", "page": "Good Bye", "language" : "en", "user" : "catty", "unpatrolled" : "true", "newPage" : "true", "robot": "false", "anonymous": "false", "namespace":"article", "continent":"North America", "country":"United States", "region":"Bay Area", "city":"San Francisco", "added": 57, "deleted": 200, "delta": -143}

然后我倾向于通过创建来执行查询select.json并运行curl -X POST 'http://localhost:8084/druid/v2/?pretty' -H 'content-type: application/json' -d @select.json

选择.json

 {
   "queryType": "select",
   "dataSource": "wikipedia",
   "dimensions":[],
   "metrics":[],
   "granularity": "all",
   "intervals": [
     "2000-01-01/2020-01-02"
   ],

   "filter" : {"type":"and",
        "fields" : [
                { "type": "selector", "dimension": "user", "value": "catty" }
        ]
   },

   "pagingSpec":{"pagingIdentifiers": {}, "threshold":500}
 }

我能够得到以下结果。

[ {
  "timestamp" : "2013-08-10T01:02:33.000Z",
  "result" : {
    "pagingIdentifiers" : {
      "wikipedia_2013-08-10T00:00:00.000Z_2013-08-11T00:00:00.000Z_2013-08-10T00:00:00.000Z" : 0
    },
    "events" : [ {
      "segmentId" : "wikipedia_2013-08-10T00:00:00.000Z_2013-08-11T00:00:00.000Z_2013-08-10T00:00:00.000Z",
      "offset" : 0,
      "event" : {
        "timestamp" : "2013-08-10T01:02:33.000Z",
        "continent" : "North America",
        "robot" : "false",
        "country" : "United States",
        "city" : "San Francisco",
        "newPage" : "true",
        "unpatrolled" : "true",
        "namespace" : "article",
        "anonymous" : "false",
        "language" : "en",
        "page" : "Good Bye",
        "region" : "Bay Area",
        "user" : "catty",
        "deleted" : 200.0,
        "added" : 57.0,
        "count" : 1,
        "delta" : -143.0
      }
    } ]
  }
} ]

看来我已经正确设置了 Druid。

现在，我想通过 HTTP 端点插入数据。根据如何将数据实时输入到Druid中？ https://stackoverflow.com/questions/31630369/how-realtime-data-input-to-druid，似乎推荐的方法是使用tranquility

宁静

我通过以下方式启动了索引服务

java -Xmx2g -Duser.timezone=UTC -Dfile.encoding=UTF-8 -classpath config/_common:config/overlord:lib/*: io.druid.cli.Main server overlord

conf/服务器.json好像

{
   "dataSources" : [
      {
         "spec" : {
            "dataSchema" : {
                "dataSource" : "wikipedia",
                "parser" : {
                    "type" : "string",
                    "parseSpec" : {
                      "format" : "json",
                      "timestampSpec" : {
                        "column" : "timestamp",
                        "format" : "auto"
                      },
                      "dimensionsSpec" : {
                        "dimensions": ["page","language","user","unpatrolled","newPage","robot","anonymous","namespace","continent","country","region","city"],
                        "dimensionExclusions" : [],
                        "spatialDimensions" : []
                      }
                    }
                },
                "metricsSpec" : [{
                    "type" : "count",
                    "name" : "count"
                }, {
                    "type" : "doubleSum",
                    "name" : "added",
                    "fieldName" : "added"
                }, {
                    "type" : "doubleSum",
                    "name" : "deleted",
                    "fieldName" : "deleted"
                }, {
                    "type" : "doubleSum",
                    "name" : "delta",
                    "fieldName" : "delta"
                }],
                "granularitySpec" : {
                    "type" : "uniform",
                    "segmentGranularity" : "DAY",
                    "queryGranularity" : "NONE"
                }
            },
            "tuningConfig" : {
               "windowPeriod" : "PT10M",
               "type" : "realtime",
               "intermediatePersistPeriod" : "PT10M",
               "maxRowsInMemory" : "100000"
            }
         },
         "properties" : {
            "task.partitions" : "1",
            "task.replicants" : "1"
         }
      }
   ],
   "properties" : {
      "zookeeper.connect" : "localhost",
      "http.port" : "8200",
      "http.threads" : "8"
   }
}

然后，我使用启动服务器

bin/tranquility server -configFile conf/server.json

我执行帖子到http://xx.xxx.xxx.xxx:8200/v1/post/wikipedia http://xx.xxx.xxx.xxx:8200/v1/post/wikipedia, with content-type equals application/json

{"timestamp": "2013-08-10T01:02:33Z", "page": "Selamat Pagi", "language" : "en", "user" : "catty", "unpatrolled" : "true", "newPage" : "true", "robot": "false", "anonymous": "false", "namespace":"article", "continent":"North America", "country":"United States", "region":"Bay Area", "city":"San Francisco", "added": 57, "deleted": 200, "delta": -143}

我得到以下回应

{"result":{"received":1,"sent":0}}

看来宁静已经收到了我们的数据，但是没能发送给druid！

我试着跑curl -X POST 'http://localhost:8084/druid/v2/?pretty' -H 'content-type: application/json' -d @select.json，但没有得到我通过宁静插入的输出。

知道为什么吗？谢谢。

当您发送的数据超出窗口期时，通常会发生这种情况。如果您手动插入数据，请提供准确的当前时间戳 (UTC)（以毫秒为单位）。否则，如果您使用任何脚本来生成数据，则可以轻松完成。确保当前时间为 UTC。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Druid

如何通过宁静向druid插入数据的相关文章

Apache Druid源码导读--Google guice DI框架

文章目录缘起Google Guice介绍与Spring的对比Example覆盖已有绑定关系默认绑定 Apache Druid中Guice模块guice lifecycleguice jsonconfigguice jersey jetty
数据库连接池----Druid

数据库连接池的标准接口 xff1a DataSource 获取连接的方法 xff1a Connection getConnection Druid是Java最好的数据库连接池之一 Druid数据库连接池的使用步骤 xff1a 1 导入jar
Druid-1.1.12.jar下载（链接下载+使用）

链接下载 xff1a 下载链接不行的话用网盘下载网盘下载 xff1a 链接 xff1a https pan baidu com s 1VUvRj VuxCDd3fb uvA8Q pwd 61 1111 提取码 xff1a 1111 下载
SpringBoot使用Driud连接数据库（仅配置测试连接，通过配置类方法配置）

1 下载SpringBoot官网下载SpringBoot项目 start spring io 2 使用sts工具通过导入maven项目将下载好的项目导入 sts工具下载地址 https spring io tools 目录结构如下 3
Spring Boot2.0配置Druid数据库连接池（单数据源、多数据源、数据监控）

我这里使用的开发环境是 IDEA 2017 JDK 1 8 Maven 3 3 9 SpringBoot 使用的是2 0 3版本详细创建过程可以参考 https blog csdn net qq 38455201 article deta
apache druid学习之Processes and servers

Processes and servers Apache Druid Process types Druid has several process types Coordinator Overlord Broker Historical
旧版本Druid回收连接引发的'recyle error'

公司官网上的心跳交易不执行了按理说是定时任务做的怎么会不执行呢遂去查看日志发现 ERROR 2018 09 25 20 30 37 933 AgtForwardServiceImpl java 31 转发数据推送异常 nested e
springboot shardingjdbc与druid数据源冲突解决

首先看错误信息 cancelling refresh attempt org springframework beans factory BeanCreationException Error creating bean with name
Druid无效链接回收策略(源码分析)(mysql 8小时连接失效问题)

目录问题背景异常Communications link failure druid数据库连接池关键配置说明注意标红配置 druid数据库连接池超时连接回收源码分析第一种方式获取连接时校验第二种方式 Destroy 定时任务检查需
springboot 集成druid 报错Communications link failure

最近线上的定时任务出现一个问题晚上12点执行的时候出现数据库连接失败具体堆栈信息如下 2019 12 03 22 16 00 208 ERROR 24832 ryBean Worker 1 c a druid pool DruidPoo
java.sql.SQLException: com.mysql.jdbc.Driver

java sql SQLException com mysql jdbc Driver java sql SQLException com mysql jdbc Driver at com alibaba druid util JdbcUt
Druid（Druid.io）简单使用

Druid简单使用一 Druid服务进程 Historical进程 Historical进程用于处理历史数据的存储和查询历史数据包括所以已经被committed的流数据 Historical进程从深度存储 Deep Storage 中下
alibaba druid数据库连接池详解

1 介绍 Druid连接池是阿里巴巴开源的数据库连接池项目 Druid连接池为监控而生内置强大的监控功能监控特性不影响性能功能强大能防SQL注入内置Loging能诊断Hack应用行为 2 下载 git地址 https github
druid与mysql连接超时的问题

背景公司一个项目使用了druid连接池 mysql数据库生产环境日志偶尔会打印一个错误如下 com mysql jdbc exceptions jdbc4 CommunicationsException Communications l
应用使用Druid连接池经常性断链问题分析

前段时间有应用使用Druid连接池经常的提示断链报错整个问题排查分析过程很有意思这里将Druid连接池数据库层以及负载均衡层的配置分析下记录整个问题的分析过程同时梳理下Druid连接池的配置和连接保活及回收机制 1 问题背景应用
springboot配置自定义数据源（Druid德鲁伊）的步骤。

今天和大家分享下在Springboot中配置自定义数据源Druid的两种方法及步骤方法一 1 在pom xml配置依赖注释里面的内容 2 配置自己的数据源设置我是在yaml文件中配置的顺便提醒一下在配置yaml文件的时候缩进问题一
springboot+mybatis+druid 多数据源整合

前言在上一篇文章里面我们进行了spring boot 和 mybatis 的整合 springboot整合mybatis使用druid数据源文中是使用的单数据源因为项目中有很多需要用到多数据源的场景比如主从同步读写分离或者业务库
如何将新列添加到现有的德鲁伊架构中？

我创建了一个架构并将 1TB 数据添加到德鲁伊架构中然后日志文件版本升级并添加新的两列然后我想将该数据添加到德鲁伊架构中但还不能为了向现有数据源添加新列您需要执行以下步骤前往Tasks德鲁伊控制台中的菜单从列出的数据源中转
如何在 GROUP BY Druid 返回的结果中执行 SELECT？

我很难将下面这个简单的 SQL 查询转换为 Druid SELECT country city Count FROM people data WHERE name Mary GROUP BY country city 所以到目前为止我想出了
Tranquility服务器不会向druid发送数据

我在用着imply 2 2 3 这是我的宁静服务器配置 dataSources spec dataSchema dataSource tutorial tranquility server parser type string parseS

随机推荐

如何在heroku应用程序中使用npm pdf图像包

我正在尝试使用 npm 包 pdf image https www npmjs com package pdf image https www npmjs com package pdf image 对于部署在 heroku 上的应用程序
设置minimumScaleFactor时UILabel获取当前比例因子？

我有一个UILabel并设置 let label UILabel label minimumScaleFactor 10 25 设置标签文本后我想知道当前的比例因子是多少我怎样才能做到这一点你还需要知道原始字体大小是多少但我想你可以
getPackageManager().getInstalledPackages(PackageManager.GET_ACTIVITIES) 返回 null

如果我打电话 PackageManager pm getPackageManager List
在图像底部添加阴影

如何在图像上添加阴影在底部以使标题清晰可见请参见下图我写了一个应用程序也有同样的效果我所做的是我创建了一个框架布局其中有图像视图和另一个View它与 ImageView 具有相同的高度然后我添加一个透明的渐变背景View E
TPC 继承错误

我在使用 C Entity Framework Codefirst 和 Fluent Api 进行 TPC 继承时遇到了一个奇怪的问题我有 3 个班级Person Invoice and PeriodicInvoice正如你在下面看到的
如何创建我的数据的地铁地图可视化

在一篇论文中找到了下面漂亮的图 http www ncbi nlm nih gov pubmed 25626705 http www ncbi nlm nih gov pubmed 25626705 它直观地展示了不同实验室的工作流程并很
在 Windows 平台上从 Node.js 连接 DB2

我目前正在使用一些 jdbc 代码将 DB2 镜像到本地 MySQL db 我想直接从 Node js 应用程序连接 DB2 而无需查询镜像我在 Windows 上运行无法更改为 Linux 似乎使用 Node js 在 DB2 上进行
Visual Studio 2010：限制编辑器选项卡的数量

Visual Studio 似乎不限制打开的编辑器选项卡的数量我正在使用 ReSharper 在打开一定数量的编辑器选项卡时速度变得非常慢因此我必须跟踪打开的选项卡并定期关闭旧选项卡如果我可以设置一个限制以便在达到限制时关闭旧选
如何在启动时检索文件名

我试图在 Excel 根据文件名打开时有条件地启动用户表单但是我相信代码在文件完全启动之前运行给我一个错误 Private Sub Workbook Open Dim name As String name ActiveWorkboo
ui 路由器解析抛出错误未找到提供程序

我这里有一个 ui router 状态 var AccountParentState url Account views accountrootview stickA true AccountAddState url add views a
BiometricPrompt：为什么我们应该在启用 setDeviceCredentialAllowed 之前检查 KeyguardManager.isDeviceSecure()？

的文档BiometricPrompt PromptInfo s setDeviceCredentialAllowed方法指出开发人员应在启用此功能之前首先检查 KeyguardManager isDeviceSecure 如果设备不安全
此连接使用的是 {tls_version}，现在无法在 Linux 上部署 Flask 应用程序

我在这里发布我的第一个问题所以如果我可以提高在这里提问的技能请告诉我我正在 linux 服务器上部署一个 python 应用程序该应用程序将接收 JSON 有效负载并写入 mariadb 数据库我已成功在 pycharm 上测试该
MVVM Light Messenger 未按预期运行

不久前我问了一个在这里发现的问题使用MVVM Light的Messenger在视图模型之间传递值 https stackoverflow com questions 18087906 use mvvm lights messenger t
C# SetWinEventHook 失败（返回 0）

对于我正在制作的应用程序我想拦截来自外部进程的窗口消息很像间谍的方式我发现我可以使用 SetWinEventHook 来做到这一点这是我的代码 class Program internal delegate void WinEve
如何在.NET中一步裁剪图像并调整图像大小

我有一个图像文件我想使用 System Drawing 类同时裁剪和调整大小我正在尝试以本文中的想法为基础 http www schnieds com 2011 07 image upload crop and resize with
如何从 XSLT 中的 JSON 中提取数据？

我正在 XSLT 中调用休息服务并获得 JSON 响应作为回报如何使用 XSLT 从 JSON 响应中提取数据下面是用于调用其余服务的 XSLT 代码并给出了 JSON 响应我需要从 JSON 响应中提取以下值Cookie1 Co
通过 mod_fcgid 加载 PHP 时 PHP $_SERVER['SCRIPT_NAME'] 错误

我正在使用 Apache 2 4 7 和 PHP 5 5 7 我有一个test php文件输入C web vhosts Symfony web 的价值 SERVER SCRIPT FILENAME 是正确的 C web vhosts Sym
Docker 公开所有端口或从 7000 到 8000 的端口范围

我可以在 Dockerfile 中指定端口范围吗 EXPOSE 7000 8000 当运行容器时将所有这些暴露的端口绑定到主机上的相同端口 docker run p 7000 8000 7000 8000 从 Docker 1 5 开始
从多个设备同时在多个轨道上录制音频

我目前正在使用 JavaScript 中的 Web Audio API 开发音频 Web 应用程序但我发现了一个问题我需要从不同的设备同时录制到不同的轨道想象一下例如一个具有 8 个输入的声卡独立地录制在 8 个缓冲区中以便录制
如何通过宁静向druid插入数据

通过以下教程http druid io docs latest tutorials tutorial loading streaming data html http druid io docs latest tutorials tutor

如何通过宁静向druid插入数据

卡夫卡控制台

宁静

如何通过宁静向druid插入数据 的相关文章

随机推荐

热门标签

如何通过宁静向druid插入数据的相关文章