事件时间序列的数据库建议

2024-01-05

对于我的一个项目，我必须将大量事件集合输入数据库以供以后处理，并且我正在尝试确定哪个 DBMS 最适合我的目的。

I have:

目前大约有 400,000,000 个离散事件
数据库中将存储约 600 GB 的数据

这些事件有多种形式，但我估计单个属性的数量约为 5,000 个。大多数事件每个仅包含大约 100 个属性的值。属性值将被视为任意字符串，在某些情况下，被视为整数。

这些事件最终将合并为一个时间序列。虽然它们确实有一些内部结构，但没有对其他事件的引用，我相信这意味着我不需要对象 DB 或某些 ORM 系统。

我的要求：

开源许可证 - 我可能需要稍微调整一下。
尽管一开始只使用一个系统，但能够扩展到多个服务器，从而实现可扩展性。
快速查询 - 更新并不那么重要。
适用于 C/C++、Java 和 Python 的成熟驱动程序/绑定。最好拥有与其他人兼容的许可证 - 我宁愿不因为技术决定而承诺任何事情。我认为大多数数据库驱动程序在这里都没有问题，但无论如何应该提到这一点。
适用于 Linux。
如果它也适用于 Windows，那就太好了，但不是必需的

我理想的数据库将允许我通过单个查询检索指定时间段内的所有事件。

到目前为止我发现/考虑到的：

PostgreSQL http://www.postgresql.org/随着页面大小的增加，每个表中显然可以有多达 6,000 列。如果我对属性计数的估计没有偏离，那么它可能会偏离。
MySQL http://www.mysql.com/每个表似乎有 4,000 列的限制。我could使用带有一点 SQL 功能的多个表，但我不想这样做。
MongoDB http://www.mongodb.org/是我目前所倾向于的。它允许我保留事件的内部结构，同时仍然能够查询它们。它的 API 看起来也相当简单。我不知道它在性能方面表现如何 - 至少在单个服务器上。
OpenTSDB http://www.opentsdb.net/它的度量收集框架听起来很有趣。我可以为每个属性使用单个时间序列（这可能有助于我的一些处理），将属性值作为标签，并另外标记条目以将它们与特定事件相关联。从管理员和应用程序程序员的角度来看，它可能比上面三个有更陡峭的准备曲线。不知道它的性能。
Use HBase http://hbase.apache.org/直接地。这可能比更符合我的要求OpenTSDB http://www.opentsdb.net/，尽管 - 从我过去使用 hadoop 的经验来看 - 管理开销可能仍然高于前三个选项。

可能还有其他数据库可以做到这一点，所以请随时告诉我 - 我将不胜感激任何可能对我有帮助的建议或评论。

PS：我作为数据库管理员的经验很少，所以对于任何误解我深表歉意。

使用具有数千列的表是疯狂的。尤其是当它们大多数如你所说为零时。

您应该首先考虑从此转换您的数据结构：

table_1
-------
event_id
attribute_1
attribute_2
[...]
attribute_5000

变成这样的东西：

table_1          event_values             attributes
--------         ------------             ----------
event_id         event_id                 attribute_id
                 attribute_id             attribute_type
                 attribute_value

它可以与任何 RDMS 一起使用（唯一的限制是数据库的总大小和性能）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

database

TimeSeries

事件时间序列的数据库建议的相关文章

在 Codeigniter 中从其他数据库切换动态数据库

mi 文件 config php 是 active group default active record TRUE db master 是唯一的数据库 db master hostname localhost db master user
jsp/servlet 从数组填充下拉框

大家好我正在尝试创建一个表单允许您为某个主题创建一个实验室它有一个下拉框您可以在其中选择与该用户相关的主题但是当我去加载页面时我收到此错误g apache jasper JasperException java lang Nu
如何比较 Postgresql 中日期时间字段中的日期？

在比较 postgresql Windows 中的版本 9 2 4 中的日期时我遇到了一个奇怪的情况我的表中有一列说update date与类型timestamp without timezone 客户可以仅使用日期搜索此字段例如 2
无法获取 ConfigBean 中实体的正确 ID - Java EE

我正在构建一个药房管理应用程序每个药房都需要一名管理员约束是这样的 public class Pharmacy implements Serializable Id GeneratedValue strategy GenerationT
如何将变量设置为触发器 MYSQL 内存储过程的结果？

我这里有一个小问题我正在为我的数据库工作创建一个触发器但我不知道如何在触发器内使用存储过程我想将过程的结果保存在变量中然后使用稍后在 IF 比较器上变量这是我的代码 DELIMITER CREATE TRIGGER insert
在数据库中存储类型时的最大 MIMEType 长度

人们在数据库中使用什么作为 MIMEType 字段的长度到目前为止我们看到的最长的是 72 字节 application vnd openxmlformats officedocument wordprocessingml documen
JFreeChart - 创建移动图表时出现问题

我在我的 java 应用程序中使用 JFreeChart Problem 我想绘制一个XY面积图 whose 域轴 x 轴当我们开始绘制数据时应该自动水平滚动我在中看到了同样的事情时间序列图表但我不想要任何时间系列图表我只想要滚动的
为什么 sql 字段名称中不应该包含逗号？

人们一直告诉我列名中不应包含空格我只是想知道这是为什么这是我为学校创建的一些数据库表遇到的问题字段名称包括 Preble 和 Darke 相反它们需要是普雷布尔县俄亥俄州和达克县俄亥俄州如果它们是行名称我只需创建一个
如何反转 Python statsmodels ARIMA 预测中的差异？

我正在尝试使用 Python 和 Statsmodels 来理解 ARIMA 预测具体来说为了使 ARIMA 算法发挥作用需要通过差分或类似方法使数据平稳问题是在进行残差预测后如何反转差异以返回到包含差异化趋势和季节性的预测
SQLite同时读写

我读过很多主题但无法找到问题的答案是否可以同时读写我有后台线程更新一些数据 UI 需要存储在数据库中的一小部分数据所以在UI线程中执行SELECT操作但当更新正在进行时它会阻塞结果 UI 冻结了几秒钟有人在写入时成功从数据库读
是否可以自动化 SQL Server 2008 分析器？

有一个post https stackoverflow com questions 488020 what is your most useful sql trick to avoid writing more code关于有用的 SQL
PHP 5 的 SQLite 编译设置是什么？

SQLite 3 7 附带了新的预写日志记录 WAL http www sqlite org wal html并且有很多设置可以被配置 http www sqlite org compile html 但是似乎没有任何方法可以改变任何事情
SQL 大表中的随机行（使用 where 子句）

我有一个网站人们可以在其中对汽车进行投票向用户展示 4 辆汽车他她可以投票选出他们最喜欢的汽车桌子cars有重要的列 car id int 10 not auto increment so has gaps views int 7
如何在我的 iOS 项目中添加和执行 .sql 文件？

我找到了很多关于在 iOS 中使用 SQLite 数据库的教程但没有找到任何直接引用 sql 文件的内容谁能告诉我如何将现有的 SQL 数据库链接到我的应用程序编辑这是一个 MySQL 转储我们有一个基于浏览器的抽认卡程序现在我
如何查看Pocketsphinx词典中是否存在该单词？

我只是想看看字典文件中是否存在字符串字典文件位于问题底部我想检查语音识别器是否可以识别单词例如识别器将无法识别字符串ahdfojakdlfafiop 因为字典中没有定义所以我可以检查某个单词是否在 pocktsphinx 词典中
在 PHP 中将十进制/双精度/浮点值与 PDO 绑定的最佳方法是什么？

看来类常量只涵盖PDO PARAM BOOL PDO PARAM INT and PDO PARAM STR用于绑定您只是将十进制浮点双精度值绑定为字符串还是有更好的方法来处理它们 MySQLi 允许使用 d 类型表示 double
从数据库 MYSQL 和 Codeigniter 获取信息

如果你们需要其他信息上一个问题就在这里从数据库中获取信息 https stackoverflow com questions 13336744 fetching information from the database 另一个更新尽
如何将图数据结构持久化到关系数据库中？

我考虑过创建一个顶点表和一个边表但是在内存中构建图和遍历子图是否需要大量查找我想避免过多的数据库读取还有其他方法可以保存图表吗旁注我听说过 Neo4j 但我的问题实际上是如何在概念上表示标准数据库中的图形不过我对一些 NoSQ
R xts 对象中从每日时间序列到每周时间序列

我正在使用 Zoo 和 xts 包来分析财务数据 ts 包不太合适因为金融系列有周末没有可用数据我读到了 xts 包中可用的 apply 函数 apply daily x FUN apply weekly x FUN apply mo
如何对 SQL Server Express 进行实时更改

我一直在使用 VS studio 开发一个 ASP NET Web 应用程序我正在使用 SQL Server Express 在开发过程中我一直在我的服务器上测试我的网络应用程序每次我需要更新数据库时我都会简单地删除旧数据库位于我

随机推荐

Rails 3 has_many 改变了？

我需要跟踪像这样设置的关联的更改添加和删除 has many listing services has many services through listing services 对于普通属性最简单的方法是检查l changes at
从 https 链接传输音频时出现问题

大家好我对 Android 有点陌生我开发了一个应用程序它从服务器流式传输音频一切都很顺利直到我的应用程序崩溃我对其进行了调试发现 Android 媒体播放器在通过 HTTPS 链接流式传输时抛出异常我有大约 20 个将音频
在Spring MVC中返回@Async方法结果并将其返回给Ajax客户端

我的控制器中有一些执行的方法 Async task Async public Future
如何在mvc 4中自动将占位符属性添加到html输入类型号？

这是一个非常具体的问题我设法使用名为的编辑器模板自动将占位符属性添加到 html5 电子邮件输入类型EmailAddress cshtml 保存在 Views Shared EditorTemplates 文件夹请参阅下面的代码 Htm
最快的多读取器/单写入器保护共享资源 - C++

我想确认我的方法非常fast适用于使用 C 的大多数多读者单作者方法的共享资源的跨平台保护它有利于编写者这样当他们进入时所有当前线程都可以完成但任何类型的所有新线程都必须等待这两个函数的逆向应该是显而易见的我所做的阅读表明提
UITableViewCell：圆角和阴影

我正在更改 UITableViewCell 的宽度以便单元格更小但用户仍然可以沿着表格视图的边缘滚动 override func layoutSubviews Set the width of the cell self bounds
Yii 2 高级应用程序模板的 Nginx 配置

我想以这样的方式配置 Nginx Web 服务器要求 index phpURI 应由public html frontend web index php 要求 admin index phpURI 应由public html backen
什么是 AAPT（Android 资源打包工具）以及它如何工作？

AAPT Android 资源打包工具是什么意思它是如何工作的我可以运送吗 so使用 AAPT 将一个应用程序的文件放入另一个应用程序的 APK 文件中 AAPT 允许您查看创建和更新 ZIP 兼容的存档 ZIP JAR 和 APK
PHP Stream_get_contents() 从数据库读取 LOB 的行为很奇怪

我的表中有 2 条具有类似 CLOB 数据的记录其中每一个都从查询中解析然后由 php 在循环中根据返回的 PDO FETCH ASSOC 读入字符串查询返回结果后看起来像这样 ID NAME DESCRIPTION LOB DEFI
在 Java 中使用 Selenium 2 将鼠标悬停在 WebElement 上[重复]

这个问题在这里已经有答案了可能的重复 Selenium2 中的 FirefoxDriver 是否有经过验证的 mouseOver 解决方法 https stackoverflow com questions 6232390 is ther
Windows 计算机文件复制 - DevOps 任务和 IP 地址

我正在 Azure DevOps 上构建发布管道我的发布的一部分是将一堆文件复制到 Azure VM 据我了解目标机器需要打开PowerShell 5986端口我有一个打开端口 5986 的虚拟机我通过使用目标计算机上的 Powe
在从桌面 C++ 启动的 Win10 现代应用程序中打开文件时出错

我尝试使用以下代码从桌面 C 使用 Windows 10 照片应用程序这是一个现代应用程序打开图像文件为简单起见省略了错误检查 DWORD pid CComPtr
我们如何在 selenium/protractor 中设置缩放级别，即缩放到 90%

我们如何将硒量角器缩放页面大小的缩放级别设置为 90 等不知道量角器中是否有等效的东西因为从未工作过但这就是我通过 JavascriptExecutor 在 java webdriver 中放大和缩小的方式使用 document
Google Apps 脚本：从亚马逊销售合作伙伴 API 获取订单（签名请求）

我正在尝试在此之后创建对亚马逊销售合作伙伴 API 的请求guide https github com amzn selling partner api docs blob main guides developer guide Selli
MySQL：如何在触发器中使用分隔符？

有人告诉我我需要在触发器中使用分隔符我正在查看 MySQL 手册页并在示例中找到了它但是它不在通用文档中这是我试图纠正的代码 CREATE TRIGGER adult BEFORE INSERT OR UPDATE ON tab
PHP MySQL 查询不起作用，但可以从终端运行

这是我的代码 gid int stripslashes POST id echo gid db dbConnect test db gt query 更新玩过的游戏集 Play 1 where id gid 回显 db gt 错误回声 d
如何在 Service Worker 中动态加载 Javascript 文件？

我无法使用任何涉及创建
为列表视图列设置不同的对齐方式

我在绘制列左对齐或居中对齐的列表视图时遇到问题我查看了在这里或其他论坛上找到的一些解决方案但它们似乎都适用所有列 https stackoverflow com questions 4883182 content alignment f
简化 vb.net 中的列表初始化

有哪些选项可以简化List初始化以消除重复New MyObject With以及参数名称例如Value1 我需要创建 50 个对象的列表因此有很多重复的可能不必要的代码我使用最新的 Visual Studio 2019 16 2 3
事件时间序列的数据库建议

对于我的一个项目我必须将大量事件集合输入数据库以供以后处理并且我正在尝试确定哪个 DBMS 最适合我的目的 I have 目前大约有 400 000 000 个离散事件数据库中将存储约 600 GB 的数据这些事件有多种形式但我估

事件时间序列的数据库建议

事件时间序列的数据库建议 的相关文章

随机推荐

热门标签

事件时间序列的数据库建议的相关文章