Postgresql 获取一列或大表中一组唯一值的最快方法

2023-12-24

我在 Postgresql 数据库中有一个不断增长的、可能非常大的表，其中包含来自不同“设备”的不同“通道”的“数据”，例如：

Table data:
  id (PK)
  device_id (FK -> device)
  channel_id (FK -> channel)
  timestamp (TIMESTAMP)
  value (Float)

我使用分区将表分成多个子表，每个子表对应一个设备，因为我从不需要在同一查询中不同设备的数据。由于并非所有设备都提供所有频道，因此我想获取单个设备的所有可用频道的列表。解决我的问题的一个简单的 SQL 查询是：

SELECT DISTINCT(channel_id) FROM data where device_id = 1;

这工作得很好，但对于数据表中有很多条目的设备来说需要很长时间。使用分区大大加快了这一过程，因为数据库只需检查一个设备的条目，但对于某些设备来说仍然需要很长时间才能完成。

我的应用程序的属性使得为一台设备添加新通道类型的情况很少发生。大多数情况下，设备添加到数据库后频道会很快添加，之后不会再添加新频道。然而，可用通道的数据添加得相当频繁。我还需要经常向用户显示每个设备的可用频道列表，因此希望加快可用频道的查找速度。我已经在channel_ids上有一个索引，希望它能加快获取所需列表的速度，但检索列表仍然需要相当长的时间。

目前，我可以想出几种方法来解决我的问题：

使用 postgres 的一些“神奇”功能，它完全符合我的要求，但我对此一无所知。
使用触发器来维护某种类型的额外表，每个“设备”/“通道”组合仅包含一个条目，因此允许快速访问可用通道。然而，由于新数据经常插入，我想触发器会产生相当多的开销，而它只在极少数情况下检测新通道。
重新考虑我的数据库设计。也许插入另一个包含“通道”和“设备”之间的链接的表，然后只在该表的“数据”中拥有一个 FK。中间表上的查询应该很快，但是，这基本上增加了将数据插入数据库的应用程序的复杂性。
也许视图可以在这里提供帮助？
在我的前端中使用缓冲仅定期执行查询，因为可用通道不会经常更改。

在我看来，第 2 点和第 3 点似乎会增加很多不必要的开销，我想避免这些开销。由于我没有找到与此主题相关的任何内容，因此我目前认为解决方案 5. 是我要采用的方法。但是，我想知道是否有人对我的问题有更好的、可能基于数据库的解决方案。

感谢您的帮助。

对于选项 1，您要做的是“松散索引扫描”或“跳过扫描”。

如果 PostgreSQL 能够在有益的时候自动执行这些操作，那就太好了，但到目前为止它还没有这样做。但是你可以把它骗进去。 http://wiki.postgresql.org/wiki/Loose_indexscan我从未在分区表上尝试过此操作，但我认为向 union all 的每个分支添加合适的 WHERE 子句会很简单。

也许您也想要选项 3，或者相反，我没有足够的信息可以说。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Postgresql 获取一列或大表中一组唯一值的最快方法的相关文章

nvarchar 值“3001822585”的转换溢出了 int 列

我使用以下方法将 Excel 文件导入到 SQL Server Excel 文件将所有值作为字符串我可以导入文件除了Barcode SalePrice and Price2 我收到错误 nvarchar 值 3001822585 条形码
PostgreSQL - 根据另一个单元格值设置默认单元格值

如果我有一个专栏说column a任何给定值我想要另一列column b有一个default value根据的值column a 换句话说 if column a peter then column b default value do
MYSQL 的 Google OAuth 2.0 用户 ID 数据类型

我正在实施 Google OAuth 2 0 并注意到 Google OAuth 返回的唯一用户 ID 是21位数字长的我想大整数 20 足以满足这种需求但我现在看到 Google OAuth 返回的用户 ID 的长度感到困惑关于我应
私人聊天系统MYSQL查询显示发送者/接收者的最后一条消息

在这里我延伸一下我之前的问题私人聊天系统MYSQL查询ORDERBY和GROUPBY https stackoverflow com questions 10929366 private chat system mysql query o
Django 中从 sqlite 迁移到 postgresql

我想迁移自sqlite to PostgreSQL db 我安装了 postgresql 并在其 shell 上创建数据库然后配置我的 django 设置如下 default ENGINE django db backends postg
如何创建不返回任何内容的函数

我想写一个函数pl pgsql 我在用着Postgres 企业管理器 v3并使用 shell 来创建一个函数但在 shell 中我必须定义返回类型如果我不定义返回类型我将无法创建函数如何创建一个不返回结果的函数即创建一个新表的函数
SQL Server 2012：有条件地增加计数器用户 ROW_NUMBER()

我正在尝试申请ROW NUMBER 根据特定条件增加计数器我的数据如下所示目标计数器是Prep column id DSR PrepIndicator Prep 1662835 1 1 1 1662835 14 2 2 1662835
如何使用 SQL 通过表示多级订单的 varchar 字段正确排序？

我不太喜欢数据库我发现在查询上出现以下问题SQL服务器数据库旧的遗留应用程序的我声明不幸的是我无法更改数据库结构字段类型这非常难看我有以下情况 SELECT Sottocategoria IdSottocategoria IdCa
如果您编辑/更新该特定对象，laravel 唯一名称表示已被占用

我有一个投资组合表我没有在 url 中显示投资组合的 id 而是使用 getRouteKeyName 显示投资组合的名称所以我希望该名称是唯一的否则如果它已经存在它可能会显示错误的投资组合我将名称字段的规则设置为唯一如果我现在编
SQL UPDATE 语句根据另一个现有行更新列

基本上我有一个与下表具有相似格式的表格我想做的是根据这个逻辑更新 Col4 如果 Col2 为空则用 Col3 更新 Col4 如果 Col2 不为 null 则在 Col1 中查找与 Col2 中的值匹配的值使用 col3 中的相应
如何计算 Postgres 上图表中所有连接的节点（行）？

我的桌子有account id and device id One account id可以有多个device ids 反之亦然我正在尝试计算每个连接的多对多关系的深度 Ex account id device id 1 10 1 11
如何进行数据透视并计算列平均值

我承认这是迄今为止我必须面对的最复杂的 SQL 语句之一我在这件事上碰壁了我希望有人能帮我一把我在数据库中有这张表 Item ActiveTime sec DateTime 1 10 2013 06 03 17 34 22 gt Mo
MySQL：如何获取每个分组的x个结果数[重复]

这个问题在这里已经有答案了可能的重复 mysql 在 GROUP BY 中使用 LIMIT 来获取每组 N 个结果 https stackoverflow com questions 2129693 mysql using limit w
如何连续添加起始行和下一行的值

我只想创建一个 sql 查询结果就像图片上的那样类似于 SQL 中的斐波那契数列 Ex Column 1 10 则 Result 列的值为 Result 10 因为这是第一行然后假设column1第二行的值为50 那么Result第二
在 MS Access SQL 查询中从正常日期转换为 unix 纪元日期

我正在尝试编写一个通过 ODBC 连接到 MySQL 数据库的 MS Access 2007 连接的查询一切工作正常查询执行我想要的操作我挂断的部分是我一直在询问用户 unix 纪元时间而不是常规日期我查找了 MS Access
如何更新 pl/sql 中嵌套表的列？ [复制]

这个问题在这里已经有答案了我正在尝试在表中创建一个可以存储多个值的列如下所示我有一个学生id std和一个名为marks可以采用几个值例如2 3 4 我想更新此列表以添加另一个标记2 3 4 5但我不知道怎么做我如何更新专栏mar
本地 Postgres 实例和 Azure Cloud Postgres 实例之间的实时同步

我需要在本地 postgresql 实例与云 postgresql 实例之间设置实时同步过程请让我知道我可以通过哪些选项来实现它我是否必须使用任何特定工具或者可以通过复制进行管理请指教使用 PgPool http www pgpoo
pg_dump 与 pg_dumpall？使用哪一个来进行数据库备份？

I tried pg dump然后在另一台机器上我尝试导入 sql 并填充数据库我看到 CREATE TABLE ERROR role prod does not exist CREATE TABLE ERROR role prod do
标量子查询包含多行

我正在使用 H2 数据库并想要移动一些数据为此我创建了以下查询 UPDATE CUSTOMER SET EMAIL SELECT service EMAIL FROM CUSTOMER SERVICE AS service INNER
SQL Server 2008 错误 233

我正在使用以下 sql 脚本在 SQL Server 2008 中创建新登录名 CREATE LOGIN xyz WITH PASSWORD xyz DEFAULT DATABASE master DEFAULT LANGUAGE us e

随机推荐

具有显式默认命名空间的 XML 文档的 XPath 和命名空间规范

我正在努力获取包所需的 XPath 表达式和命名空间规范的正确组合XML http cran r project org web packages XML index html 争论namespaces 对于具有显式定义的 XML 文档xm
Google 饼图标签

http j1309 hizliresim com 1f v t1ux0 png http j1309 hizliresim com 1f v t1ux0 png 这就是我的图表和代码
提取R中字符串中的最后一个单词

提取句子字符串中最后一个单词的最优雅的方法是什么该句子不以结尾单词之间用空格分隔 sentence lt The quick brown fox TheFunction sentence 应该返回狐狸如果可能有简单的解决方案我不
ListAdapter Diff 不会在同一列表实例上调度更新，但也不会在与 LiveData 不同的列表上调度更新

这是一个已知问题如果新列表仅具有修改的项目但具有相同的实例则 ListAdapter 实际上是其实现中的 AsyncListDiffer 不会更新列表如果您在内部使用相同的对象则更新也不适用于新实例列表为了使所有这些工作正常进行
保存base64图像python

我正在尝试使用 Python 保存 Base64 编码的图像这里的字符串太大而无法发布但这是图像当 python 接收到最后 2 个字符时虽然字符串没有格式化所以我这样做 import base64 data data image
AADSTS90019：在请求中或任何提供的凭据中均未找到租户识别信息

您好我想实现 Office365 SSO 登录我已经创建了一个帐户现在正在关注此文档 https msdn microsoft com en us library azure dn645542 aspx https msdn micr
Bootstrap 导航栏无法在移动设备上运行

我使用引导程序将下面给出的代码用于我的 home html 但通过移动设备浏览网站时搜索栏及其上的所有内容都不会显示请帮忙解决谢谢
使用 CoreBluetooth (BLE) 将数据从 CentralManager 发送到 PeripheralManager

我的应用程序在两台 iOS 设备均为 6 1 4 上运行其中一台设备充当中央设备另一台充当外围设备我已经成功地将通知设置为通知的特征从外围设备发送到中央设备但是我想将一个从 Central 到 Peripheral 的值写入
PHP多维数组转html表格

我有一个多维数组我试图将其输出为表格这是我的数组 marksarray array 3 0 gt array 2 0 gt string 1 8 1 gt string 1 0 1 gt array 2 0 gt string 1 9
QProcess::start 和 QProcess::startDetached 有什么区别？

Qt 文档给出了这样的解释 QProcess start 如果没有正在运行的程序则在新进程中启动给定程序在参数中传递命令行参数 QProcess startDetached 使用新的参数启动程序程序过程并从中分离两者有什么区别区
document.ready期间触发锚点的href的javascript函数

是否可以在页面加载期间触发锚标记的javascript函数这是我的fiddle http jsfiddle net jansian yCvBH a href click me a document ready function WebTr
border-radius 属性和 border-collapse:collapse 不能混合。如何使用边框半径创建带有圆角的折叠表格？

我正在尝试使用 CSS 制作一个带有圆角的表格border radius财产我使用的表格样式看起来像这样 table moz border radius 10px webkit border radius 10px border radi
C# RichTextBox 彩色文本

我有一个 RichTextBox 我想要其中的彩色文本有标签选项吗我想要这样的东西 color red nick color some message 因为我需要将其保存为文本并且我希望重新加载时也有彩色文本我可以在不编写自己的方法
android runOnUiThread 和 java 中简单代码的区别

我是 android 应用程序开发的初学者我正在 android 中使用线程我读过有关runOnUiThread在主 UI 上运行代码如果我没记错的话我猜我的问题是主 UI 上的正常代码和内部代码有什么区别runOnIUThrea
Ubuntu-nodejs-npm install -g > 错误：EACCES：权限被拒绝，mkdir

安装 NodeJS 时遇到问题npm包裹在 Digital Ocean Droplet Ubuntu 14 04 服务器上 npm install g PACKAGE NAME 我什至尝试过sudo有同样的错误错误信息 Error EA
macOS 上使用 Ninja 的 CMake GUI

我正在尝试使用 CMake GUI 创建 Ninja 构建文件我尝试使用 Brew 手动在 macOS 上安装 Ninja 两次我都确保 ninja 在 PATH 上可用但 CMake GUI 始终无法找到 ninja CMake 错误
使用SQL中的distinct函数

我正在运行一个 SQL 查询我想知道的是有没有一种方法可以选择表中其中一列的值不同的行当我使用 unique 函数时它返回所有不同的行所以 select distinct teacher from class etc 这工作正常
尝试重定向时看到“无法修改标头信息”错误

我有基本的 PHPmail 该脚本通过电子邮件向用户发送他们刚刚提交的表单的详细信息 PHP 可以很好地将所有数据插入数据库但是当我想在数据处理完成后重定向它们时就会出现问题我目前正在使用 mail email subject mes
代码从 Python 2.6 更改为 3.x

我想得到pywbem http pywbem svn sourceforge net 在 Python 3 2 中工作在 2 6 中工作正常但在 mof compiler py 中的这部分代码上构建失败 File pywbem 0 7
Postgresql 获取一列或大表中一组唯一值的最快方法

我在 Postgresql 数据库中有一个不断增长的可能非常大的表其中包含来自不同设备的不同通道的数据例如 Table data id PK device id FK gt device channel id FK gt c

Postgresql 获取一列或大表中一组唯一值的最快方法

Postgresql 获取一列或大表中一组唯一值的最快方法 的相关文章

随机推荐

热门标签

Postgresql 获取一列或大表中一组唯一值的最快方法的相关文章