在postgresql中，分区还是多个数据库更有效？

2024-01-24

有一个应用程序，许多公司在其中发布信息。每个公司的数据都是独立的——没有数据重叠。

从性能角度来看，最好是：

在每个表的每一行上保留公司 ID 并让每个索引都使用它？
根据公司ID对每个表进行分区
分区并创建一个用户来访问每个公司以确保安全
创建多个数据库，每个公司一个

具有持久连接的基于 Web 的应用程序。

我的想法：

新的pg连接是昂贵的，因此单个数据库创建的新连接较少
仅拥有一份字典似乎比 200 份左右更有效率
多个数据库肯定更安全，免受程序员错误的影响
如果应用程序规范应该改变以便公司共享多个数据基地将难以实施

我建议在 PostgreSQL 邮件列表上搜索有关多租户设计的信息。那里有很多讨论，答案归结为“这取决于”。在保证隔离性、性能和可维护性之间存在各种权衡。

一种常见的方法是使用单个数据库，但一个schema http://www.postgresql.org/docs/current/static/ddl-schemas.html（命名空间）每个客户在每个模式中具有相同的表结构，以及所有这些模式中相同的数据的共享或通用模式。 PostgreSQL 模式就像 MySQL“数据库”，您可以跨不同模式进行查询，但默认情况下它们是隔离的。对于单独模式中的客户数据，您可以使用search_path http://www.postgresql.org/docs/current/static/ddl-schemas.html#DDL-SCHEMAS-PATH设置，通常通过ALTER USER http://www.postgresql.org/docs/current/static/sql-alteruser.html customername SET search_path = 'customerschema, sharedschema'确保每个客户都能看到他们的数据，而且只能看到他们的数据。

为了获得额外的保护，您应该REVOKE http://www.postgresql.org/docs/current/static/sql-revoke.html ALL FROM SCHEMA customerschema FROM public then GRANT http://www.postgresql.org/docs/current/static/sql-grant.htmlALL ON SCHEMA customerschema TO thecustomer所以他们是唯一有权访问它的人，对他们的每张桌子都做同样的事情。然后，您的连接池可以使用具有以下功能的固定用户帐户登录no GRANTed 访问任何客户模式，但有权SET ROLE http://www.postgresql.org/docs/current/static/sql-set-role.html成为任何客户。（通过为他们提供设置为 NOINHERIT 的每个客户角色的成员资格来做到这一点，因此必须通过以下方式明确声明权利：SET ROLE）。连接应该立即SET ROLE向其当前运营的客户提供。这将使您避免为每个客户建立新连接的开销，同时保持强大的保护，防止程序员错误导致访问错误的客户数据。只要泳池做DISCARD ALL http://www.postgresql.org/docs/current/interactive/sql-discard.html和/或一个RESET ROLE http://www.postgresql.org/docs/8.4/interactive/sql-set-role.html在将连接分发给下一个客户端之前，这将为您提供非常强大的隔离，而不会因为每个用户的单独连接而受挫。

如果您的 Web 应用程序环境没有内置像样的连接池（例如，您正在使用具有持久连接的 PHP），那么您really需要放一个良好的连接池 http://wiki.postgresql.org/wiki/Replication,_Clustering,_and_Connection_Pooling无论如何，在 Pg 和 Web 服务器之间放置，因为到后端的连接太多会损害你的性能。保镖 http://pgfoundry.org/projects/pgbouncer/ and PgPool-II http://www.pgpool.net/是最好的选择，并且可以轻松地完成DISCARD ALL and RESET ROLE在连接切换期间为您提供。

这种方法的主要缺点是维护这么多表的开销，因为您的非共享表的基本集是为每个客户克隆的。随着客户数量的增长，它会不断增加，以至于在 autovacuum 运行期间要检查的表的绝对数量开始变得昂贵，并且基于数据库中表总数进行扩展的任何操作都会变慢。如果您考虑在同一个数据库中拥有数千或数万个客户，那么这就是一个更大的问题，但我strongly建议您在提交之前使用虚拟数据对此设计进行一些扩展测试。

理想的方法可能是使用自动行级安全性控制元组可见性的单表，但不幸的是 PostgreSQL 尚不具备这一点。由于 SEPostgreSQL 添加了合适的基础设施和 API，它看起来正在路上，但它不在 9.1 中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

postgresql

partitioning

在postgresql中，分区还是多个数据库更有效？的相关文章

PostgreSQL：有效地将 JSON 数组拆分为行

我有一个表表 A 其中包含一个包含 JSON 编码数据的文本列 JSON 数据始终是一个包含一到几千个普通对象的数组我有另一个表表 B 其中有几列包括数据类型为 JSON 的列我想从表 A 中选择所有行将 json 数组拆分为其
Slick和bonecp：org.postgresql.util.PSQLException：FATAL：抱歉，太多客户端已经错误

当我在本地开发应用程序时我使用以下命令启动我的 play2 应用程序sbt run 我喜欢如何更改代码然后重新加载浏览器以查看我的更改在大约 10 次代码更改之后我收到 postgresql 太多连接错误见下文我的数据库连接使用
我可以以编程方式配置 PostgreSQL 以不消除全文搜索中的停用词吗？

我正在使用 PostgreSQL 全文搜索来进行项目其中传统停用词 a the if 等应该被索引和可搜索这不是默认行为例如我可能希望我的用户找到查询 to be or not to be 的结果 The 文档 http www
postgresql中数组的区别

我有两个数组 1 2 3 4 7 6 and 2 3 7 在 PostgreSQL 中可能有共同的元素我想做的是从第一个数组中排除第二个数组中存在的所有元素到目前为止我已经取得了以下成果 SELECT array SELECT unne
为什么我的 postgis 不在几何字段上使用索引？

Windows 上的 postgresql 9 5 postgis 2 2 我首先创建一个表 CREATE TABLE points id SERIAL ad CHAR 40 name VARCHAR 200 然后添加一个几何字段 geo
手动更改postgresql中查询的执行计划？

是否可以在postgresql中手动更改执行计划的操作顺序例如如果我总是想在过滤之前进行排序操作尽管这在 postgresql 的正常使用中没有意义是否可以通过例如手动强制执行该操作改变运营的内部成本如果我实现自己的功能呢是否可
PostgreSQL round(v numeric, s int)

Which method http en wikipedia org wiki Rounding Tie breakingPostgres 吗round v numeric s int http www postgresql org doc
Postgres LIMIT/OFFSET 奇怪的行为

我正在使用 PostgreSQL 9 6 我有一个这样的查询 SELECT anon 1 id AS anon 1 id anon 1 is valid AS anon 1 is valid anon 1 first name AS ano
如何使用表内的 JSONB 数据类型和 PostgreSQL JDBC 驱动程序将 JSON 对象存储到 PostgreSQL 中

我想将以下 json 对象保存到 PostgreSQL 数据库表中as jsonb fname john lname doe 我当前使用 PGObject 创建对象并将类型设置为 jsonb 并将值作为 json 字符串传递寻找更好的 m
如何在 PostgreSQL 中使用条件和子查询创建唯一索引？

我使用 PGSQL 并尝试添加下面的索引 CREATE UNIQUE INDEX fk client ON user client fk client WHERE fk client NOT IN SELECT fk client FROM
PostgreSQL：使用for循环迭代表行，根据当前行检索列值

我有以下2张表 CREATE TABLE salesperson t salespersonid numeric 4 0 NOT NULL salespersonname character varying 25 salespersonte
Npgsql 参数化查询输出与 PostGIS 不兼容

我在 Npgsql 命令中有这个参数化查询 UPDATE raw geocoding SET the geom ST Transform ST GeomFromText POINT longitude latitude 4326 3081
从 Django 调用 Postgres SQL 存储过程

我正在开发一个带有 Postgresql 数据库的 Django 项目我编写了一个可以在 Postgres 上完美运行的存储过程现在我想从 Django 1 5 调用该存储过程我已经编写了代码但它提示错误 CREATE FUNCTI
pg_dump 与 pg_dumpall？使用哪一个来进行数据库备份？

I tried pg dump然后在另一台机器上我尝试导入 sql 并填充数据库我看到 CREATE TABLE ERROR role prod does not exist CREATE TABLE ERROR role prod do
postgresql 登录到另一个表时发生冲突

我正在使用 PostgreSQL 9 5 并尝试使用批量插入每天插入数百万行 INSERT INTO tours as cst adults country id price VALUES 3 129 80 2 119 120 on con
有哪些可用选项可以识别和删除 Postgres 中的无效对象（例如：损坏的索引）

有哪些可用选项可以识别和删除 Postgres 中的无效对象如果您指的是检测无效创建不良索引显然 Postgres 在尝试创建索引时可能会失败然后查询规划器将不会使用它们尽管它们存在于您的系统中此查询将检测失败索引 h
Postgres JSONB：数组数组的 where 子句

postgres 中有 v 9 5 如果有的话 create table json test id varchar NOT NULL data jsonb NOT NULL PRIMARY KEY id 其中 data 是 json 并且包
使用连接池后如何处理过多的并发连接？

Scenario 假设您有一个拥有大量流量的网站或应用程序即使使用数据库连接池性能也会受到真正的打击站点应用程序甚至可能崩溃因为并发连接太多 Question 人们有什么选择来处理这个问题我的想法我在想有这个问题的人可以创建多
PostgreSQL - 致命：用户“myuser”身份验证失败[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我刚刚在我的 Ubuntu Box 中安装了 PostGreSQL 我想做的第一件事就是创建一个数据库我读了文档 http www postgres
Django 模型：默认日期时间未转换为 SQL CURRENT_TIMESTAMP

我正在使用 Django 模型创建 PostgreSQL DB 我有一个 DateTimeField 我想将当前时间戳设置为默认值我知道有多个消息来源建议如何做到这一点但是当我在 Django 之外检查数据库时默认时间戳不会显示我

随机推荐

如何使用Reactor框架2.x执行多线程map/reduce？

我之前问过这个问题 https stackoverflow com questions 22844717 how do you execute map reduce operations with the reactor framework
如何在一个 ggplot 中绘制 S&P 500 和苏富比时间序列？

我正在使用 quantmod 包下载 S P 500 时间序列和苏富比股票 library zoo library tseries library quantmod library ggplot2 env1 new env getSymbo
VBox 共享文件夹中符号链接的 Windows 问题

我在 Virtual Box 上有一个 Ubuntu 17 虚拟机我的主机操作系统是 windows 8 1 我在主机和来宾操作系统之间创建了一个共享文件夹现在因为windows不支持symlinks https en wikiped
优化 SQL 查询

我目前正在开发一个内容管理系统我想听听您对以下方面的想法我有一张桌子 page 我们假设它看起来像这样 ID Title Content 1 Test This is a test 除此之外我还有一个page option表这样我可
如何使用 Reflection.Emit 创建多维数组

我想使用 Reflection Emit 创建一个多维数组并设置它的元素就像下面的C 代码 int nums new int 2 2 nums 1 1 2 并转成IL代码 IL 0000 nop IL 0001 ldc i4 2 IL 0
在 Android 设备上使用 CCV

有人尝试过在 Android 上使用 libccv 吗我在网上找不到任何示例代码想知道如何使用 CCV 在 Android 应用程序中实现跟踪器这包括执行以下操作处理来自 Android 设备相机的图像在设备屏幕上显示经过CCV处
WPF TextBlock 在多行上显示字符串

我有一个字符串 Item A r nItem B r nItem C 如何将此字符串绑定到 TextBlock 以便它显示为 Item A Item B Item C Thanks 只需使TextBlock大到足以显示三行 TextBloc
C#-R 接口

我需要将 R 连接到某些 C 应用程序我安装了rscproxy 1 3 and R Scilab DCOM3 0 1B5添加了 COM 引用STATCONNECTORCLNTLib StatConnectorCommonLib and S
jQuery：如何触发悬停？

如何触发第二个悬停功能 adm1n toolbar hover function function adm1n toolbar content select change function e adm1n toolbar trigger m
使用这个关键字来继承？ [复制]

这个问题在这里已经有答案了可能的重复 scala 自我类型和特征子类有什么区别 https stackoverflow com questions 1990948 what is the difference between scala
无法从日期列进行测量

我正在尝试计算 completionDate 列中的日期与今天之间的天数表名称为事件 2 我有一个名为事件的模拟器表它正在工作代码 DaysClosed DATEDIFF Incidents 2 completionDate D
在 matplotlib 中绘制 pandas 日期

我有一个包含日期的固定宽度数据文件但是当我尝试绘制数据时日期未在 x 轴上正确显示我的文件看起来像 2014 07 10 11 49 14 377102 45 2014 07 10 11 50 14 449150 45 2014 07
当复选框控件的 Visible 变为 true 时 comctl32.dll 使用过多内存

我在 C NET 应用程序运行时向 Windows 窗体添加控件这些控件中的每一个都与特定信号交互并使用该信号中的一些数据信号名称描述来源单位值等这些控件上有一个复选框当其中一个信号的复选框的 Visible 属性变为 t
使用 ggplot2 中的 geom_area() 为雷达图中的区域着色

在继续阅读之前我建议您下载并查看原始代码这个问题发布在这个论坛 https stackoverflow com questions 50353923 generate radar charts with ggplot2 noredirec
是否可以明确识别 DML 命令是否是从存储过程发出的？

我继承了一个 SQL Server 2008 数据库调用应用程序可以通过存储过程访问该数据库数据库中的每个表都有一个影子审计表其中记录了插入更新删除操作填充审计表的性能测试表明使用插入审计记录OUTPUT子句比使用触发器快 2
如何在 Xamarin.Forms 中根据 ListView 滚动方向显示和隐藏 StackLayout？

我有一个屏幕ListView显示评论集合另外我有一个StackLayout与末端重叠ListView 其中有一个Entry and a Button添加新评论我想隐藏显示这个StackLayout取决于ListView滚动方向如果
ftp_put()：无法打开该文件：没有这样的文件或目录

我在互联网上搜索了很多但没有找到解决方案我需要通过 PHP 将文件上传到 FTP 服务器我测试了各种 PHP 脚本如下所示但我总是收到相同的问题我尝试使用绝对路径正常路径和其他路径连接的警告 ftp put 无法打开该文件
如何在 Flutter 中使用 Razorpay Orders API？

我正在我的 flutter 应用程序中实现支付网关所以 Razorpay 推荐我使用 Orders API 但我没有任何方法来实现 Orders API 我参考了以下文档它包含 java PHP 等的示例但没有找到 Flutter D
错误：pnpm monorepo 工作空间内的子模块 git init 后，“请求 url * 超出 Vite 服务允许列表”

我已经设置了一个 pnpm 工作区其中包含许多我添加为 git 子模块的项目之前工作的 Nuxt 项目突然开始出现错误The request url is outside of Vite serving allow list对于多个文件
在postgresql中，分区还是多个数据库更有效？

有一个应用程序许多公司在其中发布信息每个公司的数据都是独立的没有数据重叠从性能角度来看最好是在每个表的每一行上保留公司 ID 并让每个索引都使用它根据公司ID对每个表进行分区分区并创建一个用户来访问每个公司以确保安全创建多

在postgresql中，分区还是多个数据库更有效？

在postgresql中，分区还是多个数据库更有效？ 的相关文章

随机推荐

热门标签

在postgresql中，分区还是多个数据库更有效？的相关文章