Oracle分页策略

2023-12-11

我想从两个时间戳之间的表中获取数百万行，然后对其进行处理。触发单个查询并立即检索所有记录看起来是一个糟糕的策略，因为它可能超出我的 JVM 程序的内存容量。

我读过这篇文章：

http://oracle.readthedocs.io/en/latest/sql/indexes/top-n-pagination.html

因此，我计划以1000为批量进行分页，并提出了以下策略：比方说Start_Date = X and End_Date = Y

发起查询，

select * from table where CREATE_TIMESTAMP > X AND CREATE_TIMESTAMP < Y ORDER BY CREATE_TIMESTAMP FETCH NEXT 1000 ROWS ONLY.

如果我只得到不到 1000 行，那就意味着所有记录都已完成。如果我正好得到 1000 行，那就意味着可能还有更多记录。
set X = CREATE_TIMESTAMP of 1000th record

select * from table where CREATE_TIMESTAMP > X AND CREATE_TIMESTAMP < Y ORDER BY CREATE_TIMESTAMP FETCH NEXT 1000 ROWS ONLY

重复此操作，直到我获得的记录少于 1000 条。

有人认为这种方法有任何问题吗？

分页模式是为了网站呈现而发明的（与滚动导航相反），并且在那里效果最好。简而言之，实时用户实际上无法一次查看数千/数百万条记录，因此信息被分为短页（50~200 条记录），其中每页通常向数据库发送一个查询。用户通常只点击几个页面，但不会浏览全部页面，另外用户需要一点时间来浏览页面，因此查询不是逐一发送到数据库的，而是以很长的间隔发送。检索一大块数据的时间比检索所有数百万条记录要短得多，因此用户很高兴，因为他不必等待后续页面很长时间，并且整体系统负载更小。

但从这个问题看来，你的应用程序的性质是面向批量处理而不是到网络演示。应用程序必须获取所有记录并对每条记录执行一些操作/转换（计算）。在这种情况下，使用完全不同的设计模式（流/管道处理、步骤顺序、并行步骤/操作等），如果你这样做，分页将不起作用你会毁掉你的系统性能。

让我们看一下简单实用的示例，而不是花哨的理论，它将向您展示我们在这里讨论的速度差异

假设有一张桌子PAGINATION大约有 700 万条记录：

create table pagination as
select sysdate - 200 * dbms_random.value As my_date, t.*
from (
    select o.* from all_objects o 
    cross join (select * from dual connect by level <= 100)
    fetch first 10000000 rows only
) t;

select count(*) from pagination;

  COUNT(*)
----------
   7369600

假设有一个索引创建于MY_DATE列和索引统计信息是新鲜的：

create index PAGINATION_IX on pagination( my_date );

BEGIN dbms_stats.gather_table_stats( 'TEST', 'PAGINATION', method_opt => 'FOR ALL COLUMNS' ); END;
/

假设我们将在以下日期之间处理表中大约 10% 的记录：

select count(*) from pagination
where my_date between date '2017-10-01' and '2017-10-21';

  COUNT(*)
----------
    736341

最后，为了简单起见，我们的“处理”将包括对字段之一的长度进行简单求和。
这是一个简单的分页实现：

public class Pagination {

    public static class RecordPojo {
        Date myDate;
        String objectName;

        public Date getMyDate() {
            return myDate;
        }
        public RecordPojo setMyDate(Date myDate) {
            this.myDate = myDate;
            return this;
        }
        public String getObjectName() {
            return objectName;
        }
        public RecordPojo setObjectName(String objectName) {
            this.objectName = objectName;
            return this;
        }
    };

    static class MyPaginator{

        private Connection conn;
        private int pageSize;
        private int currentPage = 0;

        public MyPaginator( Connection conn, int pageSize ) {
            this.conn = conn;
            this.pageSize = pageSize;
        }

        static final String QUERY = ""
                + "SELECT my_date, object_name FROM pagination "
                + "WHERE my_date between date '2017-10-01' and '2017-10-21' "
                + "ORDER BY my_date "
                + "OFFSET ? ROWS FETCH NEXT ? ROWS ONLY";

        List<RecordPojo> getNextPage() {
            List<RecordPojo> list = new ArrayList<>();
            ResultSet rs = null;
            try( PreparedStatement ps = conn.prepareStatement(QUERY);) {
                ps.setInt(1, pageSize * currentPage++ );
                ps.setInt(2,  pageSize);
                rs = ps.executeQuery();

                while( rs.next()) {
                    list.add( new RecordPojo().setMyDate(rs.getDate(1)).setObjectName(rs.getString(2)));
                }

            } catch (SQLException e) {
                e.printStackTrace();
            }finally {
                try{rs.close();}catch(Exception e) {}
            }
            return list;
        }

        public int getCurrentPage() {
            return currentPage;
        }
    }


    public static void main(String ...x) throws SQLException {
        OracleDataSource ds = new OracleDataSource();
        ds.setURL("jdbc:oracle:thin:test/test@//localhost:1521/orcl");
        long startTime = System.currentTimeMillis();
        long value = 0;
        int pageSize = 1000;

        try( Connection conn = ds.getConnection();){
            MyPaginator p = new MyPaginator(conn, pageSize);
            List<RecordPojo> list;
            while( ( list = p.getNextPage()).size() > 0 ) {
                value += list.stream().map( y -> y.getObjectName().length()).mapToLong(Integer::longValue).sum();
                System.out.println("Page: " + p.getCurrentPage());
            }
            System.out.format("==================\nValue = %d, Pages = %d,  time = %d seconds", value, p.getCurrentPage(), (System.currentTimeMillis() - startTime)/1000);
        }
    }
}

结果是：

Value = 18312338, Pages = 738,  time = 2216 seconds

现在让我们测试一个非常简单的基于流的解决方案 - 只需仅获取一条记录，处理它，丢弃它（释放内存），然后获取下一条记录。

public class NoPagination {

    static final String QUERY = ""
            + "SELECT my_date, object_name FROM pagination "
            + "WHERE my_date between date '2017-10-01' and '2017-10-21' "
            + "ORDER BY my_date ";

    public static void main(String[] args) throws SQLException {
        OracleDataSource ds = new OracleDataSource();
        ds.setURL("jdbc:oracle:thin:test/test@//localhost:1521/orcl");
        long startTime = System.currentTimeMillis();
        long count = 0;

        ResultSet rs = null;
        PreparedStatement ps = null;
        try( Connection conn = ds.getConnection();){
            ps = conn.prepareStatement(QUERY);
            rs = ps.executeQuery();
            while( rs.next()) {
                // processing
                RecordPojo r = new RecordPojo().setMyDate(rs.getDate(1)).setObjectName(rs.getString(2)); 
                count+=r.getObjectName().length();
            }
            System.out.format("==================\nValue = %d, time = %d seconds", count, (System.currentTimeMillis() - startTime)/1000);
        }finally {
            try { rs.close();}catch(Exception e) {}
            try { ps.close();}catch(Exception e) {}
        }
    }

结果是：

Value = 18312328, time = 11 seconds

是 - 2216 秒 / 11 秒 = 快 201 倍 -20 100% 快！！！
难以置信？你可以自己测试一下。
这个例子说明了选择正确的解决方案（正确的设计模式）来解决问题是多么重要。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Oracle分页策略的相关文章

使用“AND”表达式构建动态 SQL，而不混淆嵌套条件？

总的来说我对 php 和编码相当陌生我有一系列条件需要测试它们是否已设置它们是 option1 option2 option3 if isset option1 if isset option2 if isset option3 qu
Oracle 存储过程的全局临时表的替代方法

我已阅读并理解 Oracle 仅使用全局临时表这与允许 temp 表的 MS SQL 不同我遇到的情况需要我创建数百个全局临时表以完成我正在进行的从 MS SQL 到 Oracle 的数据库转换我想知道除了创建必须在数据库中维护的所
Google BigQuery，使用“unnest”函数时丢失了空行

StandardSQL WITH tableA AS SELECT T001 T002 T003 AS T id 1 5 AS L id UNION ALL SELECT T008 T009 AS T id NULL AS L id SEL
在实体框架 6 中使用 SqlQuery>

我正在尝试在 EF 6 中执行 SQL 查询 select查询返回两个字符串列例如select a b 并且可以有任意数量的行我想将结果映射到字典但我无法摆脱以下错误错误 1 无法将类型 System Data Entity Inf
无法访问 Big Query 中类型为 ARRAY> 的字段

我正在尝试在 BigQuery 上使用标准 SQL 方言即不是旧版 SQL 运行查询我的查询是 SELECT date hits referer FROM refresh ga sessions xxxxxx LIMIT 1000 但不
没有 Gem 的 Rails 分页

我的任务是在不使用 gem 的情况下为 Rails 项目创建前 10 个后 10 个最新和最旧链接在控制器中我可以显示表中第一组最新的 10 项 before action set page only index def
如何使用 Retrofit 2 和 RxJava 处理分页

我知道如何处理 Retrofit 响应但在使用 rx java 处理来自 REST API 的分页时遇到问题背景我使用的其余 api 为我提供了以下响应并在标题中提供了下一页的链接 HTTP 200 OK Allow GET HEA
MySQL Tinybit(1) 通过视图的列

我有一个连接 2 个表的视图其中一个表具有表示布尔值的tinyint 1 类型的列该表在连接时并不总是有条目因此当行丢失时视图需要采用 0 false 值我希望视图公开 TINYINT 1 类型且 NOT NULL 类型的列因为它
将自动递增值添加到只有一列的表中

我需要创建一个基本上仅保留索引列表的表因此我创建了一个只有一个名为 id 的自动递增列的表但是我似乎无法隐式地将自动递增值添加到该表中我知道通常当您在表中有这样一列不仅仅是此列时您可以执行以下操作插入表 col1 col2
在 SQL 中如何获得整数的最大值？

我试图从 MySQL 数据库中找出整数有符号或无符号的最大值有没有办法从数据库本身提取这些信息是否有我可以使用的内置常量或函数标准 SQL 或 MySQL 特定的 At http dev mysql com doc refman
IN 运算符对 SQL 查询性能的影响有多大？

我的 SQL 查询需要 9 个小时才能执行见下文 Select Field1 Field2 From A Where Field3 IN 45 unique values here 当我将此查询拆分为 3 个完全相同的查询仅每个 IN
如何选择列值不不同的每一行

我需要运行一个 select 语句返回列值不不同的所有行例如 EmailAddress 例如如果表格如下所示 CustomerName EmailAddress Aaron email protected cdn cgi l emai
在 Oracle 中使用数据透视表的建议

我需要一份报告我应该使用数据透视表报告将按类别分组使用 case when 语句不好因为有很多类别您可以将 Northwind 数据库视为示例所有类别将显示为列和报告将显示客户在类别中的偏好我不知道另一个解决方案并在互联网上
SQLite 使用循环重新编号 ID

您好我有一个包含许多插入行的表我需要按 id 对所有行重新编号并排序我找到了这段代码但它对我不起作用 SET i 100 UPDATE main Categories SET ID i i 1 WHERE Name White AL
如何在 Postgresql 中将 GIST 或 GIN 索引与 hstore 列一起使用？

我正在使用 postgresql 9 3 的 hstore 我正在尝试对 hstore 列使用索引就像文档所述 http www postgresql org docs 9 3 static hstore html 我的问题是索引似乎没有被
无法从 Vue 3.2 中的 V-Data-Table 中删除页脚/分页

所以我正在使用 VueJs 3 2 Vite 3 2 4 Vuetify 3 2 2 我知道应该如何声明 DataTable 上的选项以便删除页脚和分页如下所示
Postgres 按查询分组

我正在尝试在 postgres 的查询中使用 group by 我无法让它按照我想要的方式工作以便根据需要对结果进行分组这是另一个堆栈问题的扩展我刚刚回答过的递归查询 https stackoverflow com questions
如何重置 SQL Server 中表的 IDENTITY 列？ [复制]

这个问题在这里已经有答案了我怎样才能重置我的IDENTITY我已经填充的表中的列我尝试过类似的方法但它不起作用 WITH TBL AS SELECT ROW NUMBER OVER ORDER BY profile id AS RN
在 Oracle 中如何将多行组合成逗号分隔的列表？ [复制]

这个问题在这里已经有答案了我有一个简单的查询 select from countries 结果如下 country name Albania Andorra Antigua 我想在一行中返回结果如下所示 Albania Andorra
总结同一个 SQL 表上的两个条件

给定一个 SQL 表 Transactions ID INT COMPANY ID INT STATUS INT where STATUS IN 0 1 表示免费交易并且STATUS IN 2 3 表示可计费交易简单的我希望 ANSI

随机推荐

如何使用另一个字符串作为模板从字符串中提取数据？

我正在寻找一种有效的方法来使用另一个字符串作为模板从字符串中一般提取数据伪代码 var mystring NET 1 1 0 ipv4 192 168 1 7 255 255 255 0 192 168 1 1 var mytemplat
C - 通过已知大小的引用多维数组传递

主要内容 char myData 500 9 dynamic rows char tableData 500 NULL dynamic rows int r newCallBack db myData tableData r 并通过以下方式
[0-9]+)/$']' aria-label='与“编辑”相反，没有找到任何参数。尝试了 1 个模式：['articles/edit/(?P[0-9]+)/$']'> 与“编辑”相反，没有找到任何参数。尝试了 1 个模式：['articles/edit/(?P[0-9]+)/$']

我是 Django 的初学者现在正在开发一个博客应用程序在文章编辑部分我被卡住了我不知道为什么它显示这个错误搜索了很多却找不到答案 NoReverseMatch at articles edit 2 Reverse for edit
Matlab：我在 3D 图中有两个点，我想用一条线将它们连接起来

我有一个 3D 图和两个点坐标 A 0 0 0 和 B 13 11 19 我只想绘制一条连接这两点的可见线我尝试了plot3 0 0 0 13 11 19 和其他东西但我尝试的一切都惨败了就是这样 Your two points P1
JQuery UI DatePicker 使用 2 个日期字段尝试获取日期差异

我有 2 个 JQuery 日期字段 Arrival 离开到达日期不能是今天的日期我在 javascript 中使用 minDate 1 进行了排序出发日期必须至少早于抵达日期 2 天我认为 minDate 3 可以工作但那是查询
如何从文件中读取一行？

我必须读取一个 txt 文件其行格式如下 1 G 2 F 3 2 G 2 F 3 3 F 4 G 5 4 F 4 G 5 5 F 6 c w 6 p f G 7 7 G 7 G 7 w c w c w 每行都会向一个结构体提供其数据其中
带有粘合字符串数组的内爆数组

我有一个尴尬的需求但我需要在结果爆炸之前将一个数组与另一个数组交错我想我更好的选择是少说多举例数组一号 0 gt John has a 1 gt and a 2 gt 数组二号 0 gt Slingshot 1 gt Potato 我
多线程或多进程 Matplotlib plt.plot() 函数？

我目前正在 Python 中使用 matplotlib 使用 for 循环将数据绘制到图形中该循环循环遍历数据集并每次获取新的 x 和 y 然后使用plt plot x y 绘制 x 和 y 数据然后将绘图添加到当前图形我最终得到了多
在 F# 交互中获取调试器上下文

是否有可能以某种方式在 F 交互中获取调试器上下文例如如果我在 C 项目中遇到断点那么我想在 F 交互中使用局部变量就像在即时窗口中使用它们一样有什么办法可以做到吗或者我是否需要为此创建一个调试器可视化工具两者都不您需要为其
堆叠条形图标签 - D3

我正在尝试将数据标签添加到 d3 中的堆积条形图我希望数据标签位于栏的中间到目前为止我刚刚弄清楚如何在每个栏的顶部添加数据标签但实际上我希望这些标签位于每个条形的中间这是我的代码 var width 750 height 500
Oracle 11G EM 无法在 Windows 7 上运行

我已在 Windows 7 Ultimate 64 位计算机上安装了 Oracle 11G Release 2 但无法运行它们当我登录时它会生成错误已发生内部错误请检查日志文件以获取详细信息我观察到以下情况 Service ORA
scipy.optimize.curve_fit 无法拟合移位的倾斜高斯曲线

我正在尝试使用 scipy 拟合一条倾斜且移位的高斯曲线曲线拟合函数但我发现在某些条件下拟合效果很差经常给我接近或完全是一条直线下面的代码源自curve fit文档提供的代码是用于测试目的的任意数据集但很好地显示了问题 impor
使用 GAE 将对象保存到数据存储中。当取回它时，该对象有空成员

我正在尝试通过 GAE 学习 Go 我创建了 2 个处理程序一个用于将对象保存到数据存储另一个用于检索对象并将其输出到屏幕问题是当我从数据存储中检索 UserAccount 对象时该对象内的每个值都消失了任何帮助将不胜感激 Ou
如何使用 xslt 删除所有属性值中的空格？

我想使用 xslt 从 xml 中的所有属性中删除空格我用了strip space 但这会删除节点中的空格我的输入xml是
java 将字符串连接成 StringBuilder

我有一个遗留的Java文件它使用字符串连接来构建巨大的字符串对象这是一个严重的性能问题是否有一种方法可以执行以下操作 String test I am a very bad programmer to use concatenatio
PHP 到 Ruby 编译器 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案有谁知道最好是开源的 PHP 到 ruby 编译器即解析 PHP 代码并生成语义上等效的 ruby 代码的程序我自己没用过但你可能想看看Ph
如何使用 awk 显示列中的文件名？

我正在尝试执行一个添加到我的文件的命令当前输入文件的名称逗号数小于 5 的行索引跨行的逗号数 I got awk F if NF gt 5 printf Filename d Index d Number of commas d n
VSS到SVN的迁移；工具建议？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导有人对将代码库从 VSS
我可以在浏览器中查看 httpOnly cookie

我认为 httpOnly cookie 只能在 http 请求中读取但是当我打开 Firefox 开发工具时我可以看到 cookie 的值这是正常的吗是的这很正常 HttpOnly 的作用是阻止 cookie 被访问JavaSc
Oracle分页策略

我想从两个时间戳之间的表中获取数百万行然后对其进行处理触发单个查询并立即检索所有记录看起来是一个糟糕的策略因为它可能超出我的 JVM 程序的内存容量我读过这篇文章 http oracle readthedocs io en late

Oracle分页策略

Oracle分页策略 的相关文章

随机推荐

热门标签

Oracle分页策略的相关文章