如何找到总和第 k 大的对？

2024-02-13

给定两个已排序的数字数组，我们希望找到具有第 k 大可能总和的对。（一对是第一个数组中的一个元素和第二个数组中的一个元素）。例如，对于数组

[2,3,5,8,13]
[4,8,12,16]

总和最大的对是

13 + 16 = 29
13 + 12 = 25
8 + 16 = 24
13 + 8 = 21
8 + 12 = 20

因此，总和第四大的对是 (13, 8)。如何找到具有第 k 大可能和的对？

另外，最快的算法是什么？数组已排序且大小为 M 和 N。

我已经知道O(Klogk)解决方案，使用给定的 Max-Heaphere https://stackoverflow.com/questions/5212037/find-the-kth-largest-sum-in-two-arrays .

也是最爱之一Google面试问题，他们要求O(k) 解 .

我还在某处读到存在一个O(k)解决方案，我无法弄清楚。

有人可以用伪代码解释正确的解决方案吗？

附：请不要发帖this http://www.ocf.berkeley.edu/~wwu/cgi-bin/yabb/YaBB.cgi?board=riddles_cs;action=display;num=1132204952;start=25#47链接作为答案/评论。它不包含答案。

我从一个简单但不完全线性时间的算法开始。我们选择一些值array1[0]+array2[0] and array1[N-1]+array2[N-1]。然后我们确定有多少对总和大于该值以及有多少对总和小于该值。这可以通过使用两个指针迭代数组来完成：当总和太大时，指向第一个数组的指针递增；当总和太小时，指向第二个数组的指针递减。对不同的值重复此过程并使用二分搜索（或单边二分搜索），我们可以在 O(N log R) 时间内找到第 K 个最大和，其中 N 是最大数组的大小，R 是之间可能值的数量array1[N-1]+array2[N-1] and array1[0]+array2[0]。仅当数组元素是由小常数限制的整数时，该算法才具有线性时间复杂度。

Previous algorithm may be improved if we stop binary search as soon as number of pair sums in binary search range decreases from O(N²) to O(N). Then we fill auxiliary array with these pair sums (this may be done with slightly modified two-pointers algorithm). And then we use quickselect algorithm to find Kth largest sum in this auxiliary array. All this does not improve worst-case complexity because we still need O(log R) binary search steps. What if we keep the quickselect part of this algorithm but (to get proper value range) we use something better than binary search?

我们可以使用以下技巧来估计值范围：从每个数组中获取每隔一个元素，并尝试找到具有排名的对和k/4对于这些半数组（递归地使用相同的算法）。显然，这应该给出所需值范围的一些近似值。事实上，这个技巧的稍微改进的变体给出了仅包含 O(N) 元素的范围。这在以下论文中得到证明：“X + Y 中的选择以及已排序行和列的矩阵”作者：A. Mirzaian 和 E. Arjomandi http://www.cse.yorku.ca/~andy/pubs/X%2BY.pdf。本文包含算法的详细解释、证明、复杂性分析以及算法所有部分的伪代码（除了快速选择 http://en.wikipedia.org/wiki/Quickselect。如果需要线性最坏情况复杂性，可以通过以下方式增强快速选择中位数的中位数 http://en.wikipedia.org/wiki/Median_of_medians算法。

该算法的复杂度为O(N)。如果其中一个数组比其他数组短 (M

如果 k N(N-1)，我们最好解决相反的问题：第 k 个最小和。

我将简单的 C++11 实现上传到ideone http://ideone.com/qe1YHA。代码未优化且未经过彻底测试。我试图使其尽可能接近链接论文中的伪代码。该实现使用std::nth_element，仅允许平均线性复杂度（不是最坏情况）。

在线性时间内求第 K 个和的完全不同的方法是基于优先级队列 (PQ)。一种变体是将最大的对插入到 PQ，然后重复删除 PQ 的顶部并插入最多两对（一对在一个数组中具有递减索引，另一对在另一个数组中具有递减索引）。并采取一些措施来防止插入重复对。其他变体是插入包含第一个数组的最大元素的所有可能对，然后重复删除 PQ 的顶部，并在第一个数组中插入具有递减索引的对，并在第二个数组中插入相同索引的对。在这种情况下，无需担心重复项。

OP 提到 O(K log K) 解决方案，其中 PQ 被实现为最大堆。但在某些情况下（当数组元素是均匀分布且范围有限的整数，并且仅在平均情况下而不是最坏情况下需要线性复杂度时），我们可以使用 O(1) 时间优先级队列，例如，如本文所述：“事件驱动分子动力学模拟的复杂性 O(1) 优先级队列”作者：Gerald Paul http://arxiv.org/pdf/physics/0606226。这允许 O(K) 预期时间复杂度。

这种方法的优点是可以按排序顺序提供前 K 个元素。缺点是数组元素类型的选择有限，算法更复杂且更慢，渐近复杂度更差：O(K) > O(N)。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何找到总和第 k 大的对？的相关文章

单位安全平方根

我只是想知道如何以与 F 正确交互的方式编写用户定义的平方根函数 sqrt 单位制 http blogs msdn com andrewkennedy archive 2008 09 04 units of measure in f par
为什么 System.nanoTime() 比 System.currentTimeMillis() 慢（性能）？

今天我做了一个快速基准测试来测试速度性能System nanoTime and System currentTimeMillis long startTime System nanoTime for int i 0 i lt 1000000
生成所有多集大小为 n 的分区的算法

我一直在试图找出一种方法来生成多重集的所有不同的大小为 n 的分区但到目前为止却空手而归首先让我展示一下我想要实现的目标假设我们有一个输入向量uint32 t std vector
“此应用程序已请求运行时以异常方式终止它”的原因是什么？

Visual C 运行时抛出一个常见错误此应用程序已请求运行时以异常方式终止它请联系应用程序的支持团队以获取更多信息该错误消息实际上是什么意思mean 让我用一个比喻来准确地解释我的问题如果我看到一条消息异常访问冲突 0xc00
这个按位运算如何检查 2 的幂？

我正在看一些应该很简单的代码但我的数学在这里严重失败下面是一个使用以下条件检查数字是否为 2 的幂的条件 if num 1 num num 1 make num pow of 2 我的问题是如何在 num 和 num 1 之间使用按位
在网络上编写数学方程的最佳方法是什么？

Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动我正在开发一个与数学相关的网页并正在寻找一种将数学方程轻松写入网页的解决方案目前我可以使用
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
在常数空间中创建 1..N 的随机排列

我正在寻找枚举固定空间中数字 1 N 的随机排列这意味着我无法将所有数字存储在列表中原因是 N 可能非常大超过可用内存我仍然希望能够一次遍历这样一个数字的排列只访问每个数字一次我知道对于某些 N 可以这样做许多随机数生成器随机
iPhone 3GS 上的 ARM 与 Thumb 性能比较，非浮点代码

我想知道是否有人有关于 iPhone 3GS 上 ARM 与 Thumb 代码性能的硬性数据特别是对于非浮点 VFP 或 NEON 代码我知道 Thumb 模式下的浮点性能问题更大的 ARM 指令的额外代码大小是否会在某个时刻成为性能
直接选择排序与交换选择排序

有什么区别直接选择排序 vs 交换选择排序今天我陷入了一场争论我的教授在他的讲义中使用了这两个术语维基百科和任何教科书或网站都会为您提供的选择排序就是他所说的交换选择排序我以前从未听说过交换选择排序这个术语仅选择排序并且
两个程序对象运行时比较的方法

我正在进行一种特定类型的代码测试该测试相当麻烦并且可以自动化但我不确定最佳实践在描述问题之前我想澄清一下我正在寻找合适的术语和概念以便我可以阅读有关如何实现它的更多信息当然欢迎就最佳实践提出建议但我的目标很具体这种方法叫
GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？

只是对标准感到好奇sqrt 来自 GCC 上的 math h 我自己编码的sqrt 使用牛顿拉夫森来做到这一点是的我知道 fsqrt 但CPU是如何做到这一点的呢我无法调试硬件现代 CPU 中的典型 div sqrt 硬件使用 2
数学组合的完美最小哈希

首先定义两个整数N and K where N gt K 两者都在编译时已知例如 N 8 and K 3 接下来定义一组整数 0 N or 1 N 如果这使答案更简单并调用它S 例如 0 1 2 3 4 5 6 7 的子集数量S wi
Android 性能：SharedPreferences 的成本

当我的应用程序启动时我使用分片首选项中的值填充容器类这个想法是处理 SharedPreferences 和 PreferenceManager 一次因为我猜它们很重这是一个示例 SharedPreferences prefs Pre
.pdbs 会减慢发布应用程序的速度吗？

如果 dll 中包含 pdb 程序调试文件则行号将出现在引发的任何异常的堆栈跟踪中这会影响应用程序的性能吗这个问题与发布与调试即优化无关这是关于拥有 pdb 文件的性能影响每次抛出异常时都会读取 pdb 文件吗加载程序集时
绘制多边形

我正在使用 Google Maps API V3 根据路径绘制多边形该路径是随机未排序坐标点 LatLng 的数组这会产生以下形状 Polylines intersect Problem 由于多边形的形状取决于路径中点的顺序因此如何对
IIS7 上的 ASP.NET 应用程序 - iisreset 后启动速度非常慢

我有一个在 Windows 2008 上的 IIS7 下运行的 ASP NET 3 5 网站当我重新启动 IIS iisreset 然后点击一个页面时初始启动非常慢我在 Process Explorer 中看到以下活动 w3wp ex
Haskell：IORef 的性能

我一直在尝试在 Haskell 中编码一个需要使用大量可变引用的算法但与纯粹的惰性代码相比它也许并不奇怪非常慢考虑一个非常简单的例子 module Main where import Data IORef import Contr
使用 APDU 命令的有效 NFC 读取比特率是多少？

我目前正在使用 Android IsoDep trancieve 函数发送和接收累计 1628 字节的数据该函数分布在 35 个 APDU 命令选择应用程序身份验证读取中字节计数包括返回的 MAC 校验和以及由 transcie
在 O(n) 时间内排序？

我被这个问题困扰了 2周知道如何处理它吗令 L 为 n 个不同整数的列表假设 L 的 x 的元素在 1 750 范围内设计线性排序算法对 L 的元素进行排序我已经尝试过插入排序但我不确定我的方法是否正确 Construct an

随机推荐

adb 在 OSX Lion 上，但无法连接到 Galaxy 10.1 选项卡，但在 Linux 中工作正常

我正在尝试连接到运行 Android 3 2 的 Galaxy Tab 10 1 我见过几个类似的问题但它们似乎都与设备设置不正确有关我已将其设置为允许未知来源并且还启用了 Usb 调试我可以在 Linux 和 Windows 机
Cocos2D 2.0 OpenGL 错误？

在我的应用程序中它在 Cocos2D 1 1 版本中运行良好当我升级到 2 0rc0a 时我现在只看到黑屏并且不停地收到以下 4 个错误直到我退出应用程序 OpenGL error 0x0506 in CCSprite draw
Visual Studio Cordova 部署到远程 iOS 10 设备失败

我已按照本指南成功设置了从 Windows 计算机上的 Visual Studio 到 Mac 上的 Xcode 7 x 的 iOS 9 x 设备的远程部署 https taco visualstudio com en us docs io
Angular 与 socket.io 和后端 php

我正在开发实时应用程序聊天并使用 Angular 我的后端是 php codeigniter restapi 对于 mongodb 中的数据库我在某处听说套接字 io http www socket io是套接字的最佳库实时使用我
NodeJS 中的异步 post 函数

我正在尝试查询 mssql 数据库以获取用户的密码即发送 post 请求然后将其显示在控制台中但我做出的承诺并没有按照我想要的方式工作并且密码没有加载到变量中这是我的代码 app post test function let us
Docker：以非root用户身份执行命令

早些时候我曾经使用以下命令运行 sudo docker run pid host dit restart unless stopped privileged v home home net host ubuntu latest bash c
选择涵盖最多单词的字母表？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案给定一个单词列表和一个最多包含 P 个字母的字母表我们如何选择覆盖最多单词的最佳字母表例如给定单词 aaaaaa bb bb 且
gcc 汇编输出标签代表什么？

我写了一个简单的C程序test c include
由于具有项目依赖项的项目，Helm 安装失败

我根据下面的示例创建了 webfrontend 和 mywebapi https learn microsoft com en us azure dev spaces get started netcore visualstudio htt
“一个声明中有多种类型”，但没有；丢失的

我尝试使用 Code Blocks gcc 编译器编译我的程序我收到一个错误这是它抱怨的源文件 ifndef BOT H define BOT H include player h include timer h class BOTS
excel vba从selection.address获取行、单元格值

For i 1 To 20 select the cell in question Cells Find Select get the cell address CellAddr Selection Address False False
使用 jdeps + jlink + jpackage 构建 Windows 自包含应用程序后出现 EXCEPTION_ACCESS_VIOLATION

我正在尝试构建一个捆绑包独立的应用程序 windows using jdeps jlink jpackage 在Mac上使用相同的过程我设法创建了以下JPackageScriptFX https github com dlemmer
iText - PdfPTable 不显示西里尔文（俄语）符号

我为我的英语感到抱歉我正在尝试使用 PdfPTable iText 库创建表表格显示空列在此处输入图像描述 1 public class CreatePDF File file BaseFont bf Font f title Fo
d3 - mouseover 和 mouseout 事件无法正常工作

我有一系列使用 d3 创建的线我写了一些mouseover and mouseout事件事件 When I mouseover该事件通过增加y1线的值 But on mouseout在我编写的代码设置回原来的位置时该事件无法正常工作y1
如何读取 _pre_put_hook 中的旧属性值

我正在尝试实现 ndb 模型审核以便对属性的所有更改都存储在每个模型实例中这是我选择实现的 pre put hook 的代码 def pre put hook self save a history record for updates
为什么我在 C# 中从串口得到部分奇怪的值

我正在开发一个处理秤数据的程序秤通过 USB 串行端口连接我正在使用这个问题中的代码如何通过串口RS 232或USB转换器将体重秤的重量显示到文本框中 https stackoverflow com questions 1061428
SignalR 和 WebAPI，为什么要结合使用两者？

我正在尝试从头开始创建一个新的应用程序我使用过 SignalR 和 WebAPI 我相信我知道很多差异但是 SignalR 不是更快吗因为它使用了 websocket WebAPI 对我来说很有意义因为外部框架能够重用对于我不一定
计算 R 中 tidygraph 对象列表中相同列的频率？

我的列表中包含一些 tidygraph 对象我正在尝试计算相同的列在 tidygraph 节点数据内的频率例如如果我创建一些节点和边缘数据将它们转换为 tidygraph 对象并将它们放入列表中如下所示 library ti
尝试将 javafx WebView 渲染到离屏缓冲区或 FBO

最终目标是能够以 30fps 或更高的速度记录 WebView 的输出也许可以通过为 javafx 设置 FBO 来实现然后我可以以我想要的任何帧速率拉出帧我查了一下在 ViewScene 中发现了 UploadingPainter
如何找到总和第 k 大的对？

给定两个已排序的数字数组我们希望找到具有第 k 大可能总和的对一对是第一个数组中的一个元素和第二个数组中的一个元素例如对于数组 2 3 5 8 13 4 8 12 16 总和最大的对是 13 16 29 13 12 25 8 16

如何找到总和第 k 大的对？

如何找到总和第 k 大的对？ 的相关文章

随机推荐

热门标签

如何找到总和第 k 大的对？的相关文章