简单的面试问题变得更难：给定数字 1..100，在给定 k 个缺失的情况下找到缺失的数字

2024-04-12

不久前我有过一次有趣的求职面试经历。这个问题一开始很简单：

Q1：我们有一个装有数字的袋子1, 2, 3, …, 100。每个数字只出现一次，所以有 100 个数字。现在从袋子里随机选出一个号码。找到丢失的号码。

当然，我以前听说过这个面试问题，所以我很快就回答了以下内容：

A1: 嗯，数字的总和1 + 2 + 3 + … + N is (N+1)(N/2) (see 维基百科：算术级数之和 http://en.wikipedia.org/wiki/Arithmetic_sum#Sum). For N = 100，总和是5050.

因此，如果袋子中存在所有数字，则总和将恰好为5050。由于缺少一个数字，因此总和将小于此数字，差值就是该数字。所以我们可以找到缺失的数字O(N)时间和O(1) space.

到这里我以为自己已经做得很好了，但是突然问题来了个意想不到的转折：

Q2：这是正确的，但现在如果TWO数字缺失？

我以前从未见过/听说过/考虑过这种变化，所以我惊慌失措，无法回答这个问题。面试官坚持要了解我的思考过程，所以我提到也许我们可以通过与预期产品进行比较来获得更多信息，或者可能在从第一遍收集了一些信息后进行第二遍等等，但我真的只是在拍摄在黑暗中而不是实际上有一条清晰的解决方案。

面试官确实试图鼓励我，说拥有第二个方程确实是解决问题的一种方法。此时我有点沮丧（因为事先不知道答案），并询问这是否是一种通用的（读：“有用的”）编程技术，或者它是否只是一个技巧/陷阱的答案。

面试官的回答令我惊讶：你可以推广该技术来找到 3 个缺失的数字。事实上，你可以概括它来找到k缺少数字。

Qk: 如果确实如此k包里的号码不见了，你如何有效地找到它？

这是几个月前的事了，我仍然不明白这个技术是什么。显然有一个Ω(N)时间下限，因为我们必须至少扫描一次所有数字，但面试官坚持认为TIME and SPACE求解技术的复杂性（减去O(N)时间输入扫描）定义在k not N.

所以这里的问题很简单：

你会如何解决Q2?
你会如何解决Q3?
你会如何解决Qk?

澄清

一般有N数字从 1..N，不仅仅是 1..100。
我并不是在寻找明显的基于集合的解决方案，例如用一个bit set http://en.wikipedia.org/wiki/Bit_array，通过指定位的值对每个数字的存在/不存在进行编码，因此使用O(N)额外空间中的位。我们无法承担与以下比例成比例的任何额外空间N.
我也不是在寻找明显的排序优先方法。这种方法和基于集合的方法在采访中值得一提（它们很容易实现，并且取决于N，非常实用）。我正在寻找圣杯解决方案（它可能会也可能不会实际实施，但仍然具有所需的渐近特性）。

所以同样，你当然必须扫描输入O(N)，但您只能捕获少量信息（定义为k not N），然后必须找到k不知何故缺少数字。

这里有一个总结迪米特里斯·安德烈欧 https://stackoverflow.com/questions/3492302/easy-interview-question-got-harder-given-numbers-1-100-find-the-missing-number/3492664#3492664 .

记住 i 次方的和，其中 i=1,2,..,k。这将问题简化为求解方程组

a₁ + a₂ + ... + a_k = b₁

a₁² + a₂² + ... + a_k² = b₂

...

a₁^k + a₂^k + ... + a_k^k = b_k

Using Newton's identities https://en.wikipedia.org/wiki/Newton_identities#Formulation_in_terms_of_symmetric_polynomials, knowing b_i allows to compute

c₁ = a₁ + a₂ + ... a_k

c₂ = a₁a₂ + a₁a₃ + ... + a_k-1a_k

...

c_k = a₁a₂ ... a_k

If you expand the polynomial (x-a₁)...(x-a_k) the coefficients will be exactly c₁, ..., c_k - see Viète's formulas https://en.wikipedia.org/wiki/Vi%C3%A8te's_formulas. Since every polynomial factors uniquely (ring of polynomials is an Euclidean domain https://en.wikipedia.org/wiki/Euclidean_domain), this means a_i are uniquely determined, up to permutation.

这就证明了记住幂就足以恢复数字。对于常数 k，这是一个很好的方法。

However, when k is varying, the direct approach of computing c₁,...,c_k is prohibitely expensive, since e.g. c_k is the product of all missing numbers, magnitude n!/(n-k)!. To overcome this, perform computations in Zq field https://en.wikipedia.org/wiki/Finite_field_arithmetic, where q is a prime such that n <= q < 2n - it exists by Bertrand's postulate https://en.wikipedia.org/wiki/Bertrand's_postulate. The proof doesn't need to be changed, since the formulas still hold, and factorization of polynomials is still unique. You also need an algorithm for factorization over finite fields, for example the one by Berlekamp https://en.wikipedia.org/wiki/Berlekamp's_algorithm or Cantor-Zassenhaus https://en.wikipedia.org/wiki/Cantor%E2%80%93Zassenhaus_algorithm.

常数 k 的高级伪代码：

计算给定数字的 i 次方
Subtract to get sums of i-th powers of unknown numbers. Call the sums b_i.
Use Newton's identities to compute coefficients from b_i; call them c_i. Basically, c₁ = b₁; c₂ = (c₁b₁ - b₂)/2; see Wikipedia for exact formulas
Factor the polynomial x^k-c₁x^k-1 + ... + c_k.
The roots of the polynomial are the needed numbers a₁, ..., a_k.

对于变化的 k，使用例如找到素数 n

EDIT: The previous version of this answer stated that instead of Z_q, where q is prime, it is possible to use a finite field of characteristic 2 (q=2^(log n)). This is not the case, since Newton's formulas require division by numbers up to k.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

简单的面试问题变得更难：给定数字 1..100，在给定 k 个缺失的情况下找到缺失的数字的相关文章

Python 中 a -= b 和 a = a - b 之间的区别

我最近申请了this https stackoverflow com questions 30379311 fast way to take average of every n rows in a npy array对矩阵的每 N 行进行
Hive：在查询中将 array 转换为 array

我有两张桌子 create table a 1 array
std::bind2nd 和 std::bind 与二维数组和结构数组

我知道 C 有 lambda 并且 std bind1st std bind2nd 和 std bind 已弃用然而从C 的基础开始我们可以更好地理解新特性所以我从这个非常简单的代码开始使用int 数组s 第一个例子与std
如何通过在切片上查找来从切片复制到数组

我正在编写一个库来处理二进制格式我有一个带有数组变量的结构我想保留它以用于文档目的我还需要从输入字节片中查找和判断一些伪代码 type foo struct boo 5 byte coo 3 byte func main input
Django Rest框架Json解析

我想解析传入的POSTdjangoviews py 文件中的数据发布数据 number 17386372 data banana apple grapes 这是我尝试读取上述传入数据的方法request views py class Fr
2D 矩阵上的 Numpy where()

我有一个像这样的矩阵 t np array 1 2 3 foo 2 3 4 bar 5 6 7 hello 8 9 1 bar 我想获取行包含字符串 bar 的索引在一维数组中 rows np where t bar 应该给我索引 0 3
验证项目是否在开始日期和结束日期内

我有一个java程序它将检查每个项目的开始日期和结束日期每个项目必须有自己特定的开始日期和结束日期范围如果新的开始日期和结束日期的范围落在旧的开始日期和结束日期内系统将提示错误消息例如 Company ABC Item Numbe
C 中的数组地址减法[重复]

这个问题在这里已经有答案了可能的重复 C 中的指针算术 https stackoverflow com questions 759663 pointer arithmetic in c Code int main int a 0 1 2
查找整数数组中的最大/最小出现次数

我刚刚编写完一个算法该算法可以在输入整数数组中查找出现次数最多最少的值我的想法是对数组进行排序所有出现的地方现在都按顺序排列并使用
将数组分配给数组

所以我正在尝试一些数组但我不明白为什么这不起作用 int numbers 5 1 2 3 int values 5 0 0 0 0 0 values numbers 出现以下错误 Error 1 error C2106 left oper
如何将一个数组中的所有项目复制到另一个数组中？

如何将数组的每个元素其中元素是对象复制到另一个数组中以便它们完全独立我不想更改一个数组中的元素来影响另一个数组这里的关键是数组中的条目是对象并且您不希望对一个数组中的对象的修改显示在另一个数组中这意味着我们不仅需要将对象复
如何自动转换十六进制代码以将其用作 Java 中的 byte[]？

我这里有很多十六进制代码我想将它们放入 Java 中而不需要向每个实体附加 0x 喜欢 0102FFAB 和我必须执行以下操作 byte test 0x01 0x02 0xFF 0xAB 我有很多很长的十六进制代码有什么办法可以自动做
为什么 JavaScript 中是 [1,2] + [3,4] = "1,23,4" ？

我想将一个数组的元素添加到另一个数组中所以我尝试了以下方法 1 2 3 4 它的回应是 1 23 4 到底是怎么回事 The 操作员没有为数组定义发生的事情是 JavaScript将数组转换为字符串并将它们连接起来 Update 由于这
小数纬度/经度的最大长度度？

地球表面一度纬度和经度的最大长度是多少以公里或英里为单位但请注明我不确定我是否说得足够清楚让我重新表述一下众所周知地球不是一个完美的圆赤道或厄瓜多尔纬度经度变化 1 0 可能意味着一个距离而两极的相同变化可能意味着另一
如何对 PHP 数组中的值进行排序/过滤？

我需要 foreach 这个数组的值 My CODE 该代码的结果 Array 0 gt Array 0 gt Age Name 1 gt 22 Yrs Value 2 gt Ethnicity Name 3 gt Caucasian Va
寻找 5 字节 PRNG 的种子

这是一个古老的想法但从那时起我就无法找到一些相当好的方法来解决它提出的问题所以我发明了见下文一个非常紧凑的在我看来性能相当好的 PRNG 但我无法找出算法来为其在大位深度上构建合适的种子值我当前的解决方案只是暴力破解它的
在现代 x86-64 上计算 64 位整数的整数 Log10 的最快方法是什么？

标题我找到了大量 32 位示例但没有找到完整的 64 位示例使用这个帖子 https codegolf stackexchange com questions 47290 fastest way to compute order of
我可以在类变量中添加没有指定值的 PHP 数组键吗？

我目前正在努力通过IBM 关于 CakePHP 的教程 http www 128 ibm com developerworks edu os dw os php cake1 html 有一次我遇到了这段代码
PHP - 递归搜索数组中的键和子键，成功时返回键['subkey]

因此我编写了一个函数该函数可以在数组中深入搜索两个级别以查找键和子键对基本上是在寻找key subkey 如果找到则返回key subkey 我正在寻找一种以真正递归的方式执行此操作的方法并根据需要进行尽可能多的深度搜索直到到达
按元素聚合数组

Spark scala 相当新我想知道是否有一种简单的方法以按列方式聚合 Array Double 这是一个例子 c1 c2 c3 1 1 1 0 1 0 3 4 1 2 1 0 0 0 4 3 2 1 0 0 0 0 0 0 2 3 1

随机推荐

删除列表中复杂度优于 O(n^2) 的子字符串

我有一个包含许多单词 100 000 的列表我想做的是删除列表中每个单词的所有子字符串因此为了简单起见我们假设我有以下列表 words Hello Hell Apple Banana Ban Peter P e 以下输出是所需的 H
同时获取logcat和内核日志

我正在尝试通过以下命令获取日志 logcat 和 kmsg logcat v 时间 f dev kmsg cat proc 但是我不确定日志文件存储在哪里以及它的名称是什么我如何识别它好的这是谷歌快速搜索的结果安卓日志系统 http
Haskell 中的 undefined 和 Java 中的 null 有什么区别？

两者的类型都是所有类型的交集无人居住两者都可以在代码中传递而不会失败直到尝试评估它们为止我能看到的唯一区别是在 Java 中有一个漏洞允许null仅针对一个操作进行评估即引用相等比较而在 Haskell 中undefined
设置特定文件的 AWS S3 过期时间

我阅读了 PHP AWS SDK 文档 https docs aws amazon com aws sdk php v2 api class Aws S3 S3Client html https docs aws amazon com aw
二分布局Gephi 0.9.1

我的问题简单得令人尴尬 how do i plot a bipartite graph in Gephi with a layout like the one you see in the attached image 我真的无法在Geph
是否可以通过显式类型转换将基类对象分配给派生类引用？

是否可以在 C 中使用显式类型转换将基类对象分配给派生类引用我已经尝试过了它会产生运行时错误不可以对派生类的引用实际上必须引用派生类的实例或 null 否则你会期望它如何表现例如 object o new object stri
Jetty 返回 403 Forbidden

您好我正在将我的网络应用程序从 tomcat 移植到 Jetty 我正在使用 Jetty runner 来启动它我使用以下命令来启动 Jetty java jar jetty runner jar port path url path
psql 显示 ansi 彩色文本

My psqlrc有以下选项 setenv LESS iMSx4 FXR setenv PAGER less pset pager always 我想要着色的 psql 输出是 x1B 35m x1B 0m x1B 35mr x1B 0m
检测Python字符串是数字还是字母[重复]

这个问题在这里已经有答案了如何检测字符串中的数字或字母我知道您使用 ASCII 代码但是哪些函数利用了它们呢检查字符串是否为非负的数字整数和字母您可以使用str isdigit https docs python org 2
使用 async/await 锁定资源

我有一个应用程序其中有一个可由多个客户端访问的共享资源运动系统我有一些单独的操作需要在移动期间访问系统并且如果同时请求冲突的操作则应抛出繁忙异常我还有序列器它们需要获得对运动系统的独占访问权限以执行多个操作并穿插其他
Objective-C 类别性能

如果我使用类别将 Objective C 类的实现分解为多个 implementation块这会使我的 iOS 应用程序生成的二进制文件更大或根本影响性能吗显然你不能在运行时获取类的类别详细信息 https stackoverflow
为什么从 App.xaml 设置样式 TargetType="Window" 不起作用？

我正在 VS2013 中创建一个简单的 WPF 项目我想将属性应用到我的主窗口我将它们设置在我的App xaml像这样的文件
“入队”和“出队”之间的区别

有人可以解释一下主要区别吗我对任何语言编程中的这些函数都没有明确的了解 C 和 C 等编程语言中的一些基本数据结构是堆栈和队列堆栈数据结构遵循先进后出策略 FILO 其中插入或推入堆栈的第一个元素是最后一个从堆栈中删除或弹出
使用 jquery ajax 的两个 CORS 请求之间的时间间隔

我正在使用 jQuery 向 Web 服务发出 CORS 请求 ajax 根据标准有一个飞行前请求然后是实际的 POST 请求我注意到每次我尝试进行 Web 服务调用时都会有两个请求一个是飞行前请求一个是实际的 POST 请求
ASP.NET - 将 JSON 从 jQuery 传递到 ASHX

我正在尝试将 JSON 从 jQuery 传递到 ASHX 文件下面的 jQuery 示例 ajax type POST url test ashx data file dave type ward contentType applica
SQL Regex 函数类似于 MySql REGEX 函数

我正在寻找一个能够执行与 TSQL 的 MySQL REGEX 函数相同的操作的函数基本上我需要我的查询如下所示 SELECT FROM Routing WHERE Message REGEX RouteRegex 我现在不太热衷于使用
C++处理文件文件末尾的空行

当我使用c 处理文件时我发现文件末尾总是有一个空行有人说vim会在文件末尾追加一个 n 但是当我使用gedit时它也有同样的问题谁能告诉我原因吗 1 include
GCC 4.7.2：带有指向成员函数指针的 std::thread

在编写测试代码时这个问题 https stackoverflow com questions 15080015 stdthread with pointer to data member我发现下面的注释行无法在 GCC 4 7 2 上编译
为什么Hadoop文件系统不支持随机I/O？

分布式文件系统例如 Google 文件系统和 Hadoop 不支持随机 I O 不能修改之前写入的文件只能写入和追加他们为什么要这样设计文件系统该设计有哪些重要优点 P S 我知道 Hadoop 将支持修改写入的数据但他们表示它
简单的面试问题变得更难：给定数字 1..100，在给定 k 个缺失的情况下找到缺失的数字

不久前我有过一次有趣的求职面试经历这个问题一开始很简单 Q1 我们有一个装有数字的袋子1 2 3 100 每个数字只出现一次所以有 100 个数字现在从袋子里随机选出一个号码找到丢失的号码当然我以前听说过这个面试问题所以我很快

简单的面试问题变得更难：给定数字 1..100，在给定 k 个缺失的情况下找到缺失的数字

澄清

简单的面试问题变得更难：给定数字 1..100，在给定 k 个缺失的情况下找到缺失的数字 的相关文章

随机推荐

热门标签

简单的面试问题变得更难：给定数字 1..100，在给定 k 个缺失的情况下找到缺失的数字的相关文章