找到使图像在列表中唯一的像素,您可以改进暴力破解吗?

2023-12-26

假设我有一个字符串列表,其中每个字符串是

  • 正好 4 个字符长并且
  • 在列表中是唯一的。

对于每个字符串,我想确定字符串中使该字符串唯一的字符的位置。

所以对于三个字符串的列表

abcd
abcc
bbcb

对于第一个字符串,我想识别第四个位置的字符d since d不会出现在任何其他字符串的第四个位置。

对于第二个字符串,我想识别第四个位置的字符c.

对于第三个字符串,我想识别第一个位置的字符b并且第四个位置的角色也b.

这可以简明地表示为

abcd -> ...d
abcc -> ...c
bbcb -> b..b

如果您考虑同样的问题,但使用二进制数列表

0101
0011
1111

那么我想要的结果就是

0101 -> ..0.
0011 -> .0..
1111 -> 1...

坚持二进制主题,我可以使用 XOR 来识别哪些位在其中是唯一的two二进制数自

0101 ^ 0011 = 0110

我可以将其解释为在这种情况下第二位和第三位(从左到右读取)在这两个二进制数之间是唯一的。这种技术可能会转移注意力,除非它能以某种方式扩展到更大的列表。

强力方法是依次查看每个字符串,并对每个字符串迭代列表中其余字符串的垂直切片。

所以对于清单

abcd
abcc
bbcb

我会从

abcd

并迭代垂直切片

abcc
bbcb

这些垂直切片在哪里

a | b | c | c
b | b | c | b

或以列表形式“ab”、“bb”、“cc”、“cb”。

这将导致四个比较

a : ab -> . (a is not unique)
b : bb -> . (b is not unique)
c : cc -> . (c is not unique)
d : cb -> d (d is unique)

或简洁地

abcd -> ...d

也许这是一厢情愿的想法,但我有一种感觉,应该有一个优雅且通用的解决方案,适用于任意大的字符串(或二进制数字)列表。但如果有的话,我还没有看到它。

我希望使用此算法从一组唯一图像(位图)中获取最小签名,以便将来有效地识别这些图像。如果不考虑未来的效率,我会使用每个图像的简单散列。

你能改进蛮力吗?

Edit我喜欢的方法是构建像素到图像的映射

sprawl[Tuple<x=10, y=33,color=f1fefd>] => {
     image17,
     image23,
     ...
}

sprawl[Tuple<x=10, y=34,color=f1fef0>] => {
     image11
     ...
}

然后使用该图来识别每个图像的最小签名像素集。

如果一个像素(由 x、y、颜色标识)仅引用一个图像,那么我就找到了该图像的完美(最小)签名。

如果图像没有唯一的像素,情况会更复杂,但由于我知道列表中的所有图像都是唯一的,所以我应该能够组合两个或更多像素引用(但尽可能少)来推断图像。

Update

我一直在为此研究一种算法。我的问题非常类似于this one https://stackoverflow.com/questions/2249908/optimized-ocr-black-white-pixel-algorithm,我把我的算法写成回答这个问题 https://stackoverflow.com/questions/2249908/optimized-ocr-black-white-pixel-algorithm/2873004#2873004。此更新是为了引起仍在关注的任何人的注意(我看到五个书签)。我正在单独研究这个问题,所以欢迎任何和所有的反馈,即使只是为了观察我还没有说清楚!


您可以生成一个二维数组,其中包含每个字符在每个位置 (0-3) 中出现的次数。例如,arr[1,3]将包含数字/字符的次数1出现在最后一个位置。

然后对于每个字符串s,遍历字符串中的所有字符。根据数组,在该位置仅出现一次的字符是该字符串的唯一字符。换句话说,如果arr[s[i], i]==1然后串起来s地位独特i.

这将为您提供线性时间的解决方案,而您给出的算法将花费二次时间。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

找到使图像在列表中唯一的像素,您可以改进暴力破解吗? 的相关文章

  • 如何检查一个盒子是否适合另一个盒子(允许任何旋转)

    假设我有两个盒子 每个盒子都是一个长方体 http en wikipedia org wiki Rectangular cuboid aka长方体 我需要编写一个函数来决定盒子是否具有尺寸 一 二 三 可以装入具有尺寸的盒子中 甲 乙 丙
  • 白色像素簇提取

    我正在研究指纹毛孔提取项目 并陷入毛孔 白色像素簇 提取的最后阶段 我有两个输出图像 我们可以从中获取毛孔 但不知道该怎么做 这两个图像的尺寸不同 image1 的尺寸为 240 320 image2 的尺寸为 230 310 这是我的图像
  • 用Python识别图像

    我对 OCR 识别和 Python 都有点陌生 我想要实现的是从 Python 脚本运行 Tesseract 以 识别 tif 中的某些特定数字 我以为我可以为 Tesseract 做一些培训 但我在 Google 和 SO 上没有找到任何
  • 添加到数组连续数字

    这是我向SO提出的第一个问题 我希望能答对 在 PHP 中 如果你不会 Python 或伪语言也可以 给定一个包含 n 个元素的数组 old array 1 2 3 5 7 8 9 20 21 23 29 我需要向新数组添加连续数字 如果不
  • 当目标是查找某个字符串的所有出现情况时,KMP 最坏情况的复杂度是多少?

    我还想知道哪种算法在查找另一个字符串中所有出现的字符串时具有最坏情况的复杂性 博耶 摩尔算法似乎具有线性时间复杂度 KMP 算法在查找字符串中所有出现的模式时具有线性复杂度 如 Boyer Moore 算法1 如果您尝试在 aaaaaaaa
  • 在无向图中查找强连通分量

    我想在无向图中找到强连接的组件 即如果我从节点开始A然后我会回到节点A并且每条边都被恰好访问一次 对于有向图可以使用Tarjan算法来寻找强连通分量 但是对于无向图怎么办 我认为您错过了强连通分量的含义 强连接组件 如果所有顶点对之间都存在
  • 如何在Scala中实现尾递归快速排序

    我写了一个递归版本 def quickSort T xs List T p T T gt Boolean List T xs match case Nil gt Nil case gt val x xs head val left righ
  • 输入维度/分辨率会影响卷积神经网络的性能吗? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我正在构建一个图像分类器 其中有 66 个类和大约 50000 个图像 我的电脑内存为 12 GB 我的内存不足以训练图像 我的问题是
  • 合并字符数组中的最小重复次数

    假设我有两个数组 我想合并它们 以便合并后的数组具有最小重复次数 例如 x x 是重复 arr1 x d d m f m arr2 d d x f f m 唯一的条件是在合并数组中 元素来自arr1 and arr2必须出现在各自的订单中a
  • 如何从二叉搜索树中均匀随机地返回节点?

    给定一个 BST 可能平衡也可能不平衡 如何能够均匀地随机返回 任何 节点 一个限制是您不能使用外部索引数据结构 您必须以每个节点都有平等被访问的机会的方式遍历树 这个问题让我困惑了好一阵子 如果我们确实可以使用外部哈希表 指针 我们可以对
  • 搜索/排序算法 - 是否有类似 GoF 的列表?

    我是一名自学成才的开发人员 坦率地说 我不太擅长找出在任何特定情况下使用哪种搜索或排序算法 我只是想知道是否有设计模式 esque 列出了以太坊中可用的常见算法 供我添加书签 就像是 算法名称 带有别名 如果有的话 它解决的问题 大O成本
  • 需要帮助解决 Project Euler 问题 200 [已关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我正在尝试制定一个算法来解决 We
  • Exposé 布局算法

    我正在制作一些项目 其布局类似于 Mac OS X 在 Expos 中对窗口所做的操作 它适应项目的长宽比和可用区域的长宽比 基本上 可用区域分为行和列 每个单元格 行和列的交集 中放置一个项目 这些项目必须保持其纵横比 此处width h
  • Python 给定 k 个分区的整数分区

    我正在尝试寻找或开发Python 的整数分区代码 仅供参考 整数分区将给定整数 n 表示为小于 n 的整数之和 例如 整数5可以表示为4 1 3 2 3 1 1 2 2 1 2 1 1 1 1 1 1 1 1 我为此找到了许多解决方案 ht
  • 在 Java 中实现排列算法的技巧

    作为学校项目的一部分 我需要编写一个函数 该函数将接受整数 N 并返回数组 0 1 N 1 的每个排列的二维数组 该声明看起来像 public static int permutations int N 该算法描述于http www usn
  • opencv形态扩张滤波器作为最大滤波器

    就像中值滤波器的定义一样 我可以将 最大滤波器 定义为局部窗口 例如dst x y max 3x3 局部窗口像素 但我在opencv中找不到这样的过滤器 最接近的是 dilate 函数 然后我使用 dilate 函数的默认配置 但结果不正确
  • 如何查找给定字符串中仅出现一次的第一个字符[关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 未使用的功能会产生什么后果

    我想知道在代码中使用未使用的函数会产生什么 如果有什么后果 如果您查找并删除所有未使用的函数和变量 性能是否会有明显的改进 或者删除未使用的函数和变量只是一个好习惯 未使用的功能不会损害性能 他们让维护代码的人的工作变得更加困难 现代 ID
  • 在 O(n) 时间内找到 n x n 矩阵中的局部最小值

    所以 这不是我的家庭作业问题 而是取自 coursera 算法和数据结构课程的未评分作业 现已完成 You are given an n by n grid of distinct numbers A number is a local m
  • 编程 Pearls - 随机选择算法

    Programming Pearls 第一版第 120 页介绍了从 N 个整数总体中选择 M 个等概率随机元素的算法 InitToEmpty Size 0 While Size lt M do T RandInt 1 N if not Me

随机推荐

  • 音频单元图暂停和重复

    我一直在尝试使用 Apple 提供的代码来实现音频单元图 IphoneMixerEQGraph测试 http developer apple com library ios samplecode iPhoneMixerEQGraphTest
  • Typescript 与“typeof”相反/反向操作

    Angular 可以按类型查询子组件 在测试中使用它 如下所示 fixture debugElement query By directive ComponentType 现在我想创建一个为我执行此操作的函数 import Componen
  • 从其他类 Objective-C 访问方法

    寻找这个问题的答案 但我还没有找到合适的答案 我希望你们 和女孩 能帮助我 这是针对 iPhone 应用程序的 好吧 我有一个多视图应用程序 每个视图都有自己的类 一切都很愉快 然而 不同的类有时会调用相同的方法 到目前为止 我只是在两个类
  • 尝试批量插入行时发生 Knexjs 错误:获取连接超时。泳池可能已经满了。

    完整错误 Knex 获取连接超时 池可能已满 您是否缺少 transacting trx 调用 我有一个超过 70k 行的 csv json 插入 15k 17k 次后 它停止并抛出上述错误 代码如下 csvtojson colParser
  • Microsoft Graph API 是否支持 Azure AD B2C 的更改通知?

    我正在尝试获取更改通知 以便用户使用连接到 Azure AD B2C 的应用程序 我按照以下教程操作并成功创建了订阅 但我从未收到任何更改通知 https learn microsoft com en us learn modules ms
  • 如何存储长符号计算的结果以供以后使用?

    我的计算是这样的 f x runs fast g x runs fast h x depends on f x g x runs slow 5mins 现在我只需要结果h x 每次我重新启动 mma 时 我基本上都会重做相同的计算以获得h
  • 将 JSON 转换为 .NET 数据集

    我正在编写一个 Java servlet 它使用http json org java http json org java 用于从 mssql 数据库读取一些数据并将结果集转换为 JSON 字符串的库 NET 客户端应用程序正在使用此 JS
  • 如何在Word宏中的TextBox中插入文本

    我在Word中创建了一个文本框 我想在其中插入文本 Sub k Dim Box As Shape Set Box ActiveDocument Shapes AddTextbox Orientation msoTextOrientation
  • 如何在谷歌地图 API v3 中一次仅显示一个信息窗口

    我们可以在谷歌地图中一次仅显示一个信息窗口 并为多个标记显示多个信息窗口吗 意味着 当我单击标记时隐藏 关闭其他信息窗口并仅显示当前标记信息窗口 Thanks 我解决的方法如下 var infoWindowsOpenCurrently A
  • C# 在方法或事件处理程序之间传递变量

    我仍在尝试学习 c 我的问题是如何将变量从 Item1 Click 传递到 Item2 Click 这与在方法之间传递它们是同一件事还是因为它们是事件处理程序而有所不同 public partial class Events System
  • K&R 第 2 版,示例 1.9 字符数组

    我对以下代码中的 getline 函数和参数定义有疑问 代码直接取自 K R 第 1 9 章 字符数组 我已将其逐字复制在这里 问题是 当我按原样编译程序时 出现三个错误 我在最后重现了这些错误 当我在出现错误的三个地方将函数和函数参数定义
  • 从 sql 修改 SSIS 目录中的连接管理器信息

    有没有办法在使用 sql 代码部署后从 ssis 目录更新连接管理器信息 我想先部署没有敏感数据的项目 执行目录 deploy project 然后通过 SQL 将用户名和密码添加到 SSIS 目录项目 有没有办法从以下位置更新连接管理器信
  • 空间域图像卷积

    我正在尝试复制结果这个链接 https stackoverflow com q 38709810 159072 using linear卷积于空间域 图像首先转换为二维double数组 然后进行卷积 图像和内核大小相同 图像在卷积之前进行填
  • 加快用最后一个非 Nan 值替换 NaN

    我想用最后一个非 NaN 值替换向量中的所有 NaN input 1 2 3 NaN NaN 2 output 1 2 3 3 3 2 我想尝试加快已有的循环速度 input 1 2 3 NaN NaN 2 if isnan input 1
  • 单击 Angular 网页中的 TableRow 时出现 StaleElementException

    div class row gridrow clickable ng scope i class col m1 s1 tiny fa fa male i div class col m3 s11 ng binding Allard div
  • 如何删除MySQL中的记录并保留最新日期

    Example table 1 ID Email Answer UpdateDate 1 email protected cdn cgi l email protection 1 2011 07 02 2 email protected c
  • Webpack 错误:configuration.module.rules[0] 有一个未知的属性“query”

    我正在关注这个教程 https www youtube com watch v iWUR04B42Hc https www youtube com watch v iWUR04B42Hc 我知道它的内容已过时 但我认为已将其正确翻译为最新版
  • ASP.Net 移动 Web 表单发生了什么?

    以前 Visual Studio 具有用于移动 Web 表单 而不是移动 SDK 的模板 它们似乎在 Visual Studio 2008 中消失了 我见过的唯一解决方案是从 Omar 下载一些模板 http blogs msdn com
  • Pandas hub_table,按列对值进行排序

    我是 Pandas 的新用户 我喜欢它 我正在尝试在 Pandas 中创建一个数据透视表 一旦我按照我想要的方式获得了数据透视表 我想按列对值进行排名 我附上了 Excel 中的图像 因为以表格格式更容易看到我想要实现的目标 链接到图像 h
  • 找到使图像在列表中唯一的像素,您可以改进暴力破解吗?

    假设我有一个字符串列表 其中每个字符串是 正好 4 个字符长并且 在列表中是唯一的 对于每个字符串 我想确定字符串中使该字符串唯一的字符的位置 所以对于三个字符串的列表 abcd abcc bbcb 对于第一个字符串 我想识别第四个位置的字