如何找到列表中最常见的数字组合？

2024-01-03

假设您有一个数字（或字母）列表，例如

1177783777297461145777267337774652113777236237118777

我想在此列表中找到最常见的数字组合：

对于 1 位数字长的组合 - 它是此列表中最常见的数字

对于 2 位数字长的组合 - 可能是“11”

对于 3 位数字长的组合 - 可能是“777”等

对于这样的任务有一些特殊的算法吗？

更新好吧，我自己编写了以下代码（Java）。看起来执行时间与数据大小乘以模式大小成正比：

public static void main(String[] args)
{
    int DATA_SIZE = 10000;
    int[] data = new int[DATA_SIZE];
    for (int i = 0; i < DATA_SIZE; i++)
    {
        data[i] = (int) (10 * Math.random()) % 10;
        System.out.print(data[i]);
    }

    int[] pattern1 = new int[]{1, 2, 3};
    int[] pattern2 = new int[]{7, 7, 7};
    int[] pattern3 = new int[]{7, 7};

    System.out.println();
    System.out.println(match(data, pattern1));
    System.out.println(match(data, pattern2));
    System.out.println(match(data, pattern3));
}

static int match(int[] data, int[] pattern)
{
    int matches = 0;
    int i = 0;
    while (i < data.length)
    {
        matches = isEqual(data, i, pattern) ? matches + 1 : matches;
        i++;
    }
    return matches;
}

static boolean isEqual(int[] a, int startIndex, int[] a2)
{
    if (a == a2)
    {
        return true;
    }
    if (a == null || a2 == null)
    {
        return false;
    }

    for (int i = 0; i < a2.length; i++)
    {
        if (a[startIndex + i] != a2[i])
        {
            return false;
        }
    }

    return true;
}

这可以在二次时间内完成，尽管我对更快的方法感到好奇。这个想法是迭代可能的长度值 k=1..N，并在每次迭代中循环遍历字符串以找到长度为 k 的最频繁序列。

内循环可以使用哈希表来有效地计算频率。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

如何找到列表中最常见的数字组合？的相关文章

我想优化这个短循环

我想优化这个简单的循环 unsigned int i while j 0 j is an unsigned int with a start value of about N 36 000 000 float sub 0 i 1 unsig
稀疏矩阵中的最大和子矩形

求一个子矩形中的最大和NxN矩阵可以完成O n 3 正如其他帖子中指出的使用 2 d kadane 算法的时间然而如果矩阵是稀疏的具体来说O n 非零条目可以O n 3 时间被打败了吗如果有帮助的话对于我感兴趣的当前应用程序
哪种数据聚类算法适合检测时间序列事件中未知数量的聚类？

这是我的场景考虑在不同地点和时间发生的一组事件例如考虑有人在高空记录暴风雨期间城市中的雷击就我的目的而言闪电是瞬时的只能击中某些位置例如高层建筑还可以想象每次雷击都有一个唯一的 ID 以便以后可以参考该雷击这个城市大约有1
反转二进制网络

如何反转二元方程以便找到哪些输入将产生给定的输出 Example Inputs i0 through i8 Outputs o0 through o8 Operators XOR AND 二元方程 1 i0 1 i1 0 i2 1 i3
按百分比减少多边形面积

我有一个由点 x y 组成的多边形我想做的是将其减少一个百分比请记住我不想只是扩大规模多边形应该有一种内部边界其宽度取决于百分比该内部边界被多边形切断谁知道可以实现这一目标的算法输入点数组百分比输出点数组你所寻求的
Java：如何实现3和？

我正在研究 3 Sum 来自己实现它并遇到了以下规则的实现给定一个由 n 个整数组成的数组 S S 中是否存在满足 a b c 0 的元素 a b c 查找数组中所有总和为零的唯一三元组注意三元组 a b c 中的元素必须按非降序排
缩短文本并仅保留重要句子

德国网站 nandoo net 提供了缩短新闻文章的可能性如果使用滑块更改百分比值文本会发生变化并且某些句子会被遗漏您可以在这里看到它的实际效果 http www nandoo net read article 299925 http
使用C标准数学库精确计算标准正态分布的CDF

标准 C 数学库不提供计算标准正态分布 CDF 的函数 normcdf 然而它确实提供了密切相关的函数误差函数 erf 和互补误差函数 erfc 计算 CDF 的最快方法通常是通过误差函数使用预定义常量 M SQRT1 2 来表示 d
快速求解子集和

考虑这种解决子集和问题的方法 def subset summing to zero activities subsets 0 for activity cost in activities iteritems old subsets sub
检索受“rowspan”影响的行的列索引的最有效方法是什么？

考虑下表 table thead tr th th th A th th B th th C th tr thead tbody tr th 1 th td Apples td td Oranges td td Pears td tr tb
如何将无向图转换为 DAG？

The 维基页面 http en wikipedia org wiki Directed acyclic graph Relation to other kinds of graphs says 任何无向图都可以通过为其顶点选择总顺序并将每
图中的后边

I m having a hard time understanding Tarjan s algorithm for articulation points I m currently following this tutorial he
如何确定算法函数的复杂度？

您如何知道算法函数对于特定操作是否需要线性常数对数时间它取决于CPU周期吗您可以通过三种方式至少做到这一点在网上查找算法看看它是如何描述其时间复杂度的根据输入大小自己检查算法查看嵌套循环和递归条件等内容以及每个循环运
点集子集的最小周长凸包

给定平面上的 n 个点没有 3 个共线给定数字 k 找到 k 个点的子集使得 k 个点的凸包在 k 个点的子集的任何凸包中具有最小周长我可以想到一个简单的方法运行时间为 O n k k log k 找到大小为 k 的每个子集的凸包
时间复杂度和运行时间有什么区别？

时间复杂度和运行时间有什么区别它们是一样的吗运行时间是指程序运行所需的时间时间复杂度是对输入大小趋于无穷大时运行时间渐进行为的描述您可以说运行时间是 O n 2 或其他什么因为这是描述复杂性类和大 O 表示法的惯用方式事实上
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
数组中连续元素的最大乘积

我在现场面试的时候被问到了这个算法问题由于没有要求我签署保密协议我将其发布在这里寻求答案给定一个数组REAL不包含 0 的数字找到产生最大乘积的连续元素该算法应在线性时间内运行我考虑过以下方法使用两个数组第一个是利用DP思想
分而治之策略来确定列表中是否有超过 1/3 的相同元素

我正在使用分治算法来确定列表中是否有超过 1 3 的元素相同例如 1 2 3 4 不所有元素都是唯一的 1 1 2 4 5 是的其中 2 个是相同的没有排序是否有分而治之的策略我陷入了如何划分的困境 def is valid i
C 埃及分数

古埃及人仅使用以下形式的分数1 n因此任何其他分数都必须表示为这些单位分数的总和而且所有单位分数都是不同的在C或Java中使任何分数成为埃及分数总和越少越好的好方法是什么可以使用什么算法分支定界 a 例如 3 4 1 2 1
生成所有多集大小为 n 的分区的算法

我一直在试图找出一种方法来生成多重集的所有不同的大小为 n 的分区但到目前为止却空手而归首先让我展示一下我想要实现的目标假设我们有一个输入向量uint32 t std vector

随机推荐

以下reinterpret_cast是否会导致未定义的行为？

是否reinterpret cast下面的代码中会导致未定义的行为吗如果确实如此是否可以定义rpd以类型安全的方式 class Base public virtual Base default class Derived public
OAuth 回调 URL 与 nginx 代理服务器行为不兼容

在过去的三天里我花了很大一部分时间尝试互联网上的每一个解决方案但感到绝望这是问题陈述我有一个包含三个服务的 Dockerized 应用程序带有gunicorn的django应用程序 web Nginx 服务器 nginx Post
数据映射器、表数据网关（Gateway）、数据访问对象（DAO）和存储库模式之间有什么区别？

我正在尝试温习我的设计模式技能我很好奇这些模式之间有什么区别所有这些看起来都是同一件事封装特定实体的数据库逻辑因此调用代码不了解底层持久层根据我的简短研究它们通常都实现标准 CRUD 方法并抽象出特定于数据库的细节除了命名约定
jQuery 验证插件：输入与文本区域

我想知道为什么 jQuery Validate 插件的默认处理存在差异
使用 boto3 在两个 AWS S3 存储桶之间移动文件

我必须使用 Python Boto API 将文件在一个存储桶之间移动到另一个存储桶我需要它从第一个存储桶中剪切文件并将其粘贴到第二个存储桶中最好的方法是什么注意如果我有两个不同的访问密钥和秘密密钥这有关系吗如果您使用
如何在 Blade Laravel 5.2 中显示来自 aws s3 的图像

我创建了一种从 aws S3 获取数据图像文件的方法如下所示 public static function getImage imagePath if Storage exists imagePath return Storage d
Android 水平滑动项目，就像在 Duolingo 应用程序中一样

I was playing around try to implement sliding functionality like in Duolingo Activity with horizontal lessons list The l
如何从Windows交叉编译到Linux？

我在 Windows 机器上安装了 Go 1 2 编写了一个虚拟程序并设置了环境变量GOARCH and GOOS分别为 AMD64 和 linux 当我发出 go build 命令我收到错误 go build runtime linux
尝试将字符串日期转换为日期

java text ParseException 无法解析的日期 Sat May 01 00 00 00 EDT 2010 我正在尝试使用 SimpleDateFormat 类解析此日期 java util Date prevStartDa
mongodb - 除了查找另一个集合之外，如何使用 geoNear 按距离排序

我有两个单独工作的功能但想将它们组合起来功能 1 按地理邻近距离对用户进行排序功能 2 用户不应该已经被喜欢当前用户查找partnership收藏如何更新此查询以从用户的集合开始以便我可以执行 geoNear 下面 mongo
EF6 Code First 延迟加载导致空集合

因此动态代理已创建但我无法弄清楚我做错了什么来防止导航属性延迟加载这是我为测试该问题而运行的确切代码数据库上下文 public class MyDbContext DbContext public MyDbContext base
Devel::Cover 和 ModPerl::Registry 没有覆盖运行时

当我跑步时Devel Cover with ModPerl Registry 我没有得到任何覆盖信息除了BEGIN块当我运行相同的脚本时Devel Cover从命令行或作为 CGI 一切正常显然我怎样才能使Devel Cover 看
Sphinx 返回错误的搜索结果

我将 Sphinx 与 Thinking Sphinx 插件一起使用我使用以下代码以及 rakethinking sphinx index 命令对名为 Venue 的模型建立了索引 define index do indexes na
没有这样的文件或目录@ rb_sysopen - tmp/pids/puma.pid

我正在尝试启动 puma 但在最后一步失败了如下所示 16 38 09 web 1 home ramonpm rvm gems ruby 2 2 7 gems puma 3 9 1 lib puma launcher rb 130 in
C# 中的枚举使用负数的负面影响

在 C 枚举中使用负数是否有任何负面影响我正在对响应代码和负代码之一进行建模这可以编译但我想知道这是否有任何负面影响 public enum ResponseCodes InvalidServerUserPasswordCombo
片段错误中的黄油刀@bind

我按照网站上的说明进行操作 http jakewharton github io butterknife http jakewharton github io butterknife 错误 java lang RuntimeExceptio
为什么 host_statistics64() 返回不一致的结果？

为什么 OS X 10 6 8 中的 host statistics64 我不知道其他版本是否有这个问题返回的空闲活动非活动和有线内存的计数不等于 RAM 总量为什么缺少页数不一致以下输出表示十秒内未分类为空闲活动非活动或有线
为什么查询计划中存在重复的 CTE 计算以及如何在不重复代码的情况下对其进行优化？

在该查询的查询计划中 grp set 的计算重复了 4 次不同排序每次占用 23 因此占用了所有资源的 23 4 92 with grp set as select distinct old num old tbl old db old
Swing：如何实现子组件的所有事件转发到父容器？

我正在寻找一种简单的方法来制作Swing 组件转发所有收到的内容向其父容器发送事件甚至所有父母都可以root EDIT 我哪里需要这个我有一个图表编辑器组件必须转发按键和鼠标单击当用户单击子元素时将其自身设置为活动该组件的
如何找到列表中最常见的数字组合？

假设您有一个数字或字母列表例如 1177783777297461145777267337774652113777236237118777 我想在此列表中找到最常见的数字组合对于 1 位数字长的组合它是此列表中最常见的数字对于 2

如何找到列表中最常见的数字组合？

如何找到列表中最常见的数字组合？ 的相关文章

随机推荐

热门标签

如何找到列表中最常见的数字组合？的相关文章