现代硬件的算法？

2024-01-21

我再一次发现自己有一套不成立的假设 http://queue.acm.org/detail.cfm?id=1814327。该文章本身介绍了通过修改经过验证的最佳算法来解决虚拟内存问题，从而实现 10 倍的性能提升：

在现代多问题 CPU 上，运行在一些千兆赫兹时钟频率下，最坏情况损失近千万每个虚拟机页面错误的指令。如果你与旋转盘一起运行，数字更像是一亿指示。

O(log2(n)) 算法有什么好处如果这些操作导致页面错误和缓慢的磁盘操作？对于大多数相关数据集 O(n) 甚至 O(n^2)算法，避免页面故障，就会绕着它转圈。

还有更多这样的算法吗？我们是否应该重新审视我们教育的所有这些基本组成部分？自己写的时候还需要注意什么吗？

澄清：

该算法并不比经过验证的最佳算法更快，因为 Big-O 表示法有缺陷或毫无意义。它更快，因为经过验证的最佳算法依赖于现代硬件/操作系统中不正确的假设，即所有内存访问都是平等且可互换的。

仅当您的客户抱怨您的程序运行缓慢或错过了关键的最后期限时，您才需要重新检查您的算法。否则，请关注正确性、稳健性、可读性和易于维护性。在实现这些目标之前，任何性能优化都是浪费开发时间。

页面错误和磁盘操作可能是特定于平台的。总是profile您的代码以查看瓶颈在哪里。花时间在这些领域将产生最大的好处。

如果您感兴趣，除了页面错误和磁盘操作缓慢之外，您可能还想了解：

缓存命中——面向数据的设计
缓存命中——减少不必要的分支/跳跃。
缓存预测——缩小循环它们适合处理器的缓存。

同样，这些项目只有在质量达到、客户投诉以及分析员分析了您的程序之后才会出现。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

caching

languageagnostic

virtualmemory

现代硬件的算法？的相关文章

计算流数据的直方图 - 在线直方图计算

我正在寻找一种算法来生成大量流数据的直方图最大值和最小值事先未知但标准差和平均值在特定范围内我很欣赏你的想法 Cheers 我刚刚找到了一个解决方案秒从流式并行决策树算法构建在线直方图论文的 2 2 该算法由 Hive 项目中的
用于检索编辑距离接近的字符串的数据结构

例如从一组英语单词开始是否有一种结构算法允许使用单词 right 作为查询来快速检索诸如 light 和 tight 之类的字符串即我想检索与查询字符串编辑距离较小的字符串 The BK tree http blog notdot
对 Big O 表示法仍然有点困惑

所以我一直在尽力理解 Big O 表示法但仍然有一些事情我感到困惑所以我一直读到如果某件事是 O n 那么它usually指的是算法的最坏情况但它不一定要指最坏的情况这就是为什么我们可以说插入排序的最佳情况是 O n 但是我无法真
在.Net中使用ObjectCache缓存对象并设置过期时间

我陷入了一个场景我的代码如下更新它不是关于如何使用数据缓存我已经在使用它及其工作它是关于扩展它以便该方法在到期时间和从外部源获取新数据之间不会进行调用 object string this GetDataFromCache ca
零填充缓冲区/文件的 CRC32 计算

如果我想计算大量连续零字节的 CRC32 值在给定零运行长度的情况下是否可以使用恒定时间公式例如如果我知道我有 1000 个字节全部用零填充有没有办法避免 1000 次迭代的循环只是一个例子对于这个问题实际的零数量是无限的
HTML5 应用程序缓存与浏览器缓存

当前浏览器中实现了 applicationCache 我的应用程序缓存清单文件更改版本号然后触发 applicationCache 更新事件强制浏览器从服务器下载清单文件中提到的新资源假设我已经在这些资源上配置了远期到期标头这些文件
最近点对算法

我目前正在致力于用 C 实现最接近的点对算法也就是说给定一个点列表 x y 找到具有最小欧氏距离的点对我对此进行了研究我对算法的理解如下如果我错了请纠正我将点数组从中间拆分递归地找到左半部分和右半部分距离最小的点对按 y
在 C 中打印字符串的所有排列

我正在学习回溯和递归并且我陷入了打印字符串所有排列的算法我用以下方法解决了它贝尔算法 http programminggeeks com bell algorithm for permutation 用于排列但我无法理解递归方法我在
生成非连续组合

我正在尝试创建一个生成器支持执行 next 的迭代器可能在 python 中使用yield 它给出来自 1 2 n n 和 r 是参数的 r 元素的所有组合这样在选出的r个元素没有两个是连续的例如对于 r 2 且 n 4 生成
找到两个移动物体的更好交点

我想极大地优化我的算法之一我将尽力以最好的方式解释它主题我们当时处于二维欧几里德系统中t 0 在这个系统中有两个对象 O1 and O2 O1 and O2分别位于点PA and PC O1移动于常数和已知点方向的速度PB 当物体到达
如何检查一个盒子是否适合另一个盒子（允许任何旋转）

假设我有两个盒子每个盒子都是一个长方体 http en wikipedia org wiki Rectangular cuboid aka长方体我需要编写一个函数来决定盒子是否具有尺寸一二三可以装入具有尺寸的盒子中甲乙丙
算法：最大计数器

我有以下问题您有 N 个计数器最初设置为 0 并且您对它们有两种可能的操作 increase X 计数器 X 加 1 max counter 所有计数器都设置为任何计数器的最大值给出一个包含 M 个整数的非空零索引数组 A 该数组代表
合并空间上接近的路径/线段的算法

我正在寻找一种用于街道地图制图概括的几何算法名称在我的地图数据中我有许多路径点的有序列表由线段连接这些路径彼此靠近且几乎平行我如何 1 识别这些相邻路径即如何找到比某个阈值更接近的路径以及 2 将它们合并成一条路径即如
在 Java 中加载和缓存图像的最佳方法是什么？

我有超过一千个 16 x 16 像素图块图像的大量集合我在 Java 中制作的游戏需要这些图像在不耗尽 JVM 可用内存的情况下存储切片的最佳方法是什么我认为生成 1000 BufferedImages 可能并不明智保持图像准备就绪
给定与总和匹配的长度的唯一 3 位数字 (-1,0,1) 序列的数量

假设您有一个长度为 n 即空格数的垂直游戏板你有一个三面骰子有以下选项前进一停留和后退如果您低于或高于棋盘游戏空间的数量则该游戏无效一旦到达棋盘末端唯一有效的动作就是停留给定确切的骰子投掷次数 t 是否可以通过算法计算
添加到数组连续数字

这是我向SO提出的第一个问题我希望能答对在 PHP 中如果你不会 Python 或伪语言也可以给定一个包含 n 个元素的数组 old array 1 2 3 5 7 8 9 20 21 23 29 我需要向新数组添加连续数字如果不
Rails 4.0 expire_fragment/缓存过期不起作用

我一直在尝试使用 Rails 的缓存功能但我无法使某些缓存片段过期尽管它们似乎已过期使用 Rails 教程网站中指出的 Russian Doll Caching 我正在使用此配置我使release controller rb 控制器
当目标是查找某个字符串的所有出现情况时，KMP 最坏情况的复杂度是多少？

我还想知道哪种算法在查找另一个字符串中所有出现的字符串时具有最坏情况的复杂性博耶摩尔算法似乎具有线性时间复杂度 KMP 算法在查找字符串中所有出现的模式时具有线性复杂度如 Boyer Moore 算法1 如果您尝试在 aaaaaaaa
我想优化这个短循环

我想优化这个简单的循环 unsigned int i while j 0 j is an unsigned int with a start value of about N 36 000 000 float sub 0 i 1 unsig
数据库、表和列命名约定？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案每当我设计数据库时我总是想知道是否有命名数据库中项目的最佳方法我经常问自己以下问题表名应该是复数吗列名应该是单数吗我应该为表或列添加前

随机推荐

C# 5.0 异步中的可等待和等待者

Task 或Task 对象是可等待的因此我们可以对返回值为Task 或Task 的对象使用await 键 Task 或 Task 是最常用的可等待对象我们还可以定义自己的可等待对象该对象应该具有以下资格它有一个 GetAwaiter
绑定字符串格式

我有一组要显示的文本块并且我需要每个文本块的文本以不同的方式显示我当前正在标记属性中保存格式字符串并且需要以此格式显示文本如何绑定 StringFormat 部分类似于下面的部分
Web容器无法从docker compose调用后端容器

我仍在码头工人的世界中找到自己的立足点我正在尝试将我的小宠物项目 Docker 化前端是一个 vue cli 应用程序它与包含 spring boot 制作的 Restful API 的后端进行通信所以我的方法是为后端和前端声明两个
视图控制器未收到 -shouldAutorotateToInterfaceOrientation：第二次加载时的消息？

我有一个UIViewController我用它来控制弹出视图以便在整个应用程序中查看图像它支持自动旋转因为无论方向如何它都会自动调整图像大小以正确适合这工作得很好但只是在我第一次初始化并显示视图控制器时当它关闭时我将删除
HTML5 音频/视频停止缓冲区

有没有办法停止浏览器中的缓冲我有一个指向某个 mp3 文件的音频标签浏览器在播放音频时开始缓冲音频我可以停止缓冲吗我知道理想情况下如果您的音频数据输入速度比客户端可以播放的速度更快为什么不缓冲它我要求的是音频播放器应该只缓冲最
在 Unity 编辑器中显示数组成员的某些属性，具体取决于这些数组成员的其他属性

我有课MyClass它具有枚举和属性根据枚举我想在编辑器中显示某些属性有这样的枚举 first Second 和属性 health step position 如果选择第一个则在编辑器中显示名称和步骤如果选择第二个则显示步骤和位
在一个函数中生成幂集，没有显式递归，并且在 Racket 中仅使用最简单的原语

Note 这是对家庭作业的奖励但我花了太长时间尝试却毫无结果非常感谢帮助但我认为没有必要 Premise 为数字列表生成幂集但不使用任何辅助函数显式递归循环或除cons first rest empty empty else l
WCF IIS 托管服务由单个服务实现的多个服务合同 - 如何通过配置在端点之间共享 uri

我有一组服务合同它将我的服务接口分成相关功能块我目前正在使用单个服务类实现所有合约稍后可能需要拆分这些合约但目前单个服务类就足够了我正在尝试使用配置文件而不是通过代码配置端点问题是我得到了ServiceActivationE
统一圆形LBP人脸识别实现

我正在尝试使用均匀圆形 LBP 1 单位半径邻域中的 8 个点来实现基本的人脸识别系统我正在拍摄图像将其大小调整为 200 x 200像素然后将图像分割为 8x8 小图像然后我计算每个小图像的直方图并获取直方图列表 To 比较 2
JavaScript 中私有变量和实例变量的方法和变量作用域

我试图弄清楚这一点或在谷歌上搜索它我只能找到如何创建对象而不是函数到底是如何工作的如果有人可以向我解释封装是如何工作的 function myObject this variable1 tst this function1 funct
SQL 选择具有多条记录的最大日期

我正在努力查询以获取最新条目我有一个注释表其中包含以下列 BusinessDate ReportGuid NoteGuid Note NoteDate NoteAddedBy BusinessDate ReportGuid 和 Note
有序集和核心数据 (NSOrderedSet)

我有一份房产的股价清单dateTime and value 目前我在使用排序描述符获取股价时对股价进行排序现在我想更改我的代码并将它们按已排序的顺序存储以更快地检索最新的股价 dateTime max 我正在使用以下方法一一插入股价
glibc 配置错误：yacc/bison 丢失

我正在按照以下指示进行操作LFS http www linuxfromscratch org lfs view stable index html但有一点不同我只遵循第 5 节构建临时系统的部分内容以便我可以构建自己的 GCC 原因是
向 Ansible 期望（或 shell）模块发送一个退格键（以应答终端中的脚本）

name Execute the script and answer to question in term expect command script name responses Question backspace become ye
Google AdMob 返回“配置没有有效的 Google 应用 ID”

我的应用程序上线已经快一周了但我的实时 Google 广告根本没有展示我已经尝试仔细检查我能想到的所有内容例如确保应用程序 ID 和广告 ID 正确但我没有运气我有以下 2 个函数来加载和展示广告 public func load
opengraph 和 schema.org 是否可以使用相同的元标记

我不喜欢文档头部的标签数量这是一些元标记的示例
是否可以在 Android MapView 中禁用平移/缩放，同时允许用户单击 ItemizedOverlay？

有没有办法禁用平移缩放并保持地图叠加层可点击我特别考虑了一个 ItemizedOverlay 我希望它是可点击的同时拒绝用户在地图的视口中移动这是为了游戏我见过同样的问题 https stackoverflow com quest
JavaScript OOP 私有变量 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案更新这是对我之前问题的更新该问题与 StackExchange 的目标有些偏离主题但对于之前关于这个主题的询问我有一个后续问题对象模型 va
查找 pdist 压缩距离矩阵中最小值的索引

我用过scipy spatial distance pdist X 计算下面列表 X 的每对元素之间的欧氏距离度量 X 0 3 4 2 23 5 32 1 3 4 2 1 33 54 5 12 这将返回一个压缩距离矩阵 array 36 3
现代硬件的算法？

我再一次发现自己有一套不成立的假设 http queue acm org detail cfm id 1814327 该文章本身介绍了通过修改经过验证的最佳算法来解决虚拟内存问题从而实现 10 倍的性能提升在现代多问题 CPU 上运行

现代硬件的算法？

现代硬件的算法？ 的相关文章

随机推荐

热门标签

现代硬件的算法？的相关文章