像 PTLsim 这样的 CAS 模拟器如何实现 x86 硬件的周期精确模拟？

2023-11-29

谁能告诉我 CAS 软件怎么样http://www.ptlsim.org/工作？如果不知道每条指令使用了多少个周期，也不知道 CPU 分支预测逻辑，那么它们如何实现周期精度？或者一切都可以通过保密协议获得吗？

我想它们可能可以非常准确地命中或错过缓存（也许我错了，但我认为预测内部算法更容易），但是如果不知道如何实现流水线和超标量，我很困惑如何进行模拟周期准确的。

因此，理论上是否可以实现hard基于 x86 的硬件上的 rtos？或者应该签署某种保密协议才能估计每条指令所需的时间？

第一个问题：如果不知道每条指令使用了多少个周期，也不知道 CPU 分支预测逻辑，那么它们如何实现周期精度？

该模拟器确实为足够准确的 CPU 模型提供了周期精确的模拟，但没有为 Intel 或 AMD 当前产品提供开箱即用的模型。 Intel 或 AMD 有权访问所需信息的人员可以创建 RTL 级模型并获得当前处理器的周期精确模拟。英特尔和 AMD 以外的人不能。您仍然可以向模拟器提供公开已知的信息并获得合理的结果。这些结果与真实硬件不同。

如果您是软件开发人员并且想要对真实硬件进行基准测试，请使用真实硬件！像 PLTsim 这样的模拟器是为（学术）硬件开发人员设计的，他们希望测试新的硬件功能，而无需在新芯片上花费数十万美元。

第二个问题：理论上是否可以在基于 x86 的硬件上实现硬 RTO？

当然如此理论上可能的。您需要考虑所有情况下所有输入的每个代码段的绝对最坏情况。实际问题是像Core 2这样的处理器非常复杂，而且处理器的状态也非常庞大。此外，这些处理器并未设计为在时序方面具有确定性的行为。一个真正困难的 RTOS 必须非常保守。最后，正如您所观察到的，英特尔和 AMD 以外的人无法获得做出这些保守假设所需的所有信息。在实践中，合理的做法是使用最新、最好的 cpu，而使用具有确定性时序的较旧、更简单的 cpu。

另一方面，如果 RTOS 不必非常严格地实时，您始终可以只包含一些安全裕度并希望得到最好的结果。 ;-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

像 PTLsim 这样的 CAS 模拟器如何实现 x86 硬件的周期精确模拟？的相关文章

如何为ListBox（值）索引或树视图节点设置相同的按钮事件？

我有 C Win form 如下所示我也有一些数组作为列表框的菜单 public string ArrayMain 1 Water 2 Air 3 Soil 4 Fire public string ArrayWater 1 Salty
x86 汇编中 cmove 指令的用途？

反汇编可执行文件时我遇到了cmove操作说明我已经在互联网上搜索过但我只发现这是一个有条件的移动如果源和目的地相等mov发生我还不明白为什么我需要它因为它不会改变操作数它的目的是什么 The CMOVcc指令不比较源和目标它们
如何在汇编程序中使用 C 库？

我想知道如何用汇编语言编写文本编辑器但现代操作系统需要 C 库特别是对于它们的窗口系统我找到了这个page http pengu1n is programmer com posts 8304 html 这对我有很大帮助但我想知道是否
x86 实模式下的段大小

我对实模式下段的大小有一个疑问因为它们不能超过 64K 但可以小于那个 http support microsoft com kb 120069 我的问题是这些段大小和基地址是如何初始化的就像保护模式下有 GDT 和 LDT 一样实模
分配内存空间的宏

我需要让一个汇编程序员来计算帕斯卡三角形 https en wikipedia org wiki Pascal 27s triangle 这样帕斯卡三角形的每一行都与其他行分开存储在内存中我想做一个但我不知道如何使用宏在汇编中做到这一点
g++ 内联汇编括号中不匹配

g 向我抱怨以下代码中缺少括号 1 2 3 v v v asm volatile inb 1 0 a result Nd portnumber 1 2 3 正如您所看到的括号是匹配
gcc 如何知道内联汇编中使用的寄存器大小？

我有内联汇编代码 define read msr index buf asm volatile rdmsr d buf 1 a buf 0 c index 使用该宏的代码 u32 buf 2 read msr 0x173 buf 我发现反汇
x86 平台中的 KVM 影子页表处理

据我了解在没有硬件支持来宾虚拟到主机物理地址转换的处理器上 KVM 使用影子页表当来宾操作系统修改其页表时会构建和更新影子页表硬件中有没有专门的指令以x86为参考来修改页表除非有特殊说明否则不会对VMM 造成陷阱 Linux
这段汇编语言代码是什么意思？

我是一名学生刚刚开始学习汇编语言为了更好地理解它我只是用 C 写了一个简短的代码并将其转换为汇编语言奇怪的是我有点听不懂代码是 include
在 x86 Intel VT-X 非根模式下，是否可以在每个指令边界传递中断？

除了不将中断传送到虚拟处理器的某些正常指定条件 cli if 0 等之外客户机中的所有指令实际上都是可中断的吗也就是说当传入的硬件中断先传递给 LAPIC 然后传递给处理器时据说会发生一些内部魔法将其转换为虚拟中断给来宾使用虚
从汇编程序获取命令行参数

通读专业汇编语言书籍似乎它提供了用于读取命令行参数的错误代码我纠正了一点现在它从段错误变成了读取参数计数然后是段错误这是完整的代码 data output1 asciz There are d params n output2
Linux内核页表更新

在linux x86 中分页每个进程都有它自己的页面目录页表遍历从 CR3 指向的页目录开始每个进程共享内核页目录内容假设三个句子是正确的假设某个进程进入内核模式并更新他的内核页目录内容地址映射访问权利等问题由于内核地
开始使用 Real Time Linux 编程的最佳方式是什么？

虽然我用C实现了很多项目但我对操作系统完全陌生我在 Discovery board STM32 上尝试了实时 Linux 并得到了闪烁 LED 的正确结果但我并没有真正理解整个过程因为我只是按照步骤操作并且无法在互联网上找到每个步
X86 预取优化：“计算 goto”线程代码

我有一个相当重要的问题我的计算图有循环和多个计算路径我没有制作一个调度程序循环其中每个顶点将被一一调用而是将所有预先分配的框架对象放置在堆中代码数据这有点类似于线程代码甚至更好 CPS 只是在堆中跳转执行代码每个代
为什么 FMA _mm256_fmadd_pd() 内在函数有 3 个 asm 助记符：“vfmadd132pd”、“231”和“213”？

有人可以向我解释一下为什么融合乘法累加指令有 3 种变体 vfmadd132pd vfmadd231pd and vfmadd213pd 而只有一个 C 内在函数 mm256 fmadd pd 为了简单起见在 AT T 语法中有什么区别
这种没有推送寄存器的交换有多安全？

我对汇编非常陌生下面的代码应该通过两个不同的函数交换两个整数首先使用swap c然后使用swap asm 但我怀疑我是否需要push 我的意思是保存汇编代码之前寄存器的每个值和pop稍后就在返回之前 main 换句话说如果我返回
在 x86 程序集中存储大量布尔值的最佳方法是什么？

最近我一直在处理充满布尔值的大型数组目前我将它们存储在 bss部分有一个 space指令它允许我创建字节数组但是由于我只需要存储布尔值因此我希望从数组中逐位读取和写入数据目前我能想到的最好方法是有一个 space指令所需存储
SIMD 和 VLIW 指令是一样的吗？

SIMD 单指令多数据和 VLIW 超长指令字到底有什么区别其中一个是另一个的子集吗或者它们是两个完全不同的东西完全不相关且正交一台机器可以有一个或两个或者两者都没有 SIMD 指令可以作为扩展添加到 VLIW ISA 但 V
movzbl(%rdi, %rcx, 1), %ecx 在 x86-64 汇编中意味着什么？

我想我明白 movzbl rdi rcx 1 ecx 意思是将零扩展字节移至长整型并表示将 ecx 扩展为 32 位但我不完全确定语法 rdi rcx 1 指的是什么我在某处看到该语法指的是 Base Index Scale 但我找
英特尔的最后分支记录功能是英特尔处理器独有的吗？

最后分支记录是指存储与最近执行的分支相关的源地址和目标地址的寄存器对 MSR 的集合它们受英特尔酷睿 2 英特尔至强和英特尔凌动处理器系列的支持 http css csail mit edu 6 858 2012 readings ia3

随机推荐

Python mysql 使用变量来选择某个字段

python 和 mysql 有一个棘手的问题为了简单起见以下代码返回变量 field 中的所有内容它是一个字符串例如用户名或密码 options field userID entries cursor execute sel
实现 GCM 时如何从 Android 应用程序调用服务器应用程序 servlet 来注册设备

我正在尝试从 Android 开发者网站了解 GCM 我已经按照以下说明实现了客户端 Android 应用程序http developer android com google gcm client html和 http 服务器应用程序不
如何使用QWebChannel从python接收数据到js？

我试图让我的 PyQt 应用程序与 JS 进行通信但无法从 python 获取值我在 python 端有两个插槽来获取和打印数据在示例中一个 int 从 JS 传递给 python python 加 5 并将其传回然后 JS 调用
iPhone - 将视频显示为启动画面

我需要在我的 iPhone 应用程序中将视频显示为闪屏我正在使用以下代码 void setupMovie NSString moviePath NSBundle mainBundle pathForResource iphone ofTy
如何使 PhpStorm 显示用 @method 声明的方法抛出的异常（或从魔术方法 docblock 继承它们）？

假设以下示例代码 method bool someMethod class MyClass throws MyClassException public function call method args if this gt someCh
是否有用于共享列表或地图的一部分的 YAML 语法？

所以我知道我可以做这样的事情 sitelist sites www foo com www bar com anotherlist sites 并且有sitelist and anotherlist两者都包含www foo com and
通过Web服务正确捕获特定异常

我目前在我们的客户端程序中使用 C NET 服务作为服务器设计的一部分会抛出几个定制的异常来指示特定错误就像在任何正常的桌面程序中一样问题在于 Web 服务捕获这些错误并将它们序列化为FaultException 并将实际异常如N
javafx简单的PathTransition动画

我正在使用 JavaFX 构建纸牌游戏但我很难添加简单的动画我有一个 HBox 其中有多个 ImageView 每个图像的右边距为 80 以使图像彼此重叠现在我想在添加卡片时为其添加动画我想将其放置在屏幕上的某个位置对手玩家的手
如何获取与用于在 Windows 中启动关联应用程序的文件相关的完整资源管理器列表？

为了解释让我直接跳到一个例子如果双击 jpeg 它应该会在 Windows 上打开照片查看器应用程序到目前为止这似乎是一个简单的文件关联但是使用箭头键您可以浏览同一文件夹中的其他图片但这并不是基于从文件名中提取简单的路径例如
如何使用 CodeIgniter Active Record 方法添加 ORDER BY 子句？

我有一个非常小的脚本来从数据库表中获取所有记录代码如下 query this gt db gt get this gt table name return query gt result 使用这种语法我将如何添加ORDER BY nam
pyqtgraph选择图形的2D区域作为阈值来重绘图形

我希望添加功能以便用户可以在选择的线条上绘制一个矩形并且图形将刷新以便矩形内的线条保持各自的颜色而外部的任何线条都变成灰色我的代码如下当前在线条上缩放用户定义的矩形的绘图对于 3 行我的实际代码将绘制更多 from pyqt
根据另一列中的值将多列设置为零[重复]

这个问题在这里已经有答案了我这里有一个示例数据集在实际情况中它有一个训练和测试数据集它们都有大约 300 列和 800 行我想根据一列中的某个值过滤掉所有这些行然后从第 3 列设置该行中的所有值例如到第 50 列到零我该怎么
使用 Jinja 过滤器创建内容片段

我想为我的主页创建内容片段示例帖子看起来像 p Your favorite Harry Potter characters enter the Game of Thrones universe and you ll never guess
如何获取用户插入的下载文件名？

在我的 JavaScript 中我使用 a 带有 download 属性的标签让用户下载生成的文件我可以为文件设置默认名称但是用户可能会在将其保存到系统之前更改它有没有办法获取用户在保存对话框中写入的名称这样做的主要原因是当用户
tty_flip_buffer_push() 将数据发送回自身

我正在尝试在 LDD3 中运行tiny tty 当我使用 cat dev ttty0 读取它时没有输出并且命令被阻止检查跟踪我注意到 tty insert flip char 和 tty flip buffer push 都被调用然
如何衡量浏览器布局性能

我正在对大型网络应用程序中的性能回归进行故障排除我最近做了一些更改删除了 IFRAME 并将内容直接放入原始 DOM 中以提高性能确实初始加载时间更好但我发现了一个奇怪的问题通过删除 iframe 各种布局动画和滚动更改似
HashMap 中的生命周期，其中键引用值

我对 Rust 还比较陌生我想编写一个函数该函数将根据给定的闭包从集合创建 HashMap 该闭包从值生成键例如 derive Debug struct Foo id u32 name String let foos vec Foo
XAML 中的 Material Design 覆盖样式不起作用

我在使用 MaterialDesignInXamlToolkit 覆盖非常简单的 TextBox 样式时遇到困难据我所知我已经遵循了覆盖指令致信 App xaml
如何在 Swift 中解析 ISO 8601 持续时间格式？

我有一个函数我用它来格式化字符串该字符串类似于 PT1H3M20S 表示 1 小时 3 分 20 秒在我的函数中我想将字符串格式化为 1 03 20 并且它工作正常但有时我得到像这样的字符串 PT1H20S 这意味着 1 小时
像 PTLsim 这样的 CAS 模拟器如何实现 x86 硬件的周期精确模拟？

谁能告诉我 CAS 软件怎么样http www ptlsim org 工作如果不知道每条指令使用了多少个周期也不知道 CPU 分支预测逻辑那么它们如何实现周期精度或者一切都可以通过保密协议获得吗我想它们可能可以非常准确地命中或错过

像 PTLsim 这样的 CAS 模拟器如何实现 x86 硬件的周期精确模拟？

像 PTLsim 这样的 CAS 模拟器如何实现 x86 硬件的周期精确模拟？ 的相关文章

随机推荐

热门标签

像 PTLsim 这样的 CAS 模拟器如何实现 x86 硬件的周期精确模拟？的相关文章