向零舍入到最接近的 0x50 的简短按位方法？

2024-04-09

我正在尝试修补一个旧的 8 位汇编程序例程（它恰好是 M6800，但这并不是真正特定于机器的）以获取 16 位值并向下舍入到最接近的 0x50（dec 80）倍数。当前代码截断为最接近的32只需做一件事AND 0xE0到低字节，这当然会将低 5 位清零，并在不触及高字节的情况下获得正确的结果。

这是进行一些屏幕数学运算，因此输入值仅在以下范围内0xE000 to 0xE7CF。由于 80 显然不是 2 的幂，所以我不能简单地做到这一点，但考虑到这是一个补丁，我试图将指令数量保持在最低限度，理想情况下不添加通用除法或查找表等。

我很困惑，怀疑没有特别聪明的方法来实现这一点。 80 不是 2 的幂，而是 16 的倍数……这对我一点帮助都没有吗？任何见解、指示等都将受到赞赏。谢谢。

首先，自从80 = 16 * 5, 向下舍入为倍数80表示向下舍入为两者的倍数16 and 5。第一个很容易右移，所以现在我们只剩下mod 5 part:

def mod5(x):
    return x % 5

def round80(x):
    x >>= 4
    x -= mod5(x)
    x <<= 4
    return x

mod5不是那么容易做到的，但是有一个梅森模的巧妙构造 http://homepage.cs.uiowa.edu/%7Ejones/bcd/mod.shtml#exmod5首先计算mod15，然后将值降低到模 5。一开始并不是那么直观，但它只涉及加法和移位，这应该很容易实现。这是Python版本：

def mod15(x):
    x = (x >> 8) + (x & 0xFF)
    x = (x >> 4) + (x & 0xF)
    if x >= 15: x -= 15
    if x >= 15: x -= 15 # (see note)
    return x

def mod5(x):
    x = mod15(x)
    if x >= 5: x -= 5
    if x >= 5: x -= 5
    return x

def round80(x):
    x >>= 4
    x -= mod5(x)
    x <<= 4
    return x

为了安全起见，我验证了此代码的所有可能值：

for i in range(0x10000):
    trivial = i - (i % 80)
    assert trivial == round80(i)

补充一点：第二个if代替mod15实际上可以省略对于您的输入范围，注释掉没有什么区别。如果你需要整个[0,0xffff]范围内，则无法将其删除。

我不是 M6800 汇编方面的专家，所以我不会尝试编写最终代码，但它应该相对简单，特别是考虑到唯一的 16 位操作是两次移位和第一次加法mod15.

没有除法，没有乘法，也没有查找表 - 我希望这足够短，可以满足您的需求！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

向零舍入到最接近的 0x50 的简短按位方法？的相关文章

取消的分支与常规分支有何不同？

特别是对于 SPARC Assembly 取消的分支与常规分支有何不同我一直认为当我需要填充分支指令的 nop 延迟槽时需要取消分支指令但是我认为我在这一部分上是不正确的因为您可以在不取消分支的情况下填充 nop 如果不采用分支
NASM 轮班操作员

您将如何在寄存器上进行 NASM 中的位移位我读了手册它似乎只提到了这些操作员 gt gt lt lt 当我尝试使用它们时 NASM 抱怨移位运算符处理标量值您能解释什么是标量值并举例说明如何使用 gt gt and lt lt 另外
为什么 Visual Studio 使用 xchg ax,ax

我正在查看程序的反汇编因为它崩溃了并注意到很多 xchg ax ax 我用谷歌搜索了一下发现它本质上是一个 nop 但是为什么 Visual Studio 会执行 xchg 而不是 noop 该应用程序是一个C NET3 5 64位应
近调用/跳转表并不总是在引导加载程序中工作

一般问题我一直在开发一个简单的引导加载程序并在某些环境中偶然发现了一个问题在这些环境中此类指令不起作用 mov si call tbl SI Call table pointer call call tbl Call print c
为什么 GCC 不将 a*a*a*a*a*a 优化为 (a*a*a)*(a*a*a)？

我正在对科学应用程序进行一些数值优化我注意到的一件事是 GCC 会优化调用pow a 2 通过将其编译成a a 但是调用pow a 6 没有优化实际会调用库函数pow 这大大降低了性能相比之下英特尔 C 编译器 http en wi
Numpy 的舍入方式与 Python 不同

The code import numpy as np a 5 92270987499999979065 print round a 8 print round np float64 a 8 gives 5 92270987 5 92270
C# 中四舍五入到偶数

我没有看到 Math Round 的预期结果 return Math Round 99 96535789 2 MidpointRounding ToEven returning 99 97 据我了解 MidpointRounding ToE
AVX-512CD（冲突检测）与原子变量访问有何不同？

所以我在看他们展示了如何 void Histogram const float age int const hist const int n const float group width const int m const float o
Python 相当于 Bit Twiddling Hacks 中的 C 代码？

我有一个位计数方法我正在尝试尽可能快地实现我想尝试下面的算法位摆弄黑客 http graphics stanford edu seander bithacks html CountBitsSetParallel 但我不知道 C 什么是
使用 (float&)int 进行类型双关可以正常工作，(float const&)int 会像 (float)int 一样转换吗？

VS2019 发布 x86 template
如何在 Linux x86_64 上模拟 iret

我正在编写一个基于 Intel VT 的调试器由于当 NMI Exiting 1 时 iret 指令在 vmx guest 中的性能发生了变化所以我应该自己处理vmx主机中的NMI 否则 guest会出现nmi可重入错误我查了英特尔手
ARMv8 A64 汇编中立即值的范围

我的理解是 ARMv8 A64 汇编中的立即参数可以是 12 位长如果是这样的话为什么这行汇编代码是 AND X12 X10 0xFEF 产生此错误使用 gcc 编译时 Error immediate out of range at
32 位数字中 1 的数量

我正在寻找一种在 32 位数字中包含 1 数量的方法之间不使用循环任何人都可以帮助我并向我提供代码或算法吗这样做提前致谢 See Integer bitCount int http java sun com javase 6 doc
将位图旋转 90 度

我有一个1 个 64 位整数我需要在 8 x 8 区域中旋转 90 度最好使用直接位操作我想不出任何方便的算法例如这个 0xD000000000000000 110100000000000000000000000000000000
如何将 x86 GCC 风格的 C 内联汇编转换为 Rust 内联汇编？

我在 C 中有以下内联汇编 unsigned long long result asm volatile byte 15 byte 49 shlq 32 rdx orq rdx rax a result rdx return result
如何使用movntdqa避免缓存污染？

我正在尝试编写一个 memcpy 函数该函数不会将源内存加载到 CPU 缓存中目的是避免缓存污染下面的 memcpy 函数可以工作但会像标准 memcpy 一样污染缓存我正在使用带有 Visual C 2008 Express 的
设置 IRQ 映射

我正在遵循一些教程和参考文献来尝试设置我的内核我在教程中遇到了一些不熟悉的代码但根本没有解释它这是我被告知映射的代码16 IRQs 0 15 到 ISR 地点32 47 void irq remap void outportb 0x2
这种没有推送寄存器的交换有多安全？

我对汇编非常陌生下面的代码应该通过两个不同的函数交换两个整数首先使用swap c然后使用swap asm 但我怀疑我是否需要push 我的意思是保存汇编代码之前寄存器的每个值和pop稍后就在返回之前 main 换句话说如果我返回
GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？

只是对标准感到好奇sqrt 来自 GCC 上的 math h 我自己编码的sqrt 使用牛顿拉夫森来做到这一点是的我知道 fsqrt 但CPU是如何做到这一点的呢我无法调试硬件现代 CPU 中的典型 div sqrt 硬件使用 2
32位PPC rlwinm指令

我在理解上有点困难rlwinmPPC 汇编指令旋转左字立即然后与掩码我正在尝试反转函数的这一部分 rlwinm r3 r3 0 28 28 我已经知道什么了r3 is r3在本例中是一个 4 字节整数但我不确定这条指令到底是什么rlw

随机推荐

取消分配准备好的查询

编辑我感谢丹尼尔和丹尼斯问题现在已经解决了正如他们巧妙地指出的那样这种情况下的问题是程序员特别是没有彻底思考我希望我能接受这两个答案注意说我是 postgresql 新手是在侮辱新手我正在编写一个 Web 应用程序它将利
在iPhone编程中从服务器下载mp3文件[重复]

这个问题在这里已经有答案了可能的重复从服务器下载音乐文件并保存在我的应用程序中 https stackoverflow com questions 5620849 download music file from server and
如何在颤振中使用精度对整数进行舍入

我试图使折线图的 Y 轴间隔在颤动中动态化这里MaxVal将获取Y轴的最大值 int interval maxVal 6 toInt int length interval toString length toInt 所以在这里我将 ma
如何组合 List> 中的所有谓词

我有一个问题我相信你能帮助我解决我的皱纹 I have List
如何在 C# WinForms 中的 Label 上编写二次方程？

我们正在制作统计软件我们需要在任何地方放置公式例如ax2 bx c怎么做ax2表示x平方2 我想在x的上侧显示2 与 c 相同我想在后缀处显示 c 您是否有用户可以选择但无法编辑的固定公式列表然后为每个公式生成一个图像将它们存储在
将向量列表添加到 R 中的 data.frame

如何将向量列表添加到预先分配的 data frame 中以便向量形成 data frame 的行 eg ll lt list c 1 2 3 c 2 3 4 dd lt data frame matrix nrow 10 ncol 3 我
无法使用 NGINX Plus 替换 NGINX 作为使用 Kubernetes 的 Google Cloud 上微服务的反向代理

我正在关注this https cloudplatform googleblog com 2016 06 creating a scalable API with microservices html关于如何使用 Kubernetes 在
使用树输出预测 Spark 中梯度提升树情况下的类概率

众所周知 Spark 中的 GBT 目前可以为您提供预测标签我正在考虑尝试计算一个类的预测概率假设所有实例都落在某个叶子下构建 GBT 的代码 import org apache spark SparkContext import o
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
JavaScript 中的空格和空字符串有什么区别

我正在检查用户输入是否留空或不使用我的检查如下所示 function myFunction if nI value length lt 1 alert Field is empty return false else return tru
如何将 Angular Universal 项目部署到标准托管？

我的 Angular Universal 项目在我的本地主机上运行所以现在我想在安装了 Node js 的标准网络托管上测试它我跑了 npm run build 并收到dist文件夹与client and server子文件夹我应该如
如何通过注解配置spring boot，以便在web.xml中有类似的东西？

如何通过注释配置spring boot以获得类似于web xml中的内容
即使使用 withCredentials:true，Axios 也不发送 cookie 数据

尝试使用 React 和 Express 发出请求并发送 cookie 请求响应工作正常但 cookie 并未发送在客户端 import axios from axios let endPoint http 192 168 1 135
Flask 循环依赖

我正在开发一个 Flask 应用程序它仍然相对较小我只有一个 app py 文件但因为我需要进行数据库迁移所以我使用本指南将其分为 3 个 https realpython com blog python flask by exam
避免重复代码的好策略

可以说我有以下场景 public class A public String createString final String value if value null throw new NullPointerException valu
尝试使用 uint*& 作为 const 单元*& 失败：从类型“uint8_t*”的表达式对类型“const uint8_t*&”的引用进行无效初始化

以下代码无法为我编译 gcc 4 6 3 Ubuntu 12 04 include
计算不同的子文档字段并输出为命名键

在 MongoDB 中如果我有一个如下所示的集合 auctionId 22 startDt 2017 08 28T06 00 00 000Z endDt 2017 09 04T06 00 00 000Z status Open picku
Robolectric+Eclipse 找不到资源？

我刚刚为我的 Android 应用程序配置了一个测试项目以使用 Robolectric 我跟着Eclipse 快速入门 http pivotal github com robolectric eclipse quick start html
检查一个数据框列中的值是否存在于第二个数据框中

我有两个数据框 A 和 B 都有一个列 C 我想检查数据框 A 中 C 列中的值是否存在于数据框 B 中 A data frame C c 1 2 3 4 B data frame C c 1 3 4 7 Use in 如下 A C in
向零舍入到最接近的 0x50 的简短按位方法？

我正在尝试修补一个旧的 8 位汇编程序例程它恰好是 M6800 但这并不是真正特定于机器的以获取 16 位值并向下舍入到最接近的 0x50 dec 80 倍数当前代码截断为最接近的32只需做一件事AND 0xE0到低字节这当然会将低

向零舍入到最接近的 0x50 的简短按位方法？

向零舍入到最接近的 0x50 的简短按位方法？ 的相关文章

随机推荐

热门标签

向零舍入到最接近的 0x50 的简短按位方法？的相关文章