assembly - 如何将浮点常量移动到 FP 寄存器中？

因此，我正在使用 A64 指令集以汇编形式的 ARM 进行编程。我正在使用指令 fmov d1, #31.0 将值移动到 dx 寄存器。但是，当我使用 0.0 或任何高于 31.0 的值时，它会显示错误:

"Error: invalid floating-point constant at operand 2 -- `fmov d1,#32.0'"

那么，如何在 A64 上定义浮点常量呢？为什么我不能使用任何大于 31 的值或使用 0？如何用十六进制表示值？

另一个问题是:根据arm's website它支持使用浮点寄存器作为 Bx、Hx、Sx、Dx 和 Qx(分别为 8、16、34、64 和 128 位)，但我不能使用 Bx、Hx 和 Qx 寄存器，它显示:

“错误:操作数不匹配——‘fmov b1，#1.0’”

“错误:所选处理器不支持 `fmov h1,#2.0”

“错误:操作数不匹配——‘fmov q1，#2.0’”

如何正确设置第二个操作数？

最佳答案

fmov 只能使用一组非常小的浮点常量，因为常量在指令中被编码为 8 位立即数。具体来说，它必须可以表示为 ±n/16×2^r，其中 n 是范围内的整数16 ≤ n ≤ 31 且r 是-3 ≤ n ≤ 4 范围内的整数。

ARMv8 Architecture Reference Manual 中给出了受支持数字的确切列表。此外，fmov 仅适用于 16、32 和 64 位数据大小，因为没有ARMv8 指定了 8 位或 128 位浮点格式。对于不支持 FEAT_FP16 的 ARMv8 内核，也不支持 16 位数据大小。 ARMv8 在很多地方都缺乏正交性；并非所有指令都适用于所有操作数大小。

对于一个简单的替代解决方案，使用 ldr 代替文字池中的常量(您需要手动将其转换为整数)。例如，要加载 32.0，请将 32.0 转换为其 IEEE 754 表示，为您提供 0x4040000000000000。然后你可以像这样加载这个常量:

ldr d1, =0x4040000000000000

带有 SIMD&FP 寄存器和文字池中的值的 ldr 指令可用于 32 位、64 位和 128 位操作数大小。较小的操作数大小不适用于文字池寻址模式。如果要加载 8 位或 16 位寄存器，请改为加载相应的 32 位寄存器。

一个稍快的解决方案是首先将所需的数字加载到通用寄存器(支持更灵活地生成立即数)，然后将其移动到 SIMD 和 FP 寄存器中:

mov x0, #0x4040000000000000
fmov d1, x0

要加载 0.0 或掩码，请使用 movi 指令。该指令的合法立即数集取决于操作数的大小。但是对于你的情况，这只是

movi d1, #0

这会清除 d1 寄存器(以及 b1、h1、s1 和 q1 也注册了)。

https://stackoverflow.com/questions/64608307/

python - 为什么我的 Django 表单不是 "valid"？无法获取更新数据库的 POST

java - 给定算法的时间复杂度是多少？

jsf - 用作 JSF 值的 Java 记录

r - 如何在 R Shiny 应用程序中对齐 downloadButton 和 ActionBut

python - 是否可以设置 lint 自定义设置并忽略 pylance

kubernetes - 如何在我的 configmap.yaml (Helm) 中使用 json

algorithm - 如果这个更简单、更快的算法有效，为什么我们需要 Dijkstra 算法？

reactjs - 在 Next.js 中替换查询中的值

android - 如何在 ionic +react + capacitor 项目中设置最低 and