Series comparison

-[Qemu-devel] [PULL 0/5] target-arm queue
+[PULL 00/19] target-arm queue
-Handful of bug fixes to sneak in before rc3.
+Hi; this is one last arm pullreq before the end of the year.
 Mostly minor cleanups, and also implementation of the
 FEAT_XS architectural feature.
 thanks
 -- PMM
-The following changes since commit c985266ea5b50e46e07b3568c1346e10064205c9:
+The following changes since commit 8032c78e556cd0baec111740a6c636863f9bd7c8:
-  Merge remote-tracking branch 'remotes/cohuck/tags/s390x-20190726' into staging (2019-07-26 13:52:06 +0100)
+  Merge tag 'firmware-20241216-pull-request' of https://gitlab.com/kraxel/qemu into staging (2024-12-16 14:20:33 -0500)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20190726
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20241217
-for you to fetch changes up to 67505c114e6acc26f3a1a2b74833c61b6a34ff95:
+for you to fetch changes up to e91254250acb8570bd7b8a8f89d30e6d18291d02:
-  hw/arm/boot: Further improve initrd positioning code (2019-07-26 16:17:56 +0100)
+  tests/functional: update sbsa-ref firmware used in test (2024-12-17 15:21:06 +0000)
 ----------------------------------------------------------------
 target-arm queue:
- * Fix broken migration on pl330 device
+ * remove a line of redundant code
- * Fix broken migration on stellaris-input device
+ * convert various TCG helper fns to use 'fpst' alias
- * Add type checks to vmstate varry macros to avoid this class of bugs
+ * Use float_status in helper_fcvtx_f64_to_f32
- * hw/arm/boot: Fix some remaining cases where we would put the
+ * Use float_status in helper_vfp_fcvt{ds,sd}
-   initrd on top of the kernel image
+ * Implement FEAT_XS
  * hw/intc/arm_gicv3_its: Zero initialize local DTEntry etc structs
  * tests/functional: update sbsa-ref firmware used in test
 ----------------------------------------------------------------
-Damien Hedde (1):
+Denis Rastyogin (1):
-      pl330: fix vmstate description
+      target/arm: remove redundant code
 Manos Pitsidianakis (3):
       target/arm: Add decodetree entry for DSB nXS variant
       target/arm: Enable FEAT_XS for the max cpu
       tests/tcg/aarch64: add system test for FEAT_XS
 Marcin Juszkiewicz (1):
       tests/functional: update sbsa-ref firmware used in test
 Peter Maydell (4):
-      stellaris_input: Fix vmstate description of buttons field
+      target/arm: Implement fine-grained-trap handling for FEAT_XS
-      vmstate.h: Type check VMSTATE_STRUCT_VARRAY macros
+      target/arm: Add ARM_CP_ADD_TLBI_NXS type flag for NXS insns
-      hw/arm/boot: Rename elf_{low, high}_addr to image_{low, high}_addr
+      target/arm: Add ARM_CP_ADD_TLBI_NXS type flag to TLBI insns
-      hw/arm/boot: Further improve initrd positioning code
+      hw/intc/arm_gicv3_its: Zero initialize local DTEntry etc structs
- include/migration/vmstate.h | 30 ++++++++++++++++++++++++------
+Richard Henderson (10):
- hw/arm/boot.c               | 37 +++++++++++++++++++++++++++----------
+      target/arm: Convert vfp_helper.c to fpst alias
- hw/dma/pl330.c              | 17 +++++++++--------
+      target/arm: Convert helper-a64.c to fpst alias
- hw/input/stellaris_input.c  | 10 ++++++----
+      target/arm: Convert vec_helper.c to fpst alias
-files changed, 66 insertions(+), 28 deletions(-)
+      target/arm: Convert neon_helper.c to fpst alias
       target/arm: Convert sve_helper.c to fpst alias
       target/arm: Convert sme_helper.c to fpst alias
       target/arm: Convert vec_helper.c to use env alias
       target/arm: Convert neon_helper.c to use env alias
       target/arm: Use float_status in helper_fcvtx_f64_to_f32
       target/arm: Use float_status in helper_vfp_fcvt{ds,sd}
+ docs/system/arm/emulation.rst            |   1 +
+ target/arm/cpregs.h                      |  80 ++--
+ target/arm/cpu-features.h                |   5 +
+ target/arm/helper.h                      | 638 +++++++++++++++----------------
+ target/arm/tcg/helper-a64.h              | 116 +++---
+ target/arm/tcg/helper-sme.h              |   4 +-
+ target/arm/tcg/helper-sve.h              | 426 ++++++++++-----------
+ target/arm/tcg/a64.decode                |   3 +
+ hw/intc/arm_gicv3_its.c                  |  44 +--
+ target/arm/helper.c                      |  30 +-
+ target/arm/tcg/cpu64.c                   |   1 +
+ target/arm/tcg/helper-a64.c              | 101 ++---
+ target/arm/tcg/neon_helper.c             |  27 +-
+ target/arm/tcg/op_helper.c               |  11 +-
+ target/arm/tcg/sme_helper.c              |   8 +-
+ target/arm/tcg/sve_helper.c              |  96 ++---
+ target/arm/tcg/tlb-insns.c               | 202 ++++++----
+ target/arm/tcg/translate-a64.c           |  26 +-
+ target/arm/tcg/translate-vfp.c           |   4 +-
+ target/arm/tcg/vec_helper.c              |  81 ++--
+ target/arm/vfp_helper.c                  | 130 +++----
+ tests/tcg/aarch64/system/feat-xs.c       |  27 ++
+ tests/functional/test_aarch64_sbsaref.py |  20 +-
+files changed, 1083 insertions(+), 998 deletions(-)
+ create mode 100644 tests/tcg/aarch64/system/feat-xs.c

-New patch
+[PULL 01/19] target/arm: remove redundant code
+From: Denis Rastyogin <gerben@altlinux.org>
+This call is redundant as it only retrieves a value that is not used further.
+Found by Linux Verification Center (linuxtesting.org) with SVACE.
+Signed-off-by: Denis Rastyogin <gerben@altlinux.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241212120618.518369-1-gerben@altlinux.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/vfp_helper.c | 2 --
+file changed, 2 deletions(-)
+diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/vfp_helper.c
++++ b/target/arm/vfp_helper.c
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(rintd)(float64 x, void *fp_status)
+     ret = float64_round_to_int(x, fp_status);
+-    new_flags = get_float_exception_flags(fp_status);
+-
+     /* Suppress any inexact exceptions the conversion produced */
+     if (!(old_flags & float_flag_inexact)) {
+         new_flags = get_float_exception_flags(fp_status);
+--
+.34.1

-New patch
+[PULL 02/19] target/arm: Convert vfp_helper.c to fpst alias
+From: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-id: 20241206031224.78525-3-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/helper.h     | 268 ++++++++++++++++++++--------------------
+ target/arm/vfp_helper.c | 120 ++++++++----------
+files changed, 186 insertions(+), 202 deletions(-)
+diff --git a/target/arm/helper.h b/target/arm/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.h
++++ b/target/arm/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(probe_access, TCG_CALL_NO_WG, void, env, tl, i32, i32, i32)
+ DEF_HELPER_1(vfp_get_fpscr, i32, env)
+ DEF_HELPER_2(vfp_set_fpscr, void, env, i32)
+-DEF_HELPER_3(vfp_addh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_adds, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_addd, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_subh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_subs, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_subd, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_mulh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_muls, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_muld, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_divh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_divs, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_divd, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_maxh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_maxs, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_maxd, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_minh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_mins, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_mind, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_maxnumh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_maxnums, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
+-DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
+-DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
+-DEF_HELPER_2(vfp_sqrth, f16, f16, ptr)
+-DEF_HELPER_2(vfp_sqrts, f32, f32, ptr)
+-DEF_HELPER_2(vfp_sqrtd, f64, f64, ptr)
++DEF_HELPER_3(vfp_addh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_adds, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_addd, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_subh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_subs, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_subd, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_mulh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_muls, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_muld, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_divh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_divs, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_divd, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_maxh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_maxs, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_maxd, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_minh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_mins, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_mind, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_maxnumh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_maxnums, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, fpst)
++DEF_HELPER_3(vfp_minnumh, f16, f16, f16, fpst)
++DEF_HELPER_3(vfp_minnums, f32, f32, f32, fpst)
++DEF_HELPER_3(vfp_minnumd, f64, f64, f64, fpst)
++DEF_HELPER_2(vfp_sqrth, f16, f16, fpst)
++DEF_HELPER_2(vfp_sqrts, f32, f32, fpst)
++DEF_HELPER_2(vfp_sqrtd, f64, f64, fpst)
+ DEF_HELPER_3(vfp_cmph, void, f16, f16, env)
+ DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
+ DEF_HELPER_3(vfp_cmpd, void, f64, f64, env)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_cmped, void, f64, f64, env)
+ DEF_HELPER_2(vfp_fcvtds, f64, f32, env)
+ DEF_HELPER_2(vfp_fcvtsd, f32, f64, env)
+-DEF_HELPER_FLAGS_2(bfcvt, TCG_CALL_NO_RWG, i32, f32, ptr)
+-DEF_HELPER_FLAGS_2(bfcvt_pair, TCG_CALL_NO_RWG, i32, i64, ptr)
++DEF_HELPER_FLAGS_2(bfcvt, TCG_CALL_NO_RWG, i32, f32, fpst)
++DEF_HELPER_FLAGS_2(bfcvt_pair, TCG_CALL_NO_RWG, i32, i64, fpst)
+-DEF_HELPER_2(vfp_uitoh, f16, i32, ptr)
+-DEF_HELPER_2(vfp_uitos, f32, i32, ptr)
+-DEF_HELPER_2(vfp_uitod, f64, i32, ptr)
+-DEF_HELPER_2(vfp_sitoh, f16, i32, ptr)
+-DEF_HELPER_2(vfp_sitos, f32, i32, ptr)
+-DEF_HELPER_2(vfp_sitod, f64, i32, ptr)
++DEF_HELPER_2(vfp_uitoh, f16, i32, fpst)
++DEF_HELPER_2(vfp_uitos, f32, i32, fpst)
++DEF_HELPER_2(vfp_uitod, f64, i32, fpst)
++DEF_HELPER_2(vfp_sitoh, f16, i32, fpst)
++DEF_HELPER_2(vfp_sitos, f32, i32, fpst)
++DEF_HELPER_2(vfp_sitod, f64, i32, fpst)
+-DEF_HELPER_2(vfp_touih, i32, f16, ptr)
+-DEF_HELPER_2(vfp_touis, i32, f32, ptr)
+-DEF_HELPER_2(vfp_touid, i32, f64, ptr)
+-DEF_HELPER_2(vfp_touizh, i32, f16, ptr)
+-DEF_HELPER_2(vfp_touizs, i32, f32, ptr)
+-DEF_HELPER_2(vfp_touizd, i32, f64, ptr)
+-DEF_HELPER_2(vfp_tosih, s32, f16, ptr)
+-DEF_HELPER_2(vfp_tosis, s32, f32, ptr)
+-DEF_HELPER_2(vfp_tosid, s32, f64, ptr)
+-DEF_HELPER_2(vfp_tosizh, s32, f16, ptr)
+-DEF_HELPER_2(vfp_tosizs, s32, f32, ptr)
+-DEF_HELPER_2(vfp_tosizd, s32, f64, ptr)
++DEF_HELPER_2(vfp_touih, i32, f16, fpst)
++DEF_HELPER_2(vfp_touis, i32, f32, fpst)
++DEF_HELPER_2(vfp_touid, i32, f64, fpst)
++DEF_HELPER_2(vfp_touizh, i32, f16, fpst)
++DEF_HELPER_2(vfp_touizs, i32, f32, fpst)
++DEF_HELPER_2(vfp_touizd, i32, f64, fpst)
++DEF_HELPER_2(vfp_tosih, s32, f16, fpst)
++DEF_HELPER_2(vfp_tosis, s32, f32, fpst)
++DEF_HELPER_2(vfp_tosid, s32, f64, fpst)
++DEF_HELPER_2(vfp_tosizh, s32, f16, fpst)
++DEF_HELPER_2(vfp_tosizs, s32, f32, fpst)
++DEF_HELPER_2(vfp_tosizd, s32, f64, fpst)
+-DEF_HELPER_3(vfp_toshh_round_to_zero, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toslh_round_to_zero, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_touhh_round_to_zero, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toulh_round_to_zero, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toshs_round_to_zero, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_tosls_round_to_zero, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_touhs_round_to_zero, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_touls_round_to_zero, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_toshd_round_to_zero, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_tosld_round_to_zero, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_tosqd_round_to_zero, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_touhd_round_to_zero, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_tould_round_to_zero, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_touqd_round_to_zero, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_touhh, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toshh, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toulh, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toslh, i32, f16, i32, ptr)
+-DEF_HELPER_3(vfp_touqh, i64, f16, i32, ptr)
+-DEF_HELPER_3(vfp_tosqh, i64, f16, i32, ptr)
+-DEF_HELPER_3(vfp_toshs, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_tosls, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_tosqs, i64, f32, i32, ptr)
+-DEF_HELPER_3(vfp_touhs, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_touls, i32, f32, i32, ptr)
+-DEF_HELPER_3(vfp_touqs, i64, f32, i32, ptr)
+-DEF_HELPER_3(vfp_toshd, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_tosld, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_tosqd, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_touhd, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_tould, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_touqd, i64, f64, i32, ptr)
+-DEF_HELPER_3(vfp_shtos, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_sltos, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_sqtos, f32, i64, i32, ptr)
+-DEF_HELPER_3(vfp_uhtos, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_ultos, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_uqtos, f32, i64, i32, ptr)
+-DEF_HELPER_3(vfp_shtod, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_sltod, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_sqtod, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_uhtod, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_ultod, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_uqtod, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_shtoh, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_uhtoh, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_sltoh, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_ultoh, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_sqtoh, f16, i64, i32, ptr)
+-DEF_HELPER_3(vfp_uqtoh, f16, i64, i32, ptr)
++DEF_HELPER_3(vfp_toshh_round_to_zero, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_toslh_round_to_zero, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_touhh_round_to_zero, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_toulh_round_to_zero, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_toshs_round_to_zero, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_tosls_round_to_zero, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_touhs_round_to_zero, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_touls_round_to_zero, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_toshd_round_to_zero, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_tosld_round_to_zero, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_tosqd_round_to_zero, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_touhd_round_to_zero, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_tould_round_to_zero, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_touqd_round_to_zero, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_touhh, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_toshh, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_toulh, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_toslh, i32, f16, i32, fpst)
++DEF_HELPER_3(vfp_touqh, i64, f16, i32, fpst)
++DEF_HELPER_3(vfp_tosqh, i64, f16, i32, fpst)
++DEF_HELPER_3(vfp_toshs, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_tosls, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_tosqs, i64, f32, i32, fpst)
++DEF_HELPER_3(vfp_touhs, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_touls, i32, f32, i32, fpst)
++DEF_HELPER_3(vfp_touqs, i64, f32, i32, fpst)
++DEF_HELPER_3(vfp_toshd, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_tosld, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_tosqd, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_touhd, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_tould, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_touqd, i64, f64, i32, fpst)
++DEF_HELPER_3(vfp_shtos, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_sltos, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_sqtos, f32, i64, i32, fpst)
++DEF_HELPER_3(vfp_uhtos, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_ultos, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_uqtos, f32, i64, i32, fpst)
++DEF_HELPER_3(vfp_shtod, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_sltod, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_sqtod, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_uhtod, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_ultod, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_uqtod, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_shtoh, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_uhtoh, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_sltoh, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_ultoh, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_sqtoh, f16, i64, i32, fpst)
++DEF_HELPER_3(vfp_uqtoh, f16, i64, i32, fpst)
+-DEF_HELPER_3(vfp_shtos_round_to_nearest, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_sltos_round_to_nearest, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_uhtos_round_to_nearest, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_ultos_round_to_nearest, f32, i32, i32, ptr)
+-DEF_HELPER_3(vfp_shtod_round_to_nearest, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_sltod_round_to_nearest, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_uhtod_round_to_nearest, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_ultod_round_to_nearest, f64, i64, i32, ptr)
+-DEF_HELPER_3(vfp_shtoh_round_to_nearest, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_uhtoh_round_to_nearest, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_sltoh_round_to_nearest, f16, i32, i32, ptr)
+-DEF_HELPER_3(vfp_ultoh_round_to_nearest, f16, i32, i32, ptr)
++DEF_HELPER_3(vfp_shtos_round_to_nearest, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_sltos_round_to_nearest, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_uhtos_round_to_nearest, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_ultos_round_to_nearest, f32, i32, i32, fpst)
++DEF_HELPER_3(vfp_shtod_round_to_nearest, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_sltod_round_to_nearest, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_uhtod_round_to_nearest, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_ultod_round_to_nearest, f64, i64, i32, fpst)
++DEF_HELPER_3(vfp_shtoh_round_to_nearest, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_uhtoh_round_to_nearest, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_sltoh_round_to_nearest, f16, i32, i32, fpst)
++DEF_HELPER_3(vfp_ultoh_round_to_nearest, f16, i32, i32, fpst)
+-DEF_HELPER_FLAGS_2(set_rmode, TCG_CALL_NO_RWG, i32, i32, ptr)
++DEF_HELPER_FLAGS_2(set_rmode, TCG_CALL_NO_RWG, i32, i32, fpst)
+-DEF_HELPER_FLAGS_3(vfp_fcvt_f16_to_f32, TCG_CALL_NO_RWG, f32, f16, ptr, i32)
+-DEF_HELPER_FLAGS_3(vfp_fcvt_f32_to_f16, TCG_CALL_NO_RWG, f16, f32, ptr, i32)
+-DEF_HELPER_FLAGS_3(vfp_fcvt_f16_to_f64, TCG_CALL_NO_RWG, f64, f16, ptr, i32)
+-DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, ptr, i32)
++DEF_HELPER_FLAGS_3(vfp_fcvt_f16_to_f32, TCG_CALL_NO_RWG, f32, f16, fpst, i32)
++DEF_HELPER_FLAGS_3(vfp_fcvt_f32_to_f16, TCG_CALL_NO_RWG, f16, f32, fpst, i32)
++DEF_HELPER_FLAGS_3(vfp_fcvt_f16_to_f64, TCG_CALL_NO_RWG, f64, f16, fpst, i32)
++DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, fpst, i32)
+-DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
+-DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+-DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
++DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, fpst)
++DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, fpst)
++DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, fpst)
+-DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+-DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+-DEF_HELPER_FLAGS_2(rsqrte_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+-DEF_HELPER_FLAGS_2(rsqrte_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(rsqrte_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
++DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, fpst)
++DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, fpst)
++DEF_HELPER_FLAGS_2(rsqrte_f16, TCG_CALL_NO_RWG, f16, f16, fpst)
++DEF_HELPER_FLAGS_2(rsqrte_f32, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(rsqrte_f64, TCG_CALL_NO_RWG, f64, f64, fpst)
+ DEF_HELPER_FLAGS_1(recpe_u32, TCG_CALL_NO_RWG, i32, i32)
+ DEF_HELPER_FLAGS_1(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32)
+ DEF_HELPER_FLAGS_4(neon_tbl, TCG_CALL_NO_RWG, i64, env, i32, i64, i64)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(shr_cc, i32, env, i32, i32)
+ DEF_HELPER_3(sar_cc, i32, env, i32, i32)
+ DEF_HELPER_3(ror_cc, i32, env, i32, i32)
+-DEF_HELPER_FLAGS_2(rinth_exact, TCG_CALL_NO_RWG, f16, f16, ptr)
+-DEF_HELPER_FLAGS_2(rints_exact, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(rintd_exact, TCG_CALL_NO_RWG, f64, f64, ptr)
+-DEF_HELPER_FLAGS_2(rinth, TCG_CALL_NO_RWG, f16, f16, ptr)
+-DEF_HELPER_FLAGS_2(rints, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(rintd, TCG_CALL_NO_RWG, f64, f64, ptr)
++DEF_HELPER_FLAGS_2(rinth_exact, TCG_CALL_NO_RWG, f16, f16, fpst)
++DEF_HELPER_FLAGS_2(rints_exact, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(rintd_exact, TCG_CALL_NO_RWG, f64, f64, fpst)
++DEF_HELPER_FLAGS_2(rinth, TCG_CALL_NO_RWG, f16, f16, fpst)
++DEF_HELPER_FLAGS_2(rints, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(rintd, TCG_CALL_NO_RWG, f64, f64, fpst)
+ DEF_HELPER_FLAGS_2(vjcvt, TCG_CALL_NO_RWG, i32, f64, env)
+-DEF_HELPER_FLAGS_2(fjcvtzs, TCG_CALL_NO_RWG, i64, f64, ptr)
++DEF_HELPER_FLAGS_2(fjcvtzs, TCG_CALL_NO_RWG, i64, f64, fpst)
+ DEF_HELPER_FLAGS_3(check_hcr_el2_trap, TCG_CALL_NO_WG, void, env, i32, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmlal_idx_a32, TCG_CALL_NO_RWG,
+ DEF_HELPER_FLAGS_5(gvec_fmlal_idx_a64, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_2(frint32_s, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(frint64_s, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(frint32_d, TCG_CALL_NO_RWG, f64, f64, ptr)
+-DEF_HELPER_FLAGS_2(frint64_d, TCG_CALL_NO_RWG, f64, f64, ptr)
++DEF_HELPER_FLAGS_2(frint32_s, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(frint64_s, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(frint32_d, TCG_CALL_NO_RWG, f64, f64, fpst)
++DEF_HELPER_FLAGS_2(frint64_d, TCG_CALL_NO_RWG, f64, f64, fpst)
+ DEF_HELPER_FLAGS_3(gvec_ceq0_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_3(gvec_ceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/vfp_helper.c
++++ b/target/arm/vfp_helper.c
+@@ -XXX,XX +XXX,XX @@ void vfp_set_fpscr(CPUARMState *env, uint32_t val)
+ #define VFP_HELPER(name, p) HELPER(glue(glue(vfp_,name),p))
+ #define VFP_BINOP(name) \
+-dh_ctype_f16 VFP_HELPER(name, h)(dh_ctype_f16 a, dh_ctype_f16 b, void *fpstp) \
++dh_ctype_f16 VFP_HELPER(name, h)(dh_ctype_f16 a, dh_ctype_f16 b, float_status *fpst) \
+ { \
+-    float_status *fpst = fpstp; \
+     return float16_ ## name(a, b, fpst); \
+ } \
+-float32 VFP_HELPER(name, s)(float32 a, float32 b, void *fpstp) \
++float32 VFP_HELPER(name, s)(float32 a, float32 b, float_status *fpst) \
+ { \
+-    float_status *fpst = fpstp; \
+     return float32_ ## name(a, b, fpst); \
+ } \
+-float64 VFP_HELPER(name, d)(float64 a, float64 b, void *fpstp) \
++float64 VFP_HELPER(name, d)(float64 a, float64 b, float_status *fpst) \
+ { \
+-    float_status *fpst = fpstp; \
+     return float64_ ## name(a, b, fpst); \
+ }
+ VFP_BINOP(add)
+@@ -XXX,XX +XXX,XX @@ VFP_BINOP(minnum)
+ VFP_BINOP(maxnum)
+ #undef VFP_BINOP
+-dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, void *fpstp)
++dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, float_status *fpst)
+ {
+-    return float16_sqrt(a, fpstp);
++    return float16_sqrt(a, fpst);
+ }
+-float32 VFP_HELPER(sqrt, s)(float32 a, void *fpstp)
++float32 VFP_HELPER(sqrt, s)(float32 a, float_status *fpst)
+ {
+-    return float32_sqrt(a, fpstp);
++    return float32_sqrt(a, fpst);
+ }
+-float64 VFP_HELPER(sqrt, d)(float64 a, void *fpstp)
++float64 VFP_HELPER(sqrt, d)(float64 a, float_status *fpst)
+ {
+-    return float64_sqrt(a, fpstp);
++    return float64_sqrt(a, fpst);
+ }
+ static void softfloat_to_vfp_compare(CPUARMState *env, FloatRelation cmp)
+@@ -XXX,XX +XXX,XX @@ DO_VFP_cmp(d, float64, float64, fp_status)
+ /* Integer to float and float to integer conversions */
+ #define CONV_ITOF(name, ftype, fsz, sign)                           \
+-ftype HELPER(name)(uint32_t x, void *fpstp)                         \
++ftype HELPER(name)(uint32_t x, float_status *fpst)                  \
+ {                                                                   \
+-    float_status *fpst = fpstp;                                     \
+     return sign##int32_to_##float##fsz((sign##int32_t)x, fpst);     \
+ }
+ #define CONV_FTOI(name, ftype, fsz, sign, round)                \
+-sign##int32_t HELPER(name)(ftype x, void *fpstp)                \
++sign##int32_t HELPER(name)(ftype x, float_status *fpst)         \
+ {                                                               \
+-    float_status *fpst = fpstp;                                 \
+     if (float##fsz##_is_any_nan(x)) {                           \
+         float_raise(float_flag_invalid, fpst);                  \
+         return 0;                                               \
+@@ -XXX,XX +XXX,XX @@ float32 VFP_HELPER(fcvts, d)(float64 x, CPUARMState *env)
+     return float64_to_float32(x, &env->vfp.fp_status);
+ }
+-uint32_t HELPER(bfcvt)(float32 x, void *status)
++uint32_t HELPER(bfcvt)(float32 x, float_status *status)
+ {
+     return float32_to_bfloat16(x, status);
+ }
+-uint32_t HELPER(bfcvt_pair)(uint64_t pair, void *status)
++uint32_t HELPER(bfcvt_pair)(uint64_t pair, float_status *status)
+ {
+     bfloat16 lo = float32_to_bfloat16(extract64(pair, 0, 32), status);
+     bfloat16 hi = float32_to_bfloat16(extract64(pair, 32, 32), status);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(bfcvt_pair)(uint64_t pair, void *status)
+  */
+ #define VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)            \
+ ftype HELPER(vfp_##name##to##p)(uint##isz##_t  x, uint32_t shift,      \
+-                                     void *fpstp) \
+-{ return itype##_to_##float##fsz##_scalbn(x, -shift, fpstp); }
++                                float_status *fpst)                    \
++{ return itype##_to_##float##fsz##_scalbn(x, -shift, fpst); }
+ #define VFP_CONV_FIX_FLOAT_ROUND(name, p, fsz, ftype, isz, itype)      \
+     ftype HELPER(vfp_##name##to##p##_round_to_nearest)(uint##isz##_t  x, \
+                                                      uint32_t shift,   \
+-                                                     void *fpstp)      \
++                                                     float_status *fpst) \
+     {                                                                  \
+         ftype ret;                                                     \
+-        float_status *fpst = fpstp;                                    \
+         FloatRoundMode oldmode = fpst->float_rounding_mode;            \
+         fpst->float_rounding_mode = float_round_nearest_even;          \
+-        ret = itype##_to_##float##fsz##_scalbn(x, -shift, fpstp);      \
++        ret = itype##_to_##float##fsz##_scalbn(x, -shift, fpst);       \
+         fpst->float_rounding_mode = oldmode;                           \
+         return ret;                                                    \
+     }
+ #define VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype, ROUND, suff) \
+ uint##isz##_t HELPER(vfp_to##name##p##suff)(ftype x, uint32_t shift,      \
+-                                            void *fpst)                   \
++                                            float_status *fpst)           \
+ {                                                                         \
+     if (unlikely(float##fsz##_is_any_nan(x))) {                           \
+         float_raise(float_flag_invalid, fpst);                            \
+@@ -XXX,XX +XXX,XX @@ VFP_CONV_FLOAT_FIX_ROUND(uq, d, 64, float64, 64, uint64,
+ /* Set the current fp rounding mode and return the old one.
+  * The argument is a softfloat float_round_ value.
+  */
+-uint32_t HELPER(set_rmode)(uint32_t rmode, void *fpstp)
++uint32_t HELPER(set_rmode)(uint32_t rmode, float_status *fp_status)
+ {
+-    float_status *fp_status = fpstp;
+-
+     uint32_t prev_rmode = get_float_rounding_mode(fp_status);
+     set_float_rounding_mode(rmode, fp_status);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(set_rmode)(uint32_t rmode, void *fpstp)
+ }
+ /* Half precision conversions.  */
+-float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, void *fpstp, uint32_t ahp_mode)
++float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, float_status *fpst,
++                                    uint32_t ahp_mode)
+ {
+     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
+      * it would affect flushing input denormals.
+      */
+-    float_status *fpst = fpstp;
+     bool save = get_flush_inputs_to_zero(fpst);
+     set_flush_inputs_to_zero(false, fpst);
+     float32 r = float16_to_float32(a, !ahp_mode, fpst);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, void *fpstp, uint32_t ahp_mode)
+     return r;
+ }
+-uint32_t HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
++uint32_t HELPER(vfp_fcvt_f32_to_f16)(float32 a, float_status *fpst,
++                                     uint32_t ahp_mode)
+ {
+     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
+      * it would affect flushing output denormals.
+      */
+-    float_status *fpst = fpstp;
+     bool save = get_flush_to_zero(fpst);
+     set_flush_to_zero(false, fpst);
+     float16 r = float32_to_float16(a, !ahp_mode, fpst);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
+     return r;
+ }
+-float64 HELPER(vfp_fcvt_f16_to_f64)(uint32_t a, void *fpstp, uint32_t ahp_mode)
++float64 HELPER(vfp_fcvt_f16_to_f64)(uint32_t a, float_status *fpst,
++                                    uint32_t ahp_mode)
+ {
+     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
+      * it would affect flushing input denormals.
+      */
+-    float_status *fpst = fpstp;
+     bool save = get_flush_inputs_to_zero(fpst);
+     set_flush_inputs_to_zero(false, fpst);
+     float64 r = float16_to_float64(a, !ahp_mode, fpst);
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(vfp_fcvt_f16_to_f64)(uint32_t a, void *fpstp, uint32_t ahp_mode)
+     return r;
+ }
+-uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
++uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, float_status *fpst,
++                                     uint32_t ahp_mode)
+ {
+     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
+      * it would affect flushing output denormals.
+      */
+-    float_status *fpst = fpstp;
+     bool save = get_flush_to_zero(fpst);
+     set_flush_to_zero(false, fpst);
+     float16 r = float64_to_float16(a, !ahp_mode, fpst);
+@@ -XXX,XX +XXX,XX @@ static bool round_to_inf(float_status *fpst, bool sign_bit)
+     }
+ }
+-uint32_t HELPER(recpe_f16)(uint32_t input, void *fpstp)
++uint32_t HELPER(recpe_f16)(uint32_t input, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float16 f16 = float16_squash_input_denormal(input, fpst);
+     uint32_t f16_val = float16_val(f16);
+     uint32_t f16_sign = float16_is_neg(f16);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(recpe_f16)(uint32_t input, void *fpstp)
+     return make_float16(f16_val);
+ }
+-float32 HELPER(recpe_f32)(float32 input, void *fpstp)
++float32 HELPER(recpe_f32)(float32 input, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float32 f32 = float32_squash_input_denormal(input, fpst);
+     uint32_t f32_val = float32_val(f32);
+     bool f32_sign = float32_is_neg(f32);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(recpe_f32)(float32 input, void *fpstp)
+     return make_float32(f32_val);
+ }
+-float64 HELPER(recpe_f64)(float64 input, void *fpstp)
++float64 HELPER(recpe_f64)(float64 input, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float64 f64 = float64_squash_input_denormal(input, fpst);
+     uint64_t f64_val = float64_val(f64);
+     bool f64_sign = float64_is_neg(f64);
+@@ -XXX,XX +XXX,XX @@ static uint64_t recip_sqrt_estimate(int *exp , int exp_off, uint64_t frac)
+     return extract64(estimate, 0, 8) << 44;
+ }
+-uint32_t HELPER(rsqrte_f16)(uint32_t input, void *fpstp)
++uint32_t HELPER(rsqrte_f16)(uint32_t input, float_status *s)
+ {
+-    float_status *s = fpstp;
+     float16 f16 = float16_squash_input_denormal(input, s);
+     uint16_t val = float16_val(f16);
+     bool f16_sign = float16_is_neg(f16);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(rsqrte_f16)(uint32_t input, void *fpstp)
+         if (float16_is_signaling_nan(f16, s)) {
+             float_raise(float_flag_invalid, s);
+             if (!s->default_nan_mode) {
+-                nan = float16_silence_nan(f16, fpstp);
++                nan = float16_silence_nan(f16, s);
+             }
+         }
+         if (s->default_nan_mode) {
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(rsqrte_f16)(uint32_t input, void *fpstp)
+     return make_float16(val);
+ }
+-float32 HELPER(rsqrte_f32)(float32 input, void *fpstp)
++float32 HELPER(rsqrte_f32)(float32 input, float_status *s)
+ {
+-    float_status *s = fpstp;
+     float32 f32 = float32_squash_input_denormal(input, s);
+     uint32_t val = float32_val(f32);
+     uint32_t f32_sign = float32_is_neg(f32);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(rsqrte_f32)(float32 input, void *fpstp)
+         if (float32_is_signaling_nan(f32, s)) {
+             float_raise(float_flag_invalid, s);
+             if (!s->default_nan_mode) {
+-                nan = float32_silence_nan(f32, fpstp);
++                nan = float32_silence_nan(f32, s);
+             }
+         }
+         if (s->default_nan_mode) {
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(rsqrte_f32)(float32 input, void *fpstp)
+     return make_float32(val);
+ }
+-float64 HELPER(rsqrte_f64)(float64 input, void *fpstp)
++float64 HELPER(rsqrte_f64)(float64 input, float_status *s)
+ {
+-    float_status *s = fpstp;
+     float64 f64 = float64_squash_input_denormal(input, s);
+     uint64_t val = float64_val(f64);
+     bool f64_sign = float64_is_neg(f64);
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrte_f64)(float64 input, void *fpstp)
+         if (float64_is_signaling_nan(f64, s)) {
+             float_raise(float_flag_invalid, s);
+             if (!s->default_nan_mode) {
+-                nan = float64_silence_nan(f64, fpstp);
++                nan = float64_silence_nan(f64, s);
+             }
+         }
+         if (s->default_nan_mode) {
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(rsqrte_u32)(uint32_t a)
+ /* VFPv4 fused multiply-accumulate */
+ dh_ctype_f16 VFP_HELPER(muladd, h)(dh_ctype_f16 a, dh_ctype_f16 b,
+-                                   dh_ctype_f16 c, void *fpstp)
++                                   dh_ctype_f16 c, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return float16_muladd(a, b, c, 0, fpst);
+ }
+-float32 VFP_HELPER(muladd, s)(float32 a, float32 b, float32 c, void *fpstp)
++float32 VFP_HELPER(muladd, s)(float32 a, float32 b, float32 c,
++                              float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return float32_muladd(a, b, c, 0, fpst);
+ }
+-float64 VFP_HELPER(muladd, d)(float64 a, float64 b, float64 c, void *fpstp)
++float64 VFP_HELPER(muladd, d)(float64 a, float64 b, float64 c,
++                              float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return float64_muladd(a, b, c, 0, fpst);
+ }
+ /* ARMv8 round to integral */
+-dh_ctype_f16 HELPER(rinth_exact)(dh_ctype_f16 x, void *fp_status)
++dh_ctype_f16 HELPER(rinth_exact)(dh_ctype_f16 x, float_status *fp_status)
+ {
+     return float16_round_to_int(x, fp_status);
+ }
+-float32 HELPER(rints_exact)(float32 x, void *fp_status)
++float32 HELPER(rints_exact)(float32 x, float_status *fp_status)
+ {
+     return float32_round_to_int(x, fp_status);
+ }
+-float64 HELPER(rintd_exact)(float64 x, void *fp_status)
++float64 HELPER(rintd_exact)(float64 x, float_status *fp_status)
+ {
+     return float64_round_to_int(x, fp_status);
+ }
+-dh_ctype_f16 HELPER(rinth)(dh_ctype_f16 x, void *fp_status)
++dh_ctype_f16 HELPER(rinth)(dh_ctype_f16 x, float_status *fp_status)
+ {
+     int old_flags = get_float_exception_flags(fp_status), new_flags;
+     float16 ret;
+@@ -XXX,XX +XXX,XX @@ dh_ctype_f16 HELPER(rinth)(dh_ctype_f16 x, void *fp_status)
+     return ret;
+ }
+-float32 HELPER(rints)(float32 x, void *fp_status)
++float32 HELPER(rints)(float32 x, float_status *fp_status)
+ {
+     int old_flags = get_float_exception_flags(fp_status), new_flags;
+     float32 ret;
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(rints)(float32 x, void *fp_status)
+     return ret;
+ }
+-float64 HELPER(rintd)(float64 x, void *fp_status)
++float64 HELPER(rintd)(float64 x, float_status *fp_status)
+ {
+     int old_flags = get_float_exception_flags(fp_status), new_flags;
+     float64 ret;
+@@ -XXX,XX +XXX,XX @@ const FloatRoundMode arm_rmode_to_sf_map[] = {
+  * Implement float64 to int32_t conversion without saturation;
+  * the result is supplied modulo 2^32.
+  */
+-uint64_t HELPER(fjcvtzs)(float64 value, void *vstatus)
++uint64_t HELPER(fjcvtzs)(float64 value, float_status *status)
+ {
+-    float_status *status = vstatus;
+     uint32_t frac, e_old, e_new;
+     bool inexact;
+@@ -XXX,XX +XXX,XX @@ static float32 frint_s(float32 f, float_status *fpst, int intsize)
+     return (0x100u + 126u + intsize) << 23;
+ }
+-float32 HELPER(frint32_s)(float32 f, void *fpst)
++float32 HELPER(frint32_s)(float32 f, float_status *fpst)
+ {
+     return frint_s(f, fpst, 32);
+ }
+-float32 HELPER(frint64_s)(float32 f, void *fpst)
++float32 HELPER(frint64_s)(float32 f, float_status *fpst)
+ {
+     return frint_s(f, fpst, 64);
+ }
+@@ -XXX,XX +XXX,XX @@ static float64 frint_d(float64 f, float_status *fpst, int intsize)
+     return (uint64_t)(0x800 + 1022 + intsize) << 52;
+ }
+-float64 HELPER(frint32_d)(float64 f, void *fpst)
++float64 HELPER(frint32_d)(float64 f, float_status *fpst)
+ {
+     return frint_d(f, fpst, 32);
+ }
+-float64 HELPER(frint64_d)(float64 f, void *fpst)
++float64 HELPER(frint64_d)(float64 f, float_status *fpst)
+ {
+     return frint_d(f, fpst, 64);
+ }
+--
+.34.1

-New patch
+[PULL 03/19] target/arm: Convert helper-a64.c to fpst alias
+From: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-id: 20241206031224.78525-4-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/helper-a64.h | 94 +++++++++++++++++------------------
+ target/arm/tcg/helper-a64.c | 98 +++++++++++++------------------------
+files changed, 80 insertions(+), 112 deletions(-)
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.h
++++ b/target/arm/tcg/helper-a64.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(msr_i_spsel, void, env, i32)
+ DEF_HELPER_2(msr_i_daifset, void, env, i32)
+ DEF_HELPER_2(msr_i_daifclear, void, env, i32)
+ DEF_HELPER_1(msr_set_allint_el1, void, env)
+-DEF_HELPER_3(vfp_cmph_a64, i64, f16, f16, ptr)
+-DEF_HELPER_3(vfp_cmpeh_a64, i64, f16, f16, ptr)
+-DEF_HELPER_3(vfp_cmps_a64, i64, f32, f32, ptr)
+-DEF_HELPER_3(vfp_cmpes_a64, i64, f32, f32, ptr)
+-DEF_HELPER_3(vfp_cmpd_a64, i64, f64, f64, ptr)
+-DEF_HELPER_3(vfp_cmped_a64, i64, f64, f64, ptr)
++DEF_HELPER_3(vfp_cmph_a64, i64, f16, f16, fpst)
++DEF_HELPER_3(vfp_cmpeh_a64, i64, f16, f16, fpst)
++DEF_HELPER_3(vfp_cmps_a64, i64, f32, f32, fpst)
++DEF_HELPER_3(vfp_cmpes_a64, i64, f32, f32, fpst)
++DEF_HELPER_3(vfp_cmpd_a64, i64, f64, f64, fpst)
++DEF_HELPER_3(vfp_cmped_a64, i64, f64, f64, fpst)
+ DEF_HELPER_FLAGS_4(simd_tblx, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_3(vfp_mulxs, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
+-DEF_HELPER_FLAGS_3(vfp_mulxd, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+-DEF_HELPER_FLAGS_3(neon_ceq_f64, TCG_CALL_NO_RWG, i64, i64, i64, ptr)
+-DEF_HELPER_FLAGS_3(neon_cge_f64, TCG_CALL_NO_RWG, i64, i64, i64, ptr)
+-DEF_HELPER_FLAGS_3(neon_cgt_f64, TCG_CALL_NO_RWG, i64, i64, i64, ptr)
+-DEF_HELPER_FLAGS_3(recpsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-DEF_HELPER_FLAGS_3(recpsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
+-DEF_HELPER_FLAGS_3(recpsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+-DEF_HELPER_FLAGS_3(rsqrtsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-DEF_HELPER_FLAGS_3(rsqrtsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
+-DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+-DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+-DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+-DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
++DEF_HELPER_FLAGS_3(vfp_mulxs, TCG_CALL_NO_RWG, f32, f32, f32, fpst)
++DEF_HELPER_FLAGS_3(vfp_mulxd, TCG_CALL_NO_RWG, f64, f64, f64, fpst)
++DEF_HELPER_FLAGS_3(neon_ceq_f64, TCG_CALL_NO_RWG, i64, i64, i64, fpst)
++DEF_HELPER_FLAGS_3(neon_cge_f64, TCG_CALL_NO_RWG, i64, i64, i64, fpst)
++DEF_HELPER_FLAGS_3(neon_cgt_f64, TCG_CALL_NO_RWG, i64, i64, i64, fpst)
++DEF_HELPER_FLAGS_3(recpsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
++DEF_HELPER_FLAGS_3(recpsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, fpst)
++DEF_HELPER_FLAGS_3(recpsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, fpst)
++DEF_HELPER_FLAGS_3(rsqrtsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
++DEF_HELPER_FLAGS_3(rsqrtsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, fpst)
++DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, fpst)
++DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, fpst)
++DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, fpst)
++DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, fpst)
+ DEF_HELPER_FLAGS_2(fcvtx_f64_to_f32, TCG_CALL_NO_RWG, f32, f64, env)
+ DEF_HELPER_FLAGS_3(crc32_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
+ DEF_HELPER_FLAGS_3(crc32c_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
+-DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-DEF_HELPER_FLAGS_3(advsimd_minh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-DEF_HELPER_FLAGS_3(advsimd_maxnumh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-DEF_HELPER_FLAGS_3(advsimd_minnumh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_addh, f16, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_subh, f16, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_mulh, f16, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_divh, f16, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_ceq_f16, i32, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_cge_f16, i32, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_cgt_f16, i32, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_acge_f16, i32, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_acgt_f16, i32, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_mulxh, f16, f16, f16, ptr)
+-DEF_HELPER_4(advsimd_muladdh, f16, f16, f16, f16, ptr)
+-DEF_HELPER_3(advsimd_add2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_sub2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_mul2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_div2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_max2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_min2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_maxnum2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_minnum2h, i32, i32, i32, ptr)
+-DEF_HELPER_3(advsimd_mulx2h, i32, i32, i32, ptr)
+-DEF_HELPER_4(advsimd_muladd2h, i32, i32, i32, i32, ptr)
+-DEF_HELPER_2(advsimd_rinth_exact, f16, f16, ptr)
+-DEF_HELPER_2(advsimd_rinth, f16, f16, ptr)
++DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
++DEF_HELPER_FLAGS_3(advsimd_minh, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
++DEF_HELPER_FLAGS_3(advsimd_maxnumh, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
++DEF_HELPER_FLAGS_3(advsimd_minnumh, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
++DEF_HELPER_3(advsimd_addh, f16, f16, f16, fpst)
++DEF_HELPER_3(advsimd_subh, f16, f16, f16, fpst)
++DEF_HELPER_3(advsimd_mulh, f16, f16, f16, fpst)
++DEF_HELPER_3(advsimd_divh, f16, f16, f16, fpst)
++DEF_HELPER_3(advsimd_ceq_f16, i32, f16, f16, fpst)
++DEF_HELPER_3(advsimd_cge_f16, i32, f16, f16, fpst)
++DEF_HELPER_3(advsimd_cgt_f16, i32, f16, f16, fpst)
++DEF_HELPER_3(advsimd_acge_f16, i32, f16, f16, fpst)
++DEF_HELPER_3(advsimd_acgt_f16, i32, f16, f16, fpst)
++DEF_HELPER_3(advsimd_mulxh, f16, f16, f16, fpst)
++DEF_HELPER_4(advsimd_muladdh, f16, f16, f16, f16, fpst)
++DEF_HELPER_3(advsimd_add2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_sub2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_mul2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_div2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_max2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_min2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_maxnum2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_minnum2h, i32, i32, i32, fpst)
++DEF_HELPER_3(advsimd_mulx2h, i32, i32, i32, fpst)
++DEF_HELPER_4(advsimd_muladd2h, i32, i32, i32, i32, fpst)
++DEF_HELPER_2(advsimd_rinth_exact, f16, f16, fpst)
++DEF_HELPER_2(advsimd_rinth, f16, f16, fpst)
+ DEF_HELPER_2(exception_return, void, env, i64)
+ DEF_HELPER_FLAGS_2(dc_zva, TCG_CALL_NO_WG, void, env, i64)
+diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.c
++++ b/target/arm/tcg/helper-a64.c
+@@ -XXX,XX +XXX,XX @@ static inline uint32_t float_rel_to_flags(int res)
+     return flags;
+ }
+-uint64_t HELPER(vfp_cmph_a64)(uint32_t x, uint32_t y, void *fp_status)
++uint64_t HELPER(vfp_cmph_a64)(uint32_t x, uint32_t y, float_status *fp_status)
+ {
+     return float_rel_to_flags(float16_compare_quiet(x, y, fp_status));
+ }
+-uint64_t HELPER(vfp_cmpeh_a64)(uint32_t x, uint32_t y, void *fp_status)
++uint64_t HELPER(vfp_cmpeh_a64)(uint32_t x, uint32_t y, float_status *fp_status)
+ {
+     return float_rel_to_flags(float16_compare(x, y, fp_status));
+ }
+-uint64_t HELPER(vfp_cmps_a64)(float32 x, float32 y, void *fp_status)
++uint64_t HELPER(vfp_cmps_a64)(float32 x, float32 y, float_status *fp_status)
+ {
+     return float_rel_to_flags(float32_compare_quiet(x, y, fp_status));
+ }
+-uint64_t HELPER(vfp_cmpes_a64)(float32 x, float32 y, void *fp_status)
++uint64_t HELPER(vfp_cmpes_a64)(float32 x, float32 y, float_status *fp_status)
+ {
+     return float_rel_to_flags(float32_compare(x, y, fp_status));
+ }
+-uint64_t HELPER(vfp_cmpd_a64)(float64 x, float64 y, void *fp_status)
++uint64_t HELPER(vfp_cmpd_a64)(float64 x, float64 y, float_status *fp_status)
+ {
+     return float_rel_to_flags(float64_compare_quiet(x, y, fp_status));
+ }
+-uint64_t HELPER(vfp_cmped_a64)(float64 x, float64 y, void *fp_status)
++uint64_t HELPER(vfp_cmped_a64)(float64 x, float64 y, float_status *fp_status)
+ {
+     return float_rel_to_flags(float64_compare(x, y, fp_status));
+ }
+-float32 HELPER(vfp_mulxs)(float32 a, float32 b, void *fpstp)
++float32 HELPER(vfp_mulxs)(float32 a, float32 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float32_squash_input_denormal(a, fpst);
+     b = float32_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(vfp_mulxs)(float32 a, float32 b, void *fpstp)
+     return float32_mul(a, b, fpst);
+ }
+-float64 HELPER(vfp_mulxd)(float64 a, float64 b, void *fpstp)
++float64 HELPER(vfp_mulxd)(float64 a, float64 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float64_squash_input_denormal(a, fpst);
+     b = float64_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(vfp_mulxd)(float64 a, float64 b, void *fpstp)
+ }
+ /* 64bit/double versions of the neon float compare functions */
+-uint64_t HELPER(neon_ceq_f64)(float64 a, float64 b, void *fpstp)
++uint64_t HELPER(neon_ceq_f64)(float64 a, float64 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return -float64_eq_quiet(a, b, fpst);
+ }
+-uint64_t HELPER(neon_cge_f64)(float64 a, float64 b, void *fpstp)
++uint64_t HELPER(neon_cge_f64)(float64 a, float64 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return -float64_le(b, a, fpst);
+ }
+-uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, void *fpstp)
++uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return -float64_lt(b, a, fpst);
+ }
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, void *fpstp)
+  * multiply-add-and-halve.
+  */
+-uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float16_squash_input_denormal(a, fpst);
+     b = float16_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, void *fpstp)
+     return float16_muladd(a, b, float16_two, 0, fpst);
+ }
+-float32 HELPER(recpsf_f32)(float32 a, float32 b, void *fpstp)
++float32 HELPER(recpsf_f32)(float32 a, float32 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float32_squash_input_denormal(a, fpst);
+     b = float32_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(recpsf_f32)(float32 a, float32 b, void *fpstp)
+     return float32_muladd(a, b, float32_two, 0, fpst);
+ }
+-float64 HELPER(recpsf_f64)(float64 a, float64 b, void *fpstp)
++float64 HELPER(recpsf_f64)(float64 a, float64 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float64_squash_input_denormal(a, fpst);
+     b = float64_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(recpsf_f64)(float64 a, float64 b, void *fpstp)
+     return float64_muladd(a, b, float64_two, 0, fpst);
+ }
+-uint32_t HELPER(rsqrtsf_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(rsqrtsf_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float16_squash_input_denormal(a, fpst);
+     b = float16_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(rsqrtsf_f16)(uint32_t a, uint32_t b, void *fpstp)
+     return float16_muladd(a, b, float16_three, float_muladd_halve_result, fpst);
+ }
+-float32 HELPER(rsqrtsf_f32)(float32 a, float32 b, void *fpstp)
++float32 HELPER(rsqrtsf_f32)(float32 a, float32 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float32_squash_input_denormal(a, fpst);
+     b = float32_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(rsqrtsf_f32)(float32 a, float32 b, void *fpstp)
+     return float32_muladd(a, b, float32_three, float_muladd_halve_result, fpst);
+ }
+-float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, void *fpstp)
++float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float64_squash_input_denormal(a, fpst);
+     b = float64_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, void *fpstp)
+ }
+ /* Floating-point reciprocal exponent - see FPRecpX in ARM ARM */
+-uint32_t HELPER(frecpx_f16)(uint32_t a, void *fpstp)
++uint32_t HELPER(frecpx_f16)(uint32_t a, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     uint16_t val16, sbit;
+     int16_t exp;
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(frecpx_f16)(uint32_t a, void *fpstp)
+     }
+ }
+-float32 HELPER(frecpx_f32)(float32 a, void *fpstp)
++float32 HELPER(frecpx_f32)(float32 a, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     uint32_t val32, sbit;
+     int32_t exp;
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(frecpx_f32)(float32 a, void *fpstp)
+     }
+ }
+-float64 HELPER(frecpx_f64)(float64 a, void *fpstp)
++float64 HELPER(frecpx_f64)(float64 a, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     uint64_t val64, sbit;
+     int64_t exp;
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(crc32c_64)(uint64_t acc, uint64_t val, uint32_t bytes)
+ #define ADVSIMD_HELPER(name, suffix) HELPER(glue(glue(advsimd_, name), suffix))
+ #define ADVSIMD_HALFOP(name) \
+-uint32_t ADVSIMD_HELPER(name, h)(uint32_t a, uint32_t b, void *fpstp) \
++uint32_t ADVSIMD_HELPER(name, h)(uint32_t a, uint32_t b, float_status *fpst) \
+ { \
+-    float_status *fpst = fpstp; \
+     return float16_ ## name(a, b, fpst);    \
+ }
+@@ -XXX,XX +XXX,XX @@ ADVSIMD_HALFOP(minnum)
+ ADVSIMD_HALFOP(maxnum)
+ #define ADVSIMD_TWOHALFOP(name)                                         \
+-uint32_t ADVSIMD_HELPER(name, 2h)(uint32_t two_a, uint32_t two_b, void *fpstp) \
++uint32_t ADVSIMD_HELPER(name, 2h)(uint32_t two_a, uint32_t two_b,       \
++                                  float_status *fpst)                   \
+ { \
+     float16  a1, a2, b1, b2;                        \
+     uint32_t r1, r2;                                \
+-    float_status *fpst = fpstp;                     \
+     a1 = extract32(two_a, 0, 16);                   \
+     a2 = extract32(two_a, 16, 16);                  \
+     b1 = extract32(two_b, 0, 16);                   \
+@@ -XXX,XX +XXX,XX @@ ADVSIMD_TWOHALFOP(minnum)
+ ADVSIMD_TWOHALFOP(maxnum)
+ /* Data processing - scalar floating-point and advanced SIMD */
+-static float16 float16_mulx(float16 a, float16 b, void *fpstp)
++static float16 float16_mulx(float16 a, float16 b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+-
+     a = float16_squash_input_denormal(a, fpst);
+     b = float16_squash_input_denormal(b, fpst);
+@@ -XXX,XX +XXX,XX @@ ADVSIMD_TWOHALFOP(mulx)
+ /* fused multiply-accumulate */
+ uint32_t HELPER(advsimd_muladdh)(uint32_t a, uint32_t b, uint32_t c,
+-                                 void *fpstp)
++                                 float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return float16_muladd(a, b, c, 0, fpst);
+ }
+ uint32_t HELPER(advsimd_muladd2h)(uint32_t two_a, uint32_t two_b,
+-                                  uint32_t two_c, void *fpstp)
++                                  uint32_t two_c, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float16  a1, a2, b1, b2, c1, c2;
+     uint32_t r1, r2;
+     a1 = extract32(two_a, 0, 16);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_muladd2h)(uint32_t two_a, uint32_t two_b,
+ #define ADVSIMD_CMPRES(test) (test) ? 0xffff : 0
+-uint32_t HELPER(advsimd_ceq_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(advsimd_ceq_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     int compare = float16_compare_quiet(a, b, fpst);
+     return ADVSIMD_CMPRES(compare == float_relation_equal);
+ }
+-uint32_t HELPER(advsimd_cge_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(advsimd_cge_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     int compare = float16_compare(a, b, fpst);
+     return ADVSIMD_CMPRES(compare == float_relation_greater ||
+                           compare == float_relation_equal);
+ }
+-uint32_t HELPER(advsimd_cgt_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(advsimd_cgt_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     int compare = float16_compare(a, b, fpst);
+     return ADVSIMD_CMPRES(compare == float_relation_greater);
+ }
+-uint32_t HELPER(advsimd_acge_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(advsimd_acge_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float16 f0 = float16_abs(a);
+     float16 f1 = float16_abs(b);
+     int compare = float16_compare(f0, f1, fpst);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_acge_f16)(uint32_t a, uint32_t b, void *fpstp)
+                           compare == float_relation_equal);
+ }
+-uint32_t HELPER(advsimd_acgt_f16)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(advsimd_acgt_f16)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float16 f0 = float16_abs(a);
+     float16 f1 = float16_abs(b);
+     int compare = float16_compare(f0, f1, fpst);
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_acgt_f16)(uint32_t a, uint32_t b, void *fpstp)
+ }
+ /* round to integral */
+-uint32_t HELPER(advsimd_rinth_exact)(uint32_t x, void *fp_status)
++uint32_t HELPER(advsimd_rinth_exact)(uint32_t x, float_status *fp_status)
+ {
+     return float16_round_to_int(x, fp_status);
+ }
+-uint32_t HELPER(advsimd_rinth)(uint32_t x, void *fp_status)
++uint32_t HELPER(advsimd_rinth)(uint32_t x, float_status *fp_status)
+ {
+     int old_flags = get_float_exception_flags(fp_status), new_flags;
+     float16 ret;
+--
+.34.1

-New patch
+[PULL 04/19] target/arm: Convert vec_helper.c to fpst alias
+From: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-id: 20241206031224.78525-5-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/helper.h         | 284 ++++++++++++++++++------------------
+ target/arm/tcg/helper-a64.h |  18 +--
+ target/arm/tcg/helper-sve.h |  12 +-
+ target/arm/tcg/vec_helper.c |  60 ++++----
+files changed, 183 insertions(+), 191 deletions(-)
+diff --git a/target/arm/helper.h b/target/arm/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.h
++++ b/target/arm/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_usdot_idx_b, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_5(gvec_fcaddh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fcadds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fcaddd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fcmlah, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fcmlah_idx, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fcmlas, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fcmlas_idx, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fcmlad, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_sstoh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_sitos, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_ustoh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_uitos, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_tosszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_tosizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_touszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_sstoh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_sitos, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_ustoh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_uitos, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_tosszh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_tosizs, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_touszh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_sf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rz_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rz_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_sf, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_fs, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_fu, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_sh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hs, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rz_ds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rz_du, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_sd, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_ds, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_du, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sd, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ud, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_vrint_rm_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vrint_rm_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vrint_rm_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vrint_rm_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_vrintx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_vrintx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vrintx_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_vrintx_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcgt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fcgt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcge0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fcge0_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fceq0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fceq0_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fcle0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fcle0_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_4(gvec_fclt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_4(gvec_fclt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fsub_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fsub_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fsub_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fsub_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fsub_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fsub_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fceq_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fceq_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fceq_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fceq_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fceq_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fceq_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fcge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fcge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fcge_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fcge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fcge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fcge_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fcgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fcgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fcgt_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fcgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fcgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fcgt_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_facge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_facge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_facge_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_facge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_facge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_facge_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_facgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_facgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_facgt_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_facgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_facgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_facgt_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmax_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmax_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmax_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmax_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmax_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmax_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmin_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmin_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmin_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmin_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmin_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmin_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxnum_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxnum_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminnum_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fminnum_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_recps_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_recps_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_recps_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_recps_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmls_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmls_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmls_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmls_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_vfma_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_vfma_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_vfma_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_vfma_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_vfma_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_vfma_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_vfms_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_vfms_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_vfms_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_vfms_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_vfms_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_vfms_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_ftsmul_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmul_idx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmul_idx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmul_idx_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmla_nf_idx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmla_nf_idx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmls_nf_idx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_fmls_nf_idx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fmla_idx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fmla_idx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_fmla_idx_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_uqadd_b, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(gvec_bfmmla, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_FLAGS_6(gvec_bfmlal, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(gvec_bfmlal_idx, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_sclamp_b, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_uclamp_s, TCG_CALL_NO_RWG,
+ DEF_HELPER_FLAGS_5(gvec_uclamp_d, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_faddp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_faddp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_faddp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_faddp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_faddp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_faddp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fminp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fminp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fminp_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxnump_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxnump_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmaxnump_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxnump_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxnump_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmaxnump_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminnump_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminnump_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fminnump_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fminnump_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fminnump_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fminnump_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(gvec_addp_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_4(gvec_addp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.h
++++ b/target/arm/tcg/helper-a64.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(cpyfe, void, env, i32, i32, i32)
+ DEF_HELPER_FLAGS_1(guarded_page_check, TCG_CALL_NO_WG, void, env)
+ DEF_HELPER_FLAGS_2(guarded_page_br, TCG_CALL_NO_RWG, void, env, tl)
+-DEF_HELPER_FLAGS_5(gvec_fdiv_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fdiv_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fdiv_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fdiv_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fdiv_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fdiv_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmulx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmulx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmulx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmulx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmulx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmulx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmulx_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmulx_idx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(gvec_fmulx_idx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_fmulx_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmulx_idx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(gvec_fmulx_idx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+diff --git a/target/arm/tcg/helper-sve.h b/target/arm/tcg/helper-sve.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-sve.h
++++ b/target/arm/tcg/helper-sve.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_umini_s, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ DEF_HELPER_FLAGS_4(sve_umini_d, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ DEF_HELPER_FLAGS_5(gvec_recps_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_recps_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_recps_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_rsqrts_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_faddv_h, TCG_CALL_NO_RWG,
+                    i64, ptr, ptr, ptr, i32)
+diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/vec_helper.c
++++ b/target/arm/tcg/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ DO_DOT_IDX(gvec_sdot_idx_h, int64_t, int16_t, int16_t, H8)
+ DO_DOT_IDX(gvec_udot_idx_h, uint64_t, uint16_t, uint16_t, H8)
+ void HELPER(gvec_fcaddh)(void *vd, void *vn, void *vm,
+-                         void *vfpst, uint32_t desc)
++                         float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float16 *d = vd;
+     float16 *n = vn;
+     float16 *m = vm;
+-    float_status *fpst = vfpst;
+     uint32_t neg_real = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint32_t neg_imag = neg_real ^ 1;
+     uintptr_t i;
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcaddh)(void *vd, void *vn, void *vm,
+ }
+ void HELPER(gvec_fcadds)(void *vd, void *vn, void *vm,
+-                         void *vfpst, uint32_t desc)
++                         float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float32 *d = vd;
+     float32 *n = vn;
+     float32 *m = vm;
+-    float_status *fpst = vfpst;
+     uint32_t neg_real = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint32_t neg_imag = neg_real ^ 1;
+     uintptr_t i;
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcadds)(void *vd, void *vn, void *vm,
+ }
+ void HELPER(gvec_fcaddd)(void *vd, void *vn, void *vm,
+-                         void *vfpst, uint32_t desc)
++                         float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float64 *d = vd;
+     float64 *n = vn;
+     float64 *m = vm;
+-    float_status *fpst = vfpst;
+     uint64_t neg_real = extract64(desc, SIMD_DATA_SHIFT, 1);
+     uint64_t neg_imag = neg_real ^ 1;
+     uintptr_t i;
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcaddd)(void *vd, void *vn, void *vm,
+ }
+ void HELPER(gvec_fcmlah)(void *vd, void *vn, void *vm, void *va,
+-                         void *vfpst, uint32_t desc)
++                         float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float16 *d = vd, *n = vn, *m = vm, *a = va;
+-    float_status *fpst = vfpst;
+     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+     uint32_t neg_real = flip ^ neg_imag;
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlah)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(gvec_fcmlah_idx)(void *vd, void *vn, void *vm, void *va,
+-                             void *vfpst, uint32_t desc)
++                             float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float16 *d = vd, *n = vn, *m = vm, *a = va;
+-    float_status *fpst = vfpst;
+     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+     intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlah_idx)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(gvec_fcmlas)(void *vd, void *vn, void *vm, void *va,
+-                         void *vfpst, uint32_t desc)
++                         float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float32 *d = vd, *n = vn, *m = vm, *a = va;
+-    float_status *fpst = vfpst;
+     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+     uint32_t neg_real = flip ^ neg_imag;
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlas)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(gvec_fcmlas_idx)(void *vd, void *vn, void *vm, void *va,
+-                             void *vfpst, uint32_t desc)
++                             float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float32 *d = vd, *n = vn, *m = vm, *a = va;
+-    float_status *fpst = vfpst;
+     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+     intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlas_idx)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(gvec_fcmlad)(void *vd, void *vn, void *vm, void *va,
+-                         void *vfpst, uint32_t desc)
++                         float_status *fpst, uint32_t desc)
+ {
+     uintptr_t opr_sz = simd_oprsz(desc);
+     float64 *d = vd, *n = vn, *m = vm, *a = va;
+-    float_status *fpst = vfpst;
+     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
+     uint64_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+     uint64_t neg_real = flip ^ neg_imag;
+@@ -XXX,XX +XXX,XX @@ static uint64_t float64_acgt(float64 op1, float64 op2, float_status *stat)
+     return -float64_lt(float64_abs(op2), float64_abs(op1), stat);
+ }
+-static int16_t vfp_tosszh(float16 x, void *fpstp)
++static int16_t vfp_tosszh(float16 x, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     if (float16_is_any_nan(x)) {
+         float_raise(float_flag_invalid, fpst);
+         return 0;
+@@ -XXX,XX +XXX,XX @@ static int16_t vfp_tosszh(float16 x, void *fpstp)
+     return float16_to_int16_round_to_zero(x, fpst);
+ }
+-static uint16_t vfp_touszh(float16 x, void *fpstp)
++static uint16_t vfp_touszh(float16 x, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     if (float16_is_any_nan(x)) {
+         float_raise(float_flag_invalid, fpst);
+         return 0;
+@@ -XXX,XX +XXX,XX @@ static uint16_t vfp_touszh(float16 x, void *fpstp)
+ }
+ #define DO_2OP(NAME, FUNC, TYPE) \
+-void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
++void HELPER(NAME)(void *vd, void *vn, float_status *stat, uint32_t desc)  \
+ {                                                                 \
+     intptr_t i, oprsz = simd_oprsz(desc);                         \
+     TYPE *d = vd, *n = vn;                                        \
+@@ -XXX,XX +XXX,XX @@ static float32 float32_rsqrts_nf(float32 op1, float32 op2, float_status *stat)
+ }
+ #define DO_3OP(NAME, FUNC, TYPE) \
+-void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
++void HELPER(NAME)(void *vd, void *vn, void *vm,                            \
++                  float_status *stat, uint32_t desc)                       \
+ {                                                                          \
+     intptr_t i, oprsz = simd_oprsz(desc);                                  \
+     TYPE *d = vd, *n = vn, *m = vm;                                        \
+@@ -XXX,XX +XXX,XX @@ static float64 float64_mulsub_f(float64 dest, float64 op1, float64 op2,
+     return float64_muladd(float64_chs(op1), op2, dest, 0, stat);
+ }
+-#define DO_MULADD(NAME, FUNC, TYPE)                                     \
+-void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
++#define DO_MULADD(NAME, FUNC, TYPE)                                        \
++void HELPER(NAME)(void *vd, void *vn, void *vm,                            \
++                  float_status *stat, uint32_t desc)                       \
+ {                                                                          \
+     intptr_t i, oprsz = simd_oprsz(desc);                                  \
+     TYPE *d = vd, *n = vn, *m = vm;                                        \
+@@ -XXX,XX +XXX,XX @@ DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -, H8)
+ #undef DO_MLA_IDX
+ #define DO_FMUL_IDX(NAME, ADD, MUL, TYPE, H)                               \
+-void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
++void HELPER(NAME)(void *vd, void *vn, void *vm,                            \
++                  float_status *stat, uint32_t desc)                       \
+ {                                                                          \
+     intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+     intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
+@@ -XXX,XX +XXX,XX @@ DO_FMUL_IDX(gvec_fmls_nf_idx_s, float32_sub, float32_mul, float32, H4)
+ #define DO_FMLA_IDX(NAME, TYPE, H)                                         \
+ void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
+-                  void *stat, uint32_t desc)                               \
++                  float_status *stat, uint32_t desc)                       \
+ {                                                                          \
+     intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+     intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
+@@ -XXX,XX +XXX,XX @@ DO_ABA(gvec_uaba_d, uint64_t)
+ #undef DO_ABA
+ #define DO_3OP_PAIR(NAME, FUNC, TYPE, H) \
+-void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
++void HELPER(NAME)(void *vd, void *vn, void *vm,                            \
++                  float_status *stat, uint32_t desc)                       \
+ {                                                                          \
+     ARMVectorReg scratch;                                                  \
+     intptr_t oprsz = simd_oprsz(desc);                                     \
+@@ -XXX,XX +XXX,XX @@ DO_3OP_PAIR(gvec_uminp_s, MIN, uint32_t, H4)
+ #undef DO_3OP_PAIR
+ #define DO_VCVT_FIXED(NAME, FUNC, TYPE)                                 \
+-    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
++    void HELPER(NAME)(void *vd, void *vn, float_status *stat, uint32_t desc) \
+     {                                                                   \
+         intptr_t i, oprsz = simd_oprsz(desc);                           \
+         int shift = simd_data(desc);                                    \
+@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_rz_hu, helper_vfp_touhh_round_to_zero, uint16_t)
+ #undef DO_VCVT_FIXED
+ #define DO_VCVT_RMODE(NAME, FUNC, TYPE)                                 \
+-    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
++    void HELPER(NAME)(void *vd, void *vn, float_status *fpst, uint32_t desc) \
+     {                                                                   \
+-        float_status *fpst = stat;                                      \
+         intptr_t i, oprsz = simd_oprsz(desc);                           \
+         uint32_t rmode = simd_data(desc);                               \
+         uint32_t prev_rmode = get_float_rounding_mode(fpst);            \
+@@ -XXX,XX +XXX,XX @@ DO_VCVT_RMODE(gvec_vcvt_rm_uh, helper_vfp_touhh, uint16_t)
+ #undef DO_VCVT_RMODE
+ #define DO_VRINT_RMODE(NAME, FUNC, TYPE)                                \
+-    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
++    void HELPER(NAME)(void *vd, void *vn, float_status *fpst, uint32_t desc) \
+     {                                                                   \
+-        float_status *fpst = stat;                                      \
+         intptr_t i, oprsz = simd_oprsz(desc);                           \
+         uint32_t rmode = simd_data(desc);                               \
+         uint32_t prev_rmode = get_float_rounding_mode(fpst);            \
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_bfmmla)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(gvec_bfmlal)(void *vd, void *vn, void *vm, void *va,
+-                         void *stat, uint32_t desc)
++                         float_status *stat, uint32_t desc)
+ {
+     intptr_t i, opr_sz = simd_oprsz(desc);
+     intptr_t sel = simd_data(desc);
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_bfmlal)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(gvec_bfmlal_idx)(void *vd, void *vn, void *vm,
+-                             void *va, void *stat, uint32_t desc)
++                             void *va, float_status *stat, uint32_t desc)
+ {
+     intptr_t i, j, opr_sz = simd_oprsz(desc);
+     intptr_t sel = extract32(desc, SIMD_DATA_SHIFT, 1);
+--
+.34.1

-New patch
+[PULL 05/19] target/arm: Convert neon_helper.c to fpst alias
+From: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-id: 20241206031224.78525-6-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/helper.h          | 14 +++++++-------
+ target/arm/tcg/neon_helper.c | 21 +++++++--------------
+files changed, 14 insertions(+), 21 deletions(-)
+diff --git a/target/arm/helper.h b/target/arm/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.h
++++ b/target/arm/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(neon_qneg_s16, TCG_CALL_NO_RWG, i32, env, i32)
+ DEF_HELPER_FLAGS_2(neon_qneg_s32, TCG_CALL_NO_RWG, i32, env, i32)
+ DEF_HELPER_FLAGS_2(neon_qneg_s64, TCG_CALL_NO_RWG, i64, env, i64)
+-DEF_HELPER_3(neon_ceq_f32, i32, i32, i32, ptr)
+-DEF_HELPER_3(neon_cge_f32, i32, i32, i32, ptr)
+-DEF_HELPER_3(neon_cgt_f32, i32, i32, i32, ptr)
+-DEF_HELPER_3(neon_acge_f32, i32, i32, i32, ptr)
+-DEF_HELPER_3(neon_acgt_f32, i32, i32, i32, ptr)
+-DEF_HELPER_3(neon_acge_f64, i64, i64, i64, ptr)
+-DEF_HELPER_3(neon_acgt_f64, i64, i64, i64, ptr)
++DEF_HELPER_3(neon_ceq_f32, i32, i32, i32, fpst)
++DEF_HELPER_3(neon_cge_f32, i32, i32, i32, fpst)
++DEF_HELPER_3(neon_cgt_f32, i32, i32, i32, fpst)
++DEF_HELPER_3(neon_acge_f32, i32, i32, i32, fpst)
++DEF_HELPER_3(neon_acgt_f32, i32, i32, i32, fpst)
++DEF_HELPER_3(neon_acge_f64, i64, i64, i64, fpst)
++DEF_HELPER_3(neon_acgt_f64, i64, i64, i64, fpst)
+ /* iwmmxt_helper.c */
+ DEF_HELPER_2(iwmmxt_maddsq, i64, i64, i64)
+diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/neon_helper.c
++++ b/target/arm/tcg/neon_helper.c
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_qneg_s64)(CPUARMState *env, uint64_t x)
+  * Note that EQ doesn't signal InvalidOp for QNaNs but GE and GT do.
+  * Softfloat routines return 0/1, which we convert to the 0/-1 Neon requires.
+  */
+-uint32_t HELPER(neon_ceq_f32)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(neon_ceq_f32)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return -float32_eq_quiet(make_float32(a), make_float32(b), fpst);
+ }
+-uint32_t HELPER(neon_cge_f32)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(neon_cge_f32)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return -float32_le(make_float32(b), make_float32(a), fpst);
+ }
+-uint32_t HELPER(neon_cgt_f32)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(neon_cgt_f32)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     return -float32_lt(make_float32(b), make_float32(a), fpst);
+ }
+-uint32_t HELPER(neon_acge_f32)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(neon_acge_f32)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float32 f0 = float32_abs(make_float32(a));
+     float32 f1 = float32_abs(make_float32(b));
+     return -float32_le(f1, f0, fpst);
+ }
+-uint32_t HELPER(neon_acgt_f32)(uint32_t a, uint32_t b, void *fpstp)
++uint32_t HELPER(neon_acgt_f32)(uint32_t a, uint32_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float32 f0 = float32_abs(make_float32(a));
+     float32 f1 = float32_abs(make_float32(b));
+     return -float32_lt(f1, f0, fpst);
+ }
+-uint64_t HELPER(neon_acge_f64)(uint64_t a, uint64_t b, void *fpstp)
++uint64_t HELPER(neon_acge_f64)(uint64_t a, uint64_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float64 f0 = float64_abs(make_float64(a));
+     float64 f1 = float64_abs(make_float64(b));
+     return -float64_le(f1, f0, fpst);
+ }
+-uint64_t HELPER(neon_acgt_f64)(uint64_t a, uint64_t b, void *fpstp)
++uint64_t HELPER(neon_acgt_f64)(uint64_t a, uint64_t b, float_status *fpst)
+ {
+-    float_status *fpst = fpstp;
+     float64 f0 = float64_abs(make_float64(a));
+     float64 f1 = float64_abs(make_float64(b));
+     return -float64_lt(f1, f0, fpst);
+--
+.34.1

-New patch
+[PULL 06/19] target/arm: Convert sve_helper.c to fpst alias
+From: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-id: 20241206031224.78525-7-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/helper-sve.h | 414 ++++++++++++++++++------------------
+ target/arm/tcg/sve_helper.c |  96 +++++----
+files changed, 258 insertions(+), 252 deletions(-)
+diff --git a/target/arm/tcg/helper-sve.h b/target/arm/tcg/helper-sve.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-sve.h
++++ b/target/arm/tcg/helper-sve.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_faddv_h, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_faddv_s, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_faddv_d, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fmaxnmv_h, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fmaxnmv_s, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fmaxnmv_d, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fminnmv_h, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fminnmv_s, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fminnmv_d, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fmaxv_h, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fmaxv_s, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fmaxv_d, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fminv_h, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fminv_s, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve_fminv_d, TCG_CALL_NO_RWG,
+-                   i64, ptr, ptr, ptr, i32)
++                   i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fadda_h, TCG_CALL_NO_RWG,
+-                   i64, i64, ptr, ptr, ptr, i32)
++                   i64, i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fadda_s, TCG_CALL_NO_RWG,
+-                   i64, i64, ptr, ptr, ptr, i32)
++                   i64, i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fadda_d, TCG_CALL_NO_RWG,
+-                   i64, i64, ptr, ptr, ptr, i32)
++                   i64, i64, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmge0_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmge0_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmge0_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmgt0_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmgt0_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmgt0_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmlt0_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmlt0_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmlt0_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmle0_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmle0_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmle0_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmeq0_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmeq0_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmeq0_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmne0_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmne0_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcmne0_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fadd_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fadd_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fadd_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsub_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsub_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsub_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmul_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmul_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmul_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fdiv_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fdiv_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fdiv_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmin_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmin_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmin_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmax_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmax_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmax_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fminnum_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fminnum_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fminnum_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxnum_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxnum_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxnum_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fabd_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fabd_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fabd_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fscalbn_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fscalbn_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fscalbn_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmulx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmulx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmulx_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fadds_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fadds_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fadds_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsubs_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsubs_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsubs_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmuls_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmuls_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmuls_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsubrs_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsubrs_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fsubrs_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxnms_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxnms_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxnms_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fminnms_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fminnms_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fminnms_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxs_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxs_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmaxs_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmins_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmins_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fmins_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, i64, ptr, i32)
++                   void, ptr, ptr, ptr, i64, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvt_sh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvt_dh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvt_hs, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvt_ds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvt_hd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvt_sd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_bfcvt, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_hh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_hs, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_ss, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_ds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_hd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_sd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzs_dd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_hh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_hs, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_ss, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_ds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_hd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_sd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fcvtzu_dd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frint_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frint_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frint_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frintx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frintx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frintx_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frecpx_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frecpx_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_frecpx_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fsqrt_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fsqrt_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_fsqrt_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_dh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_ss, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_sd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_ds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_scvt_dd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_hh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_sh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_dh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_ss, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_sd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_ds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_ucvt_dd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmge_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmge_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmge_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmgt_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmgt_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmgt_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmeq_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmeq_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmeq_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmne_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmne_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmne_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmuo_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmuo_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcmuo_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_facge_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_facge_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_facge_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_facgt_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_facgt_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_facgt_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcadd_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcadd_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve_fcadd_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fmla_zpzzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fmla_zpzzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fmla_zpzzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fmls_zpzzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fmls_zpzzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fmls_zpzzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fnmla_zpzzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fnmla_zpzzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fnmla_zpzzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fnmls_zpzzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fnmls_zpzzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fnmls_zpzzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fcmla_zpzzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fcmla_zpzzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sve_fcmla_zpzzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(sve_ftmad_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(sve_ftmad_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(sve_ftmad_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(sve_ftmad_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(sve_ftmad_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(sve_ftmad_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve2_saddl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_4(sve2_saddl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve2_xar_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_4(sve2_xar_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_6(sve2_faddp_zpzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_faddp_zpzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_faddp_zpzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fmaxnmp_zpzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fmaxnmp_zpzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fmaxnmp_zpzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fminnmp_zpzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fminnmp_zpzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fminnmp_zpzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fmaxp_zpzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fmaxp_zpzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fmaxp_zpzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fminp_zpzz_h, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fminp_zpzz_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_6(sve2_fminp_zpzz_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve2_eor3, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_5(sve2_bcax, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve2_sqrdcmlah_zzzz_s, TCG_CALL_NO_RWG,
+ DEF_HELPER_FLAGS_5(sve2_sqrdcmlah_zzzz_d, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_6(fmmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_6(fmmla_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_6(fmmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_6(fmmla_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve2_sqrdmlah_idx_h, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve2_cdot_idx_d, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_5(sve2_fcvtnt_sh, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve2_fcvtnt_ds, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve_bfcvtnt, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve2_fcvtlt_hs, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_5(sve2_fcvtlt_sd, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, fpst, i32)
+-DEF_HELPER_FLAGS_5(flogb_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(flogb_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(flogb_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(flogb_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(flogb_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
++DEF_HELPER_FLAGS_5(flogb_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_4(sve2_sqshl_zpzi_b, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, i32)
+diff --git a/target/arm/tcg/sve_helper.c b/target/arm/tcg/sve_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/sve_helper.c
++++ b/target/arm/tcg/sve_helper.c
+@@ -XXX,XX +XXX,XX @@ DO_ZPZZ_PAIR_D(sve2_sminp_zpzz_d, int64_t, DO_MIN)
+ #define DO_ZPZZ_PAIR_FP(NAME, TYPE, H, OP)                              \
+ void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg,               \
+-                  void *status, uint32_t desc)                          \
++                  float_status *status, uint32_t desc)                  \
+ {                                                                       \
+     intptr_t i, opr_sz = simd_oprsz(desc);                              \
+     for (i = 0; i < opr_sz; ) {                                         \
+@@ -XXX,XX +XXX,XX @@ static TYPE NAME##_reduce(TYPE *data, float_status *status, uintptr_t n) \
+         return TYPE##_##FUNC(lo, hi, status);                         \
+     }                                                                 \
+ }                                                                     \
+-uint64_t HELPER(NAME)(void *vn, void *vg, void *vs, uint32_t desc)    \
++uint64_t HELPER(NAME)(void *vn, void *vg, float_status *s, uint32_t desc) \
+ {                                                                     \
+     uintptr_t i, oprsz = simd_oprsz(desc), maxsz = simd_data(desc);   \
+     TYPE data[sizeof(ARMVectorReg) / sizeof(TYPE)];                   \
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(NAME)(void *vn, void *vg, void *vs, uint32_t desc)    \
+     for (; i < maxsz; i += sizeof(TYPE)) {                            \
+         *(TYPE *)((void *)data + i) = IDENT;                          \
+     }                                                                 \
+-    return NAME##_reduce(data, vs, maxsz / sizeof(TYPE));             \
++    return NAME##_reduce(data, s, maxsz / sizeof(TYPE));              \
+ }
+ DO_REDUCE(sve_faddv_h, float16, H1_2, add, float16_zero)
+@@ -XXX,XX +XXX,XX @@ DO_REDUCE(sve_fmaxv_d, float64, H1_8, max, float64_chs(float64_infinity))
+ #undef DO_REDUCE
+ uint64_t HELPER(sve_fadda_h)(uint64_t nn, void *vm, void *vg,
+-                             void *status, uint32_t desc)
++                             float_status *status, uint32_t desc)
+ {
+     intptr_t i = 0, opr_sz = simd_oprsz(desc);
+     float16 result = nn;
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sve_fadda_h)(uint64_t nn, void *vm, void *vg,
+ }
+ uint64_t HELPER(sve_fadda_s)(uint64_t nn, void *vm, void *vg,
+-                             void *status, uint32_t desc)
++                             float_status *status, uint32_t desc)
+ {
+     intptr_t i = 0, opr_sz = simd_oprsz(desc);
+     float32 result = nn;
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sve_fadda_s)(uint64_t nn, void *vm, void *vg,
+ }
+ uint64_t HELPER(sve_fadda_d)(uint64_t nn, void *vm, void *vg,
+-                             void *status, uint32_t desc)
++                             float_status *status, uint32_t desc)
+ {
+     intptr_t i = 0, opr_sz = simd_oprsz(desc) / 8;
+     uint64_t *m = vm;
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sve_fadda_d)(uint64_t nn, void *vm, void *vg,
+  */
+ #define DO_ZPZZ_FP(NAME, TYPE, H, OP)                           \
+ void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg,       \
+-                  void *status, uint32_t desc)                  \
++                  float_status *status, uint32_t desc)          \
+ {                                                               \
+     intptr_t i = simd_oprsz(desc);                              \
+     uint64_t *g = vg;                                           \
+@@ -XXX,XX +XXX,XX @@ DO_ZPZZ_FP(sve_fmulx_d, uint64_t, H1_8, helper_vfp_mulxd)
+  */
+ #define DO_ZPZS_FP(NAME, TYPE, H, OP) \
+ void HELPER(NAME)(void *vd, void *vn, void *vg, uint64_t scalar,  \
+-                  void *status, uint32_t desc)                    \
++                  float_status *status, uint32_t desc)            \
+ {                                                                 \
+     intptr_t i = simd_oprsz(desc);                                \
+     uint64_t *g = vg;                                             \
+@@ -XXX,XX +XXX,XX @@ DO_ZPZS_FP(sve_fmins_d, float64, H1_8, float64_min)
+  * With the extra float_status parameter.
+  */
+ #define DO_ZPZ_FP(NAME, TYPE, H, OP)                                  \
+-void HELPER(NAME)(void *vd, void *vn, void *vg, void *status, uint32_t desc) \
++void HELPER(NAME)(void *vd, void *vn, void *vg,                       \
++                  float_status *status, uint32_t desc)                \
+ {                                                                     \
+     intptr_t i = simd_oprsz(desc);                                    \
+     uint64_t *g = vg;                                                 \
+@@ -XXX,XX +XXX,XX @@ static void do_fmla_zpzzz_h(void *vd, void *vn, void *vm, void *va, void *vg,
+ }
+ void HELPER(sve_fmla_zpzzz_h)(void *vd, void *vn, void *vm, void *va,
+-                              void *vg, void *status, uint32_t desc)
++                              void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_h(vd, vn, vm, va, vg, status, desc, 0, 0);
+ }
+ void HELPER(sve_fmls_zpzzz_h)(void *vd, void *vn, void *vm, void *va,
+-                              void *vg, void *status, uint32_t desc)
++                              void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_h(vd, vn, vm, va, vg, status, desc, 0x8000, 0);
+ }
+ void HELPER(sve_fnmla_zpzzz_h)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_h(vd, vn, vm, va, vg, status, desc, 0x8000, 0x8000);
+ }
+ void HELPER(sve_fnmls_zpzzz_h)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_h(vd, vn, vm, va, vg, status, desc, 0, 0x8000);
+ }
+@@ -XXX,XX +XXX,XX @@ static void do_fmla_zpzzz_s(void *vd, void *vn, void *vm, void *va, void *vg,
+ }
+ void HELPER(sve_fmla_zpzzz_s)(void *vd, void *vn, void *vm, void *va,
+-                              void *vg, void *status, uint32_t desc)
++                              void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_s(vd, vn, vm, va, vg, status, desc, 0, 0);
+ }
+ void HELPER(sve_fmls_zpzzz_s)(void *vd, void *vn, void *vm, void *va,
+-                              void *vg, void *status, uint32_t desc)
++                              void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_s(vd, vn, vm, va, vg, status, desc, 0x80000000, 0);
+ }
+ void HELPER(sve_fnmla_zpzzz_s)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_s(vd, vn, vm, va, vg, status, desc, 0x80000000, 0x80000000);
+ }
+ void HELPER(sve_fnmls_zpzzz_s)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_s(vd, vn, vm, va, vg, status, desc, 0, 0x80000000);
+ }
+@@ -XXX,XX +XXX,XX @@ static void do_fmla_zpzzz_d(void *vd, void *vn, void *vm, void *va, void *vg,
+ }
+ void HELPER(sve_fmla_zpzzz_d)(void *vd, void *vn, void *vm, void *va,
+-                              void *vg, void *status, uint32_t desc)
++                              void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_d(vd, vn, vm, va, vg, status, desc, 0, 0);
+ }
+ void HELPER(sve_fmls_zpzzz_d)(void *vd, void *vn, void *vm, void *va,
+-                              void *vg, void *status, uint32_t desc)
++                              void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_d(vd, vn, vm, va, vg, status, desc, INT64_MIN, 0);
+ }
+ void HELPER(sve_fnmla_zpzzz_d)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_d(vd, vn, vm, va, vg, status, desc, INT64_MIN, INT64_MIN);
+ }
+ void HELPER(sve_fnmls_zpzzz_d)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     do_fmla_zpzzz_d(vd, vn, vm, va, vg, status, desc, 0, INT64_MIN);
+ }
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fnmls_zpzzz_d)(void *vd, void *vn, void *vm, void *va,
+  */
+ #define DO_FPCMP_PPZZ(NAME, TYPE, H, OP)                                \
+ void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg,               \
+-                  void *status, uint32_t desc)                          \
++                  float_status *status, uint32_t desc)                  \
+ {                                                                       \
+     intptr_t i = simd_oprsz(desc), j = (i - 1) >> 6;                    \
+     uint64_t *d = vd, *g = vg;                                          \
+@@ -XXX,XX +XXX,XX @@ DO_FPCMP_PPZZ_ALL(sve_facgt, DO_FACGT)
+  */
+ #define DO_FPCMP_PPZ0(NAME, TYPE, H, OP)                   \
+ void HELPER(NAME)(void *vd, void *vn, void *vg,            \
+-                  void *status, uint32_t desc)             \
++                  float_status *status, uint32_t desc)     \
+ {                                                          \
+     intptr_t i = simd_oprsz(desc), j = (i - 1) >> 6;       \
+     uint64_t *d = vd, *g = vg;                             \
+@@ -XXX,XX +XXX,XX @@ DO_FPCMP_PPZ0_ALL(sve_fcmne0, DO_FCMNE)
+ /* FP Trig Multiply-Add. */
+-void HELPER(sve_ftmad_h)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
++void HELPER(sve_ftmad_h)(void *vd, void *vn, void *vm,
++                         float_status *s, uint32_t desc)
+ {
+     static const float16 coeff[16] = {
+x3c00, 0xb155, 0x2030, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_ftmad_h)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
+             mm = float16_abs(mm);
+             xx += 8;
+         }
+-        d[i] = float16_muladd(n[i], mm, coeff[xx], 0, vs);
++        d[i] = float16_muladd(n[i], mm, coeff[xx], 0, s);
+     }
+ }
+-void HELPER(sve_ftmad_s)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
++void HELPER(sve_ftmad_s)(void *vd, void *vn, void *vm,
++                         float_status *s, uint32_t desc)
+ {
+     static const float32 coeff[16] = {
+x3f800000, 0xbe2aaaab, 0x3c088886, 0xb95008b9,
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_ftmad_s)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
+             mm = float32_abs(mm);
+             xx += 8;
+         }
+-        d[i] = float32_muladd(n[i], mm, coeff[xx], 0, vs);
++        d[i] = float32_muladd(n[i], mm, coeff[xx], 0, s);
+     }
+ }
+-void HELPER(sve_ftmad_d)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
++void HELPER(sve_ftmad_d)(void *vd, void *vn, void *vm,
++                         float_status *s, uint32_t desc)
+ {
+     static const float64 coeff[16] = {
+x3ff0000000000000ull, 0xbfc5555555555543ull,
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_ftmad_d)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
+             mm = float64_abs(mm);
+             xx += 8;
+         }
+-        d[i] = float64_muladd(n[i], mm, coeff[xx], 0, vs);
++        d[i] = float64_muladd(n[i], mm, coeff[xx], 0, s);
+     }
+ }
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_ftmad_d)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
+  */
+ void HELPER(sve_fcadd_h)(void *vd, void *vn, void *vm, void *vg,
+-                         void *vs, uint32_t desc)
++                         float_status *s, uint32_t desc)
+ {
+     intptr_t j, i = simd_oprsz(desc);
+     uint64_t *g = vg;
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcadd_h)(void *vd, void *vn, void *vm, void *vg,
+             e3 = *(float16 *)(vm + H1_2(i)) ^ neg_imag;
+             if (likely((pg >> (i & 63)) & 1)) {
+-                *(float16 *)(vd + H1_2(i)) = float16_add(e0, e1, vs);
++                *(float16 *)(vd + H1_2(i)) = float16_add(e0, e1, s);
+             }
+             if (likely((pg >> (j & 63)) & 1)) {
+-                *(float16 *)(vd + H1_2(j)) = float16_add(e2, e3, vs);
++                *(float16 *)(vd + H1_2(j)) = float16_add(e2, e3, s);
+             }
+         } while (i & 63);
+     } while (i != 0);
+ }
+ void HELPER(sve_fcadd_s)(void *vd, void *vn, void *vm, void *vg,
+-                         void *vs, uint32_t desc)
++                         float_status *s, uint32_t desc)
+ {
+     intptr_t j, i = simd_oprsz(desc);
+     uint64_t *g = vg;
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcadd_s)(void *vd, void *vn, void *vm, void *vg,
+             e3 = *(float32 *)(vm + H1_2(i)) ^ neg_imag;
+             if (likely((pg >> (i & 63)) & 1)) {
+-                *(float32 *)(vd + H1_2(i)) = float32_add(e0, e1, vs);
++                *(float32 *)(vd + H1_2(i)) = float32_add(e0, e1, s);
+             }
+             if (likely((pg >> (j & 63)) & 1)) {
+-                *(float32 *)(vd + H1_2(j)) = float32_add(e2, e3, vs);
++                *(float32 *)(vd + H1_2(j)) = float32_add(e2, e3, s);
+             }
+         } while (i & 63);
+     } while (i != 0);
+ }
+ void HELPER(sve_fcadd_d)(void *vd, void *vn, void *vm, void *vg,
+-                         void *vs, uint32_t desc)
++                         float_status *s, uint32_t desc)
+ {
+     intptr_t j, i = simd_oprsz(desc);
+     uint64_t *g = vg;
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcadd_d)(void *vd, void *vn, void *vm, void *vg,
+             e3 = *(float64 *)(vm + H1_2(i)) ^ neg_imag;
+             if (likely((pg >> (i & 63)) & 1)) {
+-                *(float64 *)(vd + H1_2(i)) = float64_add(e0, e1, vs);
++                *(float64 *)(vd + H1_2(i)) = float64_add(e0, e1, s);
+             }
+             if (likely((pg >> (j & 63)) & 1)) {
+-                *(float64 *)(vd + H1_2(j)) = float64_add(e2, e3, vs);
++                *(float64 *)(vd + H1_2(j)) = float64_add(e2, e3, s);
+             }
+         } while (i & 63);
+     } while (i != 0);
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcadd_d)(void *vd, void *vn, void *vm, void *vg,
+  */
+ void HELPER(sve_fcmla_zpzzz_h)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     intptr_t j, i = simd_oprsz(desc);
+     unsigned rot = simd_data(desc);
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcmla_zpzzz_h)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(sve_fcmla_zpzzz_s)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     intptr_t j, i = simd_oprsz(desc);
+     unsigned rot = simd_data(desc);
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcmla_zpzzz_s)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(sve_fcmla_zpzzz_d)(void *vd, void *vn, void *vm, void *va,
+-                               void *vg, void *status, uint32_t desc)
++                               void *vg, float_status *status, uint32_t desc)
+ {
+     intptr_t j, i = simd_oprsz(desc);
+     unsigned rot = simd_data(desc);
+@@ -XXX,XX +XXX,XX @@ void HELPER(sve2_xar_s)(void *vd, void *vn, void *vm, uint32_t desc)
+ }
+ void HELPER(fmmla_s)(void *vd, void *vn, void *vm, void *va,
+-                     void *status, uint32_t desc)
++                     float_status *status, uint32_t desc)
+ {
+     intptr_t s, opr_sz = simd_oprsz(desc) / (sizeof(float32) * 4);
+@@ -XXX,XX +XXX,XX @@ void HELPER(fmmla_s)(void *vd, void *vn, void *vm, void *va,
+ }
+ void HELPER(fmmla_d)(void *vd, void *vn, void *vm, void *va,
+-                     void *status, uint32_t desc)
++                     float_status *status, uint32_t desc)
+ {
+     intptr_t s, opr_sz = simd_oprsz(desc) / (sizeof(float64) * 4);
+@@ -XXX,XX +XXX,XX @@ void HELPER(fmmla_d)(void *vd, void *vn, void *vm, void *va,
+ }
+ #define DO_FCVTNT(NAME, TYPEW, TYPEN, HW, HN, OP)                             \
+-void HELPER(NAME)(void *vd, void *vn, void *vg, void *status, uint32_t desc)  \
++void HELPER(NAME)(void *vd, void *vn, void *vg,                               \
++                  float_status *status, uint32_t desc)                        \
+ {                                                                             \
+     intptr_t i = simd_oprsz(desc);                                            \
+     uint64_t *g = vg;                                                         \
+@@ -XXX,XX +XXX,XX @@ DO_FCVTNT(sve2_fcvtnt_sh, uint32_t, uint16_t, H1_4, H1_2, sve_f32_to_f16)
+ DO_FCVTNT(sve2_fcvtnt_ds, uint64_t, uint32_t, H1_8, H1_4, float64_to_float32)
+ #define DO_FCVTLT(NAME, TYPEW, TYPEN, HW, HN, OP)                             \
+-void HELPER(NAME)(void *vd, void *vn, void *vg, void *status, uint32_t desc)  \
++void HELPER(NAME)(void *vd, void *vn, void *vg,                               \
++                  float_status *status, uint32_t desc)                        \
+ {                                                                             \
+     intptr_t i = simd_oprsz(desc);                                            \
+     uint64_t *g = vg;                                                         \
+--
+.34.1

-New patch
+[PULL 07/19] target/arm: Convert sme_helper.c to fpst alias
+From: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20241206031224.78525-8-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/helper-sme.h | 4 ++--
+ target/arm/tcg/sme_helper.c | 8 ++++----
+files changed, 6 insertions(+), 6 deletions(-)
+diff --git a/target/arm/tcg/helper-sme.h b/target/arm/tcg/helper-sme.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-sme.h
++++ b/target/arm/tcg/helper-sme.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sme_addva_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ DEF_HELPER_FLAGS_7(sme_fmopa_h, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_FLAGS_7(sme_fmopa_s, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sme_fmopa_d, TCG_CALL_NO_RWG,
+-                   void, ptr, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, ptr, fpst, i32)
+ DEF_HELPER_FLAGS_7(sme_bfmopa, TCG_CALL_NO_RWG,
+                    void, ptr, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_FLAGS_6(sme_smopa_s, TCG_CALL_NO_RWG,
+diff --git a/target/arm/tcg/sme_helper.c b/target/arm/tcg/sme_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/sme_helper.c
++++ b/target/arm/tcg/sme_helper.c
+@@ -XXX,XX +XXX,XX @@ void HELPER(sme_addva_d)(void *vzda, void *vzn, void *vpn,
+ }
+ void HELPER(sme_fmopa_s)(void *vza, void *vzn, void *vzm, void *vpn,
+-                         void *vpm, void *vst, uint32_t desc)
++                         void *vpm, float_status *fpst_in, uint32_t desc)
+ {
+     intptr_t row, col, oprsz = simd_maxsz(desc);
+     uint32_t neg = simd_data(desc) << 31;
+@@ -XXX,XX +XXX,XX @@ void HELPER(sme_fmopa_s)(void *vza, void *vzn, void *vzm, void *vpn,
+      * update the cumulative fp exception status.  It also produces
+      * default nans.
+      */
+-    fpst = *(float_status *)vst;
++    fpst = *fpst_in;
+     set_default_nan_mode(true, &fpst);
+     for (row = 0; row < oprsz; ) {
+@@ -XXX,XX +XXX,XX @@ void HELPER(sme_fmopa_s)(void *vza, void *vzn, void *vzm, void *vpn,
+ }
+ void HELPER(sme_fmopa_d)(void *vza, void *vzn, void *vzm, void *vpn,
+-                         void *vpm, void *vst, uint32_t desc)
++                         void *vpm, float_status *fpst_in, uint32_t desc)
+ {
+     intptr_t row, col, oprsz = simd_oprsz(desc) / 8;
+     uint64_t neg = (uint64_t)simd_data(desc) << 63;
+     uint64_t *za = vza, *zn = vzn, *zm = vzm;
+     uint8_t *pn = vpn, *pm = vpm;
+-    float_status fpst = *(float_status *)vst;
++    float_status fpst = *fpst_in;
+     set_default_nan_mode(true, &fpst);
+--
+.34.1

-[Qemu-devel] [PULL 3/5] vmstate.h: Type check VMSTATE_STRUCT_VARRAY macros
+[PULL 08/19] target/arm: Convert vec_helper.c to use env alias
-The VMSTATE_STRUCT_VARRAY_UINT32 macro is intended to handle
+From: Richard Henderson <richard.henderson@linaro.org>
 migrating a field which is an array of structs, but where instead of
 migrating the entire array we only migrate a variable number of
 elements of it.
-The VMSTATE_STRUCT_VARRAY_POINTER_UINT32 macro is intended to handle
+Allow the helpers to receive CPUARMState* directly
-migrating a field which is of pointer type, and points to a
+instead of via void*.
 dynamically allocated array of structs of variable size.
-We weren't actually checking that the field passed to
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-VMSTATE_STRUCT_VARRAY_UINT32 really is an array, with the result that
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-accidentally using it where the _POINTER_ macro was intended would
+Message-id: 20241206031224.78525-9-richard.henderson@linaro.org
-compile but silently corrupt memory on migration.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/helper.h         | 12 ++++++------
  target/arm/tcg/helper-a64.h |  2 +-
  target/arm/tcg/vec_helper.c | 21 +++++++--------------
 files changed, 14 insertions(+), 21 deletions(-)
-Add type-checking that enforces that the field passed in is
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 really of the right array type. This applies to all the VMSTATE
 macros which use flags including VMS_VARRAY_* but not VMS_POINTER.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
 Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
 Tested-by: Damien Hedde <damien.hedde@greensocs.com>
 Message-id: 20190725163710.11703-3-peter.maydell@linaro.org
 ---
  include/migration/vmstate.h | 30 ++++++++++++++++++++++++------
 file changed, 24 insertions(+), 6 deletions(-)
 diff --git a/include/migration/vmstate.h b/include/migration/vmstate.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/migration/vmstate.h
+--- a/target/arm/helper.h
-+++ b/include/migration/vmstate.h
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_bitmap;
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_suqadd_d, TCG_CALL_NO_RWG,
- extern const VMStateInfo vmstate_info_qtailq;
+                    void, ptr, ptr, ptr, ptr, i32)
- #define type_check_2darray(t1,t2,n,m) ((t1(*)[n][m])0 - (t2*)0)
+ DEF_HELPER_FLAGS_5(gvec_fmlal_a32, TCG_CALL_NO_RWG,
-+/*
+-                   void, ptr, ptr, ptr, ptr, i32)
-+ * Check that type t2 is an array of type t1 of size n,
++                   void, ptr, ptr, ptr, env, i32)
-+ * e.g. if t1 is 'foo' and n is 32 then t2 must be 'foo[32]'
+ DEF_HELPER_FLAGS_5(gvec_fmlal_a64, TCG_CALL_NO_RWG,
-+ */
+-                   void, ptr, ptr, ptr, ptr, i32)
- #define type_check_array(t1,t2,n) ((t1(*)[n])0 - (t2*)0)
++                   void, ptr, ptr, ptr, env, i32)
- #define type_check_pointer(t1,t2) ((t1**)0 - (t2*)0)
+ DEF_HELPER_FLAGS_5(gvec_fmlal_idx_a32, TCG_CALL_NO_RWG,
-+/*
+-                   void, ptr, ptr, ptr, ptr, i32)
-+ * type of element 0 of the specified (array) field of the type.
++                   void, ptr, ptr, ptr, env, i32)
-+ * Note that if the field is a pointer then this will return the
+ DEF_HELPER_FLAGS_5(gvec_fmlal_idx_a64, TCG_CALL_NO_RWG,
-+ * pointed-to type rather than complaining.
+-                   void, ptr, ptr, ptr, ptr, i32)
-+ */
++                   void, ptr, ptr, ptr, env, i32)
-+#define typeof_elt_of_field(type, field) typeof(((type *)0)->field[0])
-+/* Check that field f in struct type t2 is an array of t1, of any size */
+ DEF_HELPER_FLAGS_2(frint32_s, TCG_CALL_NO_RWG, f32, f32, fpst)
-+#define type_check_varray(t1, t2, f)                                 \
+ DEF_HELPER_FLAGS_2(frint64_s, TCG_CALL_NO_RWG, f32, f32, fpst)
-+    (type_check(t1, typeof_elt_of_field(t2, f))                      \
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve2_sqrdmulh_idx_d, TCG_CALL_NO_RWG,
-+     + QEMU_BUILD_BUG_ON_ZERO(!QEMU_IS_ARRAY(((t2 *)0)->f)))
+                    void, ptr, ptr, ptr, i32)
- #define vmstate_offset_value(_state, _field, _type)                  \
+ DEF_HELPER_FLAGS_6(sve2_fmlal_zzzw_s, TCG_CALL_NO_RWG,
-     (offsetof(_state, _field) +                                      \
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
++                   void, ptr, ptr, ptr, ptr, env, i32)
-     vmstate_offset_array(_state, _field, uint8_t,                    \
+ DEF_HELPER_FLAGS_6(sve2_fmlal_zzxw_s, TCG_CALL_NO_RWG,
-                          sizeof(typeof_field(_state, _field)))
+-                   void, ptr, ptr, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, env, i32)
-+#define vmstate_offset_varray(_state, _field, _type)                 \
-+    (offsetof(_state, _field) +                                      \
+ DEF_HELPER_FLAGS_4(gvec_xar_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+     type_check_varray(_type, _state, _field))
-+
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
- /* In the macros below, if there is a _version, that means the macro's
+index XXXXXXX..XXXXXXX 100644
-  * field will be processed only if the version being received is >=
+--- a/target/arm/tcg/helper-a64.h
-  * the _version specified.  In general, if you add a new field, you
++++ b/target/arm/tcg/helper-a64.h
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_cmps_a64, i64, f32, f32, fpst)
-     .info       = &(_info),                                          \
+ DEF_HELPER_3(vfp_cmpes_a64, i64, f32, f32, fpst)
-     .size       = sizeof(_type),                                     \
+ DEF_HELPER_3(vfp_cmpd_a64, i64, f64, f64, fpst)
-     .flags      = VMS_VARRAY_UINT32|VMS_MULTIPLY_ELEMENTS,           \
+ DEF_HELPER_3(vfp_cmped_a64, i64, f64, f64, fpst)
--    .offset     = offsetof(_state, _field),                          \
+-DEF_HELPER_FLAGS_4(simd_tblx, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
++DEF_HELPER_FLAGS_4(simd_tblx, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
  DEF_HELPER_FLAGS_3(vfp_mulxs, TCG_CALL_NO_RWG, f32, f32, f32, fpst)
  DEF_HELPER_FLAGS_3(vfp_mulxd, TCG_CALL_NO_RWG, f64, f64, f64, fpst)
  DEF_HELPER_FLAGS_3(neon_ceq_f64, TCG_CALL_NO_RWG, i64, i64, i64, fpst)
 diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static void do_fmlal(float32 *d, void *vn, void *vm, float_status *fpst,
  }
- #define VMSTATE_ARRAY_TEST(_field, _state, _num, _test, _info, _type) {\
+ void HELPER(gvec_fmlal_a32)(void *vd, void *vn, void *vm,
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+-                            void *venv, uint32_t desc)
-     .info       = &(_info),                                          \
++                            CPUARMState *env, uint32_t desc)
-     .size       = sizeof(_type),                                     \
+ {
-     .flags      = VMS_VARRAY_INT32,                                  \
+-    CPUARMState *env = venv;
--    .offset     = offsetof(_state, _field),                          \
+     do_fmlal(vd, vn, vm, &env->vfp.standard_fp_status, desc,
-+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
+              get_flush_inputs_to_zero(&env->vfp.fp_status_f16));
  }
- #define VMSTATE_VARRAY_INT32(_field, _state, _field_num, _version, _info, _type) {\
+ void HELPER(gvec_fmlal_a64)(void *vd, void *vn, void *vm,
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+-                            void *venv, uint32_t desc)
-     .info       = &(_info),                                          \
++                            CPUARMState *env, uint32_t desc)
-     .size       = sizeof(_type),                                     \
+ {
-     .flags      = VMS_VARRAY_UINT16,                                 \
+-    CPUARMState *env = venv;
--    .offset     = offsetof(_state, _field),                          \
+     do_fmlal(vd, vn, vm, &env->vfp.fp_status, desc,
-+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
+              get_flush_inputs_to_zero(&env->vfp.fp_status_f16));
  }
- #define VMSTATE_VSTRUCT_TEST(_field, _state, _test, _version, _vmsd, _type, _struct_version) { \
+ void HELPER(sve2_fmlal_zzzw_s)(void *vd, void *vn, void *vm, void *va,
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+-                               void *venv, uint32_t desc)
-     .vmsd       = &(_vmsd),                                          \
++                               CPUARMState *env, uint32_t desc)
-     .size       = sizeof(_type),                                     \
+ {
-     .flags      = VMS_STRUCT|VMS_VARRAY_UINT8,                       \
+     intptr_t i, oprsz = simd_oprsz(desc);
--    .offset     = offsetof(_state, _field),                          \
+     uint16_t negn = extract32(desc, SIMD_DATA_SHIFT, 1) << 15;
-+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
+     intptr_t sel = extract32(desc, SIMD_DATA_SHIFT + 1, 1) * sizeof(float16);
 -    CPUARMState *env = venv;
      float_status *status = &env->vfp.fp_status;
      bool fz16 = get_flush_inputs_to_zero(&env->vfp.fp_status_f16);
@@ -XXX,XX +XXX,XX @@ static void do_fmlal_idx(float32 *d, void *vn, void *vm, float_status *fpst,
  }
- /* a variable length array (i.e. _type *_field) but we know the
+ void HELPER(gvec_fmlal_idx_a32)(void *vd, void *vn, void *vm,
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+-                                void *venv, uint32_t desc)
-     .vmsd       = &(_vmsd),                                          \
++                                CPUARMState *env, uint32_t desc)
-     .size       = sizeof(_type),                                     \
+ {
-     .flags      = VMS_STRUCT|VMS_VARRAY_INT32,                       \
+-    CPUARMState *env = venv;
--    .offset     = offsetof(_state, _field),                          \
+     do_fmlal_idx(vd, vn, vm, &env->vfp.standard_fp_status, desc,
-+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
+                  get_flush_inputs_to_zero(&env->vfp.fp_status_f16));
  }
- #define VMSTATE_STRUCT_VARRAY_UINT32(_field, _state, _field_num, _version, _vmsd, _type) { \
+ void HELPER(gvec_fmlal_idx_a64)(void *vd, void *vn, void *vm,
-@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+-                                void *venv, uint32_t desc)
-     .vmsd       = &(_vmsd),                                          \
++                                CPUARMState *env, uint32_t desc)
-     .size       = sizeof(_type),                                     \
+ {
-     .flags      = VMS_STRUCT|VMS_VARRAY_UINT32,                      \
+-    CPUARMState *env = venv;
--    .offset     = offsetof(_state, _field),                          \
+     do_fmlal_idx(vd, vn, vm, &env->vfp.fp_status, desc,
-+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
+                  get_flush_inputs_to_zero(&env->vfp.fp_status_f16));
  }
- #define VMSTATE_STRUCT_VARRAY_ALLOC(_field, _state, _field_num, _version, _vmsd, _type) {\
+ void HELPER(sve2_fmlal_zzxw_s)(void *vd, void *vn, void *vm, void *va,
 -                               void *venv, uint32_t desc)
 +                               CPUARMState *env, uint32_t desc)
  {
      intptr_t i, j, oprsz = simd_oprsz(desc);
      uint16_t negn = extract32(desc, SIMD_DATA_SHIFT, 1) << 15;
      intptr_t sel = extract32(desc, SIMD_DATA_SHIFT + 1, 1) * sizeof(float16);
      intptr_t idx = extract32(desc, SIMD_DATA_SHIFT + 2, 3) * sizeof(float16);
 -    CPUARMState *env = venv;
      float_status *status = &env->vfp.fp_status;
      bool fz16 = get_flush_inputs_to_zero(&env->vfp.fp_status_f16);
@@ -XXX,XX +XXX,XX @@ DO_VRINT_RMODE(gvec_vrint_rm_s, helper_rints, uint32_t)
  #undef DO_VRINT_RMODE
  #ifdef TARGET_AARCH64
 -void HELPER(simd_tblx)(void *vd, void *vm, void *venv, uint32_t desc)
 +void HELPER(simd_tblx)(void *vd, void *vm, CPUARMState *env, uint32_t desc)
  {
      const uint8_t *indices = vm;
 -    CPUARMState *env = venv;
      size_t oprsz = simd_oprsz(desc);
      uint32_t rn = extract32(desc, SIMD_DATA_SHIFT, 5);
      bool is_tbx = extract32(desc, SIMD_DATA_SHIFT + 5, 1);
 --
-.20.1
+.34.1

-[Qemu-devel] [PULL 4/5] hw/arm/boot: Rename elf_{low, high}_addr to image_{low, high}_addr
+[PULL 09/19] target/arm: Convert neon_helper.c to use env alias
-Rename the elf_low_addr and elf_high_addr variables to image_low_addr
+From: Richard Henderson <richard.henderson@linaro.org>
 and image_high_addr -- in the next commit we will extend them to
 be set for other kinds of image file and not just ELF files.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-id: 20241206031224.78525-10-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Tested-by: Mark Rutland <mark.rutland@arm.com>
-Message-id: 20190722151804.25467-2-peter.maydell@linaro.org
 ---
- hw/arm/boot.c | 20 +++++++++++---------
+ target/arm/helper.h          | 56 ++++++++++++++++++------------------
-file changed, 11 insertions(+), 9 deletions(-)
+ target/arm/tcg/neon_helper.c |  6 ++--
 files changed, 30 insertions(+), 32 deletions(-)
-diff --git a/hw/arm/boot.c b/hw/arm/boot.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/boot.c
+--- a/target/arm/helper.h
-+++ b/hw/arm/boot.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(neon_qrshl_u32, i32, env, i32, i32)
-     int kernel_size;
+ DEF_HELPER_3(neon_qrshl_s32, i32, env, i32, i32)
-     int initrd_size;
+ DEF_HELPER_3(neon_qrshl_u64, i64, env, i64, i64)
-     int is_linux = 0;
+ DEF_HELPER_3(neon_qrshl_s64, i64, env, i64, i64)
--    uint64_t elf_entry, elf_low_addr, elf_high_addr;
+-DEF_HELPER_FLAGS_5(neon_sqshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+    uint64_t elf_entry;
+-DEF_HELPER_FLAGS_5(neon_sqshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+    /* Addresses of first byte used and first byte not used by the image */
+-DEF_HELPER_FLAGS_5(neon_sqshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+    uint64_t image_low_addr, image_high_addr;
+-DEF_HELPER_FLAGS_5(neon_sqshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-     int elf_machine;
+-DEF_HELPER_FLAGS_5(neon_uqshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-     hwaddr entry;
+-DEF_HELPER_FLAGS_5(neon_uqshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-     static const ARMInsnFixup *primary_loader;
+-DEF_HELPER_FLAGS_5(neon_uqshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
+-DEF_HELPER_FLAGS_5(neon_uqshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-         info->nb_cpus = 1;
+-DEF_HELPER_FLAGS_5(neon_sqrshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-DEF_HELPER_FLAGS_5(neon_sqrshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-     /* Assume that raw images are linux kernels, and ELF images are not.  */
+-DEF_HELPER_FLAGS_5(neon_sqrshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
--    kernel_size = arm_load_elf(info, &elf_entry, &elf_low_addr,
+-DEF_HELPER_FLAGS_5(neon_sqrshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
--                               &elf_high_addr, elf_machine, as);
+-DEF_HELPER_FLAGS_5(neon_uqrshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+    kernel_size = arm_load_elf(info, &elf_entry, &image_low_addr,
+-DEF_HELPER_FLAGS_5(neon_uqrshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+                               &image_high_addr, elf_machine, as);
+-DEF_HELPER_FLAGS_5(neon_uqrshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-     if (kernel_size > 0 && have_dtb(info)) {
+-DEF_HELPER_FLAGS_5(neon_uqrshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-         /*
+-DEF_HELPER_FLAGS_4(neon_sqshli_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-          * If there is still some room left at the base of RAM, try and put
+-DEF_HELPER_FLAGS_4(neon_sqshli_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-          * the DTB there like we do for images loaded with -bios or -pflash.
+-DEF_HELPER_FLAGS_4(neon_sqshli_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-          */
+-DEF_HELPER_FLAGS_4(neon_sqshli_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
--        if (elf_low_addr > info->loader_start
+-DEF_HELPER_FLAGS_4(neon_uqshli_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
--            || elf_high_addr < info->loader_start) {
+-DEF_HELPER_FLAGS_4(neon_uqshli_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+        if (image_low_addr > info->loader_start
+-DEF_HELPER_FLAGS_4(neon_uqshli_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+            || image_high_addr < info->loader_start) {
+-DEF_HELPER_FLAGS_4(neon_uqshli_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-             /*
+-DEF_HELPER_FLAGS_4(neon_sqshlui_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
--             * Set elf_low_addr as address limit for arm_load_dtb if it may be
+-DEF_HELPER_FLAGS_4(neon_sqshlui_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+             * Set image_low_addr as address limit for arm_load_dtb if it may be
+-DEF_HELPER_FLAGS_4(neon_sqshlui_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-              * pointing into RAM, otherwise pass '0' (no limit)
+-DEF_HELPER_FLAGS_4(neon_sqshlui_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-              */
++DEF_HELPER_FLAGS_5(neon_sqshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
--            if (elf_low_addr < info->loader_start) {
++DEF_HELPER_FLAGS_5(neon_sqshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
--                elf_low_addr = 0;
++DEF_HELPER_FLAGS_5(neon_sqshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-+            if (image_low_addr < info->loader_start) {
++DEF_HELPER_FLAGS_5(neon_sqshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-+                image_low_addr = 0;
++DEF_HELPER_FLAGS_5(neon_uqshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-             }
++DEF_HELPER_FLAGS_5(neon_uqshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-             info->dtb_start = info->loader_start;
++DEF_HELPER_FLAGS_5(neon_uqshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
--            info->dtb_limit = elf_low_addr;
++DEF_HELPER_FLAGS_5(neon_uqshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-+            info->dtb_limit = image_low_addr;
++DEF_HELPER_FLAGS_5(neon_sqrshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-         }
++DEF_HELPER_FLAGS_5(neon_sqrshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-     }
++DEF_HELPER_FLAGS_5(neon_sqrshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
-     entry = elf_entry;
++DEF_HELPER_FLAGS_5(neon_sqrshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_5(neon_uqrshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_5(neon_uqrshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_5(neon_uqrshl_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_5(neon_uqrshl_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshli_b, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshli_h, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshli_s, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshli_d, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_uqshli_b, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_uqshli_h, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_uqshli_s, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_uqshli_d, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshlui_b, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshlui_h, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshlui_s, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(neon_sqshlui_d, TCG_CALL_NO_RWG, void, ptr, ptr, env, i32)
  DEF_HELPER_FLAGS_4(gvec_srshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_srshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/neon_helper.c
 +++ b/target/arm/tcg/neon_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(name)(void *vd, void *vn, void *vm, uint32_t desc) \
  }
  #define NEON_GVEC_VOP2_ENV(name, vtype) \
 -void HELPER(name)(void *vd, void *vn, void *vm, void *venv, uint32_t desc) \
 +void HELPER(name)(void *vd, void *vn, void *vm, CPUARMState *env, uint32_t desc) \
  {                                                               \
      intptr_t i, opr_sz = simd_oprsz(desc);                      \
      vtype *d = vd, *n = vn, *m = vm;                            \
 -    CPUARMState *env = venv;                                    \
      for (i = 0; i < opr_sz / sizeof(vtype); i++) {              \
          NEON_FN(d[i], n[i], m[i]);                              \
      }                                                           \
@@ -XXX,XX +XXX,XX @@ void HELPER(name)(void *vd, void *vn, void *vm, void *venv, uint32_t desc) \
  }
  #define NEON_GVEC_VOP2i_ENV(name, vtype) \
 -void HELPER(name)(void *vd, void *vn, void *venv, uint32_t desc) \
 +void HELPER(name)(void *vd, void *vn, CPUARMState *env, uint32_t desc) \
  {                                                               \
      intptr_t i, opr_sz = simd_oprsz(desc);                      \
      int imm = simd_data(desc);                                  \
      vtype *d = vd, *n = vn;                                     \
 -    CPUARMState *env = venv;                                    \
      for (i = 0; i < opr_sz / sizeof(vtype); i++) {              \
          NEON_FN(d[i], n[i], imm);                               \
      }                                                           \
 --
-.20.1
+.34.1

-[Qemu-devel] [PULL 5/5] hw/arm/boot: Further improve initrd positioning code
+[PULL 10/19] target/arm: Use float_status in helper_fcvtx_f64_to_f32
-In commit e6b2b20d9735d4ef we made the boot loader code try to avoid
+From: Richard Henderson <richard.henderson@linaro.org>
 putting the initrd on top of the kernel.  However the expression used
 to calculate the start of the initrd:
-    info->initrd_start = info->loader_start +
+Pass float_status not env to match other functions.
         MAX(MIN(info->ram_size / 2, 128 * 1024 * 1024), kernel_size);
-incorrectly uses 'kernel_size' as the offset within RAM of the
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-highest address to avoid.  This is incorrect because the kernel
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-doesn't start at address 0, but slightly higher than that.  This
+Message-id: 20241206031952.78776-2-richard.henderson@linaro.org
-means that we can still incorrectly end up overlaying the initrd on
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-the kernel in some cases, for example:
+---
  target/arm/tcg/helper-a64.h    | 2 +-
  target/arm/tcg/helper-a64.c    | 3 +--
  target/arm/tcg/translate-a64.c | 2 +-
 files changed, 3 insertions(+), 4 deletions(-)
-* The kernel's image_size is 0x0a7a8000
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
 * The kernel was loaded at   0x40080000
 * The end of the kernel is   0x4A828000
 * The DTB was loaded at      0x4a800000
 To get this right we need to track the actual highest address used
 by the kernel and use that rather than kernel_size. We already
 set image_low_addr and image_high_addr for ELF images; set them
 also for the various other image types we support, and then use
 image_high_addr as the lowest allowed address for the initrd.
 (We don't use image_low_addr, but we set it for consistency
 with the existing code path for ELF files.)
 Fixes: e6b2b20d9735d4ef
 Reported-by: Mark Rutland <mark.rutland@arm.com>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Tested-by: Mark Rutland <mark.rutland@arm.com>
 Message-id: 20190722151804.25467-3-peter.maydell@linaro.org
 ---
  hw/arm/boot.c | 19 +++++++++++++++++--
 file changed, 17 insertions(+), 2 deletions(-)
 diff --git a/hw/arm/boot.c b/hw/arm/boot.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/boot.c
+--- a/target/arm/tcg/helper-a64.h
-+++ b/hw/arm/boot.c
++++ b/target/arm/tcg/helper-a64.h
-@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, fpst)
-     int is_linux = 0;
+ DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, fpst)
-     uint64_t elf_entry;
+ DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, fpst)
-     /* Addresses of first byte used and first byte not used by the image */
+ DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, fpst)
--    uint64_t image_low_addr, image_high_addr;
+-DEF_HELPER_FLAGS_2(fcvtx_f64_to_f32, TCG_CALL_NO_RWG, f32, f64, env)
-+    uint64_t image_low_addr = 0, image_high_addr = 0;
++DEF_HELPER_FLAGS_2(fcvtx_f64_to_f32, TCG_CALL_NO_RWG, f32, f64, fpst)
-     int elf_machine;
+ DEF_HELPER_FLAGS_3(crc32_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
-     hwaddr entry;
+ DEF_HELPER_FLAGS_3(crc32c_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
-     static const ARMInsnFixup *primary_loader;
+ DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, fpst)
-@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
+diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
-         uint64_t loadaddr = info->loader_start + KERNEL_NOLOAD_ADDR;
+index XXXXXXX..XXXXXXX 100644
-         kernel_size = load_uimage_as(info->kernel_filename, &entry, &loadaddr,
+--- a/target/arm/tcg/helper-a64.c
-                                      &is_linux, NULL, NULL, as);
++++ b/target/arm/tcg/helper-a64.c
-+        if (kernel_size >= 0) {
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(frecpx_f64)(float64 a, float_status *fpst)
 +            image_low_addr = loadaddr;
 +            image_high_addr = image_low_addr + kernel_size;
 +        }
      }
-     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64) && kernel_size < 0) {
+ }
-         kernel_size = load_aarch64_image(info->kernel_filename,
-                                          info->loader_start, &entry, as);
+-float32 HELPER(fcvtx_f64_to_f32)(float64 a, CPUARMState *env)
-         is_linux = 1;
++float32 HELPER(fcvtx_f64_to_f32)(float64 a, float_status *fpst)
-+        if (kernel_size >= 0) {
+ {
-+            image_low_addr = entry;
+     float32 r;
-+            image_high_addr = image_low_addr + kernel_size;
+-    float_status *fpst = &env->vfp.fp_status;
-+        }
+     int old = get_float_rounding_mode(fpst);
-     } else if (kernel_size < 0) {
-         /* 32-bit ARM */
+     set_float_rounding_mode(float_round_to_odd, fpst);
-         entry = info->loader_start + KERNEL_LOAD_ADDR;
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
-         kernel_size = load_image_targphys_as(info->kernel_filename, entry,
+index XXXXXXX..XXXXXXX 100644
-                                              ram_end - KERNEL_LOAD_ADDR, as);
+--- a/target/arm/tcg/translate-a64.c
-         is_linux = 1;
++++ b/target/arm/tcg/translate-a64.c
-+        if (kernel_size >= 0) {
+@@ -XXX,XX +XXX,XX @@ static void gen_fcvtxn_sd(TCGv_i64 d, TCGv_i64 n)
-+            image_low_addr = entry;
+      * with von Neumann rounding (round to odd)
 +            image_high_addr = image_low_addr + kernel_size;
 +        }
      }
      if (kernel_size < 0) {
          error_report("could not load kernel '%s'", info->kernel_filename);
@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
       * we might still make a bad choice here.
       */
-     info->initrd_start = info->loader_start +
+     TCGv_i32 tmp = tcg_temp_new_i32();
--        MAX(MIN(info->ram_size / 2, 128 * 1024 * 1024), kernel_size);
+-    gen_helper_fcvtx_f64_to_f32(tmp, n, tcg_env);
-+        MIN(info->ram_size / 2, 128 * 1024 * 1024);
++    gen_helper_fcvtx_f64_to_f32(tmp, n, fpstatus_ptr(FPST_FPCR));
-+    if (image_high_addr) {
+     tcg_gen_extu_i32_i64(d, tmp);
-+        info->initrd_start = MAX(info->initrd_start, image_high_addr);
+ }
-+    }
      info->initrd_start = TARGET_PAGE_ALIGN(info->initrd_start);
      if (is_linux) {
 --
-.20.1
+.34.1

-[Qemu-devel] [PULL 1/5] pl330: fix vmstate description
+[PULL 11/19] target/arm: Use float_status in helper_vfp_fcvt{ds,sd}
-From: Damien Hedde <damien.hedde@greensocs.com>
+From: Richard Henderson <richard.henderson@linaro.org>
-Fix the pl330 main and queue vmstate description.
+Pass float_status not env to match other functions.
 There were missing POINTER flags causing crashes during
 incoming migration because:
 + PL330State chan field is a pointer to an array
 + PL330Queue queue field is a pointer to an array
-Also bump corresponding vmsd version numbers.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Signed-off-by: Damien Hedde <damien.hedde@greensocs.com>
+Message-id: 20241206031952.78776-3-richard.henderson@linaro.org
 Reviewed-by: Philippe Mathieu-Daude <philmd@redhat.com>
 Acked-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
 Message-id: 20190724143553.21557-1-damien.hedde@greensocs.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/dma/pl330.c | 17 +++++++++--------
+ target/arm/helper.h            |  4 ++--
-file changed, 9 insertions(+), 8 deletions(-)
+ target/arm/tcg/translate-a64.c | 15 ++++++++++-----
  target/arm/tcg/translate-vfp.c |  4 ++--
  target/arm/vfp_helper.c        |  8 ++++----
 files changed, 18 insertions(+), 13 deletions(-)
-diff --git a/hw/dma/pl330.c b/hw/dma/pl330.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/dma/pl330.c
+--- a/target/arm/helper.h
-+++ b/hw/dma/pl330.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ typedef struct PL330Queue {
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_cmpeh, void, f16, f16, env)
+ DEF_HELPER_3(vfp_cmpes, void, f32, f32, env)
- static const VMStateDescription vmstate_pl330_queue = {
+ DEF_HELPER_3(vfp_cmped, void, f64, f64, env)
-     .name = "pl330_queue",
--    .version_id = 1,
+-DEF_HELPER_2(vfp_fcvtds, f64, f32, env)
--    .minimum_version_id = 1,
+-DEF_HELPER_2(vfp_fcvtsd, f32, f64, env)
-+    .version_id = 2,
++DEF_HELPER_2(vfp_fcvtds, f64, f32, fpst)
-+    .minimum_version_id = 2,
++DEF_HELPER_2(vfp_fcvtsd, f32, f64, fpst)
-     .fields = (VMStateField[]) {
+ DEF_HELPER_FLAGS_2(bfcvt, TCG_CALL_NO_RWG, i32, f32, fpst)
--        VMSTATE_STRUCT_VARRAY_UINT32(queue, PL330Queue, queue_size, 1,
+ DEF_HELPER_FLAGS_2(bfcvt_pair, TCG_CALL_NO_RWG, i32, i64, fpst)
--                                 vmstate_pl330_queue_entry, PL330QueueEntry),
-+        VMSTATE_STRUCT_VARRAY_POINTER_UINT32(queue, PL330Queue, queue_size,
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
-+                                             vmstate_pl330_queue_entry,
+index XXXXXXX..XXXXXXX 100644
-+                                             PL330QueueEntry),
+--- a/target/arm/tcg/translate-a64.c
-         VMSTATE_END_OF_LIST()
++++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVT_s_ds(DisasContext *s, arg_rr *a)
      if (fp_access_check(s)) {
          TCGv_i32 tcg_rn = read_fp_sreg(s, a->rn);
          TCGv_i64 tcg_rd = tcg_temp_new_i64();
 +        TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 -        gen_helper_vfp_fcvtds(tcg_rd, tcg_rn, tcg_env);
 +        gen_helper_vfp_fcvtds(tcg_rd, tcg_rn, fpst);
          write_fp_dreg(s, a->rd, tcg_rd);
      }
- };
+     return true;
-@@ -XXX,XX +XXX,XX @@ struct PL330State {
+@@ -XXX,XX +XXX,XX @@ static bool trans_FCVT_s_sd(DisasContext *s, arg_rr *a)
+     if (fp_access_check(s)) {
- static const VMStateDescription vmstate_pl330 = {
+         TCGv_i64 tcg_rn = read_fp_dreg(s, a->rn);
-     .name = "pl330",
+         TCGv_i32 tcg_rd = tcg_temp_new_i32();
--    .version_id = 1,
++        TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
--    .minimum_version_id = 1,
-+    .version_id = 2,
+-        gen_helper_vfp_fcvtsd(tcg_rd, tcg_rn, tcg_env);
-+    .minimum_version_id = 2,
++        gen_helper_vfp_fcvtsd(tcg_rd, tcg_rn, fpst);
-     .fields = (VMStateField[]) {
+         write_fp_sreg(s, a->rd, tcg_rd);
-         VMSTATE_STRUCT(manager, PL330State, 0, vmstate_pl330_chan, PL330Chan),
+     }
--        VMSTATE_STRUCT_VARRAY_UINT32(chan, PL330State, num_chnls, 0,
+     return true;
--                                     vmstate_pl330_chan, PL330Chan),
+@@ -XXX,XX +XXX,XX @@ static void gen_fcvtn_hs(TCGv_i64 d, TCGv_i64 n)
-+        VMSTATE_STRUCT_VARRAY_POINTER_UINT32(chan, PL330State, num_chnls,
+ static void gen_fcvtn_sd(TCGv_i64 d, TCGv_i64 n)
-+                                             vmstate_pl330_chan, PL330Chan),
+ {
-         VMSTATE_VBUFFER_UINT32(lo_seqn, PL330State, 1, NULL, num_chnls),
+     TCGv_i32 tmp = tcg_temp_new_i32();
-         VMSTATE_VBUFFER_UINT32(hi_seqn, PL330State, 1, NULL, num_chnls),
+-    gen_helper_vfp_fcvtsd(tmp, n, tcg_env);
-         VMSTATE_STRUCT(fifo, PL330State, 0, vmstate_pl330_fifo, PL330Fifo),
++    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 +
 +    gen_helper_vfp_fcvtsd(tmp, n, fpst);
      tcg_gen_extu_i32_i64(d, tmp);
  }
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVTL_v(DisasContext *s, arg_qrr_e *a)
       * The only instruction like this is FCVTL.
       */
      int pass;
 +    TCGv_ptr fpst;
      if (!fp_access_check(s)) {
          return true;
      }
 +    fpst = fpstatus_ptr(FPST_FPCR);
      if (a->esz == MO_64) {
          /* 32 -> 64 bit fp conversion */
          TCGv_i64 tcg_res[2];
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVTL_v(DisasContext *s, arg_qrr_e *a)
          for (pass = 0; pass < 2; pass++) {
              tcg_res[pass] = tcg_temp_new_i64();
              read_vec_element_i32(s, tcg_op, a->rn, srcelt + pass, MO_32);
 -            gen_helper_vfp_fcvtds(tcg_res[pass], tcg_op, tcg_env);
 +            gen_helper_vfp_fcvtds(tcg_res[pass], tcg_op, fpst);
          }
          for (pass = 0; pass < 2; pass++) {
              write_vec_element(s, tcg_res[pass], a->rd, pass, MO_64);
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVTL_v(DisasContext *s, arg_qrr_e *a)
          /* 16 -> 32 bit fp conversion */
          int srcelt = a->q ? 4 : 0;
          TCGv_i32 tcg_res[4];
 -        TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
          TCGv_i32 ahp = get_ahp_flag();
          for (pass = 0; pass < 4; pass++) {
 diff --git a/target/arm/tcg/translate-vfp.c b/target/arm/tcg/translate-vfp.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-vfp.c
 +++ b/target/arm/tcg/translate-vfp.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp(DisasContext *s, arg_VCVT_sp *a)
      vm = tcg_temp_new_i32();
      vd = tcg_temp_new_i64();
      vfp_load_reg32(vm, a->vm);
 -    gen_helper_vfp_fcvtds(vd, vm, tcg_env);
 +    gen_helper_vfp_fcvtds(vd, vm, fpstatus_ptr(FPST_FPCR));
      vfp_store_reg64(vd, a->vd);
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
      vd = tcg_temp_new_i32();
      vm = tcg_temp_new_i64();
      vfp_load_reg64(vm, a->vm);
 -    gen_helper_vfp_fcvtsd(vd, vm, tcg_env);
 +    gen_helper_vfp_fcvtsd(vd, vm, fpstatus_ptr(FPST_FPCR));
      vfp_store_reg32(vd, a->vd);
      return true;
  }
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ FLOAT_CONVS(ui, d, float64, 64, u)
  #undef FLOAT_CONVS
  /* floating point conversion */
 -float64 VFP_HELPER(fcvtd, s)(float32 x, CPUARMState *env)
 +float64 VFP_HELPER(fcvtd, s)(float32 x, float_status *status)
  {
 -    return float32_to_float64(x, &env->vfp.fp_status);
 +    return float32_to_float64(x, status);
  }
 -float32 VFP_HELPER(fcvts, d)(float64 x, CPUARMState *env)
 +float32 VFP_HELPER(fcvts, d)(float64 x, float_status *status)
  {
 -    return float64_to_float32(x, &env->vfp.fp_status);
 +    return float64_to_float32(x, status);
  }
  uint32_t HELPER(bfcvt)(float32 x, float_status *status)
 --
-.20.1
+.34.1

-New patch
+[PULL 12/19] target/arm: Implement fine-grained-trap handling for FEAT_XS
+FEAT_XS introduces a set of new TLBI maintenance instructions with an
+"nXS" qualifier.  These behave like the stardard ones except that
+they do not wait for memory accesses with the XS attribute to
+complete.  They have an interaction with the fine-grained-trap
+handling: the FGT bits that a hypervisor can use to trap TLBI
+maintenance instructions normally trap also the nXS variants, but the
+hypervisor can elect to not trap the nXS variants by setting
+HCRX_EL2.FGTnXS to 1.
+Add support to our FGT mechanism for these TLBI bits. For each
+TLBI-trapping FGT bit we define, for example:
+ * FGT_TLBIVAE1 -- the same value we do at present for the
+   normal variant of the insn
+ * FGT_TLBIVAE1NXS -- for the nXS qualified insn; the value of
+   this enum has an NXS bit ORed into it
+In access_check_cp_reg() we can then ignore the trap bit for an
+access where ri->fgt has the NXS bit set and HCRX_EL2.FGTnXS is 1.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211144440.2700268-2-peter.maydell@linaro.org
+---
+ target/arm/cpregs.h        | 72 ++++++++++++++++++++++----------------
+ target/arm/cpu-features.h  |  5 +++
+ target/arm/helper.c        |  5 ++-
+ target/arm/tcg/op_helper.c | 11 +++++-
+files changed, 61 insertions(+), 32 deletions(-)
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/cpregs.h
++++ b/target/arm/cpregs.h
+@@ -XXX,XX +XXX,XX @@ FIELD(HDFGWTR_EL2, NBRBCTL, 60, 1)
+ FIELD(HDFGWTR_EL2, NBRBDATA, 61, 1)
+ FIELD(HDFGWTR_EL2, NPMSNEVFR_EL1, 62, 1)
++FIELD(FGT, NXS, 13, 1) /* Honour HCR_EL2.FGTnXS to suppress FGT */
+ /* Which fine-grained trap bit register to check, if any */
+ FIELD(FGT, TYPE, 10, 3)
+ FIELD(FGT, REV, 9, 1) /* Is bit sense reversed? */
+@@ -XXX,XX +XXX,XX @@ FIELD(FGT, BITPOS, 0, 6) /* Bit position within the uint64_t */
+ #define DO_REV_BIT(REG, BITNAME)                                        \
+     FGT_##BITNAME = FGT_##REG | FGT_REV | R_##REG##_EL2_##BITNAME##_SHIFT
++/*
++ * The FGT bits for TLBI maintenance instructions accessible at EL1 always
++ * affect the "normal" TLBI insns; they affect the corresponding TLBI insns
++ * with the nXS qualifier only if HCRX_EL2.FGTnXS is 0. We define e.g.
++ * FGT_TLBIVAE1 to use for the normal insn, and FGT_TLBIVAE1NXS to use
++ * for the nXS qualified insn.
++ */
++#define DO_TLBINXS_BIT(REG, BITNAME)                             \
++    FGT_##BITNAME = FGT_##REG | R_##REG##_EL2_##BITNAME##_SHIFT, \
++    FGT_##BITNAME##NXS = FGT_##BITNAME | R_FGT_NXS_MASK
++
+ typedef enum FGTBit {
+     /*
+      * These bits tell us which register arrays to use:
+@@ -XXX,XX +XXX,XX @@ typedef enum FGTBit {
+     DO_BIT(HFGITR, ATS1E0W),
+     DO_BIT(HFGITR, ATS1E1RP),
+     DO_BIT(HFGITR, ATS1E1WP),
+-    DO_BIT(HFGITR, TLBIVMALLE1OS),
+-    DO_BIT(HFGITR, TLBIVAE1OS),
+-    DO_BIT(HFGITR, TLBIASIDE1OS),
+-    DO_BIT(HFGITR, TLBIVAAE1OS),
+-    DO_BIT(HFGITR, TLBIVALE1OS),
+-    DO_BIT(HFGITR, TLBIVAALE1OS),
+-    DO_BIT(HFGITR, TLBIRVAE1OS),
+-    DO_BIT(HFGITR, TLBIRVAAE1OS),
+-    DO_BIT(HFGITR, TLBIRVALE1OS),
+-    DO_BIT(HFGITR, TLBIRVAALE1OS),
+-    DO_BIT(HFGITR, TLBIVMALLE1IS),
+-    DO_BIT(HFGITR, TLBIVAE1IS),
+-    DO_BIT(HFGITR, TLBIASIDE1IS),
+-    DO_BIT(HFGITR, TLBIVAAE1IS),
+-    DO_BIT(HFGITR, TLBIVALE1IS),
+-    DO_BIT(HFGITR, TLBIVAALE1IS),
+-    DO_BIT(HFGITR, TLBIRVAE1IS),
+-    DO_BIT(HFGITR, TLBIRVAAE1IS),
+-    DO_BIT(HFGITR, TLBIRVALE1IS),
+-    DO_BIT(HFGITR, TLBIRVAALE1IS),
+-    DO_BIT(HFGITR, TLBIRVAE1),
+-    DO_BIT(HFGITR, TLBIRVAAE1),
+-    DO_BIT(HFGITR, TLBIRVALE1),
+-    DO_BIT(HFGITR, TLBIRVAALE1),
+-    DO_BIT(HFGITR, TLBIVMALLE1),
+-    DO_BIT(HFGITR, TLBIVAE1),
+-    DO_BIT(HFGITR, TLBIASIDE1),
+-    DO_BIT(HFGITR, TLBIVAAE1),
+-    DO_BIT(HFGITR, TLBIVALE1),
+-    DO_BIT(HFGITR, TLBIVAALE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIVMALLE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIASIDE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAAE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVALE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAALE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAAE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVALE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAALE1OS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVMALLE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIASIDE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAAE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVALE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAALE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAAE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVALE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAALE1IS),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAAE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVALE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIRVAALE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIVMALLE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIASIDE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAAE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIVALE1),
++    DO_TLBINXS_BIT(HFGITR, TLBIVAALE1),
+     DO_BIT(HFGITR, CFPRCTX),
+     DO_BIT(HFGITR, DVPRCTX),
+     DO_BIT(HFGITR, CPPRCTX),
+diff --git a/target/arm/cpu-features.h b/target/arm/cpu-features.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/cpu-features.h
++++ b/target/arm/cpu-features.h
+@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_fcma(const ARMISARegisters *id)
+     return FIELD_EX64(id->id_aa64isar1, ID_AA64ISAR1, FCMA) != 0;
+ }
++static inline bool isar_feature_aa64_xs(const ARMISARegisters *id)
++{
++    return FIELD_EX64(id->id_aa64isar1, ID_AA64ISAR1, XS) != 0;
++}
++
+ /*
+  * These are the values from APA/API/APA3.
+  * In general these must be compared '>=', per the normal Arm ARM
+diff --git a/target/arm/helper.c b/target/arm/helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.c
++++ b/target/arm/helper.c
+@@ -XXX,XX +XXX,XX @@ static void hcrx_write(CPUARMState *env, const ARMCPRegInfo *ri,
+         valid_mask |= HCRX_TALLINT | HCRX_VINMI | HCRX_VFNMI;
+     }
+     /* FEAT_CMOW adds CMOW */
+-
+     if (cpu_isar_feature(aa64_cmow, cpu)) {
+         valid_mask |= HCRX_CMOW;
+     }
++    /* FEAT_XS adds FGTnXS, FnXS */
++    if (cpu_isar_feature(aa64_xs, cpu)) {
++        valid_mask |= HCRX_FGTNXS | HCRX_FNXS;
++    }
+     /* Clear RES0 bits.  */
+     env->cp15.hcrx_el2 = value & valid_mask;
+diff --git a/target/arm/tcg/op_helper.c b/target/arm/tcg/op_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/op_helper.c
++++ b/target/arm/tcg/op_helper.c
+@@ -XXX,XX +XXX,XX @@ const void *HELPER(access_check_cp_reg)(CPUARMState *env, uint32_t key,
+         unsigned int idx = FIELD_EX32(ri->fgt, FGT, IDX);
+         unsigned int bitpos = FIELD_EX32(ri->fgt, FGT, BITPOS);
+         bool rev = FIELD_EX32(ri->fgt, FGT, REV);
++        bool nxs = FIELD_EX32(ri->fgt, FGT, NXS);
+         bool trapbit;
+         if (ri->fgt & FGT_EXEC) {
+@@ -XXX,XX +XXX,XX @@ const void *HELPER(access_check_cp_reg)(CPUARMState *env, uint32_t key,
+             trapword = env->cp15.fgt_write[idx];
+         }
+-        trapbit = extract64(trapword, bitpos, 1);
++        if (nxs && (arm_hcrx_el2_eff(env) & HCRX_FGTNXS)) {
++            /*
++             * If HCRX_EL2.FGTnXS is 1 then the fine-grained trap for
++             * TLBI maintenance insns does *not* apply to the nXS variant.
++             */
++            trapbit = 0;
++        } else {
++            trapbit = extract64(trapword, bitpos, 1);
++        }
+         if (trapbit != rev) {
+             res = CP_ACCESS_TRAP_EL2;
+             goto fail;
+--
+.34.1

-New patch
+[PULL 13/19] target/arm: Add ARM_CP_ADD_TLBI_NXS type flag for NXS insns
+All of the TLBI insns with an NXS variant put that variant at the
+same encoding but with a CRn field that is one greater than for the
+original TLBI insn.  To avoid having to define every TLBI insn
+effectively twice, once in the normal way and once in a set of cpreg
+arrays that are only registered when FEAT_XS is present, we define a
+new ARM_CP_ADD_TLB_NXS type flag for cpregs.  When this flag is set
+in a cpreg struct and FEAT_XS is present,
+define_one_arm_cp_reg_with_opaque() will automatically add a second
+cpreg to the hash table for the TLBI NXS insn with:
+ * the crn+1 encoding
+ * an FGT field that indicates that it should honour HCR_EL2.FGTnXS
+ * a name with the "NXS" suffix
+(If there are future TLBI NXS insns that don't use this same
+encoding convention, it is also possible to define them manually.)
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211144440.2700268-3-peter.maydell@linaro.org
+---
+ target/arm/cpregs.h |  8 ++++++++
+ target/arm/helper.c | 25 +++++++++++++++++++++++++
+files changed, 33 insertions(+)
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/cpregs.h
++++ b/target/arm/cpregs.h
+@@ -XXX,XX +XXX,XX @@ enum {
+      * equivalent EL1 register when FEAT_NV2 is enabled.
+      */
+     ARM_CP_NV2_REDIRECT          = 1 << 20,
++    /*
++     * Flag: this is a TLBI insn which (when FEAT_XS is present) also has
++     * an NXS variant at the same encoding except that crn is 1 greater,
++     * so when registering this cpreg automatically also register one
++     * for the TLBI NXS variant. (For QEMU the NXS variant behaves
++     * identically to the normal one, other than FGT trapping handling.)
++     */
++    ARM_CP_ADD_TLBI_NXS          = 1 << 21,
+ };
+ /*
+diff --git a/target/arm/helper.c b/target/arm/helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.c
++++ b/target/arm/helper.c
+@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
+                     if (r->state != state && r->state != ARM_CP_STATE_BOTH) {
+                         continue;
+                     }
++                    if ((r->type & ARM_CP_ADD_TLBI_NXS) &&
++                        cpu_isar_feature(aa64_xs, cpu)) {
++                        /*
++                         * This is a TLBI insn which has an NXS variant. The
++                         * NXS variant is at the same encoding except that
++                         * crn is +1, and has the same behaviour except for
++                         * fine-grained trapping. Add the NXS insn here and
++                         * then fall through to add the normal register.
++                         * add_cpreg_to_hashtable() copies the cpreg struct
++                         * and name that it is passed, so it's OK to use
++                         * a local struct here.
++                         */
++                        ARMCPRegInfo nxs_ri = *r;
++                        g_autofree char *name = g_strdup_printf("%sNXS", r->name);
++
++                        assert(state == ARM_CP_STATE_AA64);
++                        assert(nxs_ri.crn < 0xf);
++                        nxs_ri.crn++;
++                        if (nxs_ri.fgt) {
++                            nxs_ri.fgt |= R_FGT_NXS_MASK;
++                        }
++                        add_cpreg_to_hashtable(cpu, &nxs_ri, opaque, state,
++                                               ARM_CP_SECSTATE_NS,
++                                               crm, opc1, opc2, name);
++                    }
+                     if (state == ARM_CP_STATE_AA32) {
+                         /*
+                          * Under AArch32 CP registers can be common
+--
+.34.1

-New patch
+[PULL 14/19] target/arm: Add ARM_CP_ADD_TLBI_NXS type flag to TLBI insns
+Add the ARM_CP_ADD_TLBI_NXS to the TLBI insns with an NXS variant.
+This is every AArch64 TLBI encoding except for the four FEAT_RME TLBI
+insns.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211144440.2700268-4-peter.maydell@linaro.org
+---
+ target/arm/tcg/tlb-insns.c | 202 +++++++++++++++++++++++--------------
+file changed, 124 insertions(+), 78 deletions(-)
+diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/tlb-insns.c
++++ b/target/arm/tcg/tlb-insns.c
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_v8_cp_reginfo[] = {
+     /* AArch64 TLBI operations */
+     { .name = "TLBI_VMALLE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVMALLE1IS,
+       .writefn = tlbi_aa64_vmalle1is_write },
+     { .name = "TLBI_VAE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAE1IS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_ASIDE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIASIDE1IS,
+       .writefn = tlbi_aa64_vmalle1is_write },
+     { .name = "TLBI_VAAE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAAE1IS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_VALE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVALE1IS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_VAALE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAALE1IS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_VMALLE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVMALLE1,
+       .writefn = tlbi_aa64_vmalle1_write },
+     { .name = "TLBI_VAE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAE1,
+       .writefn = tlbi_aa64_vae1_write },
+     { .name = "TLBI_ASIDE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIASIDE1,
+       .writefn = tlbi_aa64_vmalle1_write },
+     { .name = "TLBI_VAAE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAAE1,
+       .writefn = tlbi_aa64_vae1_write },
+     { .name = "TLBI_VALE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVALE1,
+       .writefn = tlbi_aa64_vae1_write },
+     { .name = "TLBI_VAALE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAALE1,
+       .writefn = tlbi_aa64_vae1_write },
+     { .name = "TLBI_IPAS2E1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ipas2e1is_write },
+     { .name = "TLBI_IPAS2LE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ipas2e1is_write },
+     { .name = "TLBI_ALLE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 4,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle1is_write },
+     { .name = "TLBI_VMALLS12E1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 6,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle1is_write },
+     { .name = "TLBI_IPAS2E1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ipas2e1_write },
+     { .name = "TLBI_IPAS2LE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ipas2e1_write },
+     { .name = "TLBI_ALLE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 4,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle1_write },
+     { .name = "TLBI_VMALLS12E1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 6,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle1is_write },
+ };
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
+       .writefn = tlbimva_hyp_is_write },
+     { .name = "TLBI_ALLE2", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_alle2_write },
+     { .name = "TLBI_VAE2", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_vae2_write },
+     { .name = "TLBI_VALE2", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_vae2_write },
+     { .name = "TLBI_ALLE2IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_alle2is_write },
+     { .name = "TLBI_VAE2IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_vae2is_write },
+     { .name = "TLBI_VALE2IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_vae2is_write },
+ };
+ static const ARMCPRegInfo tlbi_el3_cp_reginfo[] = {
+     { .name = "TLBI_ALLE3IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 0,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle3is_write },
+     { .name = "TLBI_VAE3IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 1,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae3is_write },
+     { .name = "TLBI_VALE3IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 5,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae3is_write },
+     { .name = "TLBI_ALLE3", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 0,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle3_write },
+     { .name = "TLBI_VAE3", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 1,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae3_write },
+     { .name = "TLBI_VALE3", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 5,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae3_write },
+ };
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ripas2e1is_write(CPUARMState *env,
+ static const ARMCPRegInfo tlbirange_reginfo[] = {
+     { .name = "TLBI_RVAE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 1,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAE1IS,
+       .writefn = tlbi_aa64_rvae1is_write },
+     { .name = "TLBI_RVAAE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 3,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAAE1IS,
+       .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVALE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 5,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVALE1IS,
+       .writefn = tlbi_aa64_rvae1is_write },
+     { .name = "TLBI_RVAALE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 7,
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbis,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAALE1IS,
+       .writefn = tlbi_aa64_rvae1is_write },
+     { .name = "TLBI_RVAE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAE1OS,
+       .writefn = tlbi_aa64_rvae1is_write },
+     { .name = "TLBI_RVAAE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 3,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAAE1OS,
+       .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVALE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 5,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVALE1OS,
+       .writefn = tlbi_aa64_rvae1is_write },
+     { .name = "TLBI_RVAALE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 7,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAALE1OS,
+       .writefn = tlbi_aa64_rvae1is_write },
+     { .name = "TLBI_RVAE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAE1,
+       .writefn = tlbi_aa64_rvae1_write },
+     { .name = "TLBI_RVAAE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 3,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAAE1,
+       .writefn = tlbi_aa64_rvae1_write },
+    { .name = "TLBI_RVALE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 5,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVALE1,
+       .writefn = tlbi_aa64_rvae1_write },
+     { .name = "TLBI_RVAALE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 7,
+-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlb,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIRVAALE1,
+       .writefn = tlbi_aa64_rvae1_write },
+     { .name = "TLBI_RIPAS2E1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 2,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ripas2e1is_write },
+     { .name = "TLBI_RIPAS2LE1IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 6,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ripas2e1is_write },
+     { .name = "TLBI_RVAE2IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_rvae2is_write },
+    { .name = "TLBI_RVALE2IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_rvae2is_write },
+     { .name = "TLBI_RIPAS2E1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 2,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ripas2e1_write },
+     { .name = "TLBI_RIPAS2LE1", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 6,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_ripas2e1_write },
+    { .name = "TLBI_RVAE2OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_rvae2is_write },
+    { .name = "TLBI_RVALE2OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_rvae2is_write },
+     { .name = "TLBI_RVAE2", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_rvae2_write },
+    { .name = "TLBI_RVALE2", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_rvae2_write },
+    { .name = "TLBI_RVAE3IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 1,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_rvae3is_write },
+    { .name = "TLBI_RVALE3IS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 5,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_rvae3is_write },
+    { .name = "TLBI_RVAE3OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 1,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_rvae3is_write },
+    { .name = "TLBI_RVALE3OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 5,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_rvae3is_write },
+    { .name = "TLBI_RVAE3", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 1,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_rvae3_write },
+    { .name = "TLBI_RVALE3", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 5,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_rvae3_write },
+ };
+ static const ARMCPRegInfo tlbios_reginfo[] = {
+     { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVMALLE1OS,
+       .writefn = tlbi_aa64_vmalle1is_write },
+     { .name = "TLBI_VAE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 1,
+       .fgt = FGT_TLBIVAE1OS,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_ASIDE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 2,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIASIDE1OS,
+       .writefn = tlbi_aa64_vmalle1is_write },
+     { .name = "TLBI_VAAE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 3,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAAE1OS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_VALE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 5,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVALE1OS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_VAALE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 7,
+-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
++      .access = PL1_W, .accessfn = access_ttlbos,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .fgt = FGT_TLBIVAALE1OS,
+       .writefn = tlbi_aa64_vae1is_write },
+     { .name = "TLBI_ALLE2OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 0,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_alle2is_write },
+     { .name = "TLBI_VAE2OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_vae2is_write },
+    { .name = "TLBI_ALLE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 4,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle1is_write },
+     { .name = "TLBI_VALE2OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .access = PL2_W,
++      .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS | ARM_CP_EL3_NO_EL2_UNDEF,
+       .writefn = tlbi_aa64_vae2is_write },
+     { .name = "TLBI_VMALLS12E1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 6,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle1is_write },
+     { .name = "TLBI_IPAS2E1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 0,
+-      .access = PL2_W, .type = ARM_CP_NOP },
++      .access = PL2_W, .type = ARM_CP_NOP | ARM_CP_ADD_TLBI_NXS },
+     { .name = "TLBI_RIPAS2E1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 3,
+-      .access = PL2_W, .type = ARM_CP_NOP },
++      .access = PL2_W, .type = ARM_CP_NOP | ARM_CP_ADD_TLBI_NXS },
+     { .name = "TLBI_IPAS2LE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 4,
+-      .access = PL2_W, .type = ARM_CP_NOP },
++      .access = PL2_W, .type = ARM_CP_NOP | ARM_CP_ADD_TLBI_NXS },
+     { .name = "TLBI_RIPAS2LE1OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 7,
+-      .access = PL2_W, .type = ARM_CP_NOP },
++      .access = PL2_W, .type = ARM_CP_NOP | ARM_CP_ADD_TLBI_NXS },
+     { .name = "TLBI_ALLE3OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 0,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_alle3is_write },
+     { .name = "TLBI_VAE3OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 1,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae3is_write },
+     { .name = "TLBI_VALE3OS", .state = ARM_CP_STATE_AA64,
+       .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 5,
+-      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .access = PL3_W, .type = ARM_CP_NO_RAW | ARM_CP_ADD_TLBI_NXS,
+       .writefn = tlbi_aa64_vae3is_write },
+ };
+--
+.34.1

-New patch
+[PULL 15/19] target/arm: Add decodetree entry for DSB nXS variant
+From: Manos Pitsidianakis <manos.pitsidianakis@linaro.org>
+The DSB nXS variant is always both a reads and writes request type.
+Ignore the domain field like we do in plain DSB and perform a full
+system barrier operation.
+The DSB nXS variant is part of FEAT_XS made mandatory from Armv8.7.
+Signed-off-by: Manos Pitsidianakis <manos.pitsidianakis@linaro.org>
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211144440.2700268-5-peter.maydell@linaro.org
+[PMM: added missing "UNDEF unless feature present" check]
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      | 3 +++
+ target/arm/tcg/translate-a64.c | 9 +++++++++
+files changed, 12 insertions(+)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ WFIT            1101 0101 0000 0011 0001 0000 001 rd:5
+ CLREX           1101 0101 0000 0011 0011 ---- 010 11111
+ DSB_DMB         1101 0101 0000 0011 0011 domain:2 types:2 10- 11111
++# For the DSB nXS variant, types always equals MBReqTypes_All and we ignore the
++# domain bits.
++DSB_nXS         1101 0101 0000 0011 0011 -- 10 001 11111
+ ISB             1101 0101 0000 0011 0011 ---- 110 11111
+ SB              1101 0101 0000 0011 0011 0000 111 11111
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_DSB_DMB(DisasContext *s, arg_DSB_DMB *a)
+     return true;
+ }
++static bool trans_DSB_nXS(DisasContext *s, arg_DSB_nXS *a)
++{
++    if (!dc_isar_feature(aa64_xs, s)) {
++        return false;
++    }
++    tcg_gen_mb(TCG_BAR_SC | TCG_MO_ALL);
++    return true;
++}
++
+ static bool trans_ISB(DisasContext *s, arg_ISB *a)
+ {
+     /*
+--
+.34.1

-New patch
+[PULL 16/19] target/arm: Enable FEAT_XS for the max cpu
+From: Manos Pitsidianakis <manos.pitsidianakis@linaro.org>
+Add FEAT_XS feature report value in max cpu's ID_AA64ISAR1 sys register.
+Signed-off-by: Manos Pitsidianakis <manos.pitsidianakis@linaro.org>
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211144440.2700268-6-peter.maydell@linaro.org
+[PMM: Add entry for FEAT_XS to documentation]
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ docs/system/arm/emulation.rst | 1 +
+ target/arm/tcg/cpu64.c        | 1 +
+files changed, 2 insertions(+)
+diff --git a/docs/system/arm/emulation.rst b/docs/system/arm/emulation.rst
+index XXXXXXX..XXXXXXX 100644
+--- a/docs/system/arm/emulation.rst
++++ b/docs/system/arm/emulation.rst
+@@ -XXX,XX +XXX,XX @@ the following architecture extensions:
+ - FEAT_VMID16 (16-bit VMID)
+ - FEAT_WFxT (WFE and WFI instructions with timeout)
+ - FEAT_XNX (Translation table stage 2 Unprivileged Execute-never)
++- FEAT_XS (XS attribute)
+ For information on the specifics of these extensions, please refer
+ to the `Arm Architecture Reference Manual for A-profile architecture
+diff --git a/target/arm/tcg/cpu64.c b/target/arm/tcg/cpu64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/cpu64.c
++++ b/target/arm/tcg/cpu64.c
+@@ -XXX,XX +XXX,XX @@ void aarch64_max_tcg_initfn(Object *obj)
+     t = FIELD_DP64(t, ID_AA64ISAR1, BF16, 2);     /* FEAT_BF16, FEAT_EBF16 */
+     t = FIELD_DP64(t, ID_AA64ISAR1, DGH, 1);      /* FEAT_DGH */
+     t = FIELD_DP64(t, ID_AA64ISAR1, I8MM, 1);     /* FEAT_I8MM */
++    t = FIELD_DP64(t, ID_AA64ISAR1, XS, 1);       /* FEAT_XS */
+     cpu->isar.id_aa64isar1 = t;
+     t = cpu->isar.id_aa64isar2;
+--
+.34.1

-New patch
+[PULL 17/19] tests/tcg/aarch64: add system test for FEAT_XS
+From: Manos Pitsidianakis <manos.pitsidianakis@linaro.org>
+Add system test to make sure FEAT_XS is enabled for max cpu emulation
+and that QEMU doesn't crash when encountering an NXS instruction
+variant.
+Signed-off-by: Manos Pitsidianakis <manos.pitsidianakis@linaro.org>
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20241211144440.2700268-7-peter.maydell@linaro.org
+[PMM: In ISAR field test, mask with 0xf, not 0xff; use < rather
+ than an equality test to follow the standard ID register field
+ check guidelines]
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ tests/tcg/aarch64/system/feat-xs.c | 27 +++++++++++++++++++++++++++
+file changed, 27 insertions(+)
+ create mode 100644 tests/tcg/aarch64/system/feat-xs.c
+diff --git a/tests/tcg/aarch64/system/feat-xs.c b/tests/tcg/aarch64/system/feat-xs.c
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tests/tcg/aarch64/system/feat-xs.c
+@@ -XXX,XX +XXX,XX @@
++/*
++ * FEAT_XS Test
++ *
++ * Copyright (c) 2024 Linaro Ltd
++ *
++ * SPDX-License-Identifier: GPL-2.0-or-later
++ */
++
++#include <minilib.h>
++#include <stdint.h>
++
++int main(void)
++{
++    uint64_t isar1;
++
++    asm volatile ("mrs %0, id_aa64isar1_el1" : "=r"(isar1));
++    if (((isar1 >> 56) & 0xf) < 1) {
++        ml_printf("FEAT_XS not supported by CPU");
++        return 1;
++    }
++    /* VMALLE1NXS */
++    asm volatile (".inst 0xd508971f");
++    /* VMALLE1OSNXS */
++    asm volatile (".inst 0xd508911f");
++
++    return 0;
++}
+--
+.34.1

-[Qemu-devel] [PULL 2/5] stellaris_input: Fix vmstate description of buttons field
+[PULL 18/19] hw/intc/arm_gicv3_its: Zero initialize local DTEntry etc structs
-gamepad_state::buttons is a pointer to an array of structs,
+In the GICv3 ITS model, we have a common coding pattern which has a
-not an array of structs, so should be declared in the vmstate
+local C struct like "DTEntry dte", which is a C representation of an
-with VMSTATE_STRUCT_VARRAY_POINTER_INT32; otherwise we
+in-guest-memory data structure, and we call a function such as
-corrupt memory on incoming migration.
+get_dte() to read guest memory and fill in the C struct.  These
 functions to read in the struct sometimes have cases where they will
 leave early and not fill in the whole struct (for instance get_dte()
 will set "dte->valid = false" and nothing else for the case where it
 is passed an entry_addr implying that there is no L2 table entry for
 the DTE).  This then causes potential use of uninitialized memory
 later, for instance when we call a trace event which prints all the
 fields of the struct.  Sufficiently advanced compilers may produce
 -Wmaybe-uninitialized warnings about this, especially if LTO is
 enabled.
-We bump the vmstate version field as the easiest way to
+Rather than trying to carefully separate out these trace events into
-deal with the migration break, since migration wouldn't have
+"only the 'valid' field is initialized" and "all fields can be
-worked reliably before anyway.
+printed", zero-init all the structs when we define them. None of
 these structs are large (the biggest is 24 bytes) and having
 consistent behaviour is less likely to be buggy.
+Cc: qemu-stable@nongnu.org
+Resolves: https://gitlab.com/qemu-project/qemu/-/issues/2718
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
+Message-id: 20241213182337.3343068-1-peter.maydell@linaro.org
 Message-id: 20190725163710.11703-2-peter.maydell@linaro.org
 ---
- hw/input/stellaris_input.c | 10 ++++++----
+ hw/intc/arm_gicv3_its.c | 44 ++++++++++++++++++++---------------------
-file changed, 6 insertions(+), 4 deletions(-)
+file changed, 22 insertions(+), 22 deletions(-)
-diff --git a/hw/input/stellaris_input.c b/hw/input/stellaris_input.c
+diff --git a/hw/intc/arm_gicv3_its.c b/hw/intc/arm_gicv3_its.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/input/stellaris_input.c
+--- a/hw/intc/arm_gicv3_its.c
-+++ b/hw/input/stellaris_input.c
++++ b/hw/intc/arm_gicv3_its.c
-@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_stellaris_button = {
+@@ -XXX,XX +XXX,XX @@ static ItsCmdResult lookup_vte(GICv3ITSState *s, const char *who,
+ static ItsCmdResult process_its_cmd_phys(GICv3ITSState *s, const ITEntry *ite,
- static const VMStateDescription vmstate_stellaris_gamepad = {
+                                          int irqlevel)
-     .name = "stellaris_gamepad",
+ {
--    .version_id = 1,
+-    CTEntry cte;
--    .minimum_version_id = 1,
++    CTEntry cte = {};
-+    .version_id = 2,
+     ItsCmdResult cmdres;
-+    .minimum_version_id = 2,
-     .fields = (VMStateField[]) {
+     cmdres = lookup_cte(s, __func__, ite->icid, &cte);
-         VMSTATE_INT32(extension, gamepad_state),
+@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_its_cmd_phys(GICv3ITSState *s, const ITEntry *ite,
--        VMSTATE_STRUCT_VARRAY_INT32(buttons, gamepad_state, num_buttons, 0,
+ static ItsCmdResult process_its_cmd_virt(GICv3ITSState *s, const ITEntry *ite,
--                              vmstate_stellaris_button, gamepad_button),
+                                          int irqlevel)
-+        VMSTATE_STRUCT_VARRAY_POINTER_INT32(buttons, gamepad_state,
+ {
-+                                            num_buttons,
+-    VTEntry vte;
-+                                            vmstate_stellaris_button,
++    VTEntry vte = {};
-+                                            gamepad_button),
+     ItsCmdResult cmdres;
-         VMSTATE_END_OF_LIST()
-     }
+     cmdres = lookup_vte(s, __func__, ite->vpeid, &vte);
- };
+@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_its_cmd_virt(GICv3ITSState *s, const ITEntry *ite,
  static ItsCmdResult do_process_its_cmd(GICv3ITSState *s, uint32_t devid,
                                         uint32_t eventid, ItsCmdType cmd)
  {
 -    DTEntry dte;
 -    ITEntry ite;
 +    DTEntry dte = {};
 +    ITEntry ite = {};
      ItsCmdResult cmdres;
      int irqlevel;
@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_mapti(GICv3ITSState *s, const uint64_t *cmdpkt,
      uint32_t pIntid = 0;
      uint64_t num_eventids;
      uint16_t icid = 0;
 -    DTEntry dte;
 -    ITEntry ite;
 +    DTEntry dte = {};
 +    ITEntry ite = {};
      devid = (cmdpkt[0] & DEVID_MASK) >> DEVID_SHIFT;
      eventid = cmdpkt[1] & EVENTID_MASK;
@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_vmapti(GICv3ITSState *s, const uint64_t *cmdpkt,
  {
      uint32_t devid, eventid, vintid, doorbell, vpeid;
      uint32_t num_eventids;
 -    DTEntry dte;
 -    ITEntry ite;
 +    DTEntry dte = {};
 +    ITEntry ite = {};
      if (!its_feature_virtual(s)) {
          return CMD_CONTINUE;
@@ -XXX,XX +XXX,XX @@ static bool update_cte(GICv3ITSState *s, uint16_t icid, const CTEntry *cte)
  static ItsCmdResult process_mapc(GICv3ITSState *s, const uint64_t *cmdpkt)
  {
      uint16_t icid;
 -    CTEntry cte;
 +    CTEntry cte = {};
      icid = cmdpkt[2] & ICID_MASK;
      cte.valid = cmdpkt[2] & CMD_FIELD_VALID_MASK;
@@ -XXX,XX +XXX,XX @@ static bool update_dte(GICv3ITSState *s, uint32_t devid, const DTEntry *dte)
  static ItsCmdResult process_mapd(GICv3ITSState *s, const uint64_t *cmdpkt)
  {
      uint32_t devid;
 -    DTEntry dte;
 +    DTEntry dte = {};
      devid = (cmdpkt[0] & DEVID_MASK) >> DEVID_SHIFT;
      dte.size = cmdpkt[1] & SIZE_MASK;
@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_movi(GICv3ITSState *s, const uint64_t *cmdpkt)
  {
      uint32_t devid, eventid;
      uint16_t new_icid;
 -    DTEntry dte;
 -    CTEntry old_cte, new_cte;
 -    ITEntry old_ite;
 +    DTEntry dte = {};
 +    CTEntry old_cte = {}, new_cte = {};
 +    ITEntry old_ite = {};
      ItsCmdResult cmdres;
      devid = FIELD_EX64(cmdpkt[0], MOVI_0, DEVICEID);
@@ -XXX,XX +XXX,XX @@ static bool update_vte(GICv3ITSState *s, uint32_t vpeid, const VTEntry *vte)
  static ItsCmdResult process_vmapp(GICv3ITSState *s, const uint64_t *cmdpkt)
  {
 -    VTEntry vte;
 +    VTEntry vte = {};
      uint32_t vpeid;
      if (!its_feature_virtual(s)) {
@@ -XXX,XX +XXX,XX @@ static void vmovp_callback(gpointer data, gpointer opaque)
       */
      GICv3ITSState *s = data;
      VmovpCallbackData *cbdata = opaque;
 -    VTEntry vte;
 +    VTEntry vte = {};
      ItsCmdResult cmdres;
      cmdres = lookup_vte(s, __func__, cbdata->vpeid, &vte);
@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_vmovi(GICv3ITSState *s, const uint64_t *cmdpkt)
  {
      uint32_t devid, eventid, vpeid, doorbell;
      bool doorbell_valid;
 -    DTEntry dte;
 -    ITEntry ite;
 -    VTEntry old_vte, new_vte;
 +    DTEntry dte = {};
 +    ITEntry ite = {};
 +    VTEntry old_vte = {}, new_vte = {};
      ItsCmdResult cmdres;
      if (!its_feature_virtual(s)) {
@@ -XXX,XX +XXX,XX @@ static ItsCmdResult process_vinvall(GICv3ITSState *s, const uint64_t *cmdpkt)
  static ItsCmdResult process_inv(GICv3ITSState *s, const uint64_t *cmdpkt)
  {
      uint32_t devid, eventid;
 -    ITEntry ite;
 -    DTEntry dte;
 -    CTEntry cte;
 -    VTEntry vte;
 +    ITEntry ite = {};
 +    DTEntry dte = {};
 +    CTEntry cte = {};
 +    VTEntry vte = {};
      ItsCmdResult cmdres;
      devid = FIELD_EX64(cmdpkt[0], INV_0, DEVICEID);
 --
-.20.1
+.34.1

-New patch
+[PULL 19/19] tests/functional: update sbsa-ref firmware used in test
+From: Marcin Juszkiewicz <marcin.juszkiewicz@linaro.org>
+Update the URLs for the binaries we use for the firmware in the
+sbsa-ref functional tests.
+The firmware is built using Debian 'bookworm' cross toolchain (gcc
+.2.0).
+Used versions:
+- Trusted Firmware v2.12.0
+- Tianocore EDK2 stable202411
+- Tianocore EDK2 Platforms code commit 4b3530d
+This allows us to move away from "some git commit on trunk"
+to a stable release for both TF-A and EDK2.
+Signed-off-by: Marcin Juszkiewicz <marcin.juszkiewicz@linaro.org>
+Message-id: 20241125125448.185504-1-marcin.juszkiewicz@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ tests/functional/test_aarch64_sbsaref.py | 20 ++++++++++----------
+file changed, 10 insertions(+), 10 deletions(-)
+diff --git a/tests/functional/test_aarch64_sbsaref.py b/tests/functional/test_aarch64_sbsaref.py
+index XXXXXXX..XXXXXXX 100755
+--- a/tests/functional/test_aarch64_sbsaref.py
++++ b/tests/functional/test_aarch64_sbsaref.py
+@@ -XXX,XX +XXX,XX @@ def fetch_firmware(test):
+     Used components:
+-    - Trusted Firmware         v2.11.0
+-    - Tianocore EDK2           4d4f569924
+-    - Tianocore EDK2-platforms 3f08401
++    - Trusted Firmware         v2.12.0
++    - Tianocore EDK2           edk2-stable202411
++    - Tianocore EDK2-platforms 4b3530d
+     """
+@@ -XXX,XX +XXX,XX @@ class Aarch64SbsarefMachine(QemuSystemTest):
+     ASSET_FLASH0 = Asset(
+         ('https://artifacts.codelinaro.org/artifactory/linaro-419-sbsa-ref/'
+-         '20240619-148232/edk2/SBSA_FLASH0.fd.xz'),
+-        '0c954842a590988f526984de22e21ae0ab9cb351a0c99a8a58e928f0c7359cf7')
++         '20241122-189881/edk2/SBSA_FLASH0.fd.xz'),
++        '76eb89d42eebe324e4395329f47447cda9ac920aabcf99aca85424609c3384a5')
+     ASSET_FLASH1 = Asset(
+         ('https://artifacts.codelinaro.org/artifactory/linaro-419-sbsa-ref/'
+-         '20240619-148232/edk2/SBSA_FLASH1.fd.xz'),
+-        'c6ec39374c4d79bb9e9cdeeb6db44732d90bb4a334cec92002b3f4b9cac4b5ee')
++         '20241122-189881/edk2/SBSA_FLASH1.fd.xz'),
++        'f850f243bd8dbd49c51e061e0f79f1697546938f454aeb59ab7d93e5f0d412fc')
+     def test_sbsaref_edk2_firmware(self):
+@@ -XXX,XX +XXX,XX @@ def test_sbsaref_edk2_firmware(self):
+         # AP Trusted ROM
+         wait_for_console_pattern(self, "Booting Trusted Firmware")
+-        wait_for_console_pattern(self, "BL1: v2.11.0(release):")
++        wait_for_console_pattern(self, "BL1: v2.12.0(release):")
+         wait_for_console_pattern(self, "BL1: Booting BL2")
+         # Trusted Boot Firmware
+-        wait_for_console_pattern(self, "BL2: v2.11.0(release)")
++        wait_for_console_pattern(self, "BL2: v2.12.0(release)")
+         wait_for_console_pattern(self, "Booting BL31")
+         # EL3 Runtime Software
+-        wait_for_console_pattern(self, "BL31: v2.11.0(release)")
++        wait_for_console_pattern(self, "BL31: v2.12.0(release)")
+         # Non-trusted Firmware
+         wait_for_console_pattern(self, "UEFI firmware (version 1.0")
+--
+.34.1

Handful of bug fixes to sneak in before rc3.

thanks
-- PMM

The following changes since commit c985266ea5b50e46e07b3568c1346e10064205c9:

Merge remote-tracking branch 'remotes/cohuck/tags/s390x-20190726' into staging (2019-07-26 13:52:06 +0100)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20190726

for you to fetch changes up to 67505c114e6acc26f3a1a2b74833c61b6a34ff95:

hw/arm/boot: Further improve initrd positioning code (2019-07-26 16:17:56 +0100)

----------------------------------------------------------------
target-arm queue:
 * Fix broken migration on pl330 device
 * Fix broken migration on stellaris-input device
 * Add type checks to vmstate varry macros to avoid this class of bugs
 * hw/arm/boot: Fix some remaining cases where we would put the
   initrd on top of the kernel image

----------------------------------------------------------------
Damien Hedde (1):
      pl330: fix vmstate description

Peter Maydell (4):
      stellaris_input: Fix vmstate description of buttons field
      vmstate.h: Type check VMSTATE_STRUCT_VARRAY macros
      hw/arm/boot: Rename elf_{low, high}_addr to image_{low, high}_addr
      hw/arm/boot: Further improve initrd positioning code

include/migration/vmstate.h | 30 ++++++++++++++++++++++++------
 hw/arm/boot.c               | 37 +++++++++++++++++++++++++++----------
 hw/dma/pl330.c              | 17 +++++++++--------
 hw/input/stellaris_input.c  | 10 ++++++----
 4 files changed, 66 insertions(+), 28 deletions(-)

From: Damien Hedde <damien.hedde@greensocs.com>

Fix the pl330 main and queue vmstate description.
There were missing POINTER flags causing crashes during
incoming migration because:
+ PL330State chan field is a pointer to an array
+ PL330Queue queue field is a pointer to an array

Also bump corresponding vmsd version numbers.

Signed-off-by: Damien Hedde <damien.hedde@greensocs.com>
Reviewed-by: Philippe Mathieu-Daude <philmd@redhat.com>
Acked-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
Message-id: 20190724143553.21557-1-damien.hedde@greensocs.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/dma/pl330.c | 17 +++++++++--------
 1 file changed, 9 insertions(+), 8 deletions(-)

diff --git a/hw/dma/pl330.c b/hw/dma/pl330.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/pl330.c
+++ b/hw/dma/pl330.c
@@ -XXX,XX +XXX,XX @@ typedef struct PL330Queue {
 
 static const VMStateDescription vmstate_pl330_queue = {
     .name = "pl330_queue",
-    .version_id = 1,
-    .minimum_version_id = 1,
+    .version_id = 2,
+    .minimum_version_id = 2,
     .fields = (VMStateField[]) {
-        VMSTATE_STRUCT_VARRAY_UINT32(queue, PL330Queue, queue_size, 1,
-                                 vmstate_pl330_queue_entry, PL330QueueEntry),
+        VMSTATE_STRUCT_VARRAY_POINTER_UINT32(queue, PL330Queue, queue_size,
+                                             vmstate_pl330_queue_entry,
+                                             PL330QueueEntry),
         VMSTATE_END_OF_LIST()
     }
 };
@@ -XXX,XX +XXX,XX @@ struct PL330State {
 
 static const VMStateDescription vmstate_pl330 = {
     .name = "pl330",
-    .version_id = 1,
-    .minimum_version_id = 1,
+    .version_id = 2,
+    .minimum_version_id = 2,
     .fields = (VMStateField[]) {
         VMSTATE_STRUCT(manager, PL330State, 0, vmstate_pl330_chan, PL330Chan),
-        VMSTATE_STRUCT_VARRAY_UINT32(chan, PL330State, num_chnls, 0,
-                                     vmstate_pl330_chan, PL330Chan),
+        VMSTATE_STRUCT_VARRAY_POINTER_UINT32(chan, PL330State, num_chnls,
+                                             vmstate_pl330_chan, PL330Chan),
         VMSTATE_VBUFFER_UINT32(lo_seqn, PL330State, 1, NULL, num_chnls),
         VMSTATE_VBUFFER_UINT32(hi_seqn, PL330State, 1, NULL, num_chnls),
         VMSTATE_STRUCT(fifo, PL330State, 0, vmstate_pl330_fifo, PL330Fifo),
-- 
2.20.1

gamepad_state::buttons is a pointer to an array of structs,
not an array of structs, so should be declared in the vmstate
with VMSTATE_STRUCT_VARRAY_POINTER_INT32; otherwise we
corrupt memory on incoming migration.

We bump the vmstate version field as the easiest way to
deal with the migration break, since migration wouldn't have
worked reliably before anyway.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
Message-id: 20190725163710.11703-2-peter.maydell@linaro.org
---
 hw/input/stellaris_input.c | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/hw/input/stellaris_input.c b/hw/input/stellaris_input.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/input/stellaris_input.c
+++ b/hw/input/stellaris_input.c
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_stellaris_button = {
 
 static const VMStateDescription vmstate_stellaris_gamepad = {
     .name = "stellaris_gamepad",
-    .version_id = 1,
-    .minimum_version_id = 1,
+    .version_id = 2,
+    .minimum_version_id = 2,
     .fields = (VMStateField[]) {
         VMSTATE_INT32(extension, gamepad_state),
-        VMSTATE_STRUCT_VARRAY_INT32(buttons, gamepad_state, num_buttons, 0,
-                              vmstate_stellaris_button, gamepad_button),
+        VMSTATE_STRUCT_VARRAY_POINTER_INT32(buttons, gamepad_state,
+                                            num_buttons,
+                                            vmstate_stellaris_button,
+                                            gamepad_button),
         VMSTATE_END_OF_LIST()
     }
 };
-- 
2.20.1

The VMSTATE_STRUCT_VARRAY_UINT32 macro is intended to handle
migrating a field which is an array of structs, but where instead of
migrating the entire array we only migrate a variable number of
elements of it.

The VMSTATE_STRUCT_VARRAY_POINTER_UINT32 macro is intended to handle
migrating a field which is of pointer type, and points to a
dynamically allocated array of structs of variable size.

We weren't actually checking that the field passed to
VMSTATE_STRUCT_VARRAY_UINT32 really is an array, with the result that
accidentally using it where the _POINTER_ macro was intended would
compile but silently corrupt memory on migration.

Add type-checking that enforces that the field passed in is
really of the right array type. This applies to all the VMSTATE
macros which use flags including VMS_VARRAY_* but not VMS_POINTER.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
Tested-by: Damien Hedde <damien.hedde@greensocs.com>
Message-id: 20190725163710.11703-3-peter.maydell@linaro.org
---
 include/migration/vmstate.h | 30 ++++++++++++++++++++++++------
 1 file changed, 24 insertions(+), 6 deletions(-)

diff --git a/include/migration/vmstate.h b/include/migration/vmstate.h
index XXXXXXX..XXXXXXX 100644
--- a/include/migration/vmstate.h
+++ b/include/migration/vmstate.h
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_bitmap;
 extern const VMStateInfo vmstate_info_qtailq;
 
 #define type_check_2darray(t1,t2,n,m) ((t1(*)[n][m])0 - (t2*)0)
+/*
+ * Check that type t2 is an array of type t1 of size n,
+ * e.g. if t1 is 'foo' and n is 32 then t2 must be 'foo[32]'
+ */
 #define type_check_array(t1,t2,n) ((t1(*)[n])0 - (t2*)0)
 #define type_check_pointer(t1,t2) ((t1**)0 - (t2*)0)
+/*
+ * type of element 0 of the specified (array) field of the type.
+ * Note that if the field is a pointer then this will return the
+ * pointed-to type rather than complaining.
+ */
+#define typeof_elt_of_field(type, field) typeof(((type *)0)->field[0])
+/* Check that field f in struct type t2 is an array of t1, of any size */
+#define type_check_varray(t1, t2, f)                                 \
+    (type_check(t1, typeof_elt_of_field(t2, f))                      \
+     + QEMU_BUILD_BUG_ON_ZERO(!QEMU_IS_ARRAY(((t2 *)0)->f)))
 
 #define vmstate_offset_value(_state, _field, _type)                  \
     (offsetof(_state, _field) +                                      \
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     vmstate_offset_array(_state, _field, uint8_t,                    \
                          sizeof(typeof_field(_state, _field)))
 
+#define vmstate_offset_varray(_state, _field, _type)                 \
+    (offsetof(_state, _field) +                                      \
+     type_check_varray(_type, _state, _field))
+
 /* In the macros below, if there is a _version, that means the macro's
  * field will be processed only if the version being received is >=
  * the _version specified.  In general, if you add a new field, you
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     .info       = &(_info),                                          \
     .size       = sizeof(_type),                                     \
     .flags      = VMS_VARRAY_UINT32|VMS_MULTIPLY_ELEMENTS,           \
-    .offset     = offsetof(_state, _field),                          \
+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
 }
 
 #define VMSTATE_ARRAY_TEST(_field, _state, _num, _test, _info, _type) {\
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     .info       = &(_info),                                          \
     .size       = sizeof(_type),                                     \
     .flags      = VMS_VARRAY_INT32,                                  \
-    .offset     = offsetof(_state, _field),                          \
+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
 }
 
 #define VMSTATE_VARRAY_INT32(_field, _state, _field_num, _version, _info, _type) {\
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     .info       = &(_info),                                          \
     .size       = sizeof(_type),                                     \
     .flags      = VMS_VARRAY_UINT16,                                 \
-    .offset     = offsetof(_state, _field),                          \
+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
 }
 
 #define VMSTATE_VSTRUCT_TEST(_field, _state, _test, _version, _vmsd, _type, _struct_version) { \
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     .vmsd       = &(_vmsd),                                          \
     .size       = sizeof(_type),                                     \
     .flags      = VMS_STRUCT|VMS_VARRAY_UINT8,                       \
-    .offset     = offsetof(_state, _field),                          \
+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
 }
 
 /* a variable length array (i.e. _type *_field) but we know the
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     .vmsd       = &(_vmsd),                                          \
     .size       = sizeof(_type),                                     \
     .flags      = VMS_STRUCT|VMS_VARRAY_INT32,                       \
-    .offset     = offsetof(_state, _field),                          \
+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
 }
 
 #define VMSTATE_STRUCT_VARRAY_UINT32(_field, _state, _field_num, _version, _vmsd, _type) { \
@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
     .vmsd       = &(_vmsd),                                          \
     .size       = sizeof(_type),                                     \
     .flags      = VMS_STRUCT|VMS_VARRAY_UINT32,                      \
-    .offset     = offsetof(_state, _field),                          \
+    .offset     = vmstate_offset_varray(_state, _field, _type),      \
 }
 
 #define VMSTATE_STRUCT_VARRAY_ALLOC(_field, _state, _field_num, _version, _vmsd, _type) {\
-- 
2.20.1

Rename the elf_low_addr and elf_high_addr variables to image_low_addr
and image_high_addr -- in the next commit we will extend them to
be set for other kinds of image file and not just ELF files.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Tested-by: Mark Rutland <mark.rutland@arm.com>
Message-id: 20190722151804.25467-2-peter.maydell@linaro.org
---
 hw/arm/boot.c | 20 +++++++++++---------
 1 file changed, 11 insertions(+), 9 deletions(-)

diff --git a/hw/arm/boot.c b/hw/arm/boot.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/boot.c
+++ b/hw/arm/boot.c
@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
     int kernel_size;
     int initrd_size;
     int is_linux = 0;
-    uint64_t elf_entry, elf_low_addr, elf_high_addr;
+    uint64_t elf_entry;
+    /* Addresses of first byte used and first byte not used by the image */
+    uint64_t image_low_addr, image_high_addr;
     int elf_machine;
     hwaddr entry;
     static const ARMInsnFixup *primary_loader;
@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
         info->nb_cpus = 1;
 
     /* Assume that raw images are linux kernels, and ELF images are not.  */
-    kernel_size = arm_load_elf(info, &elf_entry, &elf_low_addr,
-                               &elf_high_addr, elf_machine, as);
+    kernel_size = arm_load_elf(info, &elf_entry, &image_low_addr,
+                               &image_high_addr, elf_machine, as);
     if (kernel_size > 0 && have_dtb(info)) {
         /*
          * If there is still some room left at the base of RAM, try and put
          * the DTB there like we do for images loaded with -bios or -pflash.
          */
-        if (elf_low_addr > info->loader_start
-            || elf_high_addr < info->loader_start) {
+        if (image_low_addr > info->loader_start
+            || image_high_addr < info->loader_start) {
             /*
-             * Set elf_low_addr as address limit for arm_load_dtb if it may be
+             * Set image_low_addr as address limit for arm_load_dtb if it may be
              * pointing into RAM, otherwise pass '0' (no limit)
              */
-            if (elf_low_addr < info->loader_start) {
-                elf_low_addr = 0;
+            if (image_low_addr < info->loader_start) {
+                image_low_addr = 0;
             }
             info->dtb_start = info->loader_start;
-            info->dtb_limit = elf_low_addr;
+            info->dtb_limit = image_low_addr;
         }
     }
     entry = elf_entry;
-- 
2.20.1

In commit e6b2b20d9735d4ef we made the boot loader code try to avoid
putting the initrd on top of the kernel.  However the expression used
to calculate the start of the initrd:

info->initrd_start = info->loader_start +
        MAX(MIN(info->ram_size / 2, 128 * 1024 * 1024), kernel_size);

incorrectly uses 'kernel_size' as the offset within RAM of the
highest address to avoid.  This is incorrect because the kernel
doesn't start at address 0, but slightly higher than that.  This
means that we can still incorrectly end up overlaying the initrd on
the kernel in some cases, for example:

* The kernel's image_size is 0x0a7a8000
* The kernel was loaded at   0x40080000
* The end of the kernel is   0x4A828000
* The DTB was loaded at      0x4a800000

To get this right we need to track the actual highest address used
by the kernel and use that rather than kernel_size. We already
set image_low_addr and image_high_addr for ELF images; set them
also for the various other image types we support, and then use
image_high_addr as the lowest allowed address for the initrd.
(We don't use image_low_addr, but we set it for consistency
with the existing code path for ELF files.)

Fixes: e6b2b20d9735d4ef
Reported-by: Mark Rutland <mark.rutland@arm.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Tested-by: Mark Rutland <mark.rutland@arm.com>
Message-id: 20190722151804.25467-3-peter.maydell@linaro.org
---
 hw/arm/boot.c | 19 +++++++++++++++++--
 1 file changed, 17 insertions(+), 2 deletions(-)

diff --git a/hw/arm/boot.c b/hw/arm/boot.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/boot.c
+++ b/hw/arm/boot.c
@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
     int is_linux = 0;
     uint64_t elf_entry;
     /* Addresses of first byte used and first byte not used by the image */
-    uint64_t image_low_addr, image_high_addr;
+    uint64_t image_low_addr = 0, image_high_addr = 0;
     int elf_machine;
     hwaddr entry;
     static const ARMInsnFixup *primary_loader;
@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
         uint64_t loadaddr = info->loader_start + KERNEL_NOLOAD_ADDR;
         kernel_size = load_uimage_as(info->kernel_filename, &entry, &loadaddr,
                                      &is_linux, NULL, NULL, as);
+        if (kernel_size >= 0) {
+            image_low_addr = loadaddr;
+            image_high_addr = image_low_addr + kernel_size;
+        }
     }
     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64) && kernel_size < 0) {
         kernel_size = load_aarch64_image(info->kernel_filename,
                                          info->loader_start, &entry, as);
         is_linux = 1;
+        if (kernel_size >= 0) {
+            image_low_addr = entry;
+            image_high_addr = image_low_addr + kernel_size;
+        }
     } else if (kernel_size < 0) {
         /* 32-bit ARM */
         entry = info->loader_start + KERNEL_LOAD_ADDR;
         kernel_size = load_image_targphys_as(info->kernel_filename, entry,
                                              ram_end - KERNEL_LOAD_ADDR, as);
         is_linux = 1;
+        if (kernel_size >= 0) {
+            image_low_addr = entry;
+            image_high_addr = image_low_addr + kernel_size;
+        }
     }
     if (kernel_size < 0) {
         error_report("could not load kernel '%s'", info->kernel_filename);
@@ -XXX,XX +XXX,XX @@ static void arm_setup_direct_kernel_boot(ARMCPU *cpu,
      * we might still make a bad choice here.
      */
     info->initrd_start = info->loader_start +
-        MAX(MIN(info->ram_size / 2, 128 * 1024 * 1024), kernel_size);
+        MIN(info->ram_size / 2, 128 * 1024 * 1024);
+    if (image_high_addr) {
+        info->initrd_start = MAX(info->initrd_start, image_high_addr);
+    }
     info->initrd_start = TARGET_PAGE_ALIGN(info->initrd_start);
 
     if (is_linux) {
-- 
2.20.1

Hi; this is one last arm pullreq before the end of the year.
Mostly minor cleanups, and also implementation of the
FEAT_XS architectural feature.

thanks
-- PMM

The following changes since commit 8032c78e556cd0baec111740a6c636863f9bd7c8:

Merge tag 'firmware-20241216-pull-request' of https://gitlab.com/kraxel/qemu into staging (2024-12-16 14:20:33 -0500)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20241217

for you to fetch changes up to e91254250acb8570bd7b8a8f89d30e6d18291d02:

tests/functional: update sbsa-ref firmware used in test (2024-12-17 15:21:06 +0000)

----------------------------------------------------------------
target-arm queue:
 * remove a line of redundant code
 * convert various TCG helper fns to use 'fpst' alias
 * Use float_status in helper_fcvtx_f64_to_f32
 * Use float_status in helper_vfp_fcvt{ds,sd}
 * Implement FEAT_XS
 * hw/intc/arm_gicv3_its: Zero initialize local DTEntry etc structs
 * tests/functional: update sbsa-ref firmware used in test

----------------------------------------------------------------
Denis Rastyogin (1):
      target/arm: remove redundant code

Manos Pitsidianakis (3):
      target/arm: Add decodetree entry for DSB nXS variant
      target/arm: Enable FEAT_XS for the max cpu
      tests/tcg/aarch64: add system test for FEAT_XS

Marcin Juszkiewicz (1):
      tests/functional: update sbsa-ref firmware used in test

Peter Maydell (4):
      target/arm: Implement fine-grained-trap handling for FEAT_XS
      target/arm: Add ARM_CP_ADD_TLBI_NXS type flag for NXS insns
      target/arm: Add ARM_CP_ADD_TLBI_NXS type flag to TLBI insns
      hw/intc/arm_gicv3_its: Zero initialize local DTEntry etc structs

Richard Henderson (10):
      target/arm: Convert vfp_helper.c to fpst alias
      target/arm: Convert helper-a64.c to fpst alias
      target/arm: Convert vec_helper.c to fpst alias
      target/arm: Convert neon_helper.c to fpst alias
      target/arm: Convert sve_helper.c to fpst alias
      target/arm: Convert sme_helper.c to fpst alias
      target/arm: Convert vec_helper.c to use env alias
      target/arm: Convert neon_helper.c to use env alias
      target/arm: Use float_status in helper_fcvtx_f64_to_f32
      target/arm: Use float_status in helper_vfp_fcvt{ds,sd}

From: Denis Rastyogin <gerben@altlinux.org>

This call is redundant as it only retrieves a value that is not used further.

Found by Linux Verification Center (linuxtesting.org) with SVACE.

Signed-off-by: Denis Rastyogin <gerben@altlinux.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241212120618.518369-1-gerben@altlinux.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/vfp_helper.c | 2 --
 1 file changed, 2 deletions(-)

diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rintd)(float64 x, void *fp_status)
 
     ret = float64_round_to_int(x, fp_status);
 
-    new_flags = get_float_exception_flags(fp_status);
-
     /* Suppress any inexact exceptions the conversion produced */
     if (!(old_flags & float_flag_inexact)) {
         new_flags = get_float_exception_flags(fp_status);
-- 
2.34.1