Series comparison

-[PULL 00/48] target-arm queue
+[PULL 00/85] target-arm queue
-The big thing here is RTH's patchset implementing ARMv8.1-VHE
+Another very large pullreq (this one mostly because it has
-emulation; otherwise just a handful of smaller fixes.
+RTH's decodetree conversion series in it), but this should be
 the last of the really large things in my to-review queue...
 thanks
 -- PMM
-The following changes since commit 346ed3151f1c43e72c40cb55b392a1d4cface62c:
+The following changes since commit 83aaec1d5a49f158abaa31797a0f976b3c07e5ca:
-  Merge remote-tracking branch 'remotes/awilliam/tags/vfio-update-20200206.0' into staging (2020-02-07 11:52:15 +0000)
+  Merge tag 'pull-tcg-20241212' of https://gitlab.com/rth7680/qemu into staging (2024-12-12 18:45:39 -0500)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200207
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20241213
-for you to fetch changes up to af6c91b490e9b1bce7a168f8a9c848f3e60f616e:
+for you to fetch changes up to 48e652c4bd9570f6f24def25355cb3009a7300f8:
-  stellaris: delay timer_new to avoid memleaks (2020-02-07 14:04:28 +0000)
+  target/arm: Simplify condition for tlbi_el2_cp_reginfo[] (2024-12-13 15:41:09 +0000)
 ----------------------------------------------------------------
 target-arm queue:
- * monitor: fix query-cpu-model-expansion crash when using machine type none
+ * Finish conversion of A64 decoder to decodetree
- * Support emulation of the ARMv8.1-VHE architecture feature
+ * Use float_round_to_odd in helper_fcvtx_f64_to_f32
- * bcm2835_dma: fix bugs in TD mode handling
+ * Move TLBI insn emulation code out to its own source file
- * docs/arm-cpu-features: Make kvm-no-adjvtime comment clearer
+ * docs/system/arm: fix broken links, document undocumented properties
- * stellaris, stm32f2xx_timer, armv7m_systick: fix minor memory leaks
+ * MAINTAINERS: correct an email address
 ----------------------------------------------------------------
-Alex Bennée (1):
+Brian Cain (1):
-      target/arm: check TGE and E2H flags for EL0 pauth traps
+      MAINTAINERS: correct my email address
-Liang Yan (1):
+Peter Maydell (10):
-      target/arm/monitor: query-cpu-model-expansion crashed qemu when using machine type none
+      target/arm: Move some TLBI insns to their own source file
       target/arm: Move TLBI insns for AArch32 EL2 to tlbi_insn_helper.c
       target/arm: Move AArch64 TLBI insns from v8_cp_reginfo[]
       target/arm: Move the AArch64 EL2 TLBI insns
       target/arm: Move AArch64 EL3 TLBI insns
       target/arm: Move TLBI range insns
       target/arm: Move the TLBI OS insns to tlb-insns.c.
       target/arm: Move small helper functions to tlb-insns.c
       target/arm: Move RME TLB insns to tlb-insns.c
       target/arm: Simplify condition for tlbi_el2_cp_reginfo[]
-Pan Nengyuan (3):
+Pierrick Bouvier (4):
-      armv7m_systick: delay timer_new to avoid memleaks
+      docs/system/arm/orangepi: update links
-      stm32f2xx_timer: delay timer_new to avoid memleaks
+      docs/system/arm/fby35: document execute-in-place property
-      stellaris: delay timer_new to avoid memleaks
+      docs/system/arm/xlnx-versal-virt: document ospi-flash property
       docs/system/arm/virt: document missing properties
-Philippe Mathieu-Daudé (1):
+Richard Henderson (70):
-      docs/arm-cpu-features: Make kvm-no-adjvtime comment clearer
+      target/arm: Add section labels for "Data Processing (register)"
       target/arm: Convert UDIV, SDIV to decodetree
       target/arm: Convert LSLV, LSRV, ASRV, RORV to decodetree
       target/arm: Convert CRC32, CRC32C to decodetree
       target/arm: Convert SUBP, IRG, GMI to decodetree
       target/arm: Convert PACGA to decodetree
       target/arm: Convert RBIT, REV16, REV32, REV64 to decodetree
       target/arm: Convert CLZ, CLS to decodetree
       target/arm: Convert PAC[ID]*, AUT[ID]* to decodetree
       target/arm: Convert XPAC[ID] to decodetree
       target/arm: Convert disas_logic_reg to decodetree
       target/arm: Convert disas_add_sub_ext_reg to decodetree
       target/arm: Convert disas_add_sub_reg to decodetree
       target/arm: Convert disas_data_proc_3src to decodetree
       target/arm: Convert disas_adc_sbc to decodetree
       target/arm: Convert RMIF to decodetree
       target/arm: Convert SETF8, SETF16 to decodetree
       target/arm: Convert CCMP, CCMN to decodetree
       target/arm: Convert disas_cond_select to decodetree
       target/arm: Introduce fp_access_check_scalar_hsd
       target/arm: Introduce fp_access_check_vector_hsd
       target/arm: Convert FCMP, FCMPE, FCCMP, FCCMPE to decodetree
       target/arm: Fix decode of fp16 vector fabs, fneg, fsqrt
       target/arm: Convert FMOV, FABS, FNEG (scalar) to decodetree
       target/arm: Pass fpstatus to vfp_sqrt*
       target/arm: Remove helper_sqrt_f16
       target/arm: Convert FSQRT (scalar) to decodetree
       target/arm: Convert FRINT[NPMSAXI] (scalar) to decodetree
       target/arm: Convert BFCVT to decodetree
       target/arm: Convert FRINT{32, 64}[ZX] (scalar) to decodetree
       target/arm: Convert FCVT (scalar) to decodetree
       target/arm: Convert handle_fpfpcvt to decodetree
       target/arm: Convert FJCVTZS to decodetree
       target/arm: Convert handle_fmov to decodetree
       target/arm: Convert SQABS, SQNEG to decodetree
       target/arm: Convert ABS, NEG to decodetree
       target/arm: Introduce gen_gvec_cls, gen_gvec_clz
       target/arm: Convert CLS, CLZ (vector) to decodetree
       target/arm: Introduce gen_gvec_cnt, gen_gvec_rbit
       target/arm: Convert CNT, NOT, RBIT (vector) to decodetree
       target/arm: Convert CMGT, CMGE, GMLT, GMLE, CMEQ (zero) to decodetree
       target/arm: Introduce gen_gvec_rev{16,32,64}
       target/arm: Convert handle_rev to decodetree
       target/arm: Move helper_neon_addlp_{s8, s16} to neon_helper.c
       target/arm: Introduce gen_gvec_{s,u}{add,ada}lp
       target/arm: Convert handle_2misc_pairwise to decodetree
       target/arm: Remove helper_neon_{add,sub}l_u{16,32}
       target/arm: Introduce clear_vec
       target/arm: Convert XTN, SQXTUN, SQXTN, UQXTN to decodetree
       target/arm: Convert FCVTN, BFCVTN to decodetree
       target/arm: Convert FCVTXN to decodetree
       target/arm: Convert SHLL to decodetree
       target/arm: Implement gen_gvec_fabs, gen_gvec_fneg
       target/arm: Convert FABS, FNEG (vector) to decodetree
       target/arm: Convert FSQRT (vector) to decodetree
       target/arm: Convert FRINT* (vector) to decodetree
       target/arm: Convert FCVT* (vector, integer) scalar to decodetree
       target/arm: Convert FCVT* (vector, fixed-point) scalar to decodetree
       target/arm: Convert [US]CVTF (vector, integer) scalar to decodetree
       target/arm: Convert [US]CVTF (vector, fixed-point) scalar to decodetree
       target/arm: Rename helper_gvec_vcvt_[hf][su] with _rz
       target/arm: Convert [US]CVTF (vector) to decodetree
       target/arm: Convert FCVTZ[SU] (vector, fixed-point) to decodetree
       target/arm: Convert FCVT* (vector, integer) to decodetree
       target/arm: Convert handle_2misc_fcmp_zero to decodetree
       target/arm: Convert FRECPE, FRECPX, FRSQRTE to decodetree
       target/arm: Introduce gen_gvec_urecpe, gen_gvec_ursqrte
       target/arm: Convert URECPE and URSQRTE to decodetree
       target/arm: Convert FCVTL to decodetree
       target/arm: Use float_round_to_odd in helper_fcvtx_f64_to_f32
-Rene Stange (2):
+ MAINTAINERS                          |    2 +-
-      bcm2835_dma: Fix the ylen loop in TD mode
+ docs/system/arm/fby35.rst            |    5 +
-      bcm2835_dma: Re-initialize xlen in TD mode
+ docs/system/arm/orangepi.rst         |    4 +-
+ docs/system/arm/virt.rst             |   16 +
-Richard Henderson (40):
+ docs/system/arm/xlnx-versal-virt.rst |    3 +
-      target/arm: Define isar_feature_aa64_vh
+ target/arm/helper.h                  |   43 +-
-      target/arm: Enable HCR_E2H for VHE
+ target/arm/internals.h               |    9 +
-      target/arm: Add CONTEXTIDR_EL2
+ target/arm/tcg/helper-a64.h          |    7 -
-      target/arm: Add TTBR1_EL2
+ target/arm/tcg/translate.h           |   35 +
-      target/arm: Update CNTVCT_EL0 for VHE
+ target/arm/tcg/a64.decode            |  502 ++-
-      target/arm: Split out vae1_tlbmask
+ target/arm/helper.c                  | 1208 +-------
-      target/arm: Split out alle1_tlbmask
+ target/arm/tcg-stubs.c               |    5 +
-      target/arm: Simplify tlb_force_broadcast alternatives
+ target/arm/tcg/gengvec.c             |  369 +++
-      target/arm: Rename ARMMMUIdx*_S12NSE* to ARMMMUIdx*_E10_*
+ target/arm/tcg/helper-a64.c          |  122 +-
-      target/arm: Rename ARMMMUIdx_S2NS to ARMMMUIdx_Stage2
+ target/arm/tcg/neon_helper.c         |  106 +-
-      target/arm: Rename ARMMMUIdx_S1NSE* to ARMMMUIdx_Stage1_E*
+ target/arm/tcg/tlb-insns.c           | 1266 ++++++++
-      target/arm: Rename ARMMMUIdx_S1SE[01] to ARMMMUIdx_SE10_[01]
+ target/arm/tcg/translate-a64.c       | 5670 +++++++++++-----------------------
-      target/arm: Rename ARMMMUIdx*_S1E3 to ARMMMUIdx*_SE3
+ target/arm/tcg/translate-neon.c      |  337 +-
-      target/arm: Rename ARMMMUIdx_S1E2 to ARMMMUIdx_E2
+ target/arm/tcg/translate-vfp.c       |    6 +-
-      target/arm: Recover 4 bits from TBFLAGs
+ target/arm/tcg/vec_helper.c          |   65 +-
-      target/arm: Expand TBFLAG_ANY.MMUIDX to 4 bits
+ target/arm/vfp_helper.c              |   16 +-
-      target/arm: Rearrange ARMMMUIdxBit
+ target/arm/tcg/meson.build           |    1 +
-      target/arm: Tidy ARMMMUIdx m-profile definitions
+files changed, 4203 insertions(+), 5594 deletions(-)
-      target/arm: Reorganize ARMMMUIdx
+ create mode 100644 target/arm/tcg/tlb-insns.c
       target/arm: Add regime_has_2_ranges
       target/arm: Update arm_mmu_idx for VHE
       target/arm: Update arm_sctlr for VHE
       target/arm: Update aa64_zva_access for EL2
       target/arm: Update ctr_el0_access for EL2
       target/arm: Add the hypervisor virtual counter
       target/arm: Update timer access for VHE
       target/arm: Update define_one_arm_cp_reg_with_opaque for VHE
       target/arm: Add VHE system register redirection and aliasing
       target/arm: Add VHE timer register redirection and aliasing
       target/arm: Flush tlb for ASID changes in EL2&0 translation regime
       target/arm: Flush tlbs for E2&0 translation regime
       target/arm: Update arm_phys_excp_target_el for TGE
       target/arm: Update {fp,sve}_exception_el for VHE
       target/arm: Update get_a64_user_mem_index for VHE
       target/arm: Update arm_cpu_do_interrupt_aarch64 for VHE
       target/arm: Enable ARMv8.1-VHE in -cpu max
       target/arm: Move arm_excp_unmasked to cpu.c
       target/arm: Pass more cpu state to arm_excp_unmasked
       target/arm: Use bool for unmasked in arm_excp_unmasked
       target/arm: Raise only one interrupt in arm_cpu_exec_interrupt
  target/arm/cpu-param.h     |    2 +-
  target/arm/cpu-qom.h       |    1 +
  target/arm/cpu.h           |  423 ++++++----------
  target/arm/internals.h     |   73 ++-
  target/arm/translate.h     |    4 +-
  hw/arm/stellaris.c         |    7 +-
  hw/dma/bcm2835_dma.c       |    8 +-
  hw/timer/armv7m_systick.c  |    6 +
  hw/timer/stm32f2xx_timer.c |    5 +
  target/arm/cpu.c           |  162 +++++-
  target/arm/cpu64.c         |    1 +
  target/arm/debug_helper.c  |   50 +-
  target/arm/helper-a64.c    |    2 +-
  target/arm/helper.c        | 1211 ++++++++++++++++++++++++++++++++------------
  target/arm/monitor.c       |   15 +-
  target/arm/pauth_helper.c  |   14 +-
  target/arm/translate-a64.c |   47 +-
  target/arm/translate.c     |   74 +--
  docs/arm-cpu-features.rst  |    2 +-
 files changed, 1415 insertions(+), 692 deletions(-)

-[PULL 44/48] bcm2835_dma: Re-initialize xlen in TD mode
+[PULL 01/85] target/arm: Add section labels for "Data Processing (register)"
-From: Rene Stange <rsta2@o2online.de>
+From: Richard Henderson <richard.henderson@linaro.org>
-TD (two dimensions) DMA mode did not work, because the xlen variable
+At the same time, use ### to separate 3rd-level sections.
-has not been re-initialized before each additional ylen run through
+We already use ### for 4.1.92 Data Processing (immediate),
-in bcm2835_dma_update(). Fix it.
+but not the two following two third-level sections:
 .1.93 Branches, and 4.1.94 Loads and stores.
-Signed-off-by: Rene Stange <rsta2@o2online.de>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20241211163036.2297116-2-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/dma/bcm2835_dma.c | 4 +++-
+ target/arm/tcg/a64.decode | 19 +++++++++++++++++--
-file changed, 3 insertions(+), 1 deletion(-)
+file changed, 17 insertions(+), 2 deletions(-)
-diff --git a/hw/dma/bcm2835_dma.c b/hw/dma/bcm2835_dma.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/dma/bcm2835_dma.c
+--- a/target/arm/tcg/a64.decode
-+++ b/hw/dma/bcm2835_dma.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ UBFM            . 10 100110 . ...... ...... ..... ..... @bitfield_32
- static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
+ EXTR            1 00 100111 1 0 rm:5 imm:6 rn:5 rd:5     &extract sf=1
- {
+ EXTR            0 00 100111 0 0 rm:5 0 imm:5 rn:5 rd:5   &extract sf=0
-     BCM2835DMAChan *ch = &s->chan[c];
--    uint32_t data, xlen, ylen;
+-# Branches
-+    uint32_t data, xlen, xlen_td, ylen;
++### Branches
-     int16_t dst_stride, src_stride;
+ %imm26   0:s26 !function=times_4
-     if (!(s->enable & (1 << c))) {
+ @branch         . ..... .......................... &i imm=%imm26
-@@ -XXX,XX +XXX,XX @@ static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
+@@ -XXX,XX +XXX,XX @@ HLT             1101 0100 010 ................ 000 00 @i16
-             dst_stride = 0;
+ # DCPS2         1101 0100 101 ................ 000 10 @i16
-             src_stride = 0;
+ # DCPS3         1101 0100 101 ................ 000 11 @i16
-         }
-+        xlen_td = xlen;
+-# Loads and stores
++### Loads and stores
-         while (ylen != 0) {
-             /* Normal transfer mode */
+ &stxr           rn rt rt2 rs sz lasr
-@@ -XXX,XX +XXX,XX @@ static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
+ &stlr           rn rt sz lasr
-             if (--ylen != 0) {
+@@ -XXX,XX +XXX,XX @@ CPYP            00 011 1 01000 ..... .... 01 ..... ..... @cpy
-                 ch->source_ad += src_stride;
+ CPYM            00 011 1 01010 ..... .... 01 ..... ..... @cpy
-                 ch->dest_ad += dst_stride;
+ CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
-+                xlen = xlen_td;
-             }
++### Data Processing (register)
-         }
++
-         ch->cs |= BCM2708_DMA_END;
++# Data Processing (2-source)
 +# Data Processing (1-source)
 +# Logical (shifted reg)
 +# Add/subtract (shifted reg)
 +# Add/subtract (extended reg)
 +# Add/subtract (carry)
 +# Rotate right into flags
 +# Evaluate into flags
 +# Conditional compare (regster)
 +# Conditional compare (immediate)
 +# Conditional select
 +# Data Processing (3-source)
 +
  ### Cryptographic AES
  AESE            01001110 00 10100 00100 10 ..... .....  @r2r_q1e0
 --
-.20.1
+.34.1

-[PULL 41/48] target/arm: Use bool for unmasked in arm_excp_unmasked
+[PULL 02/85] target/arm: Convert UDIV, SDIV to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-The value computed is fully boolean; using int8_t is odd.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-41-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-3-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.c | 6 +++---
+ target/arm/tcg/a64.decode      |  7 ++++
-file changed, 3 insertions(+), 3 deletions(-)
+ target/arm/tcg/translate-a64.c | 64 +++++++++++++++++-----------------
 files changed, 39 insertions(+), 32 deletions(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+@@ -XXX,XX +XXX,XX @@
- {
+ &r              rn
-     CPUARMState *env = cs->env_ptr;
+ &ri             rd imm
-     bool pstate_unmasked;
+ &rri_sf         rd rn imm sf
--    int8_t unmasked = 0;
++&rrr_sf         rd rn rm sf
-+    bool unmasked = false;
+ &i              imm
+ &rr_e           rd rn esz
-     /*
+ &rri_e          rd rn imm esz
-      * Don't take exceptions if they target a lower EL.
+@@ -XXX,XX +XXX,XX @@ CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+ ### Data Processing (register)
-              * don't affect the masking logic, only the interrupt routing.
-              */
+ # Data Processing (2-source)
-             if (target_el == 3 || !secure) {
++
--                unmasked = 1;
++@rrr_sf         sf:1 .......... rm:5 ...... rn:5 rd:5   &rrr_sf
-+                unmasked = true;
++
-             }
++UDIV            . 00 11010110 ..... 00001 0 ..... ..... @rrr_sf
-         } else {
++SDIV            . 00 11010110 ..... 00001 1 ..... ..... @rrr_sf
-             /*
++
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+ # Data Processing (1-source)
-             }
+ # Logical (shifted reg)
+ # Add/subtract (shifted reg)
-             if ((scr || hcr) && !secure) {
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
--                unmasked = 1;
+index XXXXXXX..XXXXXXX 100644
-+                unmasked = true;
+--- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(UQRSHRN_si, do_scalar_shift_imm_narrow, a, uqrshrn_fns, 0, false)
  TRANS(SQSHRUN_si, do_scalar_shift_imm_narrow, a, sqshrun_fns, MO_SIGN, false)
  TRANS(SQRSHRUN_si, do_scalar_shift_imm_narrow, a, sqrshrun_fns, MO_SIGN, false)
 +static bool do_div(DisasContext *s, arg_rrr_sf *a, bool is_signed)
 +{
 +    TCGv_i64 tcg_n, tcg_m, tcg_rd;
 +    tcg_rd = cpu_reg(s, a->rd);
 +
 +    if (!a->sf && is_signed) {
 +        tcg_n = tcg_temp_new_i64();
 +        tcg_m = tcg_temp_new_i64();
 +        tcg_gen_ext32s_i64(tcg_n, cpu_reg(s, a->rn));
 +        tcg_gen_ext32s_i64(tcg_m, cpu_reg(s, a->rm));
 +    } else {
 +        tcg_n = read_cpu_reg(s, a->rn, a->sf);
 +        tcg_m = read_cpu_reg(s, a->rm, a->sf);
 +    }
 +
 +    if (is_signed) {
 +        gen_helper_sdiv64(tcg_rd, tcg_n, tcg_m);
 +    } else {
 +        gen_helper_udiv64(tcg_rd, tcg_n, tcg_m);
 +    }
 +
 +    if (!a->sf) { /* zero extend final result */
 +        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
 +    }
 +    return true;
 +}
 +
 +TRANS(SDIV, do_div, a, true)
 +TRANS(UDIV, do_div, a, false)
 +
  /* Shift a TCGv src by TCGv shift_amount, put result in dst.
   * Note that it is the caller's responsibility to ensure that the
   * shift amount is in range (ie 0..31 or 0..63) and provide the ARM
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
  #undef MAP
  }
 -static void handle_div(DisasContext *s, bool is_signed, unsigned int sf,
 -                       unsigned int rm, unsigned int rn, unsigned int rd)
 -{
 -    TCGv_i64 tcg_n, tcg_m, tcg_rd;
 -    tcg_rd = cpu_reg(s, rd);
 -
 -    if (!sf && is_signed) {
 -        tcg_n = tcg_temp_new_i64();
 -        tcg_m = tcg_temp_new_i64();
 -        tcg_gen_ext32s_i64(tcg_n, cpu_reg(s, rn));
 -        tcg_gen_ext32s_i64(tcg_m, cpu_reg(s, rm));
 -    } else {
 -        tcg_n = read_cpu_reg(s, rn, sf);
 -        tcg_m = read_cpu_reg(s, rm, sf);
 -    }
 -
 -    if (is_signed) {
 -        gen_helper_sdiv64(tcg_rd, tcg_n, tcg_m);
 -    } else {
 -        gen_helper_udiv64(tcg_rd, tcg_n, tcg_m);
 -    }
 -
 -    if (!sf) { /* zero extend final result */
 -        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
 -    }
 -}
  /* LSLV, LSRV, ASRV, RORV */
  static void handle_shift_reg(DisasContext *s,
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
              }
          }
+         break;
+-    case 2: /* UDIV */
+-        handle_div(s, false, sf, rm, rn, rd);
+-        break;
+-    case 3: /* SDIV */
+-        handle_div(s, true, sf, rm, rn, rd);
+-        break;
+     case 4: /* IRG */
+         if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
+             goto do_unallocated;
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
+     }
+     default:
+     do_unallocated:
++    case 2: /* UDIV */
++    case 3: /* SDIV */
+         unallocated_encoding(s);
+         break;
      }
 --
-.20.1
+.34.1

-[PULL 23/48] target/arm: Update arm_sctlr for VHE
+[PULL 03/85] target/arm: Convert LSLV, LSRV, ASRV, RORV to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Use the correct sctlr for EL2&0 regime.  Due to header ordering,
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 and where arm_mmu_idx_el is declared, we need to move the function
 out of line.  Use the function in many more places in order to
 select the correct control.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-23-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h          | 10 +---------
+ target/arm/tcg/a64.decode      |  4 +++
- target/arm/helper-a64.c   |  2 +-
+ target/arm/tcg/translate-a64.c | 46 ++++++++++++++++------------------
- target/arm/helper.c       | 20 +++++++++++++++-----
+files changed, 25 insertions(+), 25 deletions(-)
  target/arm/pauth_helper.c |  9 +--------
 files changed, 18 insertions(+), 23 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_sctlr_b(CPUARMState *env)
+@@ -XXX,XX +XXX,XX @@ CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
-         (env->cp15.sctlr_el[1] & SCTLR_B) != 0;
- }
+ UDIV            . 00 11010110 ..... 00001 0 ..... ..... @rrr_sf
+ SDIV            . 00 11010110 ..... 00001 1 ..... ..... @rrr_sf
--static inline uint64_t arm_sctlr(CPUARMState *env, int el)
++LSLV            . 00 11010110 ..... 00100 0 ..... ..... @rrr_sf
--{
++LSRV            . 00 11010110 ..... 00100 1 ..... ..... @rrr_sf
--    if (el == 0) {
++ASRV            . 00 11010110 ..... 00101 0 ..... ..... @rrr_sf
--        /* FIXME: ARMv8.1-VHE S2 translation regime.  */
++RORV            . 00 11010110 ..... 00101 1 ..... ..... @rrr_sf
--        return env->cp15.sctlr_el[1];
--    } else {
+ # Data Processing (1-source)
--        return env->cp15.sctlr_el[el];
+ # Logical (shifted reg)
--    }
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 -}
 +uint64_t arm_sctlr(CPUARMState *env, int el);
  static inline bool arm_cpu_data_is_big_endian_a32(CPUARMState *env,
                                                    bool sctlr_b)
 diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.c
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/helper-a64.c
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void daif_check(CPUARMState *env, uint32_t op,
+@@ -XXX,XX +XXX,XX @@ static void shift_reg_imm(TCGv_i64 dst, TCGv_i64 src, int sf,
                         uint32_t imm, uintptr_t ra)
  {
      /* DAIF update to PSTATE. This is OK from EL0 only if UMA is set.  */
 -    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UMA)) {
 +    if (arm_current_el(env) == 0 && !(arm_sctlr(env, 0) & SCTLR_UMA)) {
          raise_exception_ra(env, EXCP_UDEF,
                             syn_aa64_sysregtrap(0, extract32(op, 0, 3),
                                                 extract32(op, 3, 3), 4,
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void aa64_fpsr_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static CPAccessResult aa64_daif_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                         bool isread)
  {
 -    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UMA)) {
 +    if (arm_current_el(env) == 0 && !(arm_sctlr(env, 0) & SCTLR_UMA)) {
          return CP_ACCESS_TRAP;
      }
      return CP_ACCESS_OK;
@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
      /* Cache invalidate/clean: NOP, but EL0 must UNDEF unless
       * SCTLR_EL1.UCI is set.
       */
 -    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UCI)) {
 +    if (arm_current_el(env) == 0 && !(arm_sctlr(env, 0) & SCTLR_UCI)) {
          return CP_ACCESS_TRAP;
      }
      return CP_ACCESS_OK;
@@ -XXX,XX +XXX,XX @@ static uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
      }
  }
--#ifndef CONFIG_USER_ONLY
++static bool do_shift_reg(DisasContext *s, arg_rrr_sf *a,
-+uint64_t arm_sctlr(CPUARMState *env, int el)
++                         enum a64_shift_type shift_type)
 +{
-+    /* Only EL0 needs to be adjusted for EL1&0 or EL2&0. */
++    TCGv_i64 tcg_shift = tcg_temp_new_i64();
-+    if (el == 0) {
++    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
-+        ARMMMUIdx mmu_idx = arm_mmu_idx_el(env, 0);
++    TCGv_i64 tcg_rn = read_cpu_reg(s, a->rn, a->sf);
-+        el = (mmu_idx == ARMMMUIdx_E20_0 ? 2 : 1);
++
-+    }
++    tcg_gen_andi_i64(tcg_shift, cpu_reg(s, a->rm), a->sf ? 63 : 31);
-+    return env->cp15.sctlr_el[el];
++    shift_reg(tcg_rd, tcg_rn, a->sf, shift_type, tcg_shift);
 +    return true;
 +}
++
- /* Return the SCTLR value which controls this address translation regime */
++TRANS(LSLV, do_shift_reg, a, A64_SHIFT_TYPE_LSL)
--static inline uint32_t regime_sctlr(CPUARMState *env, ARMMMUIdx mmu_idx)
++TRANS(LSRV, do_shift_reg, a, A64_SHIFT_TYPE_LSR)
-+static inline uint64_t regime_sctlr(CPUARMState *env, ARMMMUIdx mmu_idx)
++TRANS(ASRV, do_shift_reg, a, A64_SHIFT_TYPE_ASR)
- {
++TRANS(RORV, do_shift_reg, a, A64_SHIFT_TYPE_ROR)
-     return env->cp15.sctlr_el[regime_el(env, mmu_idx)];
++
  /* Logical (shifted register)
   *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
   * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
  }
-+#ifndef CONFIG_USER_ONLY
-+
+-/* LSLV, LSRV, ASRV, RORV */
- /* Return true if the specified stage of address translation is disabled */
+-static void handle_shift_reg(DisasContext *s,
- static inline bool regime_translation_disabled(CPUARMState *env,
+-                             enum a64_shift_type shift_type, unsigned int sf,
-                                                ARMMMUIdx mmu_idx)
+-                             unsigned int rm, unsigned int rn, unsigned int rd)
-@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
+-{
-         flags = FIELD_DP32(flags, TBFLAG_A64, ZCR_LEN, zcr_len);
+-    TCGv_i64 tcg_shift = tcg_temp_new_i64();
 -    TCGv_i64 tcg_rd = cpu_reg(s, rd);
 -    TCGv_i64 tcg_rn = read_cpu_reg(s, rn, sf);
 -
 -    tcg_gen_andi_i64(tcg_shift, cpu_reg(s, rm), sf ? 63 : 31);
 -    shift_reg(tcg_rd, tcg_rn, sf, shift_type, tcg_shift);
 -}
 -
  /* CRC32[BHWX], CRC32C[BHWX] */
  static void handle_crc32(DisasContext *s,
                           unsigned int sf, unsigned int sz, bool crc32c,
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
              tcg_gen_or_i64(cpu_reg(s, rd), cpu_reg(s, rm), t);
          }
          break;
 -    case 8: /* LSLV */
 -        handle_shift_reg(s, A64_SHIFT_TYPE_LSL, sf, rm, rn, rd);
 -        break;
 -    case 9: /* LSRV */
 -        handle_shift_reg(s, A64_SHIFT_TYPE_LSR, sf, rm, rn, rd);
 -        break;
 -    case 10: /* ASRV */
 -        handle_shift_reg(s, A64_SHIFT_TYPE_ASR, sf, rm, rn, rd);
 -        break;
 -    case 11: /* RORV */
 -        handle_shift_reg(s, A64_SHIFT_TYPE_ROR, sf, rm, rn, rd);
 -        break;
      case 12: /* PACGA */
          if (sf == 0 || !dc_isar_feature(aa64_pauth, s)) {
              goto do_unallocated;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
      do_unallocated:
      case 2: /* UDIV */
      case 3: /* SDIV */
 +    case 8: /* LSLV */
 +    case 9: /* LSRV */
 +    case 10: /* ASRV */
 +    case 11: /* RORV */
          unallocated_encoding(s);
          break;
      }
--    sctlr = arm_sctlr(env, el);
-+    sctlr = regime_sctlr(env, stage1);
-     if (arm_cpu_data_is_big_endian_a64(el, sctlr)) {
-         flags = FIELD_DP32(flags, TBFLAG_ANY, BE_DATA, 1);
-diff --git a/target/arm/pauth_helper.c b/target/arm/pauth_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/pauth_helper.c
-+++ b/target/arm/pauth_helper.c
-@@ -XXX,XX +XXX,XX @@ static void pauth_check_trap(CPUARMState *env, int el, uintptr_t ra)
- static bool pauth_key_enabled(CPUARMState *env, int el, uint32_t bit)
- {
--    uint32_t sctlr;
--    if (el == 0) {
--        /* FIXME: ARMv8.1-VHE S2 translation regime.  */
--        sctlr = env->cp15.sctlr_el[1];
--    } else {
--        sctlr = env->cp15.sctlr_el[el];
--    }
--    return (sctlr & bit) != 0;
-+    return (arm_sctlr(env, el) & bit) != 0;
- }
- uint64_t HELPER(pacia)(CPUARMState *env, uint64_t x, uint64_t y)
 --
-.20.1
+.34.1

-[PULL 19/48] target/arm: Tidy ARMMMUIdx m-profile definitions
+[PULL 04/85] target/arm: Convert CRC32, CRC32C to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Replace the magic numbers with the relevant ARM_MMU_IDX_M_* constants.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Keep the definitions short by referencing previous symbols.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-19-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h | 16 ++++++++--------
+ target/arm/tcg/a64.decode      |  12 ++++
-file changed, 8 insertions(+), 8 deletions(-)
+ target/arm/tcg/translate-a64.c | 101 +++++++++++++--------------------
 files changed, 53 insertions(+), 60 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
+@@ -XXX,XX +XXX,XX @@
-     ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
+ @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
-     ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
+ @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
-     ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
--    ARMMMUIdx_MUser = 0 | ARM_MMU_IDX_M,
++@rrr_b          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=0
--    ARMMMUIdx_MPriv = 1 | ARM_MMU_IDX_M,
+ @rrr_h          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=1
--    ARMMMUIdx_MUserNegPri = 2 | ARM_MMU_IDX_M,
++@rrr_s          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=2
--    ARMMMUIdx_MPrivNegPri = 3 | ARM_MMU_IDX_M,
+ @rrr_d          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=3
--    ARMMMUIdx_MSUser = 4 | ARM_MMU_IDX_M,
+ @rrr_sd         ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=%esz_sd
--    ARMMMUIdx_MSPriv = 5 | ARM_MMU_IDX_M,
+ @rrr_hsd        ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=%esz_hsd
--    ARMMMUIdx_MSUserNegPri = 6 | ARM_MMU_IDX_M,
+@@ -XXX,XX +XXX,XX @@ LSRV            . 00 11010110 ..... 00100 1 ..... ..... @rrr_sf
--    ARMMMUIdx_MSPrivNegPri = 7 | ARM_MMU_IDX_M,
+ ASRV            . 00 11010110 ..... 00101 0 ..... ..... @rrr_sf
-+    ARMMMUIdx_MUser = ARM_MMU_IDX_M,
+ RORV            . 00 11010110 ..... 00101 1 ..... ..... @rrr_sf
-+    ARMMMUIdx_MPriv = ARM_MMU_IDX_M | ARM_MMU_IDX_M_PRIV,
-+    ARMMMUIdx_MUserNegPri = ARMMMUIdx_MUser | ARM_MMU_IDX_M_NEGPRI,
++CRC32           0 00 11010110 ..... 0100 00 ..... ..... @rrr_b
-+    ARMMMUIdx_MPrivNegPri = ARMMMUIdx_MPriv | ARM_MMU_IDX_M_NEGPRI,
++CRC32           0 00 11010110 ..... 0100 01 ..... ..... @rrr_h
-+    ARMMMUIdx_MSUser = ARMMMUIdx_MUser | ARM_MMU_IDX_M_S,
++CRC32           0 00 11010110 ..... 0100 10 ..... ..... @rrr_s
-+    ARMMMUIdx_MSPriv = ARMMMUIdx_MPriv | ARM_MMU_IDX_M_S,
++CRC32           1 00 11010110 ..... 0100 11 ..... ..... @rrr_d
-+    ARMMMUIdx_MSUserNegPri = ARMMMUIdx_MUserNegPri | ARM_MMU_IDX_M_S,
++
-+    ARMMMUIdx_MSPrivNegPri = ARMMMUIdx_MPrivNegPri | ARM_MMU_IDX_M_S,
++CRC32C          0 00 11010110 ..... 0101 00 ..... ..... @rrr_b
-     /* Indexes below here don't have TLBs and are used only for AT system
++CRC32C          0 00 11010110 ..... 0101 01 ..... ..... @rrr_h
-      * instructions or for the first stage of an S12 page table walk.
++CRC32C          0 00 11010110 ..... 0101 10 ..... ..... @rrr_s
-      */
++CRC32C          1 00 11010110 ..... 0101 11 ..... ..... @rrr_d
 +
  # Data Processing (1-source)
  # Logical (shifted reg)
  # Add/subtract (shifted reg)
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(LSRV, do_shift_reg, a, A64_SHIFT_TYPE_LSR)
  TRANS(ASRV, do_shift_reg, a, A64_SHIFT_TYPE_ASR)
  TRANS(RORV, do_shift_reg, a, A64_SHIFT_TYPE_ROR)
 +static bool do_crc32(DisasContext *s, arg_rrr_e *a, bool crc32c)
 +{
 +    TCGv_i64 tcg_acc, tcg_val, tcg_rd;
 +    TCGv_i32 tcg_bytes;
 +
 +    switch (a->esz) {
 +    case MO_8:
 +    case MO_16:
 +    case MO_32:
 +        tcg_val = tcg_temp_new_i64();
 +        tcg_gen_extract_i64(tcg_val, cpu_reg(s, a->rm), 0, 8 << a->esz);
 +        break;
 +    case MO_64:
 +        tcg_val = cpu_reg(s, a->rm);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +    }
 +    tcg_acc = cpu_reg(s, a->rn);
 +    tcg_bytes = tcg_constant_i32(1 << a->esz);
 +    tcg_rd = cpu_reg(s, a->rd);
 +
 +    if (crc32c) {
 +        gen_helper_crc32c_64(tcg_rd, tcg_acc, tcg_val, tcg_bytes);
 +    } else {
 +        gen_helper_crc32_64(tcg_rd, tcg_acc, tcg_val, tcg_bytes);
 +    }
 +    return true;
 +}
 +
 +TRANS_FEAT(CRC32, aa64_crc32, do_crc32, a, false)
 +TRANS_FEAT(CRC32C, aa64_crc32, do_crc32, a, true)
 +
  /* Logical (shifted register)
   *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
   * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
  }
 -/* CRC32[BHWX], CRC32C[BHWX] */
 -static void handle_crc32(DisasContext *s,
 -                         unsigned int sf, unsigned int sz, bool crc32c,
 -                         unsigned int rm, unsigned int rn, unsigned int rd)
 -{
 -    TCGv_i64 tcg_acc, tcg_val;
 -    TCGv_i32 tcg_bytes;
 -
 -    if (!dc_isar_feature(aa64_crc32, s)
 -        || (sf == 1 && sz != 3)
 -        || (sf == 0 && sz == 3)) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    if (sz == 3) {
 -        tcg_val = cpu_reg(s, rm);
 -    } else {
 -        uint64_t mask;
 -        switch (sz) {
 -        case 0:
 -            mask = 0xFF;
 -            break;
 -        case 1:
 -            mask = 0xFFFF;
 -            break;
 -        case 2:
 -            mask = 0xFFFFFFFF;
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 -        tcg_val = tcg_temp_new_i64();
 -        tcg_gen_andi_i64(tcg_val, cpu_reg(s, rm), mask);
 -    }
 -
 -    tcg_acc = cpu_reg(s, rn);
 -    tcg_bytes = tcg_constant_i32(1 << sz);
 -
 -    if (crc32c) {
 -        gen_helper_crc32c_64(cpu_reg(s, rd), tcg_acc, tcg_val, tcg_bytes);
 -    } else {
 -        gen_helper_crc32_64(cpu_reg(s, rd), tcg_acc, tcg_val, tcg_bytes);
 -    }
 -}
 -
  /* Data-processing (2 source)
   *   31   30  29 28             21 20  16 15    10 9    5 4    0
   * +----+---+---+-----------------+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
          gen_helper_pacga(cpu_reg(s, rd), tcg_env,
                           cpu_reg(s, rn), cpu_reg_sp(s, rm));
          break;
 -    case 16:
 -    case 17:
 -    case 18:
 -    case 19:
 -    case 20:
 -    case 21:
 -    case 22:
 -    case 23: /* CRC32 */
 -    {
 -        int sz = extract32(opcode, 0, 2);
 -        bool crc32c = extract32(opcode, 2, 1);
 -        handle_crc32(s, sf, sz, crc32c, rm, rn, rd);
 -        break;
 -    }
      default:
      do_unallocated:
      case 2: /* UDIV */
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
      case 9: /* LSRV */
      case 10: /* ASRV */
      case 11: /* RORV */
 +    case 16:
 +    case 17:
 +    case 18:
 +    case 19:
 +    case 20:
 +    case 21:
 +    case 22:
 +    case 23: /* CRC32 */
          unallocated_encoding(s);
          break;
      }
 --
-.20.1
+.34.1

-[PULL 25/48] target/arm: Update ctr_el0_access for EL2
+[PULL 05/85] target/arm: Convert SUBP, IRG, GMI to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Update to include checks against HCR_EL2.TID2.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-25-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-6-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 26 +++++++++++++++++++++-----
+ target/arm/tcg/a64.decode      |  7 +++
-file changed, 21 insertions(+), 5 deletions(-)
+ target/arm/tcg/translate-a64.c | 94 +++++++++++++++++++---------------
 files changed, 59 insertions(+), 42 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_cp_reginfo[] = {
+@@ -XXX,XX +XXX,XX @@
- static CPAccessResult ctr_el0_access(CPUARMState *env, const ARMCPRegInfo *ri,
+ %hlm            11:1 20:2
-                                      bool isread)
- {
+ &r              rn
--    /* Only accessible in EL0 if SCTLR.UCT is set (and only in AArch64,
++&rrr            rd rn rm
--     * but the AArch32 CTR has its own reginfo struct)
+ &ri             rd imm
--     */
+ &rri_sf         rd rn imm sf
--    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UCT)) {
+ &rrr_sf         rd rn rm sf
--        return CP_ACCESS_TRAP;
+@@ -XXX,XX +XXX,XX @@ CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
-+    int cur_el = arm_current_el(env);
  # Data Processing (2-source)
 +@rrr            . .......... rm:5 ...... rn:5 rd:5      &rrr
  @rrr_sf         sf:1 .......... rm:5 ...... rn:5 rd:5   &rrr_sf
  UDIV            . 00 11010110 ..... 00001 0 ..... ..... @rrr_sf
@@ -XXX,XX +XXX,XX @@ CRC32C          0 00 11010110 ..... 0101 01 ..... ..... @rrr_h
  CRC32C          0 00 11010110 ..... 0101 10 ..... ..... @rrr_s
  CRC32C          1 00 11010110 ..... 0101 11 ..... ..... @rrr_d
 +SUBP            1 00 11010110 ..... 000000 ..... .....  @rrr
 +SUBPS           1 01 11010110 ..... 000000 ..... .....  @rrr
 +IRG             1 00 11010110 ..... 000100 ..... .....  @rrr
 +GMI             1 00 11010110 ..... 000101 ..... .....  @rrr
 +
-+    if (cur_el < 2) {
+ # Data Processing (1-source)
-+        uint64_t hcr = arm_hcr_el2_eff(env);
+ # Logical (shifted reg)
  # Add/subtract (shifted reg)
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_crc32(DisasContext *s, arg_rrr_e *a, bool crc32c)
  TRANS_FEAT(CRC32, aa64_crc32, do_crc32, a, false)
  TRANS_FEAT(CRC32C, aa64_crc32, do_crc32, a, true)
 +static bool do_subp(DisasContext *s, arg_rrr *a, bool setflag)
 +{
 +    TCGv_i64 tcg_n = read_cpu_reg_sp(s, a->rn, true);
 +    TCGv_i64 tcg_m = read_cpu_reg_sp(s, a->rm, true);
 +    TCGv_i64 tcg_d = cpu_reg(s, a->rd);
 +
-+        if (cur_el == 0) {
++    tcg_gen_sextract_i64(tcg_n, tcg_n, 0, 56);
-+            if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
++    tcg_gen_sextract_i64(tcg_m, tcg_m, 0, 56);
-+                if (!(env->cp15.sctlr_el[2] & SCTLR_UCT)) {
++
-+                    return CP_ACCESS_TRAP_EL2;
++    if (setflag) {
-+                }
++        gen_sub_CC(true, tcg_d, tcg_n, tcg_m);
-+            } else {
++    } else {
-+                if (!(env->cp15.sctlr_el[1] & SCTLR_UCT)) {
++        tcg_gen_sub_i64(tcg_d, tcg_n, tcg_m);
-+                    return CP_ACCESS_TRAP;
++    }
-+                }
++    return true;
-+                if (hcr & HCR_TID2) {
++}
-+                    return CP_ACCESS_TRAP_EL2;
++
-+                }
++TRANS_FEAT(SUBP, aa64_mte_insn_reg, do_subp, a, false)
-+            }
++TRANS_FEAT(SUBPS, aa64_mte_insn_reg, do_subp, a, true)
-+        } else if (hcr & HCR_TID2) {
++
-+            return CP_ACCESS_TRAP_EL2;
++static bool trans_IRG(DisasContext *s, arg_rrr *a)
 +{
 +    if (dc_isar_feature(aa64_mte_insn_reg, s)) {
 +        TCGv_i64 tcg_rd = cpu_reg_sp(s, a->rd);
 +        TCGv_i64 tcg_rn = cpu_reg_sp(s, a->rn);
 +
 +        if (s->ata[0]) {
 +            gen_helper_irg(tcg_rd, tcg_env, tcg_rn, cpu_reg(s, a->rm));
 +        } else {
 +            gen_address_with_allocation_tag0(tcg_rd, tcg_rn);
 +        }
++        return true;
++    }
++    return false;
++}
++
++static bool trans_GMI(DisasContext *s, arg_rrr *a)
++{
++    if (dc_isar_feature(aa64_mte_insn_reg, s)) {
++        TCGv_i64 t = tcg_temp_new_i64();
++
++        tcg_gen_extract_i64(t, cpu_reg_sp(s, a->rn), 56, 4);
++        tcg_gen_shl_i64(t, tcg_constant_i64(1), t);
++        tcg_gen_or_i64(cpu_reg(s, a->rd), cpu_reg(s, a->rm), t);
++        return true;
++    }
++    return false;
++}
++
+ /* Logical (shifted register)
+  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
+  * +----+-----+-----------+-------+---+------+--------+------+------+
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
      }
-     if (arm_current_el(env) < 2 && arm_hcr_el2_eff(env) & HCR_TID2) {
+     switch (opcode) {
 -    case 0: /* SUBP(S) */
 -        if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
 -            goto do_unallocated;
 -        } else {
 -            TCGv_i64 tcg_n, tcg_m, tcg_d;
 -
 -            tcg_n = read_cpu_reg_sp(s, rn, true);
 -            tcg_m = read_cpu_reg_sp(s, rm, true);
 -            tcg_gen_sextract_i64(tcg_n, tcg_n, 0, 56);
 -            tcg_gen_sextract_i64(tcg_m, tcg_m, 0, 56);
 -            tcg_d = cpu_reg(s, rd);
 -
 -            if (setflag) {
 -                gen_sub_CC(true, tcg_d, tcg_n, tcg_m);
 -            } else {
 -                tcg_gen_sub_i64(tcg_d, tcg_n, tcg_m);
 -            }
 -        }
 -        break;
 -    case 4: /* IRG */
 -        if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
 -            goto do_unallocated;
 -        }
 -        if (s->ata[0]) {
 -            gen_helper_irg(cpu_reg_sp(s, rd), tcg_env,
 -                           cpu_reg_sp(s, rn), cpu_reg(s, rm));
 -        } else {
 -            gen_address_with_allocation_tag0(cpu_reg_sp(s, rd),
 -                                             cpu_reg_sp(s, rn));
 -        }
 -        break;
 -    case 5: /* GMI */
 -        if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
 -            goto do_unallocated;
 -        } else {
 -            TCGv_i64 t = tcg_temp_new_i64();
 -
 -            tcg_gen_extract_i64(t, cpu_reg_sp(s, rn), 56, 4);
 -            tcg_gen_shl_i64(t, tcg_constant_i64(1), t);
 -            tcg_gen_or_i64(cpu_reg(s, rd), cpu_reg(s, rm), t);
 -        }
 -        break;
      case 12: /* PACGA */
          if (sf == 0 || !dc_isar_feature(aa64_pauth, s)) {
              goto do_unallocated;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
          break;
      default:
      do_unallocated:
 +    case 0: /* SUBP(S) */
      case 2: /* UDIV */
      case 3: /* SDIV */
 +    case 4: /* IRG */
 +    case 5: /* GMI */
      case 8: /* LSLV */
      case 9: /* LSRV */
      case 10: /* ASRV */
 --
-.20.1
+.34.1

-[PULL 26/48] target/arm: Add the hypervisor virtual counter
+[PULL 06/85] target/arm: Convert PACGA to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Remove disas_data_proc_2src, as this was the last insn
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+decoded by that function.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-26-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-7-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu-qom.h |  1 +
+ target/arm/tcg/a64.decode      |  2 ++
- target/arm/cpu.h     | 11 +++++----
+ target/arm/tcg/translate-a64.c | 65 ++++++----------------------------
- target/arm/cpu.c     |  3 ++-
+files changed, 13 insertions(+), 54 deletions(-)
  target/arm/helper.c  | 56 ++++++++++++++++++++++++++++++++++++++++++++
 files changed, 65 insertions(+), 6 deletions(-)
-diff --git a/target/arm/cpu-qom.h b/target/arm/cpu-qom.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu-qom.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu-qom.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ void arm_gt_ptimer_cb(void *opaque);
+@@ -XXX,XX +XXX,XX @@ SUBPS           1 01 11010110 ..... 000000 ..... .....  @rrr
- void arm_gt_vtimer_cb(void *opaque);
+ IRG             1 00 11010110 ..... 000100 ..... .....  @rrr
- void arm_gt_htimer_cb(void *opaque);
+ GMI             1 00 11010110 ..... 000101 ..... .....  @rrr
- void arm_gt_stimer_cb(void *opaque);
-+void arm_gt_hvtimer_cb(void *opaque);
++PACGA           1 00 11010110 ..... 001100 ..... .....  @rrr
++
- #define ARM_AFF0_SHIFT 0
+ # Data Processing (1-source)
- #define ARM_AFF0_MASK  (0xFFULL << ARM_AFF0_SHIFT)
+ # Logical (shifted reg)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+ # Add/subtract (shifted reg)
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ typedef struct ARMGenericTimer {
+@@ -XXX,XX +XXX,XX @@ static bool trans_GMI(DisasContext *s, arg_rrr *a)
-     uint64_t ctl; /* Timer Control register */
+     return false;
  } ARMGenericTimer;
 -#define GTIMER_PHYS 0
 -#define GTIMER_VIRT 1
 -#define GTIMER_HYP  2
 -#define GTIMER_SEC  3
 -#define NUM_GTIMERS 4
 +#define GTIMER_PHYS     0
 +#define GTIMER_VIRT     1
 +#define GTIMER_HYP      2
 +#define GTIMER_SEC      3
 +#define GTIMER_HYPVIRT  4
 +#define NUM_GTIMERS     5
  typedef struct {
      uint64_t raw_tcr;
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
          }
      }
 -
      {
          uint64_t scale;
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
                                                arm_gt_htimer_cb, cpu);
          cpu->gt_timer[GTIMER_SEC] = timer_new(QEMU_CLOCK_VIRTUAL, scale,
                                                arm_gt_stimer_cb, cpu);
 +        cpu->gt_timer[GTIMER_HYPVIRT] = timer_new(QEMU_CLOCK_VIRTUAL, scale,
 +                                                  arm_gt_hvtimer_cb, cpu);
      }
  #endif
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t gt_tval_read(CPUARMState *env, const ARMCPRegInfo *ri,
      switch (timeridx) {
      case GTIMER_VIRT:
 +    case GTIMER_HYPVIRT:
          offset = gt_virt_cnt_offset(env);
          break;
      }
@@ -XXX,XX +XXX,XX @@ static void gt_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
      switch (timeridx) {
      case GTIMER_VIRT:
 +    case GTIMER_HYPVIRT:
          offset = gt_virt_cnt_offset(env);
          break;
      }
@@ -XXX,XX +XXX,XX @@ static void gt_sec_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
      gt_ctl_write(env, ri, GTIMER_SEC, value);
  }
-+static void gt_hv_timer_reset(CPUARMState *env, const ARMCPRegInfo *ri)
++static bool trans_PACGA(DisasContext *s, arg_rrr *a)
 +{
-+    gt_timer_reset(env, ri, GTIMER_HYPVIRT);
++    if (dc_isar_feature(aa64_pauth, s)) {
 +        gen_helper_pacga(cpu_reg(s, a->rd), tcg_env,
 +                         cpu_reg(s, a->rn), cpu_reg_sp(s, a->rm));
 +        return true;
 +    }
 +    return false;
 +}
 +
-+static void gt_hv_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ /* Logical (shifted register)
-+                             uint64_t value)
+  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
-+{
+  * +----+-----+-----------+-------+---+------+--------+------+------+
-+    gt_cval_write(env, ri, GTIMER_HYPVIRT, value);
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
 +}
 +
 +static uint64_t gt_hv_tval_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    return gt_tval_read(env, ri, GTIMER_HYPVIRT);
 +}
 +
 +static void gt_hv_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value)
 +{
 +    gt_tval_write(env, ri, GTIMER_HYPVIRT, value);
 +}
 +
 +static void gt_hv_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                            uint64_t value)
 +{
 +    gt_ctl_write(env, ri, GTIMER_HYPVIRT, value);
 +}
 +
  void arm_gt_ptimer_cb(void *opaque)
  {
      ARMCPU *cpu = opaque;
@@ -XXX,XX +XXX,XX @@ void arm_gt_stimer_cb(void *opaque)
      gt_recalc_timer(cpu, GTIMER_SEC);
  }
-+void arm_gt_hvtimer_cb(void *opaque)
-+{
+-/* Data-processing (2 source)
-+    ARMCPU *cpu = opaque;
+- *   31   30  29 28             21 20  16 15    10 9    5 4    0
-+
+- * +----+---+---+-----------------+------+--------+------+------+
-+    gt_recalc_timer(cpu, GTIMER_HYPVIRT);
+- * | sf | 0 | S | 1 1 0 1 0 1 1 0 |  Rm  | opcode |  Rn  |  Rd  |
-+}
+- * +----+---+---+-----------------+------+--------+------+------+
-+
+- */
- static void arm_gt_cntfrq_reset(CPUARMState *env, const ARMCPRegInfo *opaque)
+-static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
- {
+-{
-     ARMCPU *cpu = env_archcpu(env);
+-    unsigned int sf, rm, opcode, rn, rd, setflag;
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vhe_reginfo[] = {
+-    sf = extract32(insn, 31, 1);
-       .opc0 = 3, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 1,
+-    setflag = extract32(insn, 29, 1);
-       .access = PL2_RW, .writefn = vmsa_tcr_ttbr_el2_write,
+-    rm = extract32(insn, 16, 5);
-       .fieldoffset = offsetof(CPUARMState, cp15.ttbr1_el[2]) },
+-    opcode = extract32(insn, 10, 6);
-+#ifndef CONFIG_USER_ONLY
+-    rn = extract32(insn, 5, 5);
-+    { .name = "CNTHV_CVAL_EL2", .state = ARM_CP_STATE_AA64,
+-    rd = extract32(insn, 0, 5);
-+      .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 3, .opc2 = 2,
+-
-+      .fieldoffset =
+-    if (setflag && opcode != 0) {
-+        offsetof(CPUARMState, cp15.c14_timer[GTIMER_HYPVIRT].cval),
+-        unallocated_encoding(s);
-+      .type = ARM_CP_IO, .access = PL2_RW,
+-        return;
-+      .writefn = gt_hv_cval_write, .raw_writefn = raw_write },
+-    }
-+    { .name = "CNTHV_TVAL_EL2", .state = ARM_CP_STATE_BOTH,
+-
-+      .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 3, .opc2 = 0,
+-    switch (opcode) {
-+      .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL2_RW,
+-    case 12: /* PACGA */
-+      .resetfn = gt_hv_timer_reset,
+-        if (sf == 0 || !dc_isar_feature(aa64_pauth, s)) {
-+      .readfn = gt_hv_tval_read, .writefn = gt_hv_tval_write },
+-            goto do_unallocated;
-+    { .name = "CNTHV_CTL_EL2", .state = ARM_CP_STATE_BOTH,
+-        }
-+      .type = ARM_CP_IO,
+-        gen_helper_pacga(cpu_reg(s, rd), tcg_env,
-+      .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 3, .opc2 = 1,
+-                         cpu_reg(s, rn), cpu_reg_sp(s, rm));
-+      .access = PL2_RW,
+-        break;
-+      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_HYPVIRT].ctl),
+-    default:
-+      .writefn = gt_hv_ctl_write, .raw_writefn = raw_write },
+-    do_unallocated:
-+#endif
+-    case 0: /* SUBP(S) */
-     REGINFO_SENTINEL
+-    case 2: /* UDIV */
- };
+-    case 3: /* SDIV */
+-    case 4: /* IRG */
 -    case 5: /* GMI */
 -    case 8: /* LSLV */
 -    case 9: /* LSRV */
 -    case 10: /* ASRV */
 -    case 11: /* RORV */
 -    case 16:
 -    case 17:
 -    case 18:
 -    case 19:
 -    case 20:
 -    case 21:
 -    case 22:
 -    case 23: /* CRC32 */
 -        unallocated_encoding(s);
 -        break;
 -    }
 -}
 -
  /*
   * Data processing - register
   *  31  30 29  28      25    21  20  16      10         0
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
          if (op0) {    /* (1 source) */
              disas_data_proc_1src(s, insn);
          } else {      /* (2 source) */
 -            disas_data_proc_2src(s, insn);
 +            goto do_unallocated;
          }
          break;
      case 0x8 ... 0xf: /* (3 source) */
 --
-.20.1
+.34.1

-[PULL 47/48] stm32f2xx_timer: delay timer_new to avoid memleaks
+[PULL 07/85] target/arm: Convert RBIT, REV16, REV32, REV64 to decodetree
-From: Pan Nengyuan <pannengyuan@huawei.com>
+From: Richard Henderson <richard.henderson@linaro.org>
-There is a memory leak when we call 'device_list_properties' with typename = stm32f2xx_timer. It's easy to reproduce as follow:
-    virsh qemu-monitor-command vm1 --pretty '{"execute": "device-list-properties", "arguments": {"typename": "stm32f2xx_timer"}}'
-This patch delay timer_new to fix this memleaks.
-Reported-by: Euler Robot <euler.robot@huawei.com>
-Signed-off-by: Pan Nengyuan <pannengyuan@huawei.com>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200205070659.22488-3-pannengyuan@huawei.com
-Cc: Alistair Francis <alistair@alistair23.me>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-8-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/timer/stm32f2xx_timer.c | 5 +++++
+ target/arm/tcg/a64.decode      |  11 +++
-file changed, 5 insertions(+)
+ target/arm/tcg/translate-a64.c | 137 +++++++++++++++------------------
 files changed, 72 insertions(+), 76 deletions(-)
-diff --git a/hw/timer/stm32f2xx_timer.c b/hw/timer/stm32f2xx_timer.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/timer/stm32f2xx_timer.c
+--- a/target/arm/tcg/a64.decode
-+++ b/hw/timer/stm32f2xx_timer.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static void stm32f2xx_timer_init(Object *obj)
+@@ -XXX,XX +XXX,XX @@
-     memory_region_init_io(&s->iomem, obj, &stm32f2xx_timer_ops, s,
+ &r              rn
-                           "stm32f2xx_timer", 0x400);
+ &rrr            rd rn rm
-     sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
+ &ri             rd imm
-+}
++&rr             rd rn
++&rr_sf          rd rn sf
-+static void stm32f2xx_timer_realize(DeviceState *dev, Error **errp)
+ &rri_sf         rd rn imm sf
-+{
+ &rrr_sf         rd rn rm sf
-+    STM32F2XXTimerState *s = STM32F2XXTIMER(dev);
+ &i              imm
-     s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, stm32f2xx_timer_interrupt, s);
+@@ -XXX,XX +XXX,XX @@ GMI             1 00 11010110 ..... 000101 ..... .....  @rrr
  PACGA           1 00 11010110 ..... 001100 ..... .....  @rrr
  # Data Processing (1-source)
 +
 +@rr             . .......... ..... ...... rn:5 rd:5     &rr
 +@rr_sf          sf:1 .......... ..... ...... rn:5 rd:5  &rr_sf
 +
 +RBIT            . 10 11010110 00000 000000 ..... .....  @rr_sf
 +REV16           . 10 11010110 00000 000001 ..... .....  @rr_sf
 +REV32           . 10 11010110 00000 000010 ..... .....  @rr_sf
 +REV64           1 10 11010110 00000 000011 ..... .....  @rr
 +
  # Logical (shifted reg)
  # Add/subtract (shifted reg)
  # Add/subtract (extended reg)
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_PACGA(DisasContext *s, arg_rrr *a)
      return false;
  }
-@@ -XXX,XX +XXX,XX @@ static void stm32f2xx_timer_class_init(ObjectClass *klass, void *data)
++typedef void ArithOneOp(TCGv_i64, TCGv_i64);
-     dc->reset = stm32f2xx_timer_reset;
++
-     device_class_set_props(dc, stm32f2xx_timer_properties);
++static bool gen_rr(DisasContext *s, int rd, int rn, ArithOneOp fn)
-     dc->vmsd = &vmstate_stm32f2xx_timer;
++{
-+    dc->realize = stm32f2xx_timer_realize;
++    fn(cpu_reg(s, rd), cpu_reg(s, rn));
 +    return true;
 +}
 +
 +static void gen_rbit32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
 +{
 +    TCGv_i32 t32 = tcg_temp_new_i32();
 +
 +    tcg_gen_extrl_i64_i32(t32, tcg_rn);
 +    gen_helper_rbit(t32, t32);
 +    tcg_gen_extu_i32_i64(tcg_rd, t32);
 +}
 +
 +static void gen_rev16_xx(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn, TCGv_i64 mask)
 +{
 +    TCGv_i64 tcg_tmp = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(tcg_tmp, tcg_rn, 8);
 +    tcg_gen_and_i64(tcg_rd, tcg_rn, mask);
 +    tcg_gen_and_i64(tcg_tmp, tcg_tmp, mask);
 +    tcg_gen_shli_i64(tcg_rd, tcg_rd, 8);
 +    tcg_gen_or_i64(tcg_rd, tcg_rd, tcg_tmp);
 +}
 +
 +static void gen_rev16_32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
 +{
 +    gen_rev16_xx(tcg_rd, tcg_rn, tcg_constant_i64(0x00ff00ff));
 +}
 +
 +static void gen_rev16_64(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
 +{
 +    gen_rev16_xx(tcg_rd, tcg_rn, tcg_constant_i64(0x00ff00ff00ff00ffull));
 +}
 +
 +static void gen_rev_32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
 +{
 +    tcg_gen_bswap32_i64(tcg_rd, tcg_rn, TCG_BSWAP_OZ);
 +}
 +
 +static void gen_rev32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
 +{
 +    tcg_gen_bswap64_i64(tcg_rd, tcg_rn);
 +    tcg_gen_rotri_i64(tcg_rd, tcg_rd, 32);
 +}
 +
 +TRANS(RBIT, gen_rr, a->rd, a->rn, a->sf ? gen_helper_rbit64 : gen_rbit32)
 +TRANS(REV16, gen_rr, a->rd, a->rn, a->sf ? gen_rev16_64 : gen_rev16_32)
 +TRANS(REV32, gen_rr, a->rd, a->rn, a->sf ? gen_rev32 : gen_rev_32)
 +TRANS(REV64, gen_rr, a->rd, a->rn, tcg_gen_bswap64_i64)
 +
  /* Logical (shifted register)
   *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
   * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void handle_cls(DisasContext *s, unsigned int sf,
      }
  }
- static const TypeInfo stm32f2xx_timer_info = {
+-static void handle_rbit(DisasContext *s, unsigned int sf,
 -                        unsigned int rn, unsigned int rd)
 -{
 -    TCGv_i64 tcg_rd, tcg_rn;
 -    tcg_rd = cpu_reg(s, rd);
 -    tcg_rn = cpu_reg(s, rn);
 -
 -    if (sf) {
 -        gen_helper_rbit64(tcg_rd, tcg_rn);
 -    } else {
 -        TCGv_i32 tcg_tmp32 = tcg_temp_new_i32();
 -        tcg_gen_extrl_i64_i32(tcg_tmp32, tcg_rn);
 -        gen_helper_rbit(tcg_tmp32, tcg_tmp32);
 -        tcg_gen_extu_i32_i64(tcg_rd, tcg_tmp32);
 -    }
 -}
 -
 -/* REV with sf==1, opcode==3 ("REV64") */
 -static void handle_rev64(DisasContext *s, unsigned int sf,
 -                         unsigned int rn, unsigned int rd)
 -{
 -    if (!sf) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -    tcg_gen_bswap64_i64(cpu_reg(s, rd), cpu_reg(s, rn));
 -}
 -
 -/* REV with sf==0, opcode==2
 - * REV32 (sf==1, opcode==2)
 - */
 -static void handle_rev32(DisasContext *s, unsigned int sf,
 -                         unsigned int rn, unsigned int rd)
 -{
 -    TCGv_i64 tcg_rd = cpu_reg(s, rd);
 -    TCGv_i64 tcg_rn = cpu_reg(s, rn);
 -
 -    if (sf) {
 -        tcg_gen_bswap64_i64(tcg_rd, tcg_rn);
 -        tcg_gen_rotri_i64(tcg_rd, tcg_rd, 32);
 -    } else {
 -        tcg_gen_bswap32_i64(tcg_rd, tcg_rn, TCG_BSWAP_OZ);
 -    }
 -}
 -
 -/* REV16 (opcode==1) */
 -static void handle_rev16(DisasContext *s, unsigned int sf,
 -                         unsigned int rn, unsigned int rd)
 -{
 -    TCGv_i64 tcg_rd = cpu_reg(s, rd);
 -    TCGv_i64 tcg_tmp = tcg_temp_new_i64();
 -    TCGv_i64 tcg_rn = read_cpu_reg(s, rn, sf);
 -    TCGv_i64 mask = tcg_constant_i64(sf ? 0x00ff00ff00ff00ffull : 0x00ff00ff);
 -
 -    tcg_gen_shri_i64(tcg_tmp, tcg_rn, 8);
 -    tcg_gen_and_i64(tcg_rd, tcg_rn, mask);
 -    tcg_gen_and_i64(tcg_tmp, tcg_tmp, mask);
 -    tcg_gen_shli_i64(tcg_rd, tcg_rd, 8);
 -    tcg_gen_or_i64(tcg_rd, tcg_rd, tcg_tmp);
 -}
 -
  /* Data-processing (1 source)
   *   31  30  29  28             21 20     16 15    10 9    5 4    0
   * +----+---+---+-----------------+---------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
  #define MAP(SF, O2, O1) ((SF) | (O1 << 1) | (O2 << 7))
      switch (MAP(sf, opcode2, opcode)) {
 -    case MAP(0, 0x00, 0x00): /* RBIT */
 -    case MAP(1, 0x00, 0x00):
 -        handle_rbit(s, sf, rn, rd);
 -        break;
 -    case MAP(0, 0x00, 0x01): /* REV16 */
 -    case MAP(1, 0x00, 0x01):
 -        handle_rev16(s, sf, rn, rd);
 -        break;
 -    case MAP(0, 0x00, 0x02): /* REV/REV32 */
 -    case MAP(1, 0x00, 0x02):
 -        handle_rev32(s, sf, rn, rd);
 -        break;
 -    case MAP(1, 0x00, 0x03): /* REV64 */
 -        handle_rev64(s, sf, rn, rd);
 -        break;
      case MAP(0, 0x00, 0x04): /* CLZ */
      case MAP(1, 0x00, 0x04):
          handle_clz(s, sf, rn, rd);
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
          break;
      default:
      do_unallocated:
 +    case MAP(0, 0x00, 0x00): /* RBIT */
 +    case MAP(1, 0x00, 0x00):
 +    case MAP(0, 0x00, 0x01): /* REV16 */
 +    case MAP(1, 0x00, 0x01):
 +    case MAP(0, 0x00, 0x02): /* REV/REV32 */
 +    case MAP(1, 0x00, 0x02):
 +    case MAP(1, 0x00, 0x03): /* REV64 */
          unallocated_encoding(s);
          break;
      }
 --
-.20.1
+.34.1

-[PULL 20/48] target/arm: Reorganize ARMMMUIdx
+[PULL 08/85] target/arm: Convert CLZ, CLS to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Prepare for, but do not yet implement, the EL2&0 regime.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 This involves adding the new MMUIdx enumerators and adjusting
 some of the MMUIdx related predicates to match.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-20-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-9-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu-param.h |   2 +-
+ target/arm/tcg/a64.decode      |  3 ++
- target/arm/cpu.h       | 134 ++++++++++++++++++-----------------------
+ target/arm/tcg/translate-a64.c | 72 ++++++++++++++--------------------
- target/arm/internals.h |  35 +++++++++++
+files changed, 33 insertions(+), 42 deletions(-)
  target/arm/helper.c    |  66 +++++++++++++++++---
  target/arm/translate.c |   1 -
 files changed, 152 insertions(+), 86 deletions(-)
-diff --git a/target/arm/cpu-param.h b/target/arm/cpu-param.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu-param.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu-param.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ REV16           . 10 11010110 00000 000001 ..... .....  @rr_sf
- # define TARGET_PAGE_BITS_MIN  10
+ REV32           . 10 11010110 00000 000010 ..... .....  @rr_sf
- #endif
+ REV64           1 10 11010110 00000 000011 ..... .....  @rr
--#define NB_MMU_MODES 8
++CLZ             . 10 11010110 00000 000100 ..... .....  @rr_sf
-+#define NB_MMU_MODES 9
++CLS             . 10 11010110 00000 000101 ..... .....  @rr_sf
++
- #endif
+ # Logical (shifted reg)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+ # Add/subtract (shifted reg)
  # Add/subtract (extended reg)
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+@@ -XXX,XX +XXX,XX @@ TRANS(REV16, gen_rr, a->rd, a->rn, a->sf ? gen_rev16_64 : gen_rev16_32)
-  *  + NonSecure EL1 & 0 stage 1
+ TRANS(REV32, gen_rr, a->rd, a->rn, a->sf ? gen_rev32 : gen_rev_32)
-  *  + NonSecure EL1 & 0 stage 2
+ TRANS(REV64, gen_rr, a->rd, a->rn, tcg_gen_bswap64_i64)
-  *  + NonSecure EL2
-- *  + Secure EL1 & EL0
++static void gen_clz32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
-+ *  + NonSecure EL2 & 0   (ARMv8.1-VHE)
++{
-+ *  + Secure EL1 & 0
++    TCGv_i32 t32 = tcg_temp_new_i32();
   *  + Secure EL3
   * If EL3 is 32-bit:
   *  + NonSecure PL1 & 0 stage 1
   *  + NonSecure PL1 & 0 stage 2
   *  + NonSecure PL2
 - *  + Secure PL0 & PL1
 + *  + Secure PL0
 + *  + Secure PL1
   * (reminder: for 32 bit EL3, Secure PL1 is *EL3*, not EL1.)
   *
   * For QEMU, an mmu_idx is not quite the same as a translation regime because:
 - *  1. we need to split the "EL1 & 0" regimes into two mmu_idxes, because they
 - *     may differ in access permissions even if the VA->PA map is the same
 + *  1. we need to split the "EL1 & 0" and "EL2 & 0" regimes into two mmu_idxes,
 + *     because they may differ in access permissions even if the VA->PA map is
 + *     the same
   *  2. we want to cache in our TLB the full VA->IPA->PA lookup for a stage 1+2
   *     translation, which means that we have one mmu_idx that deals with two
   *     concatenated translation regimes [this sort of combined s1+2 TLB is
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
   *  4. we can also safely fold together the "32 bit EL3" and "64 bit EL3"
   *     translation regimes, because they map reasonably well to each other
   *     and they can't both be active at the same time.
 - * This gives us the following list of mmu_idx values:
 + *  5. we want to be able to use the TLB for accesses done as part of a
 + *     stage1 page table walk, rather than having to walk the stage2 page
 + *     table over and over.
   *
 - * NS EL0 (aka NS PL0) stage 1+2
 - * NS EL1 (aka NS PL1) stage 1+2
 + * This gives us the following list of cases:
 + *
 + * NS EL0 EL1&0 stage 1+2 (aka NS PL0)
 + * NS EL1 EL1&0 stage 1+2 (aka NS PL1)
 + * NS EL0 EL2&0
 + * NS EL2 EL2&0
   * NS EL2 (aka NS PL2)
 + * S EL0 EL1&0 (aka S PL0)
 + * S EL1 EL1&0 (not used if EL3 is 32 bit)
   * S EL3 (aka S PL1)
 - * S EL0 (aka S PL0)
 - * S EL1 (not used if EL3 is 32 bit)
 - * NS EL0+1 stage 2
 + * NS EL1&0 stage 2
   *
 - * (The last of these is an mmu_idx because we want to be able to use the TLB
 - * for the accesses done as part of a stage 1 page table walk, rather than
 - * having to walk the stage 2 page table over and over.)
 + * for a total of 9 different mmu_idx.
   *
   * R profile CPUs have an MPU, but can use the same set of MMU indexes
   * as A profile. They only need to distinguish NS EL0 and NS EL1 (and
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
   * For M profile we arrange them to have a bit for priv, a bit for negpri
   * and a bit for secure.
   */
 -#define ARM_MMU_IDX_A 0x10 /* A profile */
 -#define ARM_MMU_IDX_NOTLB 0x20 /* does not have a TLB */
 -#define ARM_MMU_IDX_M 0x40 /* M profile */
 +#define ARM_MMU_IDX_A     0x10  /* A profile */
 +#define ARM_MMU_IDX_NOTLB 0x20  /* does not have a TLB */
 +#define ARM_MMU_IDX_M     0x40  /* M profile */
 -/* meanings of the bits for M profile mmu idx values */
 -#define ARM_MMU_IDX_M_PRIV 0x1
 +/* Meanings of the bits for M profile mmu idx values */
 +#define ARM_MMU_IDX_M_PRIV   0x1
  #define ARM_MMU_IDX_M_NEGPRI 0x2
 -#define ARM_MMU_IDX_M_S 0x4
 +#define ARM_MMU_IDX_M_S      0x4  /* Secure */
 -#define ARM_MMU_IDX_TYPE_MASK (~0x7)
 -#define ARM_MMU_IDX_COREIDX_MASK 0x7
 +#define ARM_MMU_IDX_TYPE_MASK \
 +    (ARM_MMU_IDX_A | ARM_MMU_IDX_M | ARM_MMU_IDX_NOTLB)
 +#define ARM_MMU_IDX_COREIDX_MASK 0xf
  typedef enum ARMMMUIdx {
 -    ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
 -    ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
 -    ARMMMUIdx_E2 = 2 | ARM_MMU_IDX_A,
 -    ARMMMUIdx_SE3 = 3 | ARM_MMU_IDX_A,
 -    ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
 -    ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
 -    ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
 +    /*
 +     * A-profile.
 +     */
 +    ARMMMUIdx_E10_0 =  0 | ARM_MMU_IDX_A,
 +    ARMMMUIdx_E20_0 =  1 | ARM_MMU_IDX_A,
 +
-+    ARMMMUIdx_E10_1 =  2 | ARM_MMU_IDX_A,
++    tcg_gen_extrl_i64_i32(t32, tcg_rn);
 +    tcg_gen_clzi_i32(t32, t32, 32);
 +    tcg_gen_extu_i32_i64(tcg_rd, t32);
 +}
 +
-+    ARMMMUIdx_E2 =     3 | ARM_MMU_IDX_A,
++static void gen_clz64(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
-+    ARMMMUIdx_E20_2 =  4 | ARM_MMU_IDX_A,
++{
 +    tcg_gen_clzi_i64(tcg_rd, tcg_rn, 64);
 +}
 +
-+    ARMMMUIdx_SE10_0 = 5 | ARM_MMU_IDX_A,
++static void gen_cls32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
-+    ARMMMUIdx_SE10_1 = 6 | ARM_MMU_IDX_A,
++{
-+    ARMMMUIdx_SE3 =    7 | ARM_MMU_IDX_A,
++    TCGv_i32 t32 = tcg_temp_new_i32();
 +
-+    ARMMMUIdx_Stage2 = 8 | ARM_MMU_IDX_A,
++    tcg_gen_extrl_i64_i32(t32, tcg_rn);
 +    tcg_gen_clrsb_i32(t32, t32);
 +    tcg_gen_extu_i32_i64(tcg_rd, t32);
 +}
 +
-+    /*
++TRANS(CLZ, gen_rr, a->rd, a->rn, a->sf ? gen_clz64 : gen_clz32)
-+     * These are not allocated TLBs and are used only for AT system
++TRANS(CLS, gen_rr, a->rd, a->rn, a->sf ? tcg_gen_clrsb_i64 : gen_cls32)
 +     * instructions or for the first stage of an S12 page table walk.
 +     */
 +    ARMMMUIdx_Stage1_E0 = 0 | ARM_MMU_IDX_NOTLB,
 +    ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
 +
-+    /*
+ /* Logical (shifted register)
-+     * M-profile.
+  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
-+     */
+  * +----+-----+-----------+-------+---+------+--------+------+------+
-     ARMMMUIdx_MUser = ARM_MMU_IDX_M,
+@@ -XXX,XX +XXX,XX @@ static void disas_cond_select(DisasContext *s, uint32_t insn)
-     ARMMMUIdx_MPriv = ARM_MMU_IDX_M | ARM_MMU_IDX_M_PRIV,
+     }
-     ARMMMUIdx_MUserNegPri = ARMMMUIdx_MUser | ARM_MMU_IDX_M_NEGPRI,
+ }
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
-     ARMMMUIdx_MSPriv = ARMMMUIdx_MPriv | ARM_MMU_IDX_M_S,
+-static void handle_clz(DisasContext *s, unsigned int sf,
-     ARMMMUIdx_MSUserNegPri = ARMMMUIdx_MUserNegPri | ARM_MMU_IDX_M_S,
+-                       unsigned int rn, unsigned int rd)
      ARMMMUIdx_MSPrivNegPri = ARMMMUIdx_MPrivNegPri | ARM_MMU_IDX_M_S,
 -    /* Indexes below here don't have TLBs and are used only for AT system
 -     * instructions or for the first stage of an S12 page table walk.
 -     */
 -    ARMMMUIdx_Stage1_E0 = 0 | ARM_MMU_IDX_NOTLB,
 -    ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
  } ARMMMUIdx;
  /*
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
  typedef enum ARMMMUIdxBit {
      TO_CORE_BIT(E10_0),
 +    TO_CORE_BIT(E20_0),
      TO_CORE_BIT(E10_1),
      TO_CORE_BIT(E2),
 +    TO_CORE_BIT(E20_2),
      TO_CORE_BIT(SE10_0),
      TO_CORE_BIT(SE10_1),
      TO_CORE_BIT(SE3),
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdxBit {
  #define MMU_USER_IDX 0
 -static inline int arm_to_core_mmu_idx(ARMMMUIdx mmu_idx)
 -{
--    return mmu_idx & ARM_MMU_IDX_COREIDX_MASK;
+-    TCGv_i64 tcg_rd, tcg_rn;
--}
+-    tcg_rd = cpu_reg(s, rd);
 -    tcg_rn = cpu_reg(s, rn);
 -
--static inline ARMMMUIdx core_to_arm_mmu_idx(CPUARMState *env, int mmu_idx)
+-    if (sf) {
--{
+-        tcg_gen_clzi_i64(tcg_rd, tcg_rn, 64);
 -    if (arm_feature(env, ARM_FEATURE_M)) {
 -        return mmu_idx | ARM_MMU_IDX_M;
 -    } else {
--        return mmu_idx | ARM_MMU_IDX_A;
+-        TCGv_i32 tcg_tmp32 = tcg_temp_new_i32();
 -        tcg_gen_extrl_i64_i32(tcg_tmp32, tcg_rn);
 -        tcg_gen_clzi_i32(tcg_tmp32, tcg_tmp32, 32);
 -        tcg_gen_extu_i32_i64(tcg_rd, tcg_tmp32);
 -    }
 -}
 -
--/* Return the exception level we're running at if this is our mmu_idx */
+-static void handle_cls(DisasContext *s, unsigned int sf,
--static inline int arm_mmu_idx_to_el(ARMMMUIdx mmu_idx)
+-                       unsigned int rn, unsigned int rd)
 -{
--    switch (mmu_idx & ARM_MMU_IDX_TYPE_MASK) {
+-    TCGv_i64 tcg_rd, tcg_rn;
--    case ARM_MMU_IDX_A:
+-    tcg_rd = cpu_reg(s, rd);
--        return mmu_idx & 3;
+-    tcg_rn = cpu_reg(s, rn);
--    case ARM_MMU_IDX_M:
+-
--        return mmu_idx & ARM_MMU_IDX_M_PRIV;
+-    if (sf) {
--    default:
+-        tcg_gen_clrsb_i64(tcg_rd, tcg_rn);
--        g_assert_not_reached();
+-    } else {
 -        TCGv_i32 tcg_tmp32 = tcg_temp_new_i32();
 -        tcg_gen_extrl_i64_i32(tcg_tmp32, tcg_rn);
 -        tcg_gen_clrsb_i32(tcg_tmp32, tcg_tmp32);
 -        tcg_gen_extu_i32_i64(tcg_rd, tcg_tmp32);
 -    }
 -}
 -
--/*
+ /* Data-processing (1 source)
-- * Return the MMU index for a v7M CPU with all relevant information
+  *   31  30  29  28             21 20     16 15    10 9    5 4    0
-- * manually specified.
+  * +----+---+---+-----------------+---------+--------+------+------+
-- */
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
--ARMMMUIdx arm_v7m_mmu_idx_all(CPUARMState *env,
+ #define MAP(SF, O2, O1) ((SF) | (O1 << 1) | (O2 << 7))
--                              bool secstate, bool priv, bool negpri);
--
+     switch (MAP(sf, opcode2, opcode)) {
--/* Return the MMU index for a v7M CPU in the specified security and
+-    case MAP(0, 0x00, 0x04): /* CLZ */
-- * privilege state.
+-    case MAP(1, 0x00, 0x04):
-- */
+-        handle_clz(s, sf, rn, rd);
--ARMMMUIdx arm_v7m_mmu_idx_for_secstate_and_priv(CPUARMState *env,
+-        break;
--                                                bool secstate, bool priv);
+-    case MAP(0, 0x00, 0x05): /* CLS */
--
+-    case MAP(1, 0x00, 0x05):
--/* Return the MMU index for a v7M CPU in the specified security state */
+-        handle_cls(s, sf, rn, rd);
--ARMMMUIdx arm_v7m_mmu_idx_for_secstate(CPUARMState *env, bool secstate);
+-        break;
--
+     case MAP(1, 0x01, 0x00): /* PACIA */
- /**
+         if (s->pauth_active) {
-  * cpu_mmu_index:
+             tcg_rd = cpu_reg(s, rd);
-  * @env: The cpu environment
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+     case MAP(0, 0x00, 0x02): /* REV/REV32 */
-index XXXXXXX..XXXXXXX 100644
+     case MAP(1, 0x00, 0x02):
---- a/target/arm/internals.h
+     case MAP(1, 0x00, 0x03): /* REV64 */
-+++ b/target/arm/internals.h
++    case MAP(0, 0x00, 0x04): /* CLZ */
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_tlb_fill(CPUState *cs, vaddr address, int size,
++    case MAP(1, 0x00, 0x04):
-                       MMUAccessType access_type, int mmu_idx,
++    case MAP(0, 0x00, 0x05): /* CLS */
-                       bool probe, uintptr_t retaddr);
++    case MAP(1, 0x00, 0x05):
+         unallocated_encoding(s);
-+static inline int arm_to_core_mmu_idx(ARMMMUIdx mmu_idx)
+         break;
 +{
 +    return mmu_idx & ARM_MMU_IDX_COREIDX_MASK;
 +}
 +
 +static inline ARMMMUIdx core_to_arm_mmu_idx(CPUARMState *env, int mmu_idx)
 +{
 +    if (arm_feature(env, ARM_FEATURE_M)) {
 +        return mmu_idx | ARM_MMU_IDX_M;
 +    } else {
 +        return mmu_idx | ARM_MMU_IDX_A;
 +    }
 +}
 +
 +int arm_mmu_idx_to_el(ARMMMUIdx mmu_idx);
 +
 +/*
 + * Return the MMU index for a v7M CPU with all relevant information
 + * manually specified.
 + */
 +ARMMMUIdx arm_v7m_mmu_idx_all(CPUARMState *env,
 +                              bool secstate, bool priv, bool negpri);
 +
 +/*
 + * Return the MMU index for a v7M CPU in the specified security and
 + * privilege state.
 + */
 +ARMMMUIdx arm_v7m_mmu_idx_for_secstate_and_priv(CPUARMState *env,
 +                                                bool secstate, bool priv);
 +
 +/* Return the MMU index for a v7M CPU in the specified security state */
 +ARMMMUIdx arm_v7m_mmu_idx_for_secstate(CPUARMState *env, bool secstate);
 +
  /* Return true if the stage 1 translation regime is using LPAE format page
   * tables */
  bool arm_s1_regime_using_lpae_format(CPUARMState *env, ARMMMUIdx mmu_idx);
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
      switch (mmu_idx) {
      case ARMMMUIdx_E10_0:
      case ARMMMUIdx_E10_1:
 +    case ARMMMUIdx_E20_0:
 +    case ARMMMUIdx_E20_2:
      case ARMMMUIdx_Stage1_E0:
      case ARMMMUIdx_Stage1_E1:
      case ARMMMUIdx_E2:
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_interrupt(CPUState *cs)
  #endif /* !CONFIG_USER_ONLY */
  /* Return the exception level which controls this address translation regime */
 -static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
 +static uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
  {
      switch (mmu_idx) {
 +    case ARMMMUIdx_E20_0:
 +    case ARMMMUIdx_E20_2:
      case ARMMMUIdx_Stage2:
      case ARMMMUIdx_E2:
          return 2;
@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
      case ARMMMUIdx_SE10_1:
      case ARMMMUIdx_Stage1_E0:
      case ARMMMUIdx_Stage1_E1:
 +    case ARMMMUIdx_E10_0:
 +    case ARMMMUIdx_E10_1:
      case ARMMMUIdx_MPrivNegPri:
      case ARMMMUIdx_MUserNegPri:
      case ARMMMUIdx_MPriv:
@@ -XXX,XX +XXX,XX @@ static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
   */
  static inline ARMMMUIdx stage_1_mmu_idx(ARMMMUIdx mmu_idx)
  {
 -    if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
 -        mmu_idx += (ARMMMUIdx_Stage1_E0 - ARMMMUIdx_E10_0);
 +    switch (mmu_idx) {
 +    case ARMMMUIdx_E10_0:
 +        return ARMMMUIdx_Stage1_E0;
 +    case ARMMMUIdx_E10_1:
 +        return ARMMMUIdx_Stage1_E1;
 +    default:
 +        return mmu_idx;
      }
 -    return mmu_idx;
  }
  /* Return true if the translation regime is using LPAE format page tables */
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
  {
      switch (mmu_idx) {
      case ARMMMUIdx_SE10_0:
 +    case ARMMMUIdx_E20_0:
      case ARMMMUIdx_Stage1_E0:
      case ARMMMUIdx_MUser:
      case ARMMMUIdx_MSUser:
@@ -XXX,XX +XXX,XX @@ int fp_exception_el(CPUARMState *env, int cur_el)
      return 0;
  }
 +/* Return the exception level we're running at if this is our mmu_idx */
 +int arm_mmu_idx_to_el(ARMMMUIdx mmu_idx)
 +{
 +    if (mmu_idx & ARM_MMU_IDX_M) {
 +        return mmu_idx & ARM_MMU_IDX_M_PRIV;
 +    }
 +
 +    switch (mmu_idx) {
 +    case ARMMMUIdx_E10_0:
 +    case ARMMMUIdx_E20_0:
 +    case ARMMMUIdx_SE10_0:
 +        return 0;
 +    case ARMMMUIdx_E10_1:
 +    case ARMMMUIdx_SE10_1:
 +        return 1;
 +    case ARMMMUIdx_E2:
 +    case ARMMMUIdx_E20_2:
 +        return 2;
 +    case ARMMMUIdx_SE3:
 +        return 3;
 +    default:
 +        g_assert_not_reached();
 +    }
 +}
 +
  #ifndef CONFIG_TCG
  ARMMMUIdx arm_v7m_mmu_idx_for_secstate(CPUARMState *env, bool secstate)
  {
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
          return arm_v7m_mmu_idx_for_secstate(env, env->v7m.secure);
      }
 -    if (el < 2 && arm_is_secure_below_el3(env)) {
 -        return ARMMMUIdx_SE10_0 + el;
 -    } else {
 -        return ARMMMUIdx_E10_0 + el;
 +    switch (el) {
 +    case 0:
 +        /* TODO: ARMv8.1-VHE */
 +        if (arm_is_secure_below_el3(env)) {
 +            return ARMMMUIdx_SE10_0;
 +        }
 +        return ARMMMUIdx_E10_0;
 +    case 1:
 +        if (arm_is_secure_below_el3(env)) {
 +            return ARMMMUIdx_SE10_1;
 +        }
 +        return ARMMMUIdx_E10_1;
 +    case 2:
 +        /* TODO: ARMv8.1-VHE */
 +        /* TODO: ARMv8.4-SecEL2 */
 +        return ARMMMUIdx_E2;
 +    case 3:
 +        return ARMMMUIdx_SE3;
 +    default:
 +        g_assert_not_reached();
      }
  }
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
      case ARMMMUIdx_MSUserNegPri:
      case ARMMMUIdx_MSPrivNegPri:
          return arm_to_core_mmu_idx(ARMMMUIdx_MSUserNegPri);
 -    case ARMMMUIdx_Stage2:
      default:
          g_assert_not_reached();
      }
 --
-.20.1
+.34.1

-New patch
+[PULL 09/85] target/arm: Convert PAC[ID]*, AUT[ID]* to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+This includes PACIA, PACIZA, PACIB, PACIZB, PACDA, PACDZA, PACDB,
+PACDZB, AUTIA, AUTIZA, AUTIB, AUTIZB, AUTDA, AUTDZA, AUTDB, AUTDZB.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-10-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  13 +++
+ target/arm/tcg/translate-a64.c | 173 +++++++++------------------------
+files changed, 58 insertions(+), 128 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ REV64           1 10 11010110 00000 000011 ..... .....  @rr
+ CLZ             . 10 11010110 00000 000100 ..... .....  @rr_sf
+ CLS             . 10 11010110 00000 000101 ..... .....  @rr_sf
++&pacaut         rd rn z
++@pacaut         . .. ........ ..... .. z:1 ... rn:5 rd:5  &pacaut
++
++PACIA           1 10 11010110 00001 00.000 ..... .....  @pacaut
++PACIB           1 10 11010110 00001 00.001 ..... .....  @pacaut
++PACDA           1 10 11010110 00001 00.010 ..... .....  @pacaut
++PACDB           1 10 11010110 00001 00.011 ..... .....  @pacaut
++
++AUTIA           1 10 11010110 00001 00.100 ..... .....  @pacaut
++AUTIB           1 10 11010110 00001 00.101 ..... .....  @pacaut
++AUTDA           1 10 11010110 00001 00.110 ..... .....  @pacaut
++AUTDB           1 10 11010110 00001 00.111 ..... .....  @pacaut
++
+ # Logical (shifted reg)
+ # Add/subtract (shifted reg)
+ # Add/subtract (extended reg)
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static void gen_cls32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
+ TRANS(CLZ, gen_rr, a->rd, a->rn, a->sf ? gen_clz64 : gen_clz32)
+ TRANS(CLS, gen_rr, a->rd, a->rn, a->sf ? tcg_gen_clrsb_i64 : gen_cls32)
++static bool gen_pacaut(DisasContext *s, arg_pacaut *a, NeonGenTwo64OpEnvFn fn)
++{
++    TCGv_i64 tcg_rd, tcg_rn;
++
++    if (a->z) {
++        if (a->rn != 31) {
++            return false;
++        }
++        tcg_rn = tcg_constant_i64(0);
++    } else {
++        tcg_rn = cpu_reg_sp(s, a->rn);
++    }
++    if (s->pauth_active) {
++        tcg_rd = cpu_reg(s, a->rd);
++        fn(tcg_rd, tcg_env, tcg_rd, tcg_rn);
++    }
++    return true;
++}
++
++TRANS_FEAT(PACIA, aa64_pauth, gen_pacaut, a, gen_helper_pacia)
++TRANS_FEAT(PACIB, aa64_pauth, gen_pacaut, a, gen_helper_pacib)
++TRANS_FEAT(PACDA, aa64_pauth, gen_pacaut, a, gen_helper_pacda)
++TRANS_FEAT(PACDB, aa64_pauth, gen_pacaut, a, gen_helper_pacdb)
++
++TRANS_FEAT(AUTIA, aa64_pauth, gen_pacaut, a, gen_helper_autia)
++TRANS_FEAT(AUTIB, aa64_pauth, gen_pacaut, a, gen_helper_autib)
++TRANS_FEAT(AUTDA, aa64_pauth, gen_pacaut, a, gen_helper_autda)
++TRANS_FEAT(AUTDB, aa64_pauth, gen_pacaut, a, gen_helper_autdb)
++
+ /* Logical (shifted register)
+  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
+  * +----+-----+-----------+-------+---+------+--------+------+------+
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
+ #define MAP(SF, O2, O1) ((SF) | (O1 << 1) | (O2 << 7))
+     switch (MAP(sf, opcode2, opcode)) {
+-    case MAP(1, 0x01, 0x00): /* PACIA */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacia(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x01): /* PACIB */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacib(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x02): /* PACDA */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacda(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x03): /* PACDB */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacdb(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x04): /* AUTIA */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autia(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x05): /* AUTIB */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autib(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x06): /* AUTDA */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autda(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x07): /* AUTDB */
+-        if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autdb(tcg_rd, tcg_env, tcg_rd, cpu_reg_sp(s, rn));
+-        } else if (!dc_isar_feature(aa64_pauth, s)) {
+-            goto do_unallocated;
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x08): /* PACIZA */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacia(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x09): /* PACIZB */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacib(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x0a): /* PACDZA */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacda(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x0b): /* PACDZB */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_pacdb(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x0c): /* AUTIZA */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autia(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x0d): /* AUTIZB */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autib(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x0e): /* AUTDZA */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autda(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+-    case MAP(1, 0x01, 0x0f): /* AUTDZB */
+-        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+-            goto do_unallocated;
+-        } else if (s->pauth_active) {
+-            tcg_rd = cpu_reg(s, rd);
+-            gen_helper_autdb(tcg_rd, tcg_env, tcg_rd, tcg_constant_i64(0));
+-        }
+-        break;
+     case MAP(1, 0x01, 0x10): /* XPACI */
+         if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
+             goto do_unallocated;
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
+     case MAP(1, 0x00, 0x04):
+     case MAP(0, 0x00, 0x05): /* CLS */
+     case MAP(1, 0x00, 0x05):
++    case MAP(1, 0x01, 0x00): /* PACIA */
++    case MAP(1, 0x01, 0x01): /* PACIB */
++    case MAP(1, 0x01, 0x02): /* PACDA */
++    case MAP(1, 0x01, 0x03): /* PACDB */
++    case MAP(1, 0x01, 0x04): /* AUTIA */
++    case MAP(1, 0x01, 0x05): /* AUTIB */
++    case MAP(1, 0x01, 0x06): /* AUTDA */
++    case MAP(1, 0x01, 0x07): /* AUTDB */
++    case MAP(1, 0x01, 0x08): /* PACIZA */
++    case MAP(1, 0x01, 0x09): /* PACIZB */
++    case MAP(1, 0x01, 0x0a): /* PACDZA */
++    case MAP(1, 0x01, 0x0b): /* PACDZB */
++    case MAP(1, 0x01, 0x0c): /* AUTIZA */
++    case MAP(1, 0x01, 0x0d): /* AUTIZB */
++    case MAP(1, 0x01, 0x0e): /* AUTDZA */
++    case MAP(1, 0x01, 0x0f): /* AUTDZB */
+         unallocated_encoding(s);
+         break;
+     }
+--
+.34.1

-[PULL 18/48] target/arm: Rearrange ARMMMUIdxBit
+[PULL 10/85] target/arm: Convert XPAC[ID] to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Define via macro expansion, so that renumbering of the base ARMMMUIdx
+Remove disas_data_proc_1src, as these were the last insns
-symbols is automatically reflected in the bit definitions.
+decoded by that function.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-18-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-11-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h | 39 +++++++++++++++++++++++----------------
+ target/arm/tcg/a64.decode      |  3 ++
-file changed, 23 insertions(+), 16 deletions(-)
+ target/arm/tcg/translate-a64.c | 99 +++++-----------------------------
 files changed, 16 insertions(+), 86 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
+@@ -XXX,XX +XXX,XX @@ AUTIB           1 10 11010110 00001 00.101 ..... .....  @pacaut
-     ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
+ AUTDA           1 10 11010110 00001 00.110 ..... .....  @pacaut
- } ARMMMUIdx;
+ AUTDB           1 10 11010110 00001 00.111 ..... .....  @pacaut
--/* Bit macros for the core-mmu-index values for each index,
++XPACI           1 10 11010110 00001 010000 11111 rd:5
-+/*
++XPACD           1 10 11010110 00001 010001 11111 rd:5
-+ * Bit macros for the core-mmu-index values for each index,
++
-  * for use when calling tlb_flush_by_mmuidx() and friends.
+ # Logical (shifted reg)
  # Add/subtract (shifted reg)
  # Add/subtract (extended reg)
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(AUTIB, aa64_pauth, gen_pacaut, a, gen_helper_autib)
  TRANS_FEAT(AUTDA, aa64_pauth, gen_pacaut, a, gen_helper_autda)
  TRANS_FEAT(AUTDB, aa64_pauth, gen_pacaut, a, gen_helper_autdb)
 +static bool do_xpac(DisasContext *s, int rd, NeonGenOne64OpEnvFn *fn)
 +{
 +    if (s->pauth_active) {
 +        TCGv_i64 tcg_rd = cpu_reg(s, rd);
 +        fn(tcg_rd, tcg_env, tcg_rd);
 +    }
 +    return true;
 +}
 +
 +TRANS_FEAT(XPACI, aa64_pauth, do_xpac, a->rd, gen_helper_xpaci)
 +TRANS_FEAT(XPACD, aa64_pauth, do_xpac, a->rd, gen_helper_xpacd)
 +
  /* Logical (shifted register)
   *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
   * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_cond_select(DisasContext *s, uint32_t insn)
      }
  }
 -/* Data-processing (1 source)
 - *   31  30  29  28             21 20     16 15    10 9    5 4    0
 - * +----+---+---+-----------------+---------+--------+------+------+
 - * | sf | 1 | S | 1 1 0 1 0 1 1 0 | opcode2 | opcode |  Rn  |  Rd  |
 - * +----+---+---+-----------------+---------+--------+------+------+
 - */
 -static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
 -{
 -    unsigned int sf, opcode, opcode2, rn, rd;
 -    TCGv_i64 tcg_rd;
 -
 -    if (extract32(insn, 29, 1)) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    sf = extract32(insn, 31, 1);
 -    opcode = extract32(insn, 10, 6);
 -    opcode2 = extract32(insn, 16, 5);
 -    rn = extract32(insn, 5, 5);
 -    rd = extract32(insn, 0, 5);
 -
 -#define MAP(SF, O2, O1) ((SF) | (O1 << 1) | (O2 << 7))
 -
 -    switch (MAP(sf, opcode2, opcode)) {
 -    case MAP(1, 0x01, 0x10): /* XPACI */
 -        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
 -            goto do_unallocated;
 -        } else if (s->pauth_active) {
 -            tcg_rd = cpu_reg(s, rd);
 -            gen_helper_xpaci(tcg_rd, tcg_env, tcg_rd);
 -        }
 -        break;
 -    case MAP(1, 0x01, 0x11): /* XPACD */
 -        if (!dc_isar_feature(aa64_pauth, s) || rn != 31) {
 -            goto do_unallocated;
 -        } else if (s->pauth_active) {
 -            tcg_rd = cpu_reg(s, rd);
 -            gen_helper_xpacd(tcg_rd, tcg_env, tcg_rd);
 -        }
 -        break;
 -    default:
 -    do_unallocated:
 -    case MAP(0, 0x00, 0x00): /* RBIT */
 -    case MAP(1, 0x00, 0x00):
 -    case MAP(0, 0x00, 0x01): /* REV16 */
 -    case MAP(1, 0x00, 0x01):
 -    case MAP(0, 0x00, 0x02): /* REV/REV32 */
 -    case MAP(1, 0x00, 0x02):
 -    case MAP(1, 0x00, 0x03): /* REV64 */
 -    case MAP(0, 0x00, 0x04): /* CLZ */
 -    case MAP(1, 0x00, 0x04):
 -    case MAP(0, 0x00, 0x05): /* CLS */
 -    case MAP(1, 0x00, 0x05):
 -    case MAP(1, 0x01, 0x00): /* PACIA */
 -    case MAP(1, 0x01, 0x01): /* PACIB */
 -    case MAP(1, 0x01, 0x02): /* PACDA */
 -    case MAP(1, 0x01, 0x03): /* PACDB */
 -    case MAP(1, 0x01, 0x04): /* AUTIA */
 -    case MAP(1, 0x01, 0x05): /* AUTIB */
 -    case MAP(1, 0x01, 0x06): /* AUTDA */
 -    case MAP(1, 0x01, 0x07): /* AUTDB */
 -    case MAP(1, 0x01, 0x08): /* PACIZA */
 -    case MAP(1, 0x01, 0x09): /* PACIZB */
 -    case MAP(1, 0x01, 0x0a): /* PACDZA */
 -    case MAP(1, 0x01, 0x0b): /* PACDZB */
 -    case MAP(1, 0x01, 0x0c): /* AUTIZA */
 -    case MAP(1, 0x01, 0x0d): /* AUTIZB */
 -    case MAP(1, 0x01, 0x0e): /* AUTDZA */
 -    case MAP(1, 0x01, 0x0f): /* AUTDZB */
 -        unallocated_encoding(s);
 -        break;
 -    }
 -
 -#undef MAP
 -}
 -
 -
  /*
   * Data processing - register
   *  31  30 29  28      25    21  20  16      10         0
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
   */
-+#define TO_CORE_BIT(NAME) \
+ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
-+    ARMMMUIdxBit_##NAME = 1 << (ARMMMUIdx_##NAME & ARM_MMU_IDX_COREIDX_MASK)
+ {
-+
+-    int op0 = extract32(insn, 30, 1);
- typedef enum ARMMMUIdxBit {
+     int op1 = extract32(insn, 28, 1);
--    ARMMMUIdxBit_E10_0 = 1 << 0,
+     int op2 = extract32(insn, 21, 4);
--    ARMMMUIdxBit_E10_1 = 1 << 1,
+     int op3 = extract32(insn, 10, 6);
--    ARMMMUIdxBit_E2 = 1 << 2,
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
--    ARMMMUIdxBit_SE3 = 1 << 3,
+         disas_cond_select(s, insn);
--    ARMMMUIdxBit_SE10_0 = 1 << 4,
+         break;
--    ARMMMUIdxBit_SE10_1 = 1 << 5,
--    ARMMMUIdxBit_Stage2 = 1 << 6,
+-    case 0x6: /* Data-processing */
--    ARMMMUIdxBit_MUser = 1 << 0,
+-        if (op0) {    /* (1 source) */
--    ARMMMUIdxBit_MPriv = 1 << 1,
+-            disas_data_proc_1src(s, insn);
--    ARMMMUIdxBit_MUserNegPri = 1 << 2,
+-        } else {      /* (2 source) */
--    ARMMMUIdxBit_MPrivNegPri = 1 << 3,
+-            goto do_unallocated;
--    ARMMMUIdxBit_MSUser = 1 << 4,
+-        }
--    ARMMMUIdxBit_MSPriv = 1 << 5,
+-        break;
--    ARMMMUIdxBit_MSUserNegPri = 1 << 6,
+     case 0x8 ... 0xf: /* (3 source) */
--    ARMMMUIdxBit_MSPrivNegPri = 1 << 7,
+         disas_data_proc_3src(s, insn);
-+    TO_CORE_BIT(E10_0),
+         break;
-+    TO_CORE_BIT(E10_1),
-+    TO_CORE_BIT(E2),
+     default:
-+    TO_CORE_BIT(SE10_0),
+     do_unallocated:
-+    TO_CORE_BIT(SE10_1),
++    case 0x6: /* Data-processing */
-+    TO_CORE_BIT(SE3),
+         unallocated_encoding(s);
-+    TO_CORE_BIT(Stage2),
+         break;
-+
+     }
 +    TO_CORE_BIT(MUser),
 +    TO_CORE_BIT(MPriv),
 +    TO_CORE_BIT(MUserNegPri),
 +    TO_CORE_BIT(MPrivNegPri),
 +    TO_CORE_BIT(MSUser),
 +    TO_CORE_BIT(MSPriv),
 +    TO_CORE_BIT(MSUserNegPri),
 +    TO_CORE_BIT(MSPrivNegPri),
  } ARMMMUIdxBit;
 +#undef TO_CORE_BIT
 +
  #define MMU_USER_IDX 0
  static inline int arm_to_core_mmu_idx(ARMMMUIdx mmu_idx)
 --
-.20.1
+.34.1

-[PULL 16/48] target/arm: Recover 4 bits from TBFLAGs
+[PULL 11/85] target/arm: Convert disas_logic_reg to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-We had completely run out of TBFLAG bits.
+This includes AND, BIC, ORR, ORN, EOR, EON, ANDS, BICS (shifted reg).
 Split A- and M-profile bits into two overlapping buckets.
 This results in 4 free bits.
-We used to initialize all of the a32 and m32 fields in DisasContext
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 by assignment, in arm_tr_init_disas_context.  Now we only initialize
 either the a32 or m32 by assignment, because the bits overlap in
 tbflags.  So zero the entire structure in gen_intermediate_code.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-16-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-12-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h       | 68 ++++++++++++++++++++++++++----------------
+ target/arm/tcg/a64.decode      |   9 +++
- target/arm/helper.c    | 17 +++++------
+ target/arm/tcg/translate-a64.c | 117 ++++++++++++---------------------
- target/arm/translate.c | 57 +++++++++++++++++++----------------
+files changed, 51 insertions(+), 75 deletions(-)
 files changed, 82 insertions(+), 60 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ typedef ARMCPU ArchCPU;
+@@ -XXX,XX +XXX,XX @@ XPACI           1 10 11010110 00001 010000 11111 rd:5
-  * We put flags which are shared between 32 and 64 bit mode at the top
+ XPACD           1 10 11010110 00001 010001 11111 rd:5
-  * of the word, and flags which apply to only one mode at the bottom.
-  *
+ # Logical (shifted reg)
-+ *  31          21    18    14          9              0
++
-+ * +--------------+-----+-----+----------+--------------+
++&logic_shift    rd rn rm sf sa st n
-+ * |              |     |   TBFLAG_A32   |              |
++@logic_shift    sf:1 .. ..... st:2 n:1 rm:5 sa:6 rn:5 rd:5  &logic_shift
-+ * |              |     +-----+----------+  TBFLAG_AM32 |
++
-+ * |  TBFLAG_ANY  |           |TBFLAG_M32|              |
++AND_r           . 00 01010 .. . ..... ...... ..... .....    @logic_shift
-+ * |              |           +-------------------------|
++ORR_r           . 01 01010 .. . ..... ...... ..... .....    @logic_shift
-+ * |              |           |       TBFLAG_A64        |
++EOR_r           . 10 01010 .. . ..... ...... ..... .....    @logic_shift
-+ * +--------------+-----------+-------------------------+
++ANDS_r          . 11 01010 .. . ..... ...... ..... .....    @logic_shift
-+ *  31          21          14                         0
++
-+ *
+ # Add/subtract (shifted reg)
-  * Unless otherwise noted, these bits are cached in env->hflags.
+ # Add/subtract (extended reg)
-  */
+ # Add/subtract (carry)
- FIELD(TBFLAG_ANY, AARCH64_STATE, 31, 1)
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ FIELD(TBFLAG_ANY, PSTATE_SS, 26, 1)     /* Not cached. */
+index XXXXXXX..XXXXXXX 100644
- /* Target EL if we take a floating-point-disabled exception */
+--- a/target/arm/tcg/translate-a64.c
- FIELD(TBFLAG_ANY, FPEXC_EL, 24, 2)
++++ b/target/arm/tcg/translate-a64.c
- FIELD(TBFLAG_ANY, BE_DATA, 23, 1)
+@@ -XXX,XX +XXX,XX @@ static bool do_xpac(DisasContext *s, int rd, NeonGenOne64OpEnvFn *fn)
--/*
+ TRANS_FEAT(XPACI, aa64_pauth, do_xpac, a->rd, gen_helper_xpaci)
-- * For A-profile only, target EL for debug exceptions.
+ TRANS_FEAT(XPACD, aa64_pauth, do_xpac, a->rd, gen_helper_xpacd)
-- * Note that this overlaps with the M-profile-only HANDLER and STACKCHECK bits.
 -/* Logical (shifted register)
 - *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
 - * +----+-----+-----------+-------+---+------+--------+------+------+
 - * | sf | opc | 0 1 0 1 0 | shift | N |  Rm  |  imm6  |  Rn  |  Rd  |
 - * +----+-----+-----------+-------+---+------+--------+------+------+
 - */
-+/* For A-profile only, target EL for debug exceptions.  */
+-static void disas_logic_reg(DisasContext *s, uint32_t insn)
- FIELD(TBFLAG_ANY, DEBUG_TARGET_EL, 21, 2)
++static bool do_logic_reg(DisasContext *s, arg_logic_shift *a,
++                         ArithTwoOp *fn, ArithTwoOp *inv_fn, bool setflags)
--/* Bit usage when in AArch32 state: */
+ {
--FIELD(TBFLAG_A32, THUMB, 0, 1)          /* Not cached. */
+     TCGv_i64 tcg_rd, tcg_rn, tcg_rm;
--FIELD(TBFLAG_A32, VECLEN, 1, 3)         /* Not cached. */
+-    unsigned int sf, opc, shift_type, invert, rm, shift_amount, rn, rd;
--FIELD(TBFLAG_A32, VECSTRIDE, 4, 2)      /* Not cached. */
-+/*
+-    sf = extract32(insn, 31, 1);
-+ * Bit usage when in AArch32 state, both A- and M-profile.
+-    opc = extract32(insn, 29, 2);
-+ */
+-    shift_type = extract32(insn, 22, 2);
-+FIELD(TBFLAG_AM32, CONDEXEC, 0, 8)      /* Not cached. */
+-    invert = extract32(insn, 21, 1);
-+FIELD(TBFLAG_AM32, THUMB, 8, 1)         /* Not cached. */
+-    rm = extract32(insn, 16, 5);
 -    shift_amount = extract32(insn, 10, 6);
 -    rn = extract32(insn, 5, 5);
 -    rd = extract32(insn, 0, 5);
 -
 -    if (!sf && (shift_amount & (1 << 5))) {
 -        unallocated_encoding(s);
 -        return;
 +    if (!a->sf && (a->sa & (1 << 5))) {
 +        return false;
      }
 -    tcg_rd = cpu_reg(s, rd);
 +    tcg_rd = cpu_reg(s, a->rd);
 +    tcg_rn = cpu_reg(s, a->rn);
 -    if (opc == 1 && shift_amount == 0 && shift_type == 0 && rn == 31) {
 -        /* Unshifted ORR and ORN with WZR/XZR is the standard encoding for
 -         * register-register MOV and MVN, so it is worth special casing.
 -         */
 -        tcg_rm = cpu_reg(s, rm);
 -        if (invert) {
 +    tcg_rm = read_cpu_reg(s, a->rm, a->sf);
 +    if (a->sa) {
 +        shift_reg_imm(tcg_rm, tcg_rm, a->sf, a->st, a->sa);
 +    }
 +
-+/*
++    (a->n ? inv_fn : fn)(tcg_rd, tcg_rn, tcg_rm);
-+ * Bit usage when in AArch32 state, for A-profile only.
++    if (!a->sf) {
-+ */
++        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
-+FIELD(TBFLAG_A32, VECLEN, 9, 3)         /* Not cached. */
++    }
-+FIELD(TBFLAG_A32, VECSTRIDE, 12, 2)     /* Not cached. */
++    if (setflags) {
- /*
++        gen_logic_CC(a->sf, tcg_rd);
-  * We store the bottom two bits of the CPAR as TB flags and handle
++    }
-  * checks on the other bits at runtime. This shares the same bits as
++    return true;
-  * VECSTRIDE, which is OK as no XScale CPU has VFP.
++}
-  * Not cached, because VECLEN+VECSTRIDE are not cached.
++
-  */
++static bool trans_ORR_r(DisasContext *s, arg_logic_shift *a)
--FIELD(TBFLAG_A32, XSCALE_CPAR, 4, 2)
++{
-+FIELD(TBFLAG_A32, XSCALE_CPAR, 12, 2)
++    /*
-+FIELD(TBFLAG_A32, VFPEN, 14, 1)         /* Partially cached, minus FPEXC. */
++     * Unshifted ORR and ORN with WZR/XZR is the standard encoding for
-+FIELD(TBFLAG_A32, SCTLR_B, 15, 1)
++     * register-register MOV and MVN, so it is worth special casing.
-+FIELD(TBFLAG_A32, HSTR_ACTIVE, 16, 1)
++     */
- /*
++    if (a->sa == 0 && a->st == 0 && a->rn == 31) {
-  * Indicates whether cp register reads and writes by guest code should access
++        TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
-  * the secure or nonsecure bank of banked registers; note that this is not
++        TCGv_i64 tcg_rm = cpu_reg(s, a->rm);
-  * the same thing as the current security state of the processor!
++
-  */
++        if (a->n) {
--FIELD(TBFLAG_A32, NS, 6, 1)
+             tcg_gen_not_i64(tcg_rd, tcg_rm);
--FIELD(TBFLAG_A32, VFPEN, 7, 1)          /* Partially cached, minus FPEXC. */
+-            if (!sf) {
--FIELD(TBFLAG_A32, CONDEXEC, 8, 8)       /* Not cached. */
++            if (!a->sf) {
--FIELD(TBFLAG_A32, SCTLR_B, 16, 1)
+                 tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
 -FIELD(TBFLAG_A32, HSTR_ACTIVE, 17, 1)
 +FIELD(TBFLAG_A32, NS, 17, 1)
 -/* For M profile only, set if FPCCR.LSPACT is set */
 -FIELD(TBFLAG_A32, LSPACT, 18, 1)        /* Not cached. */
 -/* For M profile only, set if we must create a new FP context */
 -FIELD(TBFLAG_A32, NEW_FP_CTXT_NEEDED, 19, 1) /* Not cached. */
 -/* For M profile only, set if FPCCR.S does not match current security state */
 -FIELD(TBFLAG_A32, FPCCR_S_WRONG, 20, 1) /* Not cached. */
 -/* For M profile only, Handler (ie not Thread) mode */
 -FIELD(TBFLAG_A32, HANDLER, 21, 1)
 -/* For M profile only, whether we should generate stack-limit checks */
 -FIELD(TBFLAG_A32, STACKCHECK, 22, 1)
 +/*
 + * Bit usage when in AArch32 state, for M-profile only.
 + */
 +/* Handler (ie not Thread) mode */
 +FIELD(TBFLAG_M32, HANDLER, 9, 1)
 +/* Whether we should generate stack-limit checks */
 +FIELD(TBFLAG_M32, STACKCHECK, 10, 1)
 +/* Set if FPCCR.LSPACT is set */
 +FIELD(TBFLAG_M32, LSPACT, 11, 1)                 /* Not cached. */
 +/* Set if we must create a new FP context */
 +FIELD(TBFLAG_M32, NEW_FP_CTXT_NEEDED, 12, 1)     /* Not cached. */
 +/* Set if FPCCR.S does not match current security state */
 +FIELD(TBFLAG_M32, FPCCR_S_WRONG, 13, 1)          /* Not cached. */
 -/* Bit usage when in AArch64 state */
 +/*
 + * Bit usage when in AArch64 state
 + */
  FIELD(TBFLAG_A64, TBII, 0, 2)
  FIELD(TBFLAG_A64, SVEEXC_EL, 2, 2)
  FIELD(TBFLAG_A64, ZCR_LEN, 4, 4)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_m32(CPUARMState *env, int fp_el,
  {
      uint32_t flags = 0;
 -    /* v8M always enables the fpu.  */
 -    flags = FIELD_DP32(flags, TBFLAG_A32, VFPEN, 1);
 -
      if (arm_v7m_is_handler_mode(env)) {
 -        flags = FIELD_DP32(flags, TBFLAG_A32, HANDLER, 1);
 +        flags = FIELD_DP32(flags, TBFLAG_M32, HANDLER, 1);
      }
      /*
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_m32(CPUARMState *env, int fp_el,
      if (arm_feature(env, ARM_FEATURE_V8) &&
          !((mmu_idx & ARM_MMU_IDX_M_NEGPRI) &&
            (env->v7m.ccr[env->v7m.secure] & R_V7M_CCR_STKOFHFNMIGN_MASK))) {
 -        flags = FIELD_DP32(flags, TBFLAG_A32, STACKCHECK, 1);
 +        flags = FIELD_DP32(flags, TBFLAG_M32, STACKCHECK, 1);
      }
      return rebuild_hflags_common_32(env, fp_el, mmu_idx, flags);
@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPUARMState *env, target_ulong *pc,
              if (arm_feature(env, ARM_FEATURE_M_SECURITY) &&
                  FIELD_EX32(env->v7m.fpccr[M_REG_S], V7M_FPCCR, S)
                  != env->v7m.secure) {
 -                flags = FIELD_DP32(flags, TBFLAG_A32, FPCCR_S_WRONG, 1);
 +                flags = FIELD_DP32(flags, TBFLAG_M32, FPCCR_S_WRONG, 1);
              }
              if ((env->v7m.fpccr[env->v7m.secure] & R_V7M_FPCCR_ASPEN_MASK) &&
@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPUARMState *env, target_ulong *pc,
                   * active FP context; we must create a new FP context before
                   * executing any FP insn.
                   */
 -                flags = FIELD_DP32(flags, TBFLAG_A32, NEW_FP_CTXT_NEEDED, 1);
 +                flags = FIELD_DP32(flags, TBFLAG_M32, NEW_FP_CTXT_NEEDED, 1);
              }
              bool is_secure = env->v7m.fpccr[M_REG_S] & R_V7M_FPCCR_S_MASK;
              if (env->v7m.fpccr[is_secure] & R_V7M_FPCCR_LSPACT_MASK) {
 -                flags = FIELD_DP32(flags, TBFLAG_A32, LSPACT, 1);
 +                flags = FIELD_DP32(flags, TBFLAG_M32, LSPACT, 1);
              }
          } else {
-             /*
+-            if (sf) {
-@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPUARMState *env, target_ulong *pc,
++            if (a->sf) {
                  tcg_gen_mov_i64(tcg_rd, tcg_rm);
              } else {
                  tcg_gen_ext32u_i64(tcg_rd, tcg_rm);
              }
          }
+-        return;
--        flags = FIELD_DP32(flags, TBFLAG_A32, THUMB, env->thumb);
++        return true;
 -        flags = FIELD_DP32(flags, TBFLAG_A32, CONDEXEC, env->condexec_bits);
 +        flags = FIELD_DP32(flags, TBFLAG_AM32, THUMB, env->thumb);
 +        flags = FIELD_DP32(flags, TBFLAG_AM32, CONDEXEC, env->condexec_bits);
          pstate_for_ss = env->uncached_cpsr;
      }
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+-    tcg_rm = read_cpu_reg(s, rm, sf);
-index XXXXXXX..XXXXXXX 100644
+-
---- a/target/arm/translate.c
+-    if (shift_amount) {
-+++ b/target/arm/translate.c
+-        shift_reg_imm(tcg_rm, tcg_rm, sf, shift_type, shift_amount);
-@@ -XXX,XX +XXX,XX @@ static void arm_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
+-    }
-      */
+-
-     dc->secure_routed_to_el3 = arm_feature(env, ARM_FEATURE_EL3) &&
+-    tcg_rn = cpu_reg(s, rn);
-                                !arm_el_is_aa64(env, 3);
+-
--    dc->thumb = FIELD_EX32(tb_flags, TBFLAG_A32, THUMB);
+-    switch (opc | (invert << 2)) {
--    dc->sctlr_b = FIELD_EX32(tb_flags, TBFLAG_A32, SCTLR_B);
+-    case 0: /* AND */
--    dc->hstr_active = FIELD_EX32(tb_flags, TBFLAG_A32, HSTR_ACTIVE);
+-    case 3: /* ANDS */
-+    dc->thumb = FIELD_EX32(tb_flags, TBFLAG_AM32, THUMB);
+-        tcg_gen_and_i64(tcg_rd, tcg_rn, tcg_rm);
-     dc->be_data = FIELD_EX32(tb_flags, TBFLAG_ANY, BE_DATA) ? MO_BE : MO_LE;
+-        break;
--    condexec = FIELD_EX32(tb_flags, TBFLAG_A32, CONDEXEC);
+-    case 1: /* ORR */
-+    condexec = FIELD_EX32(tb_flags, TBFLAG_AM32, CONDEXEC);
+-        tcg_gen_or_i64(tcg_rd, tcg_rn, tcg_rm);
-     dc->condexec_mask = (condexec & 0xf) << 1;
+-        break;
-     dc->condexec_cond = condexec >> 4;
+-    case 2: /* EOR */
 -        tcg_gen_xor_i64(tcg_rd, tcg_rn, tcg_rm);
 -        break;
 -    case 4: /* BIC */
 -    case 7: /* BICS */
 -        tcg_gen_andc_i64(tcg_rd, tcg_rn, tcg_rm);
 -        break;
 -    case 5: /* ORN */
 -        tcg_gen_orc_i64(tcg_rd, tcg_rn, tcg_rm);
 -        break;
 -    case 6: /* EON */
 -        tcg_gen_eqv_i64(tcg_rd, tcg_rn, tcg_rm);
 -        break;
 -    default:
 -        assert(FALSE);
 -        break;
 -    }
 -
 -    if (!sf) {
 -        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
 -    }
 -
 -    if (opc == 3) {
 -        gen_logic_CC(sf, tcg_rd);
 -    }
 +    return do_logic_reg(s, a, tcg_gen_or_i64, tcg_gen_orc_i64, false);
  }
 +TRANS(AND_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, false)
 +TRANS(ANDS_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, true)
 +TRANS(EOR_r, do_logic_reg, a, tcg_gen_xor_i64, tcg_gen_eqv_i64, false)
 +
-     core_mmu_idx = FIELD_EX32(tb_flags, TBFLAG_ANY, MMUIDX);
+ /*
-     dc->mmu_idx = core_to_arm_mmu_idx(env, core_mmu_idx);
+  * Add/subtract (extended register)
-     dc->current_el = arm_mmu_idx_to_el(dc->mmu_idx);
+  *
- #if !defined(CONFIG_USER_ONLY)
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
-     dc->user = (dc->current_el == 0);
+                 /* Add/sub (shifted register) */
- #endif
+                 disas_add_sub_reg(s, insn);
--    dc->ns = FIELD_EX32(tb_flags, TBFLAG_A32, NS);
+             }
-     dc->fp_excp_el = FIELD_EX32(tb_flags, TBFLAG_ANY, FPEXC_EL);
+-        } else {
--    dc->vfp_enabled = FIELD_EX32(tb_flags, TBFLAG_A32, VFPEN);
+-            /* Logical (shifted register) */
--    dc->vec_len = FIELD_EX32(tb_flags, TBFLAG_A32, VECLEN);
+-            disas_logic_reg(s, insn);
--    if (arm_feature(env, ARM_FEATURE_XSCALE)) {
++            return;
--        dc->c15_cpar = FIELD_EX32(tb_flags, TBFLAG_A32, XSCALE_CPAR);
+         }
--        dc->vec_stride = 0;
+-        return;
-+
++        goto do_unallocated;
 +    if (arm_feature(env, ARM_FEATURE_M)) {
 +        dc->vfp_enabled = 1;
 +        dc->be_data = MO_TE;
 +        dc->v7m_handler_mode = FIELD_EX32(tb_flags, TBFLAG_M32, HANDLER);
 +        dc->v8m_secure = arm_feature(env, ARM_FEATURE_M_SECURITY) &&
 +            regime_is_secure(env, dc->mmu_idx);
 +        dc->v8m_stackcheck = FIELD_EX32(tb_flags, TBFLAG_M32, STACKCHECK);
 +        dc->v8m_fpccr_s_wrong =
 +            FIELD_EX32(tb_flags, TBFLAG_M32, FPCCR_S_WRONG);
 +        dc->v7m_new_fp_ctxt_needed =
 +            FIELD_EX32(tb_flags, TBFLAG_M32, NEW_FP_CTXT_NEEDED);
 +        dc->v7m_lspact = FIELD_EX32(tb_flags, TBFLAG_M32, LSPACT);
      } else {
 -        dc->vec_stride = FIELD_EX32(tb_flags, TBFLAG_A32, VECSTRIDE);
 -        dc->c15_cpar = 0;
 +        dc->be_data =
 +            FIELD_EX32(tb_flags, TBFLAG_ANY, BE_DATA) ? MO_BE : MO_LE;
 +        dc->debug_target_el =
 +            FIELD_EX32(tb_flags, TBFLAG_ANY, DEBUG_TARGET_EL);
 +        dc->sctlr_b = FIELD_EX32(tb_flags, TBFLAG_A32, SCTLR_B);
 +        dc->hstr_active = FIELD_EX32(tb_flags, TBFLAG_A32, HSTR_ACTIVE);
 +        dc->ns = FIELD_EX32(tb_flags, TBFLAG_A32, NS);
 +        dc->vfp_enabled = FIELD_EX32(tb_flags, TBFLAG_A32, VFPEN);
 +        if (arm_feature(env, ARM_FEATURE_XSCALE)) {
 +            dc->c15_cpar = FIELD_EX32(tb_flags, TBFLAG_A32, XSCALE_CPAR);
 +        } else {
 +            dc->vec_len = FIELD_EX32(tb_flags, TBFLAG_A32, VECLEN);
 +            dc->vec_stride = FIELD_EX32(tb_flags, TBFLAG_A32, VECSTRIDE);
 +        }
      }
--    dc->v7m_handler_mode = FIELD_EX32(tb_flags, TBFLAG_A32, HANDLER);
--    dc->v8m_secure = arm_feature(env, ARM_FEATURE_M_SECURITY) &&
+     switch (op2) {
 -        regime_is_secure(env, dc->mmu_idx);
 -    dc->v8m_stackcheck = FIELD_EX32(tb_flags, TBFLAG_A32, STACKCHECK);
 -    dc->v8m_fpccr_s_wrong = FIELD_EX32(tb_flags, TBFLAG_A32, FPCCR_S_WRONG);
 -    dc->v7m_new_fp_ctxt_needed =
 -        FIELD_EX32(tb_flags, TBFLAG_A32, NEW_FP_CTXT_NEEDED);
 -    dc->v7m_lspact = FIELD_EX32(tb_flags, TBFLAG_A32, LSPACT);
      dc->cp_regs = cpu->cp_regs;
      dc->features = env->features;
@@ -XXX,XX +XXX,XX @@ static void arm_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      dc->ss_active = FIELD_EX32(tb_flags, TBFLAG_ANY, SS_ACTIVE);
      dc->pstate_ss = FIELD_EX32(tb_flags, TBFLAG_ANY, PSTATE_SS);
      dc->is_ldex = false;
 -    if (!arm_feature(env, ARM_FEATURE_M)) {
 -        dc->debug_target_el = FIELD_EX32(tb_flags, TBFLAG_ANY, DEBUG_TARGET_EL);
 -    }
      dc->page_start = dc->base.pc_first & TARGET_PAGE_MASK;
@@ -XXX,XX +XXX,XX @@ static const TranslatorOps thumb_translator_ops = {
  /* generate intermediate code for basic block 'tb'.  */
  void gen_intermediate_code(CPUState *cpu, TranslationBlock *tb, int max_insns)
  {
 -    DisasContext dc;
 +    DisasContext dc = { };
      const TranslatorOps *ops = &arm_translator_ops;
 -    if (FIELD_EX32(tb->flags, TBFLAG_A32, THUMB)) {
 +    if (FIELD_EX32(tb->flags, TBFLAG_AM32, THUMB)) {
          ops = &thumb_translator_ops;
      }
  #ifdef TARGET_AARCH64
 --
-.20.1
+.34.1

-New patch
+[PULL 12/85] target/arm: Convert disas_add_sub_ext_reg to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+This includes ADD, SUB, ADDS, SUBS (extended register).
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-13-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  9 +++++
+ target/arm/tcg/translate-a64.c | 65 +++++++++++-----------------------
+files changed, 29 insertions(+), 45 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ ANDS_r          . 11 01010 .. . ..... ...... ..... .....    @logic_shift
+ # Add/subtract (shifted reg)
+ # Add/subtract (extended reg)
++
++&addsub_ext     rd rn rm sf sa st
++@addsub_ext     sf:1 .. ........ rm:5 st:3 sa:3 rn:5 rd:5   &addsub_ext
++
++ADD_ext         . 00 01011001 ..... ... ... ..... .....     @addsub_ext
++SUB_ext         . 10 01011001 ..... ... ... ..... .....     @addsub_ext
++ADDS_ext        . 01 01011001 ..... ... ... ..... .....     @addsub_ext
++SUBS_ext        . 11 01011001 ..... ... ... ..... .....     @addsub_ext
++
+ # Add/subtract (carry)
+ # Rotate right into flags
+ # Evaluate into flags
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ TRANS(AND_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, false)
+ TRANS(ANDS_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, true)
+ TRANS(EOR_r, do_logic_reg, a, tcg_gen_xor_i64, tcg_gen_eqv_i64, false)
+-/*
+- * Add/subtract (extended register)
+- *
+- *  31|30|29|28       24|23 22|21|20   16|15  13|12  10|9  5|4  0|
+- * +--+--+--+-----------+-----+--+-------+------+------+----+----+
+- * |sf|op| S| 0 1 0 1 1 | opt | 1|  Rm   |option| imm3 | Rn | Rd |
+- * +--+--+--+-----------+-----+--+-------+------+------+----+----+
+- *
+- *  sf: 0 -> 32bit, 1 -> 64bit
+- *  op: 0 -> add  , 1 -> sub
+- *   S: 1 -> set flags
+- * opt: 00
+- * option: extension type (see DecodeRegExtend)
+- * imm3: optional shift to Rm
+- *
+- * Rd = Rn + LSL(extend(Rm), amount)
+- */
+-static void disas_add_sub_ext_reg(DisasContext *s, uint32_t insn)
++static bool do_addsub_ext(DisasContext *s, arg_addsub_ext *a,
++                          bool sub_op, bool setflags)
+ {
+-    int rd = extract32(insn, 0, 5);
+-    int rn = extract32(insn, 5, 5);
+-    int imm3 = extract32(insn, 10, 3);
+-    int option = extract32(insn, 13, 3);
+-    int rm = extract32(insn, 16, 5);
+-    int opt = extract32(insn, 22, 2);
+-    bool setflags = extract32(insn, 29, 1);
+-    bool sub_op = extract32(insn, 30, 1);
+-    bool sf = extract32(insn, 31, 1);
++    TCGv_i64 tcg_rm, tcg_rn, tcg_rd, tcg_result;
+-    TCGv_i64 tcg_rm, tcg_rn; /* temps */
+-    TCGv_i64 tcg_rd;
+-    TCGv_i64 tcg_result;
+-
+-    if (imm3 > 4 || opt != 0) {
+-        unallocated_encoding(s);
+-        return;
++    if (a->sa > 4) {
++        return false;
+     }
+     /* non-flag setting ops may use SP */
+     if (!setflags) {
+-        tcg_rd = cpu_reg_sp(s, rd);
++        tcg_rd = cpu_reg_sp(s, a->rd);
+     } else {
+-        tcg_rd = cpu_reg(s, rd);
++        tcg_rd = cpu_reg(s, a->rd);
+     }
+-    tcg_rn = read_cpu_reg_sp(s, rn, sf);
++    tcg_rn = read_cpu_reg_sp(s, a->rn, a->sf);
+-    tcg_rm = read_cpu_reg(s, rm, sf);
+-    ext_and_shift_reg(tcg_rm, tcg_rm, option, imm3);
++    tcg_rm = read_cpu_reg(s, a->rm, a->sf);
++    ext_and_shift_reg(tcg_rm, tcg_rm, a->st, a->sa);
+     tcg_result = tcg_temp_new_i64();
+-
+     if (!setflags) {
+         if (sub_op) {
+             tcg_gen_sub_i64(tcg_result, tcg_rn, tcg_rm);
+@@ -XXX,XX +XXX,XX @@ static void disas_add_sub_ext_reg(DisasContext *s, uint32_t insn)
+         }
+     } else {
+         if (sub_op) {
+-            gen_sub_CC(sf, tcg_result, tcg_rn, tcg_rm);
++            gen_sub_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
+         } else {
+-            gen_add_CC(sf, tcg_result, tcg_rn, tcg_rm);
++            gen_add_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
+         }
+     }
+-    if (sf) {
++    if (a->sf) {
+         tcg_gen_mov_i64(tcg_rd, tcg_result);
+     } else {
+         tcg_gen_ext32u_i64(tcg_rd, tcg_result);
+     }
++    return true;
+ }
++TRANS(ADD_ext, do_addsub_ext, a, false, false)
++TRANS(SUB_ext, do_addsub_ext, a, true, false)
++TRANS(ADDS_ext, do_addsub_ext, a, false, true)
++TRANS(SUBS_ext, do_addsub_ext, a, true, true)
++
+ /*
+  * Add/subtract (shifted register)
+  *
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
+     if (!op1) {
+         if (op2 & 8) {
+             if (op2 & 1) {
+-                /* Add/sub (extended register) */
+-                disas_add_sub_ext_reg(s, insn);
++                goto do_unallocated;
+             } else {
+                 /* Add/sub (shifted register) */
+                 disas_add_sub_reg(s, insn);
+--
+.34.1

-New patch
+[PULL 13/85] target/arm: Convert disas_add_sub_reg to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+This includes ADD, SUB, ADDS, SUBS (shifted register).
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-14-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  9 +++++
+ target/arm/tcg/translate-a64.c | 64 ++++++++++------------------------
+files changed, 27 insertions(+), 46 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ EOR_r           . 10 01010 .. . ..... ...... ..... .....    @logic_shift
+ ANDS_r          . 11 01010 .. . ..... ...... ..... .....    @logic_shift
+ # Add/subtract (shifted reg)
++
++&addsub_shift    rd rn rm sf sa st
++@addsub_shift    sf:1 .. ..... st:2 . rm:5 sa:6 rn:5 rd:5   &addsub_shift
++
++ADD_r           . 00 01011 .. 0 ..... ...... ..... .....    @addsub_shift
++SUB_r           . 10 01011 .. 0 ..... ...... ..... .....    @addsub_shift
++ADDS_r          . 01 01011 .. 0 ..... ...... ..... .....    @addsub_shift
++SUBS_r          . 11 01011 .. 0 ..... ...... ..... .....    @addsub_shift
++
+ # Add/subtract (extended reg)
+ &addsub_ext     rd rn rm sf sa st
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ TRANS(SUB_ext, do_addsub_ext, a, true, false)
+ TRANS(ADDS_ext, do_addsub_ext, a, false, true)
+ TRANS(SUBS_ext, do_addsub_ext, a, true, true)
+-/*
+- * Add/subtract (shifted register)
+- *
+- *  31 30 29 28       24 23 22 21 20   16 15     10 9    5 4    0
+- * +--+--+--+-----------+-----+--+-------+---------+------+------+
+- * |sf|op| S| 0 1 0 1 1 |shift| 0|  Rm   |  imm6   |  Rn  |  Rd  |
+- * +--+--+--+-----------+-----+--+-------+---------+------+------+
+- *
+- *    sf: 0 -> 32bit, 1 -> 64bit
+- *    op: 0 -> add  , 1 -> sub
+- *     S: 1 -> set flags
+- * shift: 00 -> LSL, 01 -> LSR, 10 -> ASR, 11 -> RESERVED
+- *  imm6: Shift amount to apply to Rm before the add/sub
+- */
+-static void disas_add_sub_reg(DisasContext *s, uint32_t insn)
++static bool do_addsub_reg(DisasContext *s, arg_addsub_shift *a,
++                          bool sub_op, bool setflags)
+ {
+-    int rd = extract32(insn, 0, 5);
+-    int rn = extract32(insn, 5, 5);
+-    int imm6 = extract32(insn, 10, 6);
+-    int rm = extract32(insn, 16, 5);
+-    int shift_type = extract32(insn, 22, 2);
+-    bool setflags = extract32(insn, 29, 1);
+-    bool sub_op = extract32(insn, 30, 1);
+-    bool sf = extract32(insn, 31, 1);
++    TCGv_i64 tcg_rd, tcg_rn, tcg_rm, tcg_result;
+-    TCGv_i64 tcg_rd = cpu_reg(s, rd);
+-    TCGv_i64 tcg_rn, tcg_rm;
+-    TCGv_i64 tcg_result;
+-
+-    if ((shift_type == 3) || (!sf && (imm6 > 31))) {
+-        unallocated_encoding(s);
+-        return;
++    if (a->st == 3 || (!a->sf && (a->sa & 32))) {
++        return false;
+     }
+-    tcg_rn = read_cpu_reg(s, rn, sf);
+-    tcg_rm = read_cpu_reg(s, rm, sf);
++    tcg_rd = cpu_reg(s, a->rd);
++    tcg_rn = read_cpu_reg(s, a->rn, a->sf);
++    tcg_rm = read_cpu_reg(s, a->rm, a->sf);
+-    shift_reg_imm(tcg_rm, tcg_rm, sf, shift_type, imm6);
++    shift_reg_imm(tcg_rm, tcg_rm, a->sf, a->st, a->sa);
+     tcg_result = tcg_temp_new_i64();
+-
+     if (!setflags) {
+         if (sub_op) {
+             tcg_gen_sub_i64(tcg_result, tcg_rn, tcg_rm);
+@@ -XXX,XX +XXX,XX @@ static void disas_add_sub_reg(DisasContext *s, uint32_t insn)
+         }
+     } else {
+         if (sub_op) {
+-            gen_sub_CC(sf, tcg_result, tcg_rn, tcg_rm);
++            gen_sub_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
+         } else {
+-            gen_add_CC(sf, tcg_result, tcg_rn, tcg_rm);
++            gen_add_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
+         }
+     }
+-    if (sf) {
++    if (a->sf) {
+         tcg_gen_mov_i64(tcg_rd, tcg_result);
+     } else {
+         tcg_gen_ext32u_i64(tcg_rd, tcg_result);
+     }
++    return true;
+ }
++TRANS(ADD_r, do_addsub_reg, a, false, false)
++TRANS(SUB_r, do_addsub_reg, a, true, false)
++TRANS(ADDS_r, do_addsub_reg, a, false, true)
++TRANS(SUBS_r, do_addsub_reg, a, true, true)
++
+ /* Data-processing (3 source)
+  *
+  *    31 30  29 28       24 23 21  20  16  15  14  10 9    5 4    0
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
+     int op3 = extract32(insn, 10, 6);
+     if (!op1) {
+-        if (op2 & 8) {
+-            if (op2 & 1) {
+-                goto do_unallocated;
+-            } else {
+-                /* Add/sub (shifted register) */
+-                disas_add_sub_reg(s, insn);
+-            }
+-            return;
+-        }
+         goto do_unallocated;
+     }
+--
+.34.1

-[PULL 36/48] target/arm: Update get_a64_user_mem_index for VHE
+[PULL 14/85] target/arm: Convert disas_data_proc_3src to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-The EL2&0 translation regime is affected by Load Register (unpriv).
+This includes MADD, MSUB, SMADDL, SMSUBL, UMADDL, UMSUBL, SMULH, UMULH.
-The code structure used here will facilitate later changes in this
-area for implementing UAO and NV.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-36-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-15-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h           |  9 ++++----
+ target/arm/tcg/a64.decode      |  16 +++++
- target/arm/translate.h     |  2 ++
+ target/arm/tcg/translate-a64.c | 119 ++++++++++++---------------------
- target/arm/helper.c        | 22 +++++++++++++++++++
+files changed, 59 insertions(+), 76 deletions(-)
  target/arm/translate-a64.c | 44 ++++++++++++++++++++++++--------------
 files changed, 57 insertions(+), 20 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ typedef ARMCPU ArchCPU;
+@@ -XXX,XX +XXX,XX @@ SUBS_ext        . 11 01011001 ..... ... ... ..... .....     @addsub_ext
-  * |              |     |   TBFLAG_A32   |              |
+ # Conditional select
-  * |              |     +-----+----------+  TBFLAG_AM32 |
+ # Data Processing (3-source)
-  * |  TBFLAG_ANY  |           |TBFLAG_M32|              |
-- * |              |           +-------------------------|
++&rrrr           rd rn rm ra
-- * |              |           |       TBFLAG_A64        |
++@rrrr           . .. ........ rm:5 . ra:5 rn:5 rd:5     &rrrr
-- * +--------------+-----------+-------------------------+
++
-- *  31          20          14                         0
++MADD_w          0 00 11011000 ..... 0 ..... ..... ..... @rrrr
-+ * |              |         +-+----------+--------------|
++MSUB_w          0 00 11011000 ..... 1 ..... ..... ..... @rrrr
-+ * |              |         |         TBFLAG_A64        |
++MADD_x          1 00 11011000 ..... 0 ..... ..... ..... @rrrr
-+ * +--------------+---------+---------------------------+
++MSUB_x          1 00 11011000 ..... 1 ..... ..... ..... @rrrr
-+ *  31          20        15                           0
++
-  *
++SMADDL          1 00 11011001 ..... 0 ..... ..... ..... @rrrr
-  * Unless otherwise noted, these bits are cached in env->hflags.
++SMSUBL          1 00 11011001 ..... 1 ..... ..... ..... @rrrr
-  */
++UMADDL          1 00 11011101 ..... 0 ..... ..... ..... @rrrr
-@@ -XXX,XX +XXX,XX @@ FIELD(TBFLAG_A64, PAUTH_ACTIVE, 8, 1)
++UMSUBL          1 00 11011101 ..... 1 ..... ..... ..... @rrrr
- FIELD(TBFLAG_A64, BT, 9, 1)
++
- FIELD(TBFLAG_A64, BTYPE, 10, 2)         /* Not cached. */
++SMULH           1 00 11011010 ..... 0 11111 ..... ..... @rrr
- FIELD(TBFLAG_A64, TBID, 12, 2)
++UMULH           1 00 11011110 ..... 0 11111 ..... ..... @rrr
-+FIELD(TBFLAG_A64, UNPRIV, 14, 1)
++
+ ### Cryptographic AES
- static inline bool bswap_code(bool sctlr_b)
  AESE            01001110 00 10100 00100 10 ..... .....  @r2r_q1e0
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(SUB_r, do_addsub_reg, a, true, false)
  TRANS(ADDS_r, do_addsub_reg, a, false, true)
  TRANS(SUBS_r, do_addsub_reg, a, true, true)
 -/* Data-processing (3 source)
 - *
 - *    31 30  29 28       24 23 21  20  16  15  14  10 9    5 4    0
 - *  +--+------+-----------+------+------+----+------+------+------+
 - *  |sf| op54 | 1 1 0 1 1 | op31 |  Rm  | o0 |  Ra  |  Rn  |  Rd  |
 - *  +--+------+-----------+------+------+----+------+------+------+
 - */
 -static void disas_data_proc_3src(DisasContext *s, uint32_t insn)
 +static bool do_mulh(DisasContext *s, arg_rrr *a,
 +                    void (*fn)(TCGv_i64, TCGv_i64, TCGv_i64, TCGv_i64))
  {
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+-    int rd = extract32(insn, 0, 5);
-index XXXXXXX..XXXXXXX 100644
+-    int rn = extract32(insn, 5, 5);
---- a/target/arm/translate.h
+-    int ra = extract32(insn, 10, 5);
-+++ b/target/arm/translate.h
+-    int rm = extract32(insn, 16, 5);
-@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
+-    int op_id = (extract32(insn, 29, 3) << 4) |
-      * ie A64 LDX*, LDAX*, A32/T32 LDREX*, LDAEX*.
+-        (extract32(insn, 21, 3) << 1) |
-      */
+-        extract32(insn, 15, 1);
-     bool is_ldex;
+-    bool sf = extract32(insn, 31, 1);
-+    /* True if AccType_UNPRIV should be used for LDTR et al */
+-    bool is_sub = extract32(op_id, 0, 1);
-+    bool unpriv;
+-    bool is_high = extract32(op_id, 2, 1);
-     /* True if v8.3-PAuth is active.  */
+-    bool is_signed = false;
-     bool pauth_active;
+-    TCGv_i64 tcg_op1;
-     /* True with v8.5-BTI and SCTLR_ELx.BT* set.  */
+-    TCGv_i64 tcg_op2;
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+-    TCGv_i64 tcg_tmp;
-index XXXXXXX..XXXXXXX 100644
++    TCGv_i64 discard = tcg_temp_new_i64();
---- a/target/arm/helper.c
++    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
-+++ b/target/arm/helper.c
++    TCGv_i64 tcg_rn = cpu_reg(s, a->rn);
-@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
++    TCGv_i64 tcg_rm = cpu_reg(s, a->rm);
 -    /* Note that op_id is sf:op54:op31:o0 so it includes the 32/64 size flag */
 -    switch (op_id) {
 -    case 0x42: /* SMADDL */
 -    case 0x43: /* SMSUBL */
 -    case 0x44: /* SMULH */
 -        is_signed = true;
 -        break;
 -    case 0x0: /* MADD (32bit) */
 -    case 0x1: /* MSUB (32bit) */
 -    case 0x40: /* MADD (64bit) */
 -    case 0x41: /* MSUB (64bit) */
 -    case 0x4a: /* UMADDL */
 -    case 0x4b: /* UMSUBL */
 -    case 0x4c: /* UMULH */
 -        break;
 -    default:
 -        unallocated_encoding(s);
 -        return;
 -    }
 +    fn(discard, tcg_rd, tcg_rn, tcg_rm);
 +    return true;
 +}
 -    if (is_high) {
 -        TCGv_i64 low_bits = tcg_temp_new_i64(); /* low bits discarded */
 -        TCGv_i64 tcg_rd = cpu_reg(s, rd);
 -        TCGv_i64 tcg_rn = cpu_reg(s, rn);
 -        TCGv_i64 tcg_rm = cpu_reg(s, rm);
 +TRANS(SMULH, do_mulh, a, tcg_gen_muls2_i64)
 +TRANS(UMULH, do_mulh, a, tcg_gen_mulu2_i64)
 -        if (is_signed) {
 -            tcg_gen_muls2_i64(low_bits, tcg_rd, tcg_rn, tcg_rm);
 -        } else {
 -            tcg_gen_mulu2_i64(low_bits, tcg_rd, tcg_rn, tcg_rm);
 -        }
 -        return;
 -    }
 +static bool do_muladd(DisasContext *s, arg_rrrr *a,
 +                      bool sf, bool is_sub, MemOp mop)
 +{
 +    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
 +    TCGv_i64 tcg_op1, tcg_op2;
 -    tcg_op1 = tcg_temp_new_i64();
 -    tcg_op2 = tcg_temp_new_i64();
 -    tcg_tmp = tcg_temp_new_i64();
 -
 -    if (op_id < 0x42) {
 -        tcg_gen_mov_i64(tcg_op1, cpu_reg(s, rn));
 -        tcg_gen_mov_i64(tcg_op2, cpu_reg(s, rm));
 +    if (mop == MO_64) {
 +        tcg_op1 = cpu_reg(s, a->rn);
 +        tcg_op2 = cpu_reg(s, a->rm);
      } else {
 -        if (is_signed) {
 -            tcg_gen_ext32s_i64(tcg_op1, cpu_reg(s, rn));
 -            tcg_gen_ext32s_i64(tcg_op2, cpu_reg(s, rm));
 -        } else {
 -            tcg_gen_ext32u_i64(tcg_op1, cpu_reg(s, rn));
 -            tcg_gen_ext32u_i64(tcg_op2, cpu_reg(s, rm));
 -        }
 +        tcg_op1 = tcg_temp_new_i64();
 +        tcg_op2 = tcg_temp_new_i64();
 +        tcg_gen_ext_i64(tcg_op1, cpu_reg(s, a->rn), mop);
 +        tcg_gen_ext_i64(tcg_op2, cpu_reg(s, a->rm), mop);
      }
 -    if (ra == 31 && !is_sub) {
 +    if (a->ra == 31 && !is_sub) {
          /* Special-case MADD with rA == XZR; it is the standard MUL alias */
 -        tcg_gen_mul_i64(cpu_reg(s, rd), tcg_op1, tcg_op2);
 +        tcg_gen_mul_i64(tcg_rd, tcg_op1, tcg_op2);
      } else {
 +        TCGv_i64 tcg_tmp = tcg_temp_new_i64();
 +        TCGv_i64 tcg_ra = cpu_reg(s, a->ra);
 +
          tcg_gen_mul_i64(tcg_tmp, tcg_op1, tcg_op2);
          if (is_sub) {
 -            tcg_gen_sub_i64(cpu_reg(s, rd), cpu_reg(s, ra), tcg_tmp);
 +            tcg_gen_sub_i64(tcg_rd, tcg_ra, tcg_tmp);
          } else {
 -            tcg_gen_add_i64(cpu_reg(s, rd), cpu_reg(s, ra), tcg_tmp);
 +            tcg_gen_add_i64(tcg_rd, tcg_ra, tcg_tmp);
          }
      }
-+    /* Compute the condition for using AccType_UNPRIV for LDTR et al. */
+     if (!sf) {
-+    /* TODO: ARMv8.2-UAO */
+-        tcg_gen_ext32u_i64(cpu_reg(s, rd), cpu_reg(s, rd));
-+    switch (mmu_idx) {
++        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
-+    case ARMMMUIdx_E10_1:
+     }
-+    case ARMMMUIdx_SE10_1:
++    return true;
 +        /* TODO: ARMv8.3-NV */
 +        flags = FIELD_DP32(flags, TBFLAG_A64, UNPRIV, 1);
 +        break;
 +    case ARMMMUIdx_E20_2:
 +        /* TODO: ARMv8.4-SecEL2 */
 +        /*
 +         * Note that E20_2 is gated by HCR_EL2.E2H == 1, but E20_0 is
 +         * gated by HCR_EL2.<E2H,TGE> == '11', and so is LDTR.
 +         */
 +        if (env->cp15.hcr_el2 & HCR_TGE) {
 +            flags = FIELD_DP32(flags, TBFLAG_A64, UNPRIV, 1);
 +        }
 +        break;
 +    default:
 +        break;
 +    }
 +
      return rebuild_hflags_common(env, fp_el, mmu_idx, flags);
  }
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
++TRANS(MADD_w, do_muladd, a, false, false, MO_64)
-index XXXXXXX..XXXXXXX 100644
++TRANS(MSUB_w, do_muladd, a, false, true, MO_64)
---- a/target/arm/translate-a64.c
++TRANS(MADD_x, do_muladd, a, true, false, MO_64)
-+++ b/target/arm/translate-a64.c
++TRANS(MSUB_x, do_muladd, a, true, true, MO_64)
-@@ -XXX,XX +XXX,XX @@ void a64_translate_init(void)
++
-         offsetof(CPUARMState, exclusive_high), "exclusive_high");
++TRANS(SMADDL, do_muladd, a, true, false, MO_SL)
- }
++TRANS(SMSUBL, do_muladd, a, true, true, MO_SL)
++TRANS(UMADDL, do_muladd, a, true, false, MO_UL)
--static inline int get_a64_user_mem_index(DisasContext *s)
++TRANS(UMSUBL, do_muladd, a, true, true, MO_UL)
-+/*
++
-+ * Return the core mmu_idx to use for A64 "unprivileged load/store" insns
+ /* Add/subtract (with carry)
-+ */
+  *  31 30 29 28 27 26 25 24 23 22 21  20  16  15       10  9    5 4   0
-+static int get_a64_user_mem_index(DisasContext *s)
+  * +--+--+--+------------------------+------+-------------+------+-----+
- {
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
--    /* Return the core mmu_idx to use for A64 "unprivileged load/store" insns:
+         disas_cond_select(s, insn);
--     *  if EL1, access as if EL0; otherwise access at current EL
+         break;
-+    /*
-+     * If AccType_UNPRIV is not used, the insn uses AccType_NORMAL,
+-    case 0x8 ... 0xf: /* (3 source) */
-+     * which is the usual mmu_idx for this cpu state.
+-        disas_data_proc_3src(s, insn);
       */
 -    ARMMMUIdx useridx;
 +    ARMMMUIdx useridx = s->mmu_idx;
 -    switch (s->mmu_idx) {
 -    case ARMMMUIdx_E10_1:
 -        useridx = ARMMMUIdx_E10_0;
 -        break;
--    case ARMMMUIdx_SE10_1:
+-
--        useridx = ARMMMUIdx_SE10_0;
+     default:
--        break;
+     do_unallocated:
--    case ARMMMUIdx_Stage2:
+     case 0x6: /* Data-processing */
--        g_assert_not_reached();
++    case 0x8 ... 0xf: /* (3 source) */
--    default:
+         unallocated_encoding(s);
--        useridx = s->mmu_idx;
+         break;
--        break;
+     }
 +    if (s->unpriv) {
 +        /*
 +         * We have pre-computed the condition for AccType_UNPRIV.
 +         * Therefore we should never get here with a mmu_idx for
 +         * which we do not know the corresponding user mmu_idx.
 +         */
 +        switch (useridx) {
 +        case ARMMMUIdx_E10_1:
 +            useridx = ARMMMUIdx_E10_0;
 +            break;
 +        case ARMMMUIdx_E20_2:
 +            useridx = ARMMMUIdx_E20_0;
 +            break;
 +        case ARMMMUIdx_SE10_1:
 +            useridx = ARMMMUIdx_SE10_0;
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
      }
      return arm_to_core_mmu_idx(useridx);
  }
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_init_disas_context(DisasContextBase *dcbase,
      dc->pauth_active = FIELD_EX32(tb_flags, TBFLAG_A64, PAUTH_ACTIVE);
      dc->bt = FIELD_EX32(tb_flags, TBFLAG_A64, BT);
      dc->btype = FIELD_EX32(tb_flags, TBFLAG_A64, BTYPE);
 +    dc->unpriv = FIELD_EX32(tb_flags, TBFLAG_A64, UNPRIV);
      dc->vec_len = 0;
      dc->vec_stride = 0;
      dc->cp_regs = arm_cpu->cp_regs;
 --
-.20.1
+.34.1

-New patch
+[PULL 15/85] target/arm: Convert disas_adc_sbc to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+This includes ADC, SBC, ADCS, SBCS.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-16-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  6 +++++
+ target/arm/tcg/translate-a64.c | 43 +++++++++++++---------------------
+files changed, 22 insertions(+), 27 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ ADDS_ext        . 01 01011001 ..... ... ... ..... .....     @addsub_ext
+ SUBS_ext        . 11 01011001 ..... ... ... ..... .....     @addsub_ext
+ # Add/subtract (carry)
++
++ADC             . 00 11010000 ..... 000000 ..... .....  @rrr_sf
++ADCS            . 01 11010000 ..... 000000 ..... .....  @rrr_sf
++SBC             . 10 11010000 ..... 000000 ..... .....  @rrr_sf
++SBCS            . 11 11010000 ..... 000000 ..... .....  @rrr_sf
++
+ # Rotate right into flags
+ # Evaluate into flags
+ # Conditional compare (regster)
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ TRANS(SMSUBL, do_muladd, a, true, true, MO_SL)
+ TRANS(UMADDL, do_muladd, a, true, false, MO_UL)
+ TRANS(UMSUBL, do_muladd, a, true, true, MO_UL)
+-/* Add/subtract (with carry)
+- *  31 30 29 28 27 26 25 24 23 22 21  20  16  15       10  9    5 4   0
+- * +--+--+--+------------------------+------+-------------+------+-----+
+- * |sf|op| S| 1  1  0  1  0  0  0  0 |  rm  | 0 0 0 0 0 0 |  Rn  |  Rd |
+- * +--+--+--+------------------------+------+-------------+------+-----+
+- */
+-
+-static void disas_adc_sbc(DisasContext *s, uint32_t insn)
++static bool do_adc_sbc(DisasContext *s, arg_rrr_sf *a,
++                       bool is_sub, bool setflags)
+ {
+-    unsigned int sf, op, setflags, rm, rn, rd;
+     TCGv_i64 tcg_y, tcg_rn, tcg_rd;
+-    sf = extract32(insn, 31, 1);
+-    op = extract32(insn, 30, 1);
+-    setflags = extract32(insn, 29, 1);
+-    rm = extract32(insn, 16, 5);
+-    rn = extract32(insn, 5, 5);
+-    rd = extract32(insn, 0, 5);
++    tcg_rd = cpu_reg(s, a->rd);
++    tcg_rn = cpu_reg(s, a->rn);
+-    tcg_rd = cpu_reg(s, rd);
+-    tcg_rn = cpu_reg(s, rn);
+-
+-    if (op) {
++    if (is_sub) {
+         tcg_y = tcg_temp_new_i64();
+-        tcg_gen_not_i64(tcg_y, cpu_reg(s, rm));
++        tcg_gen_not_i64(tcg_y, cpu_reg(s, a->rm));
+     } else {
+-        tcg_y = cpu_reg(s, rm);
++        tcg_y = cpu_reg(s, a->rm);
+     }
+     if (setflags) {
+-        gen_adc_CC(sf, tcg_rd, tcg_rn, tcg_y);
++        gen_adc_CC(a->sf, tcg_rd, tcg_rn, tcg_y);
+     } else {
+-        gen_adc(sf, tcg_rd, tcg_rn, tcg_y);
++        gen_adc(a->sf, tcg_rd, tcg_rn, tcg_y);
+     }
++    return true;
+ }
++TRANS(ADC, do_adc_sbc, a, false, false)
++TRANS(SBC, do_adc_sbc, a, true, false)
++TRANS(ADCS, do_adc_sbc, a, false, true)
++TRANS(SBCS, do_adc_sbc, a, true, true)
++
+ /*
+  * Rotate right into flags
+  *  31 30 29                21       15          10      5  4      0
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
+     switch (op2) {
+     case 0x0:
+         switch (op3) {
+-        case 0x00: /* Add/subtract (with carry) */
+-            disas_adc_sbc(s, insn);
+-            break;
+-
+         case 0x01: /* Rotate right into flags */
+         case 0x21:
+             disas_rotate_right_into_flags(s, insn);
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
+             break;
+         default:
++        case 0x00: /* Add/subtract (with carry) */
+             goto do_unallocated;
+         }
+         break;
+--
+.34.1

-[PULL 17/48] target/arm: Expand TBFLAG_ANY.MMUIDX to 4 bits
+[PULL 16/85] target/arm: Convert RMIF to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-We are about to expand the number of mmuidx to 10, and so need 4 bits.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 For the benefit of reading the number out of -d exec, align it to the
 penultimate nibble.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-17-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-17-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h | 16 ++++++++--------
+ target/arm/tcg/a64.decode      |  3 +++
-file changed, 8 insertions(+), 8 deletions(-)
+ target/arm/tcg/translate-a64.c | 32 +++++++++-----------------------
 files changed, 12 insertions(+), 23 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ typedef ARMCPU ArchCPU;
+@@ -XXX,XX +XXX,XX @@ SBC             . 10 11010000 ..... 000000 ..... .....  @rrr_sf
-  * We put flags which are shared between 32 and 64 bit mode at the top
+ SBCS            . 11 11010000 ..... 000000 ..... .....  @rrr_sf
-  * of the word, and flags which apply to only one mode at the bottom.
-  *
+ # Rotate right into flags
-- *  31          21    18    14          9              0
++
-+ *  31          20    18    14          9              0
++RMIF            1 01 11010000 imm:6 00001 rn:5 0 mask:4
-  * +--------------+-----+-----+----------+--------------+
++
-  * |              |     |   TBFLAG_A32   |              |
+ # Evaluate into flags
-  * |              |     +-----+----------+  TBFLAG_AM32 |
+ # Conditional compare (regster)
-@@ -XXX,XX +XXX,XX @@ typedef ARMCPU ArchCPU;
+ # Conditional compare (immediate)
-  * |              |           +-------------------------|
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
-  * |              |           |       TBFLAG_A64        |
+index XXXXXXX..XXXXXXX 100644
-  * +--------------+-----------+-------------------------+
+--- a/target/arm/tcg/translate-a64.c
-- *  31          21          14                         0
++++ b/target/arm/tcg/translate-a64.c
-+ *  31          20          14                         0
+@@ -XXX,XX +XXX,XX @@ TRANS(SBC, do_adc_sbc, a, true, false)
-  *
+ TRANS(ADCS, do_adc_sbc, a, false, true)
-  * Unless otherwise noted, these bits are cached in env->hflags.
+ TRANS(SBCS, do_adc_sbc, a, true, true)
-  */
- FIELD(TBFLAG_ANY, AARCH64_STATE, 31, 1)
+-/*
--FIELD(TBFLAG_ANY, MMUIDX, 28, 3)
+- * Rotate right into flags
--FIELD(TBFLAG_ANY, SS_ACTIVE, 27, 1)
+- *  31 30 29                21       15          10      5  4      0
--FIELD(TBFLAG_ANY, PSTATE_SS, 26, 1)     /* Not cached. */
+- * +--+--+--+-----------------+--------+-----------+------+--+------+
-+FIELD(TBFLAG_ANY, SS_ACTIVE, 30, 1)
+- * |sf|op| S| 1 1 0 1 0 0 0 0 |  imm6  | 0 0 0 0 1 |  Rn  |o2| mask |
-+FIELD(TBFLAG_ANY, PSTATE_SS, 29, 1)     /* Not cached. */
+- * +--+--+--+-----------------+--------+-----------+------+--+------+
-+FIELD(TBFLAG_ANY, BE_DATA, 28, 1)
+- */
-+FIELD(TBFLAG_ANY, MMUIDX, 24, 4)
+-static void disas_rotate_right_into_flags(DisasContext *s, uint32_t insn)
- /* Target EL if we take a floating-point-disabled exception */
++static bool trans_RMIF(DisasContext *s, arg_RMIF *a)
--FIELD(TBFLAG_ANY, FPEXC_EL, 24, 2)
+ {
--FIELD(TBFLAG_ANY, BE_DATA, 23, 1)
+-    int mask = extract32(insn, 0, 4);
-+FIELD(TBFLAG_ANY, FPEXC_EL, 22, 2)
+-    int o2 = extract32(insn, 4, 1);
- /* For A-profile only, target EL for debug exceptions.  */
+-    int rn = extract32(insn, 5, 5);
--FIELD(TBFLAG_ANY, DEBUG_TARGET_EL, 21, 2)
+-    int imm6 = extract32(insn, 15, 6);
-+FIELD(TBFLAG_ANY, DEBUG_TARGET_EL, 20, 2)
+-    int sf_op_s = extract32(insn, 29, 3);
 +    int mask = a->mask;
      TCGv_i64 tcg_rn;
      TCGv_i32 nzcv;
 -    if (sf_op_s != 5 || o2 != 0 || !dc_isar_feature(aa64_condm_4, s)) {
 -        unallocated_encoding(s);
 -        return;
 +    if (!dc_isar_feature(aa64_condm_4, s)) {
 +        return false;
      }
 -    tcg_rn = read_cpu_reg(s, rn, 1);
 -    tcg_gen_rotri_i64(tcg_rn, tcg_rn, imm6);
 +    tcg_rn = read_cpu_reg(s, a->rn, 1);
 +    tcg_gen_rotri_i64(tcg_rn, tcg_rn, a->imm);
      nzcv = tcg_temp_new_i32();
      tcg_gen_extrl_i64_i32(nzcv, tcg_rn);
@@ -XXX,XX +XXX,XX @@ static void disas_rotate_right_into_flags(DisasContext *s, uint32_t insn)
      if (mask & 1) { /* V */
          tcg_gen_shli_i32(cpu_VF, nzcv, 31 - 0);
      }
 +    return true;
  }
  /*
-  * Bit usage when in AArch32 state, both A- and M-profile.
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
      switch (op2) {
      case 0x0:
          switch (op3) {
 -        case 0x01: /* Rotate right into flags */
 -        case 0x21:
 -            disas_rotate_right_into_flags(s, insn);
 -            break;
 -
          case 0x02: /* Evaluate into flags */
          case 0x12:
          case 0x22:
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
          default:
          case 0x00: /* Add/subtract (with carry) */
 +        case 0x01: /* Rotate right into flags */
 +        case 0x21:
              goto do_unallocated;
          }
          break;
 --
-.20.1
+.34.1

-New patch
+[PULL 17/85] target/arm: Convert SETF8, SETF16 to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-18-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  4 +++
+ target/arm/tcg/translate-a64.c | 48 +++++-----------------------------
+files changed, 11 insertions(+), 41 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ SBCS            . 11 11010000 ..... 000000 ..... .....  @rrr_sf
+ RMIF            1 01 11010000 imm:6 00001 rn:5 0 mask:4
+ # Evaluate into flags
++
++SETF8           0 01 11010000 00000 000010 rn:5 01101
++SETF16          0 01 11010000 00000 010010 rn:5 01101
++
+ # Conditional compare (regster)
+ # Conditional compare (immediate)
+ # Conditional select
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_RMIF(DisasContext *s, arg_RMIF *a)
+     return true;
+ }
+-/*
+- * Evaluate into flags
+- *  31 30 29                21        15   14        10      5  4      0
+- * +--+--+--+-----------------+---------+----+---------+------+--+------+
+- * |sf|op| S| 1 1 0 1 0 0 0 0 | opcode2 | sz | 0 0 1 0 |  Rn  |o3| mask |
+- * +--+--+--+-----------------+---------+----+---------+------+--+------+
+- */
+-static void disas_evaluate_into_flags(DisasContext *s, uint32_t insn)
++static bool do_setf(DisasContext *s, int rn, int shift)
+ {
+-    int o3_mask = extract32(insn, 0, 5);
+-    int rn = extract32(insn, 5, 5);
+-    int o2 = extract32(insn, 15, 6);
+-    int sz = extract32(insn, 14, 1);
+-    int sf_op_s = extract32(insn, 29, 3);
+-    TCGv_i32 tmp;
+-    int shift;
++    TCGv_i32 tmp = tcg_temp_new_i32();
+-    if (sf_op_s != 1 || o2 != 0 || o3_mask != 0xd ||
+-        !dc_isar_feature(aa64_condm_4, s)) {
+-        unallocated_encoding(s);
+-        return;
+-    }
+-    shift = sz ? 16 : 24;  /* SETF16 or SETF8 */
+-
+-    tmp = tcg_temp_new_i32();
+     tcg_gen_extrl_i64_i32(tmp, cpu_reg(s, rn));
+     tcg_gen_shli_i32(cpu_NF, tmp, shift);
+     tcg_gen_shli_i32(cpu_VF, tmp, shift - 1);
+     tcg_gen_mov_i32(cpu_ZF, cpu_NF);
+     tcg_gen_xor_i32(cpu_VF, cpu_VF, cpu_NF);
++    return true;
+ }
++TRANS_FEAT(SETF8, aa64_condm_4, do_setf, a->rn, 24)
++TRANS_FEAT(SETF16, aa64_condm_4, do_setf, a->rn, 16)
++
+ /* Conditional compare (immediate / register)
+  *  31 30 29 28 27 26 25 24 23 22 21  20    16 15  12  11  10  9   5  4 3   0
+  * +--+--+--+------------------------+--------+------+----+--+------+--+-----+
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
+ {
+     int op1 = extract32(insn, 28, 1);
+     int op2 = extract32(insn, 21, 4);
+-    int op3 = extract32(insn, 10, 6);
+     if (!op1) {
+         goto do_unallocated;
+     }
+     switch (op2) {
+-    case 0x0:
+-        switch (op3) {
+-        case 0x02: /* Evaluate into flags */
+-        case 0x12:
+-        case 0x22:
+-        case 0x32:
+-            disas_evaluate_into_flags(s, insn);
+-            break;
+-
+-        default:
+-        case 0x00: /* Add/subtract (with carry) */
+-        case 0x01: /* Rotate right into flags */
+-        case 0x21:
+-            goto do_unallocated;
+-        }
+-        break;
+-
+     case 0x2: /* Conditional compare */
+         disas_cc(s, insn); /* both imm and reg forms */
+         break;
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
+     default:
+     do_unallocated:
++    case 0x0:
+     case 0x6: /* Data-processing */
+     case 0x8 ... 0xf: /* (3 source) */
+         unallocated_encoding(s);
+--
+.34.1

-[PULL 42/48] target/arm: Raise only one interrupt in arm_cpu_exec_interrupt
+[PULL 18/85] target/arm: Convert CCMP, CCMN to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-The fall through organization of this function meant that we
-would raise an interrupt, then might overwrite that with another.
-Since interrupt prioritization is IMPLEMENTATION DEFINED, we
-can recognize these in any order we choose.
-Unify the code to raise the interrupt in a block at the end.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-42-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-19-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.c | 30 ++++++++++++------------------
+ target/arm/tcg/a64.decode      |  6 ++--
-file changed, 12 insertions(+), 18 deletions(-)
+ target/arm/tcg/translate-a64.c | 66 +++++++++++-----------------------
 files changed, 25 insertions(+), 47 deletions(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
+@@ -XXX,XX +XXX,XX @@ RMIF            1 01 11010000 imm:6 00001 rn:5 0 mask:4
-     uint64_t hcr_el2 = arm_hcr_el2_eff(env);
+ SETF8           0 01 11010000 00000 000010 rn:5 01101
-     uint32_t target_el;
+ SETF16          0 01 11010000 00000 010010 rn:5 01101
-     uint32_t excp_idx;
--    bool ret = false;
+-# Conditional compare (regster)
 -# Conditional compare (immediate)
 +# Conditional compare
 +
-+    /* The prioritization of interrupts is IMPLEMENTATION DEFINED. */
++CCMP            sf:1 op:1 1 11010010 y:5 cond:4 imm:1 0 rn:5 0 nzcv:4
++
-     if (interrupt_request & CPU_INTERRUPT_FIQ) {
+ # Conditional select
-         excp_idx = EXCP_FIQ;
+ # Data Processing (3-source)
-         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
-         if (arm_excp_unmasked(cs, excp_idx, target_el,
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
-                               cur_el, secure, hcr_el2)) {
+index XXXXXXX..XXXXXXX 100644
--            cs->exception_index = excp_idx;
+--- a/target/arm/tcg/translate-a64.c
--            env->exception.target_el = target_el;
++++ b/target/arm/tcg/translate-a64.c
--            cc->do_interrupt(cs);
+@@ -XXX,XX +XXX,XX @@ static bool do_setf(DisasContext *s, int rn, int shift)
--            ret = true;
+ TRANS_FEAT(SETF8, aa64_condm_4, do_setf, a->rn, 24)
-+            goto found;
+ TRANS_FEAT(SETF16, aa64_condm_4, do_setf, a->rn, 16)
 -/* Conditional compare (immediate / register)
 - *  31 30 29 28 27 26 25 24 23 22 21  20    16 15  12  11  10  9   5  4 3   0
 - * +--+--+--+------------------------+--------+------+----+--+------+--+-----+
 - * |sf|op| S| 1  1  0  1  0  0  1  0 |imm5/rm | cond |i/r |o2|  Rn  |o3|nzcv |
 - * +--+--+--+------------------------+--------+------+----+--+------+--+-----+
 - *        [1]                             y                [0]       [0]
 - */
 -static void disas_cc(DisasContext *s, uint32_t insn)
 +/* CCMP, CCMN */
 +static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
  {
 -    unsigned int sf, op, y, cond, rn, nzcv, is_imm;
 -    TCGv_i32 tcg_t0, tcg_t1, tcg_t2;
 -    TCGv_i64 tcg_tmp, tcg_y, tcg_rn;
 +    TCGv_i32 tcg_t0 = tcg_temp_new_i32();
 +    TCGv_i32 tcg_t1 = tcg_temp_new_i32();
 +    TCGv_i32 tcg_t2 = tcg_temp_new_i32();
 +    TCGv_i64 tcg_tmp = tcg_temp_new_i64();
 +    TCGv_i64 tcg_rn, tcg_y;
      DisasCompare c;
 -
 -    if (!extract32(insn, 29, 1)) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -    if (insn & (1 << 10 | 1 << 4)) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -    sf = extract32(insn, 31, 1);
 -    op = extract32(insn, 30, 1);
 -    is_imm = extract32(insn, 11, 1);
 -    y = extract32(insn, 16, 5); /* y = rm (reg) or imm5 (imm) */
 -    cond = extract32(insn, 12, 4);
 -    rn = extract32(insn, 5, 5);
 -    nzcv = extract32(insn, 0, 4);
 +    unsigned nzcv;
      /* Set T0 = !COND.  */
 -    tcg_t0 = tcg_temp_new_i32();
 -    arm_test_cc(&c, cond);
 +    arm_test_cc(&c, a->cond);
      tcg_gen_setcondi_i32(tcg_invert_cond(c.cond), tcg_t0, c.value, 0);
      /* Load the arguments for the new comparison.  */
 -    if (is_imm) {
 -        tcg_y = tcg_temp_new_i64();
 -        tcg_gen_movi_i64(tcg_y, y);
 +    if (a->imm) {
 +        tcg_y = tcg_constant_i64(a->y);
      } else {
 -        tcg_y = cpu_reg(s, y);
 +        tcg_y = cpu_reg(s, a->y);
      }
 -    tcg_rn = cpu_reg(s, rn);
 +    tcg_rn = cpu_reg(s, a->rn);
      /* Set the flags for the new comparison.  */
 -    tcg_tmp = tcg_temp_new_i64();
 -    if (op) {
 -        gen_sub_CC(sf, tcg_tmp, tcg_rn, tcg_y);
 +    if (a->op) {
 +        gen_sub_CC(a->sf, tcg_tmp, tcg_rn, tcg_y);
      } else {
 -        gen_add_CC(sf, tcg_tmp, tcg_rn, tcg_y);
 +        gen_add_CC(a->sf, tcg_tmp, tcg_rn, tcg_y);
      }
 -    /* If COND was false, force the flags to #nzcv.  Compute two masks
 +    /*
 +     * If COND was false, force the flags to #nzcv.  Compute two masks
       * to help with this: T1 = (COND ? 0 : -1), T2 = (COND ? -1 : 0).
       * For tcg hosts that support ANDC, we can make do with just T1.
       * In either case, allow the tcg optimizer to delete any unused mask.
       */
 -    tcg_t1 = tcg_temp_new_i32();
 -    tcg_t2 = tcg_temp_new_i32();
      tcg_gen_neg_i32(tcg_t1, tcg_t0);
      tcg_gen_subi_i32(tcg_t2, tcg_t0, 1);
 +    nzcv = a->nzcv;
      if (nzcv & 8) { /* N */
          tcg_gen_or_i32(cpu_NF, cpu_NF, tcg_t1);
      } else {
@@ -XXX,XX +XXX,XX @@ static void disas_cc(DisasContext *s, uint32_t insn)
              tcg_gen_and_i32(cpu_VF, cpu_VF, tcg_t2);
          }
      }
-     if (interrupt_request & CPU_INTERRUPT_HARD) {
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
-         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
-         if (arm_excp_unmasked(cs, excp_idx, target_el,
-                               cur_el, secure, hcr_el2)) {
--            cs->exception_index = excp_idx;
--            env->exception.target_el = target_el;
--            cc->do_interrupt(cs);
--            ret = true;
-+            goto found;
-         }
-     }
-     if (interrupt_request & CPU_INTERRUPT_VIRQ) {
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
-         target_el = 1;
-         if (arm_excp_unmasked(cs, excp_idx, target_el,
-                               cur_el, secure, hcr_el2)) {
--            cs->exception_index = excp_idx;
--            env->exception.target_el = target_el;
--            cc->do_interrupt(cs);
--            ret = true;
-+            goto found;
-         }
-     }
-     if (interrupt_request & CPU_INTERRUPT_VFIQ) {
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
-         target_el = 1;
-         if (arm_excp_unmasked(cs, excp_idx, target_el,
-                               cur_el, secure, hcr_el2)) {
--            cs->exception_index = excp_idx;
--            env->exception.target_el = target_el;
--            cc->do_interrupt(cs);
--            ret = true;
-+            goto found;
-         }
-     }
-+    return false;
--    return ret;
-+ found:
-+    cs->exception_index = excp_idx;
-+    env->exception.target_el = target_el;
-+    cc->do_interrupt(cs);
 +    return true;
  }
- #if !defined(CONFIG_USER_ONLY) || !defined(TARGET_AARCH64)
+ /* Conditional select
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
      }
      switch (op2) {
 -    case 0x2: /* Conditional compare */
 -        disas_cc(s, insn); /* both imm and reg forms */
 -        break;
 -
      case 0x4: /* Conditional select */
          disas_cond_select(s, insn);
          break;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
      default:
      do_unallocated:
      case 0x0:
 +    case 0x2: /* Conditional compare */
      case 0x6: /* Data-processing */
      case 0x8 ... 0xf: /* (3 source) */
          unallocated_encoding(s);
 --
-.20.1
+.34.1

-[PULL 40/48] target/arm: Pass more cpu state to arm_excp_unmasked
+[PULL 19/85] target/arm: Convert disas_cond_select to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Avoid redundant computation of cpu state by passing it in
+This includes CSEL, CSINC, CSINV, CSNEG.  Remove disas_data_proc_reg,
-from the caller, which has already computed it for itself.
+as these were the last insns decoded by that function.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-40-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-20-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.c | 22 ++++++++++++----------
+ target/arm/tcg/a64.decode      |  3 ++
-file changed, 12 insertions(+), 10 deletions(-)
+ target/arm/tcg/translate-a64.c | 84 ++++++----------------------------
 files changed, 17 insertions(+), 70 deletions(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
+@@ -XXX,XX +XXX,XX @@ SETF16          0 01 11010000 00000 010010 rn:5 01101
  CCMP            sf:1 op:1 1 11010010 y:5 cond:4 imm:1 0 rn:5 0 nzcv:4
  # Conditional select
 +
 +CSEL            sf:1 else_inv:1 011010100 rm:5 cond:4 0 else_inc:1 rn:5 rd:5
 +
  # Data Processing (3-source)
  &rrrr           rd rn rm ra
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
      return true;
  }
- static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+-/* Conditional select
--                                     unsigned int target_el)
+- *   31   30  29  28             21 20  16 15  12 11 10 9    5 4    0
-+                                     unsigned int target_el,
+- * +----+----+---+-----------------+------+------+-----+------+------+
-+                                     unsigned int cur_el, bool secure,
+- * | sf | op | S | 1 1 0 1 0 1 0 0 |  Rm  | cond | op2 |  Rn  |  Rd  |
-+                                     uint64_t hcr_el2)
+- * +----+----+---+-----------------+------+------+-----+------+------+
 - */
 -static void disas_cond_select(DisasContext *s, uint32_t insn)
 +static bool trans_CSEL(DisasContext *s, arg_CSEL *a)
  {
-     CPUARMState *env = cs->env_ptr;
+-    unsigned int sf, else_inv, rm, cond, else_inc, rn, rd;
--    unsigned int cur_el = arm_current_el(env);
+-    TCGv_i64 tcg_rd, zero;
--    bool secure = arm_is_secure(env);
++    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
-     bool pstate_unmasked;
++    TCGv_i64 zero = tcg_constant_i64(0);
-     int8_t unmasked = 0;
+     DisasCompare64 c;
--    uint64_t hcr_el2;
+-    if (extract32(insn, 29, 1) || extract32(insn, 11, 1)) {
-     /*
+-        /* S == 1 or op2<1> == 1 */
-      * Don't take exceptions if they target a lower EL.
+-        unallocated_encoding(s);
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+-        return;
-         return false;
+-    }
 -    sf = extract32(insn, 31, 1);
 -    else_inv = extract32(insn, 30, 1);
 -    rm = extract32(insn, 16, 5);
 -    cond = extract32(insn, 12, 4);
 -    else_inc = extract32(insn, 10, 1);
 -    rn = extract32(insn, 5, 5);
 -    rd = extract32(insn, 0, 5);
 +    a64_test_cc(&c, a->cond);
 -    tcg_rd = cpu_reg(s, rd);
 -
 -    a64_test_cc(&c, cond);
 -    zero = tcg_constant_i64(0);
 -
 -    if (rn == 31 && rm == 31 && (else_inc ^ else_inv)) {
 +    if (a->rn == 31 && a->rm == 31 && (a->else_inc ^ a->else_inv)) {
          /* CSET & CSETM.  */
 -        if (else_inv) {
 +        if (a->else_inv) {
              tcg_gen_negsetcond_i64(tcg_invert_cond(c.cond),
                                     tcg_rd, c.value, zero);
          } else {
@@ -XXX,XX +XXX,XX @@ static void disas_cond_select(DisasContext *s, uint32_t insn)
                                  tcg_rd, c.value, zero);
          }
      } else {
 -        TCGv_i64 t_true = cpu_reg(s, rn);
 -        TCGv_i64 t_false = read_cpu_reg(s, rm, 1);
 -        if (else_inv && else_inc) {
 +        TCGv_i64 t_true = cpu_reg(s, a->rn);
 +        TCGv_i64 t_false = read_cpu_reg(s, a->rm, 1);
 +
 +        if (a->else_inv && a->else_inc) {
              tcg_gen_neg_i64(t_false, t_false);
 -        } else if (else_inv) {
 +        } else if (a->else_inv) {
              tcg_gen_not_i64(t_false, t_false);
 -        } else if (else_inc) {
 +        } else if (a->else_inc) {
              tcg_gen_addi_i64(t_false, t_false, 1);
          }
          tcg_gen_movcond_i64(c.cond, tcg_rd, c.value, zero, t_true, t_false);
      }
--    hcr_el2 = arm_hcr_el2_eff(env);
+-    if (!sf) {
 +    if (!a->sf) {
          tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
      }
 -}
 -
-     switch (excp_idx) {
+-/*
-     case EXCP_FIQ:
+- * Data processing - register
-         pstate_unmasked = !(env->daif & PSTATE_F);
+- *  31  30 29  28      25    21  20  16      10         0
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
+- * +--+---+--+---+-------+-----+-------+-------+---------+
-     CPUARMState *env = cs->env_ptr;
+- * |  |op0|  |op1| 1 0 1 | op2 |       |  op3  |         |
-     uint32_t cur_el = arm_current_el(env);
+- * +--+---+--+---+-------+-----+-------+-------+---------+
-     bool secure = arm_is_secure(env);
+- */
-+    uint64_t hcr_el2 = arm_hcr_el2_eff(env);
+-static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
-     uint32_t target_el;
+-{
-     uint32_t excp_idx;
+-    int op1 = extract32(insn, 28, 1);
-     bool ret = false;
+-    int op2 = extract32(insn, 21, 4);
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
+-
-     if (interrupt_request & CPU_INTERRUPT_FIQ) {
+-    if (!op1) {
-         excp_idx = EXCP_FIQ;
+-        goto do_unallocated;
-         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
+-    }
--        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+-
-+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+-    switch (op2) {
-+                              cur_el, secure, hcr_el2)) {
+-    case 0x4: /* Conditional select */
-             cs->exception_index = excp_idx;
+-        disas_cond_select(s, insn);
-             env->exception.target_el = target_el;
+-        break;
-             cc->do_interrupt(cs);
+-
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
+-    default:
-     if (interrupt_request & CPU_INTERRUPT_HARD) {
+-    do_unallocated:
-         excp_idx = EXCP_IRQ;
+-    case 0x0:
-         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
+-    case 0x2: /* Conditional compare */
--        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+-    case 0x6: /* Data-processing */
-+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+-    case 0x8 ... 0xf: /* (3 source) */
-+                              cur_el, secure, hcr_el2)) {
+-        unallocated_encoding(s);
-             cs->exception_index = excp_idx;
+-        break;
-             env->exception.target_el = target_el;
+-    }
-             cc->do_interrupt(cs);
++    return true;
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
+ }
-     if (interrupt_request & CPU_INTERRUPT_VIRQ) {
-         excp_idx = EXCP_VIRQ;
+ static void handle_fp_compare(DisasContext *s, int size,
-         target_el = 1;
+@@ -XXX,XX +XXX,XX @@ static bool btype_destination_ok(uint32_t insn, bool bt, int btype)
--        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+ static void disas_a64_legacy(DisasContext *s, uint32_t insn)
-+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+ {
-+                              cur_el, secure, hcr_el2)) {
+     switch (extract32(insn, 25, 4)) {
-             cs->exception_index = excp_idx;
+-    case 0x5:
-             env->exception.target_el = target_el;
+-    case 0xd:      /* Data processing - register */
-             cc->do_interrupt(cs);
+-        disas_data_proc_reg(s, insn);
-@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
+-        break;
-     if (interrupt_request & CPU_INTERRUPT_VFIQ) {
+     case 0x7:
-         excp_idx = EXCP_VFIQ;
+     case 0xf:      /* Data processing - SIMD and floating point */
-         target_el = 1;
+         disas_data_proc_simd_fp(s, insn);
 -        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
 +        if (arm_excp_unmasked(cs, excp_idx, target_el,
 +                              cur_el, secure, hcr_el2)) {
              cs->exception_index = excp_idx;
              env->exception.target_el = target_el;
              cc->do_interrupt(cs);
 --
-.20.1
+.34.1

-[PULL 06/48] target/arm: Update CNTVCT_EL0 for VHE
+[PULL 20/85] target/arm: Introduce fp_access_check_scalar_hsd
 From: Richard Henderson <richard.henderson@linaro.org>
-The virtual offset may be 0 depending on EL, E2H and TGE.
+Provide a simple way to check for float64, float32,
 and float16 support, as well as the fpu enabled.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-6-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-21-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 40 +++++++++++++++++++++++++++++++++++++---
+ target/arm/tcg/translate-a64.c | 62 ++++++++++++++++++----------------
-file changed, 37 insertions(+), 3 deletions(-)
+file changed, 32 insertions(+), 30 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t gt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
+@@ -XXX,XX +XXX,XX @@ static bool fp_access_check(DisasContext *s)
-     return gt_get_countervalue(env);
+     return true;
  }
-+static uint64_t gt_virt_cnt_offset(CPUARMState *env)
++/*
 + * Return <0 for non-supported element sizes, with MO_16 controlled by
 + * FEAT_FP16; return 0 for fp disabled; otherwise return >0 for success.
 + */
 +static int fp_access_check_scalar_hsd(DisasContext *s, MemOp esz)
 +{
-+    uint64_t hcr;
++    switch (esz) {
-+
++    case MO_64:
-+    switch (arm_current_el(env)) {
++    case MO_32:
-+    case 2:
++        break;
-+        hcr = arm_hcr_el2_eff(env);
++    case MO_16:
-+        if (hcr & HCR_E2H) {
++        if (!dc_isar_feature(aa64_fp16, s)) {
-+            return 0;
++            return -1;
 +        }
 +        break;
-+    case 0:
++    default:
-+        hcr = arm_hcr_el2_eff(env);
++        return -1;
 +        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 +            return 0;
 +        }
 +        break;
 +    }
-+
++    return fp_access_check(s);
 +    return env->cp15.cntvoff_el2;
 +}
 +
- static uint64_t gt_virt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
+ /*
   * Check that SVE access is enabled.  If it is, return true.
   * If not, emit code to generate an appropriate exception and return false.
@@ -XXX,XX +XXX,XX @@ static bool trans_FCSEL(DisasContext *s, arg_FCSEL *a)
  {
--    return gt_get_countervalue(env) - env->cp15.cntvoff_el2;
+     TCGv_i64 t_true, t_false;
-+    return gt_get_countervalue(env) - gt_virt_cnt_offset(env);
+     DisasCompare64 c;
 +    int check = fp_access_check_scalar_hsd(s, a->esz);
 -    switch (a->esz) {
 -    case MO_32:
 -    case MO_64:
 -        break;
 -    case MO_16:
 -        if (!dc_isar_feature(aa64_fp16, s)) {
 -            return false;
 -        }
 -        break;
 -    default:
 -        return false;
 -    }
 -
 -    if (!fp_access_check(s)) {
 -        return true;
 +    if (check <= 0) {
 +        return check == 0;
      }
      /* Zero extend sreg & hreg inputs to 64 bits now.  */
@@ -XXX,XX +XXX,XX @@ TRANS(FMINV_s, do_fp_reduction, a, gen_helper_vfp_mins)
  static bool trans_FMOVI_s(DisasContext *s, arg_FMOVI_s *a)
  {
 -    switch (a->esz) {
 -    case MO_32:
 -    case MO_64:
 -        break;
 -    case MO_16:
 -        if (!dc_isar_feature(aa64_fp16, s)) {
 -            return false;
 -        }
 -        break;
 -    default:
 -        return false;
 -    }
 -    if (fp_access_check(s)) {
 -        uint64_t imm = vfp_expand_imm(a->esz, a->imm);
 -        write_fp_dreg(s, a->rd, tcg_constant_i64(imm));
 +    int check = fp_access_check_scalar_hsd(s, a->esz);
 +    uint64_t imm;
 +
 +    if (check <= 0) {
 +        return check == 0;
      }
 +
 +    imm = vfp_expand_imm(a->esz, a->imm);
 +    write_fp_dreg(s, a->rd, tcg_constant_i64(imm));
      return true;
  }
- static void gt_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
-@@ -XXX,XX +XXX,XX @@ static void gt_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
- static uint64_t gt_tval_read(CPUARMState *env, const ARMCPRegInfo *ri,
-                              int timeridx)
- {
--    uint64_t offset = timeridx == GTIMER_VIRT ? env->cp15.cntvoff_el2 : 0;
-+    uint64_t offset = 0;
-+
-+    switch (timeridx) {
-+    case GTIMER_VIRT:
-+        offset = gt_virt_cnt_offset(env);
-+        break;
-+    }
-     return (uint32_t)(env->cp15.c14_timer[timeridx].cval -
-                       (gt_get_countervalue(env) - offset));
-@@ -XXX,XX +XXX,XX @@ static void gt_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                           int timeridx,
-                           uint64_t value)
- {
--    uint64_t offset = timeridx == GTIMER_VIRT ? env->cp15.cntvoff_el2 : 0;
-+    uint64_t offset = 0;
-+
-+    switch (timeridx) {
-+    case GTIMER_VIRT:
-+        offset = gt_virt_cnt_offset(env);
-+        break;
-+    }
-     trace_arm_gt_tval_write(timeridx, value);
-     env->cp15.c14_timer[timeridx].cval = gt_get_countervalue(env) - offset +
 --
-.20.1
+.34.1

-New patch
+[PULL 21/85] target/arm: Introduce fp_access_check_vector_hsd
+From: Richard Henderson <richard.henderson@linaro.org>
+Provide a simple way to check for float64, float32, and float16
+support vs vector width, as well as the fpu enabled.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-22-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/translate-a64.c | 135 +++++++++++++--------------------
+file changed, 54 insertions(+), 81 deletions(-)
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static int fp_access_check_scalar_hsd(DisasContext *s, MemOp esz)
+     return fp_access_check(s);
+ }
++/* Likewise, but vector MO_64 must have two elements. */
++static int fp_access_check_vector_hsd(DisasContext *s, bool is_q, MemOp esz)
++{
++    switch (esz) {
++    case MO_64:
++        if (!is_q) {
++            return -1;
++        }
++        break;
++    case MO_32:
++        break;
++    case MO_16:
++        if (!dc_isar_feature(aa64_fp16, s)) {
++            return -1;
++        }
++        break;
++    default:
++        return -1;
++    }
++    return fp_access_check(s);
++}
++
+ /*
+  * Check that SVE access is enabled.  If it is, return true.
+  * If not, emit code to generate an appropriate exception and return false.
+@@ -XXX,XX +XXX,XX @@ static bool do_fp3_vector(DisasContext *s, arg_qrrr_e *a, int data,
+                           gen_helper_gvec_3_ptr * const fns[3])
+ {
+     MemOp esz = a->esz;
++    int check = fp_access_check_vector_hsd(s, a->q, esz);
+-    switch (esz) {
+-    case MO_64:
+-        if (!a->q) {
+-            return false;
+-        }
+-        break;
+-    case MO_32:
+-        break;
+-    case MO_16:
+-        if (!dc_isar_feature(aa64_fp16, s)) {
+-            return false;
+-        }
+-        break;
+-    default:
+-        return false;
+-    }
+-    if (fp_access_check(s)) {
+-        gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
+-                          esz == MO_16, data, fns[esz - 1]);
++    if (check <= 0) {
++        return check == 0;
+     }
++
++    gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
++                      esz == MO_16, data, fns[esz - 1]);
+     return true;
+ }
+@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FCADD_270, aa64_fcma, do_fp3_vector, a, 1, f_vector_fcadd)
+ static bool trans_FCMLA_v(DisasContext *s, arg_FCMLA_v *a)
+ {
+-    gen_helper_gvec_4_ptr *fn;
++    static gen_helper_gvec_4_ptr * const fn[] = {
++        [MO_16] = gen_helper_gvec_fcmlah,
++        [MO_32] = gen_helper_gvec_fcmlas,
++        [MO_64] = gen_helper_gvec_fcmlad,
++    };
++    int check;
+     if (!dc_isar_feature(aa64_fcma, s)) {
+         return false;
+     }
+-    switch (a->esz) {
+-    case MO_64:
+-        if (!a->q) {
+-            return false;
+-        }
+-        fn = gen_helper_gvec_fcmlad;
+-        break;
+-    case MO_32:
+-        fn = gen_helper_gvec_fcmlas;
+-        break;
+-    case MO_16:
+-        if (!dc_isar_feature(aa64_fp16, s)) {
+-            return false;
+-        }
+-        fn = gen_helper_gvec_fcmlah;
+-        break;
+-    default:
+-        return false;
+-    }
+-    if (fp_access_check(s)) {
+-        gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
+-                          a->esz == MO_16, a->rot, fn);
++
++    check = fp_access_check_vector_hsd(s, a->q, a->esz);
++    if (check <= 0) {
++        return check == 0;
+     }
++
++    gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
++                      a->esz == MO_16, a->rot, fn[a->esz]);
+     return true;
+ }
+@@ -XXX,XX +XXX,XX @@ static bool do_fp3_vector_idx(DisasContext *s, arg_qrrx_e *a,
+                               gen_helper_gvec_3_ptr * const fns[3])
+ {
+     MemOp esz = a->esz;
++    int check = fp_access_check_vector_hsd(s, a->q, esz);
+-    switch (esz) {
+-    case MO_64:
+-        if (!a->q) {
+-            return false;
+-        }
+-        break;
+-    case MO_32:
+-        break;
+-    case MO_16:
+-        if (!dc_isar_feature(aa64_fp16, s)) {
+-            return false;
+-        }
+-        break;
+-    default:
+-        g_assert_not_reached();
+-    }
+-    if (fp_access_check(s)) {
+-        gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
+-                          esz == MO_16, a->idx, fns[esz - 1]);
++    if (check <= 0) {
++        return check == 0;
+     }
++
++    gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
++                      esz == MO_16, a->idx, fns[esz - 1]);
+     return true;
+ }
+@@ -XXX,XX +XXX,XX @@ static bool do_fmla_vector_idx(DisasContext *s, arg_qrrx_e *a, bool neg)
+         gen_helper_gvec_fmla_idx_d,
+     };
+     MemOp esz = a->esz;
++    int check = fp_access_check_vector_hsd(s, a->q, esz);
+-    switch (esz) {
+-    case MO_64:
+-        if (!a->q) {
+-            return false;
+-        }
+-        break;
+-    case MO_32:
+-        break;
+-    case MO_16:
+-        if (!dc_isar_feature(aa64_fp16, s)) {
+-            return false;
+-        }
+-        break;
+-    default:
+-        g_assert_not_reached();
+-    }
+-    if (fp_access_check(s)) {
+-        gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
+-                          esz == MO_16, (a->idx << 1) | neg,
+-                          fns[esz - 1]);
++    if (check <= 0) {
++        return check == 0;
+     }
++
++    gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
++                      esz == MO_16, (a->idx << 1) | neg,
++                      fns[esz - 1]);
+     return true;
+ }
+--
+.34.1

-[PULL 30/48] target/arm: Add VHE timer register redirection and aliasing
+[PULL 22/85] target/arm: Convert FCMP, FCMPE, FCCMP, FCCMPE to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Apart from the wholesale redirection that HCR_EL2.E2H performs
-for EL2, there's a separate redirection specific to the timers
-that happens for EL0 when running in the EL2&0 regime.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-30-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-23-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 181 +++++++++++++++++++++++++++++++++++++++++---
+ target/arm/tcg/a64.decode      |   8 +
-file changed, 169 insertions(+), 12 deletions(-)
+ target/arm/tcg/translate-a64.c | 283 ++++++++++++---------------------
 files changed, 112 insertions(+), 179 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static void gt_phys_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ FMINV_s         0110 1110 10 11000 01111 10 ..... .....     @rr_q1e2
-     gt_ctl_write(env, ri, GTIMER_PHYS, value);
  FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
 +# Floating-point Compare
 +
 +FCMP            00011110 .. 1 rm:5 001000 rn:5 e:1 z:1 000  esz=%esz_hsd
 +
 +# Floating-point Conditional Compare
 +
 +FCCMP           00011110 .. 1 rm:5 cond:4 01 rn:5 e:1 nzcv:4  esz=%esz_hsd
 +
  # Advanced SIMD Modified Immediate / Shift by Immediate
  %abcdefgh       16:3 5:5
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FMOVI_s(DisasContext *s, arg_FMOVI_s *a)
      return true;
  }
-+static int gt_phys_redir_timeridx(CPUARMState *env)
++/*
 + * Floating point compare, conditional compare
 + */
 +
 +static void handle_fp_compare(DisasContext *s, int size,
 +                              unsigned int rn, unsigned int rm,
 +                              bool cmp_with_zero, bool signal_all_nans)
 +{
-+    switch (arm_mmu_idx(env)) {
++    TCGv_i64 tcg_flags = tcg_temp_new_i64();
-+    case ARMMMUIdx_E20_0:
++    TCGv_ptr fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
-+    case ARMMMUIdx_E20_2:
++
-+        return GTIMER_HYP;
++    if (size == MO_64) {
-+    default:
++        TCGv_i64 tcg_vn, tcg_vm;
-+        return GTIMER_PHYS;
++
-+    }
++        tcg_vn = read_fp_dreg(s, rn);
 +        if (cmp_with_zero) {
 +            tcg_vm = tcg_constant_i64(0);
 +        } else {
 +            tcg_vm = read_fp_dreg(s, rm);
 +        }
 +        if (signal_all_nans) {
 +            gen_helper_vfp_cmped_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 +        } else {
 +            gen_helper_vfp_cmpd_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 +        }
 +    } else {
 +        TCGv_i32 tcg_vn = tcg_temp_new_i32();
 +        TCGv_i32 tcg_vm = tcg_temp_new_i32();
 +
 +        read_vec_element_i32(s, tcg_vn, rn, 0, size);
 +        if (cmp_with_zero) {
 +            tcg_gen_movi_i32(tcg_vm, 0);
 +        } else {
 +            read_vec_element_i32(s, tcg_vm, rm, 0, size);
 +        }
 +
 +        switch (size) {
 +        case MO_32:
 +            if (signal_all_nans) {
 +                gen_helper_vfp_cmpes_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 +            } else {
 +                gen_helper_vfp_cmps_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 +            }
 +            break;
 +        case MO_16:
 +            if (signal_all_nans) {
 +                gen_helper_vfp_cmpeh_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 +            } else {
 +                gen_helper_vfp_cmph_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 +            }
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
 +    }
 +
 +    gen_set_nzcv(tcg_flags);
 +}
 +
-+static int gt_virt_redir_timeridx(CPUARMState *env)
++/* FCMP, FCMPE */
 +static bool trans_FCMP(DisasContext *s, arg_FCMP *a)
 +{
-+    switch (arm_mmu_idx(env)) {
++    int check = fp_access_check_scalar_hsd(s, a->esz);
-+    case ARMMMUIdx_E20_0:
++
-+    case ARMMMUIdx_E20_2:
++    if (check <= 0) {
-+        return GTIMER_HYPVIRT;
++        return check == 0;
-+    default:
++    }
-+        return GTIMER_VIRT;
++
-+    }
++    handle_fp_compare(s, a->esz, a->rn, a->rm, a->z, a->e);
 +    return true;
 +}
 +
-+static uint64_t gt_phys_redir_cval_read(CPUARMState *env,
++/* FCCMP, FCCMPE */
-+                                        const ARMCPRegInfo *ri)
++static bool trans_FCCMP(DisasContext *s, arg_FCCMP *a)
 +{
-+    int timeridx = gt_phys_redir_timeridx(env);
++    TCGLabel *label_continue = NULL;
-+    return env->cp15.c14_timer[timeridx].cval;
++    int check = fp_access_check_scalar_hsd(s, a->esz);
 +
 +    if (check <= 0) {
 +        return check == 0;
 +    }
 +
 +    if (a->cond < 0x0e) { /* not always */
 +        TCGLabel *label_match = gen_new_label();
 +        label_continue = gen_new_label();
 +        arm_gen_test_cc(a->cond, label_match);
 +        /* nomatch: */
 +        gen_set_nzcv(tcg_constant_i64(a->nzcv << 28));
 +        tcg_gen_br(label_continue);
 +        gen_set_label(label_match);
 +    }
 +
 +    handle_fp_compare(s, a->esz, a->rn, a->rm, false, a->e);
 +
 +    if (label_continue) {
 +        gen_set_label(label_continue);
 +    }
 +    return true;
 +}
 +
-+static void gt_phys_redir_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ /*
-+                                     uint64_t value)
+  * Advanced SIMD Modified Immediate
-+{
+  */
-+    int timeridx = gt_phys_redir_timeridx(env);
+@@ -XXX,XX +XXX,XX @@ static bool trans_CSEL(DisasContext *s, arg_CSEL *a)
-+    gt_cval_write(env, ri, timeridx, value);
+     return true;
-+}
+ }
-+
-+static uint64_t gt_phys_redir_tval_read(CPUARMState *env,
+-static void handle_fp_compare(DisasContext *s, int size,
-+                                        const ARMCPRegInfo *ri)
+-                              unsigned int rn, unsigned int rm,
-+{
+-                              bool cmp_with_zero, bool signal_all_nans)
-+    int timeridx = gt_phys_redir_timeridx(env);
+-{
-+    return gt_tval_read(env, ri, timeridx);
+-    TCGv_i64 tcg_flags = tcg_temp_new_i64();
-+}
+-    TCGv_ptr fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
-+
+-
-+static void gt_phys_redir_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-    if (size == MO_64) {
-+                                     uint64_t value)
+-        TCGv_i64 tcg_vn, tcg_vm;
-+{
+-
-+    int timeridx = gt_phys_redir_timeridx(env);
+-        tcg_vn = read_fp_dreg(s, rn);
-+    gt_tval_write(env, ri, timeridx, value);
+-        if (cmp_with_zero) {
-+}
+-            tcg_vm = tcg_constant_i64(0);
-+
+-        } else {
-+static uint64_t gt_phys_redir_ctl_read(CPUARMState *env,
+-            tcg_vm = read_fp_dreg(s, rm);
-+                                       const ARMCPRegInfo *ri)
+-        }
-+{
+-        if (signal_all_nans) {
-+    int timeridx = gt_phys_redir_timeridx(env);
+-            gen_helper_vfp_cmped_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
-+    return env->cp15.c14_timer[timeridx].ctl;
+-        } else {
-+}
+-            gen_helper_vfp_cmpd_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
-+
+-        }
-+static void gt_phys_redir_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-    } else {
-+                                    uint64_t value)
+-        TCGv_i32 tcg_vn = tcg_temp_new_i32();
-+{
+-        TCGv_i32 tcg_vm = tcg_temp_new_i32();
-+    int timeridx = gt_phys_redir_timeridx(env);
+-
-+    gt_ctl_write(env, ri, timeridx, value);
+-        read_vec_element_i32(s, tcg_vn, rn, 0, size);
-+}
+-        if (cmp_with_zero) {
-+
+-            tcg_gen_movi_i32(tcg_vm, 0);
- static void gt_virt_timer_reset(CPUARMState *env, const ARMCPRegInfo *ri)
+-        } else {
 -            read_vec_element_i32(s, tcg_vm, rm, 0, size);
 -        }
 -
 -        switch (size) {
 -        case MO_32:
 -            if (signal_all_nans) {
 -                gen_helper_vfp_cmpes_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 -            } else {
 -                gen_helper_vfp_cmps_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 -            }
 -            break;
 -        case MO_16:
 -            if (signal_all_nans) {
 -                gen_helper_vfp_cmpeh_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 -            } else {
 -                gen_helper_vfp_cmph_a64(tcg_flags, tcg_vn, tcg_vm, fpst);
 -            }
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 -    }
 -
 -    gen_set_nzcv(tcg_flags);
 -}
 -
 -/* Floating point compare
 - *   31  30  29 28       24 23  22  21 20  16 15 14 13  10    9    5 4     0
 - * +---+---+---+-----------+------+---+------+-----+---------+------+-------+
 - * | M | 0 | S | 1 1 1 1 0 | type | 1 |  Rm  | op  | 1 0 0 0 |  Rn  |  op2  |
 - * +---+---+---+-----------+------+---+------+-----+---------+------+-------+
 - */
 -static void disas_fp_compare(DisasContext *s, uint32_t insn)
 -{
 -    unsigned int mos, type, rm, op, rn, opc, op2r;
 -    int size;
 -
 -    mos = extract32(insn, 29, 3);
 -    type = extract32(insn, 22, 2);
 -    rm = extract32(insn, 16, 5);
 -    op = extract32(insn, 14, 2);
 -    rn = extract32(insn, 5, 5);
 -    opc = extract32(insn, 3, 2);
 -    op2r = extract32(insn, 0, 3);
 -
 -    if (mos || op || op2r) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    switch (type) {
 -    case 0:
 -        size = MO_32;
 -        break;
 -    case 1:
 -        size = MO_64;
 -        break;
 -    case 3:
 -        size = MO_16;
 -        if (dc_isar_feature(aa64_fp16, s)) {
 -            break;
 -        }
 -        /* fallthru */
 -    default:
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    if (!fp_access_check(s)) {
 -        return;
 -    }
 -
 -    handle_fp_compare(s, size, rn, rm, opc & 1, opc & 2);
 -}
 -
 -/* Floating point conditional compare
 - *   31  30  29 28       24 23  22  21 20  16 15  12 11 10 9    5  4   3    0
 - * +---+---+---+-----------+------+---+------+------+-----+------+----+------+
 - * | M | 0 | S | 1 1 1 1 0 | type | 1 |  Rm  | cond | 0 1 |  Rn  | op | nzcv |
 - * +---+---+---+-----------+------+---+------+------+-----+------+----+------+
 - */
 -static void disas_fp_ccomp(DisasContext *s, uint32_t insn)
 -{
 -    unsigned int mos, type, rm, cond, rn, op, nzcv;
 -    TCGLabel *label_continue = NULL;
 -    int size;
 -
 -    mos = extract32(insn, 29, 3);
 -    type = extract32(insn, 22, 2);
 -    rm = extract32(insn, 16, 5);
 -    cond = extract32(insn, 12, 4);
 -    rn = extract32(insn, 5, 5);
 -    op = extract32(insn, 4, 1);
 -    nzcv = extract32(insn, 0, 4);
 -
 -    if (mos) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    switch (type) {
 -    case 0:
 -        size = MO_32;
 -        break;
 -    case 1:
 -        size = MO_64;
 -        break;
 -    case 3:
 -        size = MO_16;
 -        if (dc_isar_feature(aa64_fp16, s)) {
 -            break;
 -        }
 -        /* fallthru */
 -    default:
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    if (!fp_access_check(s)) {
 -        return;
 -    }
 -
 -    if (cond < 0x0e) { /* not always */
 -        TCGLabel *label_match = gen_new_label();
 -        label_continue = gen_new_label();
 -        arm_gen_test_cc(cond, label_match);
 -        /* nomatch: */
 -        gen_set_nzcv(tcg_constant_i64(nzcv << 28));
 -        tcg_gen_br(label_continue);
 -        gen_set_label(label_match);
 -    }
 -
 -    handle_fp_compare(s, size, rn, rm, false, op);
 -
 -    if (cond < 0x0e) {
 -        gen_set_label(label_continue);
 -    }
 -}
 -
  /* Floating-point data-processing (1 source) - half precision */
  static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
  {
-     gt_timer_reset(env, ri, GTIMER_VIRT);
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_fp(DisasContext *s, uint32_t insn)
-@@ -XXX,XX +XXX,XX @@ static void gt_cntvoff_write(CPUARMState *env, const ARMCPRegInfo *ri,
+         disas_fp_fixed_conv(s, insn);
-     gt_recalc_timer(cpu, GTIMER_VIRT);
+     } else {
- }
+         switch (extract32(insn, 10, 2)) {
+-        case 1:
-+static uint64_t gt_virt_redir_cval_read(CPUARMState *env,
+-            /* Floating point conditional compare */
-+                                        const ARMCPRegInfo *ri)
+-            disas_fp_ccomp(s, insn);
-+{
+-            break;
-+    int timeridx = gt_virt_redir_timeridx(env);
+-        case 2:
-+    return env->cp15.c14_timer[timeridx].cval;
+-            /* Floating point data-processing (2 source) */
-+}
+-            unallocated_encoding(s); /* in decodetree */
-+
+-            break;
-+static void gt_virt_redir_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-        case 3:
-+                                     uint64_t value)
+-            /* Floating point conditional select */
-+{
++        case 1: /* Floating point conditional compare */
-+    int timeridx = gt_virt_redir_timeridx(env);
++        case 2: /* Floating point data-processing (2 source) */
-+    gt_cval_write(env, ri, timeridx, value);
++        case 3: /* Floating point conditional select */
-+}
+             unallocated_encoding(s); /* in decodetree */
-+
+             break;
-+static uint64_t gt_virt_redir_tval_read(CPUARMState *env,
+         case 0:
-+                                        const ARMCPRegInfo *ri)
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_fp(DisasContext *s, uint32_t insn)
-+{
+                 break;
-+    int timeridx = gt_virt_redir_timeridx(env);
+             case 1: /* [15:12] == xx10 */
-+    return gt_tval_read(env, ri, timeridx);
+                 /* Floating point compare */
-+}
+-                disas_fp_compare(s, insn);
-+
++                unallocated_encoding(s); /* in decodetree */
-+static void gt_virt_redir_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                 break;
-+                                     uint64_t value)
+             case 2: /* [15:12] == x100 */
-+{
+                 /* Floating point data-processing (1 source) */
 +    int timeridx = gt_virt_redir_timeridx(env);
 +    gt_tval_write(env, ri, timeridx, value);
 +}
 +
 +static uint64_t gt_virt_redir_ctl_read(CPUARMState *env,
 +                                       const ARMCPRegInfo *ri)
 +{
 +    int timeridx = gt_virt_redir_timeridx(env);
 +    return env->cp15.c14_timer[timeridx].ctl;
 +}
 +
 +static void gt_virt_redir_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    int timeridx = gt_virt_redir_timeridx(env);
 +    gt_ctl_write(env, ri, timeridx, value);
 +}
 +
  static void gt_hyp_timer_reset(CPUARMState *env, const ARMCPRegInfo *ri)
  {
      gt_timer_reset(env, ri, GTIMER_HYP);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .accessfn = gt_ptimer_access,
        .fieldoffset = offsetoflow32(CPUARMState,
                                     cp15.c14_timer[GTIMER_PHYS].ctl),
 -      .writefn = gt_phys_ctl_write, .raw_writefn = raw_write,
 +      .readfn = gt_phys_redir_ctl_read, .raw_readfn = raw_read,
 +      .writefn = gt_phys_redir_ctl_write, .raw_writefn = raw_write,
      },
      { .name = "CNTP_CTL_S",
        .cp = 15, .crn = 14, .crm = 2, .opc1 = 0, .opc2 = 1,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .accessfn = gt_ptimer_access,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].ctl),
        .resetvalue = 0,
 -      .writefn = gt_phys_ctl_write, .raw_writefn = raw_write,
 +      .readfn = gt_phys_redir_ctl_read, .raw_readfn = raw_read,
 +      .writefn = gt_phys_redir_ctl_write, .raw_writefn = raw_write,
      },
      { .name = "CNTV_CTL", .cp = 15, .crn = 14, .crm = 3, .opc1 = 0, .opc2 = 1,
        .type = ARM_CP_IO | ARM_CP_ALIAS, .access = PL0_RW,
        .accessfn = gt_vtimer_access,
        .fieldoffset = offsetoflow32(CPUARMState,
                                     cp15.c14_timer[GTIMER_VIRT].ctl),
 -      .writefn = gt_virt_ctl_write, .raw_writefn = raw_write,
 +      .readfn = gt_virt_redir_ctl_read, .raw_readfn = raw_read,
 +      .writefn = gt_virt_redir_ctl_write, .raw_writefn = raw_write,
      },
      { .name = "CNTV_CTL_EL0", .state = ARM_CP_STATE_AA64,
        .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 3, .opc2 = 1,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .accessfn = gt_vtimer_access,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].ctl),
        .resetvalue = 0,
 -      .writefn = gt_virt_ctl_write, .raw_writefn = raw_write,
 +      .readfn = gt_virt_redir_ctl_read, .raw_readfn = raw_read,
 +      .writefn = gt_virt_redir_ctl_write, .raw_writefn = raw_write,
      },
      /* TimerValue views: a 32 bit downcounting view of the underlying state */
      { .name = "CNTP_TVAL", .cp = 15, .crn = 14, .crm = 2, .opc1 = 0, .opc2 = 0,
        .secure = ARM_CP_SECSTATE_NS,
        .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
        .accessfn = gt_ptimer_access,
 -      .readfn = gt_phys_tval_read, .writefn = gt_phys_tval_write,
 +      .readfn = gt_phys_redir_tval_read, .writefn = gt_phys_redir_tval_write,
      },
      { .name = "CNTP_TVAL_S",
        .cp = 15, .crn = 14, .crm = 2, .opc1 = 0, .opc2 = 0,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 2, .opc2 = 0,
        .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
        .accessfn = gt_ptimer_access, .resetfn = gt_phys_timer_reset,
 -      .readfn = gt_phys_tval_read, .writefn = gt_phys_tval_write,
 +      .readfn = gt_phys_redir_tval_read, .writefn = gt_phys_redir_tval_write,
      },
      { .name = "CNTV_TVAL", .cp = 15, .crn = 14, .crm = 3, .opc1 = 0, .opc2 = 0,
        .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
        .accessfn = gt_vtimer_access,
 -      .readfn = gt_virt_tval_read, .writefn = gt_virt_tval_write,
 +      .readfn = gt_virt_redir_tval_read, .writefn = gt_virt_redir_tval_write,
      },
      { .name = "CNTV_TVAL_EL0", .state = ARM_CP_STATE_AA64,
        .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 3, .opc2 = 0,
        .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
        .accessfn = gt_vtimer_access, .resetfn = gt_virt_timer_reset,
 -      .readfn = gt_virt_tval_read, .writefn = gt_virt_tval_write,
 +      .readfn = gt_virt_redir_tval_read, .writefn = gt_virt_redir_tval_write,
      },
      /* The counter itself */
      { .name = "CNTPCT", .cp = 15, .crm = 14, .opc1 = 0,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .type = ARM_CP_64BIT | ARM_CP_IO | ARM_CP_ALIAS,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].cval),
        .accessfn = gt_ptimer_access,
 -      .writefn = gt_phys_cval_write, .raw_writefn = raw_write,
 +      .readfn = gt_phys_redir_cval_read, .raw_readfn = raw_read,
 +      .writefn = gt_phys_redir_cval_write, .raw_writefn = raw_write,
      },
      { .name = "CNTP_CVAL_S", .cp = 15, .crm = 14, .opc1 = 2,
        .secure = ARM_CP_SECSTATE_S,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .type = ARM_CP_IO,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].cval),
        .resetvalue = 0, .accessfn = gt_ptimer_access,
 -      .writefn = gt_phys_cval_write, .raw_writefn = raw_write,
 +      .readfn = gt_phys_redir_cval_read, .raw_readfn = raw_read,
 +      .writefn = gt_phys_redir_cval_write, .raw_writefn = raw_write,
      },
      { .name = "CNTV_CVAL", .cp = 15, .crm = 14, .opc1 = 3,
        .access = PL0_RW,
        .type = ARM_CP_64BIT | ARM_CP_IO | ARM_CP_ALIAS,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].cval),
        .accessfn = gt_vtimer_access,
 -      .writefn = gt_virt_cval_write, .raw_writefn = raw_write,
 +      .readfn = gt_virt_redir_cval_read, .raw_readfn = raw_read,
 +      .writefn = gt_virt_redir_cval_write, .raw_writefn = raw_write,
      },
      { .name = "CNTV_CVAL_EL0", .state = ARM_CP_STATE_AA64,
        .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 3, .opc2 = 2,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .type = ARM_CP_IO,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].cval),
        .resetvalue = 0, .accessfn = gt_vtimer_access,
 -      .writefn = gt_virt_cval_write, .raw_writefn = raw_write,
 +      .readfn = gt_virt_redir_cval_read, .raw_readfn = raw_read,
 +      .writefn = gt_virt_redir_cval_write, .raw_writefn = raw_write,
      },
      /* Secure timer -- this is actually restricted to only EL3
       * and configurably Secure-EL1 via the accessfn.
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
      REGINFO_SENTINEL
  };
 +static CPAccessResult e2h_access(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                 bool isread)
 +{
 +    if (!(arm_hcr_el2_eff(env) & HCR_E2H)) {
 +        return CP_ACCESS_TRAP;
 +    }
 +    return CP_ACCESS_OK;
 +}
 +
  #else
  /* In user-mode most of the generic timer registers are inaccessible
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vhe_reginfo[] = {
        .access = PL2_RW,
        .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_HYPVIRT].ctl),
        .writefn = gt_hv_ctl_write, .raw_writefn = raw_write },
 +    { .name = "CNTP_CTL_EL02", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 2, .opc2 = 1,
 +      .type = ARM_CP_IO | ARM_CP_ALIAS,
 +      .access = PL2_RW, .accessfn = e2h_access,
 +      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].ctl),
 +      .writefn = gt_phys_ctl_write, .raw_writefn = raw_write },
 +    { .name = "CNTV_CTL_EL02", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 3, .opc2 = 1,
 +      .type = ARM_CP_IO | ARM_CP_ALIAS,
 +      .access = PL2_RW, .accessfn = e2h_access,
 +      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].ctl),
 +      .writefn = gt_virt_ctl_write, .raw_writefn = raw_write },
 +    { .name = "CNTP_TVAL_EL02", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 2, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW | ARM_CP_IO | ARM_CP_ALIAS,
 +      .access = PL2_RW, .accessfn = e2h_access,
 +      .readfn = gt_phys_tval_read, .writefn = gt_phys_tval_write },
 +    { .name = "CNTV_TVAL_EL02", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 3, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW | ARM_CP_IO | ARM_CP_ALIAS,
 +      .access = PL2_RW, .accessfn = e2h_access,
 +      .readfn = gt_virt_tval_read, .writefn = gt_virt_tval_write },
 +    { .name = "CNTP_CVAL_EL02", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 2, .opc2 = 2,
 +      .type = ARM_CP_IO | ARM_CP_ALIAS,
 +      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].cval),
 +      .access = PL2_RW, .accessfn = e2h_access,
 +      .writefn = gt_phys_cval_write, .raw_writefn = raw_write },
 +    { .name = "CNTV_CVAL_EL02", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 3, .opc2 = 2,
 +      .type = ARM_CP_IO | ARM_CP_ALIAS,
 +      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].cval),
 +      .access = PL2_RW, .accessfn = e2h_access,
 +      .writefn = gt_virt_cval_write, .raw_writefn = raw_write },
  #endif
      REGINFO_SENTINEL
  };
 --
-.20.1
+.34.1

-New patch
+[PULL 23/85] target/arm: Fix decode of fp16 vector fabs, fneg, fsqrt
+From: Richard Henderson <richard.henderson@linaro.org>
+These opcodes are only supported as vector operations,
+not as advsimd scalar.  Set only_in_vector, and remove
+the unreachable implementation of scalar fneg.
+Reported-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20241211163036.2297116-24-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/translate-a64.c | 6 +++---
+file changed, 3 insertions(+), 3 deletions(-)
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+         break;
+     case 0x2f: /* FABS */
+     case 0x6f: /* FNEG */
++        only_in_vector = true;
+         need_fpst = false;
+         break;
+     case 0x7d: /* FRSQRTE */
++        break;
+     case 0x7f: /* FSQRT (vector) */
++        only_in_vector = true;
+         break;
+     default:
+         unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+         case 0x7b: /* FCVTZU */
+             gen_helper_advsimd_f16touinth(tcg_res, tcg_op, tcg_fpstatus);
+             break;
+-        case 0x6f: /* FNEG */
+-            tcg_gen_xori_i32(tcg_res, tcg_op, 0x8000);
+-            break;
+         case 0x7d: /* FRSQRTE */
+             gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
+             break;
+--
+.34.1

-[PULL 21/48] target/arm: Add regime_has_2_ranges
+[PULL 24/85] target/arm: Convert FMOV, FABS, FNEG (scalar) to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Create a predicate to indicate whether the regime has
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 both positive and negative addresses.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-21-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-25-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/internals.h     | 18 ++++++++++++++++++
+ target/arm/tcg/a64.decode      |   7 +++
- target/arm/helper.c        | 23 ++++++-----------------
+ target/arm/tcg/translate-a64.c | 105 +++++++++++++++++++++++----------
- target/arm/translate-a64.c |  3 +--
+files changed, 81 insertions(+), 31 deletions(-)
 files changed, 25 insertions(+), 19 deletions(-)
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/internals.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static inline void arm_call_el_change_hook(ARMCPU *cpu)
+@@ -XXX,XX +XXX,XX @@
-     }
+ @rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
  @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
  @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
 +@rr_hsd         ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_hsd
  @rrr_b          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=0
  @rrr_h          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=1
@@ -XXX,XX +XXX,XX @@ FMAXV_s         0110 1110 00 11000 01111 10 ..... .....     @rr_q1e2
  FMINV_h         0.00 1110 10 11000 01111 10 ..... .....     @qrr_h
  FMINV_s         0110 1110 10 11000 01111 10 ..... .....     @rr_q1e2
 +# Floating-point data processing (1 source)
 +
 +FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
 +FABS_s          00011110 .. 1 000001 10000 ..... .....      @rr_hsd
 +FNEG_s          00011110 .. 1 000010 10000 ..... .....      @rr_hsd
 +
  # Floating-point Immediate
  FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_CSEL(DisasContext *s, arg_CSEL *a)
      return true;
  }
-+/* Return true if this address translation regime has two ranges.  */
++typedef struct FPScalar1Int {
-+static inline bool regime_has_2_ranges(ARMMMUIdx mmu_idx)
++    void (*gen_h)(TCGv_i32, TCGv_i32);
 +    void (*gen_s)(TCGv_i32, TCGv_i32);
 +    void (*gen_d)(TCGv_i64, TCGv_i64);
 +} FPScalar1Int;
 +
 +static bool do_fp1_scalar_int(DisasContext *s, arg_rr_e *a,
 +                              const FPScalar1Int *f)
 +{
-+    switch (mmu_idx) {
++    switch (a->esz) {
-+    case ARMMMUIdx_Stage1_E0:
++    case MO_64:
-+    case ARMMMUIdx_Stage1_E1:
++        if (fp_access_check(s)) {
-+    case ARMMMUIdx_E10_0:
++            TCGv_i64 t = read_fp_dreg(s, a->rn);
-+    case ARMMMUIdx_E10_1:
++            f->gen_d(t, t);
-+    case ARMMMUIdx_E20_0:
++            write_fp_dreg(s, a->rd, t);
-+    case ARMMMUIdx_E20_2:
++        }
-+    case ARMMMUIdx_SE10_0:
++        break;
-+    case ARMMMUIdx_SE10_1:
++    case MO_32:
-+        return true;
++        if (fp_access_check(s)) {
 +            TCGv_i32 t = read_fp_sreg(s, a->rn);
 +            f->gen_s(t, t);
 +            write_fp_sreg(s, a->rd, t);
 +        }
 +        break;
 +    case MO_16:
 +        if (!dc_isar_feature(aa64_fp16, s)) {
 +            return false;
 +        }
 +        if (fp_access_check(s)) {
 +            TCGv_i32 t = read_fp_hreg(s, a->rn);
 +            f->gen_h(t, t);
 +            write_fp_sreg(s, a->rd, t);
 +        }
 +        break;
 +    default:
 +        return false;
 +    }
++    return true;
 +}
 +
- /* Return true if this address translation regime is secure */
++static const FPScalar1Int f_scalar_fmov = {
- static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
++    tcg_gen_mov_i32,
 +    tcg_gen_mov_i32,
 +    tcg_gen_mov_i64,
 +};
 +TRANS(FMOV_s, do_fp1_scalar_int, a, &f_scalar_fmov)
 +
 +static const FPScalar1Int f_scalar_fabs = {
 +    gen_vfp_absh,
 +    gen_vfp_abss,
 +    gen_vfp_absd,
 +};
 +TRANS(FABS_s, do_fp1_scalar_int, a, &f_scalar_fabs)
 +
 +static const FPScalar1Int f_scalar_fneg = {
 +    gen_vfp_negh,
 +    gen_vfp_negs,
 +    gen_vfp_negd,
 +};
 +TRANS(FNEG_s, do_fp1_scalar_int, a, &f_scalar_fneg)
 +
  /* Floating-point data-processing (1 source) - half precision */
  static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
  {
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
-index XXXXXXX..XXXXXXX 100644
+     TCGv_i32 tcg_res = tcg_temp_new_i32();
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
+     switch (opcode) {
-@@ -XXX,XX +XXX,XX @@ static int get_S1prot(CPUARMState *env, ARMMMUIdx mmu_idx, bool is_aa64,
+-    case 0x0: /* FMOV */
-     }
+-        tcg_gen_mov_i32(tcg_res, tcg_op);
+-        break;
-     if (is_aa64) {
+-    case 0x1: /* FABS */
--        switch (regime_el(env, mmu_idx)) {
+-        gen_vfp_absh(tcg_res, tcg_op);
--        case 1:
+-        break;
--            if (!is_user) {
+-    case 0x2: /* FNEG */
--                xn = pxn || (user_rw & PAGE_WRITE);
+-        gen_vfp_negh(tcg_res, tcg_op);
--            }
+-        break;
--            break;
+     case 0x3: /* FSQRT */
--        case 2:
+         fpst = fpstatus_ptr(FPST_FPCR_F16);
--        case 3:
+         gen_helper_sqrt_f16(tcg_res, tcg_op, fpst);
--            break;
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
-+        if (regime_has_2_ranges(mmu_idx) && !is_user) {
+         gen_helper_advsimd_rinth(tcg_res, tcg_op, fpst);
-+            xn = pxn || (user_rw & PAGE_WRITE);
+         break;
      default:
 +    case 0x0: /* FMOV */
 +    case 0x1: /* FABS */
 +    case 0x2: /* FNEG */
          g_assert_not_reached();
      }
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
      tcg_res = tcg_temp_new_i32();
      switch (opcode) {
 -    case 0x0: /* FMOV */
 -        tcg_gen_mov_i32(tcg_res, tcg_op);
 -        goto done;
 -    case 0x1: /* FABS */
 -        gen_vfp_abss(tcg_res, tcg_op);
 -        goto done;
 -    case 0x2: /* FNEG */
 -        gen_vfp_negs(tcg_res, tcg_op);
 -        goto done;
      case 0x3: /* FSQRT */
          gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_env);
          goto done;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
          gen_fpst = gen_helper_frint64_s;
          break;
      default:
 +    case 0x0: /* FMOV */
 +    case 0x1: /* FABS */
 +    case 0x2: /* FNEG */
          g_assert_not_reached();
      }
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
      TCGv_ptr fpst;
      int rmode = -1;
 -    switch (opcode) {
 -    case 0x0: /* FMOV */
 -        gen_gvec_fn2(s, false, rd, rn, tcg_gen_gvec_mov, 0);
 -        return;
 -    }
 -
      tcg_op = read_fp_dreg(s, rn);
      tcg_res = tcg_temp_new_i64();
      switch (opcode) {
 -    case 0x1: /* FABS */
 -        gen_vfp_absd(tcg_res, tcg_op);
 -        goto done;
 -    case 0x2: /* FNEG */
 -        gen_vfp_negd(tcg_res, tcg_op);
 -        goto done;
      case 0x3: /* FSQRT */
          gen_helper_vfp_sqrtd(tcg_res, tcg_op, tcg_env);
          goto done;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
          gen_fpst = gen_helper_frint64_d;
          break;
      default:
 +    case 0x0: /* FMOV */
 +    case 0x1: /* FABS */
 +    case 0x2: /* FNEG */
          g_assert_not_reached();
      }
@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
              goto do_unallocated;
          }
-     } else if (arm_feature(env, ARM_FEATURE_V7)) {
+         /* fall through */
-         switch (regime_el(env, mmu_idx)) {
+-    case 0x0 ... 0x3:
-@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
++    case 0x3:
-                                         ARMMMUIdx mmu_idx)
+     case 0x8 ... 0xc:
- {
+     case 0xe ... 0xf:
-     uint64_t tcr = regime_tcr(env, mmu_idx)->raw_tcr;
+         /* 32-to-32 and 64-to-64 ops */
--    uint32_t el = regime_el(env, mmu_idx);
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
-     bool tbi, tbid, epd, hpd, using16k, using64k;
-     int select, tsz;
+     default:
+     do_unallocated:
-@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
++    case 0x0: /* FMOV */
-      */
++    case 0x1: /* FABS */
-     select = extract64(va, 55, 1);
++    case 0x2: /* FNEG */
+         unallocated_encoding(s);
--    if (el > 1) {
+         break;
-+    if (!regime_has_2_ranges(mmu_idx)) {
+     }
          tsz = extract32(tcr, 0, 6);
          using64k = extract32(tcr, 14, 1);
          using16k = extract32(tcr, 15, 1);
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
          param = aa64_va_parameters(env, address, mmu_idx,
                                     access_type != MMU_INST_FETCH);
          level = 0;
 -        /* If we are in 64-bit EL2 or EL3 then there is no TTBR1, so mark it
 -         * invalid.
 -         */
 -        ttbr1_valid = (el < 2);
 +        ttbr1_valid = regime_has_2_ranges(mmu_idx);
          addrsize = 64 - 8 * param.tbi;
          inputsize = 64 - param.tsz;
      } else {
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
      flags = FIELD_DP32(flags, TBFLAG_ANY, AARCH64_STATE, 1);
 -    /* FIXME: ARMv8.1-VHE S2 translation regime.  */
 -    if (regime_el(env, stage1) < 2) {
 +    /* Get control bits for tagged addresses.  */
 +    if (regime_has_2_ranges(mmu_idx)) {
          ARMVAParameters p1 = aa64_va_parameters_both(env, -1, stage1);
          tbid = (p1.tbi << 1) | p0.tbi;
          tbii = tbid & ~((p1.tbid << 1) | p0.tbid);
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_top_byte_ignore(DisasContext *s, TCGv_i64 dst,
      if (tbi == 0) {
          /* Load unmodified address */
          tcg_gen_mov_i64(dst, src);
 -    } else if (s->current_el >= 2) {
 -        /* FIXME: ARMv8.1-VHE S2 translation regime.  */
 +    } else if (!regime_has_2_ranges(s->mmu_idx)) {
          /* Force tag byte to all zero */
          tcg_gen_extract_i64(dst, src, 0, 56);
      } else {
 --
-.20.1
+.34.1

-[PULL 15/48] target/arm: Rename ARMMMUIdx_S1E2 to ARMMMUIdx_E2
+[PULL 25/85] target/arm: Pass fpstatus to vfp_sqrt*
 From: Richard Henderson <richard.henderson@linaro.org>
-This is part of a reorganization to the set of mmu_idx.
+Pass fpstatus not env, like most other fp helpers.
 The non-secure EL2 regime only has a single stage translation;
 there is no point in pointing out that the idx is for stage1.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-15-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-26-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h       |  4 ++--
+ target/arm/helper.h            |  6 +++---
- target/arm/internals.h |  2 +-
+ target/arm/tcg/translate-a64.c | 15 +++++++--------
- target/arm/helper.c    | 22 +++++++++++-----------
+ target/arm/tcg/translate-vfp.c |  6 +++---
- target/arm/translate.c |  2 +-
+ target/arm/vfp_helper.c        | 12 ++++++------
-files changed, 15 insertions(+), 15 deletions(-)
+files changed, 19 insertions(+), 20 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/helper.h
-+++ b/target/arm/cpu.h
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
- typedef enum ARMMMUIdx {
+ DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
-     ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
+ DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
-     ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
+ DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
--    ARMMMUIdx_S1E2 = 2 | ARM_MMU_IDX_A,
+-DEF_HELPER_2(vfp_sqrth, f16, f16, env)
-+    ARMMMUIdx_E2 = 2 | ARM_MMU_IDX_A,
+-DEF_HELPER_2(vfp_sqrts, f32, f32, env)
-     ARMMMUIdx_SE3 = 3 | ARM_MMU_IDX_A,
+-DEF_HELPER_2(vfp_sqrtd, f64, f64, env)
-     ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
++DEF_HELPER_2(vfp_sqrth, f16, f16, ptr)
-     ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
++DEF_HELPER_2(vfp_sqrts, f32, f32, ptr)
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
++DEF_HELPER_2(vfp_sqrtd, f64, f64, ptr)
- typedef enum ARMMMUIdxBit {
+ DEF_HELPER_3(vfp_cmph, void, f16, f16, env)
-     ARMMMUIdxBit_E10_0 = 1 << 0,
+ DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
-     ARMMMUIdxBit_E10_1 = 1 << 1,
+ DEF_HELPER_3(vfp_cmpd, void, f64, f64, env)
--    ARMMMUIdxBit_S1E2 = 1 << 2,
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 +    ARMMMUIdxBit_E2 = 1 << 2,
      ARMMMUIdxBit_SE3 = 1 << 3,
      ARMMMUIdxBit_SE10_0 = 1 << 4,
      ARMMMUIdxBit_SE10_1 = 1 << 5,
 diff --git a/target/arm/internals.h b/target/arm/internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/internals.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
-     case ARMMMUIdx_E10_1:
-     case ARMMMUIdx_Stage1_E0:
+     switch (opcode) {
-     case ARMMMUIdx_Stage1_E1:
+     case 0x3: /* FSQRT */
--    case ARMMMUIdx_S1E2:
+-        gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_env);
-+    case ARMMMUIdx_E2:
+-        goto done;
-     case ARMMMUIdx_Stage2:
++        gen_fpst = gen_helper_vfp_sqrts;
-     case ARMMMUIdx_MPrivNegPri:
++        break;
-     case ARMMMUIdx_MUserNegPri:
+     case 0x6: /* BFCVT */
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+         gen_fpst = gen_helper_bfcvt;
          break;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
          gen_fpst(tcg_res, tcg_op, fpst);
      }
 - done:
      write_fp_sreg(s, rd, tcg_res);
  }
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
      switch (opcode) {
      case 0x3: /* FSQRT */
 -        gen_helper_vfp_sqrtd(tcg_res, tcg_op, tcg_env);
 -        goto done;
 +        gen_fpst = gen_helper_vfp_sqrtd;
 +        break;
      case 0x8: /* FRINTN */
      case 0x9: /* FRINTP */
      case 0xa: /* FRINTM */
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
          gen_fpst(tcg_res, tcg_op, fpst);
      }
 - done:
      write_fp_dreg(s, rd, tcg_res);
  }
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
          gen_vfp_negd(tcg_rd, tcg_rn);
          break;
      case 0x7f: /* FSQRT */
 -        gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_env);
 +        gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_fpstatus);
          break;
      case 0x1a: /* FCVTNS */
      case 0x1b: /* FCVTMS */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
              handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
              return;
          case 0x7f: /* FSQRT */
 +            need_fpstatus = true;
              if (size == 3 && !is_q) {
                  unallocated_encoding(s);
                  return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                      gen_vfp_negs(tcg_res, tcg_op);
                      break;
                  case 0x7f: /* FSQRT */
 -                    gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_env);
 +                    gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_fpstatus);
                      break;
                  case 0x1a: /* FCVTNS */
                  case 0x1b: /* FCVTMS */
 diff --git a/target/arm/tcg/translate-vfp.c b/target/arm/tcg/translate-vfp.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/translate-vfp.c
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/translate-vfp.c
-@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ DO_VFP_2OP(VNEG, dp, gen_vfp_negd, aa32_fpdp_v2)
  static void gen_VSQRT_hp(TCGv_i32 vd, TCGv_i32 vm)
  {
-     CPUState *cs = env_cpu(env);
+-    gen_helper_vfp_sqrth(vd, vm, tcg_env);
++    gen_helper_vfp_sqrth(vd, vm, fpstatus_ptr(FPST_FPCR_F16));
 -    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_S1E2);
 +    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
  }
- static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ static void gen_VSQRT_sp(TCGv_i32 vd, TCGv_i32 vm)
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
  {
-     CPUState *cs = env_cpu(env);
+-    gen_helper_vfp_sqrts(vd, vm, tcg_env);
++    gen_helper_vfp_sqrts(vd, vm, fpstatus_ptr(FPST_FPCR));
 -    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_S1E2);
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
  }
- static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ static void gen_VSQRT_dp(TCGv_i64 vd, TCGv_i64 vm)
-@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ {
-     CPUState *cs = env_cpu(env);
+-    gen_helper_vfp_sqrtd(vd, vm, tcg_env);
-     uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
++    gen_helper_vfp_sqrtd(vd, vm, fpstatus_ptr(FPST_FPCR));
 -    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S1E2);
 +    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
  }
- static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ DO_VFP_2OP(VSQRT, hp, gen_VSQRT_hp, aa32_fp16_arith)
-@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
-     uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/vfp_helper.c
-     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
++++ b/target/arm/vfp_helper.c
--                                             ARMMMUIdxBit_S1E2);
+@@ -XXX,XX +XXX,XX @@ VFP_BINOP(minnum)
-+                                             ARMMMUIdxBit_E2);
+ VFP_BINOP(maxnum)
  #undef VFP_BINOP
 -dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, CPUARMState *env)
 +dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, void *fpstp)
  {
 -    return float16_sqrt(a, &env->vfp.fp_status_f16);
 +    return float16_sqrt(a, fpstp);
  }
- static const ARMCPRegInfo cp_reginfo[] = {
+-float32 VFP_HELPER(sqrt, s)(float32 a, CPUARMState *env)
-@@ -XXX,XX +XXX,XX @@ static void ats1h_write(CPUARMState *env, const ARMCPRegInfo *ri,
++float32 VFP_HELPER(sqrt, s)(float32 a, void *fpstp)
-     MMUAccessType access_type = ri->opc2 & 1 ? MMU_DATA_STORE : MMU_DATA_LOAD;
+ {
-     uint64_t par64;
+-    return float32_sqrt(a, &env->vfp.fp_status);
++    return float32_sqrt(a, fpstp);
 -    par64 = do_ats_write(env, value, access_type, ARMMMUIdx_S1E2);
 +    par64 = do_ats_write(env, value, access_type, ARMMMUIdx_E2);
      A32_BANKED_CURRENT_REG_SET(env, par, par64);
  }
-@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
-             mmu_idx = secure ? ARMMMUIdx_SE10_1 : ARMMMUIdx_Stage1_E1;
+-float64 VFP_HELPER(sqrt, d)(float64 a, CPUARMState *env)
-             break;
++float64 VFP_HELPER(sqrt, d)(float64 a, void *fpstp)
-         case 4: /* AT S1E2R, AT S1E2W */
+ {
--            mmu_idx = ARMMMUIdx_S1E2;
+-    return float64_sqrt(a, &env->vfp.fp_status);
-+            mmu_idx = ARMMMUIdx_E2;
++    return float64_sqrt(a, fpstp);
              break;
          case 6: /* AT S1E3R, AT S1E3W */
              mmu_idx = ARMMMUIdx_SE3;
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
      ARMCPU *cpu = env_archcpu(env);
      CPUState *cs = CPU(cpu);
 -    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_S1E2);
 +    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
  }
- static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ static void softfloat_to_vfp_compare(CPUARMState *env, FloatRelation cmp)
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
  {
      CPUState *cs = env_cpu(env);
 -    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_S1E2);
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
  }
  static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
      CPUState *cs = CPU(cpu);
      uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S1E2);
 +    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
  }
  static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      uint64_t pageaddr = sextract64(value << 12, 0, 56);
      tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
 -                                             ARMMMUIdxBit_S1E2);
 +                                             ARMMMUIdxBit_E2);
  }
  static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
  {
      switch (mmu_idx) {
      case ARMMMUIdx_Stage2:
 -    case ARMMMUIdx_S1E2:
 +    case ARMMMUIdx_E2:
          return 2;
      case ARMMMUIdx_SE3:
          return 3;
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
       *  otherwise, access as if at PL0.
       */
      switch (s->mmu_idx) {
 -    case ARMMMUIdx_S1E2:        /* this one is UNPREDICTABLE */
 +    case ARMMMUIdx_E2:        /* this one is UNPREDICTABLE */
      case ARMMMUIdx_E10_0:
      case ARMMMUIdx_E10_1:
          return arm_to_core_mmu_idx(ARMMMUIdx_E10_0);
 --
-.20.1
+.34.1

-[PULL 03/48] target/arm: Enable HCR_E2H for VHE
+[PULL 26/85] target/arm: Remove helper_sqrt_f16
 From: Richard Henderson <richard.henderson@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+This function is identical with helper_vfp_sqrth.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Replace all uses.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-3-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-27-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h    | 7 -------
+ target/arm/tcg/helper-a64.h    |  1 -
- target/arm/helper.c | 6 +++++-
+ target/arm/tcg/helper-a64.c    | 11 -----------
-files changed, 5 insertions(+), 8 deletions(-)
+ target/arm/tcg/translate-a64.c |  4 ++--
 files changed, 2 insertions(+), 14 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/helper-a64.h
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/helper-a64.h
-@@ -XXX,XX +XXX,XX @@ static inline void xpsr_write(CPUARMState *env, uint32_t val, uint32_t mask)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(advsimd_rinth_exact, f16, f16, ptr)
- #define HCR_ATA       (1ULL << 56)
+ DEF_HELPER_2(advsimd_rinth, f16, f16, ptr)
- #define HCR_DCT       (1ULL << 57)
+ DEF_HELPER_2(advsimd_f16tosinth, i32, f16, ptr)
  DEF_HELPER_2(advsimd_f16touinth, i32, f16, ptr)
 -DEF_HELPER_2(sqrt_f16, f16, f16, ptr)
  DEF_HELPER_2(exception_return, void, env, i64)
  DEF_HELPER_FLAGS_2(dc_zva, TCG_CALL_NO_WG, void, env, i64)
 diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/helper-a64.c
 +++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ illegal_return:
                    "resuming execution at 0x%" PRIx64 "\n", cur_el, env->pc);
  }
 -/*
-- * When we actually implement ARMv8.1-VHE we should add HCR_E2H to
+- * Square Root and Reciprocal square root
 - * HCR_MASK and then clear it again if the feature bit is not set in
 - * hcr_write().
 - */
--#define HCR_MASK      ((1ULL << 34) - 1)
 -
- #define SCR_NS                (1U << 0)
+-uint32_t HELPER(sqrt_f16)(uint32_t a, void *fpstp)
- #define SCR_IRQ               (1U << 1)
+-{
- #define SCR_FIQ               (1U << 2)
+-    float_status *s = fpstp;
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+-
 -    return float16_sqrt(a, s);
 -}
 -
  void HELPER(dc_zva)(CPUARMState *env, uint64_t vaddr_in)
  {
      uintptr_t ra = GETPC();
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_no_el2_v8_cp_reginfo[] = {
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
- static void hcr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+     switch (opcode) {
- {
+     case 0x3: /* FSQRT */
-     ARMCPU *cpu = env_archcpu(env);
+         fpst = fpstatus_ptr(FPST_FPCR_F16);
--    uint64_t valid_mask = HCR_MASK;
+-        gen_helper_sqrt_f16(tcg_res, tcg_op, fpst);
-+    /* Begin with bits defined in base ARMv8.0.  */
++        gen_helper_vfp_sqrth(tcg_res, tcg_op, fpst);
-+    uint64_t valid_mask = MAKE_64BIT_MASK(0, 34);
+         break;
+     case 0x8: /* FRINTN */
-     if (arm_feature(env, ARM_FEATURE_EL3)) {
+     case 0x9: /* FRINTP */
-         valid_mask &= ~HCR_HCD;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
-@@ -XXX,XX +XXX,XX @@ static void hcr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
-          */
+                 break;
-         valid_mask &= ~HCR_TSC;
+             case 0x7f: /* FSQRT */
-     }
+-                gen_helper_sqrt_f16(tcg_res, tcg_op, tcg_fpstatus);
-+    if (cpu_isar_feature(aa64_vh, cpu)) {
++                gen_helper_vfp_sqrth(tcg_res, tcg_op, tcg_fpstatus);
-+        valid_mask |= HCR_E2H;
+                 break;
-+    }
+             default:
-     if (cpu_isar_feature(aa64_lor, cpu)) {
+                 g_assert_not_reached();
          valid_mask |= HCR_TLOR;
      }
 --
-.20.1
+.34.1

-New patch
+[PULL 27/85] target/arm: Convert FSQRT (scalar) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-28-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  1 +
+ target/arm/tcg/translate-a64.c | 72 ++++++++++++++++++++++++++++------
+files changed, 62 insertions(+), 11 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FMINV_s         0110 1110 10 11000 01111 10 ..... .....     @rr_q1e2
+ FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
+ FABS_s          00011110 .. 1 000001 10000 ..... .....      @rr_hsd
+ FNEG_s          00011110 .. 1 000010 10000 ..... .....      @rr_hsd
++FSQRT_s         00011110 .. 1 000011 10000 ..... .....      @rr_hsd
+ # Floating-point Immediate
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static const FPScalar1Int f_scalar_fneg = {
+ };
+ TRANS(FNEG_s, do_fp1_scalar_int, a, &f_scalar_fneg)
++typedef struct FPScalar1 {
++    void (*gen_h)(TCGv_i32, TCGv_i32, TCGv_ptr);
++    void (*gen_s)(TCGv_i32, TCGv_i32, TCGv_ptr);
++    void (*gen_d)(TCGv_i64, TCGv_i64, TCGv_ptr);
++} FPScalar1;
++
++static bool do_fp1_scalar(DisasContext *s, arg_rr_e *a,
++                          const FPScalar1 *f, int rmode)
++{
++    TCGv_i32 tcg_rmode = NULL;
++    TCGv_ptr fpst;
++    TCGv_i64 t64;
++    TCGv_i32 t32;
++    int check = fp_access_check_scalar_hsd(s, a->esz);
++
++    if (check <= 0) {
++        return check == 0;
++    }
++
++    fpst = fpstatus_ptr(a->esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
++    if (rmode >= 0) {
++        tcg_rmode = gen_set_rmode(rmode, fpst);
++    }
++
++    switch (a->esz) {
++    case MO_64:
++        t64 = read_fp_dreg(s, a->rn);
++        f->gen_d(t64, t64, fpst);
++        write_fp_dreg(s, a->rd, t64);
++        break;
++    case MO_32:
++        t32 = read_fp_sreg(s, a->rn);
++        f->gen_s(t32, t32, fpst);
++        write_fp_sreg(s, a->rd, t32);
++        break;
++    case MO_16:
++        t32 = read_fp_hreg(s, a->rn);
++        f->gen_h(t32, t32, fpst);
++        write_fp_sreg(s, a->rd, t32);
++        break;
++    default:
++        g_assert_not_reached();
++    }
++
++    if (rmode >= 0) {
++        gen_restore_rmode(tcg_rmode, fpst);
++    }
++    return true;
++}
++
++static const FPScalar1 f_scalar_fsqrt = {
++    gen_helper_vfp_sqrth,
++    gen_helper_vfp_sqrts,
++    gen_helper_vfp_sqrtd,
++};
++TRANS(FSQRT_s, do_fp1_scalar, a, &f_scalar_fsqrt, -1)
++
+ /* Floating-point data-processing (1 source) - half precision */
+ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
+ {
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
+     TCGv_i32 tcg_res = tcg_temp_new_i32();
+     switch (opcode) {
+-    case 0x3: /* FSQRT */
+-        fpst = fpstatus_ptr(FPST_FPCR_F16);
+-        gen_helper_vfp_sqrth(tcg_res, tcg_op, fpst);
+-        break;
+     case 0x8: /* FRINTN */
+     case 0x9: /* FRINTP */
+     case 0xa: /* FRINTM */
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
+     case 0x0: /* FMOV */
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
++    case 0x3: /* FSQRT */
+         g_assert_not_reached();
+     }
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+     tcg_res = tcg_temp_new_i32();
+     switch (opcode) {
+-    case 0x3: /* FSQRT */
+-        gen_fpst = gen_helper_vfp_sqrts;
+-        break;
+     case 0x6: /* BFCVT */
+         gen_fpst = gen_helper_bfcvt;
+         break;
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+     case 0x0: /* FMOV */
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
++    case 0x3: /* FSQRT */
+         g_assert_not_reached();
+     }
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
+     tcg_res = tcg_temp_new_i64();
+     switch (opcode) {
+-    case 0x3: /* FSQRT */
+-        gen_fpst = gen_helper_vfp_sqrtd;
+-        break;
+     case 0x8: /* FRINTN */
+     case 0x9: /* FRINTP */
+     case 0xa: /* FRINTM */
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
+     case 0x0: /* FMOV */
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
++    case 0x3: /* FSQRT */
+         g_assert_not_reached();
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+             goto do_unallocated;
+         }
+         /* fall through */
+-    case 0x3:
+     case 0x8 ... 0xc:
+     case 0xe ... 0xf:
+         /* 32-to-32 and 64-to-64 ops */
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+     case 0x0: /* FMOV */
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
++    case 0x3: /* FSQRT */
+         unallocated_encoding(s);
+         break;
+     }
+--
+.34.1

-New patch
+[PULL 28/85] target/arm: Convert FRINT[NPMSAXI] (scalar) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Remove handle_fp_1src_half as these were the last insns
+decoded by that function.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-29-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |   8 +++
+ target/arm/tcg/translate-a64.c | 117 +++++++++++----------------------
+files changed, 46 insertions(+), 79 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FABS_s          00011110 .. 1 000001 10000 ..... .....      @rr_hsd
+ FNEG_s          00011110 .. 1 000010 10000 ..... .....      @rr_hsd
+ FSQRT_s         00011110 .. 1 000011 10000 ..... .....      @rr_hsd
++FRINTN_s        00011110 .. 1 001000 10000 ..... .....      @rr_hsd
++FRINTP_s        00011110 .. 1 001001 10000 ..... .....      @rr_hsd
++FRINTM_s        00011110 .. 1 001010 10000 ..... .....      @rr_hsd
++FRINTZ_s        00011110 .. 1 001011 10000 ..... .....      @rr_hsd
++FRINTA_s        00011110 .. 1 001100 10000 ..... .....      @rr_hsd
++FRINTX_s        00011110 .. 1 001110 10000 ..... .....      @rr_hsd
++FRINTI_s        00011110 .. 1 001111 10000 ..... .....      @rr_hsd
++
+ # Floating-point Immediate
+ FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static const FPScalar1 f_scalar_fsqrt = {
+ };
+ TRANS(FSQRT_s, do_fp1_scalar, a, &f_scalar_fsqrt, -1)
+-/* Floating-point data-processing (1 source) - half precision */
+-static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
+-{
+-    TCGv_ptr fpst = NULL;
+-    TCGv_i32 tcg_op = read_fp_hreg(s, rn);
+-    TCGv_i32 tcg_res = tcg_temp_new_i32();
++static const FPScalar1 f_scalar_frint = {
++    gen_helper_advsimd_rinth,
++    gen_helper_rints,
++    gen_helper_rintd,
++};
++TRANS(FRINTN_s, do_fp1_scalar, a, &f_scalar_frint, FPROUNDING_TIEEVEN)
++TRANS(FRINTP_s, do_fp1_scalar, a, &f_scalar_frint, FPROUNDING_POSINF)
++TRANS(FRINTM_s, do_fp1_scalar, a, &f_scalar_frint, FPROUNDING_NEGINF)
++TRANS(FRINTZ_s, do_fp1_scalar, a, &f_scalar_frint, FPROUNDING_ZERO)
++TRANS(FRINTA_s, do_fp1_scalar, a, &f_scalar_frint, FPROUNDING_TIEAWAY)
++TRANS(FRINTI_s, do_fp1_scalar, a, &f_scalar_frint, -1)
+-    switch (opcode) {
+-    case 0x8: /* FRINTN */
+-    case 0x9: /* FRINTP */
+-    case 0xa: /* FRINTM */
+-    case 0xb: /* FRINTZ */
+-    case 0xc: /* FRINTA */
+-    {
+-        TCGv_i32 tcg_rmode;
+-
+-        fpst = fpstatus_ptr(FPST_FPCR_F16);
+-        tcg_rmode = gen_set_rmode(opcode & 7, fpst);
+-        gen_helper_advsimd_rinth(tcg_res, tcg_op, fpst);
+-        gen_restore_rmode(tcg_rmode, fpst);
+-        break;
+-    }
+-    case 0xe: /* FRINTX */
+-        fpst = fpstatus_ptr(FPST_FPCR_F16);
+-        gen_helper_advsimd_rinth_exact(tcg_res, tcg_op, fpst);
+-        break;
+-    case 0xf: /* FRINTI */
+-        fpst = fpstatus_ptr(FPST_FPCR_F16);
+-        gen_helper_advsimd_rinth(tcg_res, tcg_op, fpst);
+-        break;
+-    default:
+-    case 0x0: /* FMOV */
+-    case 0x1: /* FABS */
+-    case 0x2: /* FNEG */
+-    case 0x3: /* FSQRT */
+-        g_assert_not_reached();
+-    }
+-
+-    write_fp_sreg(s, rd, tcg_res);
+-}
++static const FPScalar1 f_scalar_frintx = {
++    gen_helper_advsimd_rinth_exact,
++    gen_helper_rints_exact,
++    gen_helper_rintd_exact,
++};
++TRANS(FRINTX_s, do_fp1_scalar, a, &f_scalar_frintx, -1)
+ /* Floating-point data-processing (1 source) - single precision */
+ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+     case 0x6: /* BFCVT */
+         gen_fpst = gen_helper_bfcvt;
+         break;
+-    case 0x8: /* FRINTN */
+-    case 0x9: /* FRINTP */
+-    case 0xa: /* FRINTM */
+-    case 0xb: /* FRINTZ */
+-    case 0xc: /* FRINTA */
+-        rmode = opcode & 7;
+-        gen_fpst = gen_helper_rints;
+-        break;
+-    case 0xe: /* FRINTX */
+-        gen_fpst = gen_helper_rints_exact;
+-        break;
+-    case 0xf: /* FRINTI */
+-        gen_fpst = gen_helper_rints;
+-        break;
+     case 0x10: /* FRINT32Z */
+         rmode = FPROUNDING_ZERO;
+         gen_fpst = gen_helper_frint32_s;
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
+     case 0x3: /* FSQRT */
++    case 0x8: /* FRINTN */
++    case 0x9: /* FRINTP */
++    case 0xa: /* FRINTM */
++    case 0xb: /* FRINTZ */
++    case 0xc: /* FRINTA */
++    case 0xe: /* FRINTX */
++    case 0xf: /* FRINTI */
+         g_assert_not_reached();
+     }
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
+     tcg_res = tcg_temp_new_i64();
+     switch (opcode) {
+-    case 0x8: /* FRINTN */
+-    case 0x9: /* FRINTP */
+-    case 0xa: /* FRINTM */
+-    case 0xb: /* FRINTZ */
+-    case 0xc: /* FRINTA */
+-        rmode = opcode & 7;
+-        gen_fpst = gen_helper_rintd;
+-        break;
+-    case 0xe: /* FRINTX */
+-        gen_fpst = gen_helper_rintd_exact;
+-        break;
+-    case 0xf: /* FRINTI */
+-        gen_fpst = gen_helper_rintd;
+-        break;
+     case 0x10: /* FRINT32Z */
+         rmode = FPROUNDING_ZERO;
+         gen_fpst = gen_helper_frint32_d;
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
+     case 0x3: /* FSQRT */
++    case 0x8: /* FRINTN */
++    case 0x9: /* FRINTP */
++    case 0xa: /* FRINTM */
++    case 0xb: /* FRINTZ */
++    case 0xc: /* FRINTA */
++    case 0xe: /* FRINTX */
++    case 0xf: /* FRINTI */
+         g_assert_not_reached();
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+         if (type > 1 || !dc_isar_feature(aa64_frint, s)) {
+             goto do_unallocated;
+         }
+-        /* fall through */
+-    case 0x8 ... 0xc:
+-    case 0xe ... 0xf:
+         /* 32-to-32 and 64-to-64 ops */
+         switch (type) {
+         case 0:
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+             handle_fp_1src_double(s, opcode, rd, rn);
+             break;
+         case 3:
+-            if (!dc_isar_feature(aa64_fp16, s)) {
+-                goto do_unallocated;
+-            }
+-
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_fp_1src_half(s, opcode, rd, rn);
+-            break;
+         default:
+             goto do_unallocated;
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
+     case 0x3: /* FSQRT */
++    case 0x8: /* FRINTN */
++    case 0x9: /* FRINTP */
++    case 0xa: /* FRINTM */
++    case 0xb: /* FRINTZ */
++    case 0xc: /* FRINTA */
++    case 0xe: /* FRINTX */
++    case 0xf: /* FRINTI */
+         unallocated_encoding(s);
+         break;
+     }
+--
+.34.1

-New patch
+[PULL 29/85] target/arm: Convert BFCVT to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-30-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  3 +++
+ target/arm/tcg/translate-a64.c | 26 +++++++-------------------
+files changed, 10 insertions(+), 19 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@
+ &qrrrr_e        q rd rn rm ra esz
+ @rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
++@rr_s           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=2
+ @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
+ @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
+ @rr_hsd         ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_hsd
+@@ -XXX,XX +XXX,XX @@ FRINTA_s        00011110 .. 1 001100 10000 ..... .....      @rr_hsd
+ FRINTX_s        00011110 .. 1 001110 10000 ..... .....      @rr_hsd
+ FRINTI_s        00011110 .. 1 001111 10000 ..... .....      @rr_hsd
++BFCVT_s         00011110 01 1 000110 10000 ..... .....      @rr_s
++
+ # Floating-point Immediate
+ FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static const FPScalar1 f_scalar_frintx = {
+ };
+ TRANS(FRINTX_s, do_fp1_scalar, a, &f_scalar_frintx, -1)
++static const FPScalar1 f_scalar_bfcvt = {
++    .gen_s = gen_helper_bfcvt,
++};
++TRANS_FEAT(BFCVT_s, aa64_bf16, do_fp1_scalar, a, &f_scalar_bfcvt, -1)
++
+ /* Floating-point data-processing (1 source) - single precision */
+ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+ {
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+     tcg_res = tcg_temp_new_i32();
+     switch (opcode) {
+-    case 0x6: /* BFCVT */
+-        gen_fpst = gen_helper_bfcvt;
+-        break;
+     case 0x10: /* FRINT32Z */
+         rmode = FPROUNDING_ZERO;
+         gen_fpst = gen_helper_frint32_s;
+@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
+     case 0x3: /* FSQRT */
++    case 0x6: /* BFCVT */
+     case 0x8: /* FRINTN */
+     case 0x9: /* FRINTP */
+     case 0xa: /* FRINTM */
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+         }
+         break;
+-    case 0x6:
+-        switch (type) {
+-        case 1: /* BFCVT */
+-            if (!dc_isar_feature(aa64_bf16, s)) {
+-                goto do_unallocated;
+-            }
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_fp_1src_single(s, opcode, rd, rn);
+-            break;
+-        default:
+-            goto do_unallocated;
+-        }
+-        break;
+-
+     default:
+     do_unallocated:
+     case 0x0: /* FMOV */
+     case 0x1: /* FABS */
+     case 0x2: /* FNEG */
+     case 0x3: /* FSQRT */
++    case 0x6: /* BFCVT */
+     case 0x8: /* FRINTN */
+     case 0x9: /* FRINTP */
+     case 0xa: /* FRINTM */
+--
+.34.1

-New patch
+[PULL 30/85] target/arm: Convert FRINT{32, 64}[ZX] (scalar) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Remove handle_fp_1src_single and handle_fp_1src_double as
+these were the last insns decoded by those functions.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-31-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |   5 ++
+ target/arm/tcg/translate-a64.c | 146 ++++-----------------------------
+files changed, 22 insertions(+), 129 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FRINTI_s        00011110 .. 1 001111 10000 ..... .....      @rr_hsd
+ BFCVT_s         00011110 01 1 000110 10000 ..... .....      @rr_s
++FRINT32Z_s      00011110 0. 1 010000 10000 ..... .....      @rr_sd
++FRINT32X_s      00011110 0. 1 010001 10000 ..... .....      @rr_sd
++FRINT64Z_s      00011110 0. 1 010010 10000 ..... .....      @rr_sd
++FRINT64X_s      00011110 0. 1 010011 10000 ..... .....      @rr_sd
++
+ # Floating-point Immediate
+ FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static const FPScalar1 f_scalar_bfcvt = {
+ };
+ TRANS_FEAT(BFCVT_s, aa64_bf16, do_fp1_scalar, a, &f_scalar_bfcvt, -1)
+-/* Floating-point data-processing (1 source) - single precision */
+-static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
+-{
+-    void (*gen_fpst)(TCGv_i32, TCGv_i32, TCGv_ptr);
+-    TCGv_i32 tcg_op, tcg_res;
+-    TCGv_ptr fpst;
+-    int rmode = -1;
++static const FPScalar1 f_scalar_frint32 = {
++    NULL,
++    gen_helper_frint32_s,
++    gen_helper_frint32_d,
++};
++TRANS_FEAT(FRINT32Z_s, aa64_frint, do_fp1_scalar, a,
++           &f_scalar_frint32, FPROUNDING_ZERO)
++TRANS_FEAT(FRINT32X_s, aa64_frint, do_fp1_scalar, a, &f_scalar_frint32, -1)
+-    tcg_op = read_fp_sreg(s, rn);
+-    tcg_res = tcg_temp_new_i32();
+-
+-    switch (opcode) {
+-    case 0x10: /* FRINT32Z */
+-        rmode = FPROUNDING_ZERO;
+-        gen_fpst = gen_helper_frint32_s;
+-        break;
+-    case 0x11: /* FRINT32X */
+-        gen_fpst = gen_helper_frint32_s;
+-        break;
+-    case 0x12: /* FRINT64Z */
+-        rmode = FPROUNDING_ZERO;
+-        gen_fpst = gen_helper_frint64_s;
+-        break;
+-    case 0x13: /* FRINT64X */
+-        gen_fpst = gen_helper_frint64_s;
+-        break;
+-    default:
+-    case 0x0: /* FMOV */
+-    case 0x1: /* FABS */
+-    case 0x2: /* FNEG */
+-    case 0x3: /* FSQRT */
+-    case 0x6: /* BFCVT */
+-    case 0x8: /* FRINTN */
+-    case 0x9: /* FRINTP */
+-    case 0xa: /* FRINTM */
+-    case 0xb: /* FRINTZ */
+-    case 0xc: /* FRINTA */
+-    case 0xe: /* FRINTX */
+-    case 0xf: /* FRINTI */
+-        g_assert_not_reached();
+-    }
+-
+-    fpst = fpstatus_ptr(FPST_FPCR);
+-    if (rmode >= 0) {
+-        TCGv_i32 tcg_rmode = gen_set_rmode(rmode, fpst);
+-        gen_fpst(tcg_res, tcg_op, fpst);
+-        gen_restore_rmode(tcg_rmode, fpst);
+-    } else {
+-        gen_fpst(tcg_res, tcg_op, fpst);
+-    }
+-
+-    write_fp_sreg(s, rd, tcg_res);
+-}
+-
+-/* Floating-point data-processing (1 source) - double precision */
+-static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
+-{
+-    void (*gen_fpst)(TCGv_i64, TCGv_i64, TCGv_ptr);
+-    TCGv_i64 tcg_op, tcg_res;
+-    TCGv_ptr fpst;
+-    int rmode = -1;
+-
+-    tcg_op = read_fp_dreg(s, rn);
+-    tcg_res = tcg_temp_new_i64();
+-
+-    switch (opcode) {
+-    case 0x10: /* FRINT32Z */
+-        rmode = FPROUNDING_ZERO;
+-        gen_fpst = gen_helper_frint32_d;
+-        break;
+-    case 0x11: /* FRINT32X */
+-        gen_fpst = gen_helper_frint32_d;
+-        break;
+-    case 0x12: /* FRINT64Z */
+-        rmode = FPROUNDING_ZERO;
+-        gen_fpst = gen_helper_frint64_d;
+-        break;
+-    case 0x13: /* FRINT64X */
+-        gen_fpst = gen_helper_frint64_d;
+-        break;
+-    default:
+-    case 0x0: /* FMOV */
+-    case 0x1: /* FABS */
+-    case 0x2: /* FNEG */
+-    case 0x3: /* FSQRT */
+-    case 0x8: /* FRINTN */
+-    case 0x9: /* FRINTP */
+-    case 0xa: /* FRINTM */
+-    case 0xb: /* FRINTZ */
+-    case 0xc: /* FRINTA */
+-    case 0xe: /* FRINTX */
+-    case 0xf: /* FRINTI */
+-        g_assert_not_reached();
+-    }
+-
+-    fpst = fpstatus_ptr(FPST_FPCR);
+-    if (rmode >= 0) {
+-        TCGv_i32 tcg_rmode = gen_set_rmode(rmode, fpst);
+-        gen_fpst(tcg_res, tcg_op, fpst);
+-        gen_restore_rmode(tcg_rmode, fpst);
+-    } else {
+-        gen_fpst(tcg_res, tcg_op, fpst);
+-    }
+-
+-    write_fp_dreg(s, rd, tcg_res);
+-}
++static const FPScalar1 f_scalar_frint64 = {
++    NULL,
++    gen_helper_frint64_s,
++    gen_helper_frint64_d,
++};
++TRANS_FEAT(FRINT64Z_s, aa64_frint, do_fp1_scalar, a,
++           &f_scalar_frint64, FPROUNDING_ZERO)
++TRANS_FEAT(FRINT64X_s, aa64_frint, do_fp1_scalar, a, &f_scalar_frint64, -1)
+ static void handle_fp_fcvt(DisasContext *s, int opcode,
+                            int rd, int rn, int dtype, int ntype)
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+         break;
+     }
+-    case 0x10 ... 0x13: /* FRINT{32,64}{X,Z} */
+-        if (type > 1 || !dc_isar_feature(aa64_frint, s)) {
+-            goto do_unallocated;
+-        }
+-        /* 32-to-32 and 64-to-64 ops */
+-        switch (type) {
+-        case 0:
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_fp_1src_single(s, opcode, rd, rn);
+-            break;
+-        case 1:
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_fp_1src_double(s, opcode, rd, rn);
+-            break;
+-        case 3:
+-        default:
+-            goto do_unallocated;
+-        }
+-        break;
+-
+     default:
+     do_unallocated:
+     case 0x0: /* FMOV */
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
+     case 0xc: /* FRINTA */
+     case 0xe: /* FRINTX */
+     case 0xf: /* FRINTI */
++    case 0x10 ... 0x13: /* FRINT{32,64}{X,Z} */
+         unallocated_encoding(s);
+         break;
+     }
+--
+.34.1

-[PULL 31/48] target/arm: Flush tlb for ASID changes in EL2&0 translation regime
+[PULL 31/85] target/arm: Convert FCVT (scalar) to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Since we only support a single ASID, flush the tlb when it changes.
+Remove handle_fp_fcvt and disas_fp_1src as these were
 the last insns decoded by those functions.
-Note that TCR_EL2, like TCR_EL1, has the A1 bit that chooses between
-the two TTBR* registers for the location of the ASID.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-31-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-32-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 22 +++++++++++++++-------
+ target/arm/tcg/a64.decode      |   7 ++
-file changed, 15 insertions(+), 7 deletions(-)
+ target/arm/tcg/translate-a64.c | 172 +++++++++++++--------------------
 files changed, 74 insertions(+), 105 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static void vmsa_ttbcr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
+@@ -XXX,XX +XXX,XX @@ FRINT32X_s      00011110 0. 1 010001 10000 ..... .....      @rr_sd
-     tcr->base_mask = 0xffffc000u;
+ FRINT64Z_s      00011110 0. 1 010010 10000 ..... .....      @rr_sd
  FRINT64X_s      00011110 0. 1 010011 10000 ..... .....      @rr_sd
 +FCVT_s_ds       00011110 00 1 000101 10000 ..... .....      @rr
 +FCVT_s_hs       00011110 00 1 000111 10000 ..... .....      @rr
 +FCVT_s_sd       00011110 01 1 000100 10000 ..... .....      @rr
 +FCVT_s_hd       00011110 01 1 000111 10000 ..... .....      @rr
 +FCVT_s_sh       00011110 11 1 000100 10000 ..... .....      @rr
 +FCVT_s_dh       00011110 11 1 000101 10000 ..... .....      @rr
 +
  # Floating-point Immediate
  FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FRINT64Z_s, aa64_frint, do_fp1_scalar, a,
             &f_scalar_frint64, FPROUNDING_ZERO)
  TRANS_FEAT(FRINT64X_s, aa64_frint, do_fp1_scalar, a, &f_scalar_frint64, -1)
 -static void handle_fp_fcvt(DisasContext *s, int opcode,
 -                           int rd, int rn, int dtype, int ntype)
 +static bool trans_FCVT_s_ds(DisasContext *s, arg_rr *a)
  {
 -    switch (ntype) {
 -    case 0x0:
 -    {
 -        TCGv_i32 tcg_rn = read_fp_sreg(s, rn);
 -        if (dtype == 1) {
 -            /* Single to double */
 -            TCGv_i64 tcg_rd = tcg_temp_new_i64();
 -            gen_helper_vfp_fcvtds(tcg_rd, tcg_rn, tcg_env);
 -            write_fp_dreg(s, rd, tcg_rd);
 -        } else {
 -            /* Single to half */
 -            TCGv_i32 tcg_rd = tcg_temp_new_i32();
 -            TCGv_i32 ahp = get_ahp_flag();
 -            TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 +    if (fp_access_check(s)) {
 +        TCGv_i32 tcg_rn = read_fp_sreg(s, a->rn);
 +        TCGv_i64 tcg_rd = tcg_temp_new_i64();
 -            gen_helper_vfp_fcvt_f32_to_f16(tcg_rd, tcg_rn, fpst, ahp);
 -            /* write_fp_sreg is OK here because top half of tcg_rd is zero */
 -            write_fp_sreg(s, rd, tcg_rd);
 -        }
 -        break;
 -    }
 -    case 0x1:
 -    {
 -        TCGv_i64 tcg_rn = read_fp_dreg(s, rn);
 -        TCGv_i32 tcg_rd = tcg_temp_new_i32();
 -        if (dtype == 0) {
 -            /* Double to single */
 -            gen_helper_vfp_fcvtsd(tcg_rd, tcg_rn, tcg_env);
 -        } else {
 -            TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 -            TCGv_i32 ahp = get_ahp_flag();
 -            /* Double to half */
 -            gen_helper_vfp_fcvt_f64_to_f16(tcg_rd, tcg_rn, fpst, ahp);
 -            /* write_fp_sreg is OK here because top half of tcg_rd is zero */
 -        }
 -        write_fp_sreg(s, rd, tcg_rd);
 -        break;
 -    }
 -    case 0x3:
 -    {
 -        TCGv_i32 tcg_rn = read_fp_sreg(s, rn);
 -        TCGv_ptr tcg_fpst = fpstatus_ptr(FPST_FPCR);
 -        TCGv_i32 tcg_ahp = get_ahp_flag();
 -        tcg_gen_ext16u_i32(tcg_rn, tcg_rn);
 -        if (dtype == 0) {
 -            /* Half to single */
 -            TCGv_i32 tcg_rd = tcg_temp_new_i32();
 -            gen_helper_vfp_fcvt_f16_to_f32(tcg_rd, tcg_rn, tcg_fpst, tcg_ahp);
 -            write_fp_sreg(s, rd, tcg_rd);
 -        } else {
 -            /* Half to double */
 -            TCGv_i64 tcg_rd = tcg_temp_new_i64();
 -            gen_helper_vfp_fcvt_f16_to_f64(tcg_rd, tcg_rn, tcg_fpst, tcg_ahp);
 -            write_fp_dreg(s, rd, tcg_rd);
 -        }
 -        break;
 -    }
 -    default:
 -        g_assert_not_reached();
 +        gen_helper_vfp_fcvtds(tcg_rd, tcg_rn, tcg_env);
 +        write_fp_dreg(s, a->rd, tcg_rd);
      }
 +    return true;
  }
--static void vmsa_tcr_el1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-/* Floating point data-processing (1 source)
-+static void vmsa_tcr_el12_write(CPUARMState *env, const ARMCPRegInfo *ri,
+- *   31  30  29 28       24 23  22  21 20    15 14       10 9    5 4    0
-                                uint64_t value)
+- * +---+---+---+-----------+------+---+--------+-----------+------+------+
 - * | M | 0 | S | 1 1 1 1 0 | type | 1 | opcode | 1 0 0 0 0 |  Rn  |  Rd  |
 - * +---+---+---+-----------+------+---+--------+-----------+------+------+
 - */
 -static void disas_fp_1src(DisasContext *s, uint32_t insn)
 +static bool trans_FCVT_s_hs(DisasContext *s, arg_rr *a)
  {
-     ARMCPU *cpu = env_archcpu(env);
+-    int mos = extract32(insn, 29, 3);
-@@ -XXX,XX +XXX,XX @@ static void vmsa_ttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-    int type = extract32(insn, 22, 2);
- static void vmsa_tcr_ttbr_el2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-    int opcode = extract32(insn, 15, 6);
-                                     uint64_t value)
+-    int rn = extract32(insn, 5, 5);
- {
+-    int rd = extract32(insn, 0, 5);
--    /* TODO: There are ASID fields in here with HCR_EL2.E2H */
++    if (fp_access_check(s)) {
-+    /*
++        TCGv_i32 tmp = read_fp_sreg(s, a->rn);
-+     * If we are running with E2&0 regime, then an ASID is active.
++        TCGv_i32 ahp = get_ahp_flag();
-+     * Flush if that might be changing.  Note we're not checking
++        TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-+     * TCR_EL2.A1 to know if this is really the TTBRx_EL2 that
-+     * holds the active ASID, only checking the field that might.
+-    if (mos) {
-+     */
+-        goto do_unallocated;
-+    if (extract64(raw_read(env, ri) ^ value, 48, 16) &&
++        gen_helper_vfp_fcvt_f32_to_f16(tmp, tmp, fpst, ahp);
-+        (arm_hcr_el2_eff(env) & HCR_E2H)) {
++        /* write_fp_sreg is OK here because top half of result is zero */
-+        tlb_flush_by_mmuidx(env_cpu(env),
++        write_fp_sreg(s, a->rd, tmp);
-+                            ARMMMUIdxBit_E20_2 | ARMMMUIdxBit_E20_0);
+     }
 +    return true;
 +}
 -    switch (opcode) {
 -    case 0x4: case 0x5: case 0x7:
 -    {
 -        /* FCVT between half, single and double precision */
 -        int dtype = extract32(opcode, 0, 2);
 -        if (type == 2 || dtype == type) {
 -            goto do_unallocated;
 -        }
 -        if (!fp_access_check(s)) {
 -            return;
 -        }
 +static bool trans_FCVT_s_sd(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rn = read_fp_dreg(s, a->rn);
 +        TCGv_i32 tcg_rd = tcg_temp_new_i32();
 -        handle_fp_fcvt(s, opcode, rd, rn, dtype, type);
 -        break;
 +        gen_helper_vfp_fcvtsd(tcg_rd, tcg_rn, tcg_env);
 +        write_fp_sreg(s, a->rd, tcg_rd);
      }
 +    return true;
 +}
 -    default:
 -    do_unallocated:
 -    case 0x0: /* FMOV */
 -    case 0x1: /* FABS */
 -    case 0x2: /* FNEG */
 -    case 0x3: /* FSQRT */
 -    case 0x6: /* BFCVT */
 -    case 0x8: /* FRINTN */
 -    case 0x9: /* FRINTP */
 -    case 0xa: /* FRINTM */
 -    case 0xb: /* FRINTZ */
 -    case 0xc: /* FRINTA */
 -    case 0xe: /* FRINTX */
 -    case 0xf: /* FRINTI */
 -    case 0x10 ... 0x13: /* FRINT{32,64}{X,Z} */
 -        unallocated_encoding(s);
 -        break;
 +static bool trans_FCVT_s_hd(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rn = read_fp_dreg(s, a->rn);
 +        TCGv_i32 tcg_rd = tcg_temp_new_i32();
 +        TCGv_i32 ahp = get_ahp_flag();
 +        TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 +
 +        gen_helper_vfp_fcvt_f64_to_f16(tcg_rd, tcg_rn, fpst, ahp);
 +        /* write_fp_sreg is OK here because top half of tcg_rd is zero */
 +        write_fp_sreg(s, a->rd, tcg_rd);
      }
 +    return true;
 +}
 +
 +static bool trans_FCVT_s_sh(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i32 tcg_rn = read_fp_hreg(s, a->rn);
 +        TCGv_i32 tcg_rd = tcg_temp_new_i32();
 +        TCGv_ptr tcg_fpst = fpstatus_ptr(FPST_FPCR);
 +        TCGv_i32 tcg_ahp = get_ahp_flag();
 +
 +        gen_helper_vfp_fcvt_f16_to_f32(tcg_rd, tcg_rn, tcg_fpst, tcg_ahp);
 +        write_fp_sreg(s, a->rd, tcg_rd);
 +    }
-     raw_write(env, ri, value);
++    return true;
 +}
 +
 +static bool trans_FCVT_s_dh(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i32 tcg_rn = read_fp_hreg(s, a->rn);
 +        TCGv_i64 tcg_rd = tcg_temp_new_i64();
 +        TCGv_ptr tcg_fpst = fpstatus_ptr(FPST_FPCR);
 +        TCGv_i32 tcg_ahp = get_ahp_flag();
 +
 +        gen_helper_vfp_fcvt_f16_to_f64(tcg_rd, tcg_rn, tcg_fpst, tcg_ahp);
 +        write_fp_dreg(s, a->rd, tcg_rd);
 +    }
 +    return true;
  }
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vmsa_cp_reginfo[] = {
+ /* Handle floating point <=> fixed point conversions. Note that we can
-                              offsetof(CPUARMState, cp15.ttbr1_ns) } },
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_fp(DisasContext *s, uint32_t insn)
-     { .name = "TCR_EL1", .state = ARM_CP_STATE_AA64,
+                 break;
-       .opc0 = 3, .crn = 2, .crm = 0, .opc1 = 0, .opc2 = 2,
+             case 2: /* [15:12] == x100 */
--      .access = PL1_RW, .writefn = vmsa_tcr_el1_write,
+                 /* Floating point data-processing (1 source) */
-+      .access = PL1_RW, .writefn = vmsa_tcr_el12_write,
+-                disas_fp_1src(s, insn);
-       .resetfn = vmsa_ttbcr_reset, .raw_writefn = raw_write,
++                unallocated_encoding(s); /* in decodetree */
-       .fieldoffset = offsetof(CPUARMState, cp15.tcr_el[1]) },
+                 break;
-     { .name = "TTBCR", .cp = 15, .crn = 2, .crm = 0, .opc1 = 0, .opc2 = 2,
+             case 3: /* [15:12] == 1000 */
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
+                 unallocated_encoding(s);
        .resetvalue = 0 },
      { .name = "TCR_EL2", .state = ARM_CP_STATE_BOTH,
        .opc0 = 3, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 2,
 -      .access = PL2_RW,
 -      /* no .writefn needed as this can't cause an ASID change;
 -       * no .raw_writefn or .resetfn needed as we never use mask/base_mask
 -       */
 +      .access = PL2_RW, .writefn = vmsa_tcr_el12_write,
 +      /* no .raw_writefn or .resetfn needed as we never use mask/base_mask */
        .fieldoffset = offsetof(CPUARMState, cp15.tcr_el[2]) },
      { .name = "VTCR", .state = ARM_CP_STATE_AA32,
        .cp = 15, .opc1 = 4, .crn = 2, .crm = 1, .opc2 = 2,
 --
-.20.1
+.34.1

-[PULL 39/48] target/arm: Move arm_excp_unmasked to cpu.c
+[PULL 32/85] target/arm: Convert handle_fpfpcvt to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-This inline function has one user in cpu.c, and need not be exposed
+This includes SCVTF, UCVTF, FCVT{N,P,M,Z,A}{S,U}.
-otherwise.  Code movement only, with fixups for checkpatch.
+Remove disas_fp_fixed_conv as those were the last insns
 decoded by that function.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-39-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-33-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h | 111 -------------------------------------------
+ target/arm/tcg/a64.decode      |  40 ++++
- target/arm/cpu.c | 119 +++++++++++++++++++++++++++++++++++++++++++++++
+ target/arm/tcg/translate-a64.c | 391 ++++++++++++++-------------------
-files changed, 119 insertions(+), 111 deletions(-)
+files changed, 209 insertions(+), 222 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ bool write_cpustate_to_list(ARMCPU *cpu, bool kvm_sync);
+@@ -XXX,XX +XXX,XX @@ FMAXV_s         0110 1110 00 11000 01111 10 ..... .....     @rr_q1e2
- #define ARM_CPUID_TI915T      0x54029152
+ FMINV_h         0.00 1110 10 11000 01111 10 ..... .....     @qrr_h
- #define ARM_CPUID_TI925T      0x54029252
+ FMINV_s         0110 1110 10 11000 01111 10 ..... .....     @rr_q1e2
--static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
++# Conversion between floating-point and fixed-point (general register)
--                                     unsigned int target_el)
++
--{
++&fcvt           rd rn esz sf shift
--    CPUARMState *env = cs->env_ptr;
++%fcvt_shift32   10:5 !function=rsub_32
--    unsigned int cur_el = arm_current_el(env);
++%fcvt_shift64   10:6 !function=rsub_64
--    bool secure = arm_is_secure(env);
++
--    bool pstate_unmasked;
++@fcvt32         0 ....... .. ...... 1..... rn:5 rd:5    \
--    int8_t unmasked = 0;
++                &fcvt sf=0 esz=%esz_hsd shift=%fcvt_shift32
--    uint64_t hcr_el2;
++@fcvt64         1 ....... .. ...... ...... rn:5 rd:5    \
--
++                &fcvt sf=1 esz=%esz_hsd shift=%fcvt_shift64
--    /* Don't take exceptions if they target a lower EL.
++
--     * This check should catch any exceptions that would not be taken but left
++SCVTF_g         . 0011110 .. 000010 ...... ..... .....  @fcvt32
--     * pending.
++SCVTF_g         . 0011110 .. 000010 ...... ..... .....  @fcvt64
--     */
++UCVTF_g         . 0011110 .. 000011 ...... ..... .....  @fcvt32
--    if (cur_el > target_el) {
++UCVTF_g         . 0011110 .. 000011 ...... ..... .....  @fcvt64
--        return false;
++
 +FCVTZS_g        . 0011110 .. 011000 ...... ..... .....  @fcvt32
 +FCVTZS_g        . 0011110 .. 011000 ...... ..... .....  @fcvt64
 +FCVTZU_g        . 0011110 .. 011001 ...... ..... .....  @fcvt32
 +FCVTZU_g        . 0011110 .. 011001 ...... ..... .....  @fcvt64
 +
 +# Conversion between floating-point and integer (general register)
 +
 +@icvt           sf:1 ....... .. ...... ...... rn:5 rd:5 \
 +                &fcvt esz=%esz_hsd shift=0
 +
 +SCVTF_g         . 0011110 .. 100010 000000 ..... .....  @icvt
 +UCVTF_g         . 0011110 .. 100011 000000 ..... .....  @icvt
 +
 +FCVTNS_g        . 0011110 .. 100000 000000 ..... .....  @icvt
 +FCVTNU_g        . 0011110 .. 100001 000000 ..... .....  @icvt
 +FCVTPS_g        . 0011110 .. 101000 000000 ..... .....  @icvt
 +FCVTPU_g        . 0011110 .. 101001 000000 ..... .....  @icvt
 +FCVTMS_g        . 0011110 .. 110000 000000 ..... .....  @icvt
 +FCVTMU_g        . 0011110 .. 110001 000000 ..... .....  @icvt
 +FCVTZS_g        . 0011110 .. 111000 000000 ..... .....  @icvt
 +FCVTZU_g        . 0011110 .. 111001 000000 ..... .....  @icvt
 +FCVTAS_g        . 0011110 .. 100100 000000 ..... .....  @icvt
 +FCVTAU_g        . 0011110 .. 100101 000000 ..... .....  @icvt
 +
  # Floating-point data processing (1 source)
  FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVT_s_dh(DisasContext *s, arg_rr *a)
      return true;
  }
 -/* Handle floating point <=> fixed point conversions. Note that we can
 - * also deal with fp <=> integer conversions as a special case (scale == 64)
 - * OPTME: consider handling that special case specially or at least skipping
 - * the call to scalbn in the helpers for zero shifts.
 - */
 -static void handle_fpfpcvt(DisasContext *s, int rd, int rn, int opcode,
 -                           bool itof, int rmode, int scale, int sf, int type)
 +static bool do_cvtf_scalar(DisasContext *s, MemOp esz, int rd, int shift,
 +                           TCGv_i64 tcg_int, bool is_signed)
  {
 -    bool is_signed = !(opcode & 1);
      TCGv_ptr tcg_fpstatus;
      TCGv_i32 tcg_shift, tcg_single;
      TCGv_i64 tcg_double;
 -    tcg_fpstatus = fpstatus_ptr(type == 3 ? FPST_FPCR_F16 : FPST_FPCR);
 +    tcg_fpstatus = fpstatus_ptr(esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
 +    tcg_shift = tcg_constant_i32(shift);
 -    tcg_shift = tcg_constant_i32(64 - scale);
 -
 -    if (itof) {
 -        TCGv_i64 tcg_int = cpu_reg(s, rn);
 -        if (!sf) {
 -            TCGv_i64 tcg_extend = tcg_temp_new_i64();
 -
 -            if (is_signed) {
 -                tcg_gen_ext32s_i64(tcg_extend, tcg_int);
 -            } else {
 -                tcg_gen_ext32u_i64(tcg_extend, tcg_int);
 -            }
 -
 -            tcg_int = tcg_extend;
 +    switch (esz) {
 +    case MO_64:
 +        tcg_double = tcg_temp_new_i64();
 +        if (is_signed) {
 +            gen_helper_vfp_sqtod(tcg_double, tcg_int, tcg_shift, tcg_fpstatus);
 +        } else {
 +            gen_helper_vfp_uqtod(tcg_double, tcg_int, tcg_shift, tcg_fpstatus);
          }
 +        write_fp_dreg(s, rd, tcg_double);
 +        break;
 -        switch (type) {
 -        case 1: /* float64 */
 -            tcg_double = tcg_temp_new_i64();
 -            if (is_signed) {
 -                gen_helper_vfp_sqtod(tcg_double, tcg_int,
 -                                     tcg_shift, tcg_fpstatus);
 -            } else {
 -                gen_helper_vfp_uqtod(tcg_double, tcg_int,
 -                                     tcg_shift, tcg_fpstatus);
 -            }
 -            write_fp_dreg(s, rd, tcg_double);
 -            break;
 -
 -        case 0: /* float32 */
 -            tcg_single = tcg_temp_new_i32();
 -            if (is_signed) {
 -                gen_helper_vfp_sqtos(tcg_single, tcg_int,
 -                                     tcg_shift, tcg_fpstatus);
 -            } else {
 -                gen_helper_vfp_uqtos(tcg_single, tcg_int,
 -                                     tcg_shift, tcg_fpstatus);
 -            }
 -            write_fp_sreg(s, rd, tcg_single);
 -            break;
 -
 -        case 3: /* float16 */
 -            tcg_single = tcg_temp_new_i32();
 -            if (is_signed) {
 -                gen_helper_vfp_sqtoh(tcg_single, tcg_int,
 -                                     tcg_shift, tcg_fpstatus);
 -            } else {
 -                gen_helper_vfp_uqtoh(tcg_single, tcg_int,
 -                                     tcg_shift, tcg_fpstatus);
 -            }
 -            write_fp_sreg(s, rd, tcg_single);
 -            break;
 -
 -        default:
 -            g_assert_not_reached();
 +    case MO_32:
 +        tcg_single = tcg_temp_new_i32();
 +        if (is_signed) {
 +            gen_helper_vfp_sqtos(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
 +        } else {
 +            gen_helper_vfp_uqtos(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
          }
 -    } else {
 -        TCGv_i64 tcg_int = cpu_reg(s, rd);
 -        TCGv_i32 tcg_rmode;
 +        write_fp_sreg(s, rd, tcg_single);
 +        break;
 -        if (extract32(opcode, 2, 1)) {
 -            /* There are too many rounding modes to all fit into rmode,
 -             * so FCVTA[US] is a special case.
 -             */
 -            rmode = FPROUNDING_TIEAWAY;
 +    case MO_16:
 +        tcg_single = tcg_temp_new_i32();
 +        if (is_signed) {
 +            gen_helper_vfp_sqtoh(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
 +        } else {
 +            gen_helper_vfp_uqtoh(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
          }
 +        write_fp_sreg(s, rd, tcg_single);
 +        break;
 -        tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
 -
 -        switch (type) {
 -        case 1: /* float64 */
 -            tcg_double = read_fp_dreg(s, rn);
 -            if (is_signed) {
 -                if (!sf) {
 -                    gen_helper_vfp_tosld(tcg_int, tcg_double,
 -                                         tcg_shift, tcg_fpstatus);
 -                } else {
 -                    gen_helper_vfp_tosqd(tcg_int, tcg_double,
 -                                         tcg_shift, tcg_fpstatus);
 -                }
 -            } else {
 -                if (!sf) {
 -                    gen_helper_vfp_tould(tcg_int, tcg_double,
 -                                         tcg_shift, tcg_fpstatus);
 -                } else {
 -                    gen_helper_vfp_touqd(tcg_int, tcg_double,
 -                                         tcg_shift, tcg_fpstatus);
 -                }
 -            }
 -            if (!sf) {
 -                tcg_gen_ext32u_i64(tcg_int, tcg_int);
 -            }
 -            break;
 -
 -        case 0: /* float32 */
 -            tcg_single = read_fp_sreg(s, rn);
 -            if (sf) {
 -                if (is_signed) {
 -                    gen_helper_vfp_tosqs(tcg_int, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                } else {
 -                    gen_helper_vfp_touqs(tcg_int, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                }
 -            } else {
 -                TCGv_i32 tcg_dest = tcg_temp_new_i32();
 -                if (is_signed) {
 -                    gen_helper_vfp_tosls(tcg_dest, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                } else {
 -                    gen_helper_vfp_touls(tcg_dest, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                }
 -                tcg_gen_extu_i32_i64(tcg_int, tcg_dest);
 -            }
 -            break;
 -
 -        case 3: /* float16 */
 -            tcg_single = read_fp_sreg(s, rn);
 -            if (sf) {
 -                if (is_signed) {
 -                    gen_helper_vfp_tosqh(tcg_int, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                } else {
 -                    gen_helper_vfp_touqh(tcg_int, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                }
 -            } else {
 -                TCGv_i32 tcg_dest = tcg_temp_new_i32();
 -                if (is_signed) {
 -                    gen_helper_vfp_toslh(tcg_dest, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                } else {
 -                    gen_helper_vfp_toulh(tcg_dest, tcg_single,
 -                                         tcg_shift, tcg_fpstatus);
 -                }
 -                tcg_gen_extu_i32_i64(tcg_int, tcg_dest);
 -            }
 -            break;
 -
 -        default:
 -            g_assert_not_reached();
 -        }
 -
 -        gen_restore_rmode(tcg_rmode, tcg_fpstatus);
 +    default:
 +        g_assert_not_reached();
      }
 +    return true;
  }
 -/* Floating point <-> fixed point conversions
 - *   31   30  29 28       24 23  22  21 20   19 18    16 15   10 9    5 4    0
 - * +----+---+---+-----------+------+---+-------+--------+-------+------+------+
 - * | sf | 0 | S | 1 1 1 1 0 | type | 0 | rmode | opcode | scale |  Rn  |  Rd  |
 - * +----+---+---+-----------+------+---+-------+--------+-------+------+------+
 - */
 -static void disas_fp_fixed_conv(DisasContext *s, uint32_t insn)
 +static bool do_cvtf_g(DisasContext *s, arg_fcvt *a, bool is_signed)
  {
 -    int rd = extract32(insn, 0, 5);
 -    int rn = extract32(insn, 5, 5);
 -    int scale = extract32(insn, 10, 6);
 -    int opcode = extract32(insn, 16, 3);
 -    int rmode = extract32(insn, 19, 2);
 -    int type = extract32(insn, 22, 2);
 -    bool sbit = extract32(insn, 29, 1);
 -    bool sf = extract32(insn, 31, 1);
 -    bool itof;
 +    TCGv_i64 tcg_int;
 +    int check = fp_access_check_scalar_hsd(s, a->esz);
 -    if (sbit || (!sf && scale < 32)) {
 -        unallocated_encoding(s);
 -        return;
 +    if (check <= 0) {
 +        return check == 0;
      }
 -    switch (type) {
 -    case 0: /* float32 */
 -    case 1: /* float64 */
 -        break;
 -    case 3: /* float16 */
 -        if (dc_isar_feature(aa64_fp16, s)) {
 -            break;
 +    if (a->sf) {
 +        tcg_int = cpu_reg(s, a->rn);
 +    } else {
 +        tcg_int = read_cpu_reg(s, a->rn, true);
 +        if (is_signed) {
 +            tcg_gen_ext32s_i64(tcg_int, tcg_int);
 +        } else {
 +            tcg_gen_ext32u_i64(tcg_int, tcg_int);
          }
 -        /* fallthru */
 -    default:
 -        unallocated_encoding(s);
 -        return;
      }
 -
 -    switch ((rmode << 3) | opcode) {
 -    case 0x2: /* SCVTF */
 -    case 0x3: /* UCVTF */
 -        itof = true;
 -        break;
 -    case 0x18: /* FCVTZS */
 -    case 0x19: /* FCVTZU */
 -        itof = false;
 -        break;
 -    default:
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
--    hcr_el2 = arm_hcr_el2_eff(env);
+-    if (!fp_access_check(s)) {
--
+-        return;
 -    switch (excp_idx) {
 -    case EXCP_FIQ:
 -        pstate_unmasked = !(env->daif & PSTATE_F);
 -        break;
 -
 -    case EXCP_IRQ:
 -        pstate_unmasked = !(env->daif & PSTATE_I);
 -        break;
 -
 -    case EXCP_VFIQ:
 -        if (secure || !(hcr_el2 & HCR_FMO) || (hcr_el2 & HCR_TGE)) {
 -            /* VFIQs are only taken when hypervized and non-secure.  */
 -            return false;
 -        }
 -        return !(env->daif & PSTATE_F);
 -    case EXCP_VIRQ:
 -        if (secure || !(hcr_el2 & HCR_IMO) || (hcr_el2 & HCR_TGE)) {
 -            /* VIRQs are only taken when hypervized and non-secure.  */
 -            return false;
 -        }
 -        return !(env->daif & PSTATE_I);
 -    default:
 -        g_assert_not_reached();
 -    }
 -
--    /* Use the target EL, current execution state and SCR/HCR settings to
+-    handle_fpfpcvt(s, rd, rn, opcode, itof, FPROUNDING_ZERO, scale, sf, type);
--     * determine whether the corresponding CPSR bit is used to mask the
++    return do_cvtf_scalar(s, a->esz, a->rd, a->shift, tcg_int, is_signed);
 -     * interrupt.
 -     */
 -    if ((target_el > cur_el) && (target_el != 1)) {
 -        /* Exceptions targeting a higher EL may not be maskable */
 -        if (arm_feature(env, ARM_FEATURE_AARCH64)) {
 -            /* 64-bit masking rules are simple: exceptions to EL3
 -             * can't be masked, and exceptions to EL2 can only be
 -             * masked from Secure state. The HCR and SCR settings
 -             * don't affect the masking logic, only the interrupt routing.
 -             */
 -            if (target_el == 3 || !secure) {
 -                unmasked = 1;
 -            }
 -        } else {
 -            /* The old 32-bit-only environment has a more complicated
 -             * masking setup. HCR and SCR bits not only affect interrupt
 -             * routing but also change the behaviour of masking.
 -             */
 -            bool hcr, scr;
 -
 -            switch (excp_idx) {
 -            case EXCP_FIQ:
 -                /* If FIQs are routed to EL3 or EL2 then there are cases where
 -                 * we override the CPSR.F in determining if the exception is
 -                 * masked or not. If neither of these are set then we fall back
 -                 * to the CPSR.F setting otherwise we further assess the state
 -                 * below.
 -                 */
 -                hcr = hcr_el2 & HCR_FMO;
 -                scr = (env->cp15.scr_el3 & SCR_FIQ);
 -
 -                /* When EL3 is 32-bit, the SCR.FW bit controls whether the
 -                 * CPSR.F bit masks FIQ interrupts when taken in non-secure
 -                 * state. If SCR.FW is set then FIQs can be masked by CPSR.F
 -                 * when non-secure but only when FIQs are only routed to EL3.
 -                 */
 -                scr = scr && !((env->cp15.scr_el3 & SCR_FW) && !hcr);
 -                break;
 -            case EXCP_IRQ:
 -                /* When EL3 execution state is 32-bit, if HCR.IMO is set then
 -                 * we may override the CPSR.I masking when in non-secure state.
 -                 * The SCR.IRQ setting has already been taken into consideration
 -                 * when setting the target EL, so it does not have a further
 -                 * affect here.
 -                 */
 -                hcr = hcr_el2 & HCR_IMO;
 -                scr = false;
 -                break;
 -            default:
 -                g_assert_not_reached();
 -            }
 -
 -            if ((scr || hcr) && !secure) {
 -                unmasked = 1;
 -            }
 -        }
 -    }
 -
 -    /* The PSTATE bits only mask the interrupt if we have not overriden the
 -     * ability above.
 -     */
 -    return unmasked || pstate_unmasked;
 -}
 -
  #define ARM_CPU_TYPE_SUFFIX "-" TYPE_ARM_CPU
  #define ARM_CPU_TYPE_NAME(name) (name ARM_CPU_TYPE_SUFFIX)
  #define CPU_RESOLVING_TYPE TYPE_ARM_CPU
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
      arm_rebuild_hflags(env);
  }
-+static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
++TRANS(SCVTF_g, do_cvtf_g, a, true)
-+                                     unsigned int target_el)
++TRANS(UCVTF_g, do_cvtf_g, a, false)
 +
 +static void do_fcvt_scalar(DisasContext *s, MemOp out, MemOp esz,
 +                           TCGv_i64 tcg_out, int shift, int rn,
 +                           ARMFPRounding rmode)
 +{
-+    CPUARMState *env = cs->env_ptr;
++    TCGv_ptr tcg_fpstatus;
-+    unsigned int cur_el = arm_current_el(env);
++    TCGv_i32 tcg_shift, tcg_rmode, tcg_single;
-+    bool secure = arm_is_secure(env);
++
-+    bool pstate_unmasked;
++    tcg_fpstatus = fpstatus_ptr(esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
-+    int8_t unmasked = 0;
++    tcg_shift = tcg_constant_i32(shift);
-+    uint64_t hcr_el2;
++    tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
 +
-+    /*
++    switch (esz) {
-+     * Don't take exceptions if they target a lower EL.
++    case MO_64:
-+     * This check should catch any exceptions that would not be taken
++        read_vec_element(s, tcg_out, rn, 0, MO_64);
-+     * but left pending.
++        switch (out) {
-+     */
++        case MO_64 | MO_SIGN:
-+    if (cur_el > target_el) {
++            gen_helper_vfp_tosqd(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
-+        return false;
++            break;
-+    }
++        case MO_64:
-+
++            gen_helper_vfp_touqd(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
-+    hcr_el2 = arm_hcr_el2_eff(env);
++            break;
-+
++        case MO_32 | MO_SIGN:
-+    switch (excp_idx) {
++            gen_helper_vfp_tosld(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
-+    case EXCP_FIQ:
++            break;
-+        pstate_unmasked = !(env->daif & PSTATE_F);
++        case MO_32:
 +            gen_helper_vfp_tould(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
 +        break;
 +
-+    case EXCP_IRQ:
++    case MO_32:
-+        pstate_unmasked = !(env->daif & PSTATE_I);
++        tcg_single = read_fp_sreg(s, rn);
 +        switch (out) {
 +        case MO_64 | MO_SIGN:
 +            gen_helper_vfp_tosqs(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
 +            break;
 +        case MO_64:
 +            gen_helper_vfp_touqs(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
 +            break;
 +        case MO_32 | MO_SIGN:
 +            gen_helper_vfp_tosls(tcg_single, tcg_single,
 +                                 tcg_shift, tcg_fpstatus);
 +            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
 +            break;
 +        case MO_32:
 +            gen_helper_vfp_touls(tcg_single, tcg_single,
 +                                 tcg_shift, tcg_fpstatus);
 +            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
 +        break;
 +
-+    case EXCP_VFIQ:
++    case MO_16:
-+        if (secure || !(hcr_el2 & HCR_FMO) || (hcr_el2 & HCR_TGE)) {
++        tcg_single = read_fp_hreg(s, rn);
-+            /* VFIQs are only taken when hypervized and non-secure.  */
++        switch (out) {
-+            return false;
++        case MO_64 | MO_SIGN:
 +            gen_helper_vfp_tosqh(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
 +            break;
 +        case MO_64:
 +            gen_helper_vfp_touqh(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
 +            break;
 +        case MO_32 | MO_SIGN:
 +            gen_helper_vfp_toslh(tcg_single, tcg_single,
 +                                 tcg_shift, tcg_fpstatus);
 +            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
 +            break;
 +        case MO_32:
 +            gen_helper_vfp_toulh(tcg_single, tcg_single,
 +                                 tcg_shift, tcg_fpstatus);
 +            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
-+        return !(env->daif & PSTATE_F);
++        break;
-+    case EXCP_VIRQ:
++
 +        if (secure || !(hcr_el2 & HCR_IMO) || (hcr_el2 & HCR_TGE)) {
 +            /* VIRQs are only taken when hypervized and non-secure.  */
 +            return false;
 +        }
 +        return !(env->daif & PSTATE_I);
 +    default:
 +        g_assert_not_reached();
 +    }
 +
-+    /*
++    gen_restore_rmode(tcg_rmode, tcg_fpstatus);
-+     * Use the target EL, current execution state and SCR/HCR settings to
++}
-+     * determine whether the corresponding CPSR bit is used to mask the
++
-+     * interrupt.
++static bool do_fcvt_g(DisasContext *s, arg_fcvt *a,
-+     */
++                      ARMFPRounding rmode, bool is_signed)
-+    if ((target_el > cur_el) && (target_el != 1)) {
++{
-+        /* Exceptions targeting a higher EL may not be maskable */
++    TCGv_i64 tcg_int;
-+        if (arm_feature(env, ARM_FEATURE_AARCH64)) {
++    int check = fp_access_check_scalar_hsd(s, a->esz);
-+            /*
++
-+             * 64-bit masking rules are simple: exceptions to EL3
++    if (check <= 0) {
-+             * can't be masked, and exceptions to EL2 can only be
++        return check == 0;
 +             * masked from Secure state. The HCR and SCR settings
 +             * don't affect the masking logic, only the interrupt routing.
 +             */
 +            if (target_el == 3 || !secure) {
 +                unmasked = 1;
 +            }
 +        } else {
 +            /*
 +             * The old 32-bit-only environment has a more complicated
 +             * masking setup. HCR and SCR bits not only affect interrupt
 +             * routing but also change the behaviour of masking.
 +             */
 +            bool hcr, scr;
 +
 +            switch (excp_idx) {
 +            case EXCP_FIQ:
 +                /*
 +                 * If FIQs are routed to EL3 or EL2 then there are cases where
 +                 * we override the CPSR.F in determining if the exception is
 +                 * masked or not. If neither of these are set then we fall back
 +                 * to the CPSR.F setting otherwise we further assess the state
 +                 * below.
 +                 */
 +                hcr = hcr_el2 & HCR_FMO;
 +                scr = (env->cp15.scr_el3 & SCR_FIQ);
 +
 +                /*
 +                 * When EL3 is 32-bit, the SCR.FW bit controls whether the
 +                 * CPSR.F bit masks FIQ interrupts when taken in non-secure
 +                 * state. If SCR.FW is set then FIQs can be masked by CPSR.F
 +                 * when non-secure but only when FIQs are only routed to EL3.
 +                 */
 +                scr = scr && !((env->cp15.scr_el3 & SCR_FW) && !hcr);
 +                break;
 +            case EXCP_IRQ:
 +                /*
 +                 * When EL3 execution state is 32-bit, if HCR.IMO is set then
 +                 * we may override the CPSR.I masking when in non-secure state.
 +                 * The SCR.IRQ setting has already been taken into consideration
 +                 * when setting the target EL, so it does not have a further
 +                 * affect here.
 +                 */
 +                hcr = hcr_el2 & HCR_IMO;
 +                scr = false;
 +                break;
 +            default:
 +                g_assert_not_reached();
 +            }
 +
 +            if ((scr || hcr) && !secure) {
 +                unmasked = 1;
 +            }
 +        }
 +    }
 +
-+    /*
++    tcg_int = cpu_reg(s, a->rd);
-+     * The PSTATE bits only mask the interrupt if we have not overriden the
++    do_fcvt_scalar(s, (a->sf ? MO_64 : MO_32) | (is_signed ? MO_SIGN : 0),
-+     * ability above.
++                   a->esz, tcg_int, a->shift, a->rn, rmode);
-+     */
++
-+    return unmasked || pstate_unmasked;
++    if (!a->sf) {
 +        tcg_gen_ext32u_i64(tcg_int, tcg_int);
 +    }
 +    return true;
 +}
 +
- bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
++TRANS(FCVTNS_g, do_fcvt_g, a, FPROUNDING_TIEEVEN, true)
 +TRANS(FCVTNU_g, do_fcvt_g, a, FPROUNDING_TIEEVEN, false)
 +TRANS(FCVTPS_g, do_fcvt_g, a, FPROUNDING_POSINF, true)
 +TRANS(FCVTPU_g, do_fcvt_g, a, FPROUNDING_POSINF, false)
 +TRANS(FCVTMS_g, do_fcvt_g, a, FPROUNDING_NEGINF, true)
 +TRANS(FCVTMU_g, do_fcvt_g, a, FPROUNDING_NEGINF, false)
 +TRANS(FCVTZS_g, do_fcvt_g, a, FPROUNDING_ZERO, true)
 +TRANS(FCVTZU_g, do_fcvt_g, a, FPROUNDING_ZERO, false)
 +TRANS(FCVTAS_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, true)
 +TRANS(FCVTAU_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, false)
 +
  static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
  {
-     CPUClass *cc = CPU_GET_CLASS(cs);
+     /* FMOV: gpr to or from float, double, or top half of quad fp reg,
@@ -XXX,XX +XXX,XX @@ static void disas_fp_int_conv(DisasContext *s, uint32_t insn)
      switch (opcode) {
      case 2: /* SCVTF */
      case 3: /* UCVTF */
 -        itof = true;
 -        /* fallthru */
      case 4: /* FCVTAS */
      case 5: /* FCVTAU */
 -        if (rmode != 0) {
 -            goto do_unallocated;
 -        }
 -        /* fallthru */
      case 0: /* FCVT[NPMZ]S */
      case 1: /* FCVT[NPMZ]U */
 -        switch (type) {
 -        case 0: /* float32 */
 -        case 1: /* float64 */
 -            break;
 -        case 3: /* float16 */
 -            if (!dc_isar_feature(aa64_fp16, s)) {
 -                goto do_unallocated;
 -            }
 -            break;
 -        default:
 -            goto do_unallocated;
 -        }
 -        if (!fp_access_check(s)) {
 -            return;
 -        }
 -        handle_fpfpcvt(s, rd, rn, opcode, itof, rmode, 64, sf, type);
 -        break;
 +        goto do_unallocated;
      default:
          switch (sf << 7 | type << 5 | rmode << 3 | opcode) {
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_fp(DisasContext *s, uint32_t insn)
          unallocated_encoding(s); /* in decodetree */
      } else if (extract32(insn, 21, 1) == 0) {
          /* Floating point to fixed point conversions */
 -        disas_fp_fixed_conv(s, insn);
 +        unallocated_encoding(s); /* in decodetree */
      } else {
          switch (extract32(insn, 10, 2)) {
          case 1: /* Floating point conditional compare */
 --
-.20.1
+.34.1

-New patch
+[PULL 33/85] target/arm: Convert FJCVTZS to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-34-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  2 ++
+ target/arm/tcg/translate-a64.c | 41 +++++++++++++++++-----------------
+files changed, 22 insertions(+), 21 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FCVTZU_g        . 0011110 .. 111001 000000 ..... .....  @icvt
+ FCVTAS_g        . 0011110 .. 100100 000000 ..... .....  @icvt
+ FCVTAU_g        . 0011110 .. 100101 000000 ..... .....  @icvt
++FJCVTZS         0 0011110 01 111110 000000 ..... .....  @rr
++
+ # Floating-point data processing (1 source)
+ FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ TRANS(FCVTZU_g, do_fcvt_g, a, FPROUNDING_ZERO, false)
+ TRANS(FCVTAS_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, true)
+ TRANS(FCVTAU_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, false)
++static bool trans_FJCVTZS(DisasContext *s, arg_FJCVTZS *a)
++{
++    if (!dc_isar_feature(aa64_jscvt, s)) {
++        return false;
++    }
++    if (fp_access_check(s)) {
++        TCGv_i64 t = read_fp_dreg(s, a->rn);
++        TCGv_ptr fpstatus = fpstatus_ptr(FPST_FPCR);
++
++        gen_helper_fjcvtzs(t, t, fpstatus);
++
++        tcg_gen_ext32u_i64(cpu_reg(s, a->rd), t);
++        tcg_gen_extrh_i64_i32(cpu_ZF, t);
++        tcg_gen_movi_i32(cpu_CF, 0);
++        tcg_gen_movi_i32(cpu_NF, 0);
++        tcg_gen_movi_i32(cpu_VF, 0);
++    }
++    return true;
++}
++
+ static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
+ {
+     /* FMOV: gpr to or from float, double, or top half of quad fp reg,
+@@ -XXX,XX +XXX,XX @@ static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
+     }
+ }
+-static void handle_fjcvtzs(DisasContext *s, int rd, int rn)
+-{
+-    TCGv_i64 t = read_fp_dreg(s, rn);
+-    TCGv_ptr fpstatus = fpstatus_ptr(FPST_FPCR);
+-
+-    gen_helper_fjcvtzs(t, t, fpstatus);
+-
+-    tcg_gen_ext32u_i64(cpu_reg(s, rd), t);
+-    tcg_gen_extrh_i64_i32(cpu_ZF, t);
+-    tcg_gen_movi_i32(cpu_CF, 0);
+-    tcg_gen_movi_i32(cpu_NF, 0);
+-    tcg_gen_movi_i32(cpu_VF, 0);
+-}
+-
+ /* Floating point <-> integer conversions
+  *   31   30  29 28       24 23  22  21 20   19 18 16 15         10 9  5 4  0
+  * +----+---+---+-----------+------+---+-------+-----+-------------+----+----+
+@@ -XXX,XX +XXX,XX @@ static void disas_fp_int_conv(DisasContext *s, uint32_t insn)
+             break;
+         case 0b00111110: /* FJCVTZS */
+-            if (!dc_isar_feature(aa64_jscvt, s)) {
+-                goto do_unallocated;
+-            } else if (fp_access_check(s)) {
+-                handle_fjcvtzs(s, rd, rn);
+-            }
+-            break;
+-
+         default:
+         do_unallocated:
+             unallocated_encoding(s);
+--
+.34.1

-[PULL 14/48] target/arm: Rename ARMMMUIdx*_S1E3 to ARMMMUIdx*_SE3
+[PULL 34/85] target/arm: Convert handle_fmov to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-This is part of a reorganization to the set of mmu_idx.
+Remove disas_fp_int_conv and disas_data_proc_fp as these
-The EL3 regime only has a single stage translation, and
+were the last insns decoded by those functions.
 is always secure.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-14-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-35-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h       |  4 ++--
+ target/arm/tcg/a64.decode      |  14 ++
- target/arm/internals.h |  2 +-
+ target/arm/tcg/translate-a64.c | 232 ++++++++++-----------------------
- target/arm/helper.c    | 14 +++++++-------
+files changed, 86 insertions(+), 160 deletions(-)
  target/arm/translate.c |  2 +-
 files changed, 11 insertions(+), 11 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
+@@ -XXX,XX +XXX,XX @@ FCVTAU_g        . 0011110 .. 100101 000000 ..... .....  @icvt
-     ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
-     ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
+ FJCVTZS         0 0011110 01 111110 000000 ..... .....  @rr
-     ARMMMUIdx_S1E2 = 2 | ARM_MMU_IDX_A,
--    ARMMMUIdx_S1E3 = 3 | ARM_MMU_IDX_A,
++FMOV_ws         0 0011110 00 100110 000000 ..... .....  @rr
-+    ARMMMUIdx_SE3 = 3 | ARM_MMU_IDX_A,
++FMOV_sw         0 0011110 00 100111 000000 ..... .....  @rr
-     ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
++
-     ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
++FMOV_xd         1 0011110 01 100110 000000 ..... .....  @rr
-     ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
++FMOV_dx         1 0011110 01 100111 000000 ..... .....  @rr
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdxBit {
++
-     ARMMMUIdxBit_E10_0 = 1 << 0,
++# Move to/from upper half of 128-bit
-     ARMMMUIdxBit_E10_1 = 1 << 1,
++FMOV_xu         1 0011110 10 101110 000000 ..... .....  @rr
-     ARMMMUIdxBit_S1E2 = 1 << 2,
++FMOV_ux         1 0011110 10 101111 000000 ..... .....  @rr
--    ARMMMUIdxBit_S1E3 = 1 << 3,
++
-+    ARMMMUIdxBit_SE3 = 1 << 3,
++# Half-precision allows both sf=0 and sf=1 with identical results
-     ARMMMUIdxBit_SE10_0 = 1 << 4,
++FMOV_xh         - 0011110 11 100110 000000 ..... .....  @rr
-     ARMMMUIdxBit_SE10_1 = 1 << 5,
++FMOV_hx         - 0011110 11 100111 000000 ..... .....  @rr
-     ARMMMUIdxBit_Stage2 = 1 << 6,
++
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+ # Floating-point data processing (1 source)
  FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/internals.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
+@@ -XXX,XX +XXX,XX @@ static bool trans_FJCVTZS(DisasContext *s, arg_FJCVTZS *a)
-     case ARMMMUIdx_MPriv:
+     return true;
      case ARMMMUIdx_MUser:
          return false;
 -    case ARMMMUIdx_S1E3:
 +    case ARMMMUIdx_SE3:
      case ARMMMUIdx_SE10_0:
      case ARMMMUIdx_SE10_1:
      case ARMMMUIdx_MSPrivNegPri:
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
          /* stage 1 current state PL1: ATS1CPR, ATS1CPW */
          switch (el) {
          case 3:
 -            mmu_idx = ARMMMUIdx_S1E3;
 +            mmu_idx = ARMMMUIdx_SE3;
              break;
          case 2:
              mmu_idx = ARMMMUIdx_Stage1_E1;
@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
              mmu_idx = ARMMMUIdx_S1E2;
              break;
          case 6: /* AT S1E3R, AT S1E3W */
 -            mmu_idx = ARMMMUIdx_S1E3;
 +            mmu_idx = ARMMMUIdx_SE3;
              break;
          default:
              g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
      ARMCPU *cpu = env_archcpu(env);
      CPUState *cs = CPU(cpu);
 -    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_S1E3);
 +    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_SE3);
  }
- static void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++static bool trans_FMOV_hx(DisasContext *s, arg_rr *a)
  {
-     CPUState *cs = env_cpu(env);
+-    /* FMOV: gpr to or from float, double, or top half of quad fp reg,
+-     * without conversion.
--    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_S1E3);
+-     */
-+    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_SE3);
+-
 -    if (itof) {
 -        TCGv_i64 tcg_rn = cpu_reg(s, rn);
 -        TCGv_i64 tmp;
 -
 -        switch (type) {
 -        case 0:
 -            /* 32 bit */
 -            tmp = tcg_temp_new_i64();
 -            tcg_gen_ext32u_i64(tmp, tcg_rn);
 -            write_fp_dreg(s, rd, tmp);
 -            break;
 -        case 1:
 -            /* 64 bit */
 -            write_fp_dreg(s, rd, tcg_rn);
 -            break;
 -        case 2:
 -            /* 64 bit to top half. */
 -            tcg_gen_st_i64(tcg_rn, tcg_env, fp_reg_hi_offset(s, rd));
 -            clear_vec_high(s, true, rd);
 -            break;
 -        case 3:
 -            /* 16 bit */
 -            tmp = tcg_temp_new_i64();
 -            tcg_gen_ext16u_i64(tmp, tcg_rn);
 -            write_fp_dreg(s, rd, tmp);
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 -    } else {
 -        TCGv_i64 tcg_rd = cpu_reg(s, rd);
 -
 -        switch (type) {
 -        case 0:
 -            /* 32 bit */
 -            tcg_gen_ld32u_i64(tcg_rd, tcg_env, fp_reg_offset(s, rn, MO_32));
 -            break;
 -        case 1:
 -            /* 64 bit */
 -            tcg_gen_ld_i64(tcg_rd, tcg_env, fp_reg_offset(s, rn, MO_64));
 -            break;
 -        case 2:
 -            /* 64 bits from top half */
 -            tcg_gen_ld_i64(tcg_rd, tcg_env, fp_reg_hi_offset(s, rn));
 -            break;
 -        case 3:
 -            /* 16 bit */
 -            tcg_gen_ld16u_i64(tcg_rd, tcg_env, fp_reg_offset(s, rn, MO_16));
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 +    if (!dc_isar_feature(aa64_fp16, s)) {
 +        return false;
      }
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rn = cpu_reg(s, a->rn);
 +        TCGv_i64 tmp = tcg_temp_new_i64();
 +        tcg_gen_ext16u_i64(tmp, tcg_rn);
 +        write_fp_dreg(s, a->rd, tmp);
 +    }
 +    return true;
  }
- static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-/* Floating point <-> integer conversions
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
+- *   31   30  29 28       24 23  22  21 20   19 18 16 15         10 9  5 4  0
-     CPUState *cs = CPU(cpu);
+- * +----+---+---+-----------+------+---+-------+-----+-------------+----+----+
-     uint64_t pageaddr = sextract64(value << 12, 0, 56);
+- * | sf | 0 | S | 1 1 1 1 0 | type | 1 | rmode | opc | 0 0 0 0 0 0 | Rn | Rd |
+- * +----+---+---+-----------+------+---+-------+-----+-------------+----+----+
--    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S1E3);
+- */
-+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_SE3);
+-static void disas_fp_int_conv(DisasContext *s, uint32_t insn)
 +static bool trans_FMOV_sw(DisasContext *s, arg_rr *a)
  {
 -    int rd = extract32(insn, 0, 5);
 -    int rn = extract32(insn, 5, 5);
 -    int opcode = extract32(insn, 16, 3);
 -    int rmode = extract32(insn, 19, 2);
 -    int type = extract32(insn, 22, 2);
 -    bool sbit = extract32(insn, 29, 1);
 -    bool sf = extract32(insn, 31, 1);
 -    bool itof = false;
 -
 -    if (sbit) {
 -        goto do_unallocated;
 -    }
 -
 -    switch (opcode) {
 -    case 2: /* SCVTF */
 -    case 3: /* UCVTF */
 -    case 4: /* FCVTAS */
 -    case 5: /* FCVTAU */
 -    case 0: /* FCVT[NPMZ]S */
 -    case 1: /* FCVT[NPMZ]U */
 -        goto do_unallocated;
 -
 -    default:
 -        switch (sf << 7 | type << 5 | rmode << 3 | opcode) {
 -        case 0b01100110: /* FMOV half <-> 32-bit int */
 -        case 0b01100111:
 -        case 0b11100110: /* FMOV half <-> 64-bit int */
 -        case 0b11100111:
 -            if (!dc_isar_feature(aa64_fp16, s)) {
 -                goto do_unallocated;
 -            }
 -            /* fallthru */
 -        case 0b00000110: /* FMOV 32-bit */
 -        case 0b00000111:
 -        case 0b10100110: /* FMOV 64-bit */
 -        case 0b10100111:
 -        case 0b11001110: /* FMOV top half of 128-bit */
 -        case 0b11001111:
 -            if (!fp_access_check(s)) {
 -                return;
 -            }
 -            itof = opcode & 1;
 -            handle_fmov(s, rd, rn, type, itof);
 -            break;
 -
 -        case 0b00111110: /* FJCVTZS */
 -        default:
 -        do_unallocated:
 -            unallocated_encoding(s);
 -            return;
 -        }
 -        break;
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rn = cpu_reg(s, a->rn);
 +        TCGv_i64 tmp = tcg_temp_new_i64();
 +        tcg_gen_ext32u_i64(tmp, tcg_rn);
 +        write_fp_dreg(s, a->rd, tmp);
      }
 +    return true;
  }
- static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-/* FP-specific subcases of table C3-6 (SIMD and FP data processing)
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+- *   31  30  29 28     25 24                          0
-     uint64_t pageaddr = sextract64(value << 12, 0, 56);
+- * +---+---+---+---------+-----------------------------+
+- * |   | 0 |   | 1 1 1 1 |                             |
-     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
+- * +---+---+---+---------+-----------------------------+
--                                             ARMMMUIdxBit_S1E3);
+- */
-+                                             ARMMMUIdxBit_SE3);
+-static void disas_data_proc_fp(DisasContext *s, uint32_t insn)
 +static bool trans_FMOV_dx(DisasContext *s, arg_rr *a)
  {
 -    if (extract32(insn, 24, 1)) {
 -        unallocated_encoding(s); /* in decodetree */
 -    } else if (extract32(insn, 21, 1) == 0) {
 -        /* Floating point to fixed point conversions */
 -        unallocated_encoding(s); /* in decodetree */
 -    } else {
 -        switch (extract32(insn, 10, 2)) {
 -        case 1: /* Floating point conditional compare */
 -        case 2: /* Floating point data-processing (2 source) */
 -        case 3: /* Floating point conditional select */
 -            unallocated_encoding(s); /* in decodetree */
 -            break;
 -        case 0:
 -            switch (ctz32(extract32(insn, 12, 4))) {
 -            case 0: /* [15:12] == xxx1 */
 -                /* Floating point immediate */
 -                unallocated_encoding(s); /* in decodetree */
 -                break;
 -            case 1: /* [15:12] == xx10 */
 -                /* Floating point compare */
 -                unallocated_encoding(s); /* in decodetree */
 -                break;
 -            case 2: /* [15:12] == x100 */
 -                /* Floating point data-processing (1 source) */
 -                unallocated_encoding(s); /* in decodetree */
 -                break;
 -            case 3: /* [15:12] == 1000 */
 -                unallocated_encoding(s);
 -                break;
 -            default: /* [15:12] == 0000 */
 -                /* Floating point <-> integer conversions */
 -                disas_fp_int_conv(s, insn);
 -                break;
 -            }
 -            break;
 -        }
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rn = cpu_reg(s, a->rn);
 +        write_fp_dreg(s, a->rd, tcg_rn);
      }
 +    return true;
 +}
 +
 +static bool trans_FMOV_ux(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rn = cpu_reg(s, a->rn);
 +        tcg_gen_st_i64(tcg_rn, tcg_env, fp_reg_hi_offset(s, a->rd));
 +        clear_vec_high(s, true, a->rd);
 +    }
 +    return true;
 +}
 +
 +static bool trans_FMOV_xh(DisasContext *s, arg_rr *a)
 +{
 +    if (!dc_isar_feature(aa64_fp16, s)) {
 +        return false;
 +    }
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
 +        tcg_gen_ld16u_i64(tcg_rd, tcg_env, fp_reg_offset(s, a->rn, MO_16));
 +    }
 +    return true;
 +}
 +
 +static bool trans_FMOV_ws(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
 +        tcg_gen_ld32u_i64(tcg_rd, tcg_env, fp_reg_offset(s, a->rn, MO_32));
 +    }
 +    return true;
 +}
 +
 +static bool trans_FMOV_xd(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
 +        tcg_gen_ld_i64(tcg_rd, tcg_env, fp_reg_offset(s, a->rn, MO_64));
 +    }
 +    return true;
 +}
 +
 +static bool trans_FMOV_xu(DisasContext *s, arg_rr *a)
 +{
 +    if (fp_access_check(s)) {
 +        TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
 +        tcg_gen_ld_i64(tcg_rd, tcg_env, fp_reg_hi_offset(s, a->rn));
 +    }
 +    return true;
  }
- static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ /* Common vector code for handling integer to FP conversion */
-@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
+@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_simd(DisasContext *s, uint32_t insn)
-     case ARMMMUIdx_Stage2:
+ static void disas_data_proc_simd_fp(DisasContext *s, uint32_t insn)
-     case ARMMMUIdx_S1E2:
+ {
-         return 2;
+     if (extract32(insn, 28, 1) == 1 && extract32(insn, 30, 1) == 0) {
--    case ARMMMUIdx_S1E3:
+-        disas_data_proc_fp(s, insn);
-+    case ARMMMUIdx_SE3:
++        unallocated_encoding(s); /* in decodetree */
-         return 3;
+     } else {
-     case ARMMMUIdx_SE10_0:
+         /* SIMD, including crypto */
-         return arm_el_is_aa64(env, 3) ? 1 : 3;
+         disas_data_proc_simd(s, insn);
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
      case ARMMMUIdx_E10_0:
      case ARMMMUIdx_E10_1:
          return arm_to_core_mmu_idx(ARMMMUIdx_E10_0);
 -    case ARMMMUIdx_S1E3:
 +    case ARMMMUIdx_SE3:
      case ARMMMUIdx_SE10_0:
      case ARMMMUIdx_SE10_1:
          return arm_to_core_mmu_idx(ARMMMUIdx_SE10_0);
 --
-.20.1
+.34.1

-New patch
+[PULL 35/85] target/arm: Convert SQABS, SQNEG to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-36-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  11 +++
+ target/arm/tcg/translate-a64.c | 123 +++++++++++++++++++++------------
+files changed, 89 insertions(+), 45 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@
+ @rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
+ @rr_s           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=2
+ @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
++@rr_e           ........ esz:2 . ..... ...... rn:5 rd:5 &rr_e
+ @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
+ @rr_hsd         ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_hsd
+@@ -XXX,XX +XXX,XX @@ UQRSHRN_si      0111 11110 .... ... 10011 1 ..... .....     @shri_s
+ SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_b
+ SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_h
+ SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_s
++
++# Advanced SIMD scalar two-register miscellaneous
++
++SQABS_s         0101 1110 ..1 00000 01111 0 ..... .....     @rr_e
++SQNEG_s         0111 1110 ..1 00000 01111 0 ..... .....     @rr_e
++
++# Advanced SIMD two-register miscellaneous
++
++SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
++SQNEG_v         0.10 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_FMOV_xu(DisasContext *s, arg_rr *a)
+     return true;
+ }
++typedef struct ENVScalar1 {
++    NeonGenOneOpEnvFn *gen_bhs[3];
++    NeonGenOne64OpEnvFn *gen_d;
++} ENVScalar1;
++
++static bool do_env_scalar1(DisasContext *s, arg_rr_e *a, const ENVScalar1 *f)
++{
++    if (!fp_access_check(s)) {
++        return true;
++    }
++    if (a->esz == MO_64) {
++        TCGv_i64 t = read_fp_dreg(s, a->rn);
++        f->gen_d(t, tcg_env, t);
++        write_fp_dreg(s, a->rd, t);
++    } else {
++        TCGv_i32 t = tcg_temp_new_i32();
++
++        read_vec_element_i32(s, t, a->rn, 0, a->esz);
++        f->gen_bhs[a->esz](t, tcg_env, t);
++        write_fp_sreg(s, a->rd, t);
++    }
++    return true;
++}
++
++static bool do_env_vector1(DisasContext *s, arg_qrr_e *a, const ENVScalar1 *f)
++{
++    if (a->esz == MO_64 && !a->q) {
++        return false;
++    }
++    if (!fp_access_check(s)) {
++        return true;
++    }
++    if (a->esz == MO_64) {
++        TCGv_i64 t = tcg_temp_new_i64();
++
++        for (int i = 0; i < 2; ++i) {
++            read_vec_element(s, t, a->rn, i, MO_64);
++            f->gen_d(t, tcg_env, t);
++            write_vec_element(s, t, a->rd, i, MO_64);
++        }
++    } else {
++        TCGv_i32 t = tcg_temp_new_i32();
++        int n = (a->q ? 16 : 8) >> a->esz;
++
++        for (int i = 0; i < n; ++i) {
++            read_vec_element_i32(s, t, a->rn, i, a->esz);
++            f->gen_bhs[a->esz](t, tcg_env, t);
++            write_vec_element_i32(s, t, a->rd, i, a->esz);
++        }
++    }
++    clear_vec_high(s, a->q, a->rd);
++    return true;
++}
++
++static const ENVScalar1 f_scalar_sqabs = {
++    { gen_helper_neon_qabs_s8,
++      gen_helper_neon_qabs_s16,
++      gen_helper_neon_qabs_s32 },
++    gen_helper_neon_qabs_s64,
++};
++TRANS(SQABS_s, do_env_scalar1, a, &f_scalar_sqabs)
++TRANS(SQABS_v, do_env_vector1, a, &f_scalar_sqabs)
++
++static const ENVScalar1 f_scalar_sqneg = {
++    { gen_helper_neon_qneg_s8,
++      gen_helper_neon_qneg_s16,
++      gen_helper_neon_qneg_s32 },
++    gen_helper_neon_qneg_s64,
++};
++TRANS(SQNEG_s, do_env_scalar1, a, &f_scalar_sqneg)
++TRANS(SQNEG_v, do_env_vector1, a, &f_scalar_sqneg)
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+          */
+         tcg_gen_not_i64(tcg_rd, tcg_rn);
+         break;
+-    case 0x7: /* SQABS, SQNEG */
+-        if (u) {
+-            gen_helper_neon_qneg_s64(tcg_rd, tcg_env, tcg_rn);
+-        } else {
+-            gen_helper_neon_qabs_s64(tcg_rd, tcg_env, tcg_rn);
+-        }
+-        break;
+     case 0xa: /* CMLT */
+         cond = TCG_COND_LT;
+     do_cmop:
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+         gen_helper_frint64_d(tcg_rd, tcg_rn, tcg_fpstatus);
+         break;
+     default:
++    case 0x7: /* SQABS, SQNEG */
+         g_assert_not_reached();
+     }
+ }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+     TCGv_ptr tcg_fpstatus;
+     switch (opcode) {
+-    case 0x7: /* SQABS / SQNEG */
+-        break;
+     case 0xa: /* CMLT */
+         if (u) {
+             unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         break;
+     default:
+     case 0x3: /* USQADD / SUQADD */
++    case 0x7: /* SQABS / SQNEG */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         read_vec_element_i32(s, tcg_rn, rn, 0, size);
+         switch (opcode) {
+-        case 0x7: /* SQABS, SQNEG */
+-        {
+-            NeonGenOneOpEnvFn *genfn;
+-            static NeonGenOneOpEnvFn * const fns[3][2] = {
+-                { gen_helper_neon_qabs_s8, gen_helper_neon_qneg_s8 },
+-                { gen_helper_neon_qabs_s16, gen_helper_neon_qneg_s16 },
+-                { gen_helper_neon_qabs_s32, gen_helper_neon_qneg_s32 },
+-            };
+-            genfn = fns[size][u];
+-            genfn(tcg_rd, tcg_env, tcg_rn);
+-            break;
+-        }
+         case 0x1a: /* FCVTNS */
+         case 0x1b: /* FCVTMS */
+         case 0x1c: /* FCVTAS */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+                                  tcg_fpstatus);
+             break;
+         default:
++        case 0x7: /* SQABS, SQNEG */
+             g_assert_not_reached();
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             return;
+         }
+         break;
+-    case 0x7: /* SQABS, SQNEG */
+-        if (size == 3 && !is_q) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        break;
+     case 0xc ... 0xf:
+     case 0x16 ... 0x1f:
+     {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     }
+     default:
+     case 0x3: /* SUQADD, USQADD */
++    case 0x7: /* SQABS, SQNEG */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                         tcg_gen_clrsb_i32(tcg_res, tcg_op);
+                     }
+                     break;
+-                case 0x7: /* SQABS, SQNEG */
+-                    if (u) {
+-                        gen_helper_neon_qneg_s32(tcg_res, tcg_env, tcg_op);
+-                    } else {
+-                        gen_helper_neon_qabs_s32(tcg_res, tcg_env, tcg_op);
+-                    }
+-                    break;
+                 case 0x2f: /* FABS */
+                     gen_vfp_abss(tcg_res, tcg_op);
+                     break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                     gen_helper_frint64_s(tcg_res, tcg_op, tcg_fpstatus);
+                     break;
+                 default:
++                case 0x7: /* SQABS, SQNEG */
+                     g_assert_not_reached();
+                 }
+             } else {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                         gen_helper_neon_cnt_u8(tcg_res, tcg_op);
+                     }
+                     break;
+-                case 0x7: /* SQABS, SQNEG */
+-                {
+-                    NeonGenOneOpEnvFn *genfn;
+-                    static NeonGenOneOpEnvFn * const fns[2][2] = {
+-                        { gen_helper_neon_qabs_s8, gen_helper_neon_qneg_s8 },
+-                        { gen_helper_neon_qabs_s16, gen_helper_neon_qneg_s16 },
+-                    };
+-                    genfn = fns[size][u];
+-                    genfn(tcg_res, tcg_env, tcg_op);
+-                    break;
+-                }
+                 case 0x4: /* CLS, CLZ */
+                     if (u) {
+                         if (size == 0) {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                     }
+                     break;
+                 default:
++                case 0x7: /* SQABS, SQNEG */
+                     g_assert_not_reached();
+                 }
+             }
+--
+.34.1

-New patch
+[PULL 36/85] target/arm: Convert ABS, NEG to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-37-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  4 +++
+ target/arm/tcg/translate-a64.c | 46 +++++++++++++++++++++++-----------
+files changed, 35 insertions(+), 15 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_s
+ SQABS_s         0101 1110 ..1 00000 01111 0 ..... .....     @rr_e
+ SQNEG_s         0111 1110 ..1 00000 01111 0 ..... .....     @rr_e
++ABS_s           0101 1110 111 00000 10111 0 ..... .....     @rr
++NEG_s           0111 1110 111 00000 10111 0 ..... .....     @rr
+ # Advanced SIMD two-register miscellaneous
+ SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+ SQNEG_v         0.10 1110 ..1 00000 01111 0 ..... .....     @qrr_e
++ABS_v           0.00 1110 ..1 00000 10111 0 ..... .....     @qrr_e
++NEG_v           0.10 1110 ..1 00000 10111 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static const ENVScalar1 f_scalar_sqneg = {
+ TRANS(SQNEG_s, do_env_scalar1, a, &f_scalar_sqneg)
+ TRANS(SQNEG_v, do_env_vector1, a, &f_scalar_sqneg)
++static bool do_scalar1_d(DisasContext *s, arg_rr *a, ArithOneOp *f)
++{
++    if (fp_access_check(s)) {
++        TCGv_i64 t = read_fp_dreg(s, a->rn);
++        f(t, t);
++        write_fp_dreg(s, a->rd, t);
++    }
++    return true;
++}
++
++TRANS(ABS_s, do_scalar1_d, a, tcg_gen_abs_i64)
++TRANS(NEG_s, do_scalar1_d, a, tcg_gen_neg_i64)
++
++static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
++{
++    if (!a->q && a->esz == MO_64) {
++        return false;
++    }
++    if (fp_access_check(s)) {
++        gen_gvec_fn2(s, a->q, a->rd, a->rn, fn, a->esz);
++    }
++    return true;
++}
++
++TRANS(ABS_v, do_gvec_fn2, a, tcg_gen_gvec_abs)
++TRANS(NEG_v, do_gvec_fn2, a, tcg_gen_gvec_neg)
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     case 0x9: /* CMEQ, CMLE */
+         cond = u ? TCG_COND_LE : TCG_COND_EQ;
+         goto do_cmop;
+-    case 0xb: /* ABS, NEG */
+-        if (u) {
+-            tcg_gen_neg_i64(tcg_rd, tcg_rn);
+-        } else {
+-            tcg_gen_abs_i64(tcg_rd, tcg_rn);
+-        }
+-        break;
+     case 0x2f: /* FABS */
+         gen_vfp_absd(tcg_rd, tcg_rn);
+         break;
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+         break;
+     default:
+     case 0x7: /* SQABS, SQNEG */
++    case 0xb: /* ABS, NEG */
+         g_assert_not_reached();
+     }
+ }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         /* fall through */
+     case 0x8: /* CMGT, CMGE */
+     case 0x9: /* CMEQ, CMLE */
+-    case 0xb: /* ABS, NEG */
+         if (size != 3) {
+             unallocated_encoding(s);
+             return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+     default:
+     case 0x3: /* USQADD / SUQADD */
+     case 0x7: /* SQABS / SQNEG */
++    case 0xb: /* ABS, NEG */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         /* fall through */
+     case 0x8: /* CMGT, CMGE */
+     case 0x9: /* CMEQ, CMLE */
+-    case 0xb: /* ABS, NEG */
+         if (size == 3 && !is_q) {
+             unallocated_encoding(s);
+             return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     default:
+     case 0x3: /* SUQADD, USQADD */
+     case 0x7: /* SQABS, SQNEG */
++    case 0xb: /* ABS, NEG */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
+         return;
+     case 0xb:
+-        if (u) { /* ABS, NEG */
+-            gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_neg, size);
+-        } else {
+-            gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_abs, size);
+-        }
+-        return;
++        g_assert_not_reached();
+     }
+     if (size == 3) {
+--
+.34.1

-[PULL 01/48] target/arm/monitor: query-cpu-model-expansion crashed qemu when using machine type none
+[PULL 37/85] target/arm: Introduce gen_gvec_cls, gen_gvec_clz
-From: Liang Yan <lyan@suse.com>
+From: Richard Henderson <richard.henderson@linaro.org>
-Commit e19afd566781 mentioned that target-arm only supports queryable
+Add gvec interfaces for CLS and CLZ operations.
 cpu models 'max', 'host', and the current type when KVM is in use.
 The logic works well until using machine type none.
-For machine type none, cpu_type will be null if cpu option is not
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-set by command line, strlen(cpu_type) will terminate process.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-So We add a check above it.
+Message-id: 20241211163036.2297116-38-richard.henderson@linaro.org
 This won't affect i386 and s390x since they do not use current_cpu.
 Signed-off-by: Liang Yan <lyan@suse.com>
 Message-id: 20200203134251.12986-1-lyan@suse.com
 Reviewed-by: Andrew Jones <drjones@redhat.com>
 Tested-by: Andrew Jones <drjones@redhat.com>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/monitor.c | 15 +++++++++------
+ target/arm/tcg/translate.h      |  5 +++++
-file changed, 9 insertions(+), 6 deletions(-)
+ target/arm/tcg/gengvec.c        | 35 +++++++++++++++++++++++++++++++++
  target/arm/tcg/translate-a64.c  | 29 +++++++--------------------
  target/arm/tcg/translate-neon.c | 29 ++-------------------------
 files changed, 49 insertions(+), 49 deletions(-)
-diff --git a/target/arm/monitor.c b/target/arm/monitor.c
+diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/monitor.c
+--- a/target/arm/tcg/translate.h
-+++ b/target/arm/monitor.c
++++ b/target/arm/tcg/translate.h
-@@ -XXX,XX +XXX,XX @@ CpuModelExpansionInfo *qmp_query_cpu_model_expansion(CpuModelExpansionType type,
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_umaxp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
  void gen_gvec_uminp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                      uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/gengvec.c
 +++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_urhadd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
      assert(vece <= MO_32);
      tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &g[vece]);
  }
 +
 +void gen_gvec_cls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const GVecGen2 g[] = {
 +        { .fni4 = gen_helper_neon_cls_s8,
 +          .vece = MO_8 },
 +        { .fni4 = gen_helper_neon_cls_s16,
 +          .vece = MO_16 },
 +        { .fni4 = tcg_gen_clrsb_i32,
 +          .vece = MO_32 },
 +    };
 +    assert(vece <= MO_32);
 +    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 +}
 +
 +static void gen_clz32_i32(TCGv_i32 d, TCGv_i32 n)
 +{
 +    tcg_gen_clzi_i32(d, n, 32);
 +}
 +
 +void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const GVecGen2 g[] = {
 +        { .fni4 = gen_helper_neon_clz_u8,
 +          .vece = MO_8 },
 +        { .fni4 = gen_helper_neon_clz_u16,
 +          .vece = MO_16 },
 +        { .fni4 = gen_clz32_i32,
 +          .vece = MO_32 },
 +    };
 +    assert(vece <= MO_32);
 +    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 +}
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
      }
-     if (kvm_enabled()) {
+     switch (opcode) {
--        const char *cpu_type = current_machine->cpu_type;
++    case 0x4: /* CLZ, CLS */
--        int len = strlen(cpu_type) - strlen(ARM_CPU_TYPE_SUFFIX);
++        if (u) {
-         bool supported = false;
++            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clz, size);
++        } else {
-         if (!strcmp(model->name, "host") || !strcmp(model->name, "max")) {
++            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cls, size);
-             /* These are kvmarm's recommended cpu types */
++        }
-             supported = true;
++        return;
--        } else if (strlen(model->name) == len &&
+     case 0x5:
--                   !strncmp(model->name, cpu_type, len)) {
+         if (u && size == 0) { /* NOT */
--            /* KVM is enabled and we're using this type, so it works. */
+             gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
--            supported = true;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
-+        } else if (current_machine->cpu_type) {
+             if (size == 2) {
-+            const char *cpu_type = current_machine->cpu_type;
+                 /* Special cases for 32 bit elements */
-+            int len = strlen(cpu_type) - strlen(ARM_CPU_TYPE_SUFFIX);
+                 switch (opcode) {
-+
+-                case 0x4: /* CLS */
-+            if (strlen(model->name) == len &&
+-                    if (u) {
-+                !strncmp(model->name, cpu_type, len)) {
+-                        tcg_gen_clzi_i32(tcg_res, tcg_op, 32);
-+                /* KVM is enabled and we're using this type, so it works. */
+-                    } else {
-+                supported = true;
+-                        tcg_gen_clrsb_i32(tcg_res, tcg_op);
-+            }
+-                    }
-         }
+-                    break;
-         if (!supported) {
+                 case 0x2f: /* FABS */
-             error_setg(errp, "We cannot guarantee the CPU type '%s' works "
+                     gen_vfp_abss(tcg_res, tcg_op);
                      break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                          gen_helper_neon_cnt_u8(tcg_res, tcg_op);
                      }
                      break;
 -                case 0x4: /* CLS, CLZ */
 -                    if (u) {
 -                        if (size == 0) {
 -                            gen_helper_neon_clz_u8(tcg_res, tcg_op);
 -                        } else {
 -                            gen_helper_neon_clz_u16(tcg_res, tcg_op);
 -                        }
 -                    } else {
 -                        if (size == 0) {
 -                            gen_helper_neon_cls_s8(tcg_res, tcg_op);
 -                        } else {
 -                            gen_helper_neon_cls_s16(tcg_res, tcg_op);
 -                        }
 -                    }
 -                    break;
                  default:
                  case 0x7: /* SQABS, SQNEG */
                      g_assert_not_reached();
 diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-neon.c
 +++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ DO_2MISC_VEC(VCGT0, gen_gvec_cgt0)
  DO_2MISC_VEC(VCLE0, gen_gvec_cle0)
  DO_2MISC_VEC(VCGE0, gen_gvec_cge0)
  DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
 +DO_2MISC_VEC(VCLS, gen_gvec_cls)
 +DO_2MISC_VEC(VCLZ, gen_gvec_clz)
  static bool trans_VMVN(DisasContext *s, arg_2misc *a)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_VREV16(DisasContext *s, arg_2misc *a)
      return do_2misc(s, a, gen_rev16);
  }
 -static bool trans_VCLS(DisasContext *s, arg_2misc *a)
 -{
 -    static NeonGenOneOpFn * const fn[] = {
 -        gen_helper_neon_cls_s8,
 -        gen_helper_neon_cls_s16,
 -        gen_helper_neon_cls_s32,
 -        NULL,
 -    };
 -    return do_2misc(s, a, fn[a->size]);
 -}
 -
 -static void do_VCLZ_32(TCGv_i32 rd, TCGv_i32 rm)
 -{
 -    tcg_gen_clzi_i32(rd, rm, 32);
 -}
 -
 -static bool trans_VCLZ(DisasContext *s, arg_2misc *a)
 -{
 -    static NeonGenOneOpFn * const fn[] = {
 -        gen_helper_neon_clz_u8,
 -        gen_helper_neon_clz_u16,
 -        do_VCLZ_32,
 -        NULL,
 -    };
 -    return do_2misc(s, a, fn[a->size]);
 -}
 -
  static bool trans_VCNT(DisasContext *s, arg_2misc *a)
  {
      if (a->size != 0) {
 --
-.20.1
+.34.1

-New patch
+[PULL 38/85] target/arm: Convert CLS, CLZ (vector) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-39-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  2 ++
+ target/arm/tcg/translate-a64.c | 37 ++++++++++++++++------------------
+files changed, 19 insertions(+), 20 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+ SQNEG_v         0.10 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+ ABS_v           0.00 1110 ..1 00000 10111 0 ..... .....     @qrr_e
+ NEG_v           0.10 1110 ..1 00000 10111 0 ..... .....     @qrr_e
++CLS_v           0.00 1110 ..1 00000 01001 0 ..... .....     @qrr_e
++CLZ_v           0.10 1110 ..1 00000 01001 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ TRANS(ABS_v, do_gvec_fn2, a, tcg_gen_gvec_abs)
+ TRANS(NEG_v, do_gvec_fn2, a, tcg_gen_gvec_neg)
++static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
++{
++    if (a->esz == MO_64) {
++        return false;
++    }
++    if (fp_access_check(s)) {
++        gen_gvec_fn2(s, a->q, a->rd, a->rn, fn, a->esz);
++    }
++    return true;
++}
++
++TRANS(CLS_v, do_gvec_fn2_bhs, a, gen_gvec_cls)
++TRANS(CLZ_v, do_gvec_fn2_bhs, a, gen_gvec_clz)
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     TCGCond cond;
+     switch (opcode) {
+-    case 0x4: /* CLS, CLZ */
+-        if (u) {
+-            tcg_gen_clzi_i64(tcg_rd, tcg_rn, 64);
+-        } else {
+-            tcg_gen_clrsb_i64(tcg_rd, tcg_rn);
+-        }
+-        break;
+     case 0x5: /* NOT */
+         /* This opcode is shared with CNT and RBIT but we have earlier
+          * enforced that size == 3 if and only if this is the NOT insn.
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+         gen_helper_frint64_d(tcg_rd, tcg_rn, tcg_fpstatus);
+         break;
+     default:
++    case 0x4: /* CLS, CLZ */
+     case 0x7: /* SQABS, SQNEG */
+     case 0xb: /* ABS, NEG */
+         g_assert_not_reached();
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         handle_2misc_narrow(s, false, opcode, u, is_q, size, rn, rd);
+         return;
+-    case 0x4: /* CLS, CLZ */
+-        if (size == 3) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        break;
+     case 0x2: /* SADDLP, UADDLP */
+     case 0x6: /* SADALP, UADALP */
+         if (size == 3) {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     }
+     default:
+     case 0x3: /* SUQADD, USQADD */
++    case 0x4: /* CLS, CLZ */
+     case 0x7: /* SQABS, SQNEG */
+     case 0xb: /* ABS, NEG */
+         unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     }
+     switch (opcode) {
+-    case 0x4: /* CLZ, CLS */
+-        if (u) {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clz, size);
+-        } else {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cls, size);
+-        }
+-        return;
+     case 0x5:
+         if (u && size == 0) { /* NOT */
+             gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     case 0xa: /* CMLT */
+         gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
+         return;
++    case 0x4: /* CLZ, CLS */
+     case 0xb:
+         g_assert_not_reached();
+     }
+--
+.34.1

-New patch
+[PULL 39/85] target/arm: Introduce gen_gvec_cnt, gen_gvec_rbit
+From: Richard Henderson <richard.henderson@linaro.org>
+Add gvec interfaces for CNT and RBIT operations.
+Use ctpop8 for CNT and revbit+bswap for RBIT.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-40-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/helper.h             |  4 ++--
+ target/arm/tcg/translate.h      |  4 ++++
+ target/arm/tcg/gengvec.c        | 16 ++++++++++++++++
+ target/arm/tcg/neon_helper.c    | 21 ---------------------
+ target/arm/tcg/translate-a64.c  | 32 +++++++++-----------------------
+ target/arm/tcg/translate-neon.c | 16 ++++++++--------
+ target/arm/tcg/vec_helper.c     | 24 ++++++++++++++++++++++++
+files changed, 63 insertions(+), 54 deletions(-)
+diff --git a/target/arm/helper.h b/target/arm/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.h
++++ b/target/arm/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(neon_clz_u16, i32, i32)
+ DEF_HELPER_1(neon_cls_s8, i32, i32)
+ DEF_HELPER_1(neon_cls_s16, i32, i32)
+ DEF_HELPER_1(neon_cls_s32, i32, i32)
+-DEF_HELPER_1(neon_cnt_u8, i32, i32)
+-DEF_HELPER_FLAGS_1(neon_rbit_u8, TCG_CALL_NO_RWG_SE, i32, i32)
++DEF_HELPER_FLAGS_3(gvec_cnt_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
++DEF_HELPER_FLAGS_3(gvec_rbit_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ DEF_HELPER_3(neon_qdmulh_s16, i32, env, i32, i32)
+ DEF_HELPER_3(neon_qrdmulh_s16, i32, env, i32, i32)
+diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate.h
++++ b/target/arm/tcg/translate.h
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_cls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                   uint32_t opr_sz, uint32_t max_sz);
+ void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                   uint32_t opr_sz, uint32_t max_sz);
++void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                  uint32_t opr_sz, uint32_t max_sz);
++void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                   uint32_t opr_sz, uint32_t max_sz);
+ /*
+  * Forward to the isar_feature_* tests given a DisasContext pointer.
+diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/gengvec.c
++++ b/target/arm/tcg/gengvec.c
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     assert(vece <= MO_32);
+     tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+ }
++
++void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                  uint32_t opr_sz, uint32_t max_sz)
++{
++    assert(vece == MO_8);
++    tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
++                       gen_helper_gvec_cnt_b);
++}
++
++void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                  uint32_t opr_sz, uint32_t max_sz)
++{
++    assert(vece == MO_8);
++    tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
++                       gen_helper_gvec_rbit_b);
++}
+diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/neon_helper.c
++++ b/target/arm/tcg/neon_helper.c
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(neon_cls_s32)(uint32_t x)
+     return count - 1;
+ }
+-/* Bit count.  */
+-uint32_t HELPER(neon_cnt_u8)(uint32_t x)
+-{
+-    x = (x & 0x55555555) + ((x >>  1) & 0x55555555);
+-    x = (x & 0x33333333) + ((x >>  2) & 0x33333333);
+-    x = (x & 0x0f0f0f0f) + ((x >>  4) & 0x0f0f0f0f);
+-    return x;
+-}
+-
+-/* Reverse bits in each 8 bit word */
+-uint32_t HELPER(neon_rbit_u8)(uint32_t x)
+-{
+-    x =  ((x & 0xf0f0f0f0) >> 4)
+-       | ((x & 0x0f0f0f0f) << 4);
+-    x =  ((x & 0x88888888) >> 3)
+-       | ((x & 0x44444444) >> 1)
+-       | ((x & 0x22222222) << 1)
+-       | ((x & 0x11111111) << 3);
+-    return x;
+-}
+-
+ #define NEON_QDMULH16(dest, src1, src2, round) do { \
+     uint32_t tmp = (int32_t)(int16_t) src1 * (int16_t) src2; \
+     if ((tmp ^ (tmp << 1)) & SIGNBIT) { \
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     }
+     switch (opcode) {
+-    case 0x5:
+-        if (u && size == 0) { /* NOT */
++    case 0x5: /* CNT, NOT, RBIT */
++        if (!u) {
++            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cnt, 0);
++        } else if (size) {
++            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_rbit, 0);
++        } else {
+             gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
+-            return;
+         }
+-        break;
++        return;
+     case 0x8: /* CMGT, CMGE */
+         if (u) {
+             gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     } else {
+         int pass;
++        assert(size == 2);
+         for (pass = 0; pass < (is_q ? 4 : 2); pass++) {
+             TCGv_i32 tcg_op = tcg_temp_new_i32();
+             TCGv_i32 tcg_res = tcg_temp_new_i32();
+             read_vec_element_i32(s, tcg_op, rn, pass, MO_32);
+-            if (size == 2) {
++            {
+                 /* Special cases for 32 bit elements */
+                 switch (opcode) {
+                 case 0x2f: /* FABS */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                 case 0x7: /* SQABS, SQNEG */
+                     g_assert_not_reached();
+                 }
+-            } else {
+-                /* Use helpers for 8 and 16 bit elements */
+-                switch (opcode) {
+-                case 0x5: /* CNT, RBIT */
+-                    /* For these two insns size is part of the opcode specifier
+-                     * (handled earlier); they always operate on byte elements.
+-                     */
+-                    if (u) {
+-                        gen_helper_neon_rbit_u8(tcg_res, tcg_op);
+-                    } else {
+-                        gen_helper_neon_cnt_u8(tcg_res, tcg_op);
+-                    }
+-                    break;
+-                default:
+-                case 0x7: /* SQABS, SQNEG */
+-                    g_assert_not_reached();
+-                }
+             }
+-
+             write_vec_element_i32(s, tcg_res, rd, pass, MO_32);
+         }
+     }
+diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-neon.c
++++ b/target/arm/tcg/translate-neon.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_VMVN(DisasContext *s, arg_2misc *a)
+     return do_2misc_vec(s, a, tcg_gen_gvec_not);
+ }
++static bool trans_VCNT(DisasContext *s, arg_2misc *a)
++{
++    if (a->size != 0) {
++        return false;
++    }
++    return do_2misc_vec(s, a, gen_gvec_cnt);
++}
++
+ #define WRAP_2M_3_OOL_FN(WRAPNAME, FUNC, DATA)                          \
+     static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
+                          uint32_t rm_ofs, uint32_t oprsz,               \
+@@ -XXX,XX +XXX,XX @@ static bool trans_VREV16(DisasContext *s, arg_2misc *a)
+     return do_2misc(s, a, gen_rev16);
+ }
+-static bool trans_VCNT(DisasContext *s, arg_2misc *a)
+-{
+-    if (a->size != 0) {
+-        return false;
+-    }
+-    return do_2misc(s, a, gen_helper_neon_cnt_u8);
+-}
+-
+ static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+                        uint32_t oprsz, uint32_t maxsz)
+ {
+diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/vec_helper.c
++++ b/target/arm/tcg/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ DO_CLAMP(gvec_uclamp_b, uint8_t)
+ DO_CLAMP(gvec_uclamp_h, uint16_t)
+ DO_CLAMP(gvec_uclamp_s, uint32_t)
+ DO_CLAMP(gvec_uclamp_d, uint64_t)
++
++/* Bit count in each 8-bit word. */
++void HELPER(gvec_cnt_b)(void *vd, void *vn, uint32_t desc)
++{
++    intptr_t i, opr_sz = simd_oprsz(desc);
++    uint8_t *d = vd, *n = vn;
++
++    for (i = 0; i < opr_sz; ++i) {
++        d[i] = ctpop8(n[i]);
++    }
++    clear_tail(d, opr_sz, simd_maxsz(desc));
++}
++
++/* Reverse bits in each 8 bit word */
++void HELPER(gvec_rbit_b)(void *vd, void *vn, uint32_t desc)
++{
++    intptr_t i, opr_sz = simd_oprsz(desc);
++    uint64_t *d = vd, *n = vn;
++
++    for (i = 0; i < opr_sz / 8; ++i) {
++        d[i] = revbit64(bswap64(n[i]));
++    }
++    clear_tail(d, opr_sz, simd_maxsz(desc));
++}
+--
+.34.1

-New patch
+[PULL 40/85] target/arm: Convert CNT, NOT, RBIT (vector) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-41-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  4 ++++
+ target/arm/tcg/translate-a64.c | 34 ++++++----------------------------
+files changed, 10 insertions(+), 28 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@
+ @rrr_q1e3       ........ ... rm:5 ...... rn:5 rd:5      &qrrr_e q=1 esz=3
+ @rrrr_q1e3      ........ ... rm:5 . ra:5 rn:5 rd:5      &qrrrr_e q=1 esz=3
++@qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
+ @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
+ @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
+@@ -XXX,XX +XXX,XX @@ ABS_v           0.00 1110 ..1 00000 10111 0 ..... .....     @qrr_e
+ NEG_v           0.10 1110 ..1 00000 10111 0 ..... .....     @qrr_e
+ CLS_v           0.00 1110 ..1 00000 01001 0 ..... .....     @qrr_e
+ CLZ_v           0.10 1110 ..1 00000 01001 0 ..... .....     @qrr_e
++CNT_v           0.00 1110 001 00000 01011 0 ..... .....     @qrr_b
++NOT_v           0.10 1110 001 00000 01011 0 ..... .....     @qrr_b
++RBIT_v          0.10 1110 011 00000 01011 0 ..... .....     @qrr_b
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ TRANS(ABS_v, do_gvec_fn2, a, tcg_gen_gvec_abs)
+ TRANS(NEG_v, do_gvec_fn2, a, tcg_gen_gvec_neg)
++TRANS(NOT_v, do_gvec_fn2, a, tcg_gen_gvec_not)
++TRANS(CNT_v, do_gvec_fn2, a, gen_gvec_cnt)
++TRANS(RBIT_v, do_gvec_fn2, a, gen_gvec_rbit)
+ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ {
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     TCGCond cond;
+     switch (opcode) {
+-    case 0x5: /* NOT */
+-        /* This opcode is shared with CNT and RBIT but we have earlier
+-         * enforced that size == 3 if and only if this is the NOT insn.
+-         */
+-        tcg_gen_not_i64(tcg_rd, tcg_rn);
+-        break;
+     case 0xa: /* CMLT */
+         cond = TCG_COND_LT;
+     do_cmop:
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+         break;
+     default:
+     case 0x4: /* CLS, CLZ */
++    case 0x5: /* NOT */
+     case 0x7: /* SQABS, SQNEG */
+     case 0xb: /* ABS, NEG */
+         g_assert_not_reached();
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     case 0x1: /* REV16 */
+         handle_rev(s, opcode, u, is_q, size, rn, rd);
+         return;
+-    case 0x5: /* CNT, NOT, RBIT */
+-        if (u && size == 0) {
+-            /* NOT */
+-            break;
+-        } else if (u && size == 1) {
+-            /* RBIT */
+-            break;
+-        } else if (!u && size == 0) {
+-            /* CNT */
+-            break;
+-        }
+-        unallocated_encoding(s);
+-        return;
+     case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
+     case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
+         if (size == 3) {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     default:
+     case 0x3: /* SUQADD, USQADD */
+     case 0x4: /* CLS, CLZ */
++    case 0x5: /* CNT, NOT, RBIT */
+     case 0x7: /* SQABS, SQNEG */
+     case 0xb: /* ABS, NEG */
+         unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     }
+     switch (opcode) {
+-    case 0x5: /* CNT, NOT, RBIT */
+-        if (!u) {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cnt, 0);
+-        } else if (size) {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_rbit, 0);
+-        } else {
+-            gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
+-        }
+-        return;
+     case 0x8: /* CMGT, CMGE */
+         if (u) {
+             gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
+         return;
+     case 0x4: /* CLZ, CLS */
++    case 0x5: /* CNT, NOT, RBIT */
+     case 0xb:
+         g_assert_not_reached();
+     }
+--
+.34.1

-New patch
+[PULL 41/85] target/arm: Convert CMGT, CMGE, GMLT, GMLE, CMEQ (zero) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-42-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      | 10 ++++
+ target/arm/tcg/translate-a64.c | 94 +++++++++++-----------------------
+files changed, 40 insertions(+), 64 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ SQABS_s         0101 1110 ..1 00000 01111 0 ..... .....     @rr_e
+ SQNEG_s         0111 1110 ..1 00000 01111 0 ..... .....     @rr_e
+ ABS_s           0101 1110 111 00000 10111 0 ..... .....     @rr
+ NEG_s           0111 1110 111 00000 10111 0 ..... .....     @rr
++CMGT0_s         0101 1110 111 00000 10001 0 ..... .....     @rr
++CMGE0_s         0111 1110 111 00000 10001 0 ..... .....     @rr
++CMEQ0_s         0101 1110 111 00000 10011 0 ..... .....     @rr
++CMLE0_s         0111 1110 111 00000 10011 0 ..... .....     @rr
++CMLT0_s         0101 1110 111 00000 10101 0 ..... .....     @rr
+ # Advanced SIMD two-register miscellaneous
+@@ -XXX,XX +XXX,XX @@ CLZ_v           0.10 1110 ..1 00000 01001 0 ..... .....     @qrr_e
+ CNT_v           0.00 1110 001 00000 01011 0 ..... .....     @qrr_b
+ NOT_v           0.10 1110 001 00000 01011 0 ..... .....     @qrr_b
+ RBIT_v          0.10 1110 011 00000 01011 0 ..... .....     @qrr_b
++CMGT0_v         0.00 1110 ..1 00000 10001 0 ..... .....     @qrr_e
++CMGE0_v         0.10 1110 ..1 00000 10001 0 ..... .....     @qrr_e
++CMEQ0_v         0.00 1110 ..1 00000 10011 0 ..... .....     @qrr_e
++CMLE0_v         0.10 1110 ..1 00000 10011 0 ..... .....     @qrr_e
++CMLT0_v         0.00 1110 ..1 00000 10101 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_scalar1_d(DisasContext *s, arg_rr *a, ArithOneOp *f)
+ TRANS(ABS_s, do_scalar1_d, a, tcg_gen_abs_i64)
+ TRANS(NEG_s, do_scalar1_d, a, tcg_gen_neg_i64)
++static bool do_cmop0_d(DisasContext *s, arg_rr *a, TCGCond cond)
++{
++    if (fp_access_check(s)) {
++        TCGv_i64 t = read_fp_dreg(s, a->rn);
++        tcg_gen_negsetcond_i64(cond, t, t, tcg_constant_i64(0));
++        write_fp_dreg(s, a->rd, t);
++    }
++    return true;
++}
++
++TRANS(CMGT0_s, do_cmop0_d, a, TCG_COND_GT)
++TRANS(CMGE0_s, do_cmop0_d, a, TCG_COND_GE)
++TRANS(CMLE0_s, do_cmop0_d, a, TCG_COND_LE)
++TRANS(CMLT0_s, do_cmop0_d, a, TCG_COND_LT)
++TRANS(CMEQ0_s, do_cmop0_d, a, TCG_COND_EQ)
++
+ static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ {
+     if (!a->q && a->esz == MO_64) {
+@@ -XXX,XX +XXX,XX @@ TRANS(NEG_v, do_gvec_fn2, a, tcg_gen_gvec_neg)
+ TRANS(NOT_v, do_gvec_fn2, a, tcg_gen_gvec_not)
+ TRANS(CNT_v, do_gvec_fn2, a, gen_gvec_cnt)
+ TRANS(RBIT_v, do_gvec_fn2, a, gen_gvec_rbit)
++TRANS(CMGT0_v, do_gvec_fn2, a, gen_gvec_cgt0)
++TRANS(CMGE0_v, do_gvec_fn2, a, gen_gvec_cge0)
++TRANS(CMLT0_v, do_gvec_fn2, a, gen_gvec_clt0)
++TRANS(CMLE0_v, do_gvec_fn2, a, gen_gvec_cle0)
++TRANS(CMEQ0_v, do_gvec_fn2, a, gen_gvec_ceq0)
+ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ {
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+      * The caller only need provide tcg_rmode and tcg_fpstatus if the op
+      * requires them.
+      */
+-    TCGCond cond;
+-
+     switch (opcode) {
+-    case 0xa: /* CMLT */
+-        cond = TCG_COND_LT;
+-    do_cmop:
+-        /* 64 bit integer comparison against zero, result is test ? -1 : 0. */
+-        tcg_gen_negsetcond_i64(cond, tcg_rd, tcg_rn, tcg_constant_i64(0));
+-        break;
+-    case 0x8: /* CMGT, CMGE */
+-        cond = u ? TCG_COND_GE : TCG_COND_GT;
+-        goto do_cmop;
+-    case 0x9: /* CMEQ, CMLE */
+-        cond = u ? TCG_COND_LE : TCG_COND_EQ;
+-        goto do_cmop;
+     case 0x2f: /* FABS */
+         gen_vfp_absd(tcg_rd, tcg_rn);
+         break;
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     case 0x4: /* CLS, CLZ */
+     case 0x5: /* NOT */
+     case 0x7: /* SQABS, SQNEG */
++    case 0x8: /* CMGT, CMGE */
++    case 0x9: /* CMEQ, CMLE */
++    case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
+         g_assert_not_reached();
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+     TCGv_ptr tcg_fpstatus;
+     switch (opcode) {
+-    case 0xa: /* CMLT */
+-        if (u) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        /* fall through */
+-    case 0x8: /* CMGT, CMGE */
+-    case 0x9: /* CMEQ, CMLE */
+-        if (size != 3) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        break;
+     case 0x12: /* SQXTUN */
+         if (!u) {
+             unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+     default:
+     case 0x3: /* USQADD / SUQADD */
+     case 0x7: /* SQABS / SQNEG */
++    case 0x8: /* CMGT, CMGE */
++    case 0x9: /* CMEQ, CMLE */
++    case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
+         unallocated_encoding(s);
+         return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         }
+         handle_shll(s, is_q, size, rn, rd);
+         return;
+-    case 0xa: /* CMLT */
+-        if (u == 1) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        /* fall through */
+-    case 0x8: /* CMGT, CMGE */
+-    case 0x9: /* CMEQ, CMLE */
+-        if (size == 3 && !is_q) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        break;
+     case 0xc ... 0xf:
+     case 0x16 ... 0x1f:
+     {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     case 0x4: /* CLS, CLZ */
+     case 0x5: /* CNT, NOT, RBIT */
+     case 0x7: /* SQABS, SQNEG */
++    case 0x8: /* CMGT, CMGE */
++    case 0x9: /* CMEQ, CMLE */
++    case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
+         unallocated_encoding(s);
+         return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         tcg_rmode = NULL;
+     }
+-    switch (opcode) {
+-    case 0x8: /* CMGT, CMGE */
+-        if (u) {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
+-        } else {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cgt0, size);
+-        }
+-        return;
+-    case 0x9: /* CMEQ, CMLE */
+-        if (u) {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cle0, size);
+-        } else {
+-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_ceq0, size);
+-        }
+-        return;
+-    case 0xa: /* CMLT */
+-        gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
+-        return;
+-    case 0x4: /* CLZ, CLS */
+-    case 0x5: /* CNT, NOT, RBIT */
+-    case 0xb:
+-        g_assert_not_reached();
+-    }
+-
+     if (size == 3) {
+         /* All 64-bit element operations can be shared with scalar 2misc */
+         int pass;
+--
+.34.1

-New patch
+[PULL 42/85] target/arm: Introduce gen_gvec_rev{16,32,64}
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-43-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/translate.h      |  6 +++
+ target/arm/tcg/gengvec.c        | 58 ++++++++++++++++++++++
+ target/arm/tcg/translate-neon.c | 88 +++++++--------------------------
+files changed, 81 insertions(+), 71 deletions(-)
+diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate.h
++++ b/target/arm/tcg/translate.h
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                   uint32_t opr_sz, uint32_t max_sz);
+ void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz);
++void gen_gvec_rev16(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                    uint32_t opr_sz, uint32_t max_sz);
++void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                    uint32_t opr_sz, uint32_t max_sz);
++void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                    uint32_t opr_sz, uint32_t max_sz);
+ /*
+  * Forward to the isar_feature_* tests given a DisasContext pointer.
+diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/gengvec.c
++++ b/target/arm/tcg/gengvec.c
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
+                        gen_helper_gvec_rbit_b);
+ }
++
++void gen_gvec_rev16(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                    uint32_t opr_sz, uint32_t max_sz)
++{
++    assert(vece == MO_8);
++    tcg_gen_gvec_rotli(MO_16, rd_ofs, rn_ofs, 8, opr_sz, max_sz);
++}
++
++static void gen_bswap32_i64(TCGv_i64 d, TCGv_i64 n)
++{
++    tcg_gen_bswap64_i64(d, n);
++    tcg_gen_rotli_i64(d, d, 32);
++}
++
++void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                    uint32_t opr_sz, uint32_t max_sz)
++{
++    static const GVecGen2 g = {
++        .fni8 = gen_bswap32_i64,
++        .fni4 = tcg_gen_bswap32_i32,
++        .prefer_i64 = TCG_TARGET_REG_BITS == 64,
++        .vece = MO_32
++    };
++
++    switch (vece) {
++    case MO_16:
++        tcg_gen_gvec_rotli(MO_32, rd_ofs, rn_ofs, 16, opr_sz, max_sz);
++        break;
++    case MO_8:
++        tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g);
++        break;
++    default:
++        g_assert_not_reached();
++    }
++}
++
++void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++                    uint32_t opr_sz, uint32_t max_sz)
++{
++    static const GVecGen2 g[] = {
++        { .fni8 = tcg_gen_bswap64_i64,
++          .vece = MO_64 },
++        { .fni8 = tcg_gen_hswap_i64,
++          .vece = MO_64 },
++    };
++
++    switch (vece) {
++    case MO_32:
++        tcg_gen_gvec_rotli(MO_64, rd_ofs, rn_ofs, 32, opr_sz, max_sz);
++        break;
++    case MO_8:
++    case MO_16:
++        tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
++        break;
++    default:
++        g_assert_not_reached();
++    }
++}
+diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-neon.c
++++ b/target/arm/tcg/translate-neon.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP_scalar(DisasContext *s, arg_VDUP_scalar *a)
+     return true;
+ }
+-static bool trans_VREV64(DisasContext *s, arg_VREV64 *a)
+-{
+-    int pass, half;
+-    TCGv_i32 tmp[2];
+-
+-    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
+-        return false;
+-    }
+-
+-    /* UNDEF accesses to D16-D31 if they don't exist. */
+-    if (!dc_isar_feature(aa32_simd_r32, s) &&
+-        ((a->vd | a->vm) & 0x10)) {
+-        return false;
+-    }
+-
+-    if ((a->vd | a->vm) & a->q) {
+-        return false;
+-    }
+-
+-    if (a->size == 3) {
+-        return false;
+-    }
+-
+-    if (!vfp_access_check(s)) {
+-        return true;
+-    }
+-
+-    tmp[0] = tcg_temp_new_i32();
+-    tmp[1] = tcg_temp_new_i32();
+-
+-    for (pass = 0; pass < (a->q ? 2 : 1); pass++) {
+-        for (half = 0; half < 2; half++) {
+-            read_neon_element32(tmp[half], a->vm, pass * 2 + half, MO_32);
+-            switch (a->size) {
+-            case 0:
+-                tcg_gen_bswap32_i32(tmp[half], tmp[half]);
+-                break;
+-            case 1:
+-                gen_swap_half(tmp[half], tmp[half]);
+-                break;
+-            case 2:
+-                break;
+-            default:
+-                g_assert_not_reached();
+-            }
+-        }
+-        write_neon_element32(tmp[1], a->vd, pass * 2, MO_32);
+-        write_neon_element32(tmp[0], a->vd, pass * 2 + 1, MO_32);
+-    }
+-    return true;
+-}
+-
+ static bool do_2misc_pairwise(DisasContext *s, arg_2misc *a,
+                               NeonGenWidenFn *widenfn,
+                               NeonGenTwo64OpFn *opfn,
+@@ -XXX,XX +XXX,XX @@ DO_2MISC_VEC(VCGE0, gen_gvec_cge0)
+ DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
+ DO_2MISC_VEC(VCLS, gen_gvec_cls)
+ DO_2MISC_VEC(VCLZ, gen_gvec_clz)
++DO_2MISC_VEC(VREV64, gen_gvec_rev64)
+ static bool trans_VMVN(DisasContext *s, arg_2misc *a)
+ {
+@@ -XXX,XX +XXX,XX @@ static bool trans_VCNT(DisasContext *s, arg_2misc *a)
+     return do_2misc_vec(s, a, gen_gvec_cnt);
+ }
++static bool trans_VREV16(DisasContext *s, arg_2misc *a)
++{
++    if (a->size != 0) {
++        return false;
++    }
++    return do_2misc_vec(s, a, gen_gvec_rev16);
++}
++
++static bool trans_VREV32(DisasContext *s, arg_2misc *a)
++{
++    if (a->size != 0 && a->size != 1) {
++        return false;
++    }
++    return do_2misc_vec(s, a, gen_gvec_rev32);
++}
++
+ #define WRAP_2M_3_OOL_FN(WRAPNAME, FUNC, DATA)                          \
+     static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
+                          uint32_t rm_ofs, uint32_t oprsz,               \
+@@ -XXX,XX +XXX,XX @@ static bool do_2misc(DisasContext *s, arg_2misc *a, NeonGenOneOpFn *fn)
+     return true;
+ }
+-static bool trans_VREV32(DisasContext *s, arg_2misc *a)
+-{
+-    static NeonGenOneOpFn * const fn[] = {
+-        tcg_gen_bswap32_i32,
+-        gen_swap_half,
+-        NULL,
+-        NULL,
+-    };
+-    return do_2misc(s, a, fn[a->size]);
+-}
+-
+-static bool trans_VREV16(DisasContext *s, arg_2misc *a)
+-{
+-    if (a->size != 0) {
+-        return false;
+-    }
+-    return do_2misc(s, a, gen_rev16);
+-}
+-
+ static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+                        uint32_t oprsz, uint32_t maxsz)
+ {
+--
+.34.1

-New patch
+[PULL 43/85] target/arm: Convert handle_rev to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+This includes REV16, REV32, REV64.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-44-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  5 +++
+ target/arm/tcg/translate-a64.c | 79 +++-------------------------------
+files changed, 10 insertions(+), 74 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@
+ @qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
+ @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
++@qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
+ @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
+ @qrrr_b         . q:1 ...... ... rm:5 ...... rn:5 rd:5  &qrrr_e esz=0
+@@ -XXX,XX +XXX,XX @@ CMGE0_v         0.10 1110 ..1 00000 10001 0 ..... .....     @qrr_e
+ CMEQ0_v         0.00 1110 ..1 00000 10011 0 ..... .....     @qrr_e
+ CMLE0_v         0.10 1110 ..1 00000 10011 0 ..... .....     @qrr_e
+ CMLT0_v         0.00 1110 ..1 00000 10101 0 ..... .....     @qrr_e
++
++REV16_v         0.00 1110 001 00000 00011 0 ..... .....     @qrr_b
++REV32_v         0.10 1110 0.1 00000 00001 0 ..... .....     @qrr_bh
++REV64_v         0.00 1110 ..1 00000 00001 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ TRANS(CMGE0_v, do_gvec_fn2, a, gen_gvec_cge0)
+ TRANS(CMLT0_v, do_gvec_fn2, a, gen_gvec_clt0)
+ TRANS(CMLE0_v, do_gvec_fn2, a, gen_gvec_cle0)
+ TRANS(CMEQ0_v, do_gvec_fn2, a, gen_gvec_ceq0)
++TRANS(REV16_v, do_gvec_fn2, a, gen_gvec_rev16)
++TRANS(REV32_v, do_gvec_fn2, a, gen_gvec_rev32)
+ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ {
+@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ TRANS(CLS_v, do_gvec_fn2_bhs, a, gen_gvec_cls)
+ TRANS(CLZ_v, do_gvec_fn2_bhs, a, gen_gvec_clz)
++TRANS(REV64_v, do_gvec_fn2_bhs, a, gen_gvec_rev64)
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
+     }
+ }
+-static void handle_rev(DisasContext *s, int opcode, bool u,
+-                       bool is_q, int size, int rn, int rd)
+-{
+-    int op = (opcode << 1) | u;
+-    int opsz = op + size;
+-    int grp_size = 3 - opsz;
+-    int dsize = is_q ? 128 : 64;
+-    int i;
+-
+-    if (opsz >= 3) {
+-        unallocated_encoding(s);
+-        return;
+-    }
+-
+-    if (!fp_access_check(s)) {
+-        return;
+-    }
+-
+-    if (size == 0) {
+-        /* Special case bytes, use bswap op on each group of elements */
+-        int groups = dsize / (8 << grp_size);
+-
+-        for (i = 0; i < groups; i++) {
+-            TCGv_i64 tcg_tmp = tcg_temp_new_i64();
+-
+-            read_vec_element(s, tcg_tmp, rn, i, grp_size);
+-            switch (grp_size) {
+-            case MO_16:
+-                tcg_gen_bswap16_i64(tcg_tmp, tcg_tmp, TCG_BSWAP_IZ);
+-                break;
+-            case MO_32:
+-                tcg_gen_bswap32_i64(tcg_tmp, tcg_tmp, TCG_BSWAP_IZ);
+-                break;
+-            case MO_64:
+-                tcg_gen_bswap64_i64(tcg_tmp, tcg_tmp);
+-                break;
+-            default:
+-                g_assert_not_reached();
+-            }
+-            write_vec_element(s, tcg_tmp, rd, i, grp_size);
+-        }
+-        clear_vec_high(s, is_q, rd);
+-    } else {
+-        int revmask = (1 << grp_size) - 1;
+-        int esize = 8 << size;
+-        int elements = dsize / esize;
+-        TCGv_i64 tcg_rn = tcg_temp_new_i64();
+-        TCGv_i64 tcg_rd[2];
+-
+-        for (i = 0; i < 2; i++) {
+-            tcg_rd[i] = tcg_temp_new_i64();
+-            tcg_gen_movi_i64(tcg_rd[i], 0);
+-        }
+-
+-        for (i = 0; i < elements; i++) {
+-            int e_rev = (i & 0xf) ^ revmask;
+-            int w = (e_rev * esize) / 64;
+-            int o = (e_rev * esize) % 64;
+-
+-            read_vec_element(s, tcg_rn, rn, i, size);
+-            tcg_gen_deposit_i64(tcg_rd[w], tcg_rd[w], tcg_rn, o, esize);
+-        }
+-
+-        for (i = 0; i < 2; i++) {
+-            write_vec_element(s, tcg_rd[i], rd, i, MO_64);
+-        }
+-        clear_vec_high(s, true, rd);
+-    }
+-}
+-
+ static void handle_2misc_pairwise(DisasContext *s, int opcode, bool u,
+                                   bool is_q, int size, int rn, int rd)
+ {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     TCGv_ptr tcg_fpstatus;
+     switch (opcode) {
+-    case 0x0: /* REV64, REV32 */
+-    case 0x1: /* REV16 */
+-        handle_rev(s, opcode, u, is_q, size, rn, rd);
+-        return;
+     case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
+     case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
+         if (size == 3) {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         break;
+     }
+     default:
++    case 0x0: /* REV64, REV32 */
++    case 0x1: /* REV16 */
+     case 0x3: /* SUQADD, USQADD */
+     case 0x4: /* CLS, CLZ */
+     case 0x5: /* CNT, NOT, RBIT */
+--
+.34.1

-New patch
+[PULL 44/85] target/arm: Move helper_neon_addlp_{s8, s16} to neon_helper.c
+From: Richard Henderson <richard.henderson@linaro.org>
+Move from helper-a64.c to neon_helper.c so that these
+functions are available for arm32 code as well.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-45-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/helper.h          |  2 ++
+ target/arm/tcg/helper-a64.h  |  2 --
+ target/arm/tcg/helper-a64.c  | 43 ------------------------------------
+ target/arm/tcg/neon_helper.c | 43 ++++++++++++++++++++++++++++++++++++
+files changed, 45 insertions(+), 45 deletions(-)
+diff --git a/target/arm/helper.h b/target/arm/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.h
++++ b/target/arm/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_addl_u16, i64, i64, i64)
+ DEF_HELPER_2(neon_addl_u32, i64, i64, i64)
+ DEF_HELPER_2(neon_paddl_u16, i64, i64, i64)
+ DEF_HELPER_2(neon_paddl_u32, i64, i64, i64)
++DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
++DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
+ DEF_HELPER_2(neon_subl_u16, i64, i64, i64)
+ DEF_HELPER_2(neon_subl_u32, i64, i64, i64)
+ DEF_HELPER_3(neon_addl_saturate_s32, i64, env, i64, i64)
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.h
++++ b/target/arm/tcg/helper-a64.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(recpsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+ DEF_HELPER_FLAGS_3(rsqrtsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+ DEF_HELPER_FLAGS_3(rsqrtsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
+ DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+-DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
+ DEF_HELPER_FLAGS_1(neon_addlp_u8, TCG_CALL_NO_RWG_SE, i64, i64)
+-DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
+ DEF_HELPER_FLAGS_1(neon_addlp_u16, TCG_CALL_NO_RWG_SE, i64, i64)
+ DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+ DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.c
++++ b/target/arm/tcg/helper-a64.c
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, void *fpstp)
+     return float64_muladd(a, b, float64_three, float_muladd_halve_result, fpst);
+ }
+-/* Pairwise long add: add pairs of adjacent elements into
+- * double-width elements in the result (eg _s8 is an 8x8->16 op)
+- */
+-uint64_t HELPER(neon_addlp_s8)(uint64_t a)
+-{
+-    uint64_t nsignmask = 0x0080008000800080ULL;
+-    uint64_t wsignmask = 0x8000800080008000ULL;
+-    uint64_t elementmask = 0x00ff00ff00ff00ffULL;
+-    uint64_t tmp1, tmp2;
+-    uint64_t res, signres;
+-
+-    /* Extract odd elements, sign extend each to a 16 bit field */
+-    tmp1 = a & elementmask;
+-    tmp1 ^= nsignmask;
+-    tmp1 |= wsignmask;
+-    tmp1 = (tmp1 - nsignmask) ^ wsignmask;
+-    /* Ditto for the even elements */
+-    tmp2 = (a >> 8) & elementmask;
+-    tmp2 ^= nsignmask;
+-    tmp2 |= wsignmask;
+-    tmp2 = (tmp2 - nsignmask) ^ wsignmask;
+-
+-    /* calculate the result by summing bits 0..14, 16..22, etc,
+-     * and then adjusting the sign bits 15, 23, etc manually.
+-     * This ensures the addition can't overflow the 16 bit field.
+-     */
+-    signres = (tmp1 ^ tmp2) & wsignmask;
+-    res = (tmp1 & ~wsignmask) + (tmp2 & ~wsignmask);
+-    res ^= signres;
+-
+-    return res;
+-}
+-
+ uint64_t HELPER(neon_addlp_u8)(uint64_t a)
+ {
+     uint64_t tmp;
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addlp_u8)(uint64_t a)
+     return tmp;
+ }
+-uint64_t HELPER(neon_addlp_s16)(uint64_t a)
+-{
+-    int32_t reslo, reshi;
+-
+-    reslo = (int32_t)(int16_t)a + (int32_t)(int16_t)(a >> 16);
+-    reshi = (int32_t)(int16_t)(a >> 32) + (int32_t)(int16_t)(a >> 48);
+-
+-    return (uint32_t)reslo | (((uint64_t)reshi) << 32);
+-}
+-
+ uint64_t HELPER(neon_addlp_u16)(uint64_t a)
+ {
+     uint64_t tmp;
+diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/neon_helper.c
++++ b/target/arm/tcg/neon_helper.c
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_paddl_u32)(uint64_t a, uint64_t b)
+     return low + ((uint64_t)high << 32);
+ }
++/* Pairwise long add: add pairs of adjacent elements into
++ * double-width elements in the result (eg _s8 is an 8x8->16 op)
++ */
++uint64_t HELPER(neon_addlp_s8)(uint64_t a)
++{
++    uint64_t nsignmask = 0x0080008000800080ULL;
++    uint64_t wsignmask = 0x8000800080008000ULL;
++    uint64_t elementmask = 0x00ff00ff00ff00ffULL;
++    uint64_t tmp1, tmp2;
++    uint64_t res, signres;
++
++    /* Extract odd elements, sign extend each to a 16 bit field */
++    tmp1 = a & elementmask;
++    tmp1 ^= nsignmask;
++    tmp1 |= wsignmask;
++    tmp1 = (tmp1 - nsignmask) ^ wsignmask;
++    /* Ditto for the even elements */
++    tmp2 = (a >> 8) & elementmask;
++    tmp2 ^= nsignmask;
++    tmp2 |= wsignmask;
++    tmp2 = (tmp2 - nsignmask) ^ wsignmask;
++
++    /* calculate the result by summing bits 0..14, 16..22, etc,
++     * and then adjusting the sign bits 15, 23, etc manually.
++     * This ensures the addition can't overflow the 16 bit field.
++     */
++    signres = (tmp1 ^ tmp2) & wsignmask;
++    res = (tmp1 & ~wsignmask) + (tmp2 & ~wsignmask);
++    res ^= signres;
++
++    return res;
++}
++
++uint64_t HELPER(neon_addlp_s16)(uint64_t a)
++{
++    int32_t reslo, reshi;
++
++    reslo = (int32_t)(int16_t)a + (int32_t)(int16_t)(a >> 16);
++    reshi = (int32_t)(int16_t)(a >> 32) + (int32_t)(int16_t)(a >> 48);
++
++    return (uint32_t)reslo | (((uint64_t)reshi) << 32);
++}
++
+ uint64_t HELPER(neon_subl_u16)(uint64_t a, uint64_t b)
+ {
+     uint64_t mask;
+--
+.34.1

-[PULL 11/48] target/arm: Rename ARMMMUIdx_S2NS to ARMMMUIdx_Stage2
+[PULL 45/85] target/arm: Introduce gen_gvec_{s,u}{add,ada}lp
 From: Richard Henderson <richard.henderson@linaro.org>
-The EL1&0 regime is the only one that uses 2-stage translation.
+Pairwise addition with and without accumulation.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-11-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-46-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h           |  4 +--
+ target/arm/helper.h             |   2 -
- target/arm/internals.h     |  2 +-
+ target/arm/tcg/translate.h      |   9 ++
- target/arm/helper.c        | 57 ++++++++++++++++++++------------------
+ target/arm/tcg/gengvec.c        | 230 ++++++++++++++++++++++++++++++++
- target/arm/translate-a64.c |  2 +-
+ target/arm/tcg/neon_helper.c    |  22 ---
- target/arm/translate.c     |  2 +-
+ target/arm/tcg/translate-neon.c | 150 +--------------------
-files changed, 35 insertions(+), 32 deletions(-)
+files changed, 243 insertions(+), 170 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/helper.h
-+++ b/target/arm/cpu.h
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(neon_widen_s16, i64, i32)
-     ARMMMUIdx_S1E3 = 3 | ARM_MMU_IDX_A,
-     ARMMMUIdx_S1SE0 = 4 | ARM_MMU_IDX_A,
+ DEF_HELPER_2(neon_addl_u16, i64, i64, i64)
-     ARMMMUIdx_S1SE1 = 5 | ARM_MMU_IDX_A,
+ DEF_HELPER_2(neon_addl_u32, i64, i64, i64)
--    ARMMMUIdx_S2NS = 6 | ARM_MMU_IDX_A,
+-DEF_HELPER_2(neon_paddl_u16, i64, i64, i64)
-+    ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
+-DEF_HELPER_2(neon_paddl_u32, i64, i64, i64)
-     ARMMMUIdx_MUser = 0 | ARM_MMU_IDX_M,
+ DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
-     ARMMMUIdx_MPriv = 1 | ARM_MMU_IDX_M,
+ DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
-     ARMMMUIdx_MUserNegPri = 2 | ARM_MMU_IDX_M,
+ DEF_HELPER_2(neon_subl_u16, i64, i64, i64)
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdxBit {
+diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
      ARMMMUIdxBit_S1E3 = 1 << 3,
      ARMMMUIdxBit_S1SE0 = 1 << 4,
      ARMMMUIdxBit_S1SE1 = 1 << 5,
 -    ARMMMUIdxBit_S2NS = 1 << 6,
 +    ARMMMUIdxBit_Stage2 = 1 << 6,
      ARMMMUIdxBit_MUser = 1 << 0,
      ARMMMUIdxBit_MPriv = 1 << 1,
      ARMMMUIdxBit_MUserNegPri = 1 << 2,
 diff --git a/target/arm/internals.h b/target/arm/internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/tcg/translate.h
-+++ b/target/arm/internals.h
++++ b/target/arm/tcg/translate.h
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-     case ARMMMUIdx_S1NSE0:
+ void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-     case ARMMMUIdx_S1NSE1:
+                     uint32_t opr_sz, uint32_t max_sz);
-     case ARMMMUIdx_S1E2:
--    case ARMMMUIdx_S2NS:
++void gen_gvec_saddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+    case ARMMMUIdx_Stage2:
++                     uint32_t opr_sz, uint32_t max_sz);
-     case ARMMMUIdx_MPrivNegPri:
++void gen_gvec_sadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-     case ARMMMUIdx_MUserNegPri:
++                     uint32_t opr_sz, uint32_t max_sz);
-     case ARMMMUIdx_MPriv:
++void gen_gvec_uaddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-diff --git a/target/arm/helper.c b/target/arm/helper.c
++                     uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_uadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/gengvec.c
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/gengvec.c
-@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-     tlb_flush_by_mmuidx(cs,
+         g_assert_not_reached();
                          ARMMMUIdxBit_E10_1 |
                          ARMMMUIdxBit_E10_0 |
 -                        ARMMMUIdxBit_S2NS);
 +                        ARMMMUIdxBit_Stage2);
  }
  static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx_all_cpus_synced(cs,
                                          ARMMMUIdxBit_E10_1 |
                                          ARMMMUIdxBit_E10_0 |
 -                                        ARMMMUIdxBit_S2NS);
 +                                        ARMMMUIdxBit_Stage2);
  }
  static void tlbiipas2_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiipas2_write(CPUARMState *env, const ARMCPRegInfo *ri,
      pageaddr = sextract64(value << 12, 0, 40);
 -    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S2NS);
 +    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
  }
  static void tlbiipas2_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiipas2_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      pageaddr = sextract64(value << 12, 0, 40);
      tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
 -                                             ARMMMUIdxBit_S2NS);
 +                                             ARMMMUIdxBit_Stage2);
  }
  static void tlbiall_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void vttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
      ARMCPU *cpu = env_archcpu(env);
      CPUState *cs = CPU(cpu);
 -    /* Accesses to VTTBR may change the VMID so we must flush the TLB.  */
 +    /*
 +     * A change in VMID to the stage2 page table (Stage2) invalidates
 +     * the combined stage 1&2 tlbs (EL10_1 and EL10_0).
 +     */
      if (raw_read(env, ri) != value) {
          tlb_flush_by_mmuidx(cs,
                              ARMMMUIdxBit_E10_1 |
                              ARMMMUIdxBit_E10_0 |
 -                            ARMMMUIdxBit_S2NS);
 +                            ARMMMUIdxBit_Stage2);
          raw_write(env, ri, value);
      }
  }
-@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
++
-     if (arm_is_secure_below_el3(env)) {
++static void gen_saddlp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
-         return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
++{
-     } else if (arm_feature(env, ARM_FEATURE_EL2)) {
++    int half = 4 << vece;
--        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_S2NS;
++    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_Stage2;
++
-     } else {
++    tcg_gen_shli_vec(vece, t, n, half);
-         return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
++    tcg_gen_sari_vec(vece, d, n, half);
-     }
++    tcg_gen_sari_vec(vece, t, t, half);
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
++    tcg_gen_add_vec(vece, d, d, t);
++}
-     pageaddr = sextract64(value << 12, 0, 48);
++
++static void gen_saddlp_s_i64(TCGv_i64 d, TCGv_i64 n)
--    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S2NS);
++{
-+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
++    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_ext32s_i64(t, n);
 +    tcg_gen_sari_i64(d, n, 32);
 +    tcg_gen_add_i64(d, d, t);
 +}
 +
 +void gen_gvec_saddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sari_vec, INDEX_op_shli_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2 g[] = {
 +        { .fniv = gen_saddlp_vec,
 +          .fni8 = gen_helper_neon_addlp_s8,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fniv = gen_saddlp_vec,
 +          .fni8 = gen_helper_neon_addlp_s16,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fniv = gen_saddlp_vec,
 +          .fni8 = gen_saddlp_s_i64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    assert(vece <= MO_32);
 +    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 +}
 +
 +static void gen_sadalp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    gen_saddlp_vec(vece, t, n);
 +    tcg_gen_add_vec(vece, d, d, t);
 +}
 +
 +static void gen_sadalp_b_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_helper_neon_addlp_s8(t, n);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +}
 +
 +static void gen_sadalp_h_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_helper_neon_addlp_s16(t, n);
 +    tcg_gen_vec_add32_i64(d, d, t);
 +}
 +
 +static void gen_sadalp_s_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_saddlp_s_i64(t, n);
 +    tcg_gen_add_i64(d, d, t);
 +}
 +
 +void gen_gvec_sadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sari_vec, INDEX_op_shli_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2 g[] = {
 +        { .fniv = gen_sadalp_vec,
 +          .fni8 = gen_sadalp_b_i64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fniv = gen_sadalp_vec,
 +          .fni8 = gen_sadalp_h_i64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fniv = gen_sadalp_vec,
 +          .fni8 = gen_sadalp_s_i64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +    assert(vece <= MO_32);
 +    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 +}
 +
 +static void gen_uaddlp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
 +{
 +    int half = 4 << vece;
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec m = tcg_constant_vec_matching(d, vece, MAKE_64BIT_MASK(0, half));
 +
 +    tcg_gen_shri_vec(vece, t, n, half);
 +    tcg_gen_and_vec(vece, d, n, m);
 +    tcg_gen_add_vec(vece, d, d, t);
 +}
 +
 +static void gen_uaddlp_b_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +    TCGv_i64 m = tcg_constant_i64(dup_const(MO_16, 0xff));
 +
 +    tcg_gen_shri_i64(t, n, 8);
 +    tcg_gen_and_i64(d, n, m);
 +    tcg_gen_and_i64(t, t, m);
 +    /* No carry between widened unsigned elements. */
 +    tcg_gen_add_i64(d, d, t);
 +}
 +
 +static void gen_uaddlp_h_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +    TCGv_i64 m = tcg_constant_i64(dup_const(MO_32, 0xffff));
 +
 +    tcg_gen_shri_i64(t, n, 16);
 +    tcg_gen_and_i64(d, n, m);
 +    tcg_gen_and_i64(t, t, m);
 +    /* No carry between widened unsigned elements. */
 +    tcg_gen_add_i64(d, d, t);
 +}
 +
 +static void gen_uaddlp_s_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_ext32u_i64(t, n);
 +    tcg_gen_shri_i64(d, n, 32);
 +    tcg_gen_add_i64(d, d, t);
 +}
 +
 +void gen_gvec_uaddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2 g[] = {
 +        { .fniv = gen_uaddlp_vec,
 +          .fni8 = gen_uaddlp_b_i64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fniv = gen_uaddlp_vec,
 +          .fni8 = gen_uaddlp_h_i64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fniv = gen_uaddlp_vec,
 +          .fni8 = gen_uaddlp_s_i64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    assert(vece <= MO_32);
 +    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 +}
 +
 +static void gen_uadalp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    gen_uaddlp_vec(vece, t, n);
 +    tcg_gen_add_vec(vece, d, d, t);
 +}
 +
 +static void gen_uadalp_b_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_uaddlp_b_i64(t, n);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +}
 +
 +static void gen_uadalp_h_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_uaddlp_h_i64(t, n);
 +    tcg_gen_vec_add32_i64(d, d, t);
 +}
 +
 +static void gen_uadalp_s_i64(TCGv_i64 d, TCGv_i64 n)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_uaddlp_s_i64(t, n);
 +    tcg_gen_add_i64(d, d, t);
 +}
 +
 +void gen_gvec_uadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2 g[] = {
 +        { .fniv = gen_uadalp_vec,
 +          .fni8 = gen_uadalp_b_i64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fniv = gen_uadalp_vec,
 +          .fni8 = gen_uadalp_h_i64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fniv = gen_uadalp_vec,
 +          .fni8 = gen_uadalp_s_i64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    assert(vece <= MO_32);
 +    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 +}
 diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/neon_helper.c
 +++ b/target/arm/tcg/neon_helper.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addl_u32)(uint64_t a, uint64_t b)
      return (a + b) ^ mask;
  }
- static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-uint64_t HELPER(neon_paddl_u16)(uint64_t a, uint64_t b)
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-{
-     pageaddr = sextract64(value << 12, 0, 48);
+-    uint64_t tmp;
+-    uint64_t tmp2;
-     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
+-
--                                             ARMMMUIdxBit_S2NS);
+-    tmp = a & 0x0000ffff0000ffffull;
-+                                             ARMMMUIdxBit_Stage2);
+-    tmp += (a >> 16) & 0x0000ffff0000ffffull;
- }
+-    tmp2 = b & 0xffff0000ffff0000ull;
+-    tmp2 += (b << 16) & 0xffff0000ffff0000ull;
- static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
+-    return    ( tmp         & 0xffff)
-@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_interrupt(CPUState *cs)
+-            | ((tmp  >> 16) & 0xffff0000ull)
- static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
+-            | ((tmp2 << 16) & 0xffff00000000ull)
- {
+-            | ( tmp2        & 0xffff000000000000ull);
-     switch (mmu_idx) {
+-}
--    case ARMMMUIdx_S2NS:
+-
-+    case ARMMMUIdx_Stage2:
+-uint64_t HELPER(neon_paddl_u32)(uint64_t a, uint64_t b)
-     case ARMMMUIdx_S1E2:
+-{
-         return 2;
+-    uint32_t low = a + (a >> 32);
-     case ARMMMUIdx_S1E3:
+-    uint32_t high = b + (b >> 32);
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_translation_disabled(CPUARMState *env,
+-    return low + ((uint64_t)high << 32);
-         }
+-}
-     }
+-
+ /* Pairwise long add: add pairs of adjacent elements into
--    if (mmu_idx == ARMMMUIdx_S2NS) {
+  * double-width elements in the result (eg _s8 is an 8x8->16 op)
-+    if (mmu_idx == ARMMMUIdx_Stage2) {
+  */
-         /* HCR.DC means HCR.VM behaves as 1 */
+diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
-         return (env->cp15.hcr_el2 & (HCR_DC | HCR_VM)) == 0;
+index XXXXXXX..XXXXXXX 100644
-     }
+--- a/target/arm/tcg/translate-neon.c
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_translation_big_endian(CPUARMState *env,
++++ b/target/arm/tcg/translate-neon.c
- static inline uint64_t regime_ttbr(CPUARMState *env, ARMMMUIdx mmu_idx,
+@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP_scalar(DisasContext *s, arg_VDUP_scalar *a)
                                     int ttbrn)
  {
 -    if (mmu_idx == ARMMMUIdx_S2NS) {
 +    if (mmu_idx == ARMMMUIdx_Stage2) {
          return env->cp15.vttbr_el2;
      }
      if (ttbrn == 0) {
@@ -XXX,XX +XXX,XX @@ static inline uint64_t regime_ttbr(CPUARMState *env, ARMMMUIdx mmu_idx,
  /* Return the TCR controlling this translation regime */
  static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
  {
 -    if (mmu_idx == ARMMMUIdx_S2NS) {
 +    if (mmu_idx == ARMMMUIdx_Stage2) {
          return &env->cp15.vtcr_el2;
      }
      return &env->cp15.tcr_el[regime_el(env, mmu_idx)];
@@ -XXX,XX +XXX,XX @@ static int get_S1prot(CPUARMState *env, ARMMMUIdx mmu_idx, bool is_aa64,
      bool have_wxn;
      int wxn = 0;
 -    assert(mmu_idx != ARMMMUIdx_S2NS);
 +    assert(mmu_idx != ARMMMUIdx_Stage2);
      user_rw = simple_ap_to_rw_prot_is_user(ap, true);
      if (is_user) {
@@ -XXX,XX +XXX,XX @@ static hwaddr S1_ptw_translate(CPUARMState *env, ARMMMUIdx mmu_idx,
                                 ARMMMUFaultInfo *fi)
  {
      if ((mmu_idx == ARMMMUIdx_S1NSE0 || mmu_idx == ARMMMUIdx_S1NSE1) &&
 -        !regime_translation_disabled(env, ARMMMUIdx_S2NS)) {
 +        !regime_translation_disabled(env, ARMMMUIdx_Stage2)) {
          target_ulong s2size;
          hwaddr s2pa;
          int s2prot;
@@ -XXX,XX +XXX,XX @@ static hwaddr S1_ptw_translate(CPUARMState *env, ARMMMUIdx mmu_idx,
              pcacheattrs = &cacheattrs;
          }
 -        ret = get_phys_addr_lpae(env, addr, 0, ARMMMUIdx_S2NS, &s2pa,
 +        ret = get_phys_addr_lpae(env, addr, 0, ARMMMUIdx_Stage2, &s2pa,
                                   &txattrs, &s2prot, &s2size, fi, pcacheattrs);
          if (ret) {
              assert(fi->type != ARMFault_None);
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
          tsz = extract32(tcr, 0, 6);
          using64k = extract32(tcr, 14, 1);
          using16k = extract32(tcr, 15, 1);
 -        if (mmu_idx == ARMMMUIdx_S2NS) {
 +        if (mmu_idx == ARMMMUIdx_Stage2) {
              /* VTCR_EL2 */
              tbi = tbid = hpd = false;
          } else {
@@ -XXX,XX +XXX,XX @@ static ARMVAParameters aa32_va_parameters(CPUARMState *env, uint32_t va,
      int select, tsz;
      bool epd, hpd;
 -    if (mmu_idx == ARMMMUIdx_S2NS) {
 +    if (mmu_idx == ARMMMUIdx_Stage2) {
          /* VTCR */
          bool sext = extract32(tcr, 4, 1);
          bool sign = extract32(tcr, 3, 1);
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
          level = 1;
          /* There is no TTBR1 for EL2 */
          ttbr1_valid = (el != 2);
 -        addrsize = (mmu_idx == ARMMMUIdx_S2NS ? 40 : 32);
 +        addrsize = (mmu_idx == ARMMMUIdx_Stage2 ? 40 : 32);
          inputsize = addrsize - param.tsz;
      }
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
          goto do_fault;
      }
 -    if (mmu_idx != ARMMMUIdx_S2NS) {
 +    if (mmu_idx != ARMMMUIdx_Stage2) {
          /* The starting level depends on the virtual address size (which can
           * be up to 48 bits) and the translation granule size. It indicates
           * the number of strides (stride bits at a time) needed to
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
          attrs = extract64(descriptor, 2, 10)
              | (extract64(descriptor, 52, 12) << 10);
 -        if (mmu_idx == ARMMMUIdx_S2NS) {
 +        if (mmu_idx == ARMMMUIdx_Stage2) {
              /* Stage 2 table descriptors do not include any attribute fields */
              break;
          }
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
      ap = extract32(attrs, 4, 2);
      xn = extract32(attrs, 12, 1);
 -    if (mmu_idx == ARMMMUIdx_S2NS) {
 +    if (mmu_idx == ARMMMUIdx_Stage2) {
          ns = true;
          *prot = get_S2prot(env, ap, xn);
      } else {
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
      }
      if (cacheattrs != NULL) {
 -        if (mmu_idx == ARMMMUIdx_S2NS) {
 +        if (mmu_idx == ARMMMUIdx_Stage2) {
              cacheattrs->attrs = convert_stage2_attrs(env,
                                                       extract32(attrs, 0, 4));
          } else {
@@ -XXX,XX +XXX,XX @@ do_fault:
      fi->type = fault_type;
      fi->level = level;
      /* Tag the error as S2 for failed S1 PTW at S2 or ordinary S2.  */
 -    fi->stage2 = fi->s1ptw || (mmu_idx == ARMMMUIdx_S2NS);
 +    fi->stage2 = fi->s1ptw || (mmu_idx == ARMMMUIdx_Stage2);
      return true;
  }
-@@ -XXX,XX +XXX,XX @@ bool get_phys_addr(CPUARMState *env, target_ulong address,
+-static bool do_2misc_pairwise(DisasContext *s, arg_2misc *a,
-                                 prot, page_size, fi, cacheattrs);
+-                              NeonGenWidenFn *widenfn,
+-                              NeonGenTwo64OpFn *opfn,
-             /* If S1 fails or S2 is disabled, return early.  */
+-                              NeonGenTwo64OpFn *accfn)
--            if (ret || regime_translation_disabled(env, ARMMMUIdx_S2NS)) {
+-{
-+            if (ret || regime_translation_disabled(env, ARMMMUIdx_Stage2)) {
+-    /*
-                 *phys_ptr = ipa;
+-     * Pairwise long operations: widen both halves of the pair,
-                 return ret;
+-     * combine the pairs with the opfn, and then possibly accumulate
-             }
+-     * into the destination with the accfn.
+-     */
-             /* S1 is done. Now do S2 translation.  */
+-    int pass;
--            ret = get_phys_addr_lpae(env, ipa, access_type, ARMMMUIdx_S2NS,
+-
-+            ret = get_phys_addr_lpae(env, ipa, access_type, ARMMMUIdx_Stage2,
+-    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-                                      phys_ptr, attrs, &s2_prot,
+-        return false;
-                                      page_size, fi,
+-    }
-                                      cacheattrs != NULL ? &cacheattrs2 : NULL);
+-
-@@ -XXX,XX +XXX,XX @@ bool get_phys_addr(CPUARMState *env, target_ulong address,
+-    /* UNDEF accesses to D16-D31 if they don't exist. */
-     /* Fast Context Switch Extension. This doesn't exist at all in v8.
+-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-      * In v7 and earlier it affects all stage 1 translations.
+-        ((a->vd | a->vm) & 0x10)) {
-      */
+-        return false;
--    if (address < 0x02000000 && mmu_idx != ARMMMUIdx_S2NS
+-    }
-+    if (address < 0x02000000 && mmu_idx != ARMMMUIdx_Stage2
+-
-         && !arm_feature(env, ARM_FEATURE_V8)) {
+-    if ((a->vd | a->vm) & a->q) {
-         if (regime_el(env, mmu_idx) == 3) {
+-        return false;
-             address += env->cp15.fcseidr_s;
+-    }
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+-
-index XXXXXXX..XXXXXXX 100644
+-    if (!widenfn) {
---- a/target/arm/translate-a64.c
+-        return false;
-+++ b/target/arm/translate-a64.c
+-    }
-@@ -XXX,XX +XXX,XX @@ static inline int get_a64_user_mem_index(DisasContext *s)
+-
-     case ARMMMUIdx_S1SE1:
+-    if (!vfp_access_check(s)) {
-         useridx = ARMMMUIdx_S1SE0;
+-        return true;
-         break;
+-    }
--    case ARMMMUIdx_S2NS:
+-
-+    case ARMMMUIdx_Stage2:
+-    for (pass = 0; pass < a->q + 1; pass++) {
-         g_assert_not_reached();
+-        TCGv_i32 tmp;
-     default:
+-        TCGv_i64 rm0_64, rm1_64, rd_64;
-         useridx = s->mmu_idx;
+-
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+-        rm0_64 = tcg_temp_new_i64();
-index XXXXXXX..XXXXXXX 100644
+-        rm1_64 = tcg_temp_new_i64();
---- a/target/arm/translate.c
+-        rd_64 = tcg_temp_new_i64();
-+++ b/target/arm/translate.c
+-
-@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
+-        tmp = tcg_temp_new_i32();
-     case ARMMMUIdx_MSUserNegPri:
+-        read_neon_element32(tmp, a->vm, pass * 2, MO_32);
-     case ARMMMUIdx_MSPrivNegPri:
+-        widenfn(rm0_64, tmp);
-         return arm_to_core_mmu_idx(ARMMMUIdx_MSUserNegPri);
+-        read_neon_element32(tmp, a->vm, pass * 2 + 1, MO_32);
--    case ARMMMUIdx_S2NS:
+-        widenfn(rm1_64, tmp);
-+    case ARMMMUIdx_Stage2:
+-
-     default:
+-        opfn(rd_64, rm0_64, rm1_64);
-         g_assert_not_reached();
+-
-     }
+-        if (accfn) {
 -            TCGv_i64 tmp64 = tcg_temp_new_i64();
 -            read_neon_element64(tmp64, a->vd, pass, MO_64);
 -            accfn(rd_64, tmp64, rd_64);
 -        }
 -        write_neon_element64(rd_64, a->vd, pass, MO_64);
 -    }
 -    return true;
 -}
 -
 -static bool trans_VPADDL_S(DisasContext *s, arg_2misc *a)
 -{
 -    static NeonGenWidenFn * const widenfn[] = {
 -        gen_helper_neon_widen_s8,
 -        gen_helper_neon_widen_s16,
 -        tcg_gen_ext_i32_i64,
 -        NULL,
 -    };
 -    static NeonGenTwo64OpFn * const opfn[] = {
 -        gen_helper_neon_paddl_u16,
 -        gen_helper_neon_paddl_u32,
 -        tcg_gen_add_i64,
 -        NULL,
 -    };
 -
 -    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size], NULL);
 -}
 -
 -static bool trans_VPADDL_U(DisasContext *s, arg_2misc *a)
 -{
 -    static NeonGenWidenFn * const widenfn[] = {
 -        gen_helper_neon_widen_u8,
 -        gen_helper_neon_widen_u16,
 -        tcg_gen_extu_i32_i64,
 -        NULL,
 -    };
 -    static NeonGenTwo64OpFn * const opfn[] = {
 -        gen_helper_neon_paddl_u16,
 -        gen_helper_neon_paddl_u32,
 -        tcg_gen_add_i64,
 -        NULL,
 -    };
 -
 -    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size], NULL);
 -}
 -
 -static bool trans_VPADAL_S(DisasContext *s, arg_2misc *a)
 -{
 -    static NeonGenWidenFn * const widenfn[] = {
 -        gen_helper_neon_widen_s8,
 -        gen_helper_neon_widen_s16,
 -        tcg_gen_ext_i32_i64,
 -        NULL,
 -    };
 -    static NeonGenTwo64OpFn * const opfn[] = {
 -        gen_helper_neon_paddl_u16,
 -        gen_helper_neon_paddl_u32,
 -        tcg_gen_add_i64,
 -        NULL,
 -    };
 -    static NeonGenTwo64OpFn * const accfn[] = {
 -        gen_helper_neon_addl_u16,
 -        gen_helper_neon_addl_u32,
 -        tcg_gen_add_i64,
 -        NULL,
 -    };
 -
 -    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size],
 -                             accfn[a->size]);
 -}
 -
 -static bool trans_VPADAL_U(DisasContext *s, arg_2misc *a)
 -{
 -    static NeonGenWidenFn * const widenfn[] = {
 -        gen_helper_neon_widen_u8,
 -        gen_helper_neon_widen_u16,
 -        tcg_gen_extu_i32_i64,
 -        NULL,
 -    };
 -    static NeonGenTwo64OpFn * const opfn[] = {
 -        gen_helper_neon_paddl_u16,
 -        gen_helper_neon_paddl_u32,
 -        tcg_gen_add_i64,
 -        NULL,
 -    };
 -    static NeonGenTwo64OpFn * const accfn[] = {
 -        gen_helper_neon_addl_u16,
 -        gen_helper_neon_addl_u32,
 -        tcg_gen_add_i64,
 -        NULL,
 -    };
 -
 -    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size],
 -                             accfn[a->size]);
 -}
 -
  typedef void ZipFn(TCGv_ptr, TCGv_ptr);
  static bool do_zip_uzp(DisasContext *s, arg_2misc *a,
@@ -XXX,XX +XXX,XX @@ DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
  DO_2MISC_VEC(VCLS, gen_gvec_cls)
  DO_2MISC_VEC(VCLZ, gen_gvec_clz)
  DO_2MISC_VEC(VREV64, gen_gvec_rev64)
 +DO_2MISC_VEC(VPADDL_S, gen_gvec_saddlp)
 +DO_2MISC_VEC(VPADDL_U, gen_gvec_uaddlp)
 +DO_2MISC_VEC(VPADAL_S, gen_gvec_sadalp)
 +DO_2MISC_VEC(VPADAL_U, gen_gvec_uadalp)
  static bool trans_VMVN(DisasContext *s, arg_2misc *a)
  {
 --
-.20.1
+.34.1

-New patch
+[PULL 46/85] target/arm: Convert handle_2misc_pairwise to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+This includes SADDLP, UADDLP, SADALP, UADALP.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-47-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/helper-a64.h    |  2 -
+ target/arm/tcg/a64.decode      |  5 ++
+ target/arm/tcg/helper-a64.c    | 18 --------
+ target/arm/tcg/translate-a64.c | 84 +++-------------------------------
+files changed, 11 insertions(+), 98 deletions(-)
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.h
++++ b/target/arm/tcg/helper-a64.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(recpsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+ DEF_HELPER_FLAGS_3(rsqrtsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+ DEF_HELPER_FLAGS_3(rsqrtsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
+ DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
+-DEF_HELPER_FLAGS_1(neon_addlp_u8, TCG_CALL_NO_RWG_SE, i64, i64)
+-DEF_HELPER_FLAGS_1(neon_addlp_u16, TCG_CALL_NO_RWG_SE, i64, i64)
+ DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+ DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+ DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ CMLT0_v         0.00 1110 ..1 00000 10101 0 ..... .....     @qrr_e
+ REV16_v         0.00 1110 001 00000 00011 0 ..... .....     @qrr_b
+ REV32_v         0.10 1110 0.1 00000 00001 0 ..... .....     @qrr_bh
+ REV64_v         0.00 1110 ..1 00000 00001 0 ..... .....     @qrr_e
++
++SADDLP_v        0.00 1110 ..1 00000 00101 0 ..... .....     @qrr_e
++UADDLP_v        0.10 1110 ..1 00000 00101 0 ..... .....     @qrr_e
++SADALP_v        0.00 1110 ..1 00000 01101 0 ..... .....     @qrr_e
++UADALP_v        0.10 1110 ..1 00000 01101 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.c
++++ b/target/arm/tcg/helper-a64.c
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, void *fpstp)
+     return float64_muladd(a, b, float64_three, float_muladd_halve_result, fpst);
+ }
+-uint64_t HELPER(neon_addlp_u8)(uint64_t a)
+-{
+-    uint64_t tmp;
+-
+-    tmp = a & 0x00ff00ff00ff00ffULL;
+-    tmp += (a >> 8) & 0x00ff00ff00ff00ffULL;
+-    return tmp;
+-}
+-
+-uint64_t HELPER(neon_addlp_u16)(uint64_t a)
+-{
+-    uint64_t tmp;
+-
+-    tmp = a & 0x0000ffff0000ffffULL;
+-    tmp += (a >> 16) & 0x0000ffff0000ffffULL;
+-    return tmp;
+-}
+-
+ /* Floating-point reciprocal exponent - see FPRecpX in ARM ARM */
+ uint32_t HELPER(frecpx_f16)(uint32_t a, void *fpstp)
+ {
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ TRANS(CLS_v, do_gvec_fn2_bhs, a, gen_gvec_cls)
+ TRANS(CLZ_v, do_gvec_fn2_bhs, a, gen_gvec_clz)
+ TRANS(REV64_v, do_gvec_fn2_bhs, a, gen_gvec_rev64)
++TRANS(SADDLP_v, do_gvec_fn2_bhs, a, gen_gvec_saddlp)
++TRANS(UADDLP_v, do_gvec_fn2_bhs, a, gen_gvec_uaddlp)
++TRANS(SADALP_v, do_gvec_fn2_bhs, a, gen_gvec_sadalp)
++TRANS(UADALP_v, do_gvec_fn2_bhs, a, gen_gvec_uadalp)
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
+     }
+ }
+-static void handle_2misc_pairwise(DisasContext *s, int opcode, bool u,
+-                                  bool is_q, int size, int rn, int rd)
+-{
+-    /* Implement the pairwise operations from 2-misc:
+-     * SADDLP, UADDLP, SADALP, UADALP.
+-     * These all add pairs of elements in the input to produce a
+-     * double-width result element in the output (possibly accumulating).
+-     */
+-    bool accum = (opcode == 0x6);
+-    int maxpass = is_q ? 2 : 1;
+-    int pass;
+-    TCGv_i64 tcg_res[2];
+-
+-    if (size == 2) {
+-        /* 32 + 32 -> 64 op */
+-        MemOp memop = size + (u ? 0 : MO_SIGN);
+-
+-        for (pass = 0; pass < maxpass; pass++) {
+-            TCGv_i64 tcg_op1 = tcg_temp_new_i64();
+-            TCGv_i64 tcg_op2 = tcg_temp_new_i64();
+-
+-            tcg_res[pass] = tcg_temp_new_i64();
+-
+-            read_vec_element(s, tcg_op1, rn, pass * 2, memop);
+-            read_vec_element(s, tcg_op2, rn, pass * 2 + 1, memop);
+-            tcg_gen_add_i64(tcg_res[pass], tcg_op1, tcg_op2);
+-            if (accum) {
+-                read_vec_element(s, tcg_op1, rd, pass, MO_64);
+-                tcg_gen_add_i64(tcg_res[pass], tcg_res[pass], tcg_op1);
+-            }
+-        }
+-    } else {
+-        for (pass = 0; pass < maxpass; pass++) {
+-            TCGv_i64 tcg_op = tcg_temp_new_i64();
+-            NeonGenOne64OpFn *genfn;
+-            static NeonGenOne64OpFn * const fns[2][2] = {
+-                { gen_helper_neon_addlp_s8,  gen_helper_neon_addlp_u8 },
+-                { gen_helper_neon_addlp_s16,  gen_helper_neon_addlp_u16 },
+-            };
+-
+-            genfn = fns[size][u];
+-
+-            tcg_res[pass] = tcg_temp_new_i64();
+-
+-            read_vec_element(s, tcg_op, rn, pass, MO_64);
+-            genfn(tcg_res[pass], tcg_op);
+-
+-            if (accum) {
+-                read_vec_element(s, tcg_op, rd, pass, MO_64);
+-                if (size == 0) {
+-                    gen_helper_neon_addl_u16(tcg_res[pass],
+-                                             tcg_res[pass], tcg_op);
+-                } else {
+-                    gen_helper_neon_addl_u32(tcg_res[pass],
+-                                             tcg_res[pass], tcg_op);
+-                }
+-            }
+-        }
+-    }
+-    if (!is_q) {
+-        tcg_res[1] = tcg_constant_i64(0);
+-    }
+-    for (pass = 0; pass < 2; pass++) {
+-        write_vec_element(s, tcg_res[pass], rd, pass, MO_64);
+-    }
+-}
+-
+ static void handle_shll(DisasContext *s, bool is_q, int size, int rn, int rd)
+ {
+     /* Implement SHLL and SHLL2 */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         handle_2misc_narrow(s, false, opcode, u, is_q, size, rn, rd);
+         return;
+-    case 0x2: /* SADDLP, UADDLP */
+-    case 0x6: /* SADALP, UADALP */
+-        if (size == 3) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        if (!fp_access_check(s)) {
+-            return;
+-        }
+-        handle_2misc_pairwise(s, opcode, u, is_q, size, rn, rd);
+-        return;
+     case 0x13: /* SHLL, SHLL2 */
+         if (u == 0 || size == 3) {
+             unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     default:
+     case 0x0: /* REV64, REV32 */
+     case 0x1: /* REV16 */
++    case 0x2: /* SADDLP, UADDLP */
+     case 0x3: /* SUQADD, USQADD */
+     case 0x4: /* CLS, CLZ */
+     case 0x5: /* CNT, NOT, RBIT */
++    case 0x6: /* SADALP, UADALP */
+     case 0x7: /* SQABS, SQNEG */
+     case 0x8: /* CMGT, CMGE */
+     case 0x9: /* CMEQ, CMLE */
+--
+.34.1

-New patch
+[PULL 47/85] target/arm: Remove helper_neon_{add,sub}l_u{16,32}
+From: Richard Henderson <richard.henderson@linaro.org>
+These have generic equivalents: tcg_gen_vec_{add,sub}{16,32}_i64.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-48-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/helper.h             |  4 ----
+ target/arm/tcg/neon_helper.c    | 36 ---------------------------------
+ target/arm/tcg/translate-neon.c | 22 ++++++++++----------
+files changed, 11 insertions(+), 51 deletions(-)
+diff --git a/target/arm/helper.h b/target/arm/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.h
++++ b/target/arm/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(neon_widen_s8, i64, i32)
+ DEF_HELPER_1(neon_widen_u16, i64, i32)
+ DEF_HELPER_1(neon_widen_s16, i64, i32)
+-DEF_HELPER_2(neon_addl_u16, i64, i64, i64)
+-DEF_HELPER_2(neon_addl_u32, i64, i64, i64)
+ DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
+ DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
+-DEF_HELPER_2(neon_subl_u16, i64, i64, i64)
+-DEF_HELPER_2(neon_subl_u32, i64, i64, i64)
+ DEF_HELPER_3(neon_addl_saturate_s32, i64, env, i64, i64)
+ DEF_HELPER_3(neon_addl_saturate_s64, i64, env, i64, i64)
+ DEF_HELPER_2(neon_abdl_u16, i64, i32, i32)
+diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/neon_helper.c
++++ b/target/arm/tcg/neon_helper.c
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_widen_s16)(uint32_t x)
+     return ((uint32_t)(int16_t)x) | (high << 32);
+ }
+-uint64_t HELPER(neon_addl_u16)(uint64_t a, uint64_t b)
+-{
+-    uint64_t mask;
+-    mask = (a ^ b) & 0x8000800080008000ull;
+-    a &= ~0x8000800080008000ull;
+-    b &= ~0x8000800080008000ull;
+-    return (a + b) ^ mask;
+-}
+-
+-uint64_t HELPER(neon_addl_u32)(uint64_t a, uint64_t b)
+-{
+-    uint64_t mask;
+-    mask = (a ^ b) & 0x8000000080000000ull;
+-    a &= ~0x8000000080000000ull;
+-    b &= ~0x8000000080000000ull;
+-    return (a + b) ^ mask;
+-}
+-
+ /* Pairwise long add: add pairs of adjacent elements into
+  * double-width elements in the result (eg _s8 is an 8x8->16 op)
+  */
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addlp_s16)(uint64_t a)
+     return (uint32_t)reslo | (((uint64_t)reshi) << 32);
+ }
+-uint64_t HELPER(neon_subl_u16)(uint64_t a, uint64_t b)
+-{
+-    uint64_t mask;
+-    mask = (a ^ ~b) & 0x8000800080008000ull;
+-    a |= 0x8000800080008000ull;
+-    b &= ~0x8000800080008000ull;
+-    return (a - b) ^ mask;
+-}
+-
+-uint64_t HELPER(neon_subl_u32)(uint64_t a, uint64_t b)
+-{
+-    uint64_t mask;
+-    mask = (a ^ ~b) & 0x8000000080000000ull;
+-    a |= 0x8000000080000000ull;
+-    b &= ~0x8000000080000000ull;
+-    return (a - b) ^ mask;
+-}
+-
+ uint64_t HELPER(neon_addl_saturate_s32)(CPUARMState *env, uint64_t a, uint64_t b)
+ {
+     uint32_t x, y;
+diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-neon.c
++++ b/target/arm/tcg/translate-neon.c
+@@ -XXX,XX +XXX,XX @@ static bool do_prewiden_3d(DisasContext *s, arg_3diff *a,
+             NULL, NULL,                                                 \
+         };                                                              \
+         static NeonGenTwo64OpFn * const addfn[] = {                     \
+-            gen_helper_neon_##OP##l_u16,                                \
+-            gen_helper_neon_##OP##l_u32,                                \
++            tcg_gen_vec_##OP##16_i64,                                   \
++            tcg_gen_vec_##OP##32_i64,                                   \
+             tcg_gen_##OP##_i64,                                         \
+             NULL,                                                       \
+         };                                                              \
+@@ -XXX,XX +XXX,XX @@ static bool do_narrow_3d(DisasContext *s, arg_3diff *a,
+     static bool trans_##INSN##_3d(DisasContext *s, arg_3diff *a)        \
+     {                                                                   \
+         static NeonGenTwo64OpFn * const addfn[] = {                     \
+-            gen_helper_neon_##OP##l_u16,                                \
+-            gen_helper_neon_##OP##l_u32,                                \
++            tcg_gen_vec_##OP##16_i64,                                   \
++            tcg_gen_vec_##OP##32_i64,                                   \
+             tcg_gen_##OP##_i64,                                         \
+             NULL,                                                       \
+         };                                                              \
+@@ -XXX,XX +XXX,XX @@ static bool trans_VABAL_S_3d(DisasContext *s, arg_3diff *a)
+         NULL,
+     };
+     static NeonGenTwo64OpFn * const addfn[] = {
+-        gen_helper_neon_addl_u16,
+-        gen_helper_neon_addl_u32,
++        tcg_gen_vec_add16_i64,
++        tcg_gen_vec_add32_i64,
+         tcg_gen_add_i64,
+         NULL,
+     };
+@@ -XXX,XX +XXX,XX @@ static bool trans_VABAL_U_3d(DisasContext *s, arg_3diff *a)
+         NULL,
+     };
+     static NeonGenTwo64OpFn * const addfn[] = {
+-        gen_helper_neon_addl_u16,
+-        gen_helper_neon_addl_u32,
++        tcg_gen_vec_add16_i64,
++        tcg_gen_vec_add32_i64,
+         tcg_gen_add_i64,
+         NULL,
+     };
+@@ -XXX,XX +XXX,XX @@ static bool trans_VMULL_U_3d(DisasContext *s, arg_3diff *a)
+             NULL,                                                       \
+         };                                                              \
+         static NeonGenTwo64OpFn * const accfn[] = {                     \
+-            gen_helper_neon_##ACC##l_u16,                               \
+-            gen_helper_neon_##ACC##l_u32,                               \
++            tcg_gen_vec_##ACC##16_i64,                                  \
++            tcg_gen_vec_##ACC##32_i64,                                  \
+             tcg_gen_##ACC##_i64,                                        \
+             NULL,                                                       \
+         };                                                              \
+@@ -XXX,XX +XXX,XX @@ static bool trans_VMULL_U_2sc(DisasContext *s, arg_2scalar *a)
+         };                                                              \
+         static NeonGenTwo64OpFn * const accfn[] = {                     \
+             NULL,                                                       \
+-            gen_helper_neon_##ACC##l_u32,                               \
++            tcg_gen_vec_##ACC##32_i64,                                  \
+             tcg_gen_##ACC##_i64,                                        \
+             NULL,                                                       \
+         };                                                              \
+--
+.34.1

-[PULL 02/48] target/arm: Define isar_feature_aa64_vh
+[PULL 48/85] target/arm: Introduce clear_vec
 From: Richard Henderson <richard.henderson@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+In a couple of places, clearing the entire vector before storing one
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+element is the easiest solution.  Wrap that into a helper function.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-2-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-49-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h | 5 +++++
+ target/arm/tcg/translate-a64.c | 21 ++++++++++++---------
-file changed, 5 insertions(+)
+file changed, 12 insertions(+), 9 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_sve(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static TCGv_i32 read_fp_hreg(DisasContext *s, int reg)
-     return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, SVE) != 0;
+     return v;
  }
-+static inline bool isar_feature_aa64_vh(const ARMISARegisters *id)
+-/* Clear the bits above an N-bit vector, for N = (is_q ? 128 : 64).
 +static void clear_vec(DisasContext *s, int rd)
 +{
-+    return FIELD_EX64(id->id_aa64mmfr1, ID_AA64MMFR1, VH) != 0;
++    unsigned ofs = fp_reg_offset(s, rd, MO_64);
 +    unsigned vsz = vec_full_reg_size(s);
 +
 +    tcg_gen_gvec_dup_imm(MO_64, ofs, vsz, vsz, 0);
 +}
 +
- static inline bool isar_feature_aa64_lor(const ARMISARegisters *id)
++/*
- {
++ * Clear the bits above an N-bit vector, for N = (is_q ? 128 : 64).
-     return FIELD_EX64(id->id_aa64mmfr1, ID_AA64MMFR1, LO) != 0;
+  * If SVE is not enabled, then there are only 128 bits in the vector.
   */
  static void clear_vec_high(DisasContext *s, bool is_q, int rd)
@@ -XXX,XX +XXX,XX @@ static bool trans_SM3SS1(DisasContext *s, arg_SM3SS1 *a)
          TCGv_i32 tcg_op2 = tcg_temp_new_i32();
          TCGv_i32 tcg_op3 = tcg_temp_new_i32();
          TCGv_i32 tcg_res = tcg_temp_new_i32();
 -        unsigned vsz, dofs;
          read_vec_element_i32(s, tcg_op1, a->rn, 3, MO_32);
          read_vec_element_i32(s, tcg_op2, a->rm, 3, MO_32);
@@ -XXX,XX +XXX,XX @@ static bool trans_SM3SS1(DisasContext *s, arg_SM3SS1 *a)
          tcg_gen_rotri_i32(tcg_res, tcg_res, 25);
          /* Clear the whole register first, then store bits [127:96]. */
 -        vsz = vec_full_reg_size(s);
 -        dofs = vec_full_reg_offset(s, a->rd);
 -        tcg_gen_gvec_dup_imm(MO_64, dofs, vsz, vsz, 0);
 +        clear_vec(s, a->rd);
          write_vec_element_i32(s, tcg_res, a->rd, 3, MO_32);
      }
      return true;
@@ -XXX,XX +XXX,XX @@ static bool do_scalar_muladd_widening_idx(DisasContext *s, arg_rrx_e *a,
          TCGv_i64 t0 = tcg_temp_new_i64();
          TCGv_i64 t1 = tcg_temp_new_i64();
          TCGv_i64 t2 = tcg_temp_new_i64();
 -        unsigned vsz, dofs;
          if (acc) {
              read_vec_element(s, t0, a->rd, 0, a->esz + 1);
@@ -XXX,XX +XXX,XX @@ static bool do_scalar_muladd_widening_idx(DisasContext *s, arg_rrx_e *a,
          fn(t0, t1, t2);
          /* Clear the whole register first, then store scalar. */
 -        vsz = vec_full_reg_size(s);
 -        dofs = vec_full_reg_offset(s, a->rd);
 -        tcg_gen_gvec_dup_imm(MO_64, dofs, vsz, vsz, 0);
 +        clear_vec(s, a->rd);
          write_vec_element(s, t0, a->rd, 0, a->esz + 1);
      }
      return true;
 --
-.20.1
+.34.1

-New patch
+[PULL 49/85] target/arm: Convert XTN, SQXTUN, SQXTN, UQXTN to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-50-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |   9 ++
+ target/arm/tcg/translate-a64.c | 153 ++++++++++++++++++++-------------
+files changed, 102 insertions(+), 60 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ CMEQ0_s         0101 1110 111 00000 10011 0 ..... .....     @rr
+ CMLE0_s         0111 1110 111 00000 10011 0 ..... .....     @rr
+ CMLT0_s         0101 1110 111 00000 10101 0 ..... .....     @rr
++SQXTUN_s        0111 1110 ..1 00001 00101 0 ..... .....     @rr_e
++SQXTN_s         0101 1110 ..1 00001 01001 0 ..... .....     @rr_e
++UQXTN_s         0111 1110 ..1 00001 01001 0 ..... .....     @rr_e
++
+ # Advanced SIMD two-register miscellaneous
+ SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+@@ -XXX,XX +XXX,XX @@ SADDLP_v        0.00 1110 ..1 00000 00101 0 ..... .....     @qrr_e
+ UADDLP_v        0.10 1110 ..1 00000 00101 0 ..... .....     @qrr_e
+ SADALP_v        0.00 1110 ..1 00000 01101 0 ..... .....     @qrr_e
+ UADALP_v        0.10 1110 ..1 00000 01101 0 ..... .....     @qrr_e
++
++XTN             0.00 1110 ..1 00001 00101 0 ..... .....     @qrr_e
++SQXTUN_v        0.10 1110 ..1 00001 00101 0 ..... .....     @qrr_e
++SQXTN_v         0.00 1110 ..1 00001 01001 0 ..... .....     @qrr_e
++UQXTN_v         0.10 1110 ..1 00001 01001 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ TRANS(CMLE0_s, do_cmop0_d, a, TCG_COND_LE)
+ TRANS(CMLT0_s, do_cmop0_d, a, TCG_COND_LT)
+ TRANS(CMEQ0_s, do_cmop0_d, a, TCG_COND_EQ)
++static bool do_2misc_narrow_scalar(DisasContext *s, arg_rr_e *a,
++                                   ArithOneOp * const fn[3])
++{
++    if (a->esz == MO_64) {
++        return false;
++    }
++    if (fp_access_check(s)) {
++        TCGv_i64 t = tcg_temp_new_i64();
++
++        read_vec_element(s, t, a->rn, 0, a->esz + 1);
++        fn[a->esz](t, t);
++        clear_vec(s, a->rd);
++        write_vec_element(s, t, a->rd, 0, a->esz);
++    }
++    return true;
++}
++
++#define WRAP_ENV(NAME) \
++    static void gen_##NAME(TCGv_i64 d, TCGv_i64 n) \
++    { gen_helper_##NAME(d, tcg_env, n); }
++
++WRAP_ENV(neon_unarrow_sat8)
++WRAP_ENV(neon_unarrow_sat16)
++WRAP_ENV(neon_unarrow_sat32)
++
++static ArithOneOp * const f_scalar_sqxtun[] = {
++    gen_neon_unarrow_sat8,
++    gen_neon_unarrow_sat16,
++    gen_neon_unarrow_sat32,
++};
++TRANS(SQXTUN_s, do_2misc_narrow_scalar, a, f_scalar_sqxtun)
++
++WRAP_ENV(neon_narrow_sat_s8)
++WRAP_ENV(neon_narrow_sat_s16)
++WRAP_ENV(neon_narrow_sat_s32)
++
++static ArithOneOp * const f_scalar_sqxtn[] = {
++    gen_neon_narrow_sat_s8,
++    gen_neon_narrow_sat_s16,
++    gen_neon_narrow_sat_s32,
++};
++TRANS(SQXTN_s, do_2misc_narrow_scalar, a, f_scalar_sqxtn)
++
++WRAP_ENV(neon_narrow_sat_u8)
++WRAP_ENV(neon_narrow_sat_u16)
++WRAP_ENV(neon_narrow_sat_u32)
++
++static ArithOneOp * const f_scalar_uqxtn[] = {
++    gen_neon_narrow_sat_u8,
++    gen_neon_narrow_sat_u16,
++    gen_neon_narrow_sat_u32,
++};
++TRANS(UQXTN_s, do_2misc_narrow_scalar, a, f_scalar_uqxtn)
++
++#undef WRAP_ENV
++
+ static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ {
+     if (!a->q && a->esz == MO_64) {
+@@ -XXX,XX +XXX,XX @@ TRANS(UADDLP_v, do_gvec_fn2_bhs, a, gen_gvec_uaddlp)
+ TRANS(SADALP_v, do_gvec_fn2_bhs, a, gen_gvec_sadalp)
+ TRANS(UADALP_v, do_gvec_fn2_bhs, a, gen_gvec_uadalp)
++static bool do_2misc_narrow_vector(DisasContext *s, arg_qrr_e *a,
++                                   ArithOneOp * const fn[3])
++{
++    if (a->esz == MO_64) {
++        return false;
++    }
++    if (fp_access_check(s)) {
++        TCGv_i64 t0 = tcg_temp_new_i64();
++        TCGv_i64 t1 = tcg_temp_new_i64();
++
++        read_vec_element(s, t0, a->rn, 0, MO_64);
++        read_vec_element(s, t1, a->rn, 1, MO_64);
++        fn[a->esz](t0, t0);
++        fn[a->esz](t1, t1);
++        write_vec_element(s, t0, a->rd, a->q ? 2 : 0, MO_32);
++        write_vec_element(s, t1, a->rd, a->q ? 3 : 1, MO_32);
++        clear_vec_high(s, a->q, a->rd);
++    }
++    return true;
++}
++
++static ArithOneOp * const f_scalar_xtn[] = {
++    gen_helper_neon_narrow_u8,
++    gen_helper_neon_narrow_u16,
++    tcg_gen_ext32u_i64,
++};
++TRANS(XTN, do_2misc_narrow_vector, a, f_scalar_xtn)
++TRANS(SQXTUN_v, do_2misc_narrow_vector, a, f_scalar_sqxtun)
++TRANS(SQXTN_v, do_2misc_narrow_vector, a, f_scalar_sqxtn)
++TRANS(UQXTN_v, do_2misc_narrow_vector, a, f_scalar_uqxtn)
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_narrow(DisasContext *s, bool scalar,
+         tcg_res[pass] = tcg_temp_new_i64();
+         switch (opcode) {
+-        case 0x12: /* XTN, SQXTUN */
+-        {
+-            static NeonGenOne64OpFn * const xtnfns[3] = {
+-                gen_helper_neon_narrow_u8,
+-                gen_helper_neon_narrow_u16,
+-                tcg_gen_ext32u_i64,
+-            };
+-            static NeonGenOne64OpEnvFn * const sqxtunfns[3] = {
+-                gen_helper_neon_unarrow_sat8,
+-                gen_helper_neon_unarrow_sat16,
+-                gen_helper_neon_unarrow_sat32,
+-            };
+-            if (u) {
+-                genenvfn = sqxtunfns[size];
+-            } else {
+-                genfn = xtnfns[size];
+-            }
+-            break;
+-        }
+-        case 0x14: /* SQXTN, UQXTN */
+-        {
+-            static NeonGenOne64OpEnvFn * const fns[3][2] = {
+-                { gen_helper_neon_narrow_sat_s8,
+-                  gen_helper_neon_narrow_sat_u8 },
+-                { gen_helper_neon_narrow_sat_s16,
+-                  gen_helper_neon_narrow_sat_u16 },
+-                { gen_helper_neon_narrow_sat_s32,
+-                  gen_helper_neon_narrow_sat_u32 },
+-            };
+-            genenvfn = fns[size][u];
+-            break;
+-        }
+         case 0x16: /* FCVTN, FCVTN2 */
+             /* 32 bit to 16 bit or 64 bit to 32 bit float conversion */
+             if (size == 2) {
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_narrow(DisasContext *s, bool scalar,
+             }
+             break;
+         default:
++        case 0x12: /* XTN, SQXTUN */
++        case 0x14: /* SQXTN, UQXTN */
+             g_assert_not_reached();
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+     TCGv_ptr tcg_fpstatus;
+     switch (opcode) {
+-    case 0x12: /* SQXTUN */
+-        if (!u) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        /* fall through */
+-    case 0x14: /* SQXTN, UQXTN */
+-        if (size == 3) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        if (!fp_access_check(s)) {
+-            return;
+-        }
+-        handle_2misc_narrow(s, true, opcode, u, false, size, rn, rd);
+-        return;
+     case 0xc ... 0xf:
+     case 0x16 ... 0x1d:
+     case 0x1f:
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+     case 0x9: /* CMEQ, CMLE */
+     case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
++    case 0x12: /* SQXTUN */
++    case 0x14: /* SQXTN, UQXTN */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     TCGv_ptr tcg_fpstatus;
+     switch (opcode) {
+-    case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
+-    case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
+-        if (size == 3) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        if (!fp_access_check(s)) {
+-            return;
+-        }
+-
+-        handle_2misc_narrow(s, false, opcode, u, is_q, size, rn, rd);
+-        return;
+     case 0x13: /* SHLL, SHLL2 */
+         if (u == 0 || size == 3) {
+             unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     case 0x9: /* CMEQ, CMLE */
+     case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
++    case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
++    case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
+         unallocated_encoding(s);
+         return;
+     }
+--
+.34.1

-[PULL 29/48] target/arm: Add VHE system register redirection and aliasing
+[PULL 50/85] target/arm: Convert FCVTN, BFCVTN to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Several of the EL1/0 registers are redirected to the EL2 version when in
-EL2 and HCR_EL2.E2H is set.  Many of these registers have side effects.
-Link together the two ARMCPRegInfo structures after they have been
-properly instantiated.  Install common dispatch routines to all of the
-relevant registers.
-The same set of registers that are redirected also have additional
-EL12/EL02 aliases created to access the original register that was
-redirected.
-Omit the generic timer registers from redirection here, because we'll
-need multiple kinds of redirection from both EL0 and EL2.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-29-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-51-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h    |  13 ++++
+ target/arm/tcg/a64.decode      |  5 ++
- target/arm/helper.c | 162 ++++++++++++++++++++++++++++++++++++++++++++
+ target/arm/tcg/translate-a64.c | 89 ++++++++++++++++++----------------
-files changed, 175 insertions(+)
+files changed, 52 insertions(+), 42 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ struct ARMCPRegInfo {
+@@ -XXX,XX +XXX,XX @@
-      * fieldoffset is 0 then no reset will be done.
-      */
+ %rd             0:5
-     CPResetFn *resetfn;
+ %esz_sd         22:1 !function=plus_2
 +%esz_hs         22:1 !function=plus_1
  %esz_hsd        22:2 !function=xor_2
  %hl             11:1 21:1
  %hlm            11:1 20:2
@@ -XXX,XX +XXX,XX @@
  @qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
  @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
  @qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
 +@qrr_hs         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_hs
  @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
  @qrrr_b         . q:1 ...... ... rm:5 ...... rn:5 rd:5  &qrrr_e esz=0
@@ -XXX,XX +XXX,XX @@ XTN             0.00 1110 ..1 00001 00101 0 ..... .....     @qrr_e
  SQXTUN_v        0.10 1110 ..1 00001 00101 0 ..... .....     @qrr_e
  SQXTN_v         0.00 1110 ..1 00001 01001 0 ..... .....     @qrr_e
  UQXTN_v         0.10 1110 ..1 00001 01001 0 ..... .....     @qrr_e
 +
-+    /*
++FCVTN_v         0.00 1110 0.1 00001 01101 0 ..... .....     @qrr_hs
-+     * "Original" writefn and readfn.
++BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
-+     * For ARMv8.1-VHE register aliases, we overwrite the read/write
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 +     * accessor functions of various EL1/EL0 to perform the runtime
 +     * check for which sysreg should actually be modified, and then
 +     * forwards the operation.  Before overwriting the accessors,
 +     * the original function is copied here, so that accesses that
 +     * really do go to the EL1/EL0 version proceed normally.
 +     * (The corresponding EL2 register is linked via opaque.)
 +     */
 +    CPReadFn *orig_readfn;
 +    CPWriteFn *orig_writefn;
  };
  /* Macros which are lvalues for the field in CPUARMState for the
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_cp_reginfo[] = {
+@@ -XXX,XX +XXX,XX @@ TRANS(SQXTUN_v, do_2misc_narrow_vector, a, f_scalar_sqxtun)
-     REGINFO_SENTINEL
+ TRANS(SQXTN_v, do_2misc_narrow_vector, a, f_scalar_sqxtn)
- };
+ TRANS(UQXTN_v, do_2misc_narrow_vector, a, f_scalar_uqxtn)
-+#ifndef CONFIG_USER_ONLY
++static void gen_fcvtn_hs(TCGv_i64 d, TCGv_i64 n)
 +/* Test if system register redirection is to occur in the current state.  */
 +static bool redirect_for_e2h(CPUARMState *env)
 +{
-+    return arm_current_el(env) == 2 && (arm_hcr_el2_eff(env) & HCR_E2H);
++    TCGv_i32 tcg_lo = tcg_temp_new_i32();
 +    TCGv_i32 tcg_hi = tcg_temp_new_i32();
 +    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 +    TCGv_i32 ahp = get_ahp_flag();
 +
 +    tcg_gen_extr_i64_i32(tcg_lo, tcg_hi, n);
 +    gen_helper_vfp_fcvt_f32_to_f16(tcg_lo, tcg_lo, fpst, ahp);
 +    gen_helper_vfp_fcvt_f32_to_f16(tcg_hi, tcg_hi, fpst, ahp);
 +    tcg_gen_deposit_i32(tcg_lo, tcg_lo, tcg_hi, 16, 16);
 +    tcg_gen_extu_i32_i64(d, tcg_lo);
 +}
 +
-+static uint64_t el2_e2h_read(CPUARMState *env, const ARMCPRegInfo *ri)
++static void gen_fcvtn_sd(TCGv_i64 d, TCGv_i64 n)
 +{
-+    CPReadFn *readfn;
++    TCGv_i32 tmp = tcg_temp_new_i32();
-+
++    gen_helper_vfp_fcvtsd(tmp, n, tcg_env);
-+    if (redirect_for_e2h(env)) {
++    tcg_gen_extu_i32_i64(d, tmp);
 +        /* Switch to the saved EL2 version of the register.  */
 +        ri = ri->opaque;
 +        readfn = ri->readfn;
 +    } else {
 +        readfn = ri->orig_readfn;
 +    }
 +    if (readfn == NULL) {
 +        readfn = raw_read;
 +    }
 +    return readfn(env, ri);
 +}
 +
-+static void el2_e2h_write(CPUARMState *env, const ARMCPRegInfo *ri,
++static ArithOneOp * const f_vector_fcvtn[] = {
-+                          uint64_t value)
++    NULL,
 +    gen_fcvtn_hs,
 +    gen_fcvtn_sd,
 +};
 +TRANS(FCVTN_v, do_2misc_narrow_vector, a, f_vector_fcvtn)
 +
 +static void gen_bfcvtn_hs(TCGv_i64 d, TCGv_i64 n)
 +{
-+    CPWriteFn *writefn;
++    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-+
++    TCGv_i32 tmp = tcg_temp_new_i32();
-+    if (redirect_for_e2h(env)) {
++    gen_helper_bfcvt_pair(tmp, n, fpst);
-+        /* Switch to the saved EL2 version of the register.  */
++    tcg_gen_extu_i32_i64(d, tmp);
 +        ri = ri->opaque;
 +        writefn = ri->writefn;
 +    } else {
 +        writefn = ri->orig_writefn;
 +    }
 +    if (writefn == NULL) {
 +        writefn = raw_write;
 +    }
 +    writefn(env, ri, value);
 +}
 +
-+static void define_arm_vh_e2h_redirects_aliases(ARMCPU *cpu)
++static ArithOneOp * const f_vector_bfcvtn[] = {
-+{
++    NULL,
-+    struct E2HAlias {
++    gen_bfcvtn_hs,
-+        uint32_t src_key, dst_key, new_key;
++    NULL,
-+        const char *src_name, *dst_name, *new_name;
++};
-+        bool (*feature)(const ARMISARegisters *id);
++TRANS_FEAT(BFCVTN_v, aa64_bf16, do_2misc_narrow_vector, a, f_vector_bfcvtn)
 +    };
 +
-+#define K(op0, op1, crn, crm, op2) \
+ /* Common vector code for handling integer to FP conversion */
-+    ENCODE_AA64_CP_REG(CP_REG_ARM64_SYSREG_CP, crn, crm, op0, op1, op2)
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
-+
+                                    int elements, int is_signed,
-+    static const struct E2HAlias aliases[] = {
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_narrow(DisasContext *s, bool scalar,
-+        { K(3, 0,  1, 0, 0), K(3, 4,  1, 0, 0), K(3, 5, 1, 0, 0),
+         tcg_res[pass] = tcg_temp_new_i64();
-+          "SCTLR", "SCTLR_EL2", "SCTLR_EL12" },
-+        { K(3, 0,  1, 0, 2), K(3, 4,  1, 1, 2), K(3, 5, 1, 0, 2),
+         switch (opcode) {
-+          "CPACR", "CPTR_EL2", "CPACR_EL12" },
+-        case 0x16: /* FCVTN, FCVTN2 */
-+        { K(3, 0,  2, 0, 0), K(3, 4,  2, 0, 0), K(3, 5, 2, 0, 0),
+-            /* 32 bit to 16 bit or 64 bit to 32 bit float conversion */
-+          "TTBR0_EL1", "TTBR0_EL2", "TTBR0_EL12" },
+-            if (size == 2) {
-+        { K(3, 0,  2, 0, 1), K(3, 4,  2, 0, 1), K(3, 5, 2, 0, 1),
+-                TCGv_i32 tmp = tcg_temp_new_i32();
-+          "TTBR1_EL1", "TTBR1_EL2", "TTBR1_EL12" },
+-                gen_helper_vfp_fcvtsd(tmp, tcg_op, tcg_env);
-+        { K(3, 0,  2, 0, 2), K(3, 4,  2, 0, 2), K(3, 5, 2, 0, 2),
+-                tcg_gen_extu_i32_i64(tcg_res[pass], tmp);
-+          "TCR_EL1", "TCR_EL2", "TCR_EL12" },
+-            } else {
-+        { K(3, 0,  4, 0, 0), K(3, 4,  4, 0, 0), K(3, 5, 4, 0, 0),
+-                TCGv_i32 tcg_lo = tcg_temp_new_i32();
-+          "SPSR_EL1", "SPSR_EL2", "SPSR_EL12" },
+-                TCGv_i32 tcg_hi = tcg_temp_new_i32();
-+        { K(3, 0,  4, 0, 1), K(3, 4,  4, 0, 1), K(3, 5, 4, 0, 1),
+-                TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-+          "ELR_EL1", "ELR_EL2", "ELR_EL12" },
+-                TCGv_i32 ahp = get_ahp_flag();
-+        { K(3, 0,  5, 1, 0), K(3, 4,  5, 1, 0), K(3, 5, 5, 1, 0),
+-
-+          "AFSR0_EL1", "AFSR0_EL2", "AFSR0_EL12" },
+-                tcg_gen_extr_i64_i32(tcg_lo, tcg_hi, tcg_op);
-+        { K(3, 0,  5, 1, 1), K(3, 4,  5, 1, 1), K(3, 5, 5, 1, 1),
+-                gen_helper_vfp_fcvt_f32_to_f16(tcg_lo, tcg_lo, fpst, ahp);
-+          "AFSR1_EL1", "AFSR1_EL2", "AFSR1_EL12" },
+-                gen_helper_vfp_fcvt_f32_to_f16(tcg_hi, tcg_hi, fpst, ahp);
-+        { K(3, 0,  5, 2, 0), K(3, 4,  5, 2, 0), K(3, 5, 5, 2, 0),
+-                tcg_gen_deposit_i32(tcg_lo, tcg_lo, tcg_hi, 16, 16);
-+          "ESR_EL1", "ESR_EL2", "ESR_EL12" },
+-                tcg_gen_extu_i32_i64(tcg_res[pass], tcg_lo);
-+        { K(3, 0,  6, 0, 0), K(3, 4,  6, 0, 0), K(3, 5, 6, 0, 0),
+-            }
-+          "FAR_EL1", "FAR_EL2", "FAR_EL12" },
+-            break;
-+        { K(3, 0, 10, 2, 0), K(3, 4, 10, 2, 0), K(3, 5, 10, 2, 0),
+-        case 0x36: /* BFCVTN, BFCVTN2 */
-+          "MAIR_EL1", "MAIR_EL2", "MAIR_EL12" },
+-            {
-+        { K(3, 0, 10, 3, 0), K(3, 4, 10, 3, 0), K(3, 5, 10, 3, 0),
+-                TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-+          "AMAIR0", "AMAIR_EL2", "AMAIR_EL12" },
+-                TCGv_i32 tmp = tcg_temp_new_i32();
-+        { K(3, 0, 12, 0, 0), K(3, 4, 12, 0, 0), K(3, 5, 12, 0, 0),
+-                gen_helper_bfcvt_pair(tmp, tcg_op, fpst);
-+          "VBAR", "VBAR_EL2", "VBAR_EL12" },
+-                tcg_gen_extu_i32_i64(tcg_res[pass], tmp);
-+        { K(3, 0, 13, 0, 1), K(3, 4, 13, 0, 1), K(3, 5, 13, 0, 1),
+-            }
-+          "CONTEXTIDR_EL1", "CONTEXTIDR_EL2", "CONTEXTIDR_EL12" },
+-            break;
-+        { K(3, 0, 14, 1, 0), K(3, 4, 14, 1, 0), K(3, 5, 14, 1, 0),
+         case 0x56:  /* FCVTXN, FCVTXN2 */
-+          "CNTKCTL", "CNTHCTL_EL2", "CNTKCTL_EL12" },
+             {
-+
+                 /*
-+        /*
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_narrow(DisasContext *s, bool scalar,
-+         * Note that redirection of ZCR is mentioned in the description
+         default:
-+         * of ZCR_EL2, and aliasing in the description of ZCR_EL1, but
+         case 0x12: /* XTN, SQXTUN */
-+         * not in the summary table.
+         case 0x14: /* SQXTN, UQXTN */
-+         */
++        case 0x16: /* FCVTN, FCVTN2 */
-+        { K(3, 0,  1, 2, 0), K(3, 4,  1, 2, 0), K(3, 5, 1, 2, 0),
++        case 0x36: /* BFCVTN, BFCVTN2 */
-+          "ZCR_EL1", "ZCR_EL2", "ZCR_EL12", isar_feature_aa64_sve },
+             g_assert_not_reached();
-+
+         }
-+        /* TODO: ARMv8.2-SPE -- PMSCR_EL2 */
-+        /* TODO: ARMv8.4-Trace -- TRFCR_EL2 */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
-+    };
+                 unallocated_encoding(s);
-+#undef K
+                 return;
-+
+             }
-+    size_t i;
+-            /* fall through */
-+
+-        case 0x16: /* FCVTN, FCVTN2 */
-+    for (i = 0; i < ARRAY_SIZE(aliases); i++) {
+-            /* handle_2misc_narrow does a 2*size -> size operation, but these
-+        const struct E2HAlias *a = &aliases[i];
+-             * instructions encode the source size rather than dest size.
-+        ARMCPRegInfo *src_reg, *dst_reg;
+-             */
-+
+-            if (!fp_access_check(s)) {
-+        if (a->feature && !a->feature(&cpu->isar)) {
+-                return;
-+            continue;
+-            }
-+        }
+-            handle_2misc_narrow(s, false, opcode, 0, is_q, size - 1, rn, rd);
-+
+-            return;
-+        src_reg = g_hash_table_lookup(cpu->cp_regs, &a->src_key);
+-        case 0x36: /* BFCVTN, BFCVTN2 */
-+        dst_reg = g_hash_table_lookup(cpu->cp_regs, &a->dst_key);
+-            if (!dc_isar_feature(aa64_bf16, s) || size != 2) {
-+        g_assert(src_reg != NULL);
+-                unallocated_encoding(s);
-+        g_assert(dst_reg != NULL);
+-                return;
-+
+-            }
-+        /* Cross-compare names to detect typos in the keys.  */
+             if (!fp_access_check(s)) {
-+        g_assert(strcmp(src_reg->name, a->src_name) == 0);
+                 return;
-+        g_assert(strcmp(dst_reg->name, a->dst_name) == 0);
+             }
-+
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
-+        /* None of the core system registers use opaque; we will.  */
+             }
-+        g_assert(src_reg->opaque == NULL);
+             break;
-+
+         default:
-+        /* Create alias before redirection so we dup the right data. */
++        case 0x16: /* FCVTN, FCVTN2 */
-+        if (a->new_key) {
++        case 0x36: /* BFCVTN, BFCVTN2 */
-+            ARMCPRegInfo *new_reg = g_memdup(src_reg, sizeof(ARMCPRegInfo));
+             unallocated_encoding(s);
-+            uint32_t *new_key = g_memdup(&a->new_key, sizeof(uint32_t));
+             return;
-+            bool ok;
+         }
 +
 +            new_reg->name = a->new_name;
 +            new_reg->type |= ARM_CP_ALIAS;
 +            /* Remove PL1/PL0 access, leaving PL2/PL3 R/W in place.  */
 +            new_reg->access &= PL2_RW | PL3_RW;
 +
 +            ok = g_hash_table_insert(cpu->cp_regs, new_key, new_reg);
 +            g_assert(ok);
 +        }
 +
 +        src_reg->opaque = dst_reg;
 +        src_reg->orig_readfn = src_reg->readfn ?: raw_read;
 +        src_reg->orig_writefn = src_reg->writefn ?: raw_write;
 +        if (!src_reg->raw_readfn) {
 +            src_reg->raw_readfn = raw_read;
 +        }
 +        if (!src_reg->raw_writefn) {
 +            src_reg->raw_writefn = raw_write;
 +        }
 +        src_reg->readfn = el2_e2h_read;
 +        src_reg->writefn = el2_e2h_write;
 +    }
 +}
 +#endif
 +
  static CPAccessResult ctr_el0_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                       bool isread)
  {
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          : cpu_isar_feature(aa32_predinv, cpu)) {
          define_arm_cp_regs(cpu, predinv_reginfo);
      }
 +
 +#ifndef CONFIG_USER_ONLY
 +    /*
 +     * Register redirections and aliases must be done last,
 +     * after the registers from the other extensions have been defined.
 +     */
 +    if (arm_feature(env, ARM_FEATURE_EL2) && cpu_isar_feature(aa64_vh, cpu)) {
 +        define_arm_vh_e2h_redirects_aliases(cpu);
 +    }
 +#endif
  }
  void arm_cpu_register_gdb_regs_for_features(ARMCPU *cpu)
 --
-.20.1
+.34.1

-New patch
+[PULL 51/85] target/arm: Convert FCVTXN to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Remove handle_2misc_narrow as this was the last insn decoded
+by that function.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-52-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |   4 ++
+ target/arm/tcg/translate-a64.c | 101 +++++++--------------------------
+files changed, 24 insertions(+), 81 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@
+ @qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
+ @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
++@qrr_s          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=2
+ @qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
+ @qrr_hs         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_hs
+ @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
+@@ -XXX,XX +XXX,XX @@ SQXTUN_s        0111 1110 ..1 00001 00101 0 ..... .....     @rr_e
+ SQXTN_s         0101 1110 ..1 00001 01001 0 ..... .....     @rr_e
+ UQXTN_s         0111 1110 ..1 00001 01001 0 ..... .....     @rr_e
++FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
++
+ # Advanced SIMD two-register miscellaneous
+ SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+@@ -XXX,XX +XXX,XX @@ SQXTN_v         0.00 1110 ..1 00001 01001 0 ..... .....     @qrr_e
+ UQXTN_v         0.10 1110 ..1 00001 01001 0 ..... .....     @qrr_e
+ FCVTN_v         0.00 1110 0.1 00001 01101 0 ..... .....     @qrr_hs
++FCVTXN_v        0.10 1110 011 00001 01101 0 ..... .....     @qrr_s
+ BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static ArithOneOp * const f_scalar_uqxtn[] = {
+ };
+ TRANS(UQXTN_s, do_2misc_narrow_scalar, a, f_scalar_uqxtn)
++static void gen_fcvtxn_sd(TCGv_i64 d, TCGv_i64 n)
++{
++    /*
++     * 64 bit to 32 bit float conversion
++     * with von Neumann rounding (round to odd)
++     */
++    TCGv_i32 tmp = tcg_temp_new_i32();
++    gen_helper_fcvtx_f64_to_f32(tmp, n, tcg_env);
++    tcg_gen_extu_i32_i64(d, tmp);
++}
++
++static ArithOneOp * const f_scalar_fcvtxn[] = {
++    NULL,
++    NULL,
++    gen_fcvtxn_sd,
++};
++TRANS(FCVTXN_s, do_2misc_narrow_scalar, a, f_scalar_fcvtxn)
++
+ #undef WRAP_ENV
+ static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+@@ -XXX,XX +XXX,XX @@ static ArithOneOp * const f_vector_fcvtn[] = {
+     gen_fcvtn_sd,
+ };
+ TRANS(FCVTN_v, do_2misc_narrow_vector, a, f_vector_fcvtn)
++TRANS(FCVTXN_v, do_2misc_narrow_vector, a, f_scalar_fcvtxn)
+ static void gen_bfcvtn_hs(TCGv_i64 d, TCGv_i64 n)
+ {
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
+     }
+ }
+-static void handle_2misc_narrow(DisasContext *s, bool scalar,
+-                                int opcode, bool u, bool is_q,
+-                                int size, int rn, int rd)
+-{
+-    /* Handle 2-reg-misc ops which are narrowing (so each 2*size element
+-     * in the source becomes a size element in the destination).
+-     */
+-    int pass;
+-    TCGv_i64 tcg_res[2];
+-    int destelt = is_q ? 2 : 0;
+-    int passes = scalar ? 1 : 2;
+-
+-    if (scalar) {
+-        tcg_res[1] = tcg_constant_i64(0);
+-    }
+-
+-    for (pass = 0; pass < passes; pass++) {
+-        TCGv_i64 tcg_op = tcg_temp_new_i64();
+-        NeonGenOne64OpFn *genfn = NULL;
+-        NeonGenOne64OpEnvFn *genenvfn = NULL;
+-
+-        if (scalar) {
+-            read_vec_element(s, tcg_op, rn, pass, size + 1);
+-        } else {
+-            read_vec_element(s, tcg_op, rn, pass, MO_64);
+-        }
+-        tcg_res[pass] = tcg_temp_new_i64();
+-
+-        switch (opcode) {
+-        case 0x56:  /* FCVTXN, FCVTXN2 */
+-            {
+-                /*
+-                 * 64 bit to 32 bit float conversion
+-                 * with von Neumann rounding (round to odd)
+-                 */
+-                TCGv_i32 tmp = tcg_temp_new_i32();
+-                assert(size == 2);
+-                gen_helper_fcvtx_f64_to_f32(tmp, tcg_op, tcg_env);
+-                tcg_gen_extu_i32_i64(tcg_res[pass], tmp);
+-            }
+-            break;
+-        default:
+-        case 0x12: /* XTN, SQXTUN */
+-        case 0x14: /* SQXTN, UQXTN */
+-        case 0x16: /* FCVTN, FCVTN2 */
+-        case 0x36: /* BFCVTN, BFCVTN2 */
+-            g_assert_not_reached();
+-        }
+-
+-        if (genfn) {
+-            genfn(tcg_res[pass], tcg_op);
+-        } else if (genenvfn) {
+-            genenvfn(tcg_res[pass], tcg_env, tcg_op);
+-        }
+-    }
+-
+-    for (pass = 0; pass < 2; pass++) {
+-        write_vec_element(s, tcg_res[pass], rd, destelt + pass, MO_32);
+-    }
+-    clear_vec_high(s, is_q, rd);
+-}
+-
+ /* AdvSIMD scalar two reg misc
+  *  31 30  29 28       24 23  22 21       17 16    12 11 10 9    5 4    0
+  * +-----+---+-----------+------+-----------+--------+-----+------+------+
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+             rmode = FPROUNDING_TIEAWAY;
+             break;
+         case 0x56: /* FCVTXN, FCVTXN2 */
+-            if (size == 2) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_2misc_narrow(s, true, opcode, u, false, size - 1, rn, rd);
+-            return;
+         default:
+             unallocated_encoding(s);
+             return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             }
+             handle_2misc_reciprocal(s, opcode, false, u, is_q, size, rn, rd);
+             return;
+-        case 0x56: /* FCVTXN, FCVTXN2 */
+-            if (size == 2) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_2misc_narrow(s, false, opcode, 0, is_q, size - 1, rn, rd);
+-            return;
+         case 0x17: /* FCVTL, FCVTL2 */
+             if (!fp_access_check(s)) {
+                 return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         default:
+         case 0x16: /* FCVTN, FCVTN2 */
+         case 0x36: /* BFCVTN, BFCVTN2 */
++        case 0x56: /* FCVTXN, FCVTXN2 */
+             unallocated_encoding(s);
+             return;
+         }
+--
+.34.1

-New patch
+[PULL 52/85] target/arm: Convert SHLL to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-53-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  2 +
+ target/arm/tcg/translate-a64.c | 75 +++++++++++++++++-----------------
+files changed, 40 insertions(+), 37 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ UQXTN_v         0.10 1110 ..1 00001 01001 0 ..... .....     @qrr_e
+ FCVTN_v         0.00 1110 0.1 00001 01101 0 ..... .....     @qrr_hs
+ FCVTXN_v        0.10 1110 011 00001 01101 0 ..... .....     @qrr_s
+ BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
++
++SHLL_v          0.10 1110 ..1 00001 00111 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static ArithOneOp * const f_vector_bfcvtn[] = {
+ };
+ TRANS_FEAT(BFCVTN_v, aa64_bf16, do_2misc_narrow_vector, a, f_vector_bfcvtn)
++static bool trans_SHLL_v(DisasContext *s, arg_qrr_e *a)
++{
++    static NeonGenWidenFn * const widenfns[3] = {
++        gen_helper_neon_widen_u8,
++        gen_helper_neon_widen_u16,
++        tcg_gen_extu_i32_i64,
++    };
++    NeonGenWidenFn *widenfn;
++    TCGv_i64 tcg_res[2];
++    TCGv_i32 tcg_op;
++    int part, pass;
++
++    if (a->esz == MO_64) {
++        return false;
++    }
++    if (!fp_access_check(s)) {
++        return true;
++    }
++
++    tcg_op = tcg_temp_new_i32();
++    widenfn = widenfns[a->esz];
++    part = a->q ? 2 : 0;
++
++    for (pass = 0; pass < 2; pass++) {
++        read_vec_element_i32(s, tcg_op, a->rn, part + pass, MO_32);
++        tcg_res[pass] = tcg_temp_new_i64();
++        widenfn(tcg_res[pass], tcg_op);
++        tcg_gen_shli_i64(tcg_res[pass], tcg_res[pass], 8 << a->esz);
++    }
++
++    for (pass = 0; pass < 2; pass++) {
++        write_vec_element(s, tcg_res[pass], a->rd, pass, MO_64);
++    }
++    return true;
++}
++
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
+     }
+ }
+-static void handle_shll(DisasContext *s, bool is_q, int size, int rn, int rd)
+-{
+-    /* Implement SHLL and SHLL2 */
+-    int pass;
+-    int part = is_q ? 2 : 0;
+-    TCGv_i64 tcg_res[2];
+-
+-    for (pass = 0; pass < 2; pass++) {
+-        static NeonGenWidenFn * const widenfns[3] = {
+-            gen_helper_neon_widen_u8,
+-            gen_helper_neon_widen_u16,
+-            tcg_gen_extu_i32_i64,
+-        };
+-        NeonGenWidenFn *widenfn = widenfns[size];
+-        TCGv_i32 tcg_op = tcg_temp_new_i32();
+-
+-        read_vec_element_i32(s, tcg_op, rn, part + pass, MO_32);
+-        tcg_res[pass] = tcg_temp_new_i64();
+-        widenfn(tcg_res[pass], tcg_op);
+-        tcg_gen_shli_i64(tcg_res[pass], tcg_res[pass], 8 << size);
+-    }
+-
+-    for (pass = 0; pass < 2; pass++) {
+-        write_vec_element(s, tcg_res[pass], rd, pass, MO_64);
+-    }
+-}
+-
+ /* AdvSIMD two reg misc
+  *   31  30  29 28       24 23  22 21       17 16    12 11 10 9    5 4    0
+  * +---+---+---+-----------+------+-----------+--------+-----+------+------+
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     TCGv_ptr tcg_fpstatus;
+     switch (opcode) {
+-    case 0x13: /* SHLL, SHLL2 */
+-        if (u == 0 || size == 3) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+-        if (!fp_access_check(s)) {
+-            return;
+-        }
+-        handle_shll(s, is_q, size, rn, rd);
+-        return;
+     case 0xc ... 0xf:
+     case 0x16 ... 0x1f:
+     {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+     case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
+     case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
++    case 0x13: /* SHLL, SHLL2 */
+     case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
+         unallocated_encoding(s);
+         return;
+--
+.34.1

-[PULL 48/48] stellaris: delay timer_new to avoid memleaks
+[PULL 53/85] target/arm: Implement gen_gvec_fabs, gen_gvec_fneg
-From: Pan Nengyuan <pannengyuan@huawei.com>
+From: Richard Henderson <richard.henderson@linaro.org>
-There is a memory leak when we call 'device_list_properties' with typename = stellaris-gptm. It's easy to reproduce as follow:
+Move the current implementation out of translate-neon.c,
 and extend to handle all element sizes.
-  virsh qemu-monitor-command vm1 --pretty '{"execute": "device-list-properties", "arguments": {"typename": "stellaris-gptm"}}'
-This patch delay timer_new in realize to fix it.
-Reported-by: Euler Robot <euler.robot@huawei.com>
-Signed-off-by: Pan Nengyuan <pannengyuan@huawei.com>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200205070659.22488-4-pannengyuan@huawei.com
-Cc: qemu-arm@nongnu.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-54-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/stellaris.c | 7 ++++++-
+ target/arm/tcg/translate.h      |  6 ++++++
-file changed, 6 insertions(+), 1 deletion(-)
+ target/arm/tcg/gengvec.c        | 14 ++++++++++++++
  target/arm/tcg/translate-neon.c | 20 ++------------------
 files changed, 22 insertions(+), 18 deletions(-)
-diff --git a/hw/arm/stellaris.c b/hw/arm/stellaris.c
+diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/stellaris.c
+--- a/target/arm/tcg/translate.h
-+++ b/hw/arm/stellaris.c
++++ b/target/arm/tcg/translate.h
-@@ -XXX,XX +XXX,XX @@ static void stellaris_gptm_init(Object *obj)
+@@ -XXX,XX +XXX,XX @@ void gen_gvec_uaddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-     sysbus_init_mmio(sbd, &s->iomem);
+ void gen_gvec_uadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                      uint32_t opr_sz, uint32_t max_sz);
-     s->opaque[0] = s->opaque[1] = s;
 +/* These exclusively manipulate the sign bit. */
 +void gen_gvec_fabs(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                   uint32_t oprsz, uint32_t maxsz);
 +void gen_gvec_fneg(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                   uint32_t oprsz, uint32_t maxsz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/gengvec.c
 +++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_uadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
      assert(vece <= MO_32);
      tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
  }
 +
 +void gen_gvec_fabs(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                   uint32_t oprsz, uint32_t maxsz)
 +{
 +    uint64_t s_bit = 1ull << ((8 << vece) - 1);
 +    tcg_gen_gvec_andi(vece, dofs, aofs, s_bit - 1, oprsz, maxsz);
 +}
 +
-+static void stellaris_gptm_realize(DeviceState *dev, Error **errp)
++void gen_gvec_fneg(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                   uint32_t oprsz, uint32_t maxsz)
 +{
-+    gptm_state *s = STELLARIS_GPTM(dev);
++    uint64_t s_bit = 1ull << ((8 << vece) - 1);
-     s->timer[0] = timer_new_ns(QEMU_CLOCK_VIRTUAL, gptm_tick, &s->opaque[0]);
++    tcg_gen_gvec_xori(vece, dofs, aofs, s_bit, oprsz, maxsz);
-     s->timer[1] = timer_new_ns(QEMU_CLOCK_VIRTUAL, gptm_tick, &s->opaque[1]);
++}
 diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-neon.c
 +++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool do_2misc(DisasContext *s, arg_2misc *a, NeonGenOneOpFn *fn)
      return true;
  }
+-static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+-                       uint32_t oprsz, uint32_t maxsz)
+-{
+-    tcg_gen_gvec_andi(vece, rd_ofs, rm_ofs,
+-                      vece == MO_16 ? 0x7fff : 0x7fffffff,
+-                      oprsz, maxsz);
+-}
 -
- /* System controller.  */
+ static bool trans_VABS_F(DisasContext *s, arg_2misc *a)
+ {
- typedef struct {
+     if (a->size == MO_16) {
-@@ -XXX,XX +XXX,XX @@ static void stellaris_gptm_class_init(ObjectClass *klass, void *data)
+@@ -XXX,XX +XXX,XX @@ static bool trans_VABS_F(DisasContext *s, arg_2misc *a)
-     DeviceClass *dc = DEVICE_CLASS(klass);
+     } else if (a->size != MO_32) {
+         return false;
-     dc->vmsd = &vmstate_stellaris_gptm;
+     }
-+    dc->realize = stellaris_gptm_realize;
+-    return do_2misc_vec(s, a, gen_VABS_F);
 -}
 -
 -static void gen_VNEG_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 -                       uint32_t oprsz, uint32_t maxsz)
 -{
 -    tcg_gen_gvec_xori(vece, rd_ofs, rm_ofs,
 -                      vece == MO_16 ? 0x8000 : 0x80000000,
 -                      oprsz, maxsz);
 +    return do_2misc_vec(s, a, gen_gvec_fabs);
  }
- static const TypeInfo stellaris_gptm_info = {
+ static bool trans_VNEG_F(DisasContext *s, arg_2misc *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_VNEG_F(DisasContext *s, arg_2misc *a)
      } else if (a->size != MO_32) {
          return false;
      }
 -    return do_2misc_vec(s, a, gen_VNEG_F);
 +    return do_2misc_vec(s, a, gen_gvec_fneg);
  }
  static bool trans_VRECPE(DisasContext *s, arg_2misc *a)
 --
-.20.1
+.34.1

-New patch
+[PULL 54/85] target/arm: Convert FABS, FNEG (vector) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-55-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  7 +++++
+ target/arm/tcg/translate-a64.c | 54 +++++++++++++++-------------------
+files changed, 31 insertions(+), 30 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@
+ @qrr_s          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=2
+ @qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
+ @qrr_hs         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_hs
++@qrr_sd         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_sd
+ @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
+ @qrrr_b         . q:1 ...... ... rm:5 ...... rn:5 rd:5  &qrrr_e esz=0
+@@ -XXX,XX +XXX,XX @@ FCVTXN_v        0.10 1110 011 00001 01101 0 ..... .....     @qrr_s
+ BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
+ SHLL_v          0.10 1110 ..1 00001 00111 0 ..... .....     @qrr_e
++
++FABS_v          0.00 1110 111 11000 11111 0 ..... .....     @qrr_h
++FABS_v          0.00 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
++
++FNEG_v          0.10 1110 111 11000 11111 0 ..... .....     @qrr_h
++FNEG_v          0.10 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_SHLL_v(DisasContext *s, arg_qrr_e *a)
+     return true;
+ }
++static bool do_fabs_fneg_v(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
++{
++    int check = fp_access_check_vector_hsd(s, a->q, a->esz);
++
++    if (check <= 0) {
++        return check == 0;
++    }
++
++    gen_gvec_fn2(s, a->q, a->rd, a->rn, fn, a->esz);
++    return true;
++}
++
++TRANS(FABS_v, do_fabs_fneg_v, a, gen_gvec_fabs)
++TRANS(FNEG_v, do_fabs_fneg_v, a, gen_gvec_fneg)
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+      * requires them.
+      */
+     switch (opcode) {
+-    case 0x2f: /* FABS */
+-        gen_vfp_absd(tcg_rd, tcg_rn);
+-        break;
+-    case 0x6f: /* FNEG */
+-        gen_vfp_negd(tcg_rd, tcg_rn);
+-        break;
+     case 0x7f: /* FSQRT */
+         gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_fpstatus);
+         break;
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     case 0x9: /* CMEQ, CMLE */
+     case 0xa: /* CMLT */
+     case 0xb: /* ABS, NEG */
++    case 0x2f: /* FABS */
++    case 0x6f: /* FNEG */
+         g_assert_not_reached();
+     }
+ }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
+         size = is_double ? 3 : 2;
+         switch (opcode) {
+-        case 0x2f: /* FABS */
+-        case 0x6f: /* FNEG */
+-            if (size == 3 && !is_q) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            break;
+         case 0x1d: /* SCVTF */
+         case 0x5d: /* UCVTF */
+         {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x16: /* FCVTN, FCVTN2 */
+         case 0x36: /* BFCVTN, BFCVTN2 */
+         case 0x56: /* FCVTXN, FCVTXN2 */
++        case 0x2f: /* FABS */
++        case 0x6f: /* FNEG */
+             unallocated_encoding(s);
+             return;
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             {
+                 /* Special cases for 32 bit elements */
+                 switch (opcode) {
+-                case 0x2f: /* FABS */
+-                    gen_vfp_abss(tcg_res, tcg_op);
+-                    break;
+-                case 0x6f: /* FNEG */
+-                    gen_vfp_negs(tcg_res, tcg_op);
+-                    break;
+                 case 0x7f: /* FSQRT */
+                     gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_fpstatus);
+                     break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                     break;
+                 default:
+                 case 0x7: /* SQABS, SQNEG */
++                case 0x2f: /* FABS */
++                case 0x6f: /* FNEG */
+                     g_assert_not_reached();
+                 }
+             }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     case 0x7b: /* FCVTZU */
+         rmode = FPROUNDING_ZERO;
+         break;
+-    case 0x2f: /* FABS */
+-    case 0x6f: /* FNEG */
+-        only_in_vector = true;
+-        need_fpst = false;
+-        break;
+     case 0x7d: /* FRSQRTE */
+         break;
+     case 0x7f: /* FSQRT (vector) */
+         only_in_vector = true;
+         break;
+     default:
++    case 0x2f: /* FABS */
++    case 0x6f: /* FNEG */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+             case 0x59: /* FRINTX */
+                 gen_helper_advsimd_rinth_exact(tcg_res, tcg_op, tcg_fpstatus);
+                 break;
+-            case 0x2f: /* FABS */
+-                tcg_gen_andi_i32(tcg_res, tcg_op, 0x7fff);
+-                break;
+-            case 0x6f: /* FNEG */
+-                tcg_gen_xori_i32(tcg_res, tcg_op, 0x8000);
+-                break;
+             case 0x7d: /* FRSQRTE */
+                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
+                 break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+                 gen_helper_vfp_sqrth(tcg_res, tcg_op, tcg_fpstatus);
+                 break;
+             default:
++            case 0x2f: /* FABS */
++            case 0x6f: /* FNEG */
+                 g_assert_not_reached();
+             }
+--
+.34.1

-New patch
+[PULL 55/85] target/arm: Convert FSQRT (vector) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-56-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  3 ++
+ target/arm/tcg/translate-a64.c | 69 ++++++++++++++++++++++++----------
+files changed, 53 insertions(+), 19 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FABS_v          0.00 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
+ FNEG_v          0.10 1110 111 11000 11111 0 ..... .....     @qrr_h
+ FNEG_v          0.10 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
++
++FSQRT_v         0.10 1110 111 11001 11111 0 ..... .....     @qrr_h
++FSQRT_v         0.10 1110 1.1 00001 11111 0 ..... .....     @qrr_sd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_fabs_fneg_v(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+ TRANS(FABS_v, do_fabs_fneg_v, a, gen_gvec_fabs)
+ TRANS(FNEG_v, do_fabs_fneg_v, a, gen_gvec_fneg)
++static bool do_fp1_vector(DisasContext *s, arg_qrr_e *a,
++                          const FPScalar1 *f, int rmode)
++{
++    TCGv_i32 tcg_rmode = NULL;
++    TCGv_ptr fpst;
++    int check = fp_access_check_vector_hsd(s, a->q, a->esz);
++
++    if (check <= 0) {
++        return check == 0;
++    }
++
++    fpst = fpstatus_ptr(a->esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
++    if (rmode >= 0) {
++        tcg_rmode = gen_set_rmode(rmode, fpst);
++    }
++
++    if (a->esz == MO_64) {
++        TCGv_i64 t64 = tcg_temp_new_i64();
++
++        for (int pass = 0; pass < 2; ++pass) {
++            read_vec_element(s, t64, a->rn, pass, MO_64);
++            f->gen_d(t64, t64, fpst);
++            write_vec_element(s, t64, a->rd, pass, MO_64);
++        }
++    } else {
++        TCGv_i32 t32 = tcg_temp_new_i32();
++        void (*gen)(TCGv_i32, TCGv_i32, TCGv_ptr)
++            = (a->esz == MO_16 ? f->gen_h : f->gen_s);
++
++        for (int pass = 0, n = (a->q ? 16 : 8) >> a->esz; pass < n; ++pass) {
++            read_vec_element_i32(s, t32, a->rn, pass, a->esz);
++            gen(t32, t32, fpst);
++            write_vec_element_i32(s, t32, a->rd, pass, a->esz);
++        }
++    }
++    clear_vec_high(s, a->q, a->rd);
++
++    if (rmode >= 0) {
++        gen_restore_rmode(tcg_rmode, fpst);
++    }
++    return true;
++}
++
++TRANS(FSQRT_v, do_fp1_vector, a, &f_scalar_fsqrt, -1)
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+      * requires them.
+      */
+     switch (opcode) {
+-    case 0x7f: /* FSQRT */
+-        gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_fpstatus);
+-        break;
+     case 0x1a: /* FCVTNS */
+     case 0x1b: /* FCVTMS */
+     case 0x1c: /* FCVTAS */
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     case 0xb: /* ABS, NEG */
+     case 0x2f: /* FABS */
+     case 0x6f: /* FNEG */
++    case 0x7f: /* FSQRT */
+         g_assert_not_reached();
+     }
+ }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             }
+             handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
+             return;
+-        case 0x7f: /* FSQRT */
+-            need_fpstatus = true;
+-            if (size == 3 && !is_q) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            break;
+         case 0x1a: /* FCVTNS */
+         case 0x1b: /* FCVTMS */
+         case 0x3a: /* FCVTPS */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x56: /* FCVTXN, FCVTXN2 */
+         case 0x2f: /* FABS */
+         case 0x6f: /* FNEG */
++        case 0x7f: /* FSQRT */
+             unallocated_encoding(s);
+             return;
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             {
+                 /* Special cases for 32 bit elements */
+                 switch (opcode) {
+-                case 0x7f: /* FSQRT */
+-                    gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_fpstatus);
+-                    break;
+                 case 0x1a: /* FCVTNS */
+                 case 0x1b: /* FCVTMS */
+                 case 0x1c: /* FCVTAS */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                 case 0x7: /* SQABS, SQNEG */
+                 case 0x2f: /* FABS */
+                 case 0x6f: /* FNEG */
++                case 0x7f: /* FSQRT */
+                     g_assert_not_reached();
+                 }
+             }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+         break;
+     case 0x7d: /* FRSQRTE */
+         break;
+-    case 0x7f: /* FSQRT (vector) */
+-        only_in_vector = true;
+-        break;
+     default:
+     case 0x2f: /* FABS */
+     case 0x6f: /* FNEG */
++    case 0x7f: /* FSQRT (vector) */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+             case 0x7d: /* FRSQRTE */
+                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
+                 break;
+-            case 0x7f: /* FSQRT */
+-                gen_helper_vfp_sqrth(tcg_res, tcg_op, tcg_fpstatus);
+-                break;
+             default:
+             case 0x2f: /* FABS */
+             case 0x6f: /* FNEG */
++            case 0x7f: /* FSQRT */
+                 g_assert_not_reached();
+             }
+--
+.34.1

-New patch
+[PULL 56/85] target/arm: Convert FRINT* (vector) to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-57-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  26 +++++
+ target/arm/tcg/translate-a64.c | 176 ++++++++++++---------------------
+files changed, 88 insertions(+), 114 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FNEG_v          0.10 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
+ FSQRT_v         0.10 1110 111 11001 11111 0 ..... .....     @qrr_h
+ FSQRT_v         0.10 1110 1.1 00001 11111 0 ..... .....     @qrr_sd
++
++FRINTN_v        0.00 1110 011 11001 10001 0 ..... .....     @qrr_h
++FRINTN_v        0.00 1110 0.1 00001 10001 0 ..... .....     @qrr_sd
++
++FRINTM_v        0.00 1110 011 11001 10011 0 ..... .....     @qrr_h
++FRINTM_v        0.00 1110 0.1 00001 10011 0 ..... .....     @qrr_sd
++
++FRINTP_v        0.00 1110 111 11001 10001 0 ..... .....     @qrr_h
++FRINTP_v        0.00 1110 1.1 00001 10001 0 ..... .....     @qrr_sd
++
++FRINTZ_v        0.00 1110 111 11001 10011 0 ..... .....     @qrr_h
++FRINTZ_v        0.00 1110 1.1 00001 10011 0 ..... .....     @qrr_sd
++
++FRINTA_v        0.10 1110 011 11001 10001 0 ..... .....     @qrr_h
++FRINTA_v        0.10 1110 0.1 00001 10001 0 ..... .....     @qrr_sd
++
++FRINTX_v        0.10 1110 011 11001 10011 0 ..... .....     @qrr_h
++FRINTX_v        0.10 1110 0.1 00001 10011 0 ..... .....     @qrr_sd
++
++FRINTI_v        0.10 1110 111 11001 10011 0 ..... .....     @qrr_h
++FRINTI_v        0.10 1110 1.1 00001 10011 0 ..... .....     @qrr_sd
++
++FRINT32Z_v      0.00 1110 0.1 00001 11101 0 ..... .....     @qrr_sd
++FRINT32X_v      0.10 1110 0.1 00001 11101 0 ..... .....     @qrr_sd
++FRINT64Z_v      0.00 1110 0.1 00001 11111 0 ..... .....     @qrr_sd
++FRINT64X_v      0.10 1110 0.1 00001 11111 0 ..... .....     @qrr_sd
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_fp1_vector(DisasContext *s, arg_qrr_e *a,
+ TRANS(FSQRT_v, do_fp1_vector, a, &f_scalar_fsqrt, -1)
++TRANS(FRINTN_v, do_fp1_vector, a, &f_scalar_frint, FPROUNDING_TIEEVEN)
++TRANS(FRINTP_v, do_fp1_vector, a, &f_scalar_frint, FPROUNDING_POSINF)
++TRANS(FRINTM_v, do_fp1_vector, a, &f_scalar_frint, FPROUNDING_NEGINF)
++TRANS(FRINTZ_v, do_fp1_vector, a, &f_scalar_frint, FPROUNDING_ZERO)
++TRANS(FRINTA_v, do_fp1_vector, a, &f_scalar_frint, FPROUNDING_TIEAWAY)
++TRANS(FRINTI_v, do_fp1_vector, a, &f_scalar_frint, -1)
++TRANS(FRINTX_v, do_fp1_vector, a, &f_scalar_frintx, -1)
++
++TRANS_FEAT(FRINT32Z_v, aa64_frint, do_fp1_vector, a,
++           &f_scalar_frint32, FPROUNDING_ZERO)
++TRANS_FEAT(FRINT32X_v, aa64_frint, do_fp1_vector, a, &f_scalar_frint32, -1)
++TRANS_FEAT(FRINT64Z_v, aa64_frint, do_fp1_vector, a,
++           &f_scalar_frint64, FPROUNDING_ZERO)
++TRANS_FEAT(FRINT64X_v, aa64_frint, do_fp1_vector, a, &f_scalar_frint64, -1)
++
+ /* Common vector code for handling integer to FP conversion */
+ static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
+                                    int elements, int is_signed,
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     case 0x7b: /* FCVTZU */
+         gen_helper_vfp_touqd(tcg_rd, tcg_rn, tcg_constant_i32(0), tcg_fpstatus);
+         break;
+-    case 0x18: /* FRINTN */
+-    case 0x19: /* FRINTM */
+-    case 0x38: /* FRINTP */
+-    case 0x39: /* FRINTZ */
+-    case 0x58: /* FRINTA */
+-    case 0x79: /* FRINTI */
+-        gen_helper_rintd(tcg_rd, tcg_rn, tcg_fpstatus);
+-        break;
+-    case 0x59: /* FRINTX */
+-        gen_helper_rintd_exact(tcg_rd, tcg_rn, tcg_fpstatus);
+-        break;
+-    case 0x1e: /* FRINT32Z */
+-    case 0x5e: /* FRINT32X */
+-        gen_helper_frint32_d(tcg_rd, tcg_rn, tcg_fpstatus);
+-        break;
+-    case 0x1f: /* FRINT64Z */
+-    case 0x5f: /* FRINT64X */
+-        gen_helper_frint64_d(tcg_rd, tcg_rn, tcg_fpstatus);
+-        break;
+     default:
+     case 0x4: /* CLS, CLZ */
+     case 0x5: /* NOT */
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+     case 0x2f: /* FABS */
+     case 0x6f: /* FNEG */
+     case 0x7f: /* FSQRT */
++    case 0x18: /* FRINTN */
++    case 0x19: /* FRINTM */
++    case 0x38: /* FRINTP */
++    case 0x39: /* FRINTZ */
++    case 0x58: /* FRINTA */
++    case 0x79: /* FRINTI */
++    case 0x59: /* FRINTX */
++    case 0x1e: /* FRINT32Z */
++    case 0x5e: /* FRINT32X */
++    case 0x1f: /* FRINT64Z */
++    case 0x5f: /* FRINT64X */
+         g_assert_not_reached();
+     }
+ }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             }
+             handle_2misc_widening(s, opcode, is_q, size, rn, rd);
+             return;
+-        case 0x18: /* FRINTN */
+-        case 0x19: /* FRINTM */
+-        case 0x38: /* FRINTP */
+-        case 0x39: /* FRINTZ */
+-            rmode = extract32(opcode, 5, 1) | (extract32(opcode, 0, 1) << 1);
+-            /* fall through */
+-        case 0x59: /* FRINTX */
+-        case 0x79: /* FRINTI */
+-            need_fpstatus = true;
+-            if (size == 3 && !is_q) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            break;
+-        case 0x58: /* FRINTA */
+-            rmode = FPROUNDING_TIEAWAY;
+-            need_fpstatus = true;
+-            if (size == 3 && !is_q) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            break;
+         case 0x7c: /* URSQRTE */
+             if (size == 3) {
+                 unallocated_encoding(s);
+                 return;
+             }
+             break;
+-        case 0x1e: /* FRINT32Z */
+-        case 0x1f: /* FRINT64Z */
+-            rmode = FPROUNDING_ZERO;
+-            /* fall through */
+-        case 0x5e: /* FRINT32X */
+-        case 0x5f: /* FRINT64X */
+-            need_fpstatus = true;
+-            if ((size == 3 && !is_q) || !dc_isar_feature(aa64_frint, s)) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            break;
+         default:
+         case 0x16: /* FCVTN, FCVTN2 */
+         case 0x36: /* BFCVTN, BFCVTN2 */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x2f: /* FABS */
+         case 0x6f: /* FNEG */
+         case 0x7f: /* FSQRT */
++        case 0x18: /* FRINTN */
++        case 0x19: /* FRINTM */
++        case 0x38: /* FRINTP */
++        case 0x39: /* FRINTZ */
++        case 0x59: /* FRINTX */
++        case 0x79: /* FRINTI */
++        case 0x58: /* FRINTA */
++        case 0x1e: /* FRINT32Z */
++        case 0x1f: /* FRINT64Z */
++        case 0x5e: /* FRINT32X */
++        case 0x5f: /* FRINT64X */
+             unallocated_encoding(s);
+             return;
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                     gen_helper_vfp_touls(tcg_res, tcg_op,
+                                          tcg_constant_i32(0), tcg_fpstatus);
+                     break;
+-                case 0x18: /* FRINTN */
+-                case 0x19: /* FRINTM */
+-                case 0x38: /* FRINTP */
+-                case 0x39: /* FRINTZ */
+-                case 0x58: /* FRINTA */
+-                case 0x79: /* FRINTI */
+-                    gen_helper_rints(tcg_res, tcg_op, tcg_fpstatus);
+-                    break;
+-                case 0x59: /* FRINTX */
+-                    gen_helper_rints_exact(tcg_res, tcg_op, tcg_fpstatus);
+-                    break;
+                 case 0x7c: /* URSQRTE */
+                     gen_helper_rsqrte_u32(tcg_res, tcg_op);
+                     break;
+-                case 0x1e: /* FRINT32Z */
+-                case 0x5e: /* FRINT32X */
+-                    gen_helper_frint32_s(tcg_res, tcg_op, tcg_fpstatus);
+-                    break;
+-                case 0x1f: /* FRINT64Z */
+-                case 0x5f: /* FRINT64X */
+-                    gen_helper_frint64_s(tcg_res, tcg_op, tcg_fpstatus);
+-                    break;
+                 default:
+                 case 0x7: /* SQABS, SQNEG */
+                 case 0x2f: /* FABS */
+                 case 0x6f: /* FNEG */
+                 case 0x7f: /* FSQRT */
++                case 0x18: /* FRINTN */
++                case 0x19: /* FRINTM */
++                case 0x38: /* FRINTP */
++                case 0x39: /* FRINTZ */
++                case 0x58: /* FRINTA */
++                case 0x79: /* FRINTI */
++                case 0x59: /* FRINTX */
++                case 0x1e: /* FRINT32Z */
++                case 0x5e: /* FRINT32X */
++                case 0x1f: /* FRINT64Z */
++                case 0x5f: /* FRINT64X */
+                     g_assert_not_reached();
+                 }
+             }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     int rn, rd;
+     bool is_q;
+     bool is_scalar;
+-    bool only_in_vector = false;
+     int pass;
+     TCGv_i32 tcg_rmode = NULL;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     case 0x3d: /* FRECPE */
+     case 0x3f: /* FRECPX */
+         break;
+-    case 0x18: /* FRINTN */
+-        only_in_vector = true;
+-        rmode = FPROUNDING_TIEEVEN;
+-        break;
+-    case 0x19: /* FRINTM */
+-        only_in_vector = true;
+-        rmode = FPROUNDING_NEGINF;
+-        break;
+-    case 0x38: /* FRINTP */
+-        only_in_vector = true;
+-        rmode = FPROUNDING_POSINF;
+-        break;
+-    case 0x39: /* FRINTZ */
+-        only_in_vector = true;
+-        rmode = FPROUNDING_ZERO;
+-        break;
+-    case 0x58: /* FRINTA */
+-        only_in_vector = true;
+-        rmode = FPROUNDING_TIEAWAY;
+-        break;
+-    case 0x59: /* FRINTX */
+-    case 0x79: /* FRINTI */
+-        only_in_vector = true;
+-        /* current rounding mode */
+-        break;
+     case 0x1a: /* FCVTNS */
+         rmode = FPROUNDING_TIEEVEN;
+         break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     case 0x2f: /* FABS */
+     case 0x6f: /* FNEG */
+     case 0x7f: /* FSQRT (vector) */
++    case 0x18: /* FRINTN */
++    case 0x19: /* FRINTM */
++    case 0x38: /* FRINTP */
++    case 0x39: /* FRINTZ */
++    case 0x58: /* FRINTA */
++    case 0x59: /* FRINTX */
++    case 0x79: /* FRINTI */
+         unallocated_encoding(s);
+         return;
+     }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+             unallocated_encoding(s);
+             return;
+         }
+-        /* FRINTxx is only in the vector form */
+-        if (only_in_vector) {
+-            unallocated_encoding(s);
+-            return;
+-        }
+     }
+     if (!fp_access_check(s)) {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+             case 0x7b: /* FCVTZU */
+                 gen_helper_advsimd_f16touinth(tcg_res, tcg_op, tcg_fpstatus);
+                 break;
+-            case 0x18: /* FRINTN */
+-            case 0x19: /* FRINTM */
+-            case 0x38: /* FRINTP */
+-            case 0x39: /* FRINTZ */
+-            case 0x58: /* FRINTA */
+-            case 0x79: /* FRINTI */
+-                gen_helper_advsimd_rinth(tcg_res, tcg_op, tcg_fpstatus);
+-                break;
+-            case 0x59: /* FRINTX */
+-                gen_helper_advsimd_rinth_exact(tcg_res, tcg_op, tcg_fpstatus);
+-                break;
+             case 0x7d: /* FRSQRTE */
+                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
+                 break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+             case 0x2f: /* FABS */
+             case 0x6f: /* FNEG */
+             case 0x7f: /* FSQRT */
++            case 0x18: /* FRINTN */
++            case 0x19: /* FRINTM */
++            case 0x38: /* FRINTP */
++            case 0x39: /* FRINTZ */
++            case 0x58: /* FRINTA */
++            case 0x79: /* FRINTI */
++            case 0x59: /* FRINTX */
+                 g_assert_not_reached();
+             }
+--
+.34.1

-[PULL 07/48] target/arm: Split out vae1_tlbmask
+[PULL 57/85] target/arm: Convert FCVT* (vector, integer) scalar to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-No functional change, but unify code sequences.
+Arm silliness with naming, the scalar insns described
 as part of the vector instructions, as separate from
 the "regular" scalar insns which output to general registers.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-7-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-58-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 32 +++++++++++++-------------------
+ target/arm/tcg/a64.decode      |  30 ++++++++
-file changed, 13 insertions(+), 19 deletions(-)
+ target/arm/tcg/translate-a64.c | 133 ++++++++++++++-------------------
 files changed, 86 insertions(+), 77 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
+@@ -XXX,XX +XXX,XX @@ UQXTN_s         0111 1110 ..1 00001 01001 0 ..... .....     @rr_e
-  * Page D4-1736 (DDI0487A.b)
-  */
+ FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
-+static int vae1_tlbmask(CPUARMState *env)
++@icvt_h         . ....... .. ...... ...... rn:5 rd:5 \
 +                &fcvt sf=0 esz=1 shift=0
 +@icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
 +                &fcvt sf=0 esz=%esz_sd shift=0
 +
 +FCVTNS_f        0101 1110 011 11001 10101 0 ..... .....     @icvt_h
 +FCVTNS_f        0101 1110 0.1 00001 10101 0 ..... .....     @icvt_sd
 +FCVTNU_f        0111 1110 011 11001 10101 0 ..... .....     @icvt_h
 +FCVTNU_f        0111 1110 0.1 00001 10101 0 ..... .....     @icvt_sd
 +
 +FCVTPS_f        0101 1110 111 11001 10101 0 ..... .....     @icvt_h
 +FCVTPS_f        0101 1110 1.1 00001 10101 0 ..... .....     @icvt_sd
 +FCVTPU_f        0111 1110 111 11001 10101 0 ..... .....     @icvt_h
 +FCVTPU_f        0111 1110 1.1 00001 10101 0 ..... .....     @icvt_sd
 +
 +FCVTMS_f        0101 1110 011 11001 10111 0 ..... .....     @icvt_h
 +FCVTMS_f        0101 1110 0.1 00001 10111 0 ..... .....     @icvt_sd
 +FCVTMU_f        0111 1110 011 11001 10111 0 ..... .....     @icvt_h
 +FCVTMU_f        0111 1110 0.1 00001 10111 0 ..... .....     @icvt_sd
 +
 +FCVTZS_f        0101 1110 111 11001 10111 0 ..... .....     @icvt_h
 +FCVTZS_f        0101 1110 1.1 00001 10111 0 ..... .....     @icvt_sd
 +FCVTZU_f        0111 1110 111 11001 10111 0 ..... .....     @icvt_h
 +FCVTZU_f        0111 1110 1.1 00001 10111 0 ..... .....     @icvt_sd
 +
 +FCVTAS_f        0101 1110 011 11001 11001 0 ..... .....     @icvt_h
 +FCVTAS_f        0101 1110 0.1 00001 11001 0 ..... .....     @icvt_sd
 +FCVTAU_f        0111 1110 011 11001 11001 0 ..... .....     @icvt_h
 +FCVTAU_f        0111 1110 0.1 00001 11001 0 ..... .....     @icvt_sd
 +
  # Advanced SIMD two-register miscellaneous
  SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void do_fcvt_scalar(DisasContext *s, MemOp out, MemOp esz,
                                   tcg_shift, tcg_fpstatus);
              tcg_gen_extu_i32_i64(tcg_out, tcg_single);
              break;
 +        case MO_16 | MO_SIGN:
 +            gen_helper_vfp_toshh(tcg_single, tcg_single,
 +                                 tcg_shift, tcg_fpstatus);
 +            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
 +            break;
 +        case MO_16:
 +            gen_helper_vfp_touhh(tcg_single, tcg_single,
 +                                 tcg_shift, tcg_fpstatus);
 +            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
 +            break;
          default:
              g_assert_not_reached();
          }
@@ -XXX,XX +XXX,XX @@ TRANS(FCVTZU_g, do_fcvt_g, a, FPROUNDING_ZERO, false)
  TRANS(FCVTAS_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, true)
  TRANS(FCVTAU_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, false)
 +/*
 + * FCVT* (vector), scalar version.
 + * Which sounds weird, but really just means output to fp register
 + * instead of output to general register.  Input and output element
 + * size are always equal.
 + */
 +static bool do_fcvt_f(DisasContext *s, arg_fcvt *a,
 +                      ARMFPRounding rmode, bool is_signed)
 +{
-+    if (arm_is_secure_below_el3(env)) {
++    TCGv_i64 tcg_int;
-+        return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
++    int check = fp_access_check_scalar_hsd(s, a->esz);
-+    } else {
++
-+        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
++    if (check <= 0) {
 +        return check == 0;
 +    }
++
++    tcg_int = tcg_temp_new_i64();
++    do_fcvt_scalar(s, a->esz | (is_signed ? MO_SIGN : 0),
++                   a->esz, tcg_int, a->shift, a->rn, rmode);
++
++    clear_vec(s, a->rd);
++    write_vec_element(s, tcg_int, a->rd, 0, a->esz);
++    return true;
 +}
 +
- static void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++TRANS(FCVTNS_f, do_fcvt_f, a, FPROUNDING_TIEEVEN, true)
-                                       uint64_t value)
++TRANS(FCVTNU_f, do_fcvt_f, a, FPROUNDING_TIEEVEN, false)
 +TRANS(FCVTPS_f, do_fcvt_f, a, FPROUNDING_POSINF, true)
 +TRANS(FCVTPU_f, do_fcvt_f, a, FPROUNDING_POSINF, false)
 +TRANS(FCVTMS_f, do_fcvt_f, a, FPROUNDING_NEGINF, true)
 +TRANS(FCVTMU_f, do_fcvt_f, a, FPROUNDING_NEGINF, false)
 +TRANS(FCVTZS_f, do_fcvt_f, a, FPROUNDING_ZERO, true)
 +TRANS(FCVTZU_f, do_fcvt_f, a, FPROUNDING_ZERO, false)
 +TRANS(FCVTAS_f, do_fcvt_f, a, FPROUNDING_TIEAWAY, true)
 +TRANS(FCVTAU_f, do_fcvt_f, a, FPROUNDING_TIEAWAY, false)
 +
  static bool trans_FJCVTZS(DisasContext *s, arg_FJCVTZS *a)
  {
-     CPUState *cs = env_cpu(env);
+     if (!dc_isar_feature(aa64_jscvt, s)) {
--    bool sec = arm_is_secure_below_el3(env);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
-+    int mask = vae1_tlbmask(env);
+     int opcode = extract32(insn, 12, 5);
+     int size = extract32(insn, 22, 2);
--    if (sec) {
+     bool u = extract32(insn, 29, 1);
--        tlb_flush_by_mmuidx_all_cpus_synced(cs,
+-    bool is_fcvt = false;
--                                            ARMMMUIdxBit_S1SE1 |
+-    int rmode;
--                                            ARMMMUIdxBit_S1SE0);
+-    TCGv_i32 tcg_rmode;
--    } else {
+-    TCGv_ptr tcg_fpstatus;
--        tlb_flush_by_mmuidx_all_cpus_synced(cs,
--                                            ARMMMUIdxBit_S12NSE1 |
+     switch (opcode) {
--                                            ARMMMUIdxBit_S12NSE0);
+     case 0xc ... 0xf:
--    }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
-+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+         case 0x5b: /* FCVTMU */
- }
+         case 0x7a: /* FCVTPU */
+         case 0x7b: /* FCVTZU */
- static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-            is_fcvt = true;
-                                     uint64_t value)
+-            rmode = extract32(opcode, 5, 1) | (extract32(opcode, 0, 1) << 1);
- {
+-            break;
-     CPUState *cs = env_cpu(env);
+         case 0x1c: /* FCVTAS */
-+    int mask = vae1_tlbmask(env);
+         case 0x5c: /* FCVTAU */
+-            /* TIEAWAY doesn't fit in the usual rounding mode encoding */
-     if (tlb_force_broadcast(env)) {
+-            is_fcvt = true;
-         tlbi_aa64_vmalle1is_write(env, NULL, value);
+-            rmode = FPROUNDING_TIEAWAY;
 -            break;
          case 0x56: /* FCVTXN, FCVTXN2 */
          default:
              unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
          unallocated_encoding(s);
          return;
      }
+-
--    if (arm_is_secure_below_el3(env)) {
+-    if (!fp_access_check(s)) {
--        tlb_flush_by_mmuidx(cs,
+-        return;
--                            ARMMMUIdxBit_S1SE1 |
+-    }
--                            ARMMMUIdxBit_S1SE0);
+-
 -    if (is_fcvt) {
 -        tcg_fpstatus = fpstatus_ptr(FPST_FPCR);
 -        tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
 -    } else {
--        tlb_flush_by_mmuidx(cs,
+-        tcg_fpstatus = NULL;
--                            ARMMMUIdxBit_S12NSE1 |
+-        tcg_rmode = NULL;
--                            ARMMMUIdxBit_S12NSE0);
+-    }
--    }
+-
-+    tlb_flush_by_mmuidx(cs, mask);
+-    if (size == 3) {
 -        TCGv_i64 tcg_rn = read_fp_dreg(s, rn);
 -        TCGv_i64 tcg_rd = tcg_temp_new_i64();
 -
 -        handle_2misc_64(s, opcode, u, tcg_rd, tcg_rn, tcg_rmode, tcg_fpstatus);
 -        write_fp_dreg(s, rd, tcg_rd);
 -    } else {
 -        TCGv_i32 tcg_rn = tcg_temp_new_i32();
 -        TCGv_i32 tcg_rd = tcg_temp_new_i32();
 -
 -        read_vec_element_i32(s, tcg_rn, rn, 0, size);
 -
 -        switch (opcode) {
 -        case 0x1a: /* FCVTNS */
 -        case 0x1b: /* FCVTMS */
 -        case 0x1c: /* FCVTAS */
 -        case 0x3a: /* FCVTPS */
 -        case 0x3b: /* FCVTZS */
 -            gen_helper_vfp_tosls(tcg_rd, tcg_rn, tcg_constant_i32(0),
 -                                 tcg_fpstatus);
 -            break;
 -        case 0x5a: /* FCVTNU */
 -        case 0x5b: /* FCVTMU */
 -        case 0x5c: /* FCVTAU */
 -        case 0x7a: /* FCVTPU */
 -        case 0x7b: /* FCVTZU */
 -            gen_helper_vfp_touls(tcg_rd, tcg_rn, tcg_constant_i32(0),
 -                                 tcg_fpstatus);
 -            break;
 -        default:
 -        case 0x7: /* SQABS, SQNEG */
 -            g_assert_not_reached();
 -        }
 -
 -        write_fp_sreg(s, rd, tcg_rd);
 -    }
 -
 -    if (is_fcvt) {
 -        gen_restore_rmode(tcg_rmode, tcg_fpstatus);
 -    }
 +    g_assert_not_reached();
  }
- static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ /* AdvSIMD shift by immediate
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
          TCGv_i32 tcg_res = tcg_temp_new_i32();
          switch (fpop) {
 -        case 0x1a: /* FCVTNS */
 -        case 0x1b: /* FCVTMS */
 -        case 0x1c: /* FCVTAS */
 -        case 0x3a: /* FCVTPS */
 -        case 0x3b: /* FCVTZS */
 -            gen_helper_advsimd_f16tosinth(tcg_res, tcg_op, tcg_fpstatus);
 -            break;
          case 0x3d: /* FRECPE */
              gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
              break;
          case 0x3f: /* FRECPX */
              gen_helper_frecpx_f16(tcg_res, tcg_op, tcg_fpstatus);
              break;
 +        case 0x7d: /* FRSQRTE */
 +            gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
 +            break;
 +        default:
 +        case 0x1a: /* FCVTNS */
 +        case 0x1b: /* FCVTMS */
 +        case 0x1c: /* FCVTAS */
 +        case 0x3a: /* FCVTPS */
 +        case 0x3b: /* FCVTZS */
          case 0x5a: /* FCVTNU */
          case 0x5b: /* FCVTMU */
          case 0x5c: /* FCVTAU */
          case 0x7a: /* FCVTPU */
          case 0x7b: /* FCVTZU */
 -            gen_helper_advsimd_f16touinth(tcg_res, tcg_op, tcg_fpstatus);
 -            break;
 -        case 0x7d: /* FRSQRTE */
 -            gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
 -            break;
 -        default:
              g_assert_not_reached();
          }
 --
-.20.1
+.34.1

-New patch
+[PULL 58/85] target/arm: Convert FCVT* (vector, fixed-point) scalar to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-59-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      | 19 +++++++++++++++++++
+ target/arm/tcg/translate-a64.c |  4 +---
+files changed, 20 insertions(+), 3 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FCVTAS_f        0101 1110 0.1 00001 11001 0 ..... .....     @icvt_sd
+ FCVTAU_f        0111 1110 011 11001 11001 0 ..... .....     @icvt_h
+ FCVTAU_f        0111 1110 0.1 00001 11001 0 ..... .....     @icvt_sd
++%fcvt_f_sh_h    16:4 !function=rsub_16
++%fcvt_f_sh_s    16:5 !function=rsub_32
++%fcvt_f_sh_d    16:6 !function=rsub_64
++
++@fcvt_fixed_h   .... .... . 001 .... ...... rn:5 rd:5       \
++                &fcvt sf=0 esz=1 shift=%fcvt_f_sh_h
++@fcvt_fixed_s   .... .... . 01 ..... ...... rn:5 rd:5       \
++                &fcvt sf=0 esz=2 shift=%fcvt_f_sh_s
++@fcvt_fixed_d   .... .... . 1 ...... ...... rn:5 rd:5       \
++                &fcvt sf=0 esz=3 shift=%fcvt_f_sh_d
++
++FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_h
++FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_s
++FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_d
++
++FCVTZU_f        0111 1111 0 ....... 111111 ..... .....      @fcvt_fixed_h
++FCVTZU_f        0111 1111 0 ....... 111111 ..... .....      @fcvt_fixed_s
++FCVTZU_f        0111 1111 0 ....... 111111 ..... .....      @fcvt_fixed_d
++
+ # Advanced SIMD two-register miscellaneous
+ SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_shift_imm(DisasContext *s, uint32_t insn)
+         handle_simd_shift_intfp_conv(s, true, false, is_u, immh, immb,
+                                      opcode, rn, rd);
+         break;
+-    case 0x1f: /* FCVTZS, FCVTZU */
+-        handle_simd_shift_fpint_conv(s, true, false, is_u, immh, immb, rn, rd);
+-        break;
+     default:
+     case 0x00: /* SSHR / USHR */
+     case 0x02: /* SSRA / USRA */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_shift_imm(DisasContext *s, uint32_t insn)
+     case 0x11: /* SQRSHRUN */
+     case 0x12: /* SQSHRN, UQSHRN */
+     case 0x13: /* SQRSHRN, UQRSHRN */
++    case 0x1f: /* FCVTZS, FCVTZU */
+         unallocated_encoding(s);
+         break;
+     }
+--
+.34.1

-New patch
+[PULL 59/85] target/arm: Convert [US]CVTF (vector, integer) scalar to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-60-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  6 ++++++
+ target/arm/tcg/translate-a64.c | 35 ++++++++++++++++++++++++----------
+files changed, 31 insertions(+), 10 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
+ @icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
+                 &fcvt sf=0 esz=%esz_sd shift=0
++SCVTF_f         0101 1110 011 11001 11011 0 ..... .....     @icvt_h
++SCVTF_f         0101 1110 0.1 00001 11011 0 ..... .....     @icvt_sd
++
++UCVTF_f         0111 1110 011 11001 11011 0 ..... .....     @icvt_h
++UCVTF_f         0111 1110 0.1 00001 11011 0 ..... .....     @icvt_sd
++
+ FCVTNS_f        0101 1110 011 11001 10101 0 ..... .....     @icvt_h
+ FCVTNS_f        0101 1110 0.1 00001 10101 0 ..... .....     @icvt_sd
+ FCVTNU_f        0111 1110 011 11001 10101 0 ..... .....     @icvt_h
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static bool do_cvtf_g(DisasContext *s, arg_fcvt *a, bool is_signed)
+ TRANS(SCVTF_g, do_cvtf_g, a, true)
+ TRANS(UCVTF_g, do_cvtf_g, a, false)
++/*
++ * [US]CVTF (vector), scalar version.
++ * Which sounds weird, but really just means input from fp register
++ * instead of input from general register.  Input and output element
++ * size are always equal.
++ */
++static bool do_cvtf_f(DisasContext *s, arg_fcvt *a, bool is_signed)
++{
++    TCGv_i64 tcg_int;
++    int check = fp_access_check_scalar_hsd(s, a->esz);
++
++    if (check <= 0) {
++        return check == 0;
++    }
++
++    tcg_int = tcg_temp_new_i64();
++    read_vec_element(s, tcg_int, a->rn, 0, a->esz | (is_signed ? MO_SIGN : 0));
++    return do_cvtf_scalar(s, a->esz, a->rd, a->shift, tcg_int, is_signed);
++}
++
++TRANS(SCVTF_f, do_cvtf_f, a, true)
++TRANS(UCVTF_f, do_cvtf_f, a, false)
++
+ static void do_fcvt_scalar(DisasContext *s, MemOp out, MemOp esz,
+                            TCGv_i64 tcg_out, int shift, int rn,
+                            ARMFPRounding rmode)
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x6d: /* FCMLE (zero) */
+             handle_2misc_fcmp_zero(s, opcode, true, u, true, size, rn, rd);
+             return;
+-        case 0x1d: /* SCVTF */
+-        case 0x5d: /* UCVTF */
+-        {
+-            bool is_signed = (opcode == 0x1d);
+-            if (!fp_access_check(s)) {
+-                return;
+-            }
+-            handle_simd_intfp_conv(s, rd, rn, 1, is_signed, 0, size);
+-            return;
+-        }
+         case 0x3d: /* FRECPE */
+         case 0x3f: /* FRECPX */
+         case 0x7d: /* FRSQRTE */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x1c: /* FCVTAS */
+         case 0x5c: /* FCVTAU */
+         case 0x56: /* FCVTXN, FCVTXN2 */
++        case 0x1d: /* SCVTF */
++        case 0x5d: /* UCVTF */
+         default:
+             unallocated_encoding(s);
+             return;
+--
+.34.1

-New patch
+[PULL 60/85] target/arm: Convert [US]CVTF (vector, fixed-point) scalar to decodetree
+From: Richard Henderson <richard.henderson@linaro.org>
+Remove disas_simd_scalar_shift_imm as these were the
+last insns decoded by that function.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-61-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/a64.decode      |  8 ++++++
+ target/arm/tcg/translate-a64.c | 47 ----------------------------------
+files changed, 8 insertions(+), 47 deletions(-)
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/a64.decode
++++ b/target/arm/tcg/a64.decode
+@@ -XXX,XX +XXX,XX @@ FCVTAU_f        0111 1110 0.1 00001 11001 0 ..... .....     @icvt_sd
+ @fcvt_fixed_d   .... .... . 1 ...... ...... rn:5 rd:5       \
+                 &fcvt sf=0 esz=3 shift=%fcvt_f_sh_d
++SCVTF_f         0101 1111 0 ....... 111001 ..... .....      @fcvt_fixed_h
++SCVTF_f         0101 1111 0 ....... 111001 ..... .....      @fcvt_fixed_s
++SCVTF_f         0101 1111 0 ....... 111001 ..... .....      @fcvt_fixed_d
++
++UCVTF_f         0111 1111 0 ....... 111001 ..... .....      @fcvt_fixed_h
++UCVTF_f         0111 1111 0 ....... 111001 ..... .....      @fcvt_fixed_s
++UCVTF_f         0111 1111 0 ....... 111001 ..... .....      @fcvt_fixed_d
++
+ FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_h
+ FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_s
+ FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_d
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/translate-a64.c
++++ b/target/arm/tcg/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
+     gen_restore_rmode(tcg_rmode, tcg_fpstatus);
+ }
+-/* AdvSIMD scalar shift by immediate
+- *  31 30  29 28         23 22  19 18  16 15    11  10 9    5 4    0
+- * +-----+---+-------------+------+------+--------+---+------+------+
+- * | 0 1 | U | 1 1 1 1 1 0 | immh | immb | opcode | 1 |  Rn  |  Rd  |
+- * +-----+---+-------------+------+------+--------+---+------+------+
+- *
+- * This is the scalar version so it works on a fixed sized registers
+- */
+-static void disas_simd_scalar_shift_imm(DisasContext *s, uint32_t insn)
+-{
+-    int rd = extract32(insn, 0, 5);
+-    int rn = extract32(insn, 5, 5);
+-    int opcode = extract32(insn, 11, 5);
+-    int immb = extract32(insn, 16, 3);
+-    int immh = extract32(insn, 19, 4);
+-    bool is_u = extract32(insn, 29, 1);
+-
+-    if (immh == 0) {
+-        unallocated_encoding(s);
+-        return;
+-    }
+-
+-    switch (opcode) {
+-    case 0x1c: /* SCVTF, UCVTF */
+-        handle_simd_shift_intfp_conv(s, true, false, is_u, immh, immb,
+-                                     opcode, rn, rd);
+-        break;
+-    default:
+-    case 0x00: /* SSHR / USHR */
+-    case 0x02: /* SSRA / USRA */
+-    case 0x04: /* SRSHR / URSHR */
+-    case 0x06: /* SRSRA / URSRA */
+-    case 0x08: /* SRI */
+-    case 0x0a: /* SHL / SLI */
+-    case 0x0c: /* SQSHLU */
+-    case 0x0e: /* SQSHL, UQSHL */
+-    case 0x10: /* SQSHRUN */
+-    case 0x11: /* SQRSHRUN */
+-    case 0x12: /* SQSHRN, UQSHRN */
+-    case 0x13: /* SQRSHRN, UQRSHRN */
+-    case 0x1f: /* FCVTZS, FCVTZU */
+-        unallocated_encoding(s);
+-        break;
+-    }
+-}
+-
+ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
+                             TCGv_i64 tcg_rd, TCGv_i64 tcg_rn,
+                             TCGv_i32 tcg_rmode, TCGv_ptr tcg_fpstatus)
+@@ -XXX,XX +XXX,XX @@ static const AArch64DecodeTable data_proc_simd[] = {
+     { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
+     { 0x0f000400, 0x9f800400, disas_simd_shift_imm },
+     { 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
+-    { 0x5f000400, 0xdf800400, disas_simd_scalar_shift_imm },
+     { 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
+     { 0x00000000, 0x00000000, NULL }
+ };
+--
+.34.1

-[PULL 38/48] target/arm: Enable ARMv8.1-VHE in -cpu max
+[PULL 61/85] target/arm: Rename helper_gvec_vcvt_[hf][su] with _rz
 From: Richard Henderson <richard.henderson@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Emphasize that these functions use round-to-zero mode.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-38-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-62-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu64.c | 1 +
+ target/arm/helper.h             | 8 ++++----
-file changed, 1 insertion(+)
+ target/arm/tcg/translate-neon.c | 8 ++++----
  target/arm/tcg/vec_helper.c     | 8 ++++----
 files changed, 12 insertions(+), 12 deletions(-)
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
+--- a/target/arm/helper.h
-+++ b/target/arm/cpu64.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         t = cpu->isar.id_aa64mmfr1;
-         t = FIELD_DP64(t, ID_AA64MMFR1, HPDS, 1); /* HPD */
+ DEF_HELPER_FLAGS_4(gvec_vcvt_sf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         t = FIELD_DP64(t, ID_AA64MMFR1, LO, 1);
+ DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+        t = FIELD_DP64(t, ID_AA64MMFR1, VH, 1);
+-DEF_HELPER_FLAGS_4(gvec_vcvt_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         cpu->isar.id_aa64mmfr1 = t;
+-DEF_HELPER_FLAGS_4(gvec_vcvt_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         /* Replicate the same data to the 32-bit id registers.  */
++DEF_HELPER_FLAGS_4(gvec_vcvt_rz_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 -DEF_HELPER_FLAGS_4(gvec_vcvt_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 -DEF_HELPER_FLAGS_4(gvec_vcvt_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-neon.c
 +++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
  DO_FP_2SH(VCVT_SF, gen_helper_gvec_vcvt_sf)
  DO_FP_2SH(VCVT_UF, gen_helper_gvec_vcvt_uf)
 -DO_FP_2SH(VCVT_FS, gen_helper_gvec_vcvt_fs)
 -DO_FP_2SH(VCVT_FU, gen_helper_gvec_vcvt_fu)
 +DO_FP_2SH(VCVT_FS, gen_helper_gvec_vcvt_rz_fs)
 +DO_FP_2SH(VCVT_FU, gen_helper_gvec_vcvt_rz_fu)
  DO_FP_2SH(VCVT_SH, gen_helper_gvec_vcvt_sh)
  DO_FP_2SH(VCVT_UH, gen_helper_gvec_vcvt_uh)
 -DO_FP_2SH(VCVT_HS, gen_helper_gvec_vcvt_hs)
 -DO_FP_2SH(VCVT_HU, gen_helper_gvec_vcvt_hu)
 +DO_FP_2SH(VCVT_HS, gen_helper_gvec_vcvt_rz_hs)
 +DO_FP_2SH(VCVT_HU, gen_helper_gvec_vcvt_rz_hu)
  static bool do_1reg_imm(DisasContext *s, arg_1reg_imm *a,
                          GVecGen2iFn *fn)
 diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_3OP_PAIR(gvec_uminp_s, MIN, uint32_t, H4)
  DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
 -DO_VCVT_FIXED(gvec_vcvt_fs, helper_vfp_tosls_round_to_zero, uint32_t)
 -DO_VCVT_FIXED(gvec_vcvt_fu, helper_vfp_touls_round_to_zero, uint32_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
  DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
 -DO_VCVT_FIXED(gvec_vcvt_hs, helper_vfp_toshh_round_to_zero, uint16_t)
 -DO_VCVT_FIXED(gvec_vcvt_hu, helper_vfp_touhh_round_to_zero, uint16_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_hs, helper_vfp_toshh_round_to_zero, uint16_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_hu, helper_vfp_touhh_round_to_zero, uint16_t)
  #undef DO_VCVT_FIXED
 --
-.20.1
+.34.1

-[PULL 33/48] target/arm: Update arm_phys_excp_target_el for TGE
+[PULL 62/85] target/arm: Convert [US]CVTF (vector) to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-The TGE bit routes all asynchronous exceptions to EL2.
+Remove handle_simd_intfp_conv and handle_simd_shift_intfp_conv
 as these were the last insns decoded by those functions.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-33-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-63-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 6 ++++++
+ target/arm/helper.h            |   3 +
-file changed, 6 insertions(+)
+ target/arm/tcg/a64.decode      |  22 ++++
  target/arm/tcg/translate-a64.c | 201 ++++++---------------------------
  target/arm/tcg/vec_helper.c    |   7 +-
 files changed, 66 insertions(+), 167 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/helper.h
-+++ b/target/arm/helper.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ uint32_t arm_phys_excp_target_el(CPUState *cs, uint32_t excp_idx,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         break;
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     };
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    /*
++DEF_HELPER_FLAGS_4(gvec_vcvt_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+     * For these purposes, TGE and AMO/IMO/FMO both force the
++DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+     * interrupt to EL2.  Fold TGE into the bit extracted above.
++
-+     */
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    hcr |= (hcr_el2 & HCR_TGE) != 0;
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     /* Perform a table-lookup for the target EL given the current state */
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
-     target_el = target_el_table[is64][scr][rw][hcr][secure][cur_el];
+index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/a64.decode
 +++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ FRINT32Z_v      0.00 1110 0.1 00001 11101 0 ..... .....     @qrr_sd
  FRINT32X_v      0.10 1110 0.1 00001 11101 0 ..... .....     @qrr_sd
  FRINT64Z_v      0.00 1110 0.1 00001 11111 0 ..... .....     @qrr_sd
  FRINT64X_v      0.10 1110 0.1 00001 11111 0 ..... .....     @qrr_sd
 +
 +SCVTF_vi        0.00 1110 011 11001 11011 0 ..... .....     @qrr_h
 +SCVTF_vi        0.00 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
 +
 +UCVTF_vi        0.10 1110 011 11001 11011 0 ..... .....     @qrr_h
 +UCVTF_vi        0.10 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
 +
 +&fcvt_q         rd rn esz q shift
 +@fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
 +                &fcvt_q esz=1 shift=%fcvt_f_sh_h
 +@fcvtq_s        . q:1 . ...... 01 ..... ...... rn:5 rd:5    \
 +                &fcvt_q esz=2 shift=%fcvt_f_sh_s
 +@fcvtq_d        . q:1 . ...... 1 ...... ...... rn:5 rd:5    \
 +                &fcvt_q esz=3 shift=%fcvt_f_sh_d
 +
 +SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_h
 +SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_s
 +SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_d
 +
 +UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_h
 +UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_s
 +UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_d
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FRINT64Z_v, aa64_frint, do_fp1_vector, a,
             &f_scalar_frint64, FPROUNDING_ZERO)
  TRANS_FEAT(FRINT64X_v, aa64_frint, do_fp1_vector, a, &f_scalar_frint64, -1)
 -/* Common vector code for handling integer to FP conversion */
 -static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
 -                                   int elements, int is_signed,
 -                                   int fracbits, int size)
 +static bool do_gvec_op2_fpst(DisasContext *s, MemOp esz, bool is_q,
 +                             int rd, int rn, int data,
 +                             gen_helper_gvec_2_ptr * const fns[3])
  {
 -    TCGv_ptr tcg_fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
 -    TCGv_i32 tcg_shift = NULL;
 +    int check = fp_access_check_vector_hsd(s, is_q, esz);
 +    TCGv_ptr fpst;
 -    MemOp mop = size | (is_signed ? MO_SIGN : 0);
 -    int pass;
 -
 -    if (fracbits || size == MO_64) {
 -        tcg_shift = tcg_constant_i32(fracbits);
 +    if (check <= 0) {
 +        return check == 0;
      }
 -    if (size == MO_64) {
 -        TCGv_i64 tcg_int64 = tcg_temp_new_i64();
 -        TCGv_i64 tcg_double = tcg_temp_new_i64();
 -
 -        for (pass = 0; pass < elements; pass++) {
 -            read_vec_element(s, tcg_int64, rn, pass, mop);
 -
 -            if (is_signed) {
 -                gen_helper_vfp_sqtod(tcg_double, tcg_int64,
 -                                     tcg_shift, tcg_fpst);
 -            } else {
 -                gen_helper_vfp_uqtod(tcg_double, tcg_int64,
 -                                     tcg_shift, tcg_fpst);
 -            }
 -            if (elements == 1) {
 -                write_fp_dreg(s, rd, tcg_double);
 -            } else {
 -                write_vec_element(s, tcg_double, rd, pass, MO_64);
 -            }
 -        }
 -    } else {
 -        TCGv_i32 tcg_int32 = tcg_temp_new_i32();
 -        TCGv_i32 tcg_float = tcg_temp_new_i32();
 -
 -        for (pass = 0; pass < elements; pass++) {
 -            read_vec_element_i32(s, tcg_int32, rn, pass, mop);
 -
 -            switch (size) {
 -            case MO_32:
 -                if (fracbits) {
 -                    if (is_signed) {
 -                        gen_helper_vfp_sltos(tcg_float, tcg_int32,
 -                                             tcg_shift, tcg_fpst);
 -                    } else {
 -                        gen_helper_vfp_ultos(tcg_float, tcg_int32,
 -                                             tcg_shift, tcg_fpst);
 -                    }
 -                } else {
 -                    if (is_signed) {
 -                        gen_helper_vfp_sitos(tcg_float, tcg_int32, tcg_fpst);
 -                    } else {
 -                        gen_helper_vfp_uitos(tcg_float, tcg_int32, tcg_fpst);
 -                    }
 -                }
 -                break;
 -            case MO_16:
 -                if (fracbits) {
 -                    if (is_signed) {
 -                        gen_helper_vfp_sltoh(tcg_float, tcg_int32,
 -                                             tcg_shift, tcg_fpst);
 -                    } else {
 -                        gen_helper_vfp_ultoh(tcg_float, tcg_int32,
 -                                             tcg_shift, tcg_fpst);
 -                    }
 -                } else {
 -                    if (is_signed) {
 -                        gen_helper_vfp_sitoh(tcg_float, tcg_int32, tcg_fpst);
 -                    } else {
 -                        gen_helper_vfp_uitoh(tcg_float, tcg_int32, tcg_fpst);
 -                    }
 -                }
 -                break;
 -            default:
 -                g_assert_not_reached();
 -            }
 -
 -            if (elements == 1) {
 -                write_fp_sreg(s, rd, tcg_float);
 -            } else {
 -                write_vec_element_i32(s, tcg_float, rd, pass, size);
 -            }
 -        }
 -    }
 -
 -    clear_vec_high(s, elements << size == 16, rd);
 +    fpst = fpstatus_ptr(esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
 +    tcg_gen_gvec_2_ptr(vec_full_reg_offset(s, rd),
 +                       vec_full_reg_offset(s, rn), fpst,
 +                       is_q ? 16 : 8, vec_full_reg_size(s),
 +                       data, fns[esz - 1]);
 +    return true;
  }
 -/* UCVTF/SCVTF - Integer to FP conversion */
 -static void handle_simd_shift_intfp_conv(DisasContext *s, bool is_scalar,
 -                                         bool is_q, bool is_u,
 -                                         int immh, int immb, int opcode,
 -                                         int rn, int rd)
 -{
 -    int size, elements, fracbits;
 -    int immhb = immh << 3 | immb;
 +static gen_helper_gvec_2_ptr * const f_scvtf_v[] = {
 +    gen_helper_gvec_vcvt_sh,
 +    gen_helper_gvec_vcvt_sf,
 +    gen_helper_gvec_vcvt_sd,
 +};
 +TRANS(SCVTF_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, 0, f_scvtf_v)
 +TRANS(SCVTF_vf, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, a->shift, f_scvtf_v)
 -    if (immh & 8) {
 -        size = MO_64;
 -        if (!is_scalar && !is_q) {
 -            unallocated_encoding(s);
 -            return;
 -        }
 -    } else if (immh & 4) {
 -        size = MO_32;
 -    } else if (immh & 2) {
 -        size = MO_16;
 -        if (!dc_isar_feature(aa64_fp16, s)) {
 -            unallocated_encoding(s);
 -            return;
 -        }
 -    } else {
 -        /* immh == 0 would be a failure of the decode logic */
 -        g_assert(immh == 1);
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    if (is_scalar) {
 -        elements = 1;
 -    } else {
 -        elements = (8 << is_q) >> size;
 -    }
 -    fracbits = (16 << size) - immhb;
 -
 -    if (!fp_access_check(s)) {
 -        return;
 -    }
 -
 -    handle_simd_intfp_conv(s, rd, rn, elements, !is_u, fracbits, size);
 -}
 +static gen_helper_gvec_2_ptr * const f_ucvtf_v[] = {
 +    gen_helper_gvec_vcvt_uh,
 +    gen_helper_gvec_vcvt_uf,
 +    gen_helper_gvec_vcvt_ud,
 +};
 +TRANS(UCVTF_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, 0, f_ucvtf_v)
 +TRANS(UCVTF_vf, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, a->shift, f_ucvtf_v)
  /* FCVTZS, FVCVTZU - FP to fixedpoint conversion */
  static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_shift_imm(DisasContext *s, uint32_t insn)
      }
      switch (opcode) {
 -    case 0x1c: /* SCVTF / UCVTF */
 -        handle_simd_shift_intfp_conv(s, false, is_q, is_u, immh, immb,
 -                                     opcode, rn, rd);
 -        break;
      case 0x1f: /* FCVTZS/ FCVTZU */
          handle_simd_shift_fpint_conv(s, false, is_q, is_u, immh, immb, rn, rd);
          return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_shift_imm(DisasContext *s, uint32_t insn)
      case 0x12: /* SQSHRN / UQSHRN */
      case 0x13: /* SQRSHRN / UQRSHRN */
      case 0x14: /* SSHLL / USHLL */
 +    case 0x1c: /* SCVTF / UCVTF */
          unallocated_encoding(s);
          return;
      }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
          size = is_double ? 3 : 2;
          switch (opcode) {
 -        case 0x1d: /* SCVTF */
 -        case 0x5d: /* UCVTF */
 -        {
 -            bool is_signed = (opcode == 0x1d) ? true : false;
 -            int elements = is_double ? 2 : is_q ? 4 : 2;
 -            if (is_double && !is_q) {
 -                unallocated_encoding(s);
 -                return;
 -            }
 -            if (!fp_access_check(s)) {
 -                return;
 -            }
 -            handle_simd_intfp_conv(s, rd, rn, elements, is_signed, 0, size);
 -            return;
 -        }
          case 0x2c: /* FCMGT (zero) */
          case 0x2d: /* FCMEQ (zero) */
          case 0x2e: /* FCMLT (zero) */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          case 0x1f: /* FRINT64Z */
          case 0x5e: /* FRINT32X */
          case 0x5f: /* FRINT64X */
 +        case 0x1d: /* SCVTF */
 +        case 0x5d: /* UCVTF */
              unallocated_encoding(s);
              return;
          }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
      fpop = deposit32(fpop, 6, 1, u);
      switch (fpop) {
 -    case 0x1d: /* SCVTF */
 -    case 0x5d: /* UCVTF */
 -    {
 -        int elements;
 -
 -        if (is_scalar) {
 -            elements = 1;
 -        } else {
 -            elements = (is_q ? 8 : 4);
 -        }
 -
 -        if (!fp_access_check(s)) {
 -            return;
 -        }
 -        handle_simd_intfp_conv(s, rd, rn, elements, !u, 0, MO_16);
 -        return;
 -    }
 -    break;
      case 0x2c: /* FCMGT (zero) */
      case 0x2d: /* FCMEQ (zero) */
      case 0x2e: /* FCMLT (zero) */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
      case 0x58: /* FRINTA */
      case 0x59: /* FRINTX */
      case 0x79: /* FRINTI */
 +    case 0x1d: /* SCVTF */
 +    case 0x5d: /* UCVTF */
          unallocated_encoding(s);
          return;
      }
 diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_3OP_PAIR(gvec_uminp_s, MIN, uint32_t, H4)
          clear_tail(d, oprsz, simd_maxsz(desc));                         \
      }
 +DO_VCVT_FIXED(gvec_vcvt_sd, helper_vfp_sqtod, uint64_t)
 +DO_VCVT_FIXED(gvec_vcvt_ud, helper_vfp_uqtod, uint64_t)
  DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
 -DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
 -DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
  DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
 +
 +DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_rz_hs, helper_vfp_toshh_round_to_zero, uint16_t)
  DO_VCVT_FIXED(gvec_vcvt_rz_hu, helper_vfp_touhh_round_to_zero, uint16_t)
 --
-.20.1
+.34.1

-[PULL 37/48] target/arm: Update arm_cpu_do_interrupt_aarch64 for VHE
+[PULL 63/85] target/arm: Convert FCVTZ[SU] (vector, fixed-point) to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-When VHE is enabled, the exception level below EL2 is not EL1,
+Remove handle_simd_shift_fpint_conv and disas_simd_shift_imm
-but EL0, and so to identify the entry vector offset for exceptions
+as these were the last insns decoded by those functions.
 targeting EL2 we need to look at the width of EL0, not of EL1.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-37-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-64-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 9 +++++++--
+ target/arm/helper.h            |   4 +
-file changed, 7 insertions(+), 2 deletions(-)
+ target/arm/tcg/a64.decode      |   8 ++
  target/arm/tcg/translate-a64.c | 160 +++------------------------------
  target/arm/tcg/vec_helper.c    |   2 +
  target/arm/vfp_helper.c        |   4 +
 files changed, 32 insertions(+), 146 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/helper.h
-+++ b/target/arm/helper.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_do_interrupt_aarch64(CPUState *cs)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_touhs_round_to_zero, i32, f32, i32, ptr)
-          * immediately lower than the target level is using AArch32 or AArch64
+ DEF_HELPER_3(vfp_touls_round_to_zero, i32, f32, i32, ptr)
-          */
+ DEF_HELPER_3(vfp_toshd_round_to_zero, i64, f64, i32, ptr)
-         bool is_aa64;
+ DEF_HELPER_3(vfp_tosld_round_to_zero, i64, f64, i32, ptr)
-+        uint64_t hcr;
++DEF_HELPER_3(vfp_tosqd_round_to_zero, i64, f64, i32, ptr)
+ DEF_HELPER_3(vfp_touhd_round_to_zero, i64, f64, i32, ptr)
-         switch (new_el) {
+ DEF_HELPER_3(vfp_tould_round_to_zero, i64, f64, i32, ptr)
-         case 3:
++DEF_HELPER_3(vfp_touqd_round_to_zero, i64, f64, i32, ptr)
-             is_aa64 = (env->cp15.scr_el3 & SCR_RW) != 0;
+ DEF_HELPER_3(vfp_touhh, i32, f16, i32, ptr)
-             break;
+ DEF_HELPER_3(vfp_toshh, i32, f16, i32, ptr)
-         case 2:
+ DEF_HELPER_3(vfp_toulh, i32, f16, i32, ptr)
--            is_aa64 = (env->cp15.hcr_el2 & HCR_RW) != 0;
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_vcvt_rz_ds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_vcvt_rz_du, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/a64.decode
 +++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_d
  UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_h
  UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_s
  UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_d
 +
 +FCVTZS_vf       0.00 11110 ....... 111111 ..... .....       @fcvtq_h
 +FCVTZS_vf       0.00 11110 ....... 111111 ..... .....       @fcvtq_s
 +FCVTZS_vf       0.00 11110 ....... 111111 ..... .....       @fcvtq_d
 +
 +FCVTZU_vf       0.10 11110 ....... 111111 ..... .....       @fcvtq_h
 +FCVTZU_vf       0.10 11110 ....... 111111 ..... .....       @fcvtq_s
 +FCVTZU_vf       0.10 11110 ....... 111111 ..... .....       @fcvtq_d
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(UCVTF_vi, do_gvec_op2_fpst,
  TRANS(UCVTF_vf, do_gvec_op2_fpst,
        a->esz, a->q, a->rd, a->rn, a->shift, f_ucvtf_v)
 -/* FCVTZS, FVCVTZU - FP to fixedpoint conversion */
 -static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
 -                                         bool is_q, bool is_u,
 -                                         int immh, int immb, int rn, int rd)
 -{
 -    int immhb = immh << 3 | immb;
 -    int pass, size, fracbits;
 -    TCGv_ptr tcg_fpstatus;
 -    TCGv_i32 tcg_rmode, tcg_shift;
 +static gen_helper_gvec_2_ptr * const f_fcvtzs_vf[] = {
 +    gen_helper_gvec_vcvt_rz_hs,
 +    gen_helper_gvec_vcvt_rz_fs,
 +    gen_helper_gvec_vcvt_rz_ds,
 +};
 +TRANS(FCVTZS_vf, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, a->shift, f_fcvtzs_vf)
 -    if (immh & 0x8) {
 -        size = MO_64;
 -        if (!is_scalar && !is_q) {
 -            unallocated_encoding(s);
 -            return;
 -        }
 -    } else if (immh & 0x4) {
 -        size = MO_32;
 -    } else if (immh & 0x2) {
 -        size = MO_16;
 -        if (!dc_isar_feature(aa64_fp16, s)) {
 -            unallocated_encoding(s);
 -            return;
 -        }
 -    } else {
 -        /* Should have split out AdvSIMD modified immediate earlier.  */
 -        assert(immh == 1);
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    if (!fp_access_check(s)) {
 -        return;
 -    }
 -
 -    assert(!(is_scalar && is_q));
 -
 -    tcg_fpstatus = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
 -    tcg_rmode = gen_set_rmode(FPROUNDING_ZERO, tcg_fpstatus);
 -    fracbits = (16 << size) - immhb;
 -    tcg_shift = tcg_constant_i32(fracbits);
 -
 -    if (size == MO_64) {
 -        int maxpass = is_scalar ? 1 : 2;
 -
 -        for (pass = 0; pass < maxpass; pass++) {
 -            TCGv_i64 tcg_op = tcg_temp_new_i64();
 -
 -            read_vec_element(s, tcg_op, rn, pass, MO_64);
 -            if (is_u) {
 -                gen_helper_vfp_touqd(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
 -            } else {
 -                gen_helper_vfp_tosqd(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
 -            }
 -            write_vec_element(s, tcg_op, rd, pass, MO_64);
 -        }
 -        clear_vec_high(s, is_q, rd);
 -    } else {
 -        void (*fn)(TCGv_i32, TCGv_i32, TCGv_i32, TCGv_ptr);
 -        int maxpass = is_scalar ? 1 : ((8 << is_q) >> size);
 -
 -        switch (size) {
 -        case MO_16:
 -            if (is_u) {
 -                fn = gen_helper_vfp_touhh;
 -            } else {
 -                fn = gen_helper_vfp_toshh;
 -            }
 -            break;
-+            hcr = arm_hcr_el2_eff(env);
+-        case MO_32:
-+            if ((hcr & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE)) {
+-            if (is_u) {
-+                is_aa64 = (hcr & HCR_RW) != 0;
+-                fn = gen_helper_vfp_touls;
-+                break;
+-            } else {
-+            }
+-                fn = gen_helper_vfp_tosls;
-+            /* fall through */
+-            }
-         case 1:
+-            break;
-             is_aa64 = is_a64(env);
+-        default:
-             break;
+-            g_assert_not_reached();
 -        }
 -
 -        for (pass = 0; pass < maxpass; pass++) {
 -            TCGv_i32 tcg_op = tcg_temp_new_i32();
 -
 -            read_vec_element_i32(s, tcg_op, rn, pass, size);
 -            fn(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
 -            if (is_scalar) {
 -                if (size == MO_16 && !is_u) {
 -                    tcg_gen_ext16u_i32(tcg_op, tcg_op);
 -                }
 -                write_fp_sreg(s, rd, tcg_op);
 -            } else {
 -                write_vec_element_i32(s, tcg_op, rd, pass, size);
 -            }
 -        }
 -        if (!is_scalar) {
 -            clear_vec_high(s, is_q, rd);
 -        }
 -    }
 -
 -    gen_restore_rmode(tcg_rmode, tcg_fpstatus);
 -}
 +static gen_helper_gvec_2_ptr * const f_fcvtzu_vf[] = {
 +    gen_helper_gvec_vcvt_rz_hu,
 +    gen_helper_gvec_vcvt_rz_fu,
 +    gen_helper_gvec_vcvt_rz_du,
 +};
 +TRANS(FCVTZU_vf, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, a->shift, f_fcvtzu_vf)
  static void handle_2misc_64(DisasContext *s, int opcode, bool u,
                              TCGv_i64 tcg_rd, TCGv_i64 tcg_rn,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
      g_assert_not_reached();
  }
 -/* AdvSIMD shift by immediate
 - *  31  30   29 28         23 22  19 18  16 15    11  10 9    5 4    0
 - * +---+---+---+-------------+------+------+--------+---+------+------+
 - * | 0 | Q | U | 0 1 1 1 1 0 | immh | immb | opcode | 1 |  Rn  |  Rd  |
 - * +---+---+---+-------------+------+------+--------+---+------+------+
 - */
 -static void disas_simd_shift_imm(DisasContext *s, uint32_t insn)
 -{
 -    int rd = extract32(insn, 0, 5);
 -    int rn = extract32(insn, 5, 5);
 -    int opcode = extract32(insn, 11, 5);
 -    int immb = extract32(insn, 16, 3);
 -    int immh = extract32(insn, 19, 4);
 -    bool is_u = extract32(insn, 29, 1);
 -    bool is_q = extract32(insn, 30, 1);
 -
 -    if (immh == 0) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    switch (opcode) {
 -    case 0x1f: /* FCVTZS/ FCVTZU */
 -        handle_simd_shift_fpint_conv(s, false, is_q, is_u, immh, immb, rn, rd);
 -        return;
 -    default:
 -    case 0x00: /* SSHR / USHR */
 -    case 0x02: /* SSRA / USRA (accumulate) */
 -    case 0x04: /* SRSHR / URSHR (rounding) */
 -    case 0x06: /* SRSRA / URSRA (accum + rounding) */
 -    case 0x08: /* SRI */
 -    case 0x0a: /* SHL / SLI */
 -    case 0x0c: /* SQSHLU */
 -    case 0x0e: /* SQSHL, UQSHL */
 -    case 0x10: /* SHRN / SQSHRUN */
 -    case 0x11: /* RSHRN / SQRSHRUN */
 -    case 0x12: /* SQSHRN / UQSHRN */
 -    case 0x13: /* SQRSHRN / UQRSHRN */
 -    case 0x14: /* SSHLL / USHLL */
 -    case 0x1c: /* SCVTF / UCVTF */
 -        unallocated_encoding(s);
 -        return;
 -    }
 -}
 -
  static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
                                    int size, int rn, int rd)
  {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
  static const AArch64DecodeTable data_proc_simd[] = {
      /* pattern  ,  mask     ,  fn                        */
      { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
 -    { 0x0f000400, 0x9f800400, disas_simd_shift_imm },
      { 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
      { 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
      { 0x00000000, 0x00000000, NULL }
 diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
  DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_ds, helper_vfp_tosqd_round_to_zero, uint64_t)
 +DO_VCVT_FIXED(gvec_vcvt_rz_du, helper_vfp_touqd_round_to_zero, uint64_t)
  DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_rz_hs, helper_vfp_toshh_round_to_zero, uint16_t)
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ VFP_CONV_FIX_A64(sq, h, 16, dh_ctype_f16, 64, int64)
  VFP_CONV_FIX(uh, h, 16, dh_ctype_f16, 32, uint16)
  VFP_CONV_FIX(ul, h, 16, dh_ctype_f16, 32, uint32)
  VFP_CONV_FIX_A64(uq, h, 16, dh_ctype_f16, 64, uint64)
 +VFP_CONV_FLOAT_FIX_ROUND(sq, d, 64, float64, 64, int64,
 +                         float_round_to_zero, _round_to_zero)
 +VFP_CONV_FLOAT_FIX_ROUND(uq, d, 64, float64, 64, uint64,
 +                         float_round_to_zero, _round_to_zero)
  #undef VFP_CONV_FIX
  #undef VFP_CONV_FIX_FLOAT
 --
-.20.1
+.34.1

-[PULL 13/48] target/arm: Rename ARMMMUIdx_S1SE[01] to ARMMMUIdx_SE10_[01]
+[PULL 64/85] target/arm: Convert FCVT* (vector, integer) to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-This is part of a reorganization to the set of mmu_idx.
+Remove handle_2misc_64 as these were the last insns decoded
-This emphasizes that they apply to the Secure EL1&0 regime.
+by that function.  Remove helper_advsimd_f16to[su]inth as unused;
 we now always go through helper_vfp_to[su]hh or a specialized
 vector function instead.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-13-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-65-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h           |  8 ++++----
+ target/arm/helper.h            |   2 +
- target/arm/internals.h     |  4 ++--
+ target/arm/tcg/helper-a64.h    |   2 -
- target/arm/translate.h     |  2 +-
+ target/arm/tcg/a64.decode      |  25 ++++
- target/arm/helper.c        | 26 +++++++++++++-------------
+ target/arm/tcg/helper-a64.c    |  32 -----
- target/arm/translate-a64.c |  4 ++--
+ target/arm/tcg/translate-a64.c | 227 +++++++++++----------------------
- target/arm/translate.c     |  6 +++---
+ target/arm/tcg/vec_helper.c    |   2 +
-files changed, 25 insertions(+), 25 deletions(-)
+files changed, 102 insertions(+), 188 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/helper.h
-+++ b/target/arm/cpu.h
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rz_ds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     ARMMMUIdx_S1E2 = 2 | ARM_MMU_IDX_A,
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rz_du, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     ARMMMUIdx_S1E3 = 3 | ARM_MMU_IDX_A,
--    ARMMMUIdx_S1SE0 = 4 | ARM_MMU_IDX_A,
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
--    ARMMMUIdx_S1SE1 = 5 | ARM_MMU_IDX_A,
++DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
+ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     ARMMMUIdx_MUser = 0 | ARM_MMU_IDX_M,
+diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
-     ARMMMUIdx_MPriv = 1 | ARM_MMU_IDX_M,
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdxBit {
+--- a/target/arm/tcg/helper-a64.h
-     ARMMMUIdxBit_E10_1 = 1 << 1,
++++ b/target/arm/tcg/helper-a64.h
-     ARMMMUIdxBit_S1E2 = 1 << 2,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(advsimd_mulx2h, i32, i32, i32, ptr)
-     ARMMMUIdxBit_S1E3 = 1 << 3,
+ DEF_HELPER_4(advsimd_muladd2h, i32, i32, i32, i32, ptr)
--    ARMMMUIdxBit_S1SE0 = 1 << 4,
+ DEF_HELPER_2(advsimd_rinth_exact, f16, f16, ptr)
--    ARMMMUIdxBit_S1SE1 = 1 << 5,
+ DEF_HELPER_2(advsimd_rinth, f16, f16, ptr)
-+    ARMMMUIdxBit_SE10_0 = 1 << 4,
+-DEF_HELPER_2(advsimd_f16tosinth, i32, f16, ptr)
-+    ARMMMUIdxBit_SE10_1 = 1 << 5,
+-DEF_HELPER_2(advsimd_f16touinth, i32, f16, ptr)
-     ARMMMUIdxBit_Stage2 = 1 << 6,
-     ARMMMUIdxBit_MUser = 1 << 0,
+ DEF_HELPER_2(exception_return, void, env, i64)
-     ARMMMUIdxBit_MPriv = 1 << 1,
+ DEF_HELPER_FLAGS_2(dc_zva, TCG_CALL_NO_WG, void, env, i64)
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/internals.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
+@@ -XXX,XX +XXX,XX @@ SCVTF_vi        0.00 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
-     case ARMMMUIdx_MUser:
+ UCVTF_vi        0.10 1110 011 11001 11011 0 ..... .....     @qrr_h
-         return false;
+ UCVTF_vi        0.10 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
-     case ARMMMUIdx_S1E3:
--    case ARMMMUIdx_S1SE0:
++FCVTNS_vi       0.00 1110 011 11001 10101 0 ..... .....     @qrr_h
--    case ARMMMUIdx_S1SE1:
++FCVTNS_vi       0.00 1110 0.1 00001 10101 0 ..... .....     @qrr_sd
-+    case ARMMMUIdx_SE10_0:
++FCVTNU_vi       0.10 1110 011 11001 10101 0 ..... .....     @qrr_h
-+    case ARMMMUIdx_SE10_1:
++FCVTNU_vi       0.10 1110 0.1 00001 10101 0 ..... .....     @qrr_sd
-     case ARMMMUIdx_MSPrivNegPri:
++
-     case ARMMMUIdx_MSUserNegPri:
++FCVTPS_vi       0.00 1110 111 11001 10101 0 ..... .....     @qrr_h
-     case ARMMMUIdx_MSPriv:
++FCVTPS_vi       0.00 1110 1.1 00001 10101 0 ..... .....     @qrr_sd
-diff --git a/target/arm/translate.h b/target/arm/translate.h
++FCVTPU_vi       0.10 1110 111 11001 10101 0 ..... .....     @qrr_h
-index XXXXXXX..XXXXXXX 100644
++FCVTPU_vi       0.10 1110 1.1 00001 10101 0 ..... .....     @qrr_sd
---- a/target/arm/translate.h
++
-+++ b/target/arm/translate.h
++FCVTMS_vi       0.00 1110 011 11001 10111 0 ..... .....     @qrr_h
-@@ -XXX,XX +XXX,XX @@ static inline int default_exception_el(DisasContext *s)
++FCVTMS_vi       0.00 1110 0.1 00001 10111 0 ..... .....     @qrr_sd
-      * exceptions can only be routed to ELs above 1, so we target the higher of
++FCVTMU_vi       0.10 1110 011 11001 10111 0 ..... .....     @qrr_h
-      * 1 or the current EL.
++FCVTMU_vi       0.10 1110 0.1 00001 10111 0 ..... .....     @qrr_sd
-      */
++
--    return (s->mmu_idx == ARMMMUIdx_S1SE0 && s->secure_routed_to_el3)
++FCVTZS_vi       0.00 1110 111 11001 10111 0 ..... .....     @qrr_h
-+    return (s->mmu_idx == ARMMMUIdx_SE10_0 && s->secure_routed_to_el3)
++FCVTZS_vi       0.00 1110 1.1 00001 10111 0 ..... .....     @qrr_sd
-             ? 3 : MAX(1, s->current_el);
++FCVTZU_vi       0.10 1110 111 11001 10111 0 ..... .....     @qrr_h
 +FCVTZU_vi       0.10 1110 1.1 00001 10111 0 ..... .....     @qrr_sd
 +
 +FCVTAS_vi       0.00 1110 011 11001 11001 0 ..... .....     @qrr_h
 +FCVTAS_vi       0.00 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
 +FCVTAU_vi       0.10 1110 011 11001 11001 0 ..... .....     @qrr_h
 +FCVTAU_vi       0.10 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
 +
  &fcvt_q         rd rn esz q shift
  @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                  &fcvt_q esz=1 shift=%fcvt_f_sh_h
 diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/helper-a64.c
 +++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_rinth)(uint32_t x, void *fp_status)
      return ret;
  }
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+-/*
-index XXXXXXX..XXXXXXX 100644
+- * Half-precision floating point conversion functions
---- a/target/arm/helper.c
+- *
-+++ b/target/arm/helper.c
+- * There are a multitude of conversion functions with various
-@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+- * different rounding modes. This is dealt with by the calling code
-             mmu_idx = ARMMMUIdx_Stage1_E1;
+- * setting the mode appropriately before calling the helper.
-             break;
+- */
-         case 1:
+-
--            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_Stage1_E1;
+-uint32_t HELPER(advsimd_f16tosinth)(uint32_t a, void *fpstp)
-+            mmu_idx = secure ? ARMMMUIdx_SE10_1 : ARMMMUIdx_Stage1_E1;
+-{
-             break;
+-    float_status *fpst = fpstp;
-         default:
+-
-             g_assert_not_reached();
+-    /* Invalid if we are passed a NaN */
-@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+-    if (float16_is_any_nan(a)) {
-         /* stage 1 current state PL0: ATS1CUR, ATS1CUW */
+-        float_raise(float_flag_invalid, fpst);
-         switch (el) {
+-        return 0;
-         case 3:
+-    }
--            mmu_idx = ARMMMUIdx_S1SE0;
+-    return float16_to_int16(a, fpst);
-+            mmu_idx = ARMMMUIdx_SE10_0;
+-}
-             break;
+-
-         case 2:
+-uint32_t HELPER(advsimd_f16touinth)(uint32_t a, void *fpstp)
-             mmu_idx = ARMMMUIdx_Stage1_E0;
+-{
-             break;
+-    float_status *fpst = fpstp;
-         case 1:
+-
--            mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_Stage1_E0;
+-    /* Invalid if we are passed a NaN */
-+            mmu_idx = secure ? ARMMMUIdx_SE10_0 : ARMMMUIdx_Stage1_E0;
+-    if (float16_is_any_nan(a)) {
-             break;
+-        float_raise(float_flag_invalid, fpst);
-         default:
+-        return 0;
-             g_assert_not_reached();
+-    }
-@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
+-    return float16_to_uint16(a, fpst);
-     case 0:
+-}
-         switch (ri->opc1) {
+-
-         case 0: /* AT S1E1R, AT S1E1W */
+ static int el_from_spsr(uint32_t spsr)
--            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_Stage1_E1;
+ {
-+            mmu_idx = secure ? ARMMMUIdx_SE10_1 : ARMMMUIdx_Stage1_E1;
+     /* Return the exception level that this SPSR is requesting a return to,
-             break;
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
-         case 4: /* AT S1E2R, AT S1E2W */
+index XXXXXXX..XXXXXXX 100644
-             mmu_idx = ARMMMUIdx_S1E2;
+--- a/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
++++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_2_ptr * const f_fcvtzu_vf[] = {
  TRANS(FCVTZU_vf, do_gvec_op2_fpst,
        a->esz, a->q, a->rd, a->rn, a->shift, f_fcvtzu_vf)
 -static void handle_2misc_64(DisasContext *s, int opcode, bool u,
 -                            TCGv_i64 tcg_rd, TCGv_i64 tcg_rn,
 -                            TCGv_i32 tcg_rmode, TCGv_ptr tcg_fpstatus)
 -{
 -    /* Handle 64->64 opcodes which are shared between the scalar and
 -     * vector 2-reg-misc groups. We cover every integer opcode where size == 3
 -     * is valid in either group and also the double-precision fp ops.
 -     * The caller only need provide tcg_rmode and tcg_fpstatus if the op
 -     * requires them.
 -     */
 -    switch (opcode) {
 -    case 0x1a: /* FCVTNS */
 -    case 0x1b: /* FCVTMS */
 -    case 0x1c: /* FCVTAS */
 -    case 0x3a: /* FCVTPS */
 -    case 0x3b: /* FCVTZS */
 -        gen_helper_vfp_tosqd(tcg_rd, tcg_rn, tcg_constant_i32(0), tcg_fpstatus);
 -        break;
 -    case 0x5a: /* FCVTNU */
 -    case 0x5b: /* FCVTMU */
 -    case 0x5c: /* FCVTAU */
 -    case 0x7a: /* FCVTPU */
 -    case 0x7b: /* FCVTZU */
 -        gen_helper_vfp_touqd(tcg_rd, tcg_rn, tcg_constant_i32(0), tcg_fpstatus);
 -        break;
 -    default:
 -    case 0x4: /* CLS, CLZ */
 -    case 0x5: /* NOT */
 -    case 0x7: /* SQABS, SQNEG */
 -    case 0x8: /* CMGT, CMGE */
 -    case 0x9: /* CMEQ, CMLE */
 -    case 0xa: /* CMLT */
 -    case 0xb: /* ABS, NEG */
 -    case 0x2f: /* FABS */
 -    case 0x6f: /* FNEG */
 -    case 0x7f: /* FSQRT */
 -    case 0x18: /* FRINTN */
 -    case 0x19: /* FRINTM */
 -    case 0x38: /* FRINTP */
 -    case 0x39: /* FRINTZ */
 -    case 0x58: /* FRINTA */
 -    case 0x79: /* FRINTI */
 -    case 0x59: /* FRINTX */
 -    case 0x1e: /* FRINT32Z */
 -    case 0x5e: /* FRINT32X */
 -    case 0x1f: /* FRINT64Z */
 -    case 0x5f: /* FRINT64X */
 -        g_assert_not_reached();
 -    }
 -}
 +static gen_helper_gvec_2_ptr * const f_fcvt_s_vi[] = {
 +    gen_helper_gvec_vcvt_rm_sh,
 +    gen_helper_gvec_vcvt_rm_ss,
 +    gen_helper_gvec_vcvt_rm_sd,
 +};
 +
 +static gen_helper_gvec_2_ptr * const f_fcvt_u_vi[] = {
 +    gen_helper_gvec_vcvt_rm_uh,
 +    gen_helper_gvec_vcvt_rm_us,
 +    gen_helper_gvec_vcvt_rm_ud,
 +};
 +
 +TRANS(FCVTNS_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_nearest_even, f_fcvt_s_vi)
 +TRANS(FCVTNU_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_nearest_even, f_fcvt_u_vi)
 +TRANS(FCVTPS_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_up, f_fcvt_s_vi)
 +TRANS(FCVTPU_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_up, f_fcvt_u_vi)
 +TRANS(FCVTMS_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_down, f_fcvt_s_vi)
 +TRANS(FCVTMU_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_down, f_fcvt_u_vi)
 +TRANS(FCVTZS_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_to_zero, f_fcvt_s_vi)
 +TRANS(FCVTZU_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_to_zero, f_fcvt_u_vi)
 +TRANS(FCVTAS_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_ties_away, f_fcvt_s_vi)
 +TRANS(FCVTAU_vi, do_gvec_op2_fpst,
 +      a->esz, a->q, a->rd, a->rn, float_round_ties_away, f_fcvt_u_vi)
  static void handle_2misc_fcmp_zero(DisasContext *s, int opcode,
                                     bool is_scalar, bool is_u, bool is_q,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
              }
              handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
              return;
 -        case 0x1a: /* FCVTNS */
 -        case 0x1b: /* FCVTMS */
 -        case 0x3a: /* FCVTPS */
 -        case 0x3b: /* FCVTZS */
 -        case 0x5a: /* FCVTNU */
 -        case 0x5b: /* FCVTMU */
 -        case 0x7a: /* FCVTPU */
 -        case 0x7b: /* FCVTZU */
 -            need_fpstatus = true;
 -            rmode = extract32(opcode, 5, 1) | (extract32(opcode, 0, 1) << 1);
 -            if (size == 3 && !is_q) {
 -                unallocated_encoding(s);
 -                return;
 -            }
 -            break;
 -        case 0x5c: /* FCVTAU */
 -        case 0x1c: /* FCVTAS */
 -            need_fpstatus = true;
 -            rmode = FPROUNDING_TIEAWAY;
 -            if (size == 3 && !is_q) {
 -                unallocated_encoding(s);
 -                return;
 -            }
 -            break;
          case 0x3c: /* URECPE */
              if (size == 3) {
                  unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          case 0x5f: /* FRINT64X */
          case 0x1d: /* SCVTF */
          case 0x5d: /* UCVTF */
 +        case 0x1a: /* FCVTNS */
 +        case 0x1b: /* FCVTMS */
 +        case 0x3a: /* FCVTPS */
 +        case 0x3b: /* FCVTZS */
 +        case 0x5a: /* FCVTNU */
 +        case 0x5b: /* FCVTMU */
 +        case 0x7a: /* FCVTPU */
 +        case 0x7b: /* FCVTZU */
 +        case 0x5c: /* FCVTAU */
 +        case 0x1c: /* FCVTAS */
              unallocated_encoding(s);
              return;
          }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         tcg_rmode = NULL;
+     }
+-    if (size == 3) {
+-        /* All 64-bit element operations can be shared with scalar 2misc */
+-        int pass;
+-
+-        /* Coverity claims (size == 3 && !is_q) has been eliminated
+-         * from all paths leading to here.
+-         */
+-        tcg_debug_assert(is_q);
+-        for (pass = 0; pass < 2; pass++) {
+-            TCGv_i64 tcg_op = tcg_temp_new_i64();
+-            TCGv_i64 tcg_res = tcg_temp_new_i64();
+-
+-            read_vec_element(s, tcg_op, rn, pass, MO_64);
+-
+-            handle_2misc_64(s, opcode, u, tcg_res, tcg_op,
+-                            tcg_rmode, tcg_fpstatus);
+-
+-            write_vec_element(s, tcg_res, rd, pass, MO_64);
+-        }
+-    } else {
++    {
+         int pass;
+         assert(size == 2);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+             {
+                 /* Special cases for 32 bit elements */
+                 switch (opcode) {
+-                case 0x1a: /* FCVTNS */
+-                case 0x1b: /* FCVTMS */
+-                case 0x1c: /* FCVTAS */
+-                case 0x3a: /* FCVTPS */
+-                case 0x3b: /* FCVTZS */
+-                    gen_helper_vfp_tosls(tcg_res, tcg_op,
+-                                         tcg_constant_i32(0), tcg_fpstatus);
+-                    break;
+-                case 0x5a: /* FCVTNU */
+-                case 0x5b: /* FCVTMU */
+-                case 0x5c: /* FCVTAU */
+-                case 0x7a: /* FCVTPU */
+-                case 0x7b: /* FCVTZU */
+-                    gen_helper_vfp_touls(tcg_res, tcg_op,
+-                                         tcg_constant_i32(0), tcg_fpstatus);
+-                    break;
+                 case 0x7c: /* URSQRTE */
+                     gen_helper_rsqrte_u32(tcg_res, tcg_op);
+                     break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+                 case 0x5e: /* FRINT32X */
+                 case 0x1f: /* FRINT64Z */
+                 case 0x5f: /* FRINT64X */
++                case 0x1a: /* FCVTNS */
++                case 0x1b: /* FCVTMS */
++                case 0x1c: /* FCVTAS */
++                case 0x3a: /* FCVTPS */
++                case 0x3b: /* FCVTZS */
++                case 0x5a: /* FCVTNU */
++                case 0x5b: /* FCVTMU */
++                case 0x5c: /* FCVTAU */
++                case 0x7a: /* FCVTPU */
++                case 0x7b: /* FCVTZU */
+                     g_assert_not_reached();
+                 }
+             }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     case 0x3d: /* FRECPE */
+     case 0x3f: /* FRECPX */
          break;
-     case 2: /* AT S1E0R, AT S1E0W */
+-    case 0x1a: /* FCVTNS */
--        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_Stage1_E0;
+-        rmode = FPROUNDING_TIEEVEN;
-+        mmu_idx = secure ? ARMMMUIdx_SE10_0 : ARMMMUIdx_Stage1_E0;
+-        break;
-         break;
+-    case 0x1b: /* FCVTMS */
-     case 4: /* AT S12E1R, AT S12E1W */
+-        rmode = FPROUNDING_NEGINF;
--        mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_E10_1;
+-        break;
-+        mmu_idx = secure ? ARMMMUIdx_SE10_1 : ARMMMUIdx_E10_1;
+-    case 0x1c: /* FCVTAS */
-         break;
+-        rmode = FPROUNDING_TIEAWAY;
-     case 6: /* AT S12E0R, AT S12E0W */
+-        break;
--        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_E10_0;
+-    case 0x3a: /* FCVTPS */
-+        mmu_idx = secure ? ARMMMUIdx_SE10_0 : ARMMMUIdx_E10_0;
+-        rmode = FPROUNDING_POSINF;
 -        break;
 -    case 0x3b: /* FCVTZS */
 -        rmode = FPROUNDING_ZERO;
 -        break;
 -    case 0x5a: /* FCVTNU */
 -        rmode = FPROUNDING_TIEEVEN;
 -        break;
 -    case 0x5b: /* FCVTMU */
 -        rmode = FPROUNDING_NEGINF;
 -        break;
 -    case 0x5c: /* FCVTAU */
 -        rmode = FPROUNDING_TIEAWAY;
 -        break;
 -    case 0x7a: /* FCVTPU */
 -        rmode = FPROUNDING_POSINF;
 -        break;
 -    case 0x7b: /* FCVTZU */
 -        rmode = FPROUNDING_ZERO;
 -        break;
      case 0x7d: /* FRSQRTE */
          break;
      default:
-         g_assert_not_reached();
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
-@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
+     case 0x79: /* FRINTI */
- static int vae1_tlbmask(CPUARMState *env)
+     case 0x1d: /* SCVTF */
- {
+     case 0x5d: /* UCVTF */
-     if (arm_is_secure_below_el3(env)) {
++    case 0x1a: /* FCVTNS */
--        return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
++    case 0x1b: /* FCVTMS */
-+        return ARMMMUIdxBit_SE10_1 | ARMMMUIdxBit_SE10_0;
++    case 0x1c: /* FCVTAS */
-     } else {
++    case 0x3a: /* FCVTPS */
-         return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
++    case 0x3b: /* FCVTZS */
 +    case 0x5a: /* FCVTNU */
 +    case 0x5b: /* FCVTMU */
 +    case 0x5c: /* FCVTAU */
 +    case 0x7a: /* FCVTPU */
 +    case 0x7b: /* FCVTZU */
          unallocated_encoding(s);
          return;
      }
-@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
-      * stage 1 translations.
+             read_vec_element_i32(s, tcg_op, rn, pass, MO_16);
-      */
-     if (arm_is_secure_below_el3(env)) {
+             switch (fpop) {
--        return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
+-            case 0x1a: /* FCVTNS */
-+        return ARMMMUIdxBit_SE10_1 | ARMMMUIdxBit_SE10_0;
+-            case 0x1b: /* FCVTMS */
-     } else if (arm_feature(env, ARM_FEATURE_EL2)) {
+-            case 0x1c: /* FCVTAS */
-         return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_Stage2;
+-            case 0x3a: /* FCVTPS */
-     } else {
+-            case 0x3b: /* FCVTZS */
-@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
+-                gen_helper_advsimd_f16tosinth(tcg_res, tcg_op, tcg_fpstatus);
-         return 2;
+-                break;
-     case ARMMMUIdx_S1E3:
+             case 0x3d: /* FRECPE */
-         return 3;
+                 gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
--    case ARMMMUIdx_S1SE0:
+                 break;
-+    case ARMMMUIdx_SE10_0:
+-            case 0x5a: /* FCVTNU */
-         return arm_el_is_aa64(env, 3) ? 1 : 3;
+-            case 0x5b: /* FCVTMU */
--    case ARMMMUIdx_S1SE1:
+-            case 0x5c: /* FCVTAU */
-+    case ARMMMUIdx_SE10_1:
+-            case 0x7a: /* FCVTPU */
-     case ARMMMUIdx_Stage1_E0:
+-            case 0x7b: /* FCVTZU */
-     case ARMMMUIdx_Stage1_E1:
+-                gen_helper_advsimd_f16touinth(tcg_res, tcg_op, tcg_fpstatus);
-     case ARMMMUIdx_MPrivNegPri:
+-                break;
-@@ -XXX,XX +XXX,XX @@ bool arm_s1_regime_using_lpae_format(CPUARMState *env, ARMMMUIdx mmu_idx)
+             case 0x7d: /* FRSQRTE */
- static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
+                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
- {
+                 break;
-     switch (mmu_idx) {
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
--    case ARMMMUIdx_S1SE0:
+             case 0x58: /* FRINTA */
-+    case ARMMMUIdx_SE10_0:
+             case 0x79: /* FRINTI */
-     case ARMMMUIdx_Stage1_E0:
+             case 0x59: /* FRINTX */
-     case ARMMMUIdx_MUser:
++            case 0x1a: /* FCVTNS */
-     case ARMMMUIdx_MSUser:
++            case 0x1b: /* FCVTMS */
-@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
++            case 0x1c: /* FCVTAS */
 +            case 0x3a: /* FCVTPS */
 +            case 0x3b: /* FCVTZS */
 +            case 0x5a: /* FCVTNU */
 +            case 0x5b: /* FCVTMU */
 +            case 0x5c: /* FCVTAU */
 +            case 0x7a: /* FCVTPU */
 +            case 0x7b: /* FCVTZU */
                  g_assert_not_reached();
              }
 diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_rz_hu, helper_vfp_touhh_round_to_zero, uint16_t)
          clear_tail(d, oprsz, simd_maxsz(desc));                         \
      }
-     if (el < 2 && arm_is_secure_below_el3(env)) {
++DO_VCVT_RMODE(gvec_vcvt_rm_sd, helper_vfp_tosqd, uint64_t)
--        return ARMMMUIdx_S1SE0 + el;
++DO_VCVT_RMODE(gvec_vcvt_rm_ud, helper_vfp_touqd, uint64_t)
-+        return ARMMMUIdx_SE10_0 + el;
+ DO_VCVT_RMODE(gvec_vcvt_rm_ss, helper_vfp_tosls, uint32_t)
-     } else {
+ DO_VCVT_RMODE(gvec_vcvt_rm_us, helper_vfp_touls, uint32_t)
-         return ARMMMUIdx_E10_0 + el;
+ DO_VCVT_RMODE(gvec_vcvt_rm_sh, helper_vfp_toshh, uint16_t)
      }
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a64_user_mem_index(DisasContext *s)
      case ARMMMUIdx_E10_1:
          useridx = ARMMMUIdx_E10_0;
          break;
 -    case ARMMMUIdx_S1SE1:
 -        useridx = ARMMMUIdx_S1SE0;
 +    case ARMMMUIdx_SE10_1:
 +        useridx = ARMMMUIdx_SE10_0;
          break;
      case ARMMMUIdx_Stage2:
          g_assert_not_reached();
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
      case ARMMMUIdx_E10_1:
          return arm_to_core_mmu_idx(ARMMMUIdx_E10_0);
      case ARMMMUIdx_S1E3:
 -    case ARMMMUIdx_S1SE0:
 -    case ARMMMUIdx_S1SE1:
 -        return arm_to_core_mmu_idx(ARMMMUIdx_S1SE0);
 +    case ARMMMUIdx_SE10_0:
 +    case ARMMMUIdx_SE10_1:
 +        return arm_to_core_mmu_idx(ARMMMUIdx_SE10_0);
      case ARMMMUIdx_MUser:
      case ARMMMUIdx_MPriv:
          return arm_to_core_mmu_idx(ARMMMUIdx_MUser);
 --
-.20.1
+.34.1

-[PULL 27/48] target/arm: Update timer access for VHE
+[PULL 65/85] target/arm: Convert handle_2misc_fcmp_zero to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+This includes FCMEQ, FCMGT, FCMGE, FCMLT, FCMLE.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-27-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-66-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 102 +++++++++++++++++++++++++++++++++++---------
+ target/arm/helper.h            |   5 +
-file changed, 81 insertions(+), 21 deletions(-)
+ target/arm/tcg/a64.decode      |  30 ++++
  target/arm/tcg/translate-a64.c | 249 +++++++++++++--------------------
  target/arm/tcg/vec_helper.c    |   4 +-
 files changed, 138 insertions(+), 150 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/helper.h
-+++ b/target/arm/helper.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_cntfrq_access(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-      * Writable only at the highest implemented exception level.
-      */
+ DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     int el = arm_current_el(env);
+ DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    uint64_t hcr;
++DEF_HELPER_FLAGS_4(gvec_fcgt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+    uint32_t cntkctl;
+ DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     switch (el) {
+ DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     case 0:
++DEF_HELPER_FLAGS_4(gvec_fcge0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
--        if (!extract32(env->cp15.c14_cntkctl, 0, 2)) {
-+        hcr = arm_hcr_el2_eff(env);
+ DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+ DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+            cntkctl = env->cp15.cnthctl_el2;
++DEF_HELPER_FLAGS_4(gvec_fceq0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+        } else {
-+            cntkctl = env->cp15.c14_cntkctl;
+ DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+        }
+ DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+        if (!extract32(cntkctl, 0, 2)) {
++DEF_HELPER_FLAGS_4(gvec_fcle0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-             return CP_ACCESS_TRAP;
-         }
+ DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         break;
+ DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_counter_access(CPUARMState *env, int timeridx,
++DEF_HELPER_FLAGS_4(gvec_fclt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- {
-     unsigned int cur_el = arm_current_el(env);
+ DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-     bool secure = arm_is_secure(env);
+ DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+    uint64_t hcr = arm_hcr_el2_eff(env);
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
+index XXXXXXX..XXXXXXX 100644
--    /* CNT[PV]CT: not visible from PL0 if ELO[PV]CTEN is zero */
+--- a/target/arm/tcg/a64.decode
--    if (cur_el == 0 &&
++++ b/target/arm/tcg/a64.decode
--        !extract32(env->cp15.c14_cntkctl, timeridx, 1)) {
+@@ -XXX,XX +XXX,XX @@ UQXTN_s         0111 1110 ..1 00001 01001 0 ..... .....     @rr_e
--        return CP_ACCESS_TRAP;
--    }
+ FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
-+    switch (cur_el) {
-+    case 0:
++FCMGT0_s        0101 1110 111 11000 11001 0 ..... .....     @rr_h
-+        /* If HCR_EL2.<E2H,TGE> == '11': check CNTHCTL_EL2.EL0[PV]CTEN. */
++FCMGT0_s        0101 1110 1.1 00000 11001 0 ..... .....     @rr_sd
-+        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
++
-+            return (extract32(env->cp15.cnthctl_el2, timeridx, 1)
++FCMGE0_s        0111 1110 111 11000 11001 0 ..... .....     @rr_h
-+                    ? CP_ACCESS_OK : CP_ACCESS_TRAP_EL2);
++FCMGE0_s        0111 1110 1.1 00000 11001 0 ..... .....     @rr_sd
-+        }
++
++FCMEQ0_s        0101 1110 111 11000 11011 0 ..... .....     @rr_h
--    if (arm_feature(env, ARM_FEATURE_EL2) &&
++FCMEQ0_s        0101 1110 1.1 00000 11011 0 ..... .....     @rr_sd
--        timeridx == GTIMER_PHYS && !secure && cur_el < 2 &&
++
--        !extract32(env->cp15.cnthctl_el2, 0, 1)) {
++FCMLE0_s        0111 1110 111 11000 11011 0 ..... .....     @rr_h
--        return CP_ACCESS_TRAP_EL2;
++FCMLE0_s        0111 1110 1.1 00000 11011 0 ..... .....     @rr_sd
-+        /* CNT[PV]CT: not visible from PL0 if EL0[PV]CTEN is zero */
++
-+        if (!extract32(env->cp15.c14_cntkctl, timeridx, 1)) {
++FCMLT0_s        0101 1110 111 11000 11101 0 ..... .....     @rr_h
-+            return CP_ACCESS_TRAP;
++FCMLT0_s        0101 1110 1.1 00000 11101 0 ..... .....     @rr_sd
-+        }
++
-+
+ @icvt_h         . ....... .. ...... ...... rn:5 rd:5 \
-+        /* If HCR_EL2.<E2H,TGE> == '10': check CNTHCTL_EL2.EL1PCTEN. */
+                 &fcvt sf=0 esz=1 shift=0
-+        if (hcr & HCR_E2H) {
+ @icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
-+            if (timeridx == GTIMER_PHYS &&
+@@ -XXX,XX +XXX,XX @@ FCVTAS_vi       0.00 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
-+                !extract32(env->cp15.cnthctl_el2, 10, 1)) {
+ FCVTAU_vi       0.10 1110 011 11001 11001 0 ..... .....     @qrr_h
-+                return CP_ACCESS_TRAP_EL2;
+ FCVTAU_vi       0.10 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
 +FCMGT0_v        0.00 1110 111 11000 11001 0 ..... .....     @qrr_h
 +FCMGT0_v        0.00 1110 1.1 00000 11001 0 ..... .....     @qrr_sd
 +
 +FCMGE0_v        0.10 1110 111 11000 11001 0 ..... .....     @qrr_h
 +FCMGE0_v        0.10 1110 1.1 00000 11001 0 ..... .....     @qrr_sd
 +
 +FCMEQ0_v        0.00 1110 111 11000 11011 0 ..... .....     @qrr_h
 +FCMEQ0_v        0.00 1110 1.1 00000 11011 0 ..... .....     @qrr_sd
 +
 +FCMLE0_v        0.10 1110 111 11000 11011 0 ..... .....     @qrr_h
 +FCMLE0_v        0.10 1110 1.1 00000 11011 0 ..... .....     @qrr_sd
 +
 +FCMLT0_v        0.00 1110 111 11000 11101 0 ..... .....     @qrr_h
 +FCMLT0_v        0.00 1110 1.1 00000 11101 0 ..... .....     @qrr_sd
 +
  &fcvt_q         rd rn esz q shift
  @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                  &fcvt_q esz=1 shift=%fcvt_f_sh_h
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static const FPScalar f_scalar_frsqrts = {
  };
  TRANS(FRSQRTS_s, do_fp3_scalar, a, &f_scalar_frsqrts)
 +static bool do_fcmp0_s(DisasContext *s, arg_rr_e *a,
 +                       const FPScalar *f, bool swap)
 +{
 +    switch (a->esz) {
 +    case MO_64:
 +        if (fp_access_check(s)) {
 +            TCGv_i64 t0 = read_fp_dreg(s, a->rn);
 +            TCGv_i64 t1 = tcg_constant_i64(0);
 +            if (swap) {
 +                f->gen_d(t0, t1, t0, fpstatus_ptr(FPST_FPCR));
 +            } else {
 +                f->gen_d(t0, t0, t1, fpstatus_ptr(FPST_FPCR));
 +            }
-+        } else {
++            write_fp_dreg(s, a->rd, t0);
 +            /* If HCR_EL2.<E2H> == 0: check CNTHCTL_EL2.EL1PCEN. */
 +            if (arm_feature(env, ARM_FEATURE_EL2) &&
 +                timeridx == GTIMER_PHYS && !secure &&
 +                !extract32(env->cp15.cnthctl_el2, 1, 1)) {
 +                return CP_ACCESS_TRAP_EL2;
 +            }
 +        }
 +        break;
-+
++    case MO_32:
-+    case 1:
++        if (fp_access_check(s)) {
-+        /* Check CNTHCTL_EL2.EL1PCTEN, which changes location based on E2H. */
++            TCGv_i32 t0 = read_fp_sreg(s, a->rn);
-+        if (arm_feature(env, ARM_FEATURE_EL2) &&
++            TCGv_i32 t1 = tcg_constant_i32(0);
-+            timeridx == GTIMER_PHYS && !secure &&
++            if (swap) {
-+            (hcr & HCR_E2H
++                f->gen_s(t0, t1, t0, fpstatus_ptr(FPST_FPCR));
-+             ? !extract32(env->cp15.cnthctl_el2, 10, 1)
++            } else {
-+             : !extract32(env->cp15.cnthctl_el2, 0, 1))) {
++                f->gen_s(t0, t0, t1, fpstatus_ptr(FPST_FPCR));
-+            return CP_ACCESS_TRAP_EL2;
++            }
 +            write_fp_sreg(s, a->rd, t0);
 +        }
 +        break;
-     }
++    case MO_16:
-     return CP_ACCESS_OK;
++        if (!dc_isar_feature(aa64_fp16, s)) {
- }
++            return false;
@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_timer_access(CPUARMState *env, int timeridx,
  {
      unsigned int cur_el = arm_current_el(env);
      bool secure = arm_is_secure(env);
 +    uint64_t hcr = arm_hcr_el2_eff(env);
 -    /* CNT[PV]_CVAL, CNT[PV]_CTL, CNT[PV]_TVAL: not visible from PL0 if
 -     * EL0[PV]TEN is zero.
 -     */
 -    if (cur_el == 0 &&
 -        !extract32(env->cp15.c14_cntkctl, 9 - timeridx, 1)) {
 -        return CP_ACCESS_TRAP;
 -    }
 +    switch (cur_el) {
 +    case 0:
 +        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 +            /* If HCR_EL2.<E2H,TGE> == '11': check CNTHCTL_EL2.EL0[PV]TEN. */
 +            return (extract32(env->cp15.cnthctl_el2, 9 - timeridx, 1)
 +                    ? CP_ACCESS_OK : CP_ACCESS_TRAP_EL2);
 +        }
++        if (fp_access_check(s)) {
--    if (arm_feature(env, ARM_FEATURE_EL2) &&
++            TCGv_i32 t0 = read_fp_hreg(s, a->rn);
--        timeridx == GTIMER_PHYS && !secure && cur_el < 2 &&
++            TCGv_i32 t1 = tcg_constant_i32(0);
--        !extract32(env->cp15.cnthctl_el2, 1, 1)) {
++            if (swap) {
--        return CP_ACCESS_TRAP_EL2;
++                f->gen_h(t0, t1, t0, fpstatus_ptr(FPST_FPCR_F16));
 +        /*
 +         * CNT[PV]_CVAL, CNT[PV]_CTL, CNT[PV]_TVAL: not visible from
 +         * EL0 if EL0[PV]TEN is zero.
 +         */
 +        if (!extract32(env->cp15.c14_cntkctl, 9 - timeridx, 1)) {
 +            return CP_ACCESS_TRAP;
 +        }
 +        /* fall through */
 +
 +    case 1:
 +        if (arm_feature(env, ARM_FEATURE_EL2) &&
 +            timeridx == GTIMER_PHYS && !secure) {
 +            if (hcr & HCR_E2H) {
 +                /* If HCR_EL2.<E2H,TGE> == '10': check CNTHCTL_EL2.EL1PTEN. */
 +                if (!extract32(env->cp15.cnthctl_el2, 11, 1)) {
 +                    return CP_ACCESS_TRAP_EL2;
 +                }
 +            } else {
-+                /* If HCR_EL2.<E2H> == 0: check CNTHCTL_EL2.EL1PCEN. */
++                f->gen_h(t0, t0, t1, fpstatus_ptr(FPST_FPCR_F16));
 +                if (!extract32(env->cp15.cnthctl_el2, 1, 1)) {
 +                    return CP_ACCESS_TRAP_EL2;
 +                }
 +            }
++            write_fp_sreg(s, a->rd, t0);
 +        }
 +        break;
++    default:
++        return false;
++    }
++    return true;
++}
++
++TRANS(FCMEQ0_s, do_fcmp0_s, a, &f_scalar_fcmeq, false)
++TRANS(FCMGT0_s, do_fcmp0_s, a, &f_scalar_fcmgt, false)
++TRANS(FCMGE0_s, do_fcmp0_s, a, &f_scalar_fcmge, false)
++TRANS(FCMLT0_s, do_fcmp0_s, a, &f_scalar_fcmgt, true)
++TRANS(FCMLE0_s, do_fcmp0_s, a, &f_scalar_fcmge, true)
++
+ static bool do_satacc_s(DisasContext *s, arg_rrr_e *a,
+                 MemOp sgn_n, MemOp sgn_m,
+                 void (*gen_bhs)(TCGv_i64, TCGv_i64, TCGv_i64, TCGv_i64, MemOp),
+@@ -XXX,XX +XXX,XX @@ TRANS(FCVTAS_vi, do_gvec_op2_fpst,
+ TRANS(FCVTAU_vi, do_gvec_op2_fpst,
+       a->esz, a->q, a->rd, a->rn, float_round_ties_away, f_fcvt_u_vi)
+-static void handle_2misc_fcmp_zero(DisasContext *s, int opcode,
+-                                   bool is_scalar, bool is_u, bool is_q,
+-                                   int size, int rn, int rd)
+-{
+-    bool is_double = (size == MO_64);
+-    TCGv_ptr fpst;
++static gen_helper_gvec_2_ptr * const f_fceq0[] = {
++    gen_helper_gvec_fceq0_h,
++    gen_helper_gvec_fceq0_s,
++    gen_helper_gvec_fceq0_d,
++};
++TRANS(FCMEQ0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fceq0)
+-    if (!fp_access_check(s)) {
+-        return;
+-    }
++static gen_helper_gvec_2_ptr * const f_fcgt0[] = {
++    gen_helper_gvec_fcgt0_h,
++    gen_helper_gvec_fcgt0_s,
++    gen_helper_gvec_fcgt0_d,
++};
++TRANS(FCMGT0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcgt0)
+-    fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
++static gen_helper_gvec_2_ptr * const f_fcge0[] = {
++    gen_helper_gvec_fcge0_h,
++    gen_helper_gvec_fcge0_s,
++    gen_helper_gvec_fcge0_d,
++};
++TRANS(FCMGE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcge0)
+-    if (is_double) {
+-        TCGv_i64 tcg_op = tcg_temp_new_i64();
+-        TCGv_i64 tcg_zero = tcg_constant_i64(0);
+-        TCGv_i64 tcg_res = tcg_temp_new_i64();
+-        NeonGenTwoDoubleOpFn *genfn;
+-        bool swap = false;
+-        int pass;
++static gen_helper_gvec_2_ptr * const f_fclt0[] = {
++    gen_helper_gvec_fclt0_h,
++    gen_helper_gvec_fclt0_s,
++    gen_helper_gvec_fclt0_d,
++};
++TRANS(FCMLT0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fclt0)
+-        switch (opcode) {
+-        case 0x2e: /* FCMLT (zero) */
+-            swap = true;
+-            /* fallthrough */
+-        case 0x2c: /* FCMGT (zero) */
+-            genfn = gen_helper_neon_cgt_f64;
+-            break;
+-        case 0x2d: /* FCMEQ (zero) */
+-            genfn = gen_helper_neon_ceq_f64;
+-            break;
+-        case 0x6d: /* FCMLE (zero) */
+-            swap = true;
+-            /* fall through */
+-        case 0x6c: /* FCMGE (zero) */
+-            genfn = gen_helper_neon_cge_f64;
+-            break;
+-        default:
+-            g_assert_not_reached();
+-        }
+-
+-        for (pass = 0; pass < (is_scalar ? 1 : 2); pass++) {
+-            read_vec_element(s, tcg_op, rn, pass, MO_64);
+-            if (swap) {
+-                genfn(tcg_res, tcg_zero, tcg_op, fpst);
+-            } else {
+-                genfn(tcg_res, tcg_op, tcg_zero, fpst);
+-            }
+-            write_vec_element(s, tcg_res, rd, pass, MO_64);
+-        }
+-
+-        clear_vec_high(s, !is_scalar, rd);
+-    } else {
+-        TCGv_i32 tcg_op = tcg_temp_new_i32();
+-        TCGv_i32 tcg_zero = tcg_constant_i32(0);
+-        TCGv_i32 tcg_res = tcg_temp_new_i32();
+-        NeonGenTwoSingleOpFn *genfn;
+-        bool swap = false;
+-        int pass, maxpasses;
+-
+-        if (size == MO_16) {
+-            switch (opcode) {
+-            case 0x2e: /* FCMLT (zero) */
+-                swap = true;
+-                /* fall through */
+-            case 0x2c: /* FCMGT (zero) */
+-                genfn = gen_helper_advsimd_cgt_f16;
+-                break;
+-            case 0x2d: /* FCMEQ (zero) */
+-                genfn = gen_helper_advsimd_ceq_f16;
+-                break;
+-            case 0x6d: /* FCMLE (zero) */
+-                swap = true;
+-                /* fall through */
+-            case 0x6c: /* FCMGE (zero) */
+-                genfn = gen_helper_advsimd_cge_f16;
+-                break;
+-            default:
+-                g_assert_not_reached();
+-            }
+-        } else {
+-            switch (opcode) {
+-            case 0x2e: /* FCMLT (zero) */
+-                swap = true;
+-                /* fall through */
+-            case 0x2c: /* FCMGT (zero) */
+-                genfn = gen_helper_neon_cgt_f32;
+-                break;
+-            case 0x2d: /* FCMEQ (zero) */
+-                genfn = gen_helper_neon_ceq_f32;
+-                break;
+-            case 0x6d: /* FCMLE (zero) */
+-                swap = true;
+-                /* fall through */
+-            case 0x6c: /* FCMGE (zero) */
+-                genfn = gen_helper_neon_cge_f32;
+-                break;
+-            default:
+-                g_assert_not_reached();
+-            }
+-        }
+-
+-        if (is_scalar) {
+-            maxpasses = 1;
+-        } else {
+-            int vector_size = 8 << is_q;
+-            maxpasses = vector_size >> size;
+-        }
+-
+-        for (pass = 0; pass < maxpasses; pass++) {
+-            read_vec_element_i32(s, tcg_op, rn, pass, size);
+-            if (swap) {
+-                genfn(tcg_res, tcg_zero, tcg_op, fpst);
+-            } else {
+-                genfn(tcg_res, tcg_op, tcg_zero, fpst);
+-            }
+-            if (is_scalar) {
+-                write_fp_sreg(s, rd, tcg_res);
+-            } else {
+-                write_vec_element_i32(s, tcg_res, rd, pass, size);
+-            }
+-        }
+-
+-        if (!is_scalar) {
+-            clear_vec_high(s, is_q, rd);
+-        }
+-    }
+-}
++static gen_helper_gvec_2_ptr * const f_fcle0[] = {
++    gen_helper_gvec_fcle0_h,
++    gen_helper_gvec_fcle0_s,
++    gen_helper_gvec_fcle0_d,
++};
++TRANS(FCMLE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcle0)
+ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
+                                     bool is_scalar, bool is_u, bool is_q,
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
+         size = extract32(size, 0, 1) ? 3 : 2;
+         switch (opcode) {
+-        case 0x2c: /* FCMGT (zero) */
+-        case 0x2d: /* FCMEQ (zero) */
+-        case 0x2e: /* FCMLT (zero) */
+-        case 0x6c: /* FCMGE (zero) */
+-        case 0x6d: /* FCMLE (zero) */
+-            handle_2misc_fcmp_zero(s, opcode, true, u, true, size, rn, rd);
+-            return;
+         case 0x3d: /* FRECPE */
+         case 0x3f: /* FRECPX */
+         case 0x7d: /* FRSQRTE */
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x56: /* FCVTXN, FCVTXN2 */
+         case 0x1d: /* SCVTF */
+         case 0x5d: /* UCVTF */
++        case 0x2c: /* FCMGT (zero) */
++        case 0x2d: /* FCMEQ (zero) */
++        case 0x2e: /* FCMLT (zero) */
++        case 0x6c: /* FCMGE (zero) */
++        case 0x6d: /* FCMLE (zero) */
+         default:
+             unallocated_encoding(s);
+             return;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
+         size = is_double ? 3 : 2;
+         switch (opcode) {
+-        case 0x2c: /* FCMGT (zero) */
+-        case 0x2d: /* FCMEQ (zero) */
+-        case 0x2e: /* FCMLT (zero) */
+-        case 0x6c: /* FCMGE (zero) */
+-        case 0x6d: /* FCMLE (zero) */
+-            if (size == 3 && !is_q) {
+-                unallocated_encoding(s);
+-                return;
+-            }
+-            handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
+-            return;
+         case 0x3c: /* URECPE */
+             if (size == 3) {
+                 unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+         case 0x7b: /* FCVTZU */
+         case 0x5c: /* FCVTAU */
+         case 0x1c: /* FCVTAS */
++        case 0x2c: /* FCMGT (zero) */
++        case 0x2d: /* FCMEQ (zero) */
++        case 0x2e: /* FCMLT (zero) */
++        case 0x6c: /* FCMGE (zero) */
++        case 0x6d: /* FCMLE (zero) */
+             unallocated_encoding(s);
+             return;
+         }
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     fpop = deposit32(fpop, 6, 1, u);
+     switch (fpop) {
+-    case 0x2c: /* FCMGT (zero) */
+-    case 0x2d: /* FCMEQ (zero) */
+-    case 0x2e: /* FCMLT (zero) */
+-    case 0x6c: /* FCMGE (zero) */
+-    case 0x6d: /* FCMLE (zero) */
+-        handle_2misc_fcmp_zero(s, fpop, is_scalar, 0, is_q, MO_16, rn, rd);
+-        return;
+     case 0x3d: /* FRECPE */
+     case 0x3f: /* FRECPX */
+         break;
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
+     case 0x5c: /* FCVTAU */
+     case 0x7a: /* FCVTPU */
+     case 0x7b: /* FCVTZU */
++    case 0x2c: /* FCMGT (zero) */
++    case 0x2d: /* FCMEQ (zero) */
++    case 0x2e: /* FCMLT (zero) */
++    case 0x6c: /* FCMGE (zero) */
++    case 0x6d: /* FCMLE (zero) */
+         unallocated_encoding(s);
+         return;
      }
-     return CP_ACCESS_OK;
+diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
- }
+index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_touszh, vfp_touszh, float16)
  #define DO_2OP_CMP0(FN, CMPOP, DIRN)                    \
      WRAP_CMP0_##DIRN(FN, CMPOP, float16)                \
      WRAP_CMP0_##DIRN(FN, CMPOP, float32)                \
 +    WRAP_CMP0_##DIRN(FN, CMPOP, float64)                \
      DO_2OP(gvec_f##FN##0_h, float16_##FN##0, float16)   \
 -    DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)
 +    DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)   \
 +    DO_2OP(gvec_f##FN##0_d, float64_##FN##0, float64)
  DO_2OP_CMP0(cgt, cgt, FWD)
  DO_2OP_CMP0(cge, cge, FWD)
 --
-.20.1
+.34.1

-[PULL 10/48] target/arm: Rename ARMMMUIdx*_S12NSE* to ARMMMUIdx*_E10_*
+[PULL 66/85] target/arm: Convert FRECPE, FRECPX, FRSQRTE to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-This is part of a reorganization to the set of mmu_idx.
+Remove disas_simd_scalar_two_reg_misc and
-This emphasizes that they apply to the EL1&0 regime.
+disas_simd_two_reg_misc_fp16 as these were the
 last insns decoded by those functions.
-The ultimate goal is
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
  -- Non-secure regimes:
     ARMMMUIdx_E10_0,
     ARMMMUIdx_E20_0,
     ARMMMUIdx_E10_1,
     ARMMMUIdx_E2,
     ARMMMUIdx_E20_2,
  -- Secure regimes:
     ARMMMUIdx_SE10_0,
     ARMMMUIdx_SE10_1,
     ARMMMUIdx_SE3,
  -- Helper mmu_idx for non-secure EL1&0 stage1 and stage2
     ARMMMUIdx_Stage2,
     ARMMMUIdx_Stage1_E0,
     ARMMMUIdx_Stage1_E1,
 The 'S' prefix is reserved for "Secure".  Unless otherwise specified,
 each mmu_idx represents all stages of translation.
 Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-10-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-67-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h           |  8 ++++----
+ target/arm/tcg/a64.decode      |  15 ++
- target/arm/internals.h     |  4 ++--
+ target/arm/tcg/translate-a64.c | 329 ++++-----------------------------
- target/arm/helper.c        | 40 +++++++++++++++++++-------------------
+files changed, 53 insertions(+), 291 deletions(-)
  target/arm/translate-a64.c |  4 ++--
  target/arm/translate.c     |  6 +++---
 files changed, 31 insertions(+), 31 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/cpu.h
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+@@ -XXX,XX +XXX,XX @@ FCMLE0_s        0111 1110 1.1 00000 11011 0 ..... .....     @rr_sd
- #define ARM_MMU_IDX_COREIDX_MASK 0x7
+ FCMLT0_s        0101 1110 111 11000 11101 0 ..... .....     @rr_h
+ FCMLT0_s        0101 1110 1.1 00000 11101 0 ..... .....     @rr_sd
- typedef enum ARMMMUIdx {
--    ARMMMUIdx_S12NSE0 = 0 | ARM_MMU_IDX_A,
++FRECPE_s        0101 1110 111 11001 11011 0 ..... .....     @rr_h
--    ARMMMUIdx_S12NSE1 = 1 | ARM_MMU_IDX_A,
++FRECPE_s        0101 1110 1.1 00001 11011 0 ..... .....     @rr_sd
-+    ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
++
-+    ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
++FRECPX_s        0101 1110 111 11001 11111 0 ..... .....     @rr_h
-     ARMMMUIdx_S1E2 = 2 | ARM_MMU_IDX_A,
++FRECPX_s        0101 1110 1.1 00001 11111 0 ..... .....     @rr_sd
-     ARMMMUIdx_S1E3 = 3 | ARM_MMU_IDX_A,
++
-     ARMMMUIdx_S1SE0 = 4 | ARM_MMU_IDX_A,
++FRSQRTE_s       0111 1110 111 11001 11011 0 ..... .....     @rr_h
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
++FRSQRTE_s       0111 1110 1.1 00001 11011 0 ..... .....     @rr_sd
-  * for use when calling tlb_flush_by_mmuidx() and friends.
++
-  */
+ @icvt_h         . ....... .. ...... ...... rn:5 rd:5 \
- typedef enum ARMMMUIdxBit {
+                 &fcvt sf=0 esz=1 shift=0
--    ARMMMUIdxBit_S12NSE0 = 1 << 0,
+ @icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
--    ARMMMUIdxBit_S12NSE1 = 1 << 1,
+@@ -XXX,XX +XXX,XX @@ FCMLE0_v        0.10 1110 1.1 00000 11011 0 ..... .....     @qrr_sd
-+    ARMMMUIdxBit_E10_0 = 1 << 0,
+ FCMLT0_v        0.00 1110 111 11000 11101 0 ..... .....     @qrr_h
-+    ARMMMUIdxBit_E10_1 = 1 << 1,
+ FCMLT0_v        0.00 1110 1.1 00000 11101 0 ..... .....     @qrr_sd
-     ARMMMUIdxBit_S1E2 = 1 << 2,
-     ARMMMUIdxBit_S1E3 = 1 << 3,
++FRECPE_v        0.00 1110 111 11001 11011 0 ..... .....     @qrr_h
-     ARMMMUIdxBit_S1SE0 = 1 << 4,
++FRECPE_v        0.00 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
-diff --git a/target/arm/internals.h b/target/arm/internals.h
++
 +FRSQRTE_v       0.10 1110 111 11001 11011 0 ..... .....     @qrr_h
 +FRSQRTE_v       0.10 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
 +
  &fcvt_q         rd rn esz q shift
  @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                  &fcvt_q esz=1 shift=%fcvt_f_sh_h
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/arm/internals.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static inline void arm_call_el_change_hook(ARMCPU *cpu)
+@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FRINT64Z_s, aa64_frint, do_fp1_scalar, a,
- static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
+            &f_scalar_frint64, FPROUNDING_ZERO)
  TRANS_FEAT(FRINT64X_s, aa64_frint, do_fp1_scalar, a, &f_scalar_frint64, -1)
 +static const FPScalar1 f_scalar_frecpe = {
 +    gen_helper_recpe_f16,
 +    gen_helper_recpe_f32,
 +    gen_helper_recpe_f64,
 +};
 +TRANS(FRECPE_s, do_fp1_scalar, a, &f_scalar_frecpe, -1)
 +
 +static const FPScalar1 f_scalar_frecpx = {
 +    gen_helper_frecpx_f16,
 +    gen_helper_frecpx_f32,
 +    gen_helper_frecpx_f64,
 +};
 +TRANS(FRECPX_s, do_fp1_scalar, a, &f_scalar_frecpx, -1)
 +
 +static const FPScalar1 f_scalar_frsqrte = {
 +    gen_helper_rsqrte_f16,
 +    gen_helper_rsqrte_f32,
 +    gen_helper_rsqrte_f64,
 +};
 +TRANS(FRSQRTE_s, do_fp1_scalar, a, &f_scalar_frsqrte, -1)
 +
  static bool trans_FCVT_s_ds(DisasContext *s, arg_rr *a)
  {
-     switch (mmu_idx) {
+     if (fp_access_check(s)) {
--    case ARMMMUIdx_S12NSE0:
+@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_2_ptr * const f_fcle0[] = {
--    case ARMMMUIdx_S12NSE1:
+ };
-+    case ARMMMUIdx_E10_0:
+ TRANS(FCMLE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcle0)
-+    case ARMMMUIdx_E10_1:
-     case ARMMMUIdx_S1NSE0:
++static gen_helper_gvec_2_ptr * const f_frecpe[] = {
-     case ARMMMUIdx_S1NSE1:
++    gen_helper_gvec_frecpe_h,
-     case ARMMMUIdx_S1E2:
++    gen_helper_gvec_frecpe_s,
-diff --git a/target/arm/helper.c b/target/arm/helper.c
++    gen_helper_gvec_frecpe_d,
-index XXXXXXX..XXXXXXX 100644
++};
---- a/target/arm/helper.c
++TRANS(FRECPE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frecpe)
-+++ b/target/arm/helper.c
++
-@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
++static gen_helper_gvec_2_ptr * const f_frsqrte[] = {
-     CPUState *cs = env_cpu(env);
++    gen_helper_gvec_frsqrte_h,
++    gen_helper_gvec_frsqrte_s,
-     tlb_flush_by_mmuidx(cs,
++    gen_helper_gvec_frsqrte_d,
--                        ARMMMUIdxBit_S12NSE1 |
++};
--                        ARMMMUIdxBit_S12NSE0 |
++TRANS(FRSQRTE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frsqrte)
-+                        ARMMMUIdxBit_E10_1 |
++
-+                        ARMMMUIdxBit_E10_0 |
+ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
-                         ARMMMUIdxBit_S2NS);
+                                     bool is_scalar, bool is_u, bool is_q,
- }
+                                     int size, int rn, int rd)
+ {
-@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     bool is_double = (size == 3);
-     CPUState *cs = env_cpu(env);
+-    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-     tlb_flush_by_mmuidx_all_cpus_synced(cs,
+     if (is_double) {
--                                        ARMMMUIdxBit_S12NSE1 |
+-        TCGv_i64 tcg_op = tcg_temp_new_i64();
--                                        ARMMMUIdxBit_S12NSE0 |
+-        TCGv_i64 tcg_res = tcg_temp_new_i64();
-+                                        ARMMMUIdxBit_E10_1 |
+-        int pass;
-+                                        ARMMMUIdxBit_E10_0 |
+-
-                                         ARMMMUIdxBit_S2NS);
+-        for (pass = 0; pass < (is_scalar ? 1 : 2); pass++) {
- }
+-            read_vec_element(s, tcg_op, rn, pass, MO_64);
+-            switch (opcode) {
-@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
+-            case 0x3d: /* FRECPE */
-         format64 = arm_s1_regime_using_lpae_format(env, mmu_idx);
+-                gen_helper_recpe_f64(tcg_res, tcg_op, fpst);
+-                break;
-         if (arm_feature(env, ARM_FEATURE_EL2)) {
+-            case 0x3f: /* FRECPX */
--            if (mmu_idx == ARMMMUIdx_S12NSE0 || mmu_idx == ARMMMUIdx_S12NSE1) {
+-                gen_helper_frecpx_f64(tcg_res, tcg_op, fpst);
-+            if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
+-                break;
-                 format64 |= env->cp15.hcr_el2 & (HCR_VM | HCR_DC);
+-            case 0x7d: /* FRSQRTE */
-             } else {
+-                gen_helper_rsqrte_f64(tcg_res, tcg_op, fpst);
-                 format64 |= arm_current_el(env) == 2;
+-                break;
-@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+-            default:
-         break;
+-                g_assert_not_reached();
-     case 4:
+-            }
-         /* stage 1+2 NonSecure PL1: ATS12NSOPR, ATS12NSOPW */
+-            write_vec_element(s, tcg_res, rd, pass, MO_64);
--        mmu_idx = ARMMMUIdx_S12NSE1;
+-        }
-+        mmu_idx = ARMMMUIdx_E10_1;
+-        clear_vec_high(s, !is_scalar, rd);
-         break;
++        g_assert_not_reached();
      case 6:
          /* stage 1+2 NonSecure PL0: ATS12NSOUR, ATS12NSOUW */
 -        mmu_idx = ARMMMUIdx_S12NSE0;
 +        mmu_idx = ARMMMUIdx_E10_0;
          break;
      default:
          g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
          mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S1NSE0;
          break;
      case 4: /* AT S12E1R, AT S12E1W */
 -        mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_S12NSE1;
 +        mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_E10_1;
          break;
      case 6: /* AT S12E0R, AT S12E0W */
 -        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S12NSE0;
 +        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_E10_0;
          break;
      default:
          g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void vttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
      /* Accesses to VTTBR may change the VMID so we must flush the TLB.  */
      if (raw_read(env, ri) != value) {
          tlb_flush_by_mmuidx(cs,
 -                            ARMMMUIdxBit_S12NSE1 |
 -                            ARMMMUIdxBit_S12NSE0 |
 +                            ARMMMUIdxBit_E10_1 |
 +                            ARMMMUIdxBit_E10_0 |
                              ARMMMUIdxBit_S2NS);
          raw_write(env, ri, value);
      }
@@ -XXX,XX +XXX,XX @@ static int vae1_tlbmask(CPUARMState *env)
      if (arm_is_secure_below_el3(env)) {
          return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
      } else {
--        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
+         TCGv_i32 tcg_op = tcg_temp_new_i32();
-+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
+         TCGv_i32 tcg_res = tcg_temp_new_i32();
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
                  gen_helper_recpe_u32(tcg_res, tcg_op);
                  break;
              case 0x3d: /* FRECPE */
 -                gen_helper_recpe_f32(tcg_res, tcg_op, fpst);
 -                break;
              case 0x3f: /* FRECPX */
 -                gen_helper_frecpx_f32(tcg_res, tcg_op, fpst);
 -                break;
              case 0x7d: /* FRSQRTE */
 -                gen_helper_rsqrte_f32(tcg_res, tcg_op, fpst);
 -                break;
              default:
                  g_assert_not_reached();
              }
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
      }
  }
-@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
+-/* AdvSIMD scalar two reg misc
-     if (arm_is_secure_below_el3(env)) {
+- *  31 30  29 28       24 23  22 21       17 16    12 11 10 9    5 4    0
-         return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
+- * +-----+---+-----------+------+-----------+--------+-----+------+------+
-     } else if (arm_feature(env, ARM_FEATURE_EL2)) {
+- * | 0 1 | U | 1 1 1 1 0 | size | 1 0 0 0 0 | opcode | 1 0 |  Rn  |  Rd  |
--        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0 | ARMMMUIdxBit_S2NS;
+- * +-----+---+-----------+------+-----------+--------+-----+------+------+
-+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_S2NS;
+- */
-     } else {
+-static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
--        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
+-{
-+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
+-    int rd = extract32(insn, 0, 5);
 -    int rn = extract32(insn, 5, 5);
 -    int opcode = extract32(insn, 12, 5);
 -    int size = extract32(insn, 22, 2);
 -    bool u = extract32(insn, 29, 1);
 -
 -    switch (opcode) {
 -    case 0xc ... 0xf:
 -    case 0x16 ... 0x1d:
 -    case 0x1f:
 -        /* Floating point: U, size[1] and opcode indicate operation;
 -         * size[0] indicates single or double precision.
 -         */
 -        opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
 -        size = extract32(size, 0, 1) ? 3 : 2;
 -        switch (opcode) {
 -        case 0x3d: /* FRECPE */
 -        case 0x3f: /* FRECPX */
 -        case 0x7d: /* FRSQRTE */
 -            if (!fp_access_check(s)) {
 -                return;
 -            }
 -            handle_2misc_reciprocal(s, opcode, true, u, true, size, rn, rd);
 -            return;
 -        case 0x1a: /* FCVTNS */
 -        case 0x1b: /* FCVTMS */
 -        case 0x3a: /* FCVTPS */
 -        case 0x3b: /* FCVTZS */
 -        case 0x5a: /* FCVTNU */
 -        case 0x5b: /* FCVTMU */
 -        case 0x7a: /* FCVTPU */
 -        case 0x7b: /* FCVTZU */
 -        case 0x1c: /* FCVTAS */
 -        case 0x5c: /* FCVTAU */
 -        case 0x56: /* FCVTXN, FCVTXN2 */
 -        case 0x1d: /* SCVTF */
 -        case 0x5d: /* UCVTF */
 -        case 0x2c: /* FCMGT (zero) */
 -        case 0x2d: /* FCMEQ (zero) */
 -        case 0x2e: /* FCMLT (zero) */
 -        case 0x6c: /* FCMGE (zero) */
 -        case 0x6d: /* FCMLE (zero) */
 -        default:
 -            unallocated_encoding(s);
 -            return;
 -        }
 -        break;
 -    default:
 -    case 0x3: /* USQADD / SUQADD */
 -    case 0x7: /* SQABS / SQNEG */
 -    case 0x8: /* CMGT, CMGE */
 -    case 0x9: /* CMEQ, CMLE */
 -    case 0xa: /* CMLT */
 -    case 0xb: /* ABS, NEG */
 -    case 0x12: /* SQXTUN */
 -    case 0x14: /* SQXTN, UQXTN */
 -        unallocated_encoding(s);
 -        return;
 -    }
 -    g_assert_not_reached();
 -}
 -
  static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
                                    int size, int rn, int rd)
  {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                  unallocated_encoding(s);
                  return;
              }
 -            /* fall through */
 -        case 0x3d: /* FRECPE */
 -        case 0x7d: /* FRSQRTE */
 -            if (size == 3 && !is_q) {
 -                unallocated_encoding(s);
 -                return;
 -            }
              if (!fp_access_check(s)) {
                  return;
              }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          case 0x2e: /* FCMLT (zero) */
          case 0x6c: /* FCMGE (zero) */
          case 0x6d: /* FCMLE (zero) */
 +        case 0x3d: /* FRECPE */
 +        case 0x7d: /* FRSQRTE */
              unallocated_encoding(s);
              return;
          }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
      }
  }
-@@ -XXX,XX +XXX,XX @@ static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
+-/* AdvSIMD [scalar] two register miscellaneous (FP16)
-  */
+- *
- static inline ARMMMUIdx stage_1_mmu_idx(ARMMMUIdx mmu_idx)
+- *   31  30  29 28  27     24  23 22 21       17 16    12 11 10 9    5 4    0
- {
+- * +---+---+---+---+---------+---+-------------+--------+-----+------+------+
--    if (mmu_idx == ARMMMUIdx_S12NSE0 || mmu_idx == ARMMMUIdx_S12NSE1) {
+- * | 0 | Q | U | S | 1 1 1 0 | a | 1 1 1 1 0 0 | opcode | 1 0 |  Rn  |  Rd  |
--        mmu_idx += (ARMMMUIdx_S1NSE0 - ARMMMUIdx_S12NSE0);
+- * +---+---+---+---+---------+---+-------------+--------+-----+------+------+
-+    if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
+- *   mask: 1000 1111 0111 1110 0000 1100 0000 0000 0x8f7e 0c00
-+        mmu_idx += (ARMMMUIdx_S1NSE0 - ARMMMUIdx_E10_0);
+- *   val:  0000 1110 0111 1000 0000 1000 0000 0000 0x0e78 0800
-     }
+- *
-     return mmu_idx;
+- * This actually covers two groups where scalar access is governed by
- }
+- * bit 28. A bunch of the instructions (float to integral) only exist
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
+- * in the vector form and are un-allocated for the scalar decode. Also
-         return true;
+- * in the scalar decode Q is always 1.
-     default:
+- */
-         return false;
+-static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
--    case ARMMMUIdx_S12NSE0:
+-{
--    case ARMMMUIdx_S12NSE1:
+-    int fpop, opcode, a, u;
-+    case ARMMMUIdx_E10_0:
+-    int rn, rd;
-+    case ARMMMUIdx_E10_1:
+-    bool is_q;
-         g_assert_not_reached();
+-    bool is_scalar;
-     }
+-
- }
+-    int pass;
-@@ -XXX,XX +XXX,XX @@ bool get_phys_addr(CPUARMState *env, target_ulong address,
+-    TCGv_i32 tcg_rmode = NULL;
-                    target_ulong *page_size,
+-    TCGv_ptr tcg_fpstatus = NULL;
-                    ARMMMUFaultInfo *fi, ARMCacheAttrs *cacheattrs)
+-    bool need_fpst = true;
- {
+-    int rmode = -1;
--    if (mmu_idx == ARMMMUIdx_S12NSE0 || mmu_idx == ARMMMUIdx_S12NSE1) {
+-
-+    if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
+-    if (!dc_isar_feature(aa64_fp16, s)) {
-         /* Call ourselves recursively to do the stage 1 and then stage 2
+-        unallocated_encoding(s);
-          * translations.
+-        return;
-          */
+-    }
-@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
+-
-     if (el < 2 && arm_is_secure_below_el3(env)) {
+-    rd = extract32(insn, 0, 5);
-         return ARMMMUIdx_S1SE0 + el;
+-    rn = extract32(insn, 5, 5);
-     } else {
+-
--        return ARMMMUIdx_S12NSE0 + el;
+-    a = extract32(insn, 23, 1);
-+        return ARMMMUIdx_E10_0 + el;
+-    u = extract32(insn, 29, 1);
-     }
+-    is_scalar = extract32(insn, 28, 1);
- }
+-    is_q = extract32(insn, 30, 1);
+-
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+-    opcode = extract32(insn, 12, 5);
-index XXXXXXX..XXXXXXX 100644
+-    fpop = deposit32(opcode, 5, 1, a);
---- a/target/arm/translate-a64.c
+-    fpop = deposit32(fpop, 6, 1, u);
-+++ b/target/arm/translate-a64.c
+-
-@@ -XXX,XX +XXX,XX @@ static inline int get_a64_user_mem_index(DisasContext *s)
+-    switch (fpop) {
-     ARMMMUIdx useridx;
+-    case 0x3d: /* FRECPE */
+-    case 0x3f: /* FRECPX */
-     switch (s->mmu_idx) {
+-        break;
--    case ARMMMUIdx_S12NSE1:
+-    case 0x7d: /* FRSQRTE */
--        useridx = ARMMMUIdx_S12NSE0;
+-        break;
-+    case ARMMMUIdx_E10_1:
+-    default:
-+        useridx = ARMMMUIdx_E10_0;
+-    case 0x2f: /* FABS */
-         break;
+-    case 0x6f: /* FNEG */
-     case ARMMMUIdx_S1SE1:
+-    case 0x7f: /* FSQRT (vector) */
-         useridx = ARMMMUIdx_S1SE0;
+-    case 0x18: /* FRINTN */
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+-    case 0x19: /* FRINTM */
-index XXXXXXX..XXXXXXX 100644
+-    case 0x38: /* FRINTP */
---- a/target/arm/translate.c
+-    case 0x39: /* FRINTZ */
-+++ b/target/arm/translate.c
+-    case 0x58: /* FRINTA */
-@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
+-    case 0x59: /* FRINTX */
-      */
+-    case 0x79: /* FRINTI */
-     switch (s->mmu_idx) {
+-    case 0x1d: /* SCVTF */
-     case ARMMMUIdx_S1E2:        /* this one is UNPREDICTABLE */
+-    case 0x5d: /* UCVTF */
--    case ARMMMUIdx_S12NSE0:
+-    case 0x1a: /* FCVTNS */
--    case ARMMMUIdx_S12NSE1:
+-    case 0x1b: /* FCVTMS */
--        return arm_to_core_mmu_idx(ARMMMUIdx_S12NSE0);
+-    case 0x1c: /* FCVTAS */
-+    case ARMMMUIdx_E10_0:
+-    case 0x3a: /* FCVTPS */
-+    case ARMMMUIdx_E10_1:
+-    case 0x3b: /* FCVTZS */
-+        return arm_to_core_mmu_idx(ARMMMUIdx_E10_0);
+-    case 0x5a: /* FCVTNU */
-     case ARMMMUIdx_S1E3:
+-    case 0x5b: /* FCVTMU */
-     case ARMMMUIdx_S1SE0:
+-    case 0x5c: /* FCVTAU */
-     case ARMMMUIdx_S1SE1:
+-    case 0x7a: /* FCVTPU */
 -    case 0x7b: /* FCVTZU */
 -    case 0x2c: /* FCMGT (zero) */
 -    case 0x2d: /* FCMEQ (zero) */
 -    case 0x2e: /* FCMLT (zero) */
 -    case 0x6c: /* FCMGE (zero) */
 -    case 0x6d: /* FCMLE (zero) */
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -
 -    /* Check additional constraints for the scalar encoding */
 -    if (is_scalar) {
 -        if (!is_q) {
 -            unallocated_encoding(s);
 -            return;
 -        }
 -    }
 -
 -    if (!fp_access_check(s)) {
 -        return;
 -    }
 -
 -    if (rmode >= 0 || need_fpst) {
 -        tcg_fpstatus = fpstatus_ptr(FPST_FPCR_F16);
 -    }
 -
 -    if (rmode >= 0) {
 -        tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
 -    }
 -
 -    if (is_scalar) {
 -        TCGv_i32 tcg_op = read_fp_hreg(s, rn);
 -        TCGv_i32 tcg_res = tcg_temp_new_i32();
 -
 -        switch (fpop) {
 -        case 0x3d: /* FRECPE */
 -            gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
 -            break;
 -        case 0x3f: /* FRECPX */
 -            gen_helper_frecpx_f16(tcg_res, tcg_op, tcg_fpstatus);
 -            break;
 -        case 0x7d: /* FRSQRTE */
 -            gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
 -            break;
 -        default:
 -        case 0x1a: /* FCVTNS */
 -        case 0x1b: /* FCVTMS */
 -        case 0x1c: /* FCVTAS */
 -        case 0x3a: /* FCVTPS */
 -        case 0x3b: /* FCVTZS */
 -        case 0x5a: /* FCVTNU */
 -        case 0x5b: /* FCVTMU */
 -        case 0x5c: /* FCVTAU */
 -        case 0x7a: /* FCVTPU */
 -        case 0x7b: /* FCVTZU */
 -            g_assert_not_reached();
 -        }
 -
 -        /* limit any sign extension going on */
 -        tcg_gen_andi_i32(tcg_res, tcg_res, 0xffff);
 -        write_fp_sreg(s, rd, tcg_res);
 -    } else {
 -        for (pass = 0; pass < (is_q ? 8 : 4); pass++) {
 -            TCGv_i32 tcg_op = tcg_temp_new_i32();
 -            TCGv_i32 tcg_res = tcg_temp_new_i32();
 -
 -            read_vec_element_i32(s, tcg_op, rn, pass, MO_16);
 -
 -            switch (fpop) {
 -            case 0x3d: /* FRECPE */
 -                gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
 -                break;
 -            case 0x7d: /* FRSQRTE */
 -                gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
 -                break;
 -            default:
 -            case 0x2f: /* FABS */
 -            case 0x6f: /* FNEG */
 -            case 0x7f: /* FSQRT */
 -            case 0x18: /* FRINTN */
 -            case 0x19: /* FRINTM */
 -            case 0x38: /* FRINTP */
 -            case 0x39: /* FRINTZ */
 -            case 0x58: /* FRINTA */
 -            case 0x79: /* FRINTI */
 -            case 0x59: /* FRINTX */
 -            case 0x1a: /* FCVTNS */
 -            case 0x1b: /* FCVTMS */
 -            case 0x1c: /* FCVTAS */
 -            case 0x3a: /* FCVTPS */
 -            case 0x3b: /* FCVTZS */
 -            case 0x5a: /* FCVTNU */
 -            case 0x5b: /* FCVTMU */
 -            case 0x5c: /* FCVTAU */
 -            case 0x7a: /* FCVTPU */
 -            case 0x7b: /* FCVTZU */
 -                g_assert_not_reached();
 -            }
 -
 -            write_vec_element_i32(s, tcg_res, rd, pass, MO_16);
 -        }
 -
 -        clear_vec_high(s, is_q, rd);
 -    }
 -
 -    if (tcg_rmode) {
 -        gen_restore_rmode(tcg_rmode, tcg_fpstatus);
 -    }
 -}
 -
  /* C3.6 Data processing - SIMD, inc Crypto
   *
   * As the decode gets a little complex we are using a table based
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
  static const AArch64DecodeTable data_proc_simd[] = {
      /* pattern  ,  mask     ,  fn                        */
      { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
 -    { 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
 -    { 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
      { 0x00000000, 0x00000000, NULL }
  };
 --
-.20.1
+.34.1

-[PULL 46/48] armv7m_systick: delay timer_new to avoid memleaks
+[PULL 67/85] target/arm: Introduce gen_gvec_urecpe, gen_gvec_ursqrte
-From: Pan Nengyuan <pannengyuan@huawei.com>
+From: Richard Henderson <richard.henderson@linaro.org>
-There is a memory leak when we call 'device_list_properties' with typename = armv7m_systick. It's easy to reproduce as follow:
-  virsh qemu-monitor-command vm1 --pretty '{"execute": "device-list-properties", "arguments": {"typename": "armv7m_systick"}}'
-This patch delay timer_new to fix this memleaks.
-Reported-by: Euler Robot <euler.robot@huawei.com>
-Signed-off-by: Pan Nengyuan <pannengyuan@huawei.com>
-Message-id: 20200205070659.22488-2-pannengyuan@huawei.com
-Cc: qemu-arm@nongnu.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241211163036.2297116-68-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/timer/armv7m_systick.c | 6 ++++++
+ target/arm/helper.h             |  3 +++
-file changed, 6 insertions(+)
+ target/arm/tcg/translate.h      |  5 +++++
  target/arm/tcg/gengvec.c        | 16 ++++++++++++++++
  target/arm/tcg/translate-neon.c |  4 ++--
  target/arm/tcg/vec_helper.c     | 22 ++++++++++++++++++++++
 files changed, 48 insertions(+), 2 deletions(-)
-diff --git a/hw/timer/armv7m_systick.c b/hw/timer/armv7m_systick.c
+diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/timer/armv7m_systick.c
+--- a/target/arm/helper.h
-+++ b/hw/timer/armv7m_systick.c
++++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ static void systick_instance_init(Object *obj)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_uminp_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     memory_region_init_io(&s->iomem, obj, &systick_ops, s, "systick", 0xe0);
+ DEF_HELPER_FLAGS_4(gvec_uminp_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     sysbus_init_mmio(sbd, &s->iomem);
+ DEF_HELPER_FLAGS_4(gvec_uminp_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-     sysbus_init_irq(sbd, &s->irq);
 +DEF_HELPER_FLAGS_3(gvec_urecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_ursqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "tcg/helper-a64.h"
  #include "tcg/helper-sve.h"
 diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate.h
 +++ b/target/arm/tcg/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_fabs(unsigned vece, uint32_t dofs, uint32_t aofs,
  void gen_gvec_fneg(unsigned vece, uint32_t dofs, uint32_t aofs,
                     uint32_t oprsz, uint32_t maxsz);
 +void gen_gvec_urecpe(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_ursqrte(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                      uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/gengvec.c
 +++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_fneg(unsigned vece, uint32_t dofs, uint32_t aofs,
      uint64_t s_bit = 1ull << ((8 << vece) - 1);
      tcg_gen_gvec_xori(vece, dofs, aofs, s_bit, oprsz, maxsz);
  }
 +
 +void gen_gvec_urecpe(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                     uint32_t opr_sz, uint32_t max_sz)
 +{
 +    assert(vece == MO_32);
 +    tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
 +                       gen_helper_gvec_urecpe_s);
 +}
 +
-+static void systick_realize(DeviceState *dev, Error **errp)
++void gen_gvec_ursqrte(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                      uint32_t opr_sz, uint32_t max_sz)
 +{
-+    SysTickState *s = SYSTICK(dev);
++    assert(vece == MO_32);
-     s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, systick_timer_tick, s);
++    tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
 +                       gen_helper_gvec_ursqrte_s);
 +}
 diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-neon.c
 +++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VRECPE(DisasContext *s, arg_2misc *a)
      if (a->size != 2) {
          return false;
      }
 -    return do_2misc(s, a, gen_helper_recpe_u32);
 +    return do_2misc_vec(s, a, gen_gvec_urecpe);
  }
-@@ -XXX,XX +XXX,XX @@ static void systick_class_init(ObjectClass *klass, void *data)
+ static bool trans_VRSQRTE(DisasContext *s, arg_2misc *a)
+@@ -XXX,XX +XXX,XX @@ static bool trans_VRSQRTE(DisasContext *s, arg_2misc *a)
-     dc->vmsd = &vmstate_systick;
+     if (a->size != 2) {
-     dc->reset = systick_reset;
+         return false;
-+    dc->realize = systick_realize;
+     }
 -    return do_2misc(s, a, gen_helper_rsqrte_u32);
 +    return do_2misc_vec(s, a, gen_gvec_ursqrte);
  }
- static const TypeInfo armv7m_systick_info = {
+ #define WRAP_1OP_ENV_FN(WRAPNAME, FUNC) \
 diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/vec_helper.c
 +++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_rbit_b)(void *vd, void *vn, uint32_t desc)
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
 +
 +void HELPER(gvec_urecpe_s)(void *vd, void *vn, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    uint32_t *d = vd, *n = vn;
 +
 +    for (i = 0; i < opr_sz / 4; ++i) {
 +        d[i] = helper_recpe_u32(n[i]);
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_ursqrte_s)(void *vd, void *vn, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    uint32_t *d = vd, *n = vn;
 +
 +    for (i = 0; i < opr_sz / 4; ++i) {
 +        d[i] = helper_rsqrte_u32(n[i]);
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 --
-.20.1
+.34.1

-[PULL 28/48] target/arm: Update define_one_arm_cp_reg_with_opaque for VHE
+[PULL 68/85] target/arm: Convert URECPE and URSQRTE to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-For ARMv8.1, op1 == 5 is reserved for EL2 aliases of
+Remove handle_2misc_reciprocal as these were the last
-EL1 and EL0 registers.
+insns decoded by that function.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-28-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-69-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 5 +----
+ target/arm/tcg/a64.decode      |   3 +
-file changed, 1 insertion(+), 4 deletions(-)
+ target/arm/tcg/translate-a64.c | 139 ++-------------------------------
 files changed, 8 insertions(+), 134 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
+@@ -XXX,XX +XXX,XX @@ FRECPE_v        0.00 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
-             mask = PL0_RW;
+ FRSQRTE_v       0.10 1110 111 11001 11011 0 ..... .....     @qrr_h
-             break;
+ FRSQRTE_v       0.10 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
-         case 4:
-+        case 5:
++URECPE_v        0.00 1110 101 00001 11001 0 ..... .....     @qrr_s
-             /* min_EL EL2 */
++URSQRTE_v       0.10 1110 101 00001 11001 0 ..... .....     @qrr_s
-             mask = PL2_RW;
++
-             break;
+ &fcvt_q         rd rn esz q shift
--        case 5:
+ @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
--            /* unallocated encoding, so not possible */
+                 &fcvt_q esz=1 shift=%fcvt_f_sh_h
--            assert(false);
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(CMLE0_v, do_gvec_fn2, a, gen_gvec_cle0)
  TRANS(CMEQ0_v, do_gvec_fn2, a, gen_gvec_ceq0)
  TRANS(REV16_v, do_gvec_fn2, a, gen_gvec_rev16)
  TRANS(REV32_v, do_gvec_fn2, a, gen_gvec_rev32)
 +TRANS(URECPE_v, do_gvec_fn2, a, gen_gvec_urecpe)
 +TRANS(URSQRTE_v, do_gvec_fn2, a, gen_gvec_ursqrte)
  static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
  {
@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_2_ptr * const f_frsqrte[] = {
  };
  TRANS(FRSQRTE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frsqrte)
 -static void handle_2misc_reciprocal(DisasContext *s, int opcode,
 -                                    bool is_scalar, bool is_u, bool is_q,
 -                                    int size, int rn, int rd)
 -{
 -    bool is_double = (size == 3);
 -
 -    if (is_double) {
 -        g_assert_not_reached();
 -    } else {
 -        TCGv_i32 tcg_op = tcg_temp_new_i32();
 -        TCGv_i32 tcg_res = tcg_temp_new_i32();
 -        int pass, maxpasses;
 -
 -        if (is_scalar) {
 -            maxpasses = 1;
 -        } else {
 -            maxpasses = is_q ? 4 : 2;
 -        }
 -
 -        for (pass = 0; pass < maxpasses; pass++) {
 -            read_vec_element_i32(s, tcg_op, rn, pass, MO_32);
 -
 -            switch (opcode) {
 -            case 0x3c: /* URECPE */
 -                gen_helper_recpe_u32(tcg_res, tcg_op);
 -                break;
 -            case 0x3d: /* FRECPE */
 -            case 0x3f: /* FRECPX */
 -            case 0x7d: /* FRSQRTE */
 -            default:
 -                g_assert_not_reached();
 -            }
 -
 -            if (is_scalar) {
 -                write_fp_sreg(s, rd, tcg_res);
 -            } else {
 -                write_vec_element_i32(s, tcg_res, rd, pass, MO_32);
 -            }
 -        }
 -        if (!is_scalar) {
 -            clear_vec_high(s, is_q, rd);
 -        }
 -    }
 -}
 -
  static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
                                    int size, int rn, int rd)
  {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
      bool is_q = extract32(insn, 30, 1);
      int rn = extract32(insn, 5, 5);
      int rd = extract32(insn, 0, 5);
 -    bool need_fpstatus = false;
 -    int rmode = -1;
 -    TCGv_i32 tcg_rmode;
 -    TCGv_ptr tcg_fpstatus;
      switch (opcode) {
      case 0xc ... 0xf:
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
          size = is_double ? 3 : 2;
          switch (opcode) {
 -        case 0x3c: /* URECPE */
 -            if (size == 3) {
 -                unallocated_encoding(s);
 -                return;
 -            }
 -            if (!fp_access_check(s)) {
 -                return;
 -            }
 -            handle_2misc_reciprocal(s, opcode, false, u, is_q, size, rn, rd);
 -            return;
          case 0x17: /* FCVTL, FCVTL2 */
              if (!fp_access_check(s)) {
                  return;
              }
              handle_2misc_widening(s, opcode, is_q, size, rn, rd);
              return;
 -        case 0x7c: /* URSQRTE */
 -            if (size == 3) {
 -                unallocated_encoding(s);
 -                return;
 -            }
 -            break;
-         case 6:
+         default:
-             /* min_EL EL3 */
+         case 0x16: /* FCVTN, FCVTN2 */
-             mask = PL3_RW;
+         case 0x36: /* BFCVTN, BFCVTN2 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          case 0x6d: /* FCMLE (zero) */
          case 0x3d: /* FRECPE */
          case 0x7d: /* FRSQRTE */
 +        case 0x3c: /* URECPE */
 +        case 0x7c: /* URSQRTE */
              unallocated_encoding(s);
              return;
          }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          unallocated_encoding(s);
          return;
      }
 -
 -    if (!fp_access_check(s)) {
 -        return;
 -    }
 -
 -    if (need_fpstatus || rmode >= 0) {
 -        tcg_fpstatus = fpstatus_ptr(FPST_FPCR);
 -    } else {
 -        tcg_fpstatus = NULL;
 -    }
 -    if (rmode >= 0) {
 -        tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
 -    } else {
 -        tcg_rmode = NULL;
 -    }
 -
 -    {
 -        int pass;
 -
 -        assert(size == 2);
 -        for (pass = 0; pass < (is_q ? 4 : 2); pass++) {
 -            TCGv_i32 tcg_op = tcg_temp_new_i32();
 -            TCGv_i32 tcg_res = tcg_temp_new_i32();
 -
 -            read_vec_element_i32(s, tcg_op, rn, pass, MO_32);
 -
 -            {
 -                /* Special cases for 32 bit elements */
 -                switch (opcode) {
 -                case 0x7c: /* URSQRTE */
 -                    gen_helper_rsqrte_u32(tcg_res, tcg_op);
 -                    break;
 -                default:
 -                case 0x7: /* SQABS, SQNEG */
 -                case 0x2f: /* FABS */
 -                case 0x6f: /* FNEG */
 -                case 0x7f: /* FSQRT */
 -                case 0x18: /* FRINTN */
 -                case 0x19: /* FRINTM */
 -                case 0x38: /* FRINTP */
 -                case 0x39: /* FRINTZ */
 -                case 0x58: /* FRINTA */
 -                case 0x79: /* FRINTI */
 -                case 0x59: /* FRINTX */
 -                case 0x1e: /* FRINT32Z */
 -                case 0x5e: /* FRINT32X */
 -                case 0x1f: /* FRINT64Z */
 -                case 0x5f: /* FRINT64X */
 -                case 0x1a: /* FCVTNS */
 -                case 0x1b: /* FCVTMS */
 -                case 0x1c: /* FCVTAS */
 -                case 0x3a: /* FCVTPS */
 -                case 0x3b: /* FCVTZS */
 -                case 0x5a: /* FCVTNU */
 -                case 0x5b: /* FCVTMU */
 -                case 0x5c: /* FCVTAU */
 -                case 0x7a: /* FCVTPU */
 -                case 0x7b: /* FCVTZU */
 -                    g_assert_not_reached();
 -                }
 -            }
 -            write_vec_element_i32(s, tcg_res, rd, pass, MO_32);
 -        }
 -    }
 -    clear_vec_high(s, is_q, rd);
 -
 -    if (tcg_rmode) {
 -        gen_restore_rmode(tcg_rmode, tcg_fpstatus);
 -    }
 +    g_assert_not_reached();
  }
  /* C3.6 Data processing - SIMD, inc Crypto
 --
-.20.1
+.34.1

-[PULL 34/48] target/arm: Update {fp,sve}_exception_el for VHE
+[PULL 69/85] target/arm: Convert FCVTL to decodetree
 From: Richard Henderson <richard.henderson@linaro.org>
-When TGE+E2H are both set, CPACR_EL1 is ignored.
+Remove lookup_disas_fn, handle_2misc_widening,
 disas_simd_two_reg_misc, disas_data_proc_simd,
 disas_data_proc_simd_fp, disas_a64_legacy, as
 this is the final insn to be converted.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-34-richard.henderson@linaro.org
+Message-id: 20241211163036.2297116-70-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 53 ++++++++++++++++++++++++---------------------
+ target/arm/tcg/a64.decode      |   2 +
-file changed, 28 insertions(+), 25 deletions(-)
+ target/arm/tcg/translate-a64.c | 202 +++------------------------------
 files changed, 18 insertions(+), 186 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/tcg/a64.decode
-+++ b/target/arm/helper.c
++++ b/target/arm/tcg/a64.decode
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo debug_lpae_cp_reginfo[] = {
+@@ -XXX,XX +XXX,XX @@ FRSQRTE_v       0.10 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
- int sve_exception_el(CPUARMState *env, int el)
+ URECPE_v        0.00 1110 101 00001 11001 0 ..... .....     @qrr_s
  URSQRTE_v       0.10 1110 101 00001 11001 0 ..... .....     @qrr_s
 +FCVTL_v         0.00 1110 0.1 00001 01111 0 ..... .....     @qrr_sd
 +
  &fcvt_q         rd rn esz q shift
  @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                  &fcvt_q esz=1 shift=%fcvt_f_sh_h
 diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate-a64.c
 +++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static inline void gen_check_sp_alignment(DisasContext *s)
       */
  }
 -/*
 - * This provides a simple table based table lookup decoder. It is
 - * intended to be used when the relevant bits for decode are too
 - * awkwardly placed and switch/if based logic would be confusing and
 - * deeply nested. Since it's a linear search through the table, tables
 - * should be kept small.
 - *
 - * It returns the first handler where insn & mask == pattern, or
 - * NULL if there is no match.
 - * The table is terminated by an empty mask (i.e. 0)
 - */
 -static inline AArch64DecodeFn *lookup_disas_fn(const AArch64DecodeTable *table,
 -                                               uint32_t insn)
 -{
 -    const AArch64DecodeTable *tptr = table;
 -
 -    while (tptr->mask) {
 -        if ((insn & tptr->mask) == tptr->pattern) {
 -            return tptr->disas_fn;
 -        }
 -        tptr++;
 -    }
 -    return NULL;
 -}
 -
  /*
   * The instruction disassembly implemented here matches
   * the instruction encoding classifications in chapter C4
@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_2_ptr * const f_frsqrte[] = {
  };
  TRANS(FRSQRTE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frsqrte)
 -static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
 -                                  int size, int rn, int rd)
 +static bool trans_FCVTL_v(DisasContext *s, arg_qrr_e *a)
  {
- #ifndef CONFIG_USER_ONLY
+     /* Handle 2-reg-misc ops which are widening (so each size element
--    if (el <= 1) {
+      * in the source becomes a 2*size element in the destination.
-+    uint64_t hcr_el2 = arm_hcr_el2_eff(env);
+@@ -XXX,XX +XXX,XX @@ static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
       */
      int pass;
 -    if (size == 3) {
 +    if (!fp_access_check(s)) {
 +        return true;
 +    }
 +
-+    if (el <= 1 && (hcr_el2 & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE)) {
++    if (a->esz == MO_64) {
-         bool disabled = false;
+         /* 32 -> 64 bit fp conversion */
+         TCGv_i64 tcg_res[2];
-         /* The CPACR.ZEN controls traps to EL1:
+-        int srcelt = is_q ? 2 : 0;
-@@ -XXX,XX +XXX,XX @@ int sve_exception_el(CPUARMState *env, int el)
++        TCGv_i32 tcg_op = tcg_temp_new_i32();
-         }
++        int srcelt = a->q ? 2 : 0;
-         if (disabled) {
-             /* route_to_el2 */
+         for (pass = 0; pass < 2; pass++) {
--            return (arm_feature(env, ARM_FEATURE_EL2)
+-            TCGv_i32 tcg_op = tcg_temp_new_i32();
--                    && (arm_hcr_el2_eff(env) & HCR_TGE) ? 2 : 1);
+             tcg_res[pass] = tcg_temp_new_i64();
-+            return hcr_el2 & HCR_TGE ? 2 : 1;
+-
-         }
+-            read_vec_element_i32(s, tcg_op, rn, srcelt + pass, MO_32);
++            read_vec_element_i32(s, tcg_op, a->rn, srcelt + pass, MO_32);
-         /* Check CPACR.FPEN.  */
+             gen_helper_vfp_fcvtds(tcg_res[pass], tcg_op, tcg_env);
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(crc32c)(uint32_t acc, uint32_t val, uint32_t bytes)
+         }
- int fp_exception_el(CPUARMState *env, int cur_el)
+         for (pass = 0; pass < 2; pass++) {
- {
+-            write_vec_element(s, tcg_res[pass], rd, pass, MO_64);
- #ifndef CONFIG_USER_ONLY
++            write_vec_element(s, tcg_res[pass], a->rd, pass, MO_64);
--    int fpen;
+         }
--
+     } else {
-     /* CPACR and the CPTR registers don't exist before v6, so FP is
+         /* 16 -> 32 bit fp conversion */
-      * always accessible
+-        int srcelt = is_q ? 4 : 0;
-      */
++        int srcelt = a->q ? 4 : 0;
-@@ -XXX,XX +XXX,XX @@ int fp_exception_el(CPUARMState *env, int cur_el)
+         TCGv_i32 tcg_res[4];
-      * 0, 2 : trap EL0 and EL1/PL1 accesses
+         TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-      * 1    : trap only EL0 accesses
+         TCGv_i32 ahp = get_ahp_flag();
-      * 3    : trap no accesses
-+     * This register is ignored if E2H+TGE are both set.
+         for (pass = 0; pass < 4; pass++) {
-      */
+             tcg_res[pass] = tcg_temp_new_i32();
--    fpen = extract32(env->cp15.cpacr_el1, 20, 2);
+-
--    switch (fpen) {
+-            read_vec_element_i32(s, tcg_res[pass], rn, srcelt + pass, MO_16);
--    case 0:
++            read_vec_element_i32(s, tcg_res[pass], a->rn, srcelt + pass, MO_16);
--    case 2:
+             gen_helper_vfp_fcvt_f16_to_f32(tcg_res[pass], tcg_res[pass],
--        if (cur_el == 0 || cur_el == 1) {
+                                            fpst, ahp);
--            /* Trap to PL1, which might be EL1 or EL3 */
+         }
--            if (arm_is_secure(env) && !arm_el_is_aa64(env, 3)) {
+         for (pass = 0; pass < 4; pass++) {
-+    if ((arm_hcr_el2_eff(env) & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE)) {
+-            write_vec_element_i32(s, tcg_res[pass], rd, pass, MO_32);
-+        int fpen = extract32(env->cp15.cpacr_el1, 20, 2);
++            write_vec_element_i32(s, tcg_res[pass], a->rd, pass, MO_32);
-+
+         }
-+        switch (fpen) {
+     }
-+        case 0:
+-}
-+        case 2:
+-
-+            if (cur_el == 0 || cur_el == 1) {
+-/* AdvSIMD two reg misc
-+                /* Trap to PL1, which might be EL1 or EL3 */
+- *   31  30  29 28       24 23  22 21       17 16    12 11 10 9    5 4    0
-+                if (arm_is_secure(env) && !arm_el_is_aa64(env, 3)) {
+- * +---+---+---+-----------+------+-----------+--------+-----+------+------+
-+                    return 3;
+- * | 0 | Q | U | 0 1 1 1 0 | size | 1 0 0 0 0 | opcode | 1 0 |  Rn  |  Rd  |
-+                }
+- * +---+---+---+-----------+------+-----------+--------+-----+------+------+
-+                return 1;
+- */
-+            }
+-static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
-+            if (cur_el == 3 && !is_a64(env)) {
+-{
-+                /* Secure PL1 running at EL3 */
+-    int size = extract32(insn, 22, 2);
-                 return 3;
+-    int opcode = extract32(insn, 12, 5);
-             }
+-    bool u = extract32(insn, 29, 1);
--            return 1;
+-    bool is_q = extract32(insn, 30, 1);
-+            break;
+-    int rn = extract32(insn, 5, 5);
-+        case 1:
+-    int rd = extract32(insn, 0, 5);
-+            if (cur_el == 0) {
+-
-+                return 1;
+-    switch (opcode) {
-+            }
+-    case 0xc ... 0xf:
-+            break;
+-    case 0x16 ... 0x1f:
-+        case 3:
+-    {
-+            break;
+-        /* Floating point: U, size[1] and opcode indicate operation;
-         }
+-         * size[0] indicates single or double precision.
--        if (cur_el == 3 && !is_a64(env)) {
+-         */
--            /* Secure PL1 running at EL3 */
+-        int is_double = extract32(size, 0, 1);
--            return 3;
+-        opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
 -        size = is_double ? 3 : 2;
 -        switch (opcode) {
 -        case 0x17: /* FCVTL, FCVTL2 */
 -            if (!fp_access_check(s)) {
 -                return;
 -            }
 -            handle_2misc_widening(s, opcode, is_q, size, rn, rd);
 -            return;
 -        default:
 -        case 0x16: /* FCVTN, FCVTN2 */
 -        case 0x36: /* BFCVTN, BFCVTN2 */
 -        case 0x56: /* FCVTXN, FCVTXN2 */
 -        case 0x2f: /* FABS */
 -        case 0x6f: /* FNEG */
 -        case 0x7f: /* FSQRT */
 -        case 0x18: /* FRINTN */
 -        case 0x19: /* FRINTM */
 -        case 0x38: /* FRINTP */
 -        case 0x39: /* FRINTZ */
 -        case 0x59: /* FRINTX */
 -        case 0x79: /* FRINTI */
 -        case 0x58: /* FRINTA */
 -        case 0x1e: /* FRINT32Z */
 -        case 0x1f: /* FRINT64Z */
 -        case 0x5e: /* FRINT32X */
 -        case 0x5f: /* FRINT64X */
 -        case 0x1d: /* SCVTF */
 -        case 0x5d: /* UCVTF */
 -        case 0x1a: /* FCVTNS */
 -        case 0x1b: /* FCVTMS */
 -        case 0x3a: /* FCVTPS */
 -        case 0x3b: /* FCVTZS */
 -        case 0x5a: /* FCVTNU */
 -        case 0x5b: /* FCVTMU */
 -        case 0x7a: /* FCVTPU */
 -        case 0x7b: /* FCVTZU */
 -        case 0x5c: /* FCVTAU */
 -        case 0x1c: /* FCVTAS */
 -        case 0x2c: /* FCMGT (zero) */
 -        case 0x2d: /* FCMEQ (zero) */
 -        case 0x2e: /* FCMLT (zero) */
 -        case 0x6c: /* FCMGE (zero) */
 -        case 0x6d: /* FCMLE (zero) */
 -        case 0x3d: /* FRECPE */
 -        case 0x7d: /* FRSQRTE */
 -        case 0x3c: /* URECPE */
 -        case 0x7c: /* URSQRTE */
 -            unallocated_encoding(s);
 -            return;
 -        }
 -        break;
--    case 1:
+-    }
--        if (cur_el == 0) {
+-    default:
--            return 1;
+-    case 0x0: /* REV64, REV32 */
--        }
+-    case 0x1: /* REV16 */
 -    case 0x2: /* SADDLP, UADDLP */
 -    case 0x3: /* SUQADD, USQADD */
 -    case 0x4: /* CLS, CLZ */
 -    case 0x5: /* CNT, NOT, RBIT */
 -    case 0x6: /* SADALP, UADALP */
 -    case 0x7: /* SQABS, SQNEG */
 -    case 0x8: /* CMGT, CMGE */
 -    case 0x9: /* CMEQ, CMLE */
 -    case 0xa: /* CMLT */
 -    case 0xb: /* ABS, NEG */
 -    case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
 -    case 0x13: /* SHLL, SHLL2 */
 -    case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
 -        unallocated_encoding(s);
 -        return;
 -    }
 -    g_assert_not_reached();
 -}
 -
 -/* C3.6 Data processing - SIMD, inc Crypto
 - *
 - * As the decode gets a little complex we are using a table based
 - * approach for this part of the decode.
 - */
 -static const AArch64DecodeTable data_proc_simd[] = {
 -    /* pattern  ,  mask     ,  fn                        */
 -    { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
 -    { 0x00000000, 0x00000000, NULL }
 -};
 -
 -static void disas_data_proc_simd(DisasContext *s, uint32_t insn)
 -{
 -    /* Note that this is called with all non-FP cases from
 -     * table C3-6 so it must UNDEF for entries not specifically
 -     * allocated to instructions in that table.
 -     */
 -    AArch64DecodeFn *fn = lookup_disas_fn(&data_proc_simd[0], insn);
 -    if (fn) {
 -        fn(s, insn);
 -    } else {
 -        unallocated_encoding(s);
 -    }
 -}
 -
 -/* C3.6 Data processing - SIMD and floating point */
 -static void disas_data_proc_simd_fp(DisasContext *s, uint32_t insn)
 -{
 -    if (extract32(insn, 28, 1) == 1 && extract32(insn, 30, 1) == 0) {
 -        unallocated_encoding(s); /* in decodetree */
 -    } else {
 -        /* SIMD, including crypto */
 -        disas_data_proc_simd(s, insn);
 -    }
 +    clear_vec_high(s, true, a->rd);
 +    return true;
  }
  static bool trans_OK(DisasContext *s, arg_OK *a)
@@ -XXX,XX +XXX,XX @@ static bool btype_destination_ok(uint32_t insn, bool bt, int btype)
      return false;
  }
 -/* C3.1 A64 instruction index by encoding */
 -static void disas_a64_legacy(DisasContext *s, uint32_t insn)
 -{
 -    switch (extract32(insn, 25, 4)) {
 -    case 0x7:
 -    case 0xf:      /* Data processing - SIMD and floating point */
 -        disas_data_proc_simd_fp(s, insn);
 -        break;
--    case 3:
+-    default:
 -        unallocated_encoding(s);
 -        break;
+-    }
+-}
+-
+ static void aarch64_tr_init_disas_context(DisasContextBase *dcbase,
+                                           CPUState *cpu)
+ {
+@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
+     if (!disas_a64(s, insn) &&
+         !disas_sme(s, insn) &&
+         !disas_sve(s, insn)) {
+-        disas_a64_legacy(s, insn);
++        unallocated_encoding(s);
      }
      /*
 --
-.20.1
+.34.1

-New patch
+[PULL 70/85] target/arm: Use float_round_to_odd in helper_fcvtx_f64_to_f32
+From: Richard Henderson <richard.henderson@linaro.org>
+Softfloat has native support for round-to-odd.  Use it.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241206031428.78634-1-richard.henderson@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ target/arm/tcg/helper-a64.c | 18 ++++--------------
+file changed, 4 insertions(+), 14 deletions(-)
+diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/helper-a64.c
++++ b/target/arm/tcg/helper-a64.c
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(frecpx_f64)(float64 a, void *fpstp)
+ float32 HELPER(fcvtx_f64_to_f32)(float64 a, CPUARMState *env)
+ {
+-    /* Von Neumann rounding is implemented by using round-to-zero
+-     * and then setting the LSB of the result if Inexact was raised.
+-     */
+     float32 r;
+     float_status *fpst = &env->vfp.fp_status;
+-    float_status tstat = *fpst;
+-    int exflags;
++    int old = get_float_rounding_mode(fpst);
+-    set_float_rounding_mode(float_round_to_zero, &tstat);
+-    set_float_exception_flags(0, &tstat);
+-    r = float64_to_float32(a, &tstat);
+-    exflags = get_float_exception_flags(&tstat);
+-    if (exflags & float_flag_inexact) {
+-        r = make_float32(float32_val(r) | 1);
+-    }
+-    exflags |= get_float_exception_flags(fpst);
+-    set_float_exception_flags(exflags, fpst);
++    set_float_rounding_mode(float_round_to_odd, fpst);
++    r = float64_to_float32(a, fpst);
++    set_float_rounding_mode(old, fpst);
+     return r;
+ }
+--
+.34.1

-[PULL 43/48] bcm2835_dma: Fix the ylen loop in TD mode
+[PULL 71/85] docs/system/arm/orangepi: update links
-From: Rene Stange <rsta2@o2online.de>
+From: Pierrick Bouvier <pierrick.bouvier@linaro.org>
-In TD (two dimensions) DMA mode ylen has to be increased by one after
+www.orangepi.org does not support https, it's expected to stick to http.
 reading it from the TXFR_LEN register, because a value of zero has to
 result in one run through of the ylen loop. This has been tested on a
 real Raspberry Pi 3 Model B+. In the previous implementation the ylen
 loop was not passed at all for a value of zero.
-Signed-off-by: Rene Stange <rsta2@o2online.de>
+Reviewed-by: Niek Linnenbank <nieklinnenbank@gmail.com>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
 Message-id: 20241206192254.3889131-2-pierrick.bouvier@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/dma/bcm2835_dma.c | 4 ++--
+ docs/system/arm/orangepi.rst | 4 ++--
 file changed, 2 insertions(+), 2 deletions(-)
-diff --git a/hw/dma/bcm2835_dma.c b/hw/dma/bcm2835_dma.c
+diff --git a/docs/system/arm/orangepi.rst b/docs/system/arm/orangepi.rst
 index XXXXXXX..XXXXXXX 100644
---- a/hw/dma/bcm2835_dma.c
+--- a/docs/system/arm/orangepi.rst
-+++ b/hw/dma/bcm2835_dma.c
++++ b/docs/system/arm/orangepi.rst
-@@ -XXX,XX +XXX,XX @@ static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
+@@ -XXX,XX +XXX,XX @@ Orange Pi PC images
-         ch->stride = ldl_le_phys(&s->dma_as, ch->conblk_ad + 16);
+ Note that the mainline kernel does not have a root filesystem. You may provide it
-         ch->nextconbk = ldl_le_phys(&s->dma_as, ch->conblk_ad + 20);
+ with an official Orange Pi PC image from the official website:
-+        ylen = 1;
+-  http://www.orangepi.org/downloadresources/
-         if (ch->ti & BCM2708_DMA_TDMODE) {
++  http://www.orangepi.org/html/serviceAndSupport/index.html
-             /* 2D transfer mode */
--            ylen = (ch->txfr_len >> 16) & 0x3fff;
+ Another possibility is to run an Armbian image for Orange Pi PC which
-+            ylen += (ch->txfr_len >> 16) & 0x3fff;
+ can be downloaded from:
-             xlen = ch->txfr_len & 0xffff;
+@@ -XXX,XX +XXX,XX @@ including the Orange Pi PC. NetBSD 9.0 is known to work best for the Orange Pi P
-             dst_stride = ch->stride >> 16;
+ board and provides a fully working system with serial console, networking and storage.
-             src_stride = ch->stride & 0xffff;
+ For the Orange Pi PC machine, get the 'evbarm-earmv7hf' based image from:
-         } else {
--            ylen = 1;
+-  https://cdn.netbsd.org/pub/NetBSD/NetBSD-9.0/evbarm-earmv7hf/binary/gzimg/armv7.img.gz
-             xlen = ch->txfr_len;
++  https://archive.netbsd.org/pub/NetBSD-archive/NetBSD-9.0/evbarm-earmv7hf/binary/gzimg/armv7.img.gz
-             dst_stride = 0;
-             src_stride = 0;
+ The image requires manually installing U-Boot in the image. Build U-Boot with
  the orangepi_pc_defconfig configuration as described in the previous section.
 --
-.20.1
+.34.1

-[PULL 35/48] target/arm: check TGE and E2H flags for EL0 pauth traps
+[PULL 72/85] docs/system/arm/fby35: document execute-in-place property
-From: Alex Bennée <alex.bennee@linaro.org>
+From: Pierrick Bouvier <pierrick.bouvier@linaro.org>
-According to ARM ARM we should only trap from the EL1&0 regime.
+Reviewed-by: Cédric Le Goater <clg@redhat.com>
+Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Message-id: 20241206192254.3889131-3-pierrick.bouvier@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200206105448.4726-35-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/pauth_helper.c | 5 ++++-
+ docs/system/arm/fby35.rst | 5 +++++
-file changed, 4 insertions(+), 1 deletion(-)
+file changed, 5 insertions(+)
-diff --git a/target/arm/pauth_helper.c b/target/arm/pauth_helper.c
+diff --git a/docs/system/arm/fby35.rst b/docs/system/arm/fby35.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/pauth_helper.c
+--- a/docs/system/arm/fby35.rst
-+++ b/target/arm/pauth_helper.c
++++ b/docs/system/arm/fby35.rst
-@@ -XXX,XX +XXX,XX @@ static void pauth_check_trap(CPUARMState *env, int el, uintptr_t ra)
+@@ -XXX,XX +XXX,XX @@ process starts.
-     if (el < 2 && arm_feature(env, ARM_FEATURE_EL2)) {
+     $ screen /dev/tty0 # In a separate TMUX pane, terminal window, etc.
-         uint64_t hcr = arm_hcr_el2_eff(env);
+     $ screen /dev/tty1
-         bool trap = !(hcr & HCR_API);
+     $ (qemu) c           # Start the boot process once screen is setup.
--        /* FIXME: ARMv8.1-VHE: trap only applies to EL1&0 regime.  */
++
-+        if (el == 0) {
++This machine model supports emulation of the boot from the CE0 flash device by
-+            /* Trap only applies to EL1&0 regime.  */
++setting option ``execute-in-place``. When using this option, the CPU fetches
-+            trap &= (hcr & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE);
++instructions to execute by reading CE0 and not from a preloaded ROM
-+        }
++initialized at machine init time. As a result, execution will be slower.
          /* FIXME: ARMv8.3-NV: HCR_NV trap takes precedence for ERETA[AB].  */
          if (trap) {
              pauth_trap(env, 2, ra);
 --
-.20.1
+.34.1

-New patch
+[PULL 73/85] docs/system/arm/xlnx-versal-virt: document ospi-flash property
+From: Pierrick Bouvier <pierrick.bouvier@linaro.org>
+Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
+Message-id: 20241206192254.3889131-4-pierrick.bouvier@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ docs/system/arm/xlnx-versal-virt.rst | 3 +++
+file changed, 3 insertions(+)
+diff --git a/docs/system/arm/xlnx-versal-virt.rst b/docs/system/arm/xlnx-versal-virt.rst
+index XXXXXXX..XXXXXXX 100644
+--- a/docs/system/arm/xlnx-versal-virt.rst
++++ b/docs/system/arm/xlnx-versal-virt.rst
+@@ -XXX,XX +XXX,XX @@ Run the following at the U-Boot prompt:
+   fdt set /chosen/dom0 reg <0x00000000 0x40000000 0x0 0x03100000>
+   booti 30000000 - 20000000
++It's possible to change the OSPI flash model emulated by using the machine model
++option ``ospi-flash``.
++
+ BBRAM File Backend
+ """"""""""""""""""
+ BBRAM can have an optional file backend, which must be a seekable
+--
+.34.1

-New patch
+[PULL 74/85] docs/system/arm/virt: document missing properties
+From: Pierrick Bouvier <pierrick.bouvier@linaro.org>
+Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
+Message-id: 20241206192254.3889131-5-pierrick.bouvier@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ docs/system/arm/virt.rst | 16 ++++++++++++++++
+file changed, 16 insertions(+)
+diff --git a/docs/system/arm/virt.rst b/docs/system/arm/virt.rst
+index XXXXXXX..XXXXXXX 100644
+--- a/docs/system/arm/virt.rst
++++ b/docs/system/arm/virt.rst
+@@ -XXX,XX +XXX,XX @@ iommu
+   ``smmuv3``
+     Create an SMMUv3
++default-bus-bypass-iommu
++  Set ``on``/``off`` to enable/disable `bypass_iommu
++  <https://gitlab.com/qemu-project/qemu/-/blob/master/docs/bypass-iommu.txt>`_
++  for default root bus.
++
+ ras
+   Set ``on``/``off`` to enable/disable reporting host memory errors to a guest
+   using ACPI and guest external abort exceptions. The default is off.
++acpi
++  Set ``on``/``off``/``auto`` to enable/disable ACPI.
++
+ dtb-randomness
+   Set ``on``/``off`` to pass random seeds via the guest DTB
+   rng-seed and kaslr-seed nodes (in both "/chosen" and
+@@ -XXX,XX +XXX,XX @@ dtb-randomness
+ dtb-kaslr-seed
+   A deprecated synonym for dtb-randomness.
++x-oem-id
++  Set string (up to 6 bytes) to override the default value of field OEMID in ACPI
++  table header.
++
++x-oem-table-id
++  Set string (up to 8 bytes) to override the default value of field OEM Table ID
++  in ACPI table header.
++
+ Linux guest kernel configuration
+ """"""""""""""""""""""""""""""""
+--
+.34.1

-[PULL 45/48] docs/arm-cpu-features: Make kvm-no-adjvtime comment clearer
+[PULL 75/85] MAINTAINERS: correct my email address
-From: Philippe Mathieu-Daudé <philmd@redhat.com>
+From: Brian Cain <brian.cain@oss.qualcomm.com>
-The bold text sounds like 'knock knock'. Only bolding the
+Mea culpa, I don't know how I got this wrong in 2dfe93699c.  Still
-second 'not' makes it easier to read.
+getting used to the new address, I suppose.  Somehow I got it right in the
 mailmap, though.
-Fixes: dea101a1ae
+Signed-off-by: Brian Cain <brian.cain@oss.qualcomm.com>
-Signed-off-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+Message-id: 20241209181242.1434231-1-brian.cain@oss.qualcomm.com
-Reviewed-by: Andrew Jones <drjones@redhat.com>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20200206225148.23923-1-philmd@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- docs/arm-cpu-features.rst | 2 +-
+ MAINTAINERS | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/docs/arm-cpu-features.rst b/docs/arm-cpu-features.rst
+diff --git a/MAINTAINERS b/MAINTAINERS
 index XXXXXXX..XXXXXXX 100644
---- a/docs/arm-cpu-features.rst
+--- a/MAINTAINERS
-+++ b/docs/arm-cpu-features.rst
++++ b/MAINTAINERS
-@@ -XXX,XX +XXX,XX @@ the list of KVM VCPU features and their descriptions.
+@@ -XXX,XX +XXX,XX @@ F: target/avr/
+ F: tests/functional/test_avr_mega2560.py
-   kvm-no-adjvtime          By default kvm-no-adjvtime is disabled.  This
-                            means that by default the virtual time
+ Hexagon TCG CPUs
--                           adjustment is enabled (vtime is *not not*
+-M: Brian Cain <bcain@oss.qualcomm.com>
-+                           adjustment is enabled (vtime is not *not*
++M: Brian Cain <brian.cain@oss.qualcomm.com>
-                            adjusted).
+ S: Supported
+ F: target/hexagon/
-                            When virtual time adjustment is enabled each
+ X: target/hexagon/idef-parser/
 --
-.20.1
+.34.1

-[PULL 09/48] target/arm: Simplify tlb_force_broadcast alternatives
+[PULL 76/85] target/arm: Move some TLBI insns to their own source file
-From: Richard Henderson <richard.henderson@linaro.org>
+target/arm/helper.c is very large and unwieldy.  One subset of code
 that we can pull out into its own file is the cpreg arrays and
 corresponding functions for the TLBI instructions.
-Rather than call to a separate function and re-compute any
+Because these are instructions they are only relevant for TCG and we
-parameters for the flush, simply use the correct flush
+can make the new file only be built for CONFIG_TCG.
 function directly.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+In this commit we move the AArch32 instructions from:
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+ not_v7_cp_reginfo[]
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+ v7_cp_reginfo[]
-Message-id: 20200206105448.4726-9-richard.henderson@linaro.org
+ v7mp_cp_reginfo[]
  v8_cp_reginfo[]
 into a new file target/arm/tcg/tlb-insns.c.
 A few small functions are used both by functions we haven't yet moved
 across and by functions we have already moved.  We temporarily make
 these global with a prototype in cpregs.h; when the move of all TLBI
 insns is complete these will return to being file-local.
 For CONFIG_TCG, this is just moving code around.  For a KVM only
 build, these cpregs will no longer be added to the cpregs hashtable
 for the CPU.  However this should not be a behaviour change, because:
  * we never try to migration sync or otherwise include
    ARM_CP_NO_RAW cpregs
  * for migration we treat the kernel's list of system registers
    as the authoritative one, so these TLBI insns were never
    in it anyway
 The no-tcg stub of define_tlb_insn_regs() therefore does nothing.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-2-peter.maydell@linaro.org
 ---
- target/arm/helper.c | 52 +++++++++++++++++++++------------------------
+ target/arm/cpregs.h        |  14 +++
-file changed, 24 insertions(+), 28 deletions(-)
+ target/arm/internals.h     |   3 +
  target/arm/helper.c        | 231 ++--------------------------------
  target/arm/tcg-stubs.c     |   5 +
  target/arm/tcg/tlb-insns.c | 246 +++++++++++++++++++++++++++++++++++++
  target/arm/tcg/meson.build |   1 +
 files changed, 280 insertions(+), 220 deletions(-)
  create mode 100644 target/arm/tcg/tlb-insns.c
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/cpregs.h
++++ b/target/arm/cpregs.h
+@@ -XXX,XX +XXX,XX @@ static inline bool arm_cpreg_traps_in_nv(const ARMCPRegInfo *ri)
+     return ri->opc1 == 4 || ri->opc1 == 5;
+ }
++/*
++ * Temporary declarations of functions until the move to tlb_insn_helper.c
++ * is complete and we can make the functions static again
++ */
++CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
++                           bool isread);
++CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
++                             bool isread);
++bool tlb_force_broadcast(CPUARMState *env);
++void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                       uint64_t value);
++void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                          uint64_t value);
++
+ #endif /* TARGET_ARM_CPREGS_H */
+diff --git a/target/arm/internals.h b/target/arm/internals.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/internals.h
++++ b/target/arm/internals.h
+@@ -XXX,XX +XXX,XX @@ static inline uint64_t pauth_ptr_mask(ARMVAParameters param)
+ /* Add the cpreg definitions for debug related system registers */
+ void define_debug_regs(ARMCPU *cpu);
++/* Add the cpreg definitions for TLBI instructions */
++void define_tlb_insn_regs(ARMCPU *cpu);
++
+ /* Effective value of MDCR_EL2 */
+ static inline uint64_t arm_mdcr_el2_eff(CPUARMState *env)
+ {
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tacr(CPUARMState *env, const ARMCPRegInfo *ri,
-                           uint64_t value)
+ }
- {
-     /* Invalidate all (TLBIALL) */
+ /* Check for traps from EL1 due to HCR_EL2.TTLB. */
--    ARMCPU *cpu = env_archcpu(env);
+-static CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-+    CPUState *cs = env_cpu(env);
+-                                  bool isread)
++CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-     if (tlb_force_broadcast(env)) {
++                           bool isread)
--        tlbiall_is_write(env, NULL, value);
+ {
--        return;
+     if (arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_TTLB)) {
          return CP_ACCESS_TRAP_EL2;
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
  }
  /* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBIS. */
 -static CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                    bool isread)
 +CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             bool isread)
  {
      if (arm_current_el(env) == 1 &&
          (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBIS))) {
@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
              ARMMMUIdxBit_Stage2_S);
  }
 -
 -/* IS variants of TLB operations must affect all cores */
 -static void tlbiall_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush_all_cpus_synced(cs);
 -}
 -
 -static void tlbiasid_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush_all_cpus_synced(cs);
 -}
 -
 -static void tlbimva_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
 -}
 -
 -static void tlbimvaa_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
 -}
 -
  /*
   * Non-IS variants of TLB operations are upgraded to
   * IS versions if we are at EL1 and HCR_EL2.FB is effectively set to
   * force broadcast of these operations.
   */
 -static bool tlb_force_broadcast(CPUARMState *env)
 +bool tlb_force_broadcast(CPUARMState *env)
  {
      return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
  }
 -static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                          uint64_t value)
 -{
 -    /* Invalidate all (TLBIALL) */
 -    CPUState *cs = env_cpu(env);
 -
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_all_cpus_synced(cs);
 -    } else {
 -        tlb_flush(cs);
 -    }
 -}
 -
 -static void tlbimva_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                          uint64_t value)
 -{
 -    /* Invalidate single TLB entry by MVA and ASID (TLBIMVA) */
 -    CPUState *cs = env_cpu(env);
 -
 -    value &= TARGET_PAGE_MASK;
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_page_all_cpus_synced(cs, value);
 -    } else {
 -        tlb_flush_page(cs, value);
 -    }
 -}
 -
 -static void tlbiasid_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                           uint64_t value)
 -{
 -    /* Invalidate by ASID (TLBIASID) */
 -    CPUState *cs = env_cpu(env);
 -
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_all_cpus_synced(cs);
 -    } else {
 -        tlb_flush(cs);
 -    }
 -}
 -
 -static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                           uint64_t value)
 -{
 -    /* Invalidate single entry by MVA, all ASIDs (TLBIMVAA) */
 -    CPUState *cs = env_cpu(env);
 -
 -    value &= TARGET_PAGE_MASK;
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_page_all_cpus_synced(cs, value);
 -    } else {
 -        tlb_flush_page(cs, value);
 -    }
 -}
 -
  static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                 uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
  }
 -static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                              uint64_t value)
 +void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                       uint64_t value)
  {
      CPUState *cs = env_cpu(env);
      uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
  }
 -static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                 uint64_t value)
 +void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
  {
      CPUState *cs = env_cpu(env);
      uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                               ARMMMUIdxBit_E2);
  }
 -static void tlbiipas2_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
 -
 -    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
 -}
 -
 -static void tlbiipas2is_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
 -
 -    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, ARMMMUIdxBit_Stage2);
 -}
 -
  static const ARMCPRegInfo cp_reginfo[] = {
      /*
       * Define the secure and non-secure FCSE identifier CP registers
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo not_v7_cp_reginfo[] = {
       */
      { .name = "DBGDIDR", .cp = 14, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 0,
        .access = PL0_R, .type = ARM_CP_CONST, .resetvalue = 0 },
 -    /*
 -     * MMU TLB control. Note that the wildcarding means we cover not just
 -     * the unified TLB ops but also the dside/iside/inner-shareable variants.
 -     */
 -    { .name = "TLBIALL", .cp = 15, .crn = 8, .crm = CP_ANY,
 -      .opc1 = CP_ANY, .opc2 = 0, .access = PL1_W, .writefn = tlbiall_write,
 -      .type = ARM_CP_NO_RAW },
 -    { .name = "TLBIMVA", .cp = 15, .crn = 8, .crm = CP_ANY,
 -      .opc1 = CP_ANY, .opc2 = 1, .access = PL1_W, .writefn = tlbimva_write,
 -      .type = ARM_CP_NO_RAW },
 -    { .name = "TLBIASID", .cp = 15, .crn = 8, .crm = CP_ANY,
 -      .opc1 = CP_ANY, .opc2 = 2, .access = PL1_W, .writefn = tlbiasid_write,
 -      .type = ARM_CP_NO_RAW },
 -    { .name = "TLBIMVAA", .cp = 15, .crn = 8, .crm = CP_ANY,
 -      .opc1 = CP_ANY, .opc2 = 3, .access = PL1_W, .writefn = tlbimvaa_write,
 -      .type = ARM_CP_NO_RAW },
      { .name = "PRRR", .cp = 15, .crn = 10, .crm = 2,
        .opc1 = 0, .opc2 = 0, .access = PL1_RW, .type = ARM_CP_NOP },
      { .name = "NMRR", .cp = 15, .crn = 10, .crm = 2,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
        .opc0 = 3, .opc1 = 0, .crn = 12, .crm = 1, .opc2 = 0,
        .fgt = FGT_ISR_EL1,
        .type = ARM_CP_NO_RAW, .access = PL1_R, .readfn = isr_read },
 -    /* 32 bit ITLB invalidates */
 -    { .name = "ITLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 0,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbiall_write },
 -    { .name = "ITLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbimva_write },
 -    { .name = "ITLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 2,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbiasid_write },
 -    /* 32 bit DTLB invalidates */
 -    { .name = "DTLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 0,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbiall_write },
 -    { .name = "DTLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbimva_write },
 -    { .name = "DTLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 2,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbiasid_write },
 -    /* 32 bit TLB invalidates */
 -    { .name = "TLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbiall_write },
 -    { .name = "TLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbimva_write },
 -    { .name = "TLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbiasid_write },
 -    { .name = "TLBIMVAA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbimvaa_write },
 -};
 -
 -static const ARMCPRegInfo v7mp_cp_reginfo[] = {
 -    /* 32 bit TLB invalidates, Inner Shareable */
 -    { .name = "TLBIALLIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 -      .writefn = tlbiall_is_write },
 -    { .name = "TLBIMVAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 -      .writefn = tlbimva_is_write },
 -    { .name = "TLBIASIDIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 -      .writefn = tlbiasid_is_write },
 -    { .name = "TLBIMVAAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 -      .writefn = tlbimvaa_is_write },
  };
  static const ARMCPRegInfo pmovsset_cp_reginfo[] = {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v8_cp_reginfo[] = {
        .fieldoffset = offsetof(CPUARMState, cp15.par_el[1]),
        .writefn = par_write },
  #endif
 -    /* TLB invalidate last level of translation table walk */
 -    { .name = "TLBIMVALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 -      .writefn = tlbimva_is_write },
 -    { .name = "TLBIMVAALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 -      .writefn = tlbimvaa_is_write },
 -    { .name = "TLBIMVAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbimva_write },
 -    { .name = "TLBIMVAAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
 -      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 -      .writefn = tlbimvaa_write },
 -    { .name = "TLBIMVALH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbimva_hyp_write },
 -    { .name = "TLBIMVALHIS",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbimva_hyp_is_write },
 -    { .name = "TLBIIPAS2",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiipas2_hyp_write },
 -    { .name = "TLBIIPAS2IS",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiipas2is_hyp_write },
 -    { .name = "TLBIIPAS2L",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiipas2_hyp_write },
 -    { .name = "TLBIIPAS2LIS",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiipas2is_hyp_write },
      /* 32 bit cache operations */
      { .name = "ICIALLUIS", .cp = 15, .opc1 = 0, .crn = 7, .crm = 1, .opc2 = 0,
        .type = ARM_CP_NOP, .access = PL1_W, .accessfn = access_ticab },
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          define_arm_cp_regs(cpu, not_v8_cp_reginfo);
      }
 +    define_tlb_insn_regs(cpu);
 +
      if (arm_feature(env, ARM_FEATURE_V6)) {
          /* The ID registers all have impdef reset values */
          ARMCPRegInfo v6_idregs[] = {
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
      if (arm_feature(env, ARM_FEATURE_V6K)) {
          define_arm_cp_regs(cpu, v6k_cp_reginfo);
      }
 -    if (arm_feature(env, ARM_FEATURE_V7MP) &&
 -        !arm_feature(env, ARM_FEATURE_PMSA)) {
 -        define_arm_cp_regs(cpu, v7mp_cp_reginfo);
 -    }
      if (arm_feature(env, ARM_FEATURE_V7VE)) {
          define_arm_cp_regs(cpu, pmovsset_cp_reginfo);
      }
 diff --git a/target/arm/tcg-stubs.c b/target/arm/tcg-stubs.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg-stubs.c
 +++ b/target/arm/tcg-stubs.c
@@ -XXX,XX +XXX,XX @@ void raise_exception_ra(CPUARMState *env, uint32_t excp, uint32_t syndrome,
  void assert_hflags_rebuild_correctly(CPUARMState *env)
  {
  }
 +
 +/* TLBI insns are only used by TCG, so we don't need to do anything for KVM */
 +void define_tlb_insn_regs(ARMCPU *cpu)
 +{
 +}
 diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Helpers for TLBI insns
 + *
 + * This code is licensed under the GNU GPL v2 or later.
 + *
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + */
 +#include "qemu/osdep.h"
 +#include "exec/exec-all.h"
 +#include "cpu.h"
 +#include "internals.h"
 +#include "cpu-features.h"
 +#include "cpregs.h"
 +
 +/* IS variants of TLB operations must affect all cores */
 +static void tlbiall_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_all_cpus_synced(cs);
 +}
 +
 +static void tlbiasid_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_all_cpus_synced(cs);
 +}
 +
 +static void tlbimva_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
 +}
 +
 +static void tlbimvaa_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
 +}
 +
 +static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
 +{
 +    /* Invalidate all (TLBIALL) */
 +    CPUState *cs = env_cpu(env);
 +
 +    if (tlb_force_broadcast(env)) {
 +        tlb_flush_all_cpus_synced(cs);
 +    } else {
 +        tlb_flush(cs);
-     }
++    }
--
++}
--    tlb_flush(CPU(cpu));
++
- }
++static void tlbimva_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                          uint64_t value)
- static void tlbimva_write(CPUARMState *env, const ARMCPRegInfo *ri,
++{
-                           uint64_t value)
++    /* Invalidate single TLB entry by MVA and ASID (TLBIMVA) */
- {
++    CPUState *cs = env_cpu(env);
-     /* Invalidate single TLB entry by MVA and ASID (TLBIMVA) */
++
 -    ARMCPU *cpu = env_archcpu(env);
 +    CPUState *cs = env_cpu(env);
 +    value &= TARGET_PAGE_MASK;
-     if (tlb_force_broadcast(env)) {
++    if (tlb_force_broadcast(env)) {
 -        tlbimva_is_write(env, NULL, value);
 -        return;
 +        tlb_flush_page_all_cpus_synced(cs, value);
 +    } else {
 +        tlb_flush_page(cs, value);
-     }
++    }
--
++}
--    tlb_flush_page(CPU(cpu), value & TARGET_PAGE_MASK);
++
- }
++static void tlbiasid_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                           uint64_t value)
- static void tlbiasid_write(CPUARMState *env, const ARMCPRegInfo *ri,
++{
-                            uint64_t value)
++    /* Invalidate by ASID (TLBIASID) */
- {
++    CPUState *cs = env_cpu(env);
-     /* Invalidate by ASID (TLBIASID) */
++
--    ARMCPU *cpu = env_archcpu(env);
++    if (tlb_force_broadcast(env)) {
 +    CPUState *cs = env_cpu(env);
      if (tlb_force_broadcast(env)) {
 -        tlbiasid_is_write(env, NULL, value);
 -        return;
 +        tlb_flush_all_cpus_synced(cs);
 +    } else {
 +        tlb_flush(cs);
-     }
++    }
--
++}
--    tlb_flush(CPU(cpu));
++
- }
++static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                           uint64_t value)
- static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
++{
-                            uint64_t value)
++    /* Invalidate single entry by MVA, all ASIDs (TLBIMVAA) */
- {
++    CPUState *cs = env_cpu(env);
-     /* Invalidate single entry by MVA, all ASIDs (TLBIMVAA) */
++
 -    ARMCPU *cpu = env_archcpu(env);
 +    CPUState *cs = env_cpu(env);
 +    value &= TARGET_PAGE_MASK;
-     if (tlb_force_broadcast(env)) {
++    if (tlb_force_broadcast(env)) {
 -        tlbimvaa_is_write(env, NULL, value);
 -        return;
 +        tlb_flush_page_all_cpus_synced(cs, value);
 +    } else {
 +        tlb_flush_page(cs, value);
-     }
++    }
--
++}
--    tlb_flush_page(CPU(cpu), value & TARGET_PAGE_MASK);
++
- }
++static void tlbiipas2_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                                uint64_t value)
- static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
++{
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
++    CPUState *cs = env_cpu(env);
-     int mask = vae1_tlbmask(env);
++    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
++
-     if (tlb_force_broadcast(env)) {
++    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
--        tlbi_aa64_vmalle1is_write(env, NULL, value);
++}
--        return;
++
-+        tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
++static void tlbiipas2is_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
 +
 +    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, ARMMMUIdxBit_Stage2);
 +}
 +
 +static const ARMCPRegInfo tlbi_not_v7_cp_reginfo[] = {
 +    /*
 +     * MMU TLB control. Note that the wildcarding means we cover not just
 +     * the unified TLB ops but also the dside/iside/inner-shareable variants.
 +     */
 +    { .name = "TLBIALL", .cp = 15, .crn = 8, .crm = CP_ANY,
 +      .opc1 = CP_ANY, .opc2 = 0, .access = PL1_W, .writefn = tlbiall_write,
 +      .type = ARM_CP_NO_RAW },
 +    { .name = "TLBIMVA", .cp = 15, .crn = 8, .crm = CP_ANY,
 +      .opc1 = CP_ANY, .opc2 = 1, .access = PL1_W, .writefn = tlbimva_write,
 +      .type = ARM_CP_NO_RAW },
 +    { .name = "TLBIASID", .cp = 15, .crn = 8, .crm = CP_ANY,
 +      .opc1 = CP_ANY, .opc2 = 2, .access = PL1_W, .writefn = tlbiasid_write,
 +      .type = ARM_CP_NO_RAW },
 +    { .name = "TLBIMVAA", .cp = 15, .crn = 8, .crm = CP_ANY,
 +      .opc1 = CP_ANY, .opc2 = 3, .access = PL1_W, .writefn = tlbimvaa_write,
 +      .type = ARM_CP_NO_RAW },
 +};
 +
 +static const ARMCPRegInfo tlbi_v7_cp_reginfo[] = {
 +    /* 32 bit ITLB invalidates */
 +    { .name = "ITLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbiall_write },
 +    { .name = "ITLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbimva_write },
 +    { .name = "ITLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 2,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbiasid_write },
 +    /* 32 bit DTLB invalidates */
 +    { .name = "DTLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbiall_write },
 +    { .name = "DTLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbimva_write },
 +    { .name = "DTLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 2,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbiasid_write },
 +    /* 32 bit TLB invalidates */
 +    { .name = "TLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbiall_write },
 +    { .name = "TLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbimva_write },
 +    { .name = "TLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbiasid_write },
 +    { .name = "TLBIMVAA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbimvaa_write },
 +};
 +
 +static const ARMCPRegInfo tlbi_v7mp_cp_reginfo[] = {
 +    /* 32 bit TLB invalidates, Inner Shareable */
 +    { .name = "TLBIALLIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 +      .writefn = tlbiall_is_write },
 +    { .name = "TLBIMVAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 +      .writefn = tlbimva_is_write },
 +    { .name = "TLBIASIDIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 +      .writefn = tlbiasid_is_write },
 +    { .name = "TLBIMVAAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 +      .writefn = tlbimvaa_is_write },
 +};
 +
 +static const ARMCPRegInfo tlbi_v8_cp_reginfo[] = {
 +    /* AArch32 TLB invalidate last level of translation table walk */
 +    { .name = "TLBIMVALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 +      .writefn = tlbimva_is_write },
 +    { .name = "TLBIMVAALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
 +      .writefn = tlbimvaa_is_write },
 +    { .name = "TLBIMVAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbimva_write },
 +    { .name = "TLBIMVAAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
 +      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
 +      .writefn = tlbimvaa_write },
 +    { .name = "TLBIMVALH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbimva_hyp_write },
 +    { .name = "TLBIMVALHIS",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbimva_hyp_is_write },
 +    { .name = "TLBIIPAS2",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiipas2_hyp_write },
 +    { .name = "TLBIIPAS2IS",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiipas2is_hyp_write },
 +    { .name = "TLBIIPAS2L",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiipas2_hyp_write },
 +    { .name = "TLBIIPAS2LIS",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiipas2is_hyp_write },
 +};
 +
 +void define_tlb_insn_regs(ARMCPU *cpu)
 +{
 +    CPUARMState *env = &cpu->env;
 +
 +    if (!arm_feature(env, ARM_FEATURE_V7)) {
 +        define_arm_cp_regs(cpu, tlbi_not_v7_cp_reginfo);
 +    } else {
-+        tlb_flush_by_mmuidx(cs, mask);
++        define_arm_cp_regs(cpu, tlbi_v7_cp_reginfo);
-     }
++    }
--
++    if (arm_feature(env, ARM_FEATURE_V7MP) &&
--    tlb_flush_by_mmuidx(cs, mask);
++        !arm_feature(env, ARM_FEATURE_PMSA)) {
- }
++        define_arm_cp_regs(cpu, tlbi_v7mp_cp_reginfo);
++    }
- static int alle1_tlbmask(CPUARMState *env)
++    if (arm_feature(env, ARM_FEATURE_V8)) {
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
++        define_arm_cp_regs(cpu, tlbi_v8_cp_reginfo);
-     uint64_t pageaddr = sextract64(value << 12, 0, 56);
++    }
++}
-     if (tlb_force_broadcast(env)) {
+diff --git a/target/arm/tcg/meson.build b/target/arm/tcg/meson.build
--        tlbi_aa64_vae1is_write(env, NULL, value);
+index XXXXXXX..XXXXXXX 100644
--        return;
+--- a/target/arm/tcg/meson.build
-+        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
++++ b/target/arm/tcg/meson.build
-+    } else {
+@@ -XXX,XX +XXX,XX @@ arm_ss.add(files(
-+        tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
+   'op_helper.c',
-     }
+   'tlb_helper.c',
--
+   'vec_helper.c',
--    tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
++  'tlb-insns.c',
- }
+ ))
- static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ arm_ss.add(when: 'TARGET_AARCH64', if_true: files(
 --
-.20.1
+.34.1

-[PULL 12/48] target/arm: Rename ARMMMUIdx_S1NSE* to ARMMMUIdx_Stage1_E*
+[PULL 77/85] target/arm: Move TLBI insns for AArch32 EL2 to tlbi_insn_helper.c
-From: Richard Henderson <richard.henderson@linaro.org>
+Move the AArch32 TLBI insns for AArch32 EL2 to tlbi_insn_helper.c.
+To keep this as an obviously pure code-movement, we retain the
-This is part of a reorganization to the set of mmu_idx.
+same condition for registering tlbi_el2_cp_reginfo that we use for
-The EL1&0 regime is the only one that uses 2-stage translation.
+el2_cp_reginfo. We'll be able to simplify this condition later,
-Spelling out Stage avoids confusion with Secure.
+since the need to define the reginfo for EL3-without-EL2 doesn't
+apply for the TLBI ops specifically.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+This move brings all the uses of tlbimva_hyp_write() and
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+tlbimva_hyp_is_write() back into a single file, so we can move those
-Message-id: 20200206105448.4726-12-richard.henderson@linaro.org
+also, and make them file-local again.
 The helper alle1_tlbmask() is an exception to the pattern that we
 only need to make these functions global temporarily, because once
 this refactoring is complete it will be called by both code in
 helper.c (vttbr_write()) and by code in tlb-insns.c.  We therefore
 put its prototype in a permanent home in internals.h.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-3-peter.maydell@linaro.org
 ---
- target/arm/cpu.h       |  4 ++--
+ target/arm/cpregs.h        |  4 --
- target/arm/internals.h |  6 +++---
+ target/arm/internals.h     |  6 +++
- target/arm/helper.c    | 27 ++++++++++++++-------------
+ target/arm/helper.c        | 74 +--------------------------------
-files changed, 19 insertions(+), 18 deletions(-)
+ target/arm/tcg/tlb-insns.c | 85 ++++++++++++++++++++++++++++++++++++++
+files changed, 92 insertions(+), 77 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
---- a/target/arm/cpu.h
+index XXXXXXX..XXXXXXX 100644
-+++ b/target/arm/cpu.h
+--- a/target/arm/cpregs.h
-@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
++++ b/target/arm/cpregs.h
-     /* Indexes below here don't have TLBs and are used only for AT system
+@@ -XXX,XX +XXX,XX @@ CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-      * instructions or for the first stage of an S12 page table walk.
+ CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
-      */
+                              bool isread);
--    ARMMMUIdx_S1NSE0 = 0 | ARM_MMU_IDX_NOTLB,
+ bool tlb_force_broadcast(CPUARMState *env);
--    ARMMMUIdx_S1NSE1 = 1 | ARM_MMU_IDX_NOTLB,
+-void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
-+    ARMMMUIdx_Stage1_E0 = 0 | ARM_MMU_IDX_NOTLB,
+-                       uint64_t value);
-+    ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
+-void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
- } ARMMMUIdx;
+-                          uint64_t value);
- /* Bit macros for the core-mmu-index values for each index,
+ #endif /* TARGET_ARM_CPREGS_H */
 diff --git a/target/arm/internals.h b/target/arm/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/internals.h
 +++ b/target/arm/internals.h
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
+@@ -XXX,XX +XXX,XX @@ uint64_t gt_get_countervalue(CPUARMState *env);
-     switch (mmu_idx) {
+  * and CNTVCT_EL0 (this will be either 0 or the value of CNTVOFF_EL2).
-     case ARMMMUIdx_E10_0:
+  */
-     case ARMMMUIdx_E10_1:
+ uint64_t gt_virt_cnt_offset(CPUARMState *env);
--    case ARMMMUIdx_S1NSE0:
++
--    case ARMMMUIdx_S1NSE1:
++/*
-+    case ARMMMUIdx_Stage1_E0:
++ * Return mask of ARMMMUIdxBit values corresponding to an "invalidate
-+    case ARMMMUIdx_Stage1_E1:
++ * all EL1" scope; this covers stage 1 and stage 2.
-     case ARMMMUIdx_S1E2:
++ */
-     case ARMMMUIdx_Stage2:
++int alle1_tlbmask(CPUARMState *env);
-     case ARMMMUIdx_MPrivNegPri:
+ #endif
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx(CPUARMState *env);
  #ifdef CONFIG_USER_ONLY
  static inline ARMMMUIdx arm_stage1_mmu_idx(CPUARMState *env)
  {
 -    return ARMMMUIdx_S1NSE0;
 +    return ARMMMUIdx_Stage1_E0;
  }
  #else
  ARMMMUIdx arm_stage1_mmu_idx(CPUARMState *env);
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
+@@ -XXX,XX +XXX,XX @@ static void contextidr_write(CPUARMState *env, const ARMCPRegInfo *ri,
-         bool take_exc = false;
+     raw_write(env, ri, value);
+ }
-         if (fi.s1ptw && current_el == 1 && !arm_is_secure(env)
--            && (mmu_idx == ARMMMUIdx_S1NSE1 || mmu_idx == ARMMMUIdx_S1NSE0)) {
+-static int alle1_tlbmask(CPUARMState *env)
-+            && (mmu_idx == ARMMMUIdx_Stage1_E1 ||
++int alle1_tlbmask(CPUARMState *env)
-+                mmu_idx == ARMMMUIdx_Stage1_E0)) {
+ {
-             /*
+     /*
-              * Synchronous stage 2 fault on an access made as part of the
+      * Note that the 'ALL' scope must invalidate both stage 1 and
-              * translation table walk for AT S1E0* or AT S1E1* insn
+@@ -XXX,XX +XXX,XX @@ bool tlb_force_broadcast(CPUARMState *env)
-@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+     return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
-             mmu_idx = ARMMMUIdx_S1E3;
+ }
-             break;
-         case 2:
+-static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
--            mmu_idx = ARMMMUIdx_S1NSE1;
+-                               uint64_t value)
-+            mmu_idx = ARMMMUIdx_Stage1_E1;
+-{
-             break;
+-    CPUState *cs = env_cpu(env);
-         case 1:
+-
--            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_S1NSE1;
+-    tlb_flush_by_mmuidx(cs, alle1_tlbmask(env));
-+            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_Stage1_E1;
+-}
-             break;
+-
-         default:
+-static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-             g_assert_not_reached();
+-                                  uint64_t value)
-@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
+-{
-             mmu_idx = ARMMMUIdx_S1SE0;
+-    CPUState *cs = env_cpu(env);
-             break;
+-
-         case 2:
+-    tlb_flush_by_mmuidx_all_cpus_synced(cs, alle1_tlbmask(env));
--            mmu_idx = ARMMMUIdx_S1NSE0;
+-}
-+            mmu_idx = ARMMMUIdx_Stage1_E0;
+-
-             break;
+-
-         case 1:
+-static void tlbiall_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
--            mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S1NSE0;
+-                              uint64_t value)
-+            mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_Stage1_E0;
+-{
-             break;
+-    CPUState *cs = env_cpu(env);
-         default:
+-
-             g_assert_not_reached();
+-    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
-@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
+-}
-     case 0:
+-
-         switch (ri->opc1) {
+-static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-         case 0: /* AT S1E1R, AT S1E1W */
+-                                 uint64_t value)
--            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_S1NSE1;
+-{
-+            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_Stage1_E1;
+-    CPUState *cs = env_cpu(env);
-             break;
+-
-         case 4: /* AT S1E2R, AT S1E2W */
+-    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
-             mmu_idx = ARMMMUIdx_S1E2;
+-}
-@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
+-
-         }
+-void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
-         break;
+-                       uint64_t value)
-     case 2: /* AT S1E0R, AT S1E0W */
+-{
--        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S1NSE0;
+-    CPUState *cs = env_cpu(env);
-+        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_Stage1_E0;
+-    uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
-         break;
+-
-     case 4: /* AT S12E1R, AT S12E1W */
+-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
-         mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_E10_1;
+-}
-@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
+-
-     case ARMMMUIdx_S1SE0:
+-void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-         return arm_el_is_aa64(env, 3) ? 1 : 3;
+-                          uint64_t value)
-     case ARMMMUIdx_S1SE1:
+-{
--    case ARMMMUIdx_S1NSE0:
+-    CPUState *cs = env_cpu(env);
--    case ARMMMUIdx_S1NSE1:
+-    uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
-+    case ARMMMUIdx_Stage1_E0:
+-
-+    case ARMMMUIdx_Stage1_E1:
+-    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-     case ARMMMUIdx_MPrivNegPri:
+-                                             ARMMMUIdxBit_E2);
-     case ARMMMUIdx_MUserNegPri:
+-}
-     case ARMMMUIdx_MPriv:
+-
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_translation_disabled(CPUARMState *env,
+ static const ARMCPRegInfo cp_reginfo[] = {
      /*
       * Define the secure and non-secure FCSE identifier CP registers
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
      { .name = "HTTBR", .cp = 15, .opc1 = 4, .crm = 2,
        .access = PL2_RW, .type = ARM_CP_64BIT | ARM_CP_ALIAS,
        .fieldoffset = offsetof(CPUARMState, cp15.ttbr0_el[2]) },
 -    { .name = "TLBIALLNSNH",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 4,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiall_nsnh_write },
 -    { .name = "TLBIALLNSNHIS",
 -      .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 4,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiall_nsnh_is_write },
 -    { .name = "TLBIALLH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiall_hyp_write },
 -    { .name = "TLBIALLHIS", .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbiall_hyp_is_write },
 -    { .name = "TLBIMVAH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbimva_hyp_write },
 -    { .name = "TLBIMVAHIS", .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
 -      .type = ARM_CP_NO_RAW, .access = PL2_W,
 -      .writefn = tlbimva_hyp_is_write },
      { .name = "TLBI_ALLE2", .state = ARM_CP_STATE_AA64,
        .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
        .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/tlb-insns.c
 +++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
      }
+ }
-     if ((env->cp15.hcr_el2 & HCR_DC) &&
--        (mmu_idx == ARMMMUIdx_S1NSE0 || mmu_idx == ARMMMUIdx_S1NSE1)) {
++static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
-+        (mmu_idx == ARMMMUIdx_Stage1_E0 || mmu_idx == ARMMMUIdx_Stage1_E1)) {
++                              uint64_t value)
-         /* HCR.DC means SCTLR_EL1.M behaves as 0 */
++{
-         return true;
++    CPUState *cs = env_cpu(env);
 +    uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
 +
 +    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
 +}
 +
 +static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                 uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
 +
 +    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
 +                                             ARMMMUIdxBit_E2);
 +}
 +
  static void tlbiipas2_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbiipas2is_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, ARMMMUIdxBit_Stage2);
  }
 +static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                               uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_by_mmuidx(cs, alle1_tlbmask(env));
 +}
 +
 +static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, alle1_tlbmask(env));
 +}
 +
 +
 +static void tlbiall_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                              uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
 +}
 +
 +static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                 uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
 +}
 +
  static const ARMCPRegInfo tlbi_not_v7_cp_reginfo[] = {
      /*
       * MMU TLB control. Note that the wildcarding means we cover not just
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_v8_cp_reginfo[] = {
        .writefn = tlbiipas2is_hyp_write },
  };
 +static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
 +    { .name = "TLBIALLNSNH",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 4,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiall_nsnh_write },
 +    { .name = "TLBIALLNSNHIS",
 +      .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 4,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiall_nsnh_is_write },
 +    { .name = "TLBIALLH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiall_hyp_write },
 +    { .name = "TLBIALLHIS", .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbiall_hyp_is_write },
 +    { .name = "TLBIMVAH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbimva_hyp_write },
 +    { .name = "TLBIMVAHIS", .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
 +      .type = ARM_CP_NO_RAW, .access = PL2_W,
 +      .writefn = tlbimva_hyp_is_write },
 +};
 +
  void define_tlb_insn_regs(ARMCPU *cpu)
  {
      CPUARMState *env = &cpu->env;
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
      if (arm_feature(env, ARM_FEATURE_V8)) {
          define_arm_cp_regs(cpu, tlbi_v8_cp_reginfo);
      }
-@@ -XXX,XX +XXX,XX @@ static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
++    /*
- static inline ARMMMUIdx stage_1_mmu_idx(ARMMMUIdx mmu_idx)
++     * We retain the existing logic for when to register these TLBI
- {
++     * ops (i.e. matching the condition for el2_cp_reginfo[] in
-     if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
++     * helper.c), but we will be able to simplify this later.
--        mmu_idx += (ARMMMUIdx_S1NSE0 - ARMMMUIdx_E10_0);
++     */
-+        mmu_idx += (ARMMMUIdx_Stage1_E0 - ARMMMUIdx_E10_0);
++    if (arm_feature(env, ARM_FEATURE_EL2)
-     }
++        || (arm_feature(env, ARM_FEATURE_EL3)
-     return mmu_idx;
++            && arm_feature(env, ARM_FEATURE_V8))) {
- }
++        define_arm_cp_regs(cpu, tlbi_el2_cp_reginfo);
-@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
++    }
- {
+ }
      switch (mmu_idx) {
      case ARMMMUIdx_S1SE0:
 -    case ARMMMUIdx_S1NSE0:
 +    case ARMMMUIdx_Stage1_E0:
      case ARMMMUIdx_MUser:
      case ARMMMUIdx_MSUser:
      case ARMMMUIdx_MUserNegPri:
@@ -XXX,XX +XXX,XX @@ static hwaddr S1_ptw_translate(CPUARMState *env, ARMMMUIdx mmu_idx,
                                 hwaddr addr, MemTxAttrs txattrs,
                                 ARMMMUFaultInfo *fi)
  {
 -    if ((mmu_idx == ARMMMUIdx_S1NSE0 || mmu_idx == ARMMMUIdx_S1NSE1) &&
 +    if ((mmu_idx == ARMMMUIdx_Stage1_E0 || mmu_idx == ARMMMUIdx_Stage1_E1) &&
          !regime_translation_disabled(env, ARMMMUIdx_Stage2)) {
          target_ulong s2size;
          hwaddr s2pa;
 --
-.20.1
+.34.1

-[PULL 08/48] target/arm: Split out alle1_tlbmask
+[PULL 78/85] target/arm: Move AArch64 TLBI insns from v8_cp_reginfo[]
-From: Richard Henderson <richard.henderson@linaro.org>
+Move the AArch64 TLBI insns that are declared in v8_cp_reginfo[]
 into tlb-insns.c.
-No functional change, but unify code sequences.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20241210160452.2427965-4-peter.maydell@linaro.org
 ---
  target/arm/cpregs.h        |  11 +++
  target/arm/helper.c        | 182 +++----------------------------------
  target/arm/tcg/tlb-insns.c | 160 ++++++++++++++++++++++++++++++++
 files changed, 182 insertions(+), 171 deletions(-)
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+index XXXXXXX..XXXXXXX 100644
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+--- a/target/arm/cpregs.h
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
++++ b/target/arm/cpregs.h
-Message-id: 20200206105448.4726-8-richard.henderson@linaro.org
+@@ -XXX,XX +XXX,XX @@ CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+ CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
----
+                              bool isread);
- target/arm/helper.c | 86 +++++++++++++--------------------------------
+ bool tlb_force_broadcast(CPUARMState *env);
-file changed, 24 insertions(+), 62 deletions(-)
++int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
++                       uint64_t addr);
 +int vae1_tlbbits(CPUARMState *env, uint64_t addr);
 +int vae1_tlbmask(CPUARMState *env);
 +int ipas2e1_tlbmask(CPUARMState *env, int64_t value);
 +void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                               uint64_t value);
 +void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value);
 +void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                            uint64_t value);
  #endif /* TARGET_ARM_CPREGS_H */
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tocu(CPUARMState *env, const ARMCPRegInfo *ri,
-     tlb_flush_by_mmuidx(cs, mask);
+  * Page D4-1736 (DDI0487A.b)
- }
+  */
 -static int vae1_tlbmask(CPUARMState *env)
 +int vae1_tlbmask(CPUARMState *env)
  {
      uint64_t hcr = arm_hcr_el2_eff(env);
      uint16_t mask;
@@ -XXX,XX +XXX,XX @@ static int vae2_tlbmask(CPUARMState *env)
  }
  /* Return 56 if TBI is enabled, 64 otherwise. */
 -static int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
 -                              uint64_t addr)
 +int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
 +                       uint64_t addr)
  {
      uint64_t tcr = regime_tcr(env, mmu_idx);
      int tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
@@ -XXX,XX +XXX,XX @@ static int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
      return (tbi >> select) & 1 ? 56 : 64;
  }
 -static int vae1_tlbbits(CPUARMState *env, uint64_t addr)
 +int vae1_tlbbits(CPUARMState *env, uint64_t addr)
  {
      uint64_t hcr = arm_hcr_el2_eff(env);
      ARMMMUIdx mmu_idx;
@@ -XXX,XX +XXX,XX @@ static int vae2_tlbbits(CPUARMState *env, uint64_t addr)
      return tlbbits_for_regime(env, mmu_idx, addr);
  }
 -static void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                      uint64_t value)
 +void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                               uint64_t value)
  {
      CPUState *cs = env_cpu(env);
      int mask = vae1_tlbmask(env);
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
  }
 -static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = vae1_tlbmask(env);
 -
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 -    } else {
 -        tlb_flush_by_mmuidx(cs, mask);
 -    }
 -}
 -
  static int e2_tlbmask(CPUARMState *env)
  {
      return (ARMMMUIdxBit_E20_0 |
@@ -XXX,XX +XXX,XX @@ static int e2_tlbmask(CPUARMState *env)
              ARMMMUIdxBit_E2);
  }
 -static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                  uint64_t value)
-+static int alle1_tlbmask(CPUARMState *env)
+-{
- {
+-    CPUState *cs = env_cpu(env);
--    /* Note that the 'ALL' scope must invalidate both stage 1 and
+-    int mask = alle1_tlbmask(env);
-+    /*
+-
-+     * Note that the 'ALL' scope must invalidate both stage 1 and
+-    tlb_flush_by_mmuidx(cs, mask);
-      * stage 2 translations, whereas most other scopes only invalidate
+-}
-      * stage 1 translations.
+-
-      */
+ static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
--    ARMCPU *cpu = env_archcpu(env);
+                                   uint64_t value)
--    CPUState *cs = CPU(cpu);
+ {
--
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
-     if (arm_is_secure_below_el3(env)) {
+     tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
--        tlb_flush_by_mmuidx(cs,
+ }
--                            ARMMMUIdxBit_S1SE1 |
--                            ARMMMUIdxBit_S1SE0);
+-static void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-+        return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
+-                                    uint64_t value)
-+    } else if (arm_feature(env, ARM_FEATURE_EL2)) {
++void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-+        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0 | ARMMMUIdxBit_S2NS;
++                             uint64_t value)
-     } else {
+ {
--        if (arm_feature(env, ARM_FEATURE_EL2)) {
+     CPUState *cs = env_cpu(env);
--            tlb_flush_by_mmuidx(cs,
+     int mask = alle1_tlbmask(env);
--                                ARMMMUIdxBit_S12NSE1 |
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
--                                ARMMMUIdxBit_S12NSE0 |
+     tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
--                                ARMMMUIdxBit_S2NS);
+ }
--        } else {
--            tlb_flush_by_mmuidx(cs,
+-static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
--                                ARMMMUIdxBit_S12NSE1 |
+-                                   uint64_t value)
--                                ARMMMUIdxBit_S12NSE0);
++void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
--        }
++                            uint64_t value)
-+        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
+ {
-     }
+     CPUState *cs = env_cpu(env);
- }
+     int mask = vae1_tlbmask(env);
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
  }
 -static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                 uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA, EL1&0 (AArch64 version).
 -     * Currently handles all of VAE1, VAAE1, VAALE1 and VALE1,
 -     * since we don't support flush-for-specific-ASID-only or
 -     * flush-last-level-only.
 -     */
 -    CPUState *cs = env_cpu(env);
 -    int mask = vae1_tlbmask(env);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -    int bits = vae1_tlbbits(env, pageaddr);
 -
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 -    } else {
 -        tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
 -    }
 -}
 -
  static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                                    ARMMMUIdxBit_E3, bits);
  }
 -static int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
 +int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
  {
      /*
       * The MSB of value is the NS field, which only applies if SEL2
@@ -XXX,XX +XXX,XX @@ static int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
              : ARMMMUIdxBit_Stage2);
  }
 -static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = ipas2e1_tlbmask(env, value);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -
 -    if (tlb_force_broadcast(env)) {
 -        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
 -    } else {
 -        tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
 -    }
 -}
 -
 -static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                      uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = ipas2e1_tlbmask(env, value);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -
 -    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
 -}
 -
  #ifdef TARGET_AARCH64
  typedef struct {
      uint64_t base;
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v8_cp_reginfo[] = {
        .opc0 = 1, .opc1 = 0, .crn = 7, .crm = 14, .opc2 = 2,
        .fgt = FGT_DCCISW,
        .access = PL1_W, .accessfn = access_tsw, .type = ARM_CP_NOP },
 -    /* TLBI operations */
 -    { .name = "TLBI_VMALLE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
 -      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVMALLE1IS,
 -      .writefn = tlbi_aa64_vmalle1is_write },
 -    { .name = "TLBI_VAE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
 -      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAE1IS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_ASIDE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
 -      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIASIDE1IS,
 -      .writefn = tlbi_aa64_vmalle1is_write },
 -    { .name = "TLBI_VAAE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
 -      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAAE1IS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_VALE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
 -      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVALE1IS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_VAALE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
 -      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAALE1IS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_VMALLE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVMALLE1,
 -      .writefn = tlbi_aa64_vmalle1_write },
 -    { .name = "TLBI_VAE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAE1,
 -      .writefn = tlbi_aa64_vae1_write },
 -    { .name = "TLBI_ASIDE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIASIDE1,
 -      .writefn = tlbi_aa64_vmalle1_write },
 -    { .name = "TLBI_VAAE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAAE1,
 -      .writefn = tlbi_aa64_vae1_write },
 -    { .name = "TLBI_VALE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVALE1,
 -      .writefn = tlbi_aa64_vae1_write },
 -    { .name = "TLBI_VAALE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAALE1,
 -      .writefn = tlbi_aa64_vae1_write },
 -    { .name = "TLBI_IPAS2E1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ipas2e1is_write },
 -    { .name = "TLBI_IPAS2LE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ipas2e1is_write },
 -    { .name = "TLBI_ALLE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 4,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle1is_write },
 -    { .name = "TLBI_VMALLS12E1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 6,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle1is_write },
 -    { .name = "TLBI_IPAS2E1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ipas2e1_write },
 -    { .name = "TLBI_IPAS2LE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ipas2e1_write },
 -    { .name = "TLBI_ALLE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 4,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle1_write },
 -    { .name = "TLBI_VMALLS12E1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 6,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle1is_write },
  #ifndef CONFIG_USER_ONLY
      /* 64 bit address translation operations */
      { .name = "AT_S1E1R", .state = ARM_CP_STATE_AA64,
 diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/tlb-insns.c
 +++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
  }
 +static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = vae1_tlbmask(env);
 +
 +    if (tlb_force_broadcast(env)) {
 +        tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 +    } else {
 +        tlb_flush_by_mmuidx(cs, mask);
 +    }
 +}
 +
 +static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = alle1_tlbmask(env);
 +
 +    tlb_flush_by_mmuidx(cs, mask);
 +}
 +
- static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
++static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                   uint64_t value)
++                                 uint64_t value)
- {
++{
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
++    /*
- static void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++     * Invalidate by VA, EL1&0 (AArch64 version).
-                                     uint64_t value)
++     * Currently handles all of VAE1, VAAE1, VAALE1 and VALE1,
- {
++     * since we don't support flush-for-specific-ASID-only or
--    /* Note that the 'ALL' scope must invalidate both stage 1 and
++     * flush-last-level-only.
--     * stage 2 translations, whereas most other scopes only invalidate
++     */
 -     * stage 1 translations.
 -     */
      CPUState *cs = env_cpu(env);
 -    bool sec = arm_is_secure_below_el3(env);
 -    bool has_el2 = arm_feature(env, ARM_FEATURE_EL2);
 +    int mask = alle1_tlbmask(env);
 -    if (sec) {
 -        tlb_flush_by_mmuidx_all_cpus_synced(cs,
 -                                            ARMMMUIdxBit_S1SE1 |
 -                                            ARMMMUIdxBit_S1SE0);
 -    } else if (has_el2) {
 -        tlb_flush_by_mmuidx_all_cpus_synced(cs,
 -                                            ARMMMUIdxBit_S12NSE1 |
 -                                            ARMMMUIdxBit_S12NSE0 |
 -                                            ARMMMUIdxBit_S2NS);
 -    } else {
 -          tlb_flush_by_mmuidx_all_cpus_synced(cs,
 -                                              ARMMMUIdxBit_S12NSE1 |
 -                                              ARMMMUIdxBit_S12NSE0);
 -    }
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
  }
  static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
  {
 -    ARMCPU *cpu = env_archcpu(env);
 -    CPUState *cs = CPU(cpu);
 -    bool sec = arm_is_secure_below_el3(env);
 +    CPUState *cs = env_cpu(env);
 +    int mask = vae1_tlbmask(env);
-     uint64_t pageaddr = sextract64(value << 12, 0, 56);
++    uint64_t pageaddr = sextract64(value << 12, 0, 56);
++    int bits = vae1_tlbbits(env, pageaddr);
--    if (sec) {
++
--        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
++    if (tlb_force_broadcast(env)) {
--                                                 ARMMMUIdxBit_S1SE1 |
++        tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
--                                                 ARMMMUIdxBit_S1SE0);
++    } else {
--    } else {
++        tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
--        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
++    }
--                                                 ARMMMUIdxBit_S12NSE1 |
++}
--                                                 ARMMMUIdxBit_S12NSE0);
++
--    }
++static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = ipas2e1_tlbmask(env, value);
 +    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 +
 +    if (tlb_force_broadcast(env)) {
 +        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
 +    } else {
 +        tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
 +    }
 +}
 +
 +static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                      uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = ipas2e1_tlbmask(env, value);
 +    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 +
 +    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
- }
++}
++
- static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ static const ARMCPRegInfo tlbi_not_v7_cp_reginfo[] = {
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     /*
-      * since we don't support flush-for-specific-ASID-only or
+      * MMU TLB control. Note that the wildcarding means we cover not just
-      * flush-last-level-only.
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_v8_cp_reginfo[] = {
-      */
+       .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
--    ARMCPU *cpu = env_archcpu(env);
+       .type = ARM_CP_NO_RAW, .access = PL2_W,
--    CPUState *cs = CPU(cpu);
+       .writefn = tlbiipas2is_hyp_write },
-+    CPUState *cs = env_cpu(env);
++    /* AArch64 TLBI operations */
-+    int mask = vae1_tlbmask(env);
++    { .name = "TLBI_VMALLE1IS", .state = ARM_CP_STATE_AA64,
-     uint64_t pageaddr = sextract64(value << 12, 0, 56);
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
++      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-     if (tlb_force_broadcast(env)) {
++      .fgt = FGT_TLBIVMALLE1IS,
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
++      .writefn = tlbi_aa64_vmalle1is_write },
-         return;
++    { .name = "TLBI_VAE1IS", .state = ARM_CP_STATE_AA64,
-     }
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
++      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
--    if (arm_is_secure_below_el3(env)) {
++      .fgt = FGT_TLBIVAE1IS,
--        tlb_flush_page_by_mmuidx(cs, pageaddr,
++      .writefn = tlbi_aa64_vae1is_write },
--                                 ARMMMUIdxBit_S1SE1 |
++    { .name = "TLBI_ASIDE1IS", .state = ARM_CP_STATE_AA64,
--                                 ARMMMUIdxBit_S1SE0);
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
--    } else {
++      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
--        tlb_flush_page_by_mmuidx(cs, pageaddr,
++      .fgt = FGT_TLBIASIDE1IS,
--                                 ARMMMUIdxBit_S12NSE1 |
++      .writefn = tlbi_aa64_vmalle1is_write },
--                                 ARMMMUIdxBit_S12NSE0);
++    { .name = "TLBI_VAAE1IS", .state = ARM_CP_STATE_AA64,
--    }
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
-+    tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
++      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
- }
++      .fgt = FGT_TLBIVAAE1IS,
++      .writefn = tlbi_aa64_vae1is_write },
- static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++    { .name = "TLBI_VALE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
 +      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVALE1IS,
 +      .writefn = tlbi_aa64_vae1is_write },
 +    { .name = "TLBI_VAALE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
 +      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVAALE1IS,
 +      .writefn = tlbi_aa64_vae1is_write },
 +    { .name = "TLBI_VMALLE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVMALLE1,
 +      .writefn = tlbi_aa64_vmalle1_write },
 +    { .name = "TLBI_VAE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVAE1,
 +      .writefn = tlbi_aa64_vae1_write },
 +    { .name = "TLBI_ASIDE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIASIDE1,
 +      .writefn = tlbi_aa64_vmalle1_write },
 +    { .name = "TLBI_VAAE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVAAE1,
 +      .writefn = tlbi_aa64_vae1_write },
 +    { .name = "TLBI_VALE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVALE1,
 +      .writefn = tlbi_aa64_vae1_write },
 +    { .name = "TLBI_VAALE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVAALE1,
 +      .writefn = tlbi_aa64_vae1_write },
 +    { .name = "TLBI_IPAS2E1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ipas2e1is_write },
 +    { .name = "TLBI_IPAS2LE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ipas2e1is_write },
 +    { .name = "TLBI_ALLE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 4,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle1is_write },
 +    { .name = "TLBI_VMALLS12E1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 6,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle1is_write },
 +    { .name = "TLBI_IPAS2E1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ipas2e1_write },
 +    { .name = "TLBI_IPAS2LE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ipas2e1_write },
 +    { .name = "TLBI_ALLE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 4,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle1_write },
 +    { .name = "TLBI_VMALLS12E1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 6,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle1is_write },
  };
  static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
 --
-.20.1
+.34.1

-New patch
+[PULL 79/85] target/arm: Move the AArch64 EL2 TLBI insns
+Move the AArch64 EL2 TLBI insn definitions that were
+in el2_cp_reginfo[] across to tlb-insns.c.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-5-peter.maydell@linaro.org
+---
+ target/arm/cpregs.h        |  7 +++++
+ target/arm/helper.c        | 61 ++++----------------------------------
+ target/arm/tcg/tlb-insns.c | 49 ++++++++++++++++++++++++++++++
+files changed, 62 insertions(+), 55 deletions(-)
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/cpregs.h
++++ b/target/arm/cpregs.h
+@@ -XXX,XX +XXX,XX @@ bool tlb_force_broadcast(CPUARMState *env);
+ int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
+                        uint64_t addr);
+ int vae1_tlbbits(CPUARMState *env, uint64_t addr);
++int vae2_tlbbits(CPUARMState *env, uint64_t addr);
+ int vae1_tlbmask(CPUARMState *env);
++int vae2_tlbmask(CPUARMState *env);
+ int ipas2e1_tlbmask(CPUARMState *env, int64_t value);
++int e2_tlbmask(CPUARMState *env);
+ void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                uint64_t value);
+ void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                              uint64_t value);
+ void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value);
++void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                             uint64_t value);
++void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                            uint64_t value);
+ #endif /* TARGET_ARM_CPREGS_H */
+diff --git a/target/arm/helper.c b/target/arm/helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper.c
++++ b/target/arm/helper.c
+@@ -XXX,XX +XXX,XX @@ int vae1_tlbmask(CPUARMState *env)
+     return mask;
+ }
+-static int vae2_tlbmask(CPUARMState *env)
++int vae2_tlbmask(CPUARMState *env)
+ {
+     uint64_t hcr = arm_hcr_el2_eff(env);
+     uint16_t mask;
+@@ -XXX,XX +XXX,XX @@ int vae1_tlbbits(CPUARMState *env, uint64_t addr)
+     return tlbbits_for_regime(env, mmu_idx, addr);
+ }
+-static int vae2_tlbbits(CPUARMState *env, uint64_t addr)
++int vae2_tlbbits(CPUARMState *env, uint64_t addr)
+ {
+     uint64_t hcr = arm_hcr_el2_eff(env);
+     ARMMMUIdx mmu_idx;
+@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+ }
+-static int e2_tlbmask(CPUARMState *env)
++int e2_tlbmask(CPUARMState *env)
+ {
+     return (ARMMMUIdxBit_E20_0 |
+             ARMMMUIdxBit_E20_2 |
+@@ -XXX,XX +XXX,XX @@ static int e2_tlbmask(CPUARMState *env)
+             ARMMMUIdxBit_E2);
+ }
+-static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                                  uint64_t value)
+-{
+-    CPUState *cs = env_cpu(env);
+-    int mask = e2_tlbmask(env);
+-
+-    tlb_flush_by_mmuidx(cs, mask);
+-}
+-
+ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                   uint64_t value)
+ {
+@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+ }
+-static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                                    uint64_t value)
++void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                             uint64_t value)
+ {
+     CPUState *cs = env_cpu(env);
+     int mask = e2_tlbmask(env);
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
+ }
+-static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                                 uint64_t value)
+-{
+-    /*
+-     * Invalidate by VA, EL2
+-     * Currently handles both VAE2 and VALE2, since we don't support
+-     * flush-last-level-only.
+-     */
+-    CPUState *cs = env_cpu(env);
+-    int mask = vae2_tlbmask(env);
+-    uint64_t pageaddr = sextract64(value << 12, 0, 56);
+-    int bits = vae2_tlbbits(env, pageaddr);
+-
+-    tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
+-}
+-
+ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  uint64_t value)
+ {
+@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
+ }
+-static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+ {
+     CPUState *cs = env_cpu(env);
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
+     { .name = "HTTBR", .cp = 15, .opc1 = 4, .crm = 2,
+       .access = PL2_RW, .type = ARM_CP_64BIT | ARM_CP_ALIAS,
+       .fieldoffset = offsetof(CPUARMState, cp15.ttbr0_el[2]) },
+-    { .name = "TLBI_ALLE2", .state = ARM_CP_STATE_AA64,
+-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+-      .writefn = tlbi_aa64_alle2_write },
+-    { .name = "TLBI_VAE2", .state = ARM_CP_STATE_AA64,
+-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+-      .writefn = tlbi_aa64_vae2_write },
+-    { .name = "TLBI_VALE2", .state = ARM_CP_STATE_AA64,
+-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+-      .writefn = tlbi_aa64_vae2_write },
+-    { .name = "TLBI_ALLE2IS", .state = ARM_CP_STATE_AA64,
+-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+-      .writefn = tlbi_aa64_alle2is_write },
+-    { .name = "TLBI_VAE2IS", .state = ARM_CP_STATE_AA64,
+-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+-      .writefn = tlbi_aa64_vae2is_write },
+-    { .name = "TLBI_VALE2IS", .state = ARM_CP_STATE_AA64,
+-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
+-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+-      .writefn = tlbi_aa64_vae2is_write },
+ #ifndef CONFIG_USER_ONLY
+     /*
+      * Unlike the other EL2-related AT operations, these must
+diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/tlb-insns.c
++++ b/target/arm/tcg/tlb-insns.c
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     tlb_flush_by_mmuidx(cs, mask);
+ }
++static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                                  uint64_t value)
++{
++    CPUState *cs = env_cpu(env);
++    int mask = e2_tlbmask(env);
++
++    tlb_flush_by_mmuidx(cs, mask);
++}
++
++static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                                 uint64_t value)
++{
++    /*
++     * Invalidate by VA, EL2
++     * Currently handles both VAE2 and VALE2, since we don't support
++     * flush-last-level-only.
++     */
++    CPUState *cs = env_cpu(env);
++    int mask = vae2_tlbmask(env);
++    uint64_t pageaddr = sextract64(value << 12, 0, 56);
++    int bits = vae2_tlbbits(env, pageaddr);
++
++    tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
++}
++
+ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  uint64_t value)
+ {
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
+     { .name = "TLBIMVAHIS", .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
+       .type = ARM_CP_NO_RAW, .access = PL2_W,
+       .writefn = tlbimva_hyp_is_write },
++    { .name = "TLBI_ALLE2", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .writefn = tlbi_aa64_alle2_write },
++    { .name = "TLBI_VAE2", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .writefn = tlbi_aa64_vae2_write },
++    { .name = "TLBI_VALE2", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .writefn = tlbi_aa64_vae2_write },
++    { .name = "TLBI_ALLE2IS", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .writefn = tlbi_aa64_alle2is_write },
++    { .name = "TLBI_VAE2IS", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .writefn = tlbi_aa64_vae2is_write },
++    { .name = "TLBI_VALE2IS", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
++      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
++      .writefn = tlbi_aa64_vae2is_write },
+ };
+ void define_tlb_insn_regs(ARMCPU *cpu)
+--
+.34.1

-[PULL 04/48] target/arm: Add CONTEXTIDR_EL2
+[PULL 80/85] target/arm: Move AArch64 EL3 TLBI insns
-From: Richard Henderson <richard.henderson@linaro.org>
+Move the AArch64 EL3 TLBI insns from el3_cp_reginfo[] across
 to tlb-insns.c.
-Not all of the breakpoint types are supported, but those that
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-only examine contextidr are extended to support the new register.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20241210160452.2427965-6-peter.maydell@linaro.org
 ---
  target/arm/cpregs.h        |  4 +++
  target/arm/helper.c        | 56 +++-----------------------------------
  target/arm/tcg/tlb-insns.c | 54 ++++++++++++++++++++++++++++++++++++
 files changed, 62 insertions(+), 52 deletions(-)
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200206105448.4726-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/debug_helper.c | 50 +++++++++++++++++++++++++++++----------
  target/arm/helper.c       | 12 ++++++++++
 files changed, 50 insertions(+), 12 deletions(-)
 diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/debug_helper.c
+--- a/target/arm/cpregs.h
-+++ b/target/arm/debug_helper.c
++++ b/target/arm/cpregs.h
-@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
+@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-     int ctx_cmps = extract32(cpu->dbgdidr, 20, 4);
+                              uint64_t value);
-     int bt;
+ void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-     uint32_t contextidr;
+                             uint64_t value);
-+    uint64_t hcr_el2;
++void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                            uint64_t value);
-     /*
++void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-      * Links to unimplemented or non-context aware breakpoints are
++                             uint64_t value);
-@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
-     }
+ #endif /* TARGET_ARM_CPREGS_H */
      bt = extract64(bcr, 20, 4);
 -
 -    /*
 -     * We match the whole register even if this is AArch32 using the
 -     * short descriptor format (in which case it holds both PROCID and ASID),
 -     * since we don't implement the optional v7 context ID masking.
 -     */
 -    contextidr = extract64(env->cp15.contextidr_el[1], 0, 32);
 +    hcr_el2 = arm_hcr_el2_eff(env);
      switch (bt) {
      case 3: /* linked context ID match */
 -        if (arm_current_el(env) > 1) {
 -            /* Context matches never fire in EL2 or (AArch64) EL3 */
 +        switch (arm_current_el(env)) {
 +        default:
 +            /* Context matches never fire in AArch64 EL3 */
              return false;
 +        case 2:
 +            if (!(hcr_el2 & HCR_E2H)) {
 +                /* Context matches never fire in EL2 without E2H enabled. */
 +                return false;
 +            }
 +            contextidr = env->cp15.contextidr_el[2];
 +            break;
 +        case 1:
 +            contextidr = env->cp15.contextidr_el[1];
 +            break;
 +        case 0:
 +            if ((hcr_el2 & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 +                contextidr = env->cp15.contextidr_el[2];
 +            } else {
 +                contextidr = env->cp15.contextidr_el[1];
 +            }
 +            break;
          }
 -        return (contextidr == extract64(env->cp15.dbgbvr[lbn], 0, 32));
 -    case 5: /* linked address mismatch (reserved in AArch64) */
 +        break;
 +
 +    case 7:  /* linked contextidr_el1 match */
 +        contextidr = env->cp15.contextidr_el[1];
 +        break;
 +    case 13: /* linked contextidr_el2 match */
 +        contextidr = env->cp15.contextidr_el[2];
 +        break;
 +
      case 9: /* linked VMID match (reserved if no EL2) */
      case 11: /* linked context ID and VMID match (reserved if no EL2) */
 +    case 15: /* linked full context ID match */
      default:
          /*
           * Links to Unlinked context breakpoints must generate no
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
          return false;
      }
 -    return false;
 +    /*
 +     * We match the whole register even if this is AArch32 using the
 +     * short descriptor format (in which case it holds both PROCID and ASID),
 +     * since we don't implement the optional v7 context ID masking.
 +     */
 +    return contextidr == (uint32_t)env->cp15.dbgbvr[lbn];
  }
  static bool bp_wp_matches(ARMCPU *cpu, int n, bool is_wp)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo jazelle_regs[] = {
+@@ -XXX,XX +XXX,XX @@ int e2_tlbmask(CPUARMState *env)
-     REGINFO_SENTINEL
+             ARMMMUIdxBit_E2);
  }
 -static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                  uint64_t value)
 -{
 -    ARMCPU *cpu = env_archcpu(env);
 -    CPUState *cs = CPU(cpu);
 -
 -    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
 -}
 -
  void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                               uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
  }
 -static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 +void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             uint64_t value)
  {
      CPUState *cs = env_cpu(env);
      tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
  }
 -static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                 uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA, EL3
 -     * Currently handles both VAE3 and VALE3, since we don't support
 -     * flush-last-level-only.
 -     */
 -    ARMCPU *cpu = env_archcpu(env);
 -    CPUState *cs = CPU(cpu);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -
 -    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
 -}
 -
  void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                              uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
  }
 -static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                   uint64_t value)
 +void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                            uint64_t value)
  {
      CPUState *cs = env_cpu(env);
      uint64_t pageaddr = sextract64(value << 12, 0, 56);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_cp_reginfo[] = {
        .opc0 = 3, .opc1 = 6, .crn = 5, .crm = 1, .opc2 = 1,
        .access = PL3_RW, .type = ARM_CP_CONST,
        .resetvalue = 0 },
 -    { .name = "TLBI_ALLE3IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 0,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle3is_write },
 -    { .name = "TLBI_VAE3IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 1,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae3is_write },
 -    { .name = "TLBI_VALE3IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 5,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae3is_write },
 -    { .name = "TLBI_ALLE3", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 0,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle3_write },
 -    { .name = "TLBI_VAE3", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 1,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae3_write },
 -    { .name = "TLBI_VALE3", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 5,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae3_write },
  };
-+static const ARMCPRegInfo vhe_reginfo[] = {
+ #ifndef CONFIG_USER_ONLY
-+    { .name = "CONTEXTIDR_EL2", .state = ARM_CP_STATE_AA64,
+diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
-+      .opc0 = 3, .opc1 = 4, .crn = 13, .crm = 0, .opc2 = 1,
+index XXXXXXX..XXXXXXX 100644
-+      .access = PL2_RW,
+--- a/target/arm/tcg/tlb-insns.c
-+      .fieldoffset = offsetof(CPUARMState, cp15.contextidr_el[2]) },
++++ b/target/arm/tcg/tlb-insns.c
-+    REGINFO_SENTINEL
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx(cs, mask);
  }
 +static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +    CPUState *cs = CPU(cpu);
 +
 +    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
 +}
 +
  static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
  }
 +static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                 uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA, EL3
 +     * Currently handles both VAE3 and VALE3, since we don't support
 +     * flush-last-level-only.
 +     */
 +    ARMCPU *cpu = env_archcpu(env);
 +    CPUState *cs = CPU(cpu);
 +    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 +
 +    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
 +}
 +
  static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
        .writefn = tlbi_aa64_vae2is_write },
  };
 +static const ARMCPRegInfo tlbi_el3_cp_reginfo[] = {
 +    { .name = "TLBI_ALLE3IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 0,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle3is_write },
 +    { .name = "TLBI_VAE3IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 1,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_vae3is_write },
 +    { .name = "TLBI_VALE3IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 5,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_vae3is_write },
 +    { .name = "TLBI_ALLE3", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 0,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle3_write },
 +    { .name = "TLBI_VAE3", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 1,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_vae3_write },
 +    { .name = "TLBI_VALE3", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 5,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_vae3_write },
 +};
 +
- void register_cp_regs_for_features(ARMCPU *cpu)
+ void define_tlb_insn_regs(ARMCPU *cpu)
  {
-     /* Register all the coprocessor registers based on feature bits */
+     CPUARMState *env = &cpu->env;
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
+@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
-         define_arm_cp_regs(cpu, lor_reginfo);
+             && arm_feature(env, ARM_FEATURE_V8))) {
          define_arm_cp_regs(cpu, tlbi_el2_cp_reginfo);
      }
++    if (arm_feature(env, ARM_FEATURE_EL3)) {
-+    if (arm_feature(env, ARM_FEATURE_EL2) && cpu_isar_feature(aa64_vh, cpu)) {
++        define_arm_cp_regs(cpu, tlbi_el3_cp_reginfo);
 +        define_arm_cp_regs(cpu, vhe_reginfo);
 +    }
-+
+ }
      if (cpu_isar_feature(aa64_sve, cpu)) {
          define_one_arm_cp_reg(cpu, &zcr_el1_reginfo);
          if (arm_feature(env, ARM_FEATURE_EL2)) {
 --
-.20.1
+.34.1

-[PULL 24/48] target/arm: Update aa64_zva_access for EL2
+[PULL 81/85] target/arm: Move TLBI range insns
-From: Richard Henderson <richard.henderson@linaro.org>
+Move the TLBI invalidate-range insns across to tlb-insns.c.
-The comment that we don't support EL2 is somewhat out of date.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Update to include checks against HCR_EL2.TDZ.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20241210160452.2427965-7-peter.maydell@linaro.org
 ---
  target/arm/cpregs.h        |   2 +
  target/arm/helper.c        | 330 +------------------------------------
  target/arm/tcg/tlb-insns.c | 329 ++++++++++++++++++++++++++++++++++++
 files changed, 333 insertions(+), 328 deletions(-)
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+index XXXXXXX..XXXXXXX 100644
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+--- a/target/arm/cpregs.h
-Message-id: 20200206105448.4726-24-richard.henderson@linaro.org
++++ b/target/arm/cpregs.h
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+@@ -XXX,XX +XXX,XX @@ CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
----
+                            bool isread);
- target/arm/helper.c | 26 +++++++++++++++++++++-----
+ CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
-file changed, 21 insertions(+), 5 deletions(-)
+                              bool isread);
++CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             bool isread);
  bool tlb_force_broadcast(CPUARMState *env);
  int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
                         uint64_t addr);
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
  #ifdef TARGET_AARCH64
  /* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBOS. */
 -static CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                    bool isread)
 +CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
 +                             bool isread)
  {
      if (arm_current_el(env) == 1 &&
          (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBOS))) {
@@ -XXX,XX +XXX,XX @@ int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
              : ARMMMUIdxBit_Stage2);
  }
 -#ifdef TARGET_AARCH64
 -typedef struct {
 -    uint64_t base;
 -    uint64_t length;
 -} TLBIRange;
 -
 -static ARMGranuleSize tlbi_range_tg_to_gran_size(int tg)
 -{
 -    /*
 -     * Note that the TLBI range TG field encoding differs from both
 -     * TG0 and TG1 encodings.
 -     */
 -    switch (tg) {
 -    case 1:
 -        return Gran4K;
 -    case 2:
 -        return Gran16K;
 -    case 3:
 -        return Gran64K;
 -    default:
 -        return GranInvalid;
 -    }
 -}
 -
 -static TLBIRange tlbi_aa64_get_range(CPUARMState *env, ARMMMUIdx mmuidx,
 -                                     uint64_t value)
 -{
 -    unsigned int page_size_granule, page_shift, num, scale, exponent;
 -    /* Extract one bit to represent the va selector in use. */
 -    uint64_t select = sextract64(value, 36, 1);
 -    ARMVAParameters param = aa64_va_parameters(env, select, mmuidx, true, false);
 -    TLBIRange ret = { };
 -    ARMGranuleSize gran;
 -
 -    page_size_granule = extract64(value, 46, 2);
 -    gran = tlbi_range_tg_to_gran_size(page_size_granule);
 -
 -    /* The granule encoded in value must match the granule in use. */
 -    if (gran != param.gran) {
 -        qemu_log_mask(LOG_GUEST_ERROR, "Invalid tlbi page size granule %d\n",
 -                      page_size_granule);
 -        return ret;
 -    }
 -
 -    page_shift = arm_granule_bits(gran);
 -    num = extract64(value, 39, 5);
 -    scale = extract64(value, 44, 2);
 -    exponent = (5 * scale) + 1;
 -
 -    ret.length = (num + 1) << (exponent + page_shift);
 -
 -    if (param.select) {
 -        ret.base = sextract64(value, 0, 37);
 -    } else {
 -        ret.base = extract64(value, 0, 37);
 -    }
 -    if (param.ds) {
 -        /*
 -         * With DS=1, BaseADDR is always shifted 16 so that it is able
 -         * to address all 52 va bits.  The input address is perforce
 -         * aligned on a 64k boundary regardless of translation granule.
 -         */
 -        page_shift = 16;
 -    }
 -    ret.base <<= page_shift;
 -
 -    return ret;
 -}
 -
 -static void do_rvae_write(CPUARMState *env, uint64_t value,
 -                          int idxmap, bool synced)
 -{
 -    ARMMMUIdx one_idx = ARM_MMU_IDX_A | ctz32(idxmap);
 -    TLBIRange range;
 -    int bits;
 -
 -    range = tlbi_aa64_get_range(env, one_idx, value);
 -    bits = tlbbits_for_regime(env, one_idx, range.base);
 -
 -    if (synced) {
 -        tlb_flush_range_by_mmuidx_all_cpus_synced(env_cpu(env),
 -                                                  range.base,
 -                                                  range.length,
 -                                                  idxmap,
 -                                                  bits);
 -    } else {
 -        tlb_flush_range_by_mmuidx(env_cpu(env), range.base,
 -                                  range.length, idxmap, bits);
 -    }
 -}
 -
 -static void tlbi_aa64_rvae1_write(CPUARMState *env,
 -                                  const ARMCPRegInfo *ri,
 -                                  uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA range, EL1&0.
 -     * Currently handles all of RVAE1, RVAAE1, RVAALE1 and RVALE1,
 -     * since we don't support flush-for-specific-ASID-only or
 -     * flush-last-level-only.
 -     */
 -
 -    do_rvae_write(env, value, vae1_tlbmask(env),
 -                  tlb_force_broadcast(env));
 -}
 -
 -static void tlbi_aa64_rvae1is_write(CPUARMState *env,
 -                                    const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA range, Inner/Outer Shareable EL1&0.
 -     * Currently handles all of RVAE1IS, RVAE1OS, RVAAE1IS, RVAAE1OS,
 -     * RVAALE1IS, RVAALE1OS, RVALE1IS and RVALE1OS, since we don't support
 -     * flush-for-specific-ASID-only, flush-last-level-only or inner/outer
 -     * shareable specific flushes.
 -     */
 -
 -    do_rvae_write(env, value, vae1_tlbmask(env), true);
 -}
 -
 -static void tlbi_aa64_rvae2_write(CPUARMState *env,
 -                                  const ARMCPRegInfo *ri,
 -                                  uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA range, EL2.
 -     * Currently handles all of RVAE2 and RVALE2,
 -     * since we don't support flush-for-specific-ASID-only or
 -     * flush-last-level-only.
 -     */
 -
 -    do_rvae_write(env, value, vae2_tlbmask(env),
 -                  tlb_force_broadcast(env));
 -
 -
 -}
 -
 -static void tlbi_aa64_rvae2is_write(CPUARMState *env,
 -                                    const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA range, Inner/Outer Shareable, EL2.
 -     * Currently handles all of RVAE2IS, RVAE2OS, RVALE2IS and RVALE2OS,
 -     * since we don't support flush-for-specific-ASID-only,
 -     * flush-last-level-only or inner/outer shareable specific flushes.
 -     */
 -
 -    do_rvae_write(env, value, vae2_tlbmask(env), true);
 -
 -}
 -
 -static void tlbi_aa64_rvae3_write(CPUARMState *env,
 -                                  const ARMCPRegInfo *ri,
 -                                  uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA range, EL3.
 -     * Currently handles all of RVAE3 and RVALE3,
 -     * since we don't support flush-for-specific-ASID-only or
 -     * flush-last-level-only.
 -     */
 -
 -    do_rvae_write(env, value, ARMMMUIdxBit_E3, tlb_force_broadcast(env));
 -}
 -
 -static void tlbi_aa64_rvae3is_write(CPUARMState *env,
 -                                    const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 -{
 -    /*
 -     * Invalidate by VA range, EL3, Inner/Outer Shareable.
 -     * Currently handles all of RVAE3IS, RVAE3OS, RVALE3IS and RVALE3OS,
 -     * since we don't support flush-for-specific-ASID-only,
 -     * flush-last-level-only or inner/outer specific flushes.
 -     */
 -
 -    do_rvae_write(env, value, ARMMMUIdxBit_E3, true);
 -}
 -
 -static void tlbi_aa64_ripas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                     uint64_t value)
 -{
 -    do_rvae_write(env, value, ipas2e1_tlbmask(env, value),
 -                  tlb_force_broadcast(env));
 -}
 -
 -static void tlbi_aa64_ripas2e1is_write(CPUARMState *env,
 -                                       const ARMCPRegInfo *ri,
 -                                       uint64_t value)
 -{
 -    do_rvae_write(env, value, ipas2e1_tlbmask(env, value), true);
 -}
 -#endif
 -
  static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                        bool isread)
  {
--    /* We don't implement EL2, so the only control on DC ZVA is the
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo pauth_reginfo[] = {
--     * bit in the SCTLR which can prohibit access for EL0.
+       .fieldoffset = offsetof(CPUARMState, keys.apib.hi) },
--     */
+ };
--    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_DZE)) {
--        return CP_ACCESS_TRAP;
+-static const ARMCPRegInfo tlbirange_reginfo[] = {
-+    int cur_el = arm_current_el(env);
+-    { .name = "TLBI_RVAE1IS", .state = ARM_CP_STATE_AA64,
-+
+-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 1,
-+    if (cur_el < 2) {
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-+        uint64_t hcr = arm_hcr_el2_eff(env);
+-      .fgt = FGT_TLBIRVAE1IS,
-+
+-      .writefn = tlbi_aa64_rvae1is_write },
-+        if (cur_el == 0) {
+-    { .name = "TLBI_RVAAE1IS", .state = ARM_CP_STATE_AA64,
-+            if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 3,
-+                if (!(env->cp15.sctlr_el[2] & SCTLR_DZE)) {
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-+                    return CP_ACCESS_TRAP_EL2;
+-      .fgt = FGT_TLBIRVAAE1IS,
-+                }
+-      .writefn = tlbi_aa64_rvae1is_write },
-+            } else {
+-   { .name = "TLBI_RVALE1IS", .state = ARM_CP_STATE_AA64,
-+                if (!(env->cp15.sctlr_el[1] & SCTLR_DZE)) {
+-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 5,
-+                    return CP_ACCESS_TRAP;
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-+                }
+-      .fgt = FGT_TLBIRVALE1IS,
-+                if (hcr & HCR_TDZ) {
+-      .writefn = tlbi_aa64_rvae1is_write },
-+                    return CP_ACCESS_TRAP_EL2;
+-    { .name = "TLBI_RVAALE1IS", .state = ARM_CP_STATE_AA64,
-+                }
+-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 7,
-+            }
+-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-+        } else if (hcr & HCR_TDZ) {
+-      .fgt = FGT_TLBIRVAALE1IS,
-+            return CP_ACCESS_TRAP_EL2;
+-      .writefn = tlbi_aa64_rvae1is_write },
-+        }
+-    { .name = "TLBI_RVAE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVAE1OS,
 -      .writefn = tlbi_aa64_rvae1is_write },
 -    { .name = "TLBI_RVAAE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 3,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVAAE1OS,
 -      .writefn = tlbi_aa64_rvae1is_write },
 -   { .name = "TLBI_RVALE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 5,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVALE1OS,
 -      .writefn = tlbi_aa64_rvae1is_write },
 -    { .name = "TLBI_RVAALE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 7,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVAALE1OS,
 -      .writefn = tlbi_aa64_rvae1is_write },
 -    { .name = "TLBI_RVAE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVAE1,
 -      .writefn = tlbi_aa64_rvae1_write },
 -    { .name = "TLBI_RVAAE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 3,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVAAE1,
 -      .writefn = tlbi_aa64_rvae1_write },
 -   { .name = "TLBI_RVALE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 5,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVALE1,
 -      .writefn = tlbi_aa64_rvae1_write },
 -    { .name = "TLBI_RVAALE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 7,
 -      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIRVAALE1,
 -      .writefn = tlbi_aa64_rvae1_write },
 -    { .name = "TLBI_RIPAS2E1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 2,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ripas2e1is_write },
 -    { .name = "TLBI_RIPAS2LE1IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 6,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ripas2e1is_write },
 -    { .name = "TLBI_RVAE2IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 1,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_rvae2is_write },
 -   { .name = "TLBI_RVALE2IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 5,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_rvae2is_write },
 -    { .name = "TLBI_RIPAS2E1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 2,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ripas2e1_write },
 -    { .name = "TLBI_RIPAS2LE1", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 6,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_ripas2e1_write },
 -   { .name = "TLBI_RVAE2OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 1,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_rvae2is_write },
 -   { .name = "TLBI_RVALE2OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 5,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_rvae2is_write },
 -    { .name = "TLBI_RVAE2", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 1,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_rvae2_write },
 -   { .name = "TLBI_RVALE2", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 5,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_rvae2_write },
 -   { .name = "TLBI_RVAE3IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 1,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_rvae3is_write },
 -   { .name = "TLBI_RVALE3IS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 5,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_rvae3is_write },
 -   { .name = "TLBI_RVAE3OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 1,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_rvae3is_write },
 -   { .name = "TLBI_RVALE3OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 5,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_rvae3is_write },
 -   { .name = "TLBI_RVAE3", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 1,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_rvae3_write },
 -   { .name = "TLBI_RVALE3", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 5,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_rvae3_write },
 -};
 -
  static const ARMCPRegInfo tlbios_reginfo[] = {
      { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
        .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
      if (cpu_isar_feature(aa64_rndr, cpu)) {
          define_arm_cp_regs(cpu, rndr_reginfo);
      }
-     return CP_ACCESS_OK;
+-    if (cpu_isar_feature(aa64_tlbirange, cpu)) {
 -        define_arm_cp_regs(cpu, tlbirange_reginfo);
 -    }
      if (cpu_isar_feature(aa64_tlbios, cpu)) {
          define_arm_cp_regs(cpu, tlbios_reginfo);
      }
 diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/tlb-insns.c
 +++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@
   * SPDX-License-Identifier: GPL-2.0-or-later
   */
  #include "qemu/osdep.h"
 +#include "qemu/log.h"
  #include "exec/exec-all.h"
  #include "cpu.h"
  #include "internals.h"
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el3_cp_reginfo[] = {
        .writefn = tlbi_aa64_vae3_write },
  };
 +#ifdef TARGET_AARCH64
 +typedef struct {
 +    uint64_t base;
 +    uint64_t length;
 +} TLBIRange;
 +
 +static ARMGranuleSize tlbi_range_tg_to_gran_size(int tg)
 +{
 +    /*
 +     * Note that the TLBI range TG field encoding differs from both
 +     * TG0 and TG1 encodings.
 +     */
 +    switch (tg) {
 +    case 1:
 +        return Gran4K;
 +    case 2:
 +        return Gran16K;
 +    case 3:
 +        return Gran64K;
 +    default:
 +        return GranInvalid;
 +    }
 +}
 +
 +static TLBIRange tlbi_aa64_get_range(CPUARMState *env, ARMMMUIdx mmuidx,
 +                                     uint64_t value)
 +{
 +    unsigned int page_size_granule, page_shift, num, scale, exponent;
 +    /* Extract one bit to represent the va selector in use. */
 +    uint64_t select = sextract64(value, 36, 1);
 +    ARMVAParameters param = aa64_va_parameters(env, select, mmuidx, true, false);
 +    TLBIRange ret = { };
 +    ARMGranuleSize gran;
 +
 +    page_size_granule = extract64(value, 46, 2);
 +    gran = tlbi_range_tg_to_gran_size(page_size_granule);
 +
 +    /* The granule encoded in value must match the granule in use. */
 +    if (gran != param.gran) {
 +        qemu_log_mask(LOG_GUEST_ERROR, "Invalid tlbi page size granule %d\n",
 +                      page_size_granule);
 +        return ret;
 +    }
 +
 +    page_shift = arm_granule_bits(gran);
 +    num = extract64(value, 39, 5);
 +    scale = extract64(value, 44, 2);
 +    exponent = (5 * scale) + 1;
 +
 +    ret.length = (num + 1) << (exponent + page_shift);
 +
 +    if (param.select) {
 +        ret.base = sextract64(value, 0, 37);
 +    } else {
 +        ret.base = extract64(value, 0, 37);
 +    }
 +    if (param.ds) {
 +        /*
 +         * With DS=1, BaseADDR is always shifted 16 so that it is able
 +         * to address all 52 va bits.  The input address is perforce
 +         * aligned on a 64k boundary regardless of translation granule.
 +         */
 +        page_shift = 16;
 +    }
 +    ret.base <<= page_shift;
 +
 +    return ret;
 +}
 +
 +static void do_rvae_write(CPUARMState *env, uint64_t value,
 +                          int idxmap, bool synced)
 +{
 +    ARMMMUIdx one_idx = ARM_MMU_IDX_A | ctz32(idxmap);
 +    TLBIRange range;
 +    int bits;
 +
 +    range = tlbi_aa64_get_range(env, one_idx, value);
 +    bits = tlbbits_for_regime(env, one_idx, range.base);
 +
 +    if (synced) {
 +        tlb_flush_range_by_mmuidx_all_cpus_synced(env_cpu(env),
 +                                                  range.base,
 +                                                  range.length,
 +                                                  idxmap,
 +                                                  bits);
 +    } else {
 +        tlb_flush_range_by_mmuidx(env_cpu(env), range.base,
 +                                  range.length, idxmap, bits);
 +    }
 +}
 +
 +static void tlbi_aa64_rvae1_write(CPUARMState *env,
 +                                  const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA range, EL1&0.
 +     * Currently handles all of RVAE1, RVAAE1, RVAALE1 and RVALE1,
 +     * since we don't support flush-for-specific-ASID-only or
 +     * flush-last-level-only.
 +     */
 +
 +    do_rvae_write(env, value, vae1_tlbmask(env),
 +                  tlb_force_broadcast(env));
 +}
 +
 +static void tlbi_aa64_rvae1is_write(CPUARMState *env,
 +                                    const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA range, Inner/Outer Shareable EL1&0.
 +     * Currently handles all of RVAE1IS, RVAE1OS, RVAAE1IS, RVAAE1OS,
 +     * RVAALE1IS, RVAALE1OS, RVALE1IS and RVALE1OS, since we don't support
 +     * flush-for-specific-ASID-only, flush-last-level-only or inner/outer
 +     * shareable specific flushes.
 +     */
 +
 +    do_rvae_write(env, value, vae1_tlbmask(env), true);
 +}
 +
 +static void tlbi_aa64_rvae2_write(CPUARMState *env,
 +                                  const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA range, EL2.
 +     * Currently handles all of RVAE2 and RVALE2,
 +     * since we don't support flush-for-specific-ASID-only or
 +     * flush-last-level-only.
 +     */
 +
 +    do_rvae_write(env, value, vae2_tlbmask(env),
 +                  tlb_force_broadcast(env));
 +
 +
 +}
 +
 +static void tlbi_aa64_rvae2is_write(CPUARMState *env,
 +                                    const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA range, Inner/Outer Shareable, EL2.
 +     * Currently handles all of RVAE2IS, RVAE2OS, RVALE2IS and RVALE2OS,
 +     * since we don't support flush-for-specific-ASID-only,
 +     * flush-last-level-only or inner/outer shareable specific flushes.
 +     */
 +
 +    do_rvae_write(env, value, vae2_tlbmask(env), true);
 +
 +}
 +
 +static void tlbi_aa64_rvae3_write(CPUARMState *env,
 +                                  const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA range, EL3.
 +     * Currently handles all of RVAE3 and RVALE3,
 +     * since we don't support flush-for-specific-ASID-only or
 +     * flush-last-level-only.
 +     */
 +
 +    do_rvae_write(env, value, ARMMMUIdxBit_E3, tlb_force_broadcast(env));
 +}
 +
 +static void tlbi_aa64_rvae3is_write(CPUARMState *env,
 +                                    const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    /*
 +     * Invalidate by VA range, EL3, Inner/Outer Shareable.
 +     * Currently handles all of RVAE3IS, RVAE3OS, RVALE3IS and RVALE3OS,
 +     * since we don't support flush-for-specific-ASID-only,
 +     * flush-last-level-only or inner/outer specific flushes.
 +     */
 +
 +    do_rvae_write(env, value, ARMMMUIdxBit_E3, true);
 +}
 +
 +static void tlbi_aa64_ripas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                     uint64_t value)
 +{
 +    do_rvae_write(env, value, ipas2e1_tlbmask(env, value),
 +                  tlb_force_broadcast(env));
 +}
 +
 +static void tlbi_aa64_ripas2e1is_write(CPUARMState *env,
 +                                       const ARMCPRegInfo *ri,
 +                                       uint64_t value)
 +{
 +    do_rvae_write(env, value, ipas2e1_tlbmask(env, value), true);
 +}
 +
 +static const ARMCPRegInfo tlbirange_reginfo[] = {
 +    { .name = "TLBI_RVAE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 1,
 +      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAE1IS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +    { .name = "TLBI_RVAAE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 3,
 +      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAAE1IS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +   { .name = "TLBI_RVALE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 5,
 +      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVALE1IS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +    { .name = "TLBI_RVAALE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 7,
 +      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAALE1IS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +    { .name = "TLBI_RVAE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAE1OS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +    { .name = "TLBI_RVAAE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 3,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAAE1OS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +   { .name = "TLBI_RVALE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 5,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVALE1OS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +    { .name = "TLBI_RVAALE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 7,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAALE1OS,
 +      .writefn = tlbi_aa64_rvae1is_write },
 +    { .name = "TLBI_RVAE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAE1,
 +      .writefn = tlbi_aa64_rvae1_write },
 +    { .name = "TLBI_RVAAE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 3,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAAE1,
 +      .writefn = tlbi_aa64_rvae1_write },
 +   { .name = "TLBI_RVALE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 5,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVALE1,
 +      .writefn = tlbi_aa64_rvae1_write },
 +    { .name = "TLBI_RVAALE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 7,
 +      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIRVAALE1,
 +      .writefn = tlbi_aa64_rvae1_write },
 +    { .name = "TLBI_RIPAS2E1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 2,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ripas2e1is_write },
 +    { .name = "TLBI_RIPAS2LE1IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 6,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ripas2e1is_write },
 +    { .name = "TLBI_RVAE2IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 1,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_rvae2is_write },
 +   { .name = "TLBI_RVALE2IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 5,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_rvae2is_write },
 +    { .name = "TLBI_RIPAS2E1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 2,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ripas2e1_write },
 +    { .name = "TLBI_RIPAS2LE1", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 6,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_ripas2e1_write },
 +   { .name = "TLBI_RVAE2OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 1,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_rvae2is_write },
 +   { .name = "TLBI_RVALE2OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 5,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_rvae2is_write },
 +    { .name = "TLBI_RVAE2", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 1,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_rvae2_write },
 +   { .name = "TLBI_RVALE2", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 5,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_rvae2_write },
 +   { .name = "TLBI_RVAE3IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 1,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_rvae3is_write },
 +   { .name = "TLBI_RVALE3IS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 5,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_rvae3is_write },
 +   { .name = "TLBI_RVAE3OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 1,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_rvae3is_write },
 +   { .name = "TLBI_RVALE3OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 5,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_rvae3is_write },
 +   { .name = "TLBI_RVAE3", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 1,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_rvae3_write },
 +   { .name = "TLBI_RVALE3", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 5,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_rvae3_write },
 +};
 +#endif
 +
  void define_tlb_insn_regs(ARMCPU *cpu)
  {
      CPUARMState *env = &cpu->env;
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
      if (arm_feature(env, ARM_FEATURE_EL3)) {
          define_arm_cp_regs(cpu, tlbi_el3_cp_reginfo);
      }
 +#ifdef TARGET_AARCH64
 +    if (cpu_isar_feature(aa64_tlbirange, cpu)) {
 +        define_arm_cp_regs(cpu, tlbirange_reginfo);
 +    }
 +#endif
  }
 --
-.20.1
+.34.1

-[PULL 22/48] target/arm: Update arm_mmu_idx for VHE
+[PULL 82/85] target/arm: Move the TLBI OS insns to tlb-insns.c.
-From: Richard Henderson <richard.henderson@linaro.org>
+Move the TLBI OS insns across to tlb-insns.c.
-Return the indexes for the EL2&0 regime when the appropriate bits
-are set within HCR_EL2.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-22-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-8-peter.maydell@linaro.org
 ---
- target/arm/helper.c | 11 +++++++++--
+ target/arm/helper.c        | 80 --------------------------------------
-file changed, 9 insertions(+), 2 deletions(-)
+ target/arm/tcg/tlb-insns.c | 80 ++++++++++++++++++++++++++++++++++++++
 files changed, 80 insertions(+), 80 deletions(-)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo pauth_reginfo[] = {
-         return arm_v7m_mmu_idx_for_secstate(env, env->v7m.secure);
+       .fieldoffset = offsetof(CPUARMState, keys.apib.hi) },
  };
 -static const ARMCPRegInfo tlbios_reginfo[] = {
 -    { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVMALLE1OS,
 -      .writefn = tlbi_aa64_vmalle1is_write },
 -    { .name = "TLBI_VAE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 1,
 -      .fgt = FGT_TLBIVAE1OS,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_ASIDE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 2,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIASIDE1OS,
 -      .writefn = tlbi_aa64_vmalle1is_write },
 -    { .name = "TLBI_VAAE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 3,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAAE1OS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_VALE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 5,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVALE1OS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_VAALE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 7,
 -      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 -      .fgt = FGT_TLBIVAALE1OS,
 -      .writefn = tlbi_aa64_vae1is_write },
 -    { .name = "TLBI_ALLE2OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 0,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_alle2is_write },
 -    { .name = "TLBI_VAE2OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 1,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_vae2is_write },
 -   { .name = "TLBI_ALLE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 4,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle1is_write },
 -    { .name = "TLBI_VALE2OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 5,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 -      .writefn = tlbi_aa64_vae2is_write },
 -    { .name = "TLBI_VMALLS12E1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 6,
 -      .access = PL2_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle1is_write },
 -    { .name = "TLBI_IPAS2E1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 0,
 -      .access = PL2_W, .type = ARM_CP_NOP },
 -    { .name = "TLBI_RIPAS2E1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 3,
 -      .access = PL2_W, .type = ARM_CP_NOP },
 -    { .name = "TLBI_IPAS2LE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 4,
 -      .access = PL2_W, .type = ARM_CP_NOP },
 -    { .name = "TLBI_RIPAS2LE1OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 7,
 -      .access = PL2_W, .type = ARM_CP_NOP },
 -    { .name = "TLBI_ALLE3OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 0,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_alle3is_write },
 -    { .name = "TLBI_VAE3OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 1,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae3is_write },
 -    { .name = "TLBI_VALE3OS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 5,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_vae3is_write },
 -};
 -
  static uint64_t rndr_readfn(CPUARMState *env, const ARMCPRegInfo *ri)
  {
      Error *err = NULL;
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
      if (cpu_isar_feature(aa64_rndr, cpu)) {
          define_arm_cp_regs(cpu, rndr_reginfo);
      }
+-    if (cpu_isar_feature(aa64_tlbios, cpu)) {
-+    /* See ARM pseudo-function ELIsInHost.  */
+-        define_arm_cp_regs(cpu, tlbios_reginfo);
-     switch (el) {
+-    }
-     case 0:
+     /* Data Cache clean instructions up to PoP */
--        /* TODO: ARMv8.1-VHE */
+     if (cpu_isar_feature(aa64_dcpop, cpu)) {
-         if (arm_is_secure_below_el3(env)) {
+         define_one_arm_cp_reg(cpu, dcpop_reg);
-             return ARMMMUIdx_SE10_0;
+diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
-         }
+index XXXXXXX..XXXXXXX 100644
-+        if ((env->cp15.hcr_el2 & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)
+--- a/target/arm/tcg/tlb-insns.c
-+            && arm_el_is_aa64(env, 2)) {
++++ b/target/arm/tcg/tlb-insns.c
-+            return ARMMMUIdx_E20_0;
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbirange_reginfo[] = {
-+        }
+       .access = PL3_W, .type = ARM_CP_NO_RAW,
-         return ARMMMUIdx_E10_0;
+       .writefn = tlbi_aa64_rvae3_write },
-     case 1:
+ };
-         if (arm_is_secure_below_el3(env)) {
++
-@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
++static const ARMCPRegInfo tlbios_reginfo[] = {
-         }
++    { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
-         return ARMMMUIdx_E10_1;
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
-     case 2:
++      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
--        /* TODO: ARMv8.1-VHE */
++      .fgt = FGT_TLBIVMALLE1OS,
-         /* TODO: ARMv8.4-SecEL2 */
++      .writefn = tlbi_aa64_vmalle1is_write },
-+        /* Note that TGE does not apply at EL2.  */
++    { .name = "TLBI_VAE1OS", .state = ARM_CP_STATE_AA64,
-+        if ((env->cp15.hcr_el2 & HCR_E2H) && arm_el_is_aa64(env, 2)) {
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 1,
-+            return ARMMMUIdx_E20_2;
++      .fgt = FGT_TLBIVAE1OS,
-+        }
++      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-         return ARMMMUIdx_E2;
++      .writefn = tlbi_aa64_vae1is_write },
-     case 3:
++    { .name = "TLBI_ASIDE1OS", .state = ARM_CP_STATE_AA64,
-         return ARMMMUIdx_SE3;
++      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 2,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIASIDE1OS,
 +      .writefn = tlbi_aa64_vmalle1is_write },
 +    { .name = "TLBI_VAAE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 3,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVAAE1OS,
 +      .writefn = tlbi_aa64_vae1is_write },
 +    { .name = "TLBI_VALE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 5,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVALE1OS,
 +      .writefn = tlbi_aa64_vae1is_write },
 +    { .name = "TLBI_VAALE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 7,
 +      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
 +      .fgt = FGT_TLBIVAALE1OS,
 +      .writefn = tlbi_aa64_vae1is_write },
 +    { .name = "TLBI_ALLE2OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 0,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_alle2is_write },
 +    { .name = "TLBI_VAE2OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 1,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_vae2is_write },
 +   { .name = "TLBI_ALLE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 4,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle1is_write },
 +    { .name = "TLBI_VALE2OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 5,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
 +      .writefn = tlbi_aa64_vae2is_write },
 +    { .name = "TLBI_VMALLS12E1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 6,
 +      .access = PL2_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle1is_write },
 +    { .name = "TLBI_IPAS2E1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 0,
 +      .access = PL2_W, .type = ARM_CP_NOP },
 +    { .name = "TLBI_RIPAS2E1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 3,
 +      .access = PL2_W, .type = ARM_CP_NOP },
 +    { .name = "TLBI_IPAS2LE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 4,
 +      .access = PL2_W, .type = ARM_CP_NOP },
 +    { .name = "TLBI_RIPAS2LE1OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 7,
 +      .access = PL2_W, .type = ARM_CP_NOP },
 +    { .name = "TLBI_ALLE3OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 0,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_alle3is_write },
 +    { .name = "TLBI_VAE3OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 1,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_vae3is_write },
 +    { .name = "TLBI_VALE3OS", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 5,
 +      .access = PL3_W, .type = ARM_CP_NO_RAW,
 +      .writefn = tlbi_aa64_vae3is_write },
 +};
  #endif
  void define_tlb_insn_regs(ARMCPU *cpu)
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
      if (cpu_isar_feature(aa64_tlbirange, cpu)) {
          define_arm_cp_regs(cpu, tlbirange_reginfo);
      }
 +    if (cpu_isar_feature(aa64_tlbios, cpu)) {
 +        define_arm_cp_regs(cpu, tlbios_reginfo);
 +    }
  #endif
  }
 --
-.20.1
+.34.1

-[PULL 32/48] target/arm: Flush tlbs for E2&0 translation regime
+[PULL 83/85] target/arm: Move small helper functions to tlb-insns.c
-From: Richard Henderson <richard.henderson@linaro.org>
+The remaining functions that we temporarily made global are now
 used only from callsits in tlb-insns.c; move them across and
 make them file-local again.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-32-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-9-peter.maydell@linaro.org
 ---
- target/arm/helper.c | 25 ++++++++++++++++++-------
+ target/arm/cpregs.h        |  34 ------
-file changed, 18 insertions(+), 7 deletions(-)
+ target/arm/helper.c        | 220 -------------------------------------
  target/arm/tcg/tlb-insns.c | 220 +++++++++++++++++++++++++++++++++++++
 files changed, 220 insertions(+), 254 deletions(-)
+diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/cpregs.h
++++ b/target/arm/cpregs.h
+@@ -XXX,XX +XXX,XX @@ static inline bool arm_cpreg_traps_in_nv(const ARMCPRegInfo *ri)
+     return ri->opc1 == 4 || ri->opc1 == 5;
+ }
+-/*
+- * Temporary declarations of functions until the move to tlb_insn_helper.c
+- * is complete and we can make the functions static again
+- */
+-CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
+-                           bool isread);
+-CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
+-                             bool isread);
+-CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
+-                             bool isread);
+-bool tlb_force_broadcast(CPUARMState *env);
+-int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
+-                       uint64_t addr);
+-int vae1_tlbbits(CPUARMState *env, uint64_t addr);
+-int vae2_tlbbits(CPUARMState *env, uint64_t addr);
+-int vae1_tlbmask(CPUARMState *env);
+-int vae2_tlbmask(CPUARMState *env);
+-int ipas2e1_tlbmask(CPUARMState *env, int64_t value);
+-int e2_tlbmask(CPUARMState *env);
+-void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                               uint64_t value);
+-void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                             uint64_t value);
+-void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                            uint64_t value);
+-void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                             uint64_t value);
+-void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                            uint64_t value);
+-void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                            uint64_t value);
+-void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-                             uint64_t value);
+-
+ #endif /* TARGET_ARM_CPREGS_H */
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
+@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tacr(CPUARMState *env, const ARMCPRegInfo *ri,
+     return CP_ACCESS_OK;
- static int vae1_tlbmask(CPUARMState *env)
+ }
- {
-+    /* Since we exclude secure first, we may read HCR_EL2 directly. */
+-/* Check for traps from EL1 due to HCR_EL2.TTLB. */
-     if (arm_is_secure_below_el3(env)) {
+-CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-         return ARMMMUIdxBit_SE10_1 | ARMMMUIdxBit_SE10_0;
+-                           bool isread)
-+    } else if ((env->cp15.hcr_el2 & (HCR_E2H | HCR_TGE))
+-{
-+               == (HCR_E2H | HCR_TGE)) {
+-    if (arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_TTLB)) {
-+        return ARMMMUIdxBit_E20_2 | ARMMMUIdxBit_E20_0;
+-        return CP_ACCESS_TRAP_EL2;
-     } else {
+-    }
-         return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
+-    return CP_ACCESS_OK;
 -}
 -
 -/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBIS. */
 -CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             bool isread)
 -{
 -    if (arm_current_el(env) == 1 &&
 -        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBIS))) {
 -        return CP_ACCESS_TRAP_EL2;
 -    }
 -    return CP_ACCESS_OK;
 -}
 -
 -#ifdef TARGET_AARCH64
 -/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBOS. */
 -CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             bool isread)
 -{
 -    if (arm_current_el(env) == 1 &&
 -        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBOS))) {
 -        return CP_ACCESS_TRAP_EL2;
 -    }
 -    return CP_ACCESS_OK;
 -}
 -#endif
 -
  static void dacr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
  {
      ARMCPU *cpu = env_archcpu(env);
@@ -XXX,XX +XXX,XX @@ int alle1_tlbmask(CPUARMState *env)
              ARMMMUIdxBit_Stage2_S);
  }
 -/*
 - * Non-IS variants of TLB operations are upgraded to
 - * IS versions if we are at EL1 and HCR_EL2.FB is effectively set to
 - * force broadcast of these operations.
 - */
 -bool tlb_force_broadcast(CPUARMState *env)
 -{
 -    return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
 -}
 -
  static const ARMCPRegInfo cp_reginfo[] = {
      /*
       * Define the secure and non-secure FCSE identifier CP registers
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tocu(CPUARMState *env, const ARMCPRegInfo *ri,
      return do_cacheop_pou_access(env, HCR_TOCU | HCR_TPU);
  }
 -/*
 - * See: D4.7.2 TLB maintenance requirements and the TLB maintenance instructions
 - * Page D4-1736 (DDI0487A.b)
 - */
 -
 -int vae1_tlbmask(CPUARMState *env)
 -{
 -    uint64_t hcr = arm_hcr_el2_eff(env);
 -    uint16_t mask;
 -
 -    assert(arm_feature(env, ARM_FEATURE_AARCH64));
 -
 -    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 -        mask = ARMMMUIdxBit_E20_2 |
 -               ARMMMUIdxBit_E20_2_PAN |
 -               ARMMMUIdxBit_E20_0;
 -    } else {
 -        /* This is AArch64 only, so we don't need to touch the EL30_x TLBs */
 -        mask = ARMMMUIdxBit_E10_1 |
 -               ARMMMUIdxBit_E10_1_PAN |
 -               ARMMMUIdxBit_E10_0;
 -    }
 -    return mask;
 -}
 -
 -int vae2_tlbmask(CPUARMState *env)
 -{
 -    uint64_t hcr = arm_hcr_el2_eff(env);
 -    uint16_t mask;
 -
 -    if (hcr & HCR_E2H) {
 -        mask = ARMMMUIdxBit_E20_2 |
 -               ARMMMUIdxBit_E20_2_PAN |
 -               ARMMMUIdxBit_E20_0;
 -    } else {
 -        mask = ARMMMUIdxBit_E2;
 -    }
 -    return mask;
 -}
 -
 -/* Return 56 if TBI is enabled, 64 otherwise. */
 -int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
 -                       uint64_t addr)
 -{
 -    uint64_t tcr = regime_tcr(env, mmu_idx);
 -    int tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
 -    int select = extract64(addr, 55, 1);
 -
 -    return (tbi >> select) & 1 ? 56 : 64;
 -}
 -
 -int vae1_tlbbits(CPUARMState *env, uint64_t addr)
 -{
 -    uint64_t hcr = arm_hcr_el2_eff(env);
 -    ARMMMUIdx mmu_idx;
 -
 -    assert(arm_feature(env, ARM_FEATURE_AARCH64));
 -
 -    /* Only the regime of the mmu_idx below is significant. */
 -    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 -        mmu_idx = ARMMMUIdx_E20_0;
 -    } else {
 -        mmu_idx = ARMMMUIdx_E10_0;
 -    }
 -
 -    return tlbbits_for_regime(env, mmu_idx, addr);
 -}
 -
 -int vae2_tlbbits(CPUARMState *env, uint64_t addr)
 -{
 -    uint64_t hcr = arm_hcr_el2_eff(env);
 -    ARMMMUIdx mmu_idx;
 -
 -    /*
 -     * Only the regime of the mmu_idx below is significant.
 -     * Regime EL2&0 has two ranges with separate TBI configuration, while EL2
 -     * only has one.
 -     */
 -    if (hcr & HCR_E2H) {
 -        mmu_idx = ARMMMUIdx_E20_2;
 -    } else {
 -        mmu_idx = ARMMMUIdx_E2;
 -    }
 -
 -    return tlbbits_for_regime(env, mmu_idx, addr);
 -}
 -
 -void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                               uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = vae1_tlbmask(env);
 -
 -    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 -}
 -
 -int e2_tlbmask(CPUARMState *env)
 -{
 -    return (ARMMMUIdxBit_E20_0 |
 -            ARMMMUIdxBit_E20_2 |
 -            ARMMMUIdxBit_E20_2_PAN |
 -            ARMMMUIdxBit_E2);
 -}
 -
 -void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = alle1_tlbmask(env);
 -
 -    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 -}
 -
 -void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = e2_tlbmask(env);
 -
 -    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 -}
 -
 -void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                             uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
 -}
 -
 -void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                            uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = vae1_tlbmask(env);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -    int bits = vae1_tlbbits(env, pageaddr);
 -
 -    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 -}
 -
 -void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                   uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    int mask = vae2_tlbmask(env);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -    int bits = vae2_tlbbits(env, pageaddr);
 -
 -    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 -}
 -
 -void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                            uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 -    int bits = tlbbits_for_regime(env, ARMMMUIdx_E3, pageaddr);
 -
 -    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr,
 -                                                  ARMMMUIdxBit_E3, bits);
 -}
 -
 -int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
 -{
 -    /*
 -     * The MSB of value is the NS field, which only applies if SEL2
 -     * is implemented and SCR_EL3.NS is not set (i.e. in secure mode).
 -     */
 -    return (value >= 0
 -            && cpu_isar_feature(aa64_sel2, env_archcpu(env))
 -            && arm_is_secure_below_el3(env)
 -            ? ARMMMUIdxBit_Stage2_S
 -            : ARMMMUIdxBit_Stage2);
 -}
 -
  static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                        bool isread)
  {
 diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/tlb-insns.c
 +++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@
  #include "cpu-features.h"
  #include "cpregs.h"
 +/* Check for traps from EL1 due to HCR_EL2.TTLB. */
 +static CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                  bool isread)
 +{
 +    if (arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_TTLB)) {
 +        return CP_ACCESS_TRAP_EL2;
 +    }
 +    return CP_ACCESS_OK;
 +}
 +
 +/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBIS. */
 +static CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    bool isread)
 +{
 +    if (arm_current_el(env) == 1 &&
 +        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBIS))) {
 +        return CP_ACCESS_TRAP_EL2;
 +    }
 +    return CP_ACCESS_OK;
 +}
 +
 +#ifdef TARGET_AARCH64
 +/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBOS. */
 +static CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    bool isread)
 +{
 +    if (arm_current_el(env) == 1 &&
 +        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBOS))) {
 +        return CP_ACCESS_TRAP_EL2;
 +    }
 +    return CP_ACCESS_OK;
 +}
 +#endif
 +
  /* IS variants of TLB operations must affect all cores */
  static void tlbiall_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                               uint64_t value)
@@ -XXX,XX +XXX,XX @@ static void tlbimvaa_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
  }
 +/*
 + * Non-IS variants of TLB operations are upgraded to
 + * IS versions if we are at EL1 and HCR_EL2.FB is effectively set to
 + * force broadcast of these operations.
 + */
 +static bool tlb_force_broadcast(CPUARMState *env)
 +{
 +    return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
 +}
 +
  static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
                            uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
  }
 +/*
 + * See: D4.7.2 TLB maintenance requirements and the TLB maintenance instructions
 + * Page D4-1736 (DDI0487A.b)
 + */
 +
 +static int vae1_tlbmask(CPUARMState *env)
 +{
 +    uint64_t hcr = arm_hcr_el2_eff(env);
 +    uint16_t mask;
 +
 +    assert(arm_feature(env, ARM_FEATURE_AARCH64));
 +
 +    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 +        mask = ARMMMUIdxBit_E20_2 |
 +               ARMMMUIdxBit_E20_2_PAN |
 +               ARMMMUIdxBit_E20_0;
 +    } else {
 +        /* This is AArch64 only, so we don't need to touch the EL30_x TLBs */
 +        mask = ARMMMUIdxBit_E10_1 |
 +               ARMMMUIdxBit_E10_1_PAN |
 +               ARMMMUIdxBit_E10_0;
 +    }
 +    return mask;
 +}
 +
 +static int vae2_tlbmask(CPUARMState *env)
 +{
 +    uint64_t hcr = arm_hcr_el2_eff(env);
 +    uint16_t mask;
 +
 +    if (hcr & HCR_E2H) {
 +        mask = ARMMMUIdxBit_E20_2 |
 +               ARMMMUIdxBit_E20_2_PAN |
 +               ARMMMUIdxBit_E20_0;
 +    } else {
 +        mask = ARMMMUIdxBit_E2;
 +    }
 +    return mask;
 +}
 +
 +/* Return 56 if TBI is enabled, 64 otherwise. */
 +static int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
 +                       uint64_t addr)
 +{
 +    uint64_t tcr = regime_tcr(env, mmu_idx);
 +    int tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
 +    int select = extract64(addr, 55, 1);
 +
 +    return (tbi >> select) & 1 ? 56 : 64;
 +}
 +
 +static int vae1_tlbbits(CPUARMState *env, uint64_t addr)
 +{
 +    uint64_t hcr = arm_hcr_el2_eff(env);
 +    ARMMMUIdx mmu_idx;
 +
 +    assert(arm_feature(env, ARM_FEATURE_AARCH64));
 +
 +    /* Only the regime of the mmu_idx below is significant. */
 +    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
 +        mmu_idx = ARMMMUIdx_E20_0;
 +    } else {
 +        mmu_idx = ARMMMUIdx_E10_0;
 +    }
 +
 +    return tlbbits_for_regime(env, mmu_idx, addr);
 +}
 +
 +static int vae2_tlbbits(CPUARMState *env, uint64_t addr)
 +{
 +    uint64_t hcr = arm_hcr_el2_eff(env);
 +    ARMMMUIdx mmu_idx;
 +
 +    /*
 +     * Only the regime of the mmu_idx below is significant.
 +     * Regime EL2&0 has two ranges with separate TBI configuration, while EL2
 +     * only has one.
 +     */
 +    if (hcr & HCR_E2H) {
 +        mmu_idx = ARMMMUIdx_E20_2;
 +    } else {
 +        mmu_idx = ARMMMUIdx_E2;
 +    }
 +
 +    return tlbbits_for_regime(env, mmu_idx, addr);
 +}
 +
 +static void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                      uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = vae1_tlbmask(env);
 +
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 +}
 +
  static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                      uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
      }
-@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
+ }
      }
  }
 +static int e2_tlbmask(CPUARMState *env)
 +{
-+    /* TODO: ARMv8.4-SecEL2 */
++    return (ARMMMUIdxBit_E20_0 |
-+    return ARMMMUIdxBit_E20_0 | ARMMMUIdxBit_E20_2 | ARMMMUIdxBit_E2;
++            ARMMMUIdxBit_E20_2 |
 +            ARMMMUIdxBit_E20_2_PAN |
 +            ARMMMUIdxBit_E2);
 +}
 +
  static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                    uint64_t value)
  {
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
- static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+     tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
-                                   uint64_t value)
+ }
- {
--    ARMCPU *cpu = env_archcpu(env);
++static void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
--    CPUState *cs = CPU(cpu);
++                                    uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = alle1_tlbmask(env);
 +
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 +}
 +
 +static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = e2_tlbmask(env);
++
--    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
++    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
-+    tlb_flush_by_mmuidx(cs, mask);
++}
- }
++
++static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
- static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
++                                    uint64_t value)
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
++{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
 +}
 +
  static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
      tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
  }
 +static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                   uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = vae1_tlbmask(env);
 +    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 +    int bits = vae1_tlbbits(env, pageaddr);
 +
 +    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 +}
 +
  static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
      }
  }
 +static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                   uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    int mask = vae2_tlbmask(env);
 +    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 +    int bits = vae2_tlbbits(env, pageaddr);
 +
 +    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 +}
 +
 +static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                   uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +    uint64_t pageaddr = sextract64(value << 12, 0, 56);
 +    int bits = tlbbits_for_regime(env, ARMMMUIdx_E3, pageaddr);
 +
 +    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr,
 +                                                  ARMMMUIdxBit_E3, bits);
 +}
 +
 +static int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
 +{
 +    /*
 +     * The MSB of value is the NS field, which only applies if SEL2
 +     * is implemented and SCR_EL3.NS is not set (i.e. in secure mode).
 +     */
 +    return (value >= 0
 +            && cpu_isar_feature(aa64_sel2, env_archcpu(env))
 +            && arm_is_secure_below_el3(env)
 +            ? ARMMMUIdxBit_Stage2_S
 +            : ARMMMUIdxBit_Stage2);
 +}
 +
  static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                      uint64_t value)
  {
-     CPUState *cs = env_cpu(env);
-+    int mask = e2_tlbmask(env);
--    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
-+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
- }
- static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
-      * Currently handles both VAE2 and VALE2, since we don't support
-      * flush-last-level-only.
-      */
--    ARMCPU *cpu = env_archcpu(env);
--    CPUState *cs = CPU(cpu);
-+    CPUState *cs = env_cpu(env);
-+    int mask = e2_tlbmask(env);
-     uint64_t pageaddr = sextract64(value << 12, 0, 56);
--    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
-+    tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
- }
- static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 --
-.20.1
+.34.1

-[PULL 05/48] target/arm: Add TTBR1_EL2
+[PULL 84/85] target/arm: Move RME TLB insns to tlb-insns.c
-From: Richard Henderson <richard.henderson@linaro.org>
+Move the FEAT_RME specific TLB insns across to tlb-insns.c.
-At the same time, add writefn to TTBR0_EL2 and TCR_EL2.
-A later patch will update any ASID therein.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200206105448.4726-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-10-peter.maydell@linaro.org
 ---
- target/arm/helper.c | 13 ++++++++++++-
+ target/arm/helper.c        | 38 --------------------------------
-file changed, 12 insertions(+), 1 deletion(-)
+ target/arm/tcg/tlb-insns.c | 45 ++++++++++++++++++++++++++++++++++++++
 files changed, 45 insertions(+), 38 deletions(-)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void vmsa_ttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo sme_reginfo[] = {
-     raw_write(env, ri, value);
+       .type = ARM_CP_CONST, .resetvalue = 0 },
  };
 -static void tlbi_aa64_paall_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                  uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush(cs);
 -}
 -
  static void gpccr_write(CPUARMState *env, const ARMCPRegInfo *ri,
                          uint64_t value)
  {
@@ -XXX,XX +XXX,XX @@ static void gpccr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
                                       env_archcpu(env)->reset_l0gptsz);
  }
-+static void vmsa_tcr_ttbr_el2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+-static void tlbi_aa64_paallos_write(CPUARMState *env, const ARMCPRegInfo *ri,
 -                                    uint64_t value)
 -{
 -    CPUState *cs = env_cpu(env);
 -
 -    tlb_flush_all_cpus_synced(cs);
 -}
 -
  static const ARMCPRegInfo rme_reginfo[] = {
      { .name = "GPCCR_EL3", .state = ARM_CP_STATE_AA64,
        .opc0 = 3, .opc1 = 6, .crn = 2, .crm = 1, .opc2 = 6,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo rme_reginfo[] = {
      { .name = "MFAR_EL3", .state = ARM_CP_STATE_AA64,
        .opc0 = 3, .opc1 = 6, .crn = 6, .crm = 0, .opc2 = 5,
        .access = PL3_RW, .fieldoffset = offsetof(CPUARMState, cp15.mfar_el3) },
 -    { .name = "TLBI_PAALL", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 4,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_paall_write },
 -    { .name = "TLBI_PAALLOS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 4,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_paallos_write },
 -    /*
 -     * QEMU does not have a way to invalidate by physical address, thus
 -     * invalidating a range of physical addresses is accomplished by
 -     * flushing all tlb entries in the outer shareable domain,
 -     * just like PAALLOS.
 -     */
 -    { .name = "TLBI_RPALOS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 7,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_paallos_write },
 -    { .name = "TLBI_RPAOS", .state = ARM_CP_STATE_AA64,
 -      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 3,
 -      .access = PL3_W, .type = ARM_CP_NO_RAW,
 -      .writefn = tlbi_aa64_paallos_write },
      { .name = "DC_CIPAPA", .state = ARM_CP_STATE_AA64,
        .opc0 = 1, .opc1 = 6, .crn = 7, .crm = 14, .opc2 = 1,
        .access = PL3_W, .type = ARM_CP_NOP },
 diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/tlb-insns.c
 +++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbios_reginfo[] = {
        .access = PL3_W, .type = ARM_CP_NO_RAW,
        .writefn = tlbi_aa64_vae3is_write },
  };
 +
 +static void tlbi_aa64_paall_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                  uint64_t value)
 +{
 +    CPUState *cs = env_cpu(env);
 +
 +    tlb_flush(cs);
 +}
 +
 +static void tlbi_aa64_paallos_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                                    uint64_t value)
 +{
-+    /* TODO: There are ASID fields in here with HCR_EL2.E2H */
++    CPUState *cs = env_cpu(env);
-+    raw_write(env, ri, value);
++
 +    tlb_flush_all_cpus_synced(cs);
 +}
 +
- static void vttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
++static const ARMCPRegInfo tlbi_rme_reginfo[] = {
-                         uint64_t value)
++    { .name = "TLBI_PAALL", .state = ARM_CP_STATE_AA64,
- {
++      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 4,
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
++      .access = PL3_W, .type = ARM_CP_NO_RAW,
-       .fieldoffset = offsetof(CPUARMState, cp15.tpidr_el[2]) },
++      .writefn = tlbi_aa64_paall_write },
-     { .name = "TTBR0_EL2", .state = ARM_CP_STATE_AA64,
++    { .name = "TLBI_PAALLOS", .state = ARM_CP_STATE_AA64,
-       .opc0 = 3, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 0,
++      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 4,
--      .access = PL2_RW, .resetvalue = 0,
++      .access = PL3_W, .type = ARM_CP_NO_RAW,
-+      .access = PL2_RW, .resetvalue = 0, .writefn = vmsa_tcr_ttbr_el2_write,
++      .writefn = tlbi_aa64_paallos_write },
-       .fieldoffset = offsetof(CPUARMState, cp15.ttbr0_el[2]) },
++    /*
-     { .name = "HTTBR", .cp = 15, .opc1 = 4, .crm = 2,
++     * QEMU does not have a way to invalidate by physical address, thus
-       .access = PL2_RW, .type = ARM_CP_64BIT | ARM_CP_ALIAS,
++     * invalidating a range of physical addresses is accomplished by
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vhe_reginfo[] = {
++     * flushing all tlb entries in the outer shareable domain,
-       .opc0 = 3, .opc1 = 4, .crn = 13, .crm = 0, .opc2 = 1,
++     * just like PAALLOS.
-       .access = PL2_RW,
++     */
-       .fieldoffset = offsetof(CPUARMState, cp15.contextidr_el[2]) },
++    { .name = "TLBI_RPALOS", .state = ARM_CP_STATE_AA64,
-+    { .name = "TTBR1_EL2", .state = ARM_CP_STATE_AA64,
++      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 7,
-+      .opc0 = 3, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 1,
++      .access = PL3_W, .type = ARM_CP_NO_RAW,
-+      .access = PL2_RW, .writefn = vmsa_tcr_ttbr_el2_write,
++      .writefn = tlbi_aa64_paallos_write },
-+      .fieldoffset = offsetof(CPUARMState, cp15.ttbr1_el[2]) },
++    { .name = "TLBI_RPAOS", .state = ARM_CP_STATE_AA64,
-     REGINFO_SENTINEL
++      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 3,
- };
++      .access = PL3_W, .type = ARM_CP_NO_RAW,
++      .writefn = tlbi_aa64_paallos_write },
 +};
 +
  #endif
  void define_tlb_insn_regs(ARMCPU *cpu)
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
      if (cpu_isar_feature(aa64_tlbios, cpu)) {
          define_arm_cp_regs(cpu, tlbios_reginfo);
      }
 +    if (cpu_isar_feature(aa64_rme, cpu)) {
 +        define_arm_cp_regs(cpu, tlbi_rme_reginfo);
 +    }
  #endif
  }
 --
-.20.1
+.34.1

-New patch
+[PULL 85/85] target/arm: Simplify condition for tlbi_el2_cp_reginfo[]
+We currently register the tlbi_el2_cp_reginfo[] TLBI insns if EL2 is
+implemented, or if EL3 and v8 is implemented.  This is a copy of the
+logic used for el2_cp_reginfo[], but for the specific case of the
+TLBI insns we can simplify it.  This is because we do not need the
+"if EL2 does not exist but EL3 does then EL2 registers should exist
+and be RAZ/WI" handling here: all our cpregs are for instructions,
+which UNDEF when EL3 exists and EL2 does not.
+Simplify the condition down to just "if EL2 exists".
+This is not a behaviour change because:
+ * for AArch64 insns we marked them with ARM_CP_EL3_NO_EL2_UNDEF,
+   which meant that define_arm_cp_regs() would ignore them if
+   EL2 wasn't present
+ * for AArch32 insns, the .access = PL2_W meant that if EL2
+   was not present the only way to get at them was from AArch32
+   EL3; but we have no CPUs which have ARM_FEATURE_V8 but
+   start in AArch32
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20241210160452.2427965-11-peter.maydell@linaro.org
+---
+ target/arm/tcg/tlb-insns.c | 4 +---
+file changed, 1 insertion(+), 3 deletions(-)
+diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/tcg/tlb-insns.c
++++ b/target/arm/tcg/tlb-insns.c
+@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
+      * ops (i.e. matching the condition for el2_cp_reginfo[] in
+      * helper.c), but we will be able to simplify this later.
+      */
+-    if (arm_feature(env, ARM_FEATURE_EL2)
+-        || (arm_feature(env, ARM_FEATURE_EL3)
+-            && arm_feature(env, ARM_FEATURE_V8))) {
++    if (arm_feature(env, ARM_FEATURE_EL2)) {
+         define_arm_cp_regs(cpu, tlbi_el2_cp_reginfo);
+     }
+     if (arm_feature(env, ARM_FEATURE_EL3)) {
+--
+.34.1

The big thing here is RTH's patchset implementing ARMv8.1-VHE
emulation; otherwise just a handful of smaller fixes.

thanks
-- PMM

The following changes since commit 346ed3151f1c43e72c40cb55b392a1d4cface62c:

Merge remote-tracking branch 'remotes/awilliam/tags/vfio-update-20200206.0' into staging (2020-02-07 11:52:15 +0000)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200207

for you to fetch changes up to af6c91b490e9b1bce7a168f8a9c848f3e60f616e:

stellaris: delay timer_new to avoid memleaks (2020-02-07 14:04:28 +0000)

----------------------------------------------------------------
target-arm queue:
 * monitor: fix query-cpu-model-expansion crash when using machine type none
 * Support emulation of the ARMv8.1-VHE architecture feature
 * bcm2835_dma: fix bugs in TD mode handling
 * docs/arm-cpu-features: Make kvm-no-adjvtime comment clearer
 * stellaris, stm32f2xx_timer, armv7m_systick: fix minor memory leaks

----------------------------------------------------------------
Alex Bennée (1):
      target/arm: check TGE and E2H flags for EL0 pauth traps

Liang Yan (1):
      target/arm/monitor: query-cpu-model-expansion crashed qemu when using machine type none

Pan Nengyuan (3):
      armv7m_systick: delay timer_new to avoid memleaks
      stm32f2xx_timer: delay timer_new to avoid memleaks
      stellaris: delay timer_new to avoid memleaks

Philippe Mathieu-Daudé (1):
      docs/arm-cpu-features: Make kvm-no-adjvtime comment clearer

Rene Stange (2):
      bcm2835_dma: Fix the ylen loop in TD mode
      bcm2835_dma: Re-initialize xlen in TD mode

Richard Henderson (40):
      target/arm: Define isar_feature_aa64_vh
      target/arm: Enable HCR_E2H for VHE
      target/arm: Add CONTEXTIDR_EL2
      target/arm: Add TTBR1_EL2
      target/arm: Update CNTVCT_EL0 for VHE
      target/arm: Split out vae1_tlbmask
      target/arm: Split out alle1_tlbmask
      target/arm: Simplify tlb_force_broadcast alternatives
      target/arm: Rename ARMMMUIdx*_S12NSE* to ARMMMUIdx*_E10_*
      target/arm: Rename ARMMMUIdx_S2NS to ARMMMUIdx_Stage2
      target/arm: Rename ARMMMUIdx_S1NSE* to ARMMMUIdx_Stage1_E*
      target/arm: Rename ARMMMUIdx_S1SE[01] to ARMMMUIdx_SE10_[01]
      target/arm: Rename ARMMMUIdx*_S1E3 to ARMMMUIdx*_SE3
      target/arm: Rename ARMMMUIdx_S1E2 to ARMMMUIdx_E2
      target/arm: Recover 4 bits from TBFLAGs
      target/arm: Expand TBFLAG_ANY.MMUIDX to 4 bits
      target/arm: Rearrange ARMMMUIdxBit
      target/arm: Tidy ARMMMUIdx m-profile definitions
      target/arm: Reorganize ARMMMUIdx
      target/arm: Add regime_has_2_ranges
      target/arm: Update arm_mmu_idx for VHE
      target/arm: Update arm_sctlr for VHE
      target/arm: Update aa64_zva_access for EL2
      target/arm: Update ctr_el0_access for EL2
      target/arm: Add the hypervisor virtual counter
      target/arm: Update timer access for VHE
      target/arm: Update define_one_arm_cp_reg_with_opaque for VHE
      target/arm: Add VHE system register redirection and aliasing
      target/arm: Add VHE timer register redirection and aliasing
      target/arm: Flush tlb for ASID changes in EL2&0 translation regime
      target/arm: Flush tlbs for E2&0 translation regime
      target/arm: Update arm_phys_excp_target_el for TGE
      target/arm: Update {fp,sve}_exception_el for VHE
      target/arm: Update get_a64_user_mem_index for VHE
      target/arm: Update arm_cpu_do_interrupt_aarch64 for VHE
      target/arm: Enable ARMv8.1-VHE in -cpu max
      target/arm: Move arm_excp_unmasked to cpu.c
      target/arm: Pass more cpu state to arm_excp_unmasked
      target/arm: Use bool for unmasked in arm_excp_unmasked
      target/arm: Raise only one interrupt in arm_cpu_exec_interrupt

From: Liang Yan <lyan@suse.com>

Commit e19afd566781 mentioned that target-arm only supports queryable
cpu models 'max', 'host', and the current type when KVM is in use.
The logic works well until using machine type none.

For machine type none, cpu_type will be null if cpu option is not
set by command line, strlen(cpu_type) will terminate process.
So We add a check above it.

This won't affect i386 and s390x since they do not use current_cpu.

Signed-off-by: Liang Yan <lyan@suse.com>
Message-id: 20200203134251.12986-1-lyan@suse.com
Reviewed-by: Andrew Jones <drjones@redhat.com>
Tested-by: Andrew Jones <drjones@redhat.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/monitor.c | 15 +++++++++------
 1 file changed, 9 insertions(+), 6 deletions(-)

diff --git a/target/arm/monitor.c b/target/arm/monitor.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/monitor.c
+++ b/target/arm/monitor.c
@@ -XXX,XX +XXX,XX @@ CpuModelExpansionInfo *qmp_query_cpu_model_expansion(CpuModelExpansionType type,
     }
 
     if (kvm_enabled()) {
-        const char *cpu_type = current_machine->cpu_type;
-        int len = strlen(cpu_type) - strlen(ARM_CPU_TYPE_SUFFIX);
         bool supported = false;
 
         if (!strcmp(model->name, "host") || !strcmp(model->name, "max")) {
             /* These are kvmarm's recommended cpu types */
             supported = true;
-        } else if (strlen(model->name) == len &&
-                   !strncmp(model->name, cpu_type, len)) {
-            /* KVM is enabled and we're using this type, so it works. */
-            supported = true;
+        } else if (current_machine->cpu_type) {
+            const char *cpu_type = current_machine->cpu_type;
+            int len = strlen(cpu_type) - strlen(ARM_CPU_TYPE_SUFFIX);
+
+            if (strlen(model->name) == len &&
+                !strncmp(model->name, cpu_type, len)) {
+                /* KVM is enabled and we're using this type, so it works. */
+                supported = true;
+            }
         }
         if (!supported) {
             error_setg(errp, "We cannot guarantee the CPU type '%s' works "
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline void xpsr_write(CPUARMState *env, uint32_t val, uint32_t mask)
 #define HCR_ATA       (1ULL << 56)
 #define HCR_DCT       (1ULL << 57)
 
-/*
- * When we actually implement ARMv8.1-VHE we should add HCR_E2H to
- * HCR_MASK and then clear it again if the feature bit is not set in
- * hcr_write().
- */
-#define HCR_MASK      ((1ULL << 34) - 1)
-
 #define SCR_NS                (1U << 0)
 #define SCR_IRQ               (1U << 1)
 #define SCR_FIQ               (1U << 2)
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_no_el2_v8_cp_reginfo[] = {
 static void hcr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
 {
     ARMCPU *cpu = env_archcpu(env);
-    uint64_t valid_mask = HCR_MASK;
+    /* Begin with bits defined in base ARMv8.0.  */
+    uint64_t valid_mask = MAKE_64BIT_MASK(0, 34);
 
     if (arm_feature(env, ARM_FEATURE_EL3)) {
         valid_mask &= ~HCR_HCD;
@@ -XXX,XX +XXX,XX @@ static void hcr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
          */
         valid_mask &= ~HCR_TSC;
     }
+    if (cpu_isar_feature(aa64_vh, cpu)) {
+        valid_mask |= HCR_E2H;
+    }
     if (cpu_isar_feature(aa64_lor, cpu)) {
         valid_mask |= HCR_TLOR;
     }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Not all of the breakpoint types are supported, but those that
only examine contextidr are extended to support the new register.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/debug_helper.c | 50 +++++++++++++++++++++++++++++----------
 target/arm/helper.c       | 12 ++++++++++
 2 files changed, 50 insertions(+), 12 deletions(-)

diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/debug_helper.c
+++ b/target/arm/debug_helper.c
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
     int ctx_cmps = extract32(cpu->dbgdidr, 20, 4);
     int bt;
     uint32_t contextidr;
+    uint64_t hcr_el2;
 
     /*
      * Links to unimplemented or non-context aware breakpoints are
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
     }
 
     bt = extract64(bcr, 20, 4);
-
-    /*
-     * We match the whole register even if this is AArch32 using the
-     * short descriptor format (in which case it holds both PROCID and ASID),
-     * since we don't implement the optional v7 context ID masking.
-     */
-    contextidr = extract64(env->cp15.contextidr_el[1], 0, 32);
+    hcr_el2 = arm_hcr_el2_eff(env);
 
     switch (bt) {
     case 3: /* linked context ID match */
-        if (arm_current_el(env) > 1) {
-            /* Context matches never fire in EL2 or (AArch64) EL3 */
+        switch (arm_current_el(env)) {
+        default:
+            /* Context matches never fire in AArch64 EL3 */
             return false;
+        case 2:
+            if (!(hcr_el2 & HCR_E2H)) {
+                /* Context matches never fire in EL2 without E2H enabled. */
+                return false;
+            }
+            contextidr = env->cp15.contextidr_el[2];
+            break;
+        case 1:
+            contextidr = env->cp15.contextidr_el[1];
+            break;
+        case 0:
+            if ((hcr_el2 & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+                contextidr = env->cp15.contextidr_el[2];
+            } else {
+                contextidr = env->cp15.contextidr_el[1];
+            }
+            break;
         }
-        return (contextidr == extract64(env->cp15.dbgbvr[lbn], 0, 32));
-    case 5: /* linked address mismatch (reserved in AArch64) */
+        break;
+
+    case 7:  /* linked contextidr_el1 match */
+        contextidr = env->cp15.contextidr_el[1];
+        break;
+    case 13: /* linked contextidr_el2 match */
+        contextidr = env->cp15.contextidr_el[2];
+        break;
+
     case 9: /* linked VMID match (reserved if no EL2) */
     case 11: /* linked context ID and VMID match (reserved if no EL2) */
+    case 15: /* linked full context ID match */
     default:
         /*
          * Links to Unlinked context breakpoints must generate no
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
         return false;
     }
 
-    return false;
+    /*
+     * We match the whole register even if this is AArch32 using the
+     * short descriptor format (in which case it holds both PROCID and ASID),
+     * since we don't implement the optional v7 context ID masking.
+     */
+    return contextidr == (uint32_t)env->cp15.dbgbvr[lbn];
 }
 
 static bool bp_wp_matches(ARMCPU *cpu, int n, bool is_wp)
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo jazelle_regs[] = {
     REGINFO_SENTINEL
 };
 
+static const ARMCPRegInfo vhe_reginfo[] = {
+    { .name = "CONTEXTIDR_EL2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 4, .crn = 13, .crm = 0, .opc2 = 1,
+      .access = PL2_RW,
+      .fieldoffset = offsetof(CPUARMState, cp15.contextidr_el[2]) },
+    REGINFO_SENTINEL
+};
+
 void register_cp_regs_for_features(ARMCPU *cpu)
 {
     /* Register all the coprocessor registers based on feature bits */
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
         define_arm_cp_regs(cpu, lor_reginfo);
     }
 
+    if (arm_feature(env, ARM_FEATURE_EL2) && cpu_isar_feature(aa64_vh, cpu)) {
+        define_arm_cp_regs(cpu, vhe_reginfo);
+    }
+
     if (cpu_isar_feature(aa64_sve, cpu)) {
         define_one_arm_cp_reg(cpu, &zcr_el1_reginfo);
         if (arm_feature(env, ARM_FEATURE_EL2)) {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

At the same time, add writefn to TTBR0_EL2 and TCR_EL2.
A later patch will update any ASID therein.

From: Richard Henderson <richard.henderson@linaro.org>

The virtual offset may be 0 depending on EL, E2H and TGE.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t gt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
     return gt_get_countervalue(env);
 }
 
+static uint64_t gt_virt_cnt_offset(CPUARMState *env)
+{
+    uint64_t hcr;
+
+    switch (arm_current_el(env)) {
+    case 2:
+        hcr = arm_hcr_el2_eff(env);
+        if (hcr & HCR_E2H) {
+            return 0;
+        }
+        break;
+    case 0:
+        hcr = arm_hcr_el2_eff(env);
+        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+            return 0;
+        }
+        break;
+    }
+
+    return env->cp15.cntvoff_el2;
+}
+
 static uint64_t gt_virt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
 {
-    return gt_get_countervalue(env) - env->cp15.cntvoff_el2;
+    return gt_get_countervalue(env) - gt_virt_cnt_offset(env);
 }
 
 static void gt_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void gt_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static uint64_t gt_tval_read(CPUARMState *env, const ARMCPRegInfo *ri,
                              int timeridx)
 {
-    uint64_t offset = timeridx == GTIMER_VIRT ? env->cp15.cntvoff_el2 : 0;
+    uint64_t offset = 0;
+
+    switch (timeridx) {
+    case GTIMER_VIRT:
+        offset = gt_virt_cnt_offset(env);
+        break;
+    }
 
     return (uint32_t)(env->cp15.c14_timer[timeridx].cval -
                       (gt_get_countervalue(env) - offset));
@@ -XXX,XX +XXX,XX @@ static void gt_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
                           int timeridx,
                           uint64_t value)
 {
-    uint64_t offset = timeridx == GTIMER_VIRT ? env->cp15.cntvoff_el2 : 0;
+    uint64_t offset = 0;
+
+    switch (timeridx) {
+    case GTIMER_VIRT:
+        offset = gt_virt_cnt_offset(env);
+        break;
+    }
 
     trace_arm_gt_tval_write(timeridx, value);
     env->cp15.c14_timer[timeridx].cval = gt_get_countervalue(env) - offset +
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

No functional change, but unify code sequences.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-7-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 32 +++++++++++++-------------------
 1 file changed, 13 insertions(+), 19 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
  * Page D4-1736 (DDI0487A.b)
  */
 
+static int vae1_tlbmask(CPUARMState *env)
+{
+    if (arm_is_secure_below_el3(env)) {
+        return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
+    } else {
+        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
+    }
+}
+
 static void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                       uint64_t value)
 {
     CPUState *cs = env_cpu(env);
-    bool sec = arm_is_secure_below_el3(env);
+    int mask = vae1_tlbmask(env);
 
-    if (sec) {
-        tlb_flush_by_mmuidx_all_cpus_synced(cs,
-                                            ARMMMUIdxBit_S1SE1 |
-                                            ARMMMUIdxBit_S1SE0);
-    } else {
-        tlb_flush_by_mmuidx_all_cpus_synced(cs,
-                                            ARMMMUIdxBit_S12NSE1 |
-                                            ARMMMUIdxBit_S12NSE0);
-    }
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 }
 
 static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
 {
     CPUState *cs = env_cpu(env);
+    int mask = vae1_tlbmask(env);
 
     if (tlb_force_broadcast(env)) {
         tlbi_aa64_vmalle1is_write(env, NULL, value);
         return;
     }
 
-    if (arm_is_secure_below_el3(env)) {
-        tlb_flush_by_mmuidx(cs,
-                            ARMMMUIdxBit_S1SE1 |
-                            ARMMMUIdxBit_S1SE0);
-    } else {
-        tlb_flush_by_mmuidx(cs,
-                            ARMMMUIdxBit_S12NSE1 |
-                            ARMMMUIdxBit_S12NSE0);
-    }
+    tlb_flush_by_mmuidx(cs, mask);
 }
 
 static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

No functional change, but unify code sequences.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-8-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 86 +++++++++++++--------------------------------
 1 file changed, 24 insertions(+), 62 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx(cs, mask);
 }
 
-static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                  uint64_t value)
+static int alle1_tlbmask(CPUARMState *env)
 {
-    /* Note that the 'ALL' scope must invalidate both stage 1 and
+    /*
+     * Note that the 'ALL' scope must invalidate both stage 1 and
      * stage 2 translations, whereas most other scopes only invalidate
      * stage 1 translations.
      */
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
-
     if (arm_is_secure_below_el3(env)) {
-        tlb_flush_by_mmuidx(cs,
-                            ARMMMUIdxBit_S1SE1 |
-                            ARMMMUIdxBit_S1SE0);
+        return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
+    } else if (arm_feature(env, ARM_FEATURE_EL2)) {
+        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0 | ARMMMUIdxBit_S2NS;
     } else {
-        if (arm_feature(env, ARM_FEATURE_EL2)) {
-            tlb_flush_by_mmuidx(cs,
-                                ARMMMUIdxBit_S12NSE1 |
-                                ARMMMUIdxBit_S12NSE0 |
-                                ARMMMUIdxBit_S2NS);
-        } else {
-            tlb_flush_by_mmuidx(cs,
-                                ARMMMUIdxBit_S12NSE1 |
-                                ARMMMUIdxBit_S12NSE0);
-        }
+        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
     }
 }
 
+static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = alle1_tlbmask(env);
+
+    tlb_flush_by_mmuidx(cs, mask);
+}
+
 static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
 {
-    /* Note that the 'ALL' scope must invalidate both stage 1 and
-     * stage 2 translations, whereas most other scopes only invalidate
-     * stage 1 translations.
-     */
     CPUState *cs = env_cpu(env);
-    bool sec = arm_is_secure_below_el3(env);
-    bool has_el2 = arm_feature(env, ARM_FEATURE_EL2);
+    int mask = alle1_tlbmask(env);
 
-    if (sec) {
-        tlb_flush_by_mmuidx_all_cpus_synced(cs,
-                                            ARMMMUIdxBit_S1SE1 |
-                                            ARMMMUIdxBit_S1SE0);
-    } else if (has_el2) {
-        tlb_flush_by_mmuidx_all_cpus_synced(cs,
-                                            ARMMMUIdxBit_S12NSE1 |
-                                            ARMMMUIdxBit_S12NSE0 |
-                                            ARMMMUIdxBit_S2NS);
-    } else {
-          tlb_flush_by_mmuidx_all_cpus_synced(cs,
-                                              ARMMMUIdxBit_S12NSE1 |
-                                              ARMMMUIdxBit_S12NSE0);
-    }
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 }
 
 static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                    uint64_t value)
 {
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
-    bool sec = arm_is_secure_below_el3(env);
+    CPUState *cs = env_cpu(env);
+    int mask = vae1_tlbmask(env);
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
 
-    if (sec) {
-        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                                 ARMMMUIdxBit_S1SE1 |
-                                                 ARMMMUIdxBit_S1SE0);
-    } else {
-        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                                 ARMMMUIdxBit_S12NSE1 |
-                                                 ARMMMUIdxBit_S12NSE0);
-    }
+    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
 }
 
 static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
      * since we don't support flush-for-specific-ASID-only or
      * flush-last-level-only.
      */
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
+    CPUState *cs = env_cpu(env);
+    int mask = vae1_tlbmask(env);
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
 
     if (tlb_force_broadcast(env)) {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
         return;
     }
 
-    if (arm_is_secure_below_el3(env)) {
-        tlb_flush_page_by_mmuidx(cs, pageaddr,
-                                 ARMMMUIdxBit_S1SE1 |
-                                 ARMMMUIdxBit_S1SE0);
-    } else {
-        tlb_flush_page_by_mmuidx(cs, pageaddr,
-                                 ARMMMUIdxBit_S12NSE1 |
-                                 ARMMMUIdxBit_S12NSE0);
-    }
+    tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
 }
 
 static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Rather than call to a separate function and re-compute any
parameters for the flush, simply use the correct flush
function directly.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
                           uint64_t value)
 {
     /* Invalidate all (TLBIALL) */
-    ARMCPU *cpu = env_archcpu(env);
+    CPUState *cs = env_cpu(env);
 
     if (tlb_force_broadcast(env)) {
-        tlbiall_is_write(env, NULL, value);
-        return;
+        tlb_flush_all_cpus_synced(cs);
+    } else {
+        tlb_flush(cs);
     }
-
-    tlb_flush(CPU(cpu));
 }
 
 static void tlbimva_write(CPUARMState *env, const ARMCPRegInfo *ri,
                           uint64_t value)
 {
     /* Invalidate single TLB entry by MVA and ASID (TLBIMVA) */
-    ARMCPU *cpu = env_archcpu(env);
+    CPUState *cs = env_cpu(env);
 
+    value &= TARGET_PAGE_MASK;
     if (tlb_force_broadcast(env)) {
-        tlbimva_is_write(env, NULL, value);
-        return;
+        tlb_flush_page_all_cpus_synced(cs, value);
+    } else {
+        tlb_flush_page(cs, value);
     }
-
-    tlb_flush_page(CPU(cpu), value & TARGET_PAGE_MASK);
 }
 
 static void tlbiasid_write(CPUARMState *env, const ARMCPRegInfo *ri,
                            uint64_t value)
 {
     /* Invalidate by ASID (TLBIASID) */
-    ARMCPU *cpu = env_archcpu(env);
+    CPUState *cs = env_cpu(env);
 
     if (tlb_force_broadcast(env)) {
-        tlbiasid_is_write(env, NULL, value);
-        return;
+        tlb_flush_all_cpus_synced(cs);
+    } else {
+        tlb_flush(cs);
     }
-
-    tlb_flush(CPU(cpu));
 }
 
 static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
                            uint64_t value)
 {
     /* Invalidate single entry by MVA, all ASIDs (TLBIMVAA) */
-    ARMCPU *cpu = env_archcpu(env);
+    CPUState *cs = env_cpu(env);
 
+    value &= TARGET_PAGE_MASK;
     if (tlb_force_broadcast(env)) {
-        tlbimvaa_is_write(env, NULL, value);
-        return;
+        tlb_flush_page_all_cpus_synced(cs, value);
+    } else {
+        tlb_flush_page(cs, value);
     }
-
-    tlb_flush_page(CPU(cpu), value & TARGET_PAGE_MASK);
 }
 
 static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
     int mask = vae1_tlbmask(env);
 
     if (tlb_force_broadcast(env)) {
-        tlbi_aa64_vmalle1is_write(env, NULL, value);
-        return;
+        tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+    } else {
+        tlb_flush_by_mmuidx(cs, mask);
     }
-
-    tlb_flush_by_mmuidx(cs, mask);
 }
 
 static int alle1_tlbmask(CPUARMState *env)
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
 
     if (tlb_force_broadcast(env)) {
-        tlbi_aa64_vae1is_write(env, NULL, value);
-        return;
+        tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, mask);
+    } else {
+        tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
     }
-
-    tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
 }
 
 static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is part of a reorganization to the set of mmu_idx.
This emphasizes that they apply to the EL1&0 regime.

The ultimate goal is

-- Non-secure regimes:
    ARMMMUIdx_E10_0,
    ARMMMUIdx_E20_0,
    ARMMMUIdx_E10_1,
    ARMMMUIdx_E2,
    ARMMMUIdx_E20_2,

-- Secure regimes:
    ARMMMUIdx_SE10_0,
    ARMMMUIdx_SE10_1,
    ARMMMUIdx_SE3,

-- Helper mmu_idx for non-secure EL1&0 stage1 and stage2
    ARMMMUIdx_Stage2,
    ARMMMUIdx_Stage1_E0,
    ARMMMUIdx_Stage1_E1,

The 'S' prefix is reserved for "Secure".  Unless otherwise specified,
each mmu_idx represents all stages of translation.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-10-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h           |  8 ++++----
 target/arm/internals.h     |  4 ++--
 target/arm/helper.c        | 40 +++++++++++++++++++-------------------
 target/arm/translate-a64.c |  4 ++--
 target/arm/translate.c     |  6 +++---
 5 files changed, 31 insertions(+), 31 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
 #define ARM_MMU_IDX_COREIDX_MASK 0x7
 
 typedef enum ARMMMUIdx {
-    ARMMMUIdx_S12NSE0 = 0 | ARM_MMU_IDX_A,
-    ARMMMUIdx_S12NSE1 = 1 | ARM_MMU_IDX_A,
+    ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
+    ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
     ARMMMUIdx_S1E2 = 2 | ARM_MMU_IDX_A,
     ARMMMUIdx_S1E3 = 3 | ARM_MMU_IDX_A,
     ARMMMUIdx_S1SE0 = 4 | ARM_MMU_IDX_A,
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
  * for use when calling tlb_flush_by_mmuidx() and friends.
  */
 typedef enum ARMMMUIdxBit {
-    ARMMMUIdxBit_S12NSE0 = 1 << 0,
-    ARMMMUIdxBit_S12NSE1 = 1 << 1,
+    ARMMMUIdxBit_E10_0 = 1 << 0,
+    ARMMMUIdxBit_E10_1 = 1 << 1,
     ARMMMUIdxBit_S1E2 = 1 << 2,
     ARMMMUIdxBit_S1E3 = 1 << 3,
     ARMMMUIdxBit_S1SE0 = 1 << 4,
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline void arm_call_el_change_hook(ARMCPU *cpu)
 static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     switch (mmu_idx) {
-    case ARMMMUIdx_S12NSE0:
-    case ARMMMUIdx_S12NSE1:
+    case ARMMMUIdx_E10_0:
+    case ARMMMUIdx_E10_1:
     case ARMMMUIdx_S1NSE0:
     case ARMMMUIdx_S1NSE1:
     case ARMMMUIdx_S1E2:
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
     CPUState *cs = env_cpu(env);
 
     tlb_flush_by_mmuidx(cs,
-                        ARMMMUIdxBit_S12NSE1 |
-                        ARMMMUIdxBit_S12NSE0 |
+                        ARMMMUIdxBit_E10_1 |
+                        ARMMMUIdxBit_E10_0 |
                         ARMMMUIdxBit_S2NS);
 }
 
@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     CPUState *cs = env_cpu(env);
 
     tlb_flush_by_mmuidx_all_cpus_synced(cs,
-                                        ARMMMUIdxBit_S12NSE1 |
-                                        ARMMMUIdxBit_S12NSE0 |
+                                        ARMMMUIdxBit_E10_1 |
+                                        ARMMMUIdxBit_E10_0 |
                                         ARMMMUIdxBit_S2NS);
 }
 
@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
         format64 = arm_s1_regime_using_lpae_format(env, mmu_idx);
 
         if (arm_feature(env, ARM_FEATURE_EL2)) {
-            if (mmu_idx == ARMMMUIdx_S12NSE0 || mmu_idx == ARMMMUIdx_S12NSE1) {
+            if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
                 format64 |= env->cp15.hcr_el2 & (HCR_VM | HCR_DC);
             } else {
                 format64 |= arm_current_el(env) == 2;
@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
         break;
     case 4:
         /* stage 1+2 NonSecure PL1: ATS12NSOPR, ATS12NSOPW */
-        mmu_idx = ARMMMUIdx_S12NSE1;
+        mmu_idx = ARMMMUIdx_E10_1;
         break;
     case 6:
         /* stage 1+2 NonSecure PL0: ATS12NSOUR, ATS12NSOUW */
-        mmu_idx = ARMMMUIdx_S12NSE0;
+        mmu_idx = ARMMMUIdx_E10_0;
         break;
     default:
         g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
         mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S1NSE0;
         break;
     case 4: /* AT S12E1R, AT S12E1W */
-        mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_S12NSE1;
+        mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_E10_1;
         break;
     case 6: /* AT S12E0R, AT S12E0W */
-        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S12NSE0;
+        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_E10_0;
         break;
     default:
         g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void vttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
     /* Accesses to VTTBR may change the VMID so we must flush the TLB.  */
     if (raw_read(env, ri) != value) {
         tlb_flush_by_mmuidx(cs,
-                            ARMMMUIdxBit_S12NSE1 |
-                            ARMMMUIdxBit_S12NSE0 |
+                            ARMMMUIdxBit_E10_1 |
+                            ARMMMUIdxBit_E10_0 |
                             ARMMMUIdxBit_S2NS);
         raw_write(env, ri, value);
     }
@@ -XXX,XX +XXX,XX @@ static int vae1_tlbmask(CPUARMState *env)
     if (arm_is_secure_below_el3(env)) {
         return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
     } else {
-        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
     if (arm_is_secure_below_el3(env)) {
         return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
     } else if (arm_feature(env, ARM_FEATURE_EL2)) {
-        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0 | ARMMMUIdxBit_S2NS;
+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_S2NS;
     } else {
-        return ARMMMUIdxBit_S12NSE1 | ARMMMUIdxBit_S12NSE0;
+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
  */
 static inline ARMMMUIdx stage_1_mmu_idx(ARMMMUIdx mmu_idx)
 {
-    if (mmu_idx == ARMMMUIdx_S12NSE0 || mmu_idx == ARMMMUIdx_S12NSE1) {
-        mmu_idx += (ARMMMUIdx_S1NSE0 - ARMMMUIdx_S12NSE0);
+    if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
+        mmu_idx += (ARMMMUIdx_S1NSE0 - ARMMMUIdx_E10_0);
     }
     return mmu_idx;
 }
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
         return true;
     default:
         return false;
-    case ARMMMUIdx_S12NSE0:
-    case ARMMMUIdx_S12NSE1:
+    case ARMMMUIdx_E10_0:
+    case ARMMMUIdx_E10_1:
         g_assert_not_reached();
     }
 }
@@ -XXX,XX +XXX,XX @@ bool get_phys_addr(CPUARMState *env, target_ulong address,
                    target_ulong *page_size,
                    ARMMMUFaultInfo *fi, ARMCacheAttrs *cacheattrs)
 {
-    if (mmu_idx == ARMMMUIdx_S12NSE0 || mmu_idx == ARMMMUIdx_S12NSE1) {
+    if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
         /* Call ourselves recursively to do the stage 1 and then stage 2
          * translations.
          */
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
     if (el < 2 && arm_is_secure_below_el3(env)) {
         return ARMMMUIdx_S1SE0 + el;
     } else {
-        return ARMMMUIdx_S12NSE0 + el;
+        return ARMMMUIdx_E10_0 + el;
     }
 }
 
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a64_user_mem_index(DisasContext *s)
     ARMMMUIdx useridx;
 
     switch (s->mmu_idx) {
-    case ARMMMUIdx_S12NSE1:
-        useridx = ARMMMUIdx_S12NSE0;
+    case ARMMMUIdx_E10_1:
+        useridx = ARMMMUIdx_E10_0;
         break;
     case ARMMMUIdx_S1SE1:
         useridx = ARMMMUIdx_S1SE0;
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
      */
     switch (s->mmu_idx) {
     case ARMMMUIdx_S1E2:        /* this one is UNPREDICTABLE */
-    case ARMMMUIdx_S12NSE0:
-    case ARMMMUIdx_S12NSE1:
-        return arm_to_core_mmu_idx(ARMMMUIdx_S12NSE0);
+    case ARMMMUIdx_E10_0:
+    case ARMMMUIdx_E10_1:
+        return arm_to_core_mmu_idx(ARMMMUIdx_E10_0);
     case ARMMMUIdx_S1E3:
     case ARMMMUIdx_S1SE0:
     case ARMMMUIdx_S1SE1:
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The EL1&0 regime is the only one that uses 2-stage translation.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-11-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h           |  4 +--
 target/arm/internals.h     |  2 +-
 target/arm/helper.c        | 57 ++++++++++++++++++++------------------
 target/arm/translate-a64.c |  2 +-
 target/arm/translate.c     |  2 +-
 5 files changed, 35 insertions(+), 32 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
     ARMMMUIdx_S1E3 = 3 | ARM_MMU_IDX_A,
     ARMMMUIdx_S1SE0 = 4 | ARM_MMU_IDX_A,
     ARMMMUIdx_S1SE1 = 5 | ARM_MMU_IDX_A,
-    ARMMMUIdx_S2NS = 6 | ARM_MMU_IDX_A,
+    ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
     ARMMMUIdx_MUser = 0 | ARM_MMU_IDX_M,
     ARMMMUIdx_MPriv = 1 | ARM_MMU_IDX_M,
     ARMMMUIdx_MUserNegPri = 2 | ARM_MMU_IDX_M,
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdxBit {
     ARMMMUIdxBit_S1E3 = 1 << 3,
     ARMMMUIdxBit_S1SE0 = 1 << 4,
     ARMMMUIdxBit_S1SE1 = 1 << 5,
-    ARMMMUIdxBit_S2NS = 1 << 6,
+    ARMMMUIdxBit_Stage2 = 1 << 6,
     ARMMMUIdxBit_MUser = 1 << 0,
     ARMMMUIdxBit_MPriv = 1 << 1,
     ARMMMUIdxBit_MUserNegPri = 1 << 2,
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
     case ARMMMUIdx_S1NSE0:
     case ARMMMUIdx_S1NSE1:
     case ARMMMUIdx_S1E2:
-    case ARMMMUIdx_S2NS:
+    case ARMMMUIdx_Stage2:
     case ARMMMUIdx_MPrivNegPri:
     case ARMMMUIdx_MUserNegPri:
     case ARMMMUIdx_MPriv:
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx(cs,
                         ARMMMUIdxBit_E10_1 |
                         ARMMMUIdxBit_E10_0 |
-                        ARMMMUIdxBit_S2NS);
+                        ARMMMUIdxBit_Stage2);
 }
 
 static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiall_nsnh_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs,
                                         ARMMMUIdxBit_E10_1 |
                                         ARMMMUIdxBit_E10_0 |
-                                        ARMMMUIdxBit_S2NS);
+                                        ARMMMUIdxBit_Stage2);
 }
 
 static void tlbiipas2_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiipas2_write(CPUARMState *env, const ARMCPRegInfo *ri,
 
     pageaddr = sextract64(value << 12, 0, 40);
 
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S2NS);
+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
 }
 
 static void tlbiipas2_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiipas2_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     pageaddr = sextract64(value << 12, 0, 40);
 
     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                             ARMMMUIdxBit_S2NS);
+                                             ARMMMUIdxBit_Stage2);
 }
 
 static void tlbiall_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void vttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
     ARMCPU *cpu = env_archcpu(env);
     CPUState *cs = CPU(cpu);
 
-    /* Accesses to VTTBR may change the VMID so we must flush the TLB.  */
+    /*
+     * A change in VMID to the stage2 page table (Stage2) invalidates
+     * the combined stage 1&2 tlbs (EL10_1 and EL10_0).
+     */
     if (raw_read(env, ri) != value) {
         tlb_flush_by_mmuidx(cs,
                             ARMMMUIdxBit_E10_1 |
                             ARMMMUIdxBit_E10_0 |
-                            ARMMMUIdxBit_S2NS);
+                            ARMMMUIdxBit_Stage2);
         raw_write(env, ri, value);
     }
 }
@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
     if (arm_is_secure_below_el3(env)) {
         return ARMMMUIdxBit_S1SE1 | ARMMMUIdxBit_S1SE0;
     } else if (arm_feature(env, ARM_FEATURE_EL2)) {
-        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_S2NS;
+        return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0 | ARMMMUIdxBit_Stage2;
     } else {
         return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
     }
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 
     pageaddr = sextract64(value << 12, 0, 48);
 
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S2NS);
+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
 }
 
 static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     pageaddr = sextract64(value << 12, 0, 48);
 
     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                             ARMMMUIdxBit_S2NS);
+                                             ARMMMUIdxBit_Stage2);
 }
 
 static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_interrupt(CPUState *cs)
 static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     switch (mmu_idx) {
-    case ARMMMUIdx_S2NS:
+    case ARMMMUIdx_Stage2:
     case ARMMMUIdx_S1E2:
         return 2;
     case ARMMMUIdx_S1E3:
@@ -XXX,XX +XXX,XX @@ static inline bool regime_translation_disabled(CPUARMState *env,
         }
     }
 
-    if (mmu_idx == ARMMMUIdx_S2NS) {
+    if (mmu_idx == ARMMMUIdx_Stage2) {
         /* HCR.DC means HCR.VM behaves as 1 */
         return (env->cp15.hcr_el2 & (HCR_DC | HCR_VM)) == 0;
     }
@@ -XXX,XX +XXX,XX @@ static inline bool regime_translation_big_endian(CPUARMState *env,
 static inline uint64_t regime_ttbr(CPUARMState *env, ARMMMUIdx mmu_idx,
                                    int ttbrn)
 {
-    if (mmu_idx == ARMMMUIdx_S2NS) {
+    if (mmu_idx == ARMMMUIdx_Stage2) {
         return env->cp15.vttbr_el2;
     }
     if (ttbrn == 0) {
@@ -XXX,XX +XXX,XX @@ static inline uint64_t regime_ttbr(CPUARMState *env, ARMMMUIdx mmu_idx,
 /* Return the TCR controlling this translation regime */
 static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
-    if (mmu_idx == ARMMMUIdx_S2NS) {
+    if (mmu_idx == ARMMMUIdx_Stage2) {
         return &env->cp15.vtcr_el2;
     }
     return &env->cp15.tcr_el[regime_el(env, mmu_idx)];
@@ -XXX,XX +XXX,XX @@ static int get_S1prot(CPUARMState *env, ARMMMUIdx mmu_idx, bool is_aa64,
     bool have_wxn;
     int wxn = 0;
 
-    assert(mmu_idx != ARMMMUIdx_S2NS);
+    assert(mmu_idx != ARMMMUIdx_Stage2);
 
     user_rw = simple_ap_to_rw_prot_is_user(ap, true);
     if (is_user) {
@@ -XXX,XX +XXX,XX @@ static hwaddr S1_ptw_translate(CPUARMState *env, ARMMMUIdx mmu_idx,
                                ARMMMUFaultInfo *fi)
 {
     if ((mmu_idx == ARMMMUIdx_S1NSE0 || mmu_idx == ARMMMUIdx_S1NSE1) &&
-        !regime_translation_disabled(env, ARMMMUIdx_S2NS)) {
+        !regime_translation_disabled(env, ARMMMUIdx_Stage2)) {
         target_ulong s2size;
         hwaddr s2pa;
         int s2prot;
@@ -XXX,XX +XXX,XX @@ static hwaddr S1_ptw_translate(CPUARMState *env, ARMMMUIdx mmu_idx,
             pcacheattrs = &cacheattrs;
         }
 
-        ret = get_phys_addr_lpae(env, addr, 0, ARMMMUIdx_S2NS, &s2pa,
+        ret = get_phys_addr_lpae(env, addr, 0, ARMMMUIdx_Stage2, &s2pa,
                                  &txattrs, &s2prot, &s2size, fi, pcacheattrs);
         if (ret) {
             assert(fi->type != ARMFault_None);
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
         tsz = extract32(tcr, 0, 6);
         using64k = extract32(tcr, 14, 1);
         using16k = extract32(tcr, 15, 1);
-        if (mmu_idx == ARMMMUIdx_S2NS) {
+        if (mmu_idx == ARMMMUIdx_Stage2) {
             /* VTCR_EL2 */
             tbi = tbid = hpd = false;
         } else {
@@ -XXX,XX +XXX,XX @@ static ARMVAParameters aa32_va_parameters(CPUARMState *env, uint32_t va,
     int select, tsz;
     bool epd, hpd;
 
-    if (mmu_idx == ARMMMUIdx_S2NS) {
+    if (mmu_idx == ARMMMUIdx_Stage2) {
         /* VTCR */
         bool sext = extract32(tcr, 4, 1);
         bool sign = extract32(tcr, 3, 1);
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
         level = 1;
         /* There is no TTBR1 for EL2 */
         ttbr1_valid = (el != 2);
-        addrsize = (mmu_idx == ARMMMUIdx_S2NS ? 40 : 32);
+        addrsize = (mmu_idx == ARMMMUIdx_Stage2 ? 40 : 32);
         inputsize = addrsize - param.tsz;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
         goto do_fault;
     }
 
-    if (mmu_idx != ARMMMUIdx_S2NS) {
+    if (mmu_idx != ARMMMUIdx_Stage2) {
         /* The starting level depends on the virtual address size (which can
          * be up to 48 bits) and the translation granule size. It indicates
          * the number of strides (stride bits at a time) needed to
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
         attrs = extract64(descriptor, 2, 10)
             | (extract64(descriptor, 52, 12) << 10);
 
-        if (mmu_idx == ARMMMUIdx_S2NS) {
+        if (mmu_idx == ARMMMUIdx_Stage2) {
             /* Stage 2 table descriptors do not include any attribute fields */
             break;
         }
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
     ap = extract32(attrs, 4, 2);
     xn = extract32(attrs, 12, 1);
 
-    if (mmu_idx == ARMMMUIdx_S2NS) {
+    if (mmu_idx == ARMMMUIdx_Stage2) {
         ns = true;
         *prot = get_S2prot(env, ap, xn);
     } else {
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
     }
 
     if (cacheattrs != NULL) {
-        if (mmu_idx == ARMMMUIdx_S2NS) {
+        if (mmu_idx == ARMMMUIdx_Stage2) {
             cacheattrs->attrs = convert_stage2_attrs(env,
                                                      extract32(attrs, 0, 4));
         } else {
@@ -XXX,XX +XXX,XX @@ do_fault:
     fi->type = fault_type;
     fi->level = level;
     /* Tag the error as S2 for failed S1 PTW at S2 or ordinary S2.  */
-    fi->stage2 = fi->s1ptw || (mmu_idx == ARMMMUIdx_S2NS);
+    fi->stage2 = fi->s1ptw || (mmu_idx == ARMMMUIdx_Stage2);
     return true;
 }
 
@@ -XXX,XX +XXX,XX @@ bool get_phys_addr(CPUARMState *env, target_ulong address,
                                 prot, page_size, fi, cacheattrs);
 
             /* If S1 fails or S2 is disabled, return early.  */
-            if (ret || regime_translation_disabled(env, ARMMMUIdx_S2NS)) {
+            if (ret || regime_translation_disabled(env, ARMMMUIdx_Stage2)) {
                 *phys_ptr = ipa;
                 return ret;
             }
 
             /* S1 is done. Now do S2 translation.  */
-            ret = get_phys_addr_lpae(env, ipa, access_type, ARMMMUIdx_S2NS,
+            ret = get_phys_addr_lpae(env, ipa, access_type, ARMMMUIdx_Stage2,
                                      phys_ptr, attrs, &s2_prot,
                                      page_size, fi,
                                      cacheattrs != NULL ? &cacheattrs2 : NULL);
@@ -XXX,XX +XXX,XX @@ bool get_phys_addr(CPUARMState *env, target_ulong address,
     /* Fast Context Switch Extension. This doesn't exist at all in v8.
      * In v7 and earlier it affects all stage 1 translations.
      */
-    if (address < 0x02000000 && mmu_idx != ARMMMUIdx_S2NS
+    if (address < 0x02000000 && mmu_idx != ARMMMUIdx_Stage2
         && !arm_feature(env, ARM_FEATURE_V8)) {
         if (regime_el(env, mmu_idx) == 3) {
             address += env->cp15.fcseidr_s;
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a64_user_mem_index(DisasContext *s)
     case ARMMMUIdx_S1SE1:
         useridx = ARMMMUIdx_S1SE0;
         break;
-    case ARMMMUIdx_S2NS:
+    case ARMMMUIdx_Stage2:
         g_assert_not_reached();
     default:
         useridx = s->mmu_idx;
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
     case ARMMMUIdx_MSUserNegPri:
     case ARMMMUIdx_MSPrivNegPri:
         return arm_to_core_mmu_idx(ARMMMUIdx_MSUserNegPri);
-    case ARMMMUIdx_S2NS:
+    case ARMMMUIdx_Stage2:
     default:
         g_assert_not_reached();
     }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is part of a reorganization to the set of mmu_idx.
The EL1&0 regime is the only one that uses 2-stage translation.
Spelling out Stage avoids confusion with Secure.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-12-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h       |  4 ++--
 target/arm/internals.h |  6 +++---
 target/arm/helper.c    | 27 ++++++++++++++-------------
 3 files changed, 19 insertions(+), 18 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
     /* Indexes below here don't have TLBs and are used only for AT system
      * instructions or for the first stage of an S12 page table walk.
      */
-    ARMMMUIdx_S1NSE0 = 0 | ARM_MMU_IDX_NOTLB,
-    ARMMMUIdx_S1NSE1 = 1 | ARM_MMU_IDX_NOTLB,
+    ARMMMUIdx_Stage1_E0 = 0 | ARM_MMU_IDX_NOTLB,
+    ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
 } ARMMMUIdx;
 
 /* Bit macros for the core-mmu-index values for each index,
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
     switch (mmu_idx) {
     case ARMMMUIdx_E10_0:
     case ARMMMUIdx_E10_1:
-    case ARMMMUIdx_S1NSE0:
-    case ARMMMUIdx_S1NSE1:
+    case ARMMMUIdx_Stage1_E0:
+    case ARMMMUIdx_Stage1_E1:
     case ARMMMUIdx_S1E2:
     case ARMMMUIdx_Stage2:
     case ARMMMUIdx_MPrivNegPri:
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx(CPUARMState *env);
 #ifdef CONFIG_USER_ONLY
 static inline ARMMMUIdx arm_stage1_mmu_idx(CPUARMState *env)
 {
-    return ARMMMUIdx_S1NSE0;
+    return ARMMMUIdx_Stage1_E0;
 }
 #else
 ARMMMUIdx arm_stage1_mmu_idx(CPUARMState *env);
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
         bool take_exc = false;
 
         if (fi.s1ptw && current_el == 1 && !arm_is_secure(env)
-            && (mmu_idx == ARMMMUIdx_S1NSE1 || mmu_idx == ARMMMUIdx_S1NSE0)) {
+            && (mmu_idx == ARMMMUIdx_Stage1_E1 ||
+                mmu_idx == ARMMMUIdx_Stage1_E0)) {
             /*
              * Synchronous stage 2 fault on an access made as part of the
              * translation table walk for AT S1E0* or AT S1E1* insn
@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
             mmu_idx = ARMMMUIdx_S1E3;
             break;
         case 2:
-            mmu_idx = ARMMMUIdx_S1NSE1;
+            mmu_idx = ARMMMUIdx_Stage1_E1;
             break;
         case 1:
-            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_S1NSE1;
+            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_Stage1_E1;
             break;
         default:
             g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void ats_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
             mmu_idx = ARMMMUIdx_S1SE0;
             break;
         case 2:
-            mmu_idx = ARMMMUIdx_S1NSE0;
+            mmu_idx = ARMMMUIdx_Stage1_E0;
             break;
         case 1:
-            mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S1NSE0;
+            mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_Stage1_E0;
             break;
         default:
             g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
     case 0:
         switch (ri->opc1) {
         case 0: /* AT S1E1R, AT S1E1W */
-            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_S1NSE1;
+            mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_Stage1_E1;
             break;
         case 4: /* AT S1E2R, AT S1E2W */
             mmu_idx = ARMMMUIdx_S1E2;
@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
         }
         break;
     case 2: /* AT S1E0R, AT S1E0W */
-        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_S1NSE0;
+        mmu_idx = secure ? ARMMMUIdx_S1SE0 : ARMMMUIdx_Stage1_E0;
         break;
     case 4: /* AT S12E1R, AT S12E1W */
         mmu_idx = secure ? ARMMMUIdx_S1SE1 : ARMMMUIdx_E10_1;
@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
     case ARMMMUIdx_S1SE0:
         return arm_el_is_aa64(env, 3) ? 1 : 3;
     case ARMMMUIdx_S1SE1:
-    case ARMMMUIdx_S1NSE0:
-    case ARMMMUIdx_S1NSE1:
+    case ARMMMUIdx_Stage1_E0:
+    case ARMMMUIdx_Stage1_E1:
     case ARMMMUIdx_MPrivNegPri:
     case ARMMMUIdx_MUserNegPri:
     case ARMMMUIdx_MPriv:
@@ -XXX,XX +XXX,XX @@ static inline bool regime_translation_disabled(CPUARMState *env,
     }
 
     if ((env->cp15.hcr_el2 & HCR_DC) &&
-        (mmu_idx == ARMMMUIdx_S1NSE0 || mmu_idx == ARMMMUIdx_S1NSE1)) {
+        (mmu_idx == ARMMMUIdx_Stage1_E0 || mmu_idx == ARMMMUIdx_Stage1_E1)) {
         /* HCR.DC means SCTLR_EL1.M behaves as 0 */
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
 static inline ARMMMUIdx stage_1_mmu_idx(ARMMMUIdx mmu_idx)
 {
     if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
-        mmu_idx += (ARMMMUIdx_S1NSE0 - ARMMMUIdx_E10_0);
+        mmu_idx += (ARMMMUIdx_Stage1_E0 - ARMMMUIdx_E10_0);
     }
     return mmu_idx;
 }
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     switch (mmu_idx) {
     case ARMMMUIdx_S1SE0:
-    case ARMMMUIdx_S1NSE0:
+    case ARMMMUIdx_Stage1_E0:
     case ARMMMUIdx_MUser:
     case ARMMMUIdx_MSUser:
     case ARMMMUIdx_MUserNegPri:
@@ -XXX,XX +XXX,XX @@ static hwaddr S1_ptw_translate(CPUARMState *env, ARMMMUIdx mmu_idx,
                                hwaddr addr, MemTxAttrs txattrs,
                                ARMMMUFaultInfo *fi)
 {
-    if ((mmu_idx == ARMMMUIdx_S1NSE0 || mmu_idx == ARMMMUIdx_S1NSE1) &&
+    if ((mmu_idx == ARMMMUIdx_Stage1_E0 || mmu_idx == ARMMMUIdx_Stage1_E1) &&
         !regime_translation_disabled(env, ARMMMUIdx_Stage2)) {
         target_ulong s2size;
         hwaddr s2pa;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is part of a reorganization to the set of mmu_idx.
This emphasizes that they apply to the Secure EL1&0 regime.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-13-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h           |  8 ++++----
 target/arm/internals.h     |  4 ++--
 target/arm/translate.h     |  2 +-
 target/arm/helper.c        | 26 +++++++++++++-------------
 target/arm/translate-a64.c |  4 ++--
 target/arm/translate.c     |  6 +++---
 6 files changed, 25 insertions(+), 25 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

This is part of a reorganization to the set of mmu_idx.
The EL3 regime only has a single stage translation, and
is always secure.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-14-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h       |  4 ++--
 target/arm/internals.h |  2 +-
 target/arm/helper.c    | 14 +++++++-------
 target/arm/translate.c |  2 +-
 4 files changed, 11 insertions(+), 11 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

This is part of a reorganization to the set of mmu_idx.
The non-secure EL2 regime only has a single stage translation;
there is no point in pointing out that the idx is for stage1.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-15-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h       |  4 ++--
 target/arm/internals.h |  2 +-
 target/arm/helper.c    | 22 +++++++++++-----------
 target/arm/translate.c |  2 +-
 4 files changed, 15 insertions(+), 15 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
 typedef enum ARMMMUIdx {
     ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
     ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
-    ARMMMUIdx_S1E2 = 2 | ARM_MMU_IDX_A,
+    ARMMMUIdx_E2 = 2 | ARM_MMU_IDX_A,
     ARMMMUIdx_SE3 = 3 | ARM_MMU_IDX_A,
     ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
     ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
 typedef enum ARMMMUIdxBit {
     ARMMMUIdxBit_E10_0 = 1 << 0,
     ARMMMUIdxBit_E10_1 = 1 << 1,
-    ARMMMUIdxBit_S1E2 = 1 << 2,
+    ARMMMUIdxBit_E2 = 1 << 2,
     ARMMMUIdxBit_SE3 = 1 << 3,
     ARMMMUIdxBit_SE10_0 = 1 << 4,
     ARMMMUIdxBit_SE10_1 = 1 << 5,
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
     case ARMMMUIdx_E10_1:
     case ARMMMUIdx_Stage1_E0:
     case ARMMMUIdx_Stage1_E1:
-    case ARMMMUIdx_S1E2:
+    case ARMMMUIdx_E2:
     case ARMMMUIdx_Stage2:
     case ARMMMUIdx_MPrivNegPri:
     case ARMMMUIdx_MUserNegPri:
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
 {
     CPUState *cs = env_cpu(env);
 
-    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_S1E2);
+    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
 }
 
 static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 {
     CPUState *cs = env_cpu(env);
 
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_S1E2);
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
 }
 
 static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
     CPUState *cs = env_cpu(env);
     uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
 
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S1E2);
+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
 }
 
 static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
 
     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                             ARMMMUIdxBit_S1E2);
+                                             ARMMMUIdxBit_E2);
 }
 
 static const ARMCPRegInfo cp_reginfo[] = {
@@ -XXX,XX +XXX,XX @@ static void ats1h_write(CPUARMState *env, const ARMCPRegInfo *ri,
     MMUAccessType access_type = ri->opc2 & 1 ? MMU_DATA_STORE : MMU_DATA_LOAD;
     uint64_t par64;
 
-    par64 = do_ats_write(env, value, access_type, ARMMMUIdx_S1E2);
+    par64 = do_ats_write(env, value, access_type, ARMMMUIdx_E2);
 
     A32_BANKED_CURRENT_REG_SET(env, par, par64);
 }
@@ -XXX,XX +XXX,XX @@ static void ats_write64(CPUARMState *env, const ARMCPRegInfo *ri,
             mmu_idx = secure ? ARMMMUIdx_SE10_1 : ARMMMUIdx_Stage1_E1;
             break;
         case 4: /* AT S1E2R, AT S1E2W */
-            mmu_idx = ARMMMUIdx_S1E2;
+            mmu_idx = ARMMMUIdx_E2;
             break;
         case 6: /* AT S1E3R, AT S1E3W */
             mmu_idx = ARMMMUIdx_SE3;
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
     ARMCPU *cpu = env_archcpu(env);
     CPUState *cs = CPU(cpu);
 
-    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_S1E2);
+    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
 }
 
 static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 {
     CPUState *cs = env_cpu(env);
 
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_S1E2);
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
 }
 
 static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
     CPUState *cs = CPU(cpu);
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
 
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_S1E2);
+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
 }
 
 static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
 
     tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                             ARMMMUIdxBit_S1E2);
+                                             ARMMMUIdxBit_E2);
 }
 
 static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     switch (mmu_idx) {
     case ARMMMUIdx_Stage2:
-    case ARMMMUIdx_S1E2:
+    case ARMMMUIdx_E2:
         return 2;
     case ARMMMUIdx_SE3:
         return 3;
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
      *  otherwise, access as if at PL0.
      */
     switch (s->mmu_idx) {
-    case ARMMMUIdx_S1E2:        /* this one is UNPREDICTABLE */
+    case ARMMMUIdx_E2:        /* this one is UNPREDICTABLE */
     case ARMMMUIdx_E10_0:
     case ARMMMUIdx_E10_1:
         return arm_to_core_mmu_idx(ARMMMUIdx_E10_0);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

We had completely run out of TBFLAG bits.
Split A- and M-profile bits into two overlapping buckets.
This results in 4 free bits.

We used to initialize all of the a32 and m32 fields in DisasContext
by assignment, in arm_tr_init_disas_context.  Now we only initialize
either the a32 or m32 by assignment, because the bits overlap in
tbflags.  So zero the entire structure in gen_intermediate_code.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-16-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h       | 68 ++++++++++++++++++++++++++----------------
 target/arm/helper.c    | 17 +++++------
 target/arm/translate.c | 57 +++++++++++++++++++----------------
 3 files changed, 82 insertions(+), 60 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef ARMCPU ArchCPU;
  * We put flags which are shared between 32 and 64 bit mode at the top
  * of the word, and flags which apply to only one mode at the bottom.
  *
+ *  31          21    18    14          9              0
+ * +--------------+-----+-----+----------+--------------+
+ * |              |     |   TBFLAG_A32   |              |
+ * |              |     +-----+----------+  TBFLAG_AM32 |
+ * |  TBFLAG_ANY  |           |TBFLAG_M32|              |
+ * |              |           +-------------------------|
+ * |              |           |       TBFLAG_A64        |
+ * +--------------+-----------+-------------------------+
+ *  31          21          14                         0
+ *
  * Unless otherwise noted, these bits are cached in env->hflags.
  */
 FIELD(TBFLAG_ANY, AARCH64_STATE, 31, 1)
@@ -XXX,XX +XXX,XX @@ FIELD(TBFLAG_ANY, PSTATE_SS, 26, 1)     /* Not cached. */
 /* Target EL if we take a floating-point-disabled exception */
 FIELD(TBFLAG_ANY, FPEXC_EL, 24, 2)
 FIELD(TBFLAG_ANY, BE_DATA, 23, 1)
-/*
- * For A-profile only, target EL for debug exceptions.
- * Note that this overlaps with the M-profile-only HANDLER and STACKCHECK bits.
- */
+/* For A-profile only, target EL for debug exceptions.  */
 FIELD(TBFLAG_ANY, DEBUG_TARGET_EL, 21, 2)
 
-/* Bit usage when in AArch32 state: */
-FIELD(TBFLAG_A32, THUMB, 0, 1)          /* Not cached. */
-FIELD(TBFLAG_A32, VECLEN, 1, 3)         /* Not cached. */
-FIELD(TBFLAG_A32, VECSTRIDE, 4, 2)      /* Not cached. */
+/*
+ * Bit usage when in AArch32 state, both A- and M-profile.
+ */
+FIELD(TBFLAG_AM32, CONDEXEC, 0, 8)      /* Not cached. */
+FIELD(TBFLAG_AM32, THUMB, 8, 1)         /* Not cached. */
+
+/*
+ * Bit usage when in AArch32 state, for A-profile only.
+ */
+FIELD(TBFLAG_A32, VECLEN, 9, 3)         /* Not cached. */
+FIELD(TBFLAG_A32, VECSTRIDE, 12, 2)     /* Not cached. */
 /*
  * We store the bottom two bits of the CPAR as TB flags and handle
  * checks on the other bits at runtime. This shares the same bits as
  * VECSTRIDE, which is OK as no XScale CPU has VFP.
  * Not cached, because VECLEN+VECSTRIDE are not cached.
  */
-FIELD(TBFLAG_A32, XSCALE_CPAR, 4, 2)
+FIELD(TBFLAG_A32, XSCALE_CPAR, 12, 2)
+FIELD(TBFLAG_A32, VFPEN, 14, 1)         /* Partially cached, minus FPEXC. */
+FIELD(TBFLAG_A32, SCTLR_B, 15, 1)
+FIELD(TBFLAG_A32, HSTR_ACTIVE, 16, 1)
 /*
  * Indicates whether cp register reads and writes by guest code should access
  * the secure or nonsecure bank of banked registers; note that this is not
  * the same thing as the current security state of the processor!
  */
-FIELD(TBFLAG_A32, NS, 6, 1)
-FIELD(TBFLAG_A32, VFPEN, 7, 1)          /* Partially cached, minus FPEXC. */
-FIELD(TBFLAG_A32, CONDEXEC, 8, 8)       /* Not cached. */
-FIELD(TBFLAG_A32, SCTLR_B, 16, 1)
-FIELD(TBFLAG_A32, HSTR_ACTIVE, 17, 1)
+FIELD(TBFLAG_A32, NS, 17, 1)
 
-/* For M profile only, set if FPCCR.LSPACT is set */
-FIELD(TBFLAG_A32, LSPACT, 18, 1)        /* Not cached. */
-/* For M profile only, set if we must create a new FP context */
-FIELD(TBFLAG_A32, NEW_FP_CTXT_NEEDED, 19, 1) /* Not cached. */
-/* For M profile only, set if FPCCR.S does not match current security state */
-FIELD(TBFLAG_A32, FPCCR_S_WRONG, 20, 1) /* Not cached. */
-/* For M profile only, Handler (ie not Thread) mode */
-FIELD(TBFLAG_A32, HANDLER, 21, 1)
-/* For M profile only, whether we should generate stack-limit checks */
-FIELD(TBFLAG_A32, STACKCHECK, 22, 1)
+/*
+ * Bit usage when in AArch32 state, for M-profile only.
+ */
+/* Handler (ie not Thread) mode */
+FIELD(TBFLAG_M32, HANDLER, 9, 1)
+/* Whether we should generate stack-limit checks */
+FIELD(TBFLAG_M32, STACKCHECK, 10, 1)
+/* Set if FPCCR.LSPACT is set */
+FIELD(TBFLAG_M32, LSPACT, 11, 1)                 /* Not cached. */
+/* Set if we must create a new FP context */
+FIELD(TBFLAG_M32, NEW_FP_CTXT_NEEDED, 12, 1)     /* Not cached. */
+/* Set if FPCCR.S does not match current security state */
+FIELD(TBFLAG_M32, FPCCR_S_WRONG, 13, 1)          /* Not cached. */
 
-/* Bit usage when in AArch64 state */
+/*
+ * Bit usage when in AArch64 state
+ */
 FIELD(TBFLAG_A64, TBII, 0, 2)
 FIELD(TBFLAG_A64, SVEEXC_EL, 2, 2)
 FIELD(TBFLAG_A64, ZCR_LEN, 4, 4)
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_m32(CPUARMState *env, int fp_el,
 {
     uint32_t flags = 0;
 
-    /* v8M always enables the fpu.  */
-    flags = FIELD_DP32(flags, TBFLAG_A32, VFPEN, 1);
-
     if (arm_v7m_is_handler_mode(env)) {
-        flags = FIELD_DP32(flags, TBFLAG_A32, HANDLER, 1);
+        flags = FIELD_DP32(flags, TBFLAG_M32, HANDLER, 1);
     }
 
     /*
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_m32(CPUARMState *env, int fp_el,
     if (arm_feature(env, ARM_FEATURE_V8) &&
         !((mmu_idx & ARM_MMU_IDX_M_NEGPRI) &&
           (env->v7m.ccr[env->v7m.secure] & R_V7M_CCR_STKOFHFNMIGN_MASK))) {
-        flags = FIELD_DP32(flags, TBFLAG_A32, STACKCHECK, 1);
+        flags = FIELD_DP32(flags, TBFLAG_M32, STACKCHECK, 1);
     }
 
     return rebuild_hflags_common_32(env, fp_el, mmu_idx, flags);
@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPUARMState *env, target_ulong *pc,
             if (arm_feature(env, ARM_FEATURE_M_SECURITY) &&
                 FIELD_EX32(env->v7m.fpccr[M_REG_S], V7M_FPCCR, S)
                 != env->v7m.secure) {
-                flags = FIELD_DP32(flags, TBFLAG_A32, FPCCR_S_WRONG, 1);
+                flags = FIELD_DP32(flags, TBFLAG_M32, FPCCR_S_WRONG, 1);
             }
 
             if ((env->v7m.fpccr[env->v7m.secure] & R_V7M_FPCCR_ASPEN_MASK) &&
@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPUARMState *env, target_ulong *pc,
                  * active FP context; we must create a new FP context before
                  * executing any FP insn.
                  */
-                flags = FIELD_DP32(flags, TBFLAG_A32, NEW_FP_CTXT_NEEDED, 1);
+                flags = FIELD_DP32(flags, TBFLAG_M32, NEW_FP_CTXT_NEEDED, 1);
             }
 
             bool is_secure = env->v7m.fpccr[M_REG_S] & R_V7M_FPCCR_S_MASK;
             if (env->v7m.fpccr[is_secure] & R_V7M_FPCCR_LSPACT_MASK) {
-                flags = FIELD_DP32(flags, TBFLAG_A32, LSPACT, 1);
+                flags = FIELD_DP32(flags, TBFLAG_M32, LSPACT, 1);
             }
         } else {
             /*
@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPUARMState *env, target_ulong *pc,
             }
         }
 
-        flags = FIELD_DP32(flags, TBFLAG_A32, THUMB, env->thumb);
-        flags = FIELD_DP32(flags, TBFLAG_A32, CONDEXEC, env->condexec_bits);
+        flags = FIELD_DP32(flags, TBFLAG_AM32, THUMB, env->thumb);
+        flags = FIELD_DP32(flags, TBFLAG_AM32, CONDEXEC, env->condexec_bits);
         pstate_for_ss = env->uncached_cpsr;
     }
 
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void arm_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      */
     dc->secure_routed_to_el3 = arm_feature(env, ARM_FEATURE_EL3) &&
                                !arm_el_is_aa64(env, 3);
-    dc->thumb = FIELD_EX32(tb_flags, TBFLAG_A32, THUMB);
-    dc->sctlr_b = FIELD_EX32(tb_flags, TBFLAG_A32, SCTLR_B);
-    dc->hstr_active = FIELD_EX32(tb_flags, TBFLAG_A32, HSTR_ACTIVE);
+    dc->thumb = FIELD_EX32(tb_flags, TBFLAG_AM32, THUMB);
     dc->be_data = FIELD_EX32(tb_flags, TBFLAG_ANY, BE_DATA) ? MO_BE : MO_LE;
-    condexec = FIELD_EX32(tb_flags, TBFLAG_A32, CONDEXEC);
+    condexec = FIELD_EX32(tb_flags, TBFLAG_AM32, CONDEXEC);
     dc->condexec_mask = (condexec & 0xf) << 1;
     dc->condexec_cond = condexec >> 4;
+
     core_mmu_idx = FIELD_EX32(tb_flags, TBFLAG_ANY, MMUIDX);
     dc->mmu_idx = core_to_arm_mmu_idx(env, core_mmu_idx);
     dc->current_el = arm_mmu_idx_to_el(dc->mmu_idx);
 #if !defined(CONFIG_USER_ONLY)
     dc->user = (dc->current_el == 0);
 #endif
-    dc->ns = FIELD_EX32(tb_flags, TBFLAG_A32, NS);
     dc->fp_excp_el = FIELD_EX32(tb_flags, TBFLAG_ANY, FPEXC_EL);
-    dc->vfp_enabled = FIELD_EX32(tb_flags, TBFLAG_A32, VFPEN);
-    dc->vec_len = FIELD_EX32(tb_flags, TBFLAG_A32, VECLEN);
-    if (arm_feature(env, ARM_FEATURE_XSCALE)) {
-        dc->c15_cpar = FIELD_EX32(tb_flags, TBFLAG_A32, XSCALE_CPAR);
-        dc->vec_stride = 0;
+
+    if (arm_feature(env, ARM_FEATURE_M)) {
+        dc->vfp_enabled = 1;
+        dc->be_data = MO_TE;
+        dc->v7m_handler_mode = FIELD_EX32(tb_flags, TBFLAG_M32, HANDLER);
+        dc->v8m_secure = arm_feature(env, ARM_FEATURE_M_SECURITY) &&
+            regime_is_secure(env, dc->mmu_idx);
+        dc->v8m_stackcheck = FIELD_EX32(tb_flags, TBFLAG_M32, STACKCHECK);
+        dc->v8m_fpccr_s_wrong =
+            FIELD_EX32(tb_flags, TBFLAG_M32, FPCCR_S_WRONG);
+        dc->v7m_new_fp_ctxt_needed =
+            FIELD_EX32(tb_flags, TBFLAG_M32, NEW_FP_CTXT_NEEDED);
+        dc->v7m_lspact = FIELD_EX32(tb_flags, TBFLAG_M32, LSPACT);
     } else {
-        dc->vec_stride = FIELD_EX32(tb_flags, TBFLAG_A32, VECSTRIDE);
-        dc->c15_cpar = 0;
+        dc->be_data =
+            FIELD_EX32(tb_flags, TBFLAG_ANY, BE_DATA) ? MO_BE : MO_LE;
+        dc->debug_target_el =
+            FIELD_EX32(tb_flags, TBFLAG_ANY, DEBUG_TARGET_EL);
+        dc->sctlr_b = FIELD_EX32(tb_flags, TBFLAG_A32, SCTLR_B);
+        dc->hstr_active = FIELD_EX32(tb_flags, TBFLAG_A32, HSTR_ACTIVE);
+        dc->ns = FIELD_EX32(tb_flags, TBFLAG_A32, NS);
+        dc->vfp_enabled = FIELD_EX32(tb_flags, TBFLAG_A32, VFPEN);
+        if (arm_feature(env, ARM_FEATURE_XSCALE)) {
+            dc->c15_cpar = FIELD_EX32(tb_flags, TBFLAG_A32, XSCALE_CPAR);
+        } else {
+            dc->vec_len = FIELD_EX32(tb_flags, TBFLAG_A32, VECLEN);
+            dc->vec_stride = FIELD_EX32(tb_flags, TBFLAG_A32, VECSTRIDE);
+        }
     }
-    dc->v7m_handler_mode = FIELD_EX32(tb_flags, TBFLAG_A32, HANDLER);
-    dc->v8m_secure = arm_feature(env, ARM_FEATURE_M_SECURITY) &&
-        regime_is_secure(env, dc->mmu_idx);
-    dc->v8m_stackcheck = FIELD_EX32(tb_flags, TBFLAG_A32, STACKCHECK);
-    dc->v8m_fpccr_s_wrong = FIELD_EX32(tb_flags, TBFLAG_A32, FPCCR_S_WRONG);
-    dc->v7m_new_fp_ctxt_needed =
-        FIELD_EX32(tb_flags, TBFLAG_A32, NEW_FP_CTXT_NEEDED);
-    dc->v7m_lspact = FIELD_EX32(tb_flags, TBFLAG_A32, LSPACT);
     dc->cp_regs = cpu->cp_regs;
     dc->features = env->features;
 
@@ -XXX,XX +XXX,XX @@ static void arm_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
     dc->ss_active = FIELD_EX32(tb_flags, TBFLAG_ANY, SS_ACTIVE);
     dc->pstate_ss = FIELD_EX32(tb_flags, TBFLAG_ANY, PSTATE_SS);
     dc->is_ldex = false;
-    if (!arm_feature(env, ARM_FEATURE_M)) {
-        dc->debug_target_el = FIELD_EX32(tb_flags, TBFLAG_ANY, DEBUG_TARGET_EL);
-    }
 
     dc->page_start = dc->base.pc_first & TARGET_PAGE_MASK;
 
@@ -XXX,XX +XXX,XX @@ static const TranslatorOps thumb_translator_ops = {
 /* generate intermediate code for basic block 'tb'.  */
 void gen_intermediate_code(CPUState *cpu, TranslationBlock *tb, int max_insns)
 {
-    DisasContext dc;
+    DisasContext dc = { };
     const TranslatorOps *ops = &arm_translator_ops;
 
-    if (FIELD_EX32(tb->flags, TBFLAG_A32, THUMB)) {
+    if (FIELD_EX32(tb->flags, TBFLAG_AM32, THUMB)) {
         ops = &thumb_translator_ops;
     }
 #ifdef TARGET_AARCH64
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

We are about to expand the number of mmuidx to 10, and so need 4 bits.
For the benefit of reading the number out of -d exec, align it to the
penultimate nibble.

From: Richard Henderson <richard.henderson@linaro.org>

Define via macro expansion, so that renumbering of the base ARMMMUIdx
symbols is automatically reflected in the bit definitions.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-18-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h | 39 +++++++++++++++++++++++----------------
 1 file changed, 23 insertions(+), 16 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
     ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
 } ARMMMUIdx;
 
-/* Bit macros for the core-mmu-index values for each index,
+/*
+ * Bit macros for the core-mmu-index values for each index,
  * for use when calling tlb_flush_by_mmuidx() and friends.
  */
+#define TO_CORE_BIT(NAME) \
+    ARMMMUIdxBit_##NAME = 1 << (ARMMMUIdx_##NAME & ARM_MMU_IDX_COREIDX_MASK)
+
 typedef enum ARMMMUIdxBit {
-    ARMMMUIdxBit_E10_0 = 1 << 0,
-    ARMMMUIdxBit_E10_1 = 1 << 1,
-    ARMMMUIdxBit_E2 = 1 << 2,
-    ARMMMUIdxBit_SE3 = 1 << 3,
-    ARMMMUIdxBit_SE10_0 = 1 << 4,
-    ARMMMUIdxBit_SE10_1 = 1 << 5,
-    ARMMMUIdxBit_Stage2 = 1 << 6,
-    ARMMMUIdxBit_MUser = 1 << 0,
-    ARMMMUIdxBit_MPriv = 1 << 1,
-    ARMMMUIdxBit_MUserNegPri = 1 << 2,
-    ARMMMUIdxBit_MPrivNegPri = 1 << 3,
-    ARMMMUIdxBit_MSUser = 1 << 4,
-    ARMMMUIdxBit_MSPriv = 1 << 5,
-    ARMMMUIdxBit_MSUserNegPri = 1 << 6,
-    ARMMMUIdxBit_MSPrivNegPri = 1 << 7,
+    TO_CORE_BIT(E10_0),
+    TO_CORE_BIT(E10_1),
+    TO_CORE_BIT(E2),
+    TO_CORE_BIT(SE10_0),
+    TO_CORE_BIT(SE10_1),
+    TO_CORE_BIT(SE3),
+    TO_CORE_BIT(Stage2),
+
+    TO_CORE_BIT(MUser),
+    TO_CORE_BIT(MPriv),
+    TO_CORE_BIT(MUserNegPri),
+    TO_CORE_BIT(MPrivNegPri),
+    TO_CORE_BIT(MSUser),
+    TO_CORE_BIT(MSPriv),
+    TO_CORE_BIT(MSUserNegPri),
+    TO_CORE_BIT(MSPrivNegPri),
 } ARMMMUIdxBit;
 
+#undef TO_CORE_BIT
+
 #define MMU_USER_IDX 0
 
 static inline int arm_to_core_mmu_idx(ARMMMUIdx mmu_idx)
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Replace the magic numbers with the relevant ARM_MMU_IDX_M_* constants.
Keep the definitions short by referencing previous symbols.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-19-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h | 16 ++++++++--------
 1 file changed, 8 insertions(+), 8 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Prepare for, but do not yet implement, the EL2&0 regime.
This involves adding the new MMUIdx enumerators and adjusting
some of the MMUIdx related predicates to match.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-20-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu-param.h |   2 +-
 target/arm/cpu.h       | 134 ++++++++++++++++++-----------------------
 target/arm/internals.h |  35 +++++++++++
 target/arm/helper.c    |  66 +++++++++++++++++---
 target/arm/translate.c |   1 -
 5 files changed, 152 insertions(+), 86 deletions(-)

diff --git a/target/arm/cpu-param.h b/target/arm/cpu-param.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu-param.h
+++ b/target/arm/cpu-param.h
@@ -XXX,XX +XXX,XX @@
 # define TARGET_PAGE_BITS_MIN  10
 #endif
 
-#define NB_MMU_MODES 8
+#define NB_MMU_MODES 9
 
 #endif
diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
  *  + NonSecure EL1 & 0 stage 1
  *  + NonSecure EL1 & 0 stage 2
  *  + NonSecure EL2
- *  + Secure EL1 & EL0
+ *  + NonSecure EL2 & 0   (ARMv8.1-VHE)
+ *  + Secure EL1 & 0
  *  + Secure EL3
  * If EL3 is 32-bit:
  *  + NonSecure PL1 & 0 stage 1
  *  + NonSecure PL1 & 0 stage 2
  *  + NonSecure PL2
- *  + Secure PL0 & PL1
+ *  + Secure PL0
+ *  + Secure PL1
  * (reminder: for 32 bit EL3, Secure PL1 is *EL3*, not EL1.)
  *
  * For QEMU, an mmu_idx is not quite the same as a translation regime because:
- *  1. we need to split the "EL1 & 0" regimes into two mmu_idxes, because they
- *     may differ in access permissions even if the VA->PA map is the same
+ *  1. we need to split the "EL1 & 0" and "EL2 & 0" regimes into two mmu_idxes,
+ *     because they may differ in access permissions even if the VA->PA map is
+ *     the same
  *  2. we want to cache in our TLB the full VA->IPA->PA lookup for a stage 1+2
  *     translation, which means that we have one mmu_idx that deals with two
  *     concatenated translation regimes [this sort of combined s1+2 TLB is
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
  *  4. we can also safely fold together the "32 bit EL3" and "64 bit EL3"
  *     translation regimes, because they map reasonably well to each other
  *     and they can't both be active at the same time.
- * This gives us the following list of mmu_idx values:
+ *  5. we want to be able to use the TLB for accesses done as part of a
+ *     stage1 page table walk, rather than having to walk the stage2 page
+ *     table over and over.
  *
- * NS EL0 (aka NS PL0) stage 1+2
- * NS EL1 (aka NS PL1) stage 1+2
+ * This gives us the following list of cases:
+ *
+ * NS EL0 EL1&0 stage 1+2 (aka NS PL0)
+ * NS EL1 EL1&0 stage 1+2 (aka NS PL1)
+ * NS EL0 EL2&0
+ * NS EL2 EL2&0
  * NS EL2 (aka NS PL2)
+ * S EL0 EL1&0 (aka S PL0)
+ * S EL1 EL1&0 (not used if EL3 is 32 bit)
  * S EL3 (aka S PL1)
- * S EL0 (aka S PL0)
- * S EL1 (not used if EL3 is 32 bit)
- * NS EL0+1 stage 2
+ * NS EL1&0 stage 2
  *
- * (The last of these is an mmu_idx because we want to be able to use the TLB
- * for the accesses done as part of a stage 1 page table walk, rather than
- * having to walk the stage 2 page table over and over.)
+ * for a total of 9 different mmu_idx.
  *
  * R profile CPUs have an MPU, but can use the same set of MMU indexes
  * as A profile. They only need to distinguish NS EL0 and NS EL1 (and
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
  * For M profile we arrange them to have a bit for priv, a bit for negpri
  * and a bit for secure.
  */
-#define ARM_MMU_IDX_A 0x10 /* A profile */
-#define ARM_MMU_IDX_NOTLB 0x20 /* does not have a TLB */
-#define ARM_MMU_IDX_M 0x40 /* M profile */
+#define ARM_MMU_IDX_A     0x10  /* A profile */
+#define ARM_MMU_IDX_NOTLB 0x20  /* does not have a TLB */
+#define ARM_MMU_IDX_M     0x40  /* M profile */
 
-/* meanings of the bits for M profile mmu idx values */
-#define ARM_MMU_IDX_M_PRIV 0x1
+/* Meanings of the bits for M profile mmu idx values */
+#define ARM_MMU_IDX_M_PRIV   0x1
 #define ARM_MMU_IDX_M_NEGPRI 0x2
-#define ARM_MMU_IDX_M_S 0x4
+#define ARM_MMU_IDX_M_S      0x4  /* Secure */
 
-#define ARM_MMU_IDX_TYPE_MASK (~0x7)
-#define ARM_MMU_IDX_COREIDX_MASK 0x7
+#define ARM_MMU_IDX_TYPE_MASK \
+    (ARM_MMU_IDX_A | ARM_MMU_IDX_M | ARM_MMU_IDX_NOTLB)
+#define ARM_MMU_IDX_COREIDX_MASK 0xf
 
 typedef enum ARMMMUIdx {
-    ARMMMUIdx_E10_0 = 0 | ARM_MMU_IDX_A,
-    ARMMMUIdx_E10_1 = 1 | ARM_MMU_IDX_A,
-    ARMMMUIdx_E2 = 2 | ARM_MMU_IDX_A,
-    ARMMMUIdx_SE3 = 3 | ARM_MMU_IDX_A,
-    ARMMMUIdx_SE10_0 = 4 | ARM_MMU_IDX_A,
-    ARMMMUIdx_SE10_1 = 5 | ARM_MMU_IDX_A,
-    ARMMMUIdx_Stage2 = 6 | ARM_MMU_IDX_A,
+    /*
+     * A-profile.
+     */
+    ARMMMUIdx_E10_0 =  0 | ARM_MMU_IDX_A,
+    ARMMMUIdx_E20_0 =  1 | ARM_MMU_IDX_A,
+
+    ARMMMUIdx_E10_1 =  2 | ARM_MMU_IDX_A,
+
+    ARMMMUIdx_E2 =     3 | ARM_MMU_IDX_A,
+    ARMMMUIdx_E20_2 =  4 | ARM_MMU_IDX_A,
+
+    ARMMMUIdx_SE10_0 = 5 | ARM_MMU_IDX_A,
+    ARMMMUIdx_SE10_1 = 6 | ARM_MMU_IDX_A,
+    ARMMMUIdx_SE3 =    7 | ARM_MMU_IDX_A,
+
+    ARMMMUIdx_Stage2 = 8 | ARM_MMU_IDX_A,
+
+    /*
+     * These are not allocated TLBs and are used only for AT system
+     * instructions or for the first stage of an S12 page table walk.
+     */
+    ARMMMUIdx_Stage1_E0 = 0 | ARM_MMU_IDX_NOTLB,
+    ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
+
+    /*
+     * M-profile.
+     */
     ARMMMUIdx_MUser = ARM_MMU_IDX_M,
     ARMMMUIdx_MPriv = ARM_MMU_IDX_M | ARM_MMU_IDX_M_PRIV,
     ARMMMUIdx_MUserNegPri = ARMMMUIdx_MUser | ARM_MMU_IDX_M_NEGPRI,
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
     ARMMMUIdx_MSPriv = ARMMMUIdx_MPriv | ARM_MMU_IDX_M_S,
     ARMMMUIdx_MSUserNegPri = ARMMMUIdx_MUserNegPri | ARM_MMU_IDX_M_S,
     ARMMMUIdx_MSPrivNegPri = ARMMMUIdx_MPrivNegPri | ARM_MMU_IDX_M_S,
-    /* Indexes below here don't have TLBs and are used only for AT system
-     * instructions or for the first stage of an S12 page table walk.
-     */
-    ARMMMUIdx_Stage1_E0 = 0 | ARM_MMU_IDX_NOTLB,
-    ARMMMUIdx_Stage1_E1 = 1 | ARM_MMU_IDX_NOTLB,
 } ARMMMUIdx;
 
 /*
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdx {
 
 typedef enum ARMMMUIdxBit {
     TO_CORE_BIT(E10_0),
+    TO_CORE_BIT(E20_0),
     TO_CORE_BIT(E10_1),
     TO_CORE_BIT(E2),
+    TO_CORE_BIT(E20_2),
     TO_CORE_BIT(SE10_0),
     TO_CORE_BIT(SE10_1),
     TO_CORE_BIT(SE3),
@@ -XXX,XX +XXX,XX @@ typedef enum ARMMMUIdxBit {
 
 #define MMU_USER_IDX 0
 
-static inline int arm_to_core_mmu_idx(ARMMMUIdx mmu_idx)
-{
-    return mmu_idx & ARM_MMU_IDX_COREIDX_MASK;
-}
-
-static inline ARMMMUIdx core_to_arm_mmu_idx(CPUARMState *env, int mmu_idx)
-{
-    if (arm_feature(env, ARM_FEATURE_M)) {
-        return mmu_idx | ARM_MMU_IDX_M;
-    } else {
-        return mmu_idx | ARM_MMU_IDX_A;
-    }
-}
-
-/* Return the exception level we're running at if this is our mmu_idx */
-static inline int arm_mmu_idx_to_el(ARMMMUIdx mmu_idx)
-{
-    switch (mmu_idx & ARM_MMU_IDX_TYPE_MASK) {
-    case ARM_MMU_IDX_A:
-        return mmu_idx & 3;
-    case ARM_MMU_IDX_M:
-        return mmu_idx & ARM_MMU_IDX_M_PRIV;
-    default:
-        g_assert_not_reached();
-    }
-}
-
-/*
- * Return the MMU index for a v7M CPU with all relevant information
- * manually specified.
- */
-ARMMMUIdx arm_v7m_mmu_idx_all(CPUARMState *env,
-                              bool secstate, bool priv, bool negpri);
-
-/* Return the MMU index for a v7M CPU in the specified security and
- * privilege state.
- */
-ARMMMUIdx arm_v7m_mmu_idx_for_secstate_and_priv(CPUARMState *env,
-                                                bool secstate, bool priv);
-
-/* Return the MMU index for a v7M CPU in the specified security state */
-ARMMMUIdx arm_v7m_mmu_idx_for_secstate(CPUARMState *env, bool secstate);
-
 /**
  * cpu_mmu_index:
  * @env: The cpu environment
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_tlb_fill(CPUState *cs, vaddr address, int size,
                       MMUAccessType access_type, int mmu_idx,
                       bool probe, uintptr_t retaddr);
 
+static inline int arm_to_core_mmu_idx(ARMMMUIdx mmu_idx)
+{
+    return mmu_idx & ARM_MMU_IDX_COREIDX_MASK;
+}
+
+static inline ARMMMUIdx core_to_arm_mmu_idx(CPUARMState *env, int mmu_idx)
+{
+    if (arm_feature(env, ARM_FEATURE_M)) {
+        return mmu_idx | ARM_MMU_IDX_M;
+    } else {
+        return mmu_idx | ARM_MMU_IDX_A;
+    }
+}
+
+int arm_mmu_idx_to_el(ARMMMUIdx mmu_idx);
+
+/*
+ * Return the MMU index for a v7M CPU with all relevant information
+ * manually specified.
+ */
+ARMMMUIdx arm_v7m_mmu_idx_all(CPUARMState *env,
+                              bool secstate, bool priv, bool negpri);
+
+/*
+ * Return the MMU index for a v7M CPU in the specified security and
+ * privilege state.
+ */
+ARMMMUIdx arm_v7m_mmu_idx_for_secstate_and_priv(CPUARMState *env,
+                                                bool secstate, bool priv);
+
+/* Return the MMU index for a v7M CPU in the specified security state */
+ARMMMUIdx arm_v7m_mmu_idx_for_secstate(CPUARMState *env, bool secstate);
+
 /* Return true if the stage 1 translation regime is using LPAE format page
  * tables */
 bool arm_s1_regime_using_lpae_format(CPUARMState *env, ARMMMUIdx mmu_idx);
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
     switch (mmu_idx) {
     case ARMMMUIdx_E10_0:
     case ARMMMUIdx_E10_1:
+    case ARMMMUIdx_E20_0:
+    case ARMMMUIdx_E20_2:
     case ARMMMUIdx_Stage1_E0:
     case ARMMMUIdx_Stage1_E1:
     case ARMMMUIdx_E2:
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_interrupt(CPUState *cs)
 #endif /* !CONFIG_USER_ONLY */
 
 /* Return the exception level which controls this address translation regime */
-static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
+static uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     switch (mmu_idx) {
+    case ARMMMUIdx_E20_0:
+    case ARMMMUIdx_E20_2:
     case ARMMMUIdx_Stage2:
     case ARMMMUIdx_E2:
         return 2;
@@ -XXX,XX +XXX,XX @@ static inline uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
     case ARMMMUIdx_SE10_1:
     case ARMMMUIdx_Stage1_E0:
     case ARMMMUIdx_Stage1_E1:
+    case ARMMMUIdx_E10_0:
+    case ARMMMUIdx_E10_1:
     case ARMMMUIdx_MPrivNegPri:
     case ARMMMUIdx_MUserNegPri:
     case ARMMMUIdx_MPriv:
@@ -XXX,XX +XXX,XX @@ static inline TCR *regime_tcr(CPUARMState *env, ARMMMUIdx mmu_idx)
  */
 static inline ARMMMUIdx stage_1_mmu_idx(ARMMMUIdx mmu_idx)
 {
-    if (mmu_idx == ARMMMUIdx_E10_0 || mmu_idx == ARMMMUIdx_E10_1) {
-        mmu_idx += (ARMMMUIdx_Stage1_E0 - ARMMMUIdx_E10_0);
+    switch (mmu_idx) {
+    case ARMMMUIdx_E10_0:
+        return ARMMMUIdx_Stage1_E0;
+    case ARMMMUIdx_E10_1:
+        return ARMMMUIdx_Stage1_E1;
+    default:
+        return mmu_idx;
     }
-    return mmu_idx;
 }
 
 /* Return true if the translation regime is using LPAE format page tables */
@@ -XXX,XX +XXX,XX @@ static inline bool regime_is_user(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     switch (mmu_idx) {
     case ARMMMUIdx_SE10_0:
+    case ARMMMUIdx_E20_0:
     case ARMMMUIdx_Stage1_E0:
     case ARMMMUIdx_MUser:
     case ARMMMUIdx_MSUser:
@@ -XXX,XX +XXX,XX @@ int fp_exception_el(CPUARMState *env, int cur_el)
     return 0;
 }
 
+/* Return the exception level we're running at if this is our mmu_idx */
+int arm_mmu_idx_to_el(ARMMMUIdx mmu_idx)
+{
+    if (mmu_idx & ARM_MMU_IDX_M) {
+        return mmu_idx & ARM_MMU_IDX_M_PRIV;
+    }
+
+    switch (mmu_idx) {
+    case ARMMMUIdx_E10_0:
+    case ARMMMUIdx_E20_0:
+    case ARMMMUIdx_SE10_0:
+        return 0;
+    case ARMMMUIdx_E10_1:
+    case ARMMMUIdx_SE10_1:
+        return 1;
+    case ARMMMUIdx_E2:
+    case ARMMMUIdx_E20_2:
+        return 2;
+    case ARMMMUIdx_SE3:
+        return 3;
+    default:
+        g_assert_not_reached();
+    }
+}
+
 #ifndef CONFIG_TCG
 ARMMMUIdx arm_v7m_mmu_idx_for_secstate(CPUARMState *env, bool secstate)
 {
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
         return arm_v7m_mmu_idx_for_secstate(env, env->v7m.secure);
     }
 
-    if (el < 2 && arm_is_secure_below_el3(env)) {
-        return ARMMMUIdx_SE10_0 + el;
-    } else {
-        return ARMMMUIdx_E10_0 + el;
+    switch (el) {
+    case 0:
+        /* TODO: ARMv8.1-VHE */
+        if (arm_is_secure_below_el3(env)) {
+            return ARMMMUIdx_SE10_0;
+        }
+        return ARMMMUIdx_E10_0;
+    case 1:
+        if (arm_is_secure_below_el3(env)) {
+            return ARMMMUIdx_SE10_1;
+        }
+        return ARMMMUIdx_E10_1;
+    case 2:
+        /* TODO: ARMv8.1-VHE */
+        /* TODO: ARMv8.4-SecEL2 */
+        return ARMMMUIdx_E2;
+    case 3:
+        return ARMMMUIdx_SE3;
+    default:
+        g_assert_not_reached();
     }
 }
 
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline int get_a32_user_mem_index(DisasContext *s)
     case ARMMMUIdx_MSUserNegPri:
     case ARMMMUIdx_MSPrivNegPri:
         return arm_to_core_mmu_idx(ARMMMUIdx_MSUserNegPri);
-    case ARMMMUIdx_Stage2:
     default:
         g_assert_not_reached();
     }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Create a predicate to indicate whether the regime has
both positive and negative addresses.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-21-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/internals.h     | 18 ++++++++++++++++++
 target/arm/helper.c        | 23 ++++++-----------------
 target/arm/translate-a64.c |  3 +--
 3 files changed, 25 insertions(+), 19 deletions(-)

diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline void arm_call_el_change_hook(ARMCPU *cpu)
     }
 }
 
+/* Return true if this address translation regime has two ranges.  */
+static inline bool regime_has_2_ranges(ARMMMUIdx mmu_idx)
+{
+    switch (mmu_idx) {
+    case ARMMMUIdx_Stage1_E0:
+    case ARMMMUIdx_Stage1_E1:
+    case ARMMMUIdx_E10_0:
+    case ARMMMUIdx_E10_1:
+    case ARMMMUIdx_E20_0:
+    case ARMMMUIdx_E20_2:
+    case ARMMMUIdx_SE10_0:
+    case ARMMMUIdx_SE10_1:
+        return true;
+    default:
+        return false;
+    }
+}
+
 /* Return true if this address translation regime is secure */
 static inline bool regime_is_secure(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static int get_S1prot(CPUARMState *env, ARMMMUIdx mmu_idx, bool is_aa64,
     }
 
     if (is_aa64) {
-        switch (regime_el(env, mmu_idx)) {
-        case 1:
-            if (!is_user) {
-                xn = pxn || (user_rw & PAGE_WRITE);
-            }
-            break;
-        case 2:
-        case 3:
-            break;
+        if (regime_has_2_ranges(mmu_idx) && !is_user) {
+            xn = pxn || (user_rw & PAGE_WRITE);
         }
     } else if (arm_feature(env, ARM_FEATURE_V7)) {
         switch (regime_el(env, mmu_idx)) {
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
                                         ARMMMUIdx mmu_idx)
 {
     uint64_t tcr = regime_tcr(env, mmu_idx)->raw_tcr;
-    uint32_t el = regime_el(env, mmu_idx);
     bool tbi, tbid, epd, hpd, using16k, using64k;
     int select, tsz;
 
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
      */
     select = extract64(va, 55, 1);
 
-    if (el > 1) {
+    if (!regime_has_2_ranges(mmu_idx)) {
         tsz = extract32(tcr, 0, 6);
         using64k = extract32(tcr, 14, 1);
         using16k = extract32(tcr, 15, 1);
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
         param = aa64_va_parameters(env, address, mmu_idx,
                                    access_type != MMU_INST_FETCH);
         level = 0;
-        /* If we are in 64-bit EL2 or EL3 then there is no TTBR1, so mark it
-         * invalid.
-         */
-        ttbr1_valid = (el < 2);
+        ttbr1_valid = regime_has_2_ranges(mmu_idx);
         addrsize = 64 - 8 * param.tbi;
         inputsize = 64 - param.tsz;
     } else {
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
 
     flags = FIELD_DP32(flags, TBFLAG_ANY, AARCH64_STATE, 1);
 
-    /* FIXME: ARMv8.1-VHE S2 translation regime.  */
-    if (regime_el(env, stage1) < 2) {
+    /* Get control bits for tagged addresses.  */
+    if (regime_has_2_ranges(mmu_idx)) {
         ARMVAParameters p1 = aa64_va_parameters_both(env, -1, stage1);
         tbid = (p1.tbi << 1) | p0.tbi;
         tbii = tbid & ~((p1.tbid << 1) | p0.tbid);
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_top_byte_ignore(DisasContext *s, TCGv_i64 dst,
     if (tbi == 0) {
         /* Load unmodified address */
         tcg_gen_mov_i64(dst, src);
-    } else if (s->current_el >= 2) {
-        /* FIXME: ARMv8.1-VHE S2 translation regime.  */
+    } else if (!regime_has_2_ranges(s->mmu_idx)) {
         /* Force tag byte to all zero */
         tcg_gen_extract_i64(dst, src, 0, 56);
     } else {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Return the indexes for the EL2&0 regime when the appropriate bits
are set within HCR_EL2.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
         return arm_v7m_mmu_idx_for_secstate(env, env->v7m.secure);
     }
 
+    /* See ARM pseudo-function ELIsInHost.  */
     switch (el) {
     case 0:
-        /* TODO: ARMv8.1-VHE */
         if (arm_is_secure_below_el3(env)) {
             return ARMMMUIdx_SE10_0;
         }
+        if ((env->cp15.hcr_el2 & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)
+            && arm_el_is_aa64(env, 2)) {
+            return ARMMMUIdx_E20_0;
+        }
         return ARMMMUIdx_E10_0;
     case 1:
         if (arm_is_secure_below_el3(env)) {
@@ -XXX,XX +XXX,XX @@ ARMMMUIdx arm_mmu_idx_el(CPUARMState *env, int el)
         }
         return ARMMMUIdx_E10_1;
     case 2:
-        /* TODO: ARMv8.1-VHE */
         /* TODO: ARMv8.4-SecEL2 */
+        /* Note that TGE does not apply at EL2.  */
+        if ((env->cp15.hcr_el2 & HCR_E2H) && arm_el_is_aa64(env, 2)) {
+            return ARMMMUIdx_E20_2;
+        }
         return ARMMMUIdx_E2;
     case 3:
         return ARMMMUIdx_SE3;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Use the correct sctlr for EL2&0 regime.  Due to header ordering,
and where arm_mmu_idx_el is declared, we need to move the function
out of line.  Use the function in many more places in order to
select the correct control.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-23-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h          | 10 +---------
 target/arm/helper-a64.c   |  2 +-
 target/arm/helper.c       | 20 +++++++++++++++-----
 target/arm/pauth_helper.c |  9 +--------
 4 files changed, 18 insertions(+), 23 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool arm_sctlr_b(CPUARMState *env)
         (env->cp15.sctlr_el[1] & SCTLR_B) != 0;
 }
 
-static inline uint64_t arm_sctlr(CPUARMState *env, int el)
-{
-    if (el == 0) {
-        /* FIXME: ARMv8.1-VHE S2 translation regime.  */
-        return env->cp15.sctlr_el[1];
-    } else {
-        return env->cp15.sctlr_el[el];
-    }
-}
+uint64_t arm_sctlr(CPUARMState *env, int el);
 
 static inline bool arm_cpu_data_is_big_endian_a32(CPUARMState *env,
                                                   bool sctlr_b)
diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.c
+++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ static void daif_check(CPUARMState *env, uint32_t op,
                        uint32_t imm, uintptr_t ra)
 {
     /* DAIF update to PSTATE. This is OK from EL0 only if UMA is set.  */
-    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UMA)) {
+    if (arm_current_el(env) == 0 && !(arm_sctlr(env, 0) & SCTLR_UMA)) {
         raise_exception_ra(env, EXCP_UDEF,
                            syn_aa64_sysregtrap(0, extract32(op, 0, 3),
                                                extract32(op, 3, 3), 4,
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void aa64_fpsr_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static CPAccessResult aa64_daif_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                        bool isread)
 {
-    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UMA)) {
+    if (arm_current_el(env) == 0 && !(arm_sctlr(env, 0) & SCTLR_UMA)) {
         return CP_ACCESS_TRAP;
     }
     return CP_ACCESS_OK;
@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
     /* Cache invalidate/clean: NOP, but EL0 must UNDEF unless
      * SCTLR_EL1.UCI is set.
      */
-    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UCI)) {
+    if (arm_current_el(env) == 0 && !(arm_sctlr(env, 0) & SCTLR_UCI)) {
         return CP_ACCESS_TRAP;
     }
     return CP_ACCESS_OK;
@@ -XXX,XX +XXX,XX @@ static uint32_t regime_el(CPUARMState *env, ARMMMUIdx mmu_idx)
     }
 }
 
-#ifndef CONFIG_USER_ONLY
+uint64_t arm_sctlr(CPUARMState *env, int el)
+{
+    /* Only EL0 needs to be adjusted for EL1&0 or EL2&0. */
+    if (el == 0) {
+        ARMMMUIdx mmu_idx = arm_mmu_idx_el(env, 0);
+        el = (mmu_idx == ARMMMUIdx_E20_0 ? 2 : 1);
+    }
+    return env->cp15.sctlr_el[el];
+}
 
 /* Return the SCTLR value which controls this address translation regime */
-static inline uint32_t regime_sctlr(CPUARMState *env, ARMMMUIdx mmu_idx)
+static inline uint64_t regime_sctlr(CPUARMState *env, ARMMMUIdx mmu_idx)
 {
     return env->cp15.sctlr_el[regime_el(env, mmu_idx)];
 }
 
+#ifndef CONFIG_USER_ONLY
+
 /* Return true if the specified stage of address translation is disabled */
 static inline bool regime_translation_disabled(CPUARMState *env,
                                                ARMMMUIdx mmu_idx)
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
         flags = FIELD_DP32(flags, TBFLAG_A64, ZCR_LEN, zcr_len);
     }
 
-    sctlr = arm_sctlr(env, el);
+    sctlr = regime_sctlr(env, stage1);
 
     if (arm_cpu_data_is_big_endian_a64(el, sctlr)) {
         flags = FIELD_DP32(flags, TBFLAG_ANY, BE_DATA, 1);
diff --git a/target/arm/pauth_helper.c b/target/arm/pauth_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/pauth_helper.c
+++ b/target/arm/pauth_helper.c
@@ -XXX,XX +XXX,XX @@ static void pauth_check_trap(CPUARMState *env, int el, uintptr_t ra)
 
 static bool pauth_key_enabled(CPUARMState *env, int el, uint32_t bit)
 {
-    uint32_t sctlr;
-    if (el == 0) {
-        /* FIXME: ARMv8.1-VHE S2 translation regime.  */
-        sctlr = env->cp15.sctlr_el[1];
-    } else {
-        sctlr = env->cp15.sctlr_el[el];
-    }
-    return (sctlr & bit) != 0;
+    return (arm_sctlr(env, el) & bit) != 0;
 }
 
 uint64_t HELPER(pacia)(CPUARMState *env, uint64_t x, uint64_t y)
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The comment that we don't support EL2 is somewhat out of date.
Update to include checks against HCR_EL2.TDZ.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_ipas2e1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                       bool isread)
 {
-    /* We don't implement EL2, so the only control on DC ZVA is the
-     * bit in the SCTLR which can prohibit access for EL0.
-     */
-    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_DZE)) {
-        return CP_ACCESS_TRAP;
+    int cur_el = arm_current_el(env);
+
+    if (cur_el < 2) {
+        uint64_t hcr = arm_hcr_el2_eff(env);
+
+        if (cur_el == 0) {
+            if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+                if (!(env->cp15.sctlr_el[2] & SCTLR_DZE)) {
+                    return CP_ACCESS_TRAP_EL2;
+                }
+            } else {
+                if (!(env->cp15.sctlr_el[1] & SCTLR_DZE)) {
+                    return CP_ACCESS_TRAP;
+                }
+                if (hcr & HCR_TDZ) {
+                    return CP_ACCESS_TRAP_EL2;
+                }
+            }
+        } else if (hcr & HCR_TDZ) {
+            return CP_ACCESS_TRAP_EL2;
+        }
     }
     return CP_ACCESS_OK;
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Update to include checks against HCR_EL2.TID2.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_cp_reginfo[] = {
 static CPAccessResult ctr_el0_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                      bool isread)
 {
-    /* Only accessible in EL0 if SCTLR.UCT is set (and only in AArch64,
-     * but the AArch32 CTR has its own reginfo struct)
-     */
-    if (arm_current_el(env) == 0 && !(env->cp15.sctlr_el[1] & SCTLR_UCT)) {
-        return CP_ACCESS_TRAP;
+    int cur_el = arm_current_el(env);
+
+    if (cur_el < 2) {
+        uint64_t hcr = arm_hcr_el2_eff(env);
+
+        if (cur_el == 0) {
+            if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+                if (!(env->cp15.sctlr_el[2] & SCTLR_UCT)) {
+                    return CP_ACCESS_TRAP_EL2;
+                }
+            } else {
+                if (!(env->cp15.sctlr_el[1] & SCTLR_UCT)) {
+                    return CP_ACCESS_TRAP;
+                }
+                if (hcr & HCR_TID2) {
+                    return CP_ACCESS_TRAP_EL2;
+                }
+            }
+        } else if (hcr & HCR_TID2) {
+            return CP_ACCESS_TRAP_EL2;
+        }
     }
 
     if (arm_current_el(env) < 2 && arm_hcr_el2_eff(env) & HCR_TID2) {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-26-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu-qom.h |  1 +
 target/arm/cpu.h     | 11 +++++----
 target/arm/cpu.c     |  3 ++-
 target/arm/helper.c  | 56 ++++++++++++++++++++++++++++++++++++++++++++
 4 files changed, 65 insertions(+), 6 deletions(-)

diff --git a/target/arm/cpu-qom.h b/target/arm/cpu-qom.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu-qom.h
+++ b/target/arm/cpu-qom.h
@@ -XXX,XX +XXX,XX @@ void arm_gt_ptimer_cb(void *opaque);
 void arm_gt_vtimer_cb(void *opaque);
 void arm_gt_htimer_cb(void *opaque);
 void arm_gt_stimer_cb(void *opaque);
+void arm_gt_hvtimer_cb(void *opaque);
 
 #define ARM_AFF0_SHIFT 0
 #define ARM_AFF0_MASK  (0xFFULL << ARM_AFF0_SHIFT)
diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef struct ARMGenericTimer {
     uint64_t ctl; /* Timer Control register */
 } ARMGenericTimer;
 
-#define GTIMER_PHYS 0
-#define GTIMER_VIRT 1
-#define GTIMER_HYP  2
-#define GTIMER_SEC  3
-#define NUM_GTIMERS 4
+#define GTIMER_PHYS     0
+#define GTIMER_VIRT     1
+#define GTIMER_HYP      2
+#define GTIMER_SEC      3
+#define GTIMER_HYPVIRT  4
+#define NUM_GTIMERS     5
 
 typedef struct {
     uint64_t raw_tcr;
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
         }
     }
 
-
     {
         uint64_t scale;
 
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
                                               arm_gt_htimer_cb, cpu);
         cpu->gt_timer[GTIMER_SEC] = timer_new(QEMU_CLOCK_VIRTUAL, scale,
                                               arm_gt_stimer_cb, cpu);
+        cpu->gt_timer[GTIMER_HYPVIRT] = timer_new(QEMU_CLOCK_VIRTUAL, scale,
+                                                  arm_gt_hvtimer_cb, cpu);
     }
 #endif
 
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t gt_tval_read(CPUARMState *env, const ARMCPRegInfo *ri,
 
     switch (timeridx) {
     case GTIMER_VIRT:
+    case GTIMER_HYPVIRT:
         offset = gt_virt_cnt_offset(env);
         break;
     }
@@ -XXX,XX +XXX,XX @@ static void gt_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
 
     switch (timeridx) {
     case GTIMER_VIRT:
+    case GTIMER_HYPVIRT:
         offset = gt_virt_cnt_offset(env);
         break;
     }
@@ -XXX,XX +XXX,XX @@ static void gt_sec_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
     gt_ctl_write(env, ri, GTIMER_SEC, value);
 }
 
+static void gt_hv_timer_reset(CPUARMState *env, const ARMCPRegInfo *ri)
+{
+    gt_timer_reset(env, ri, GTIMER_HYPVIRT);
+}
+
+static void gt_hv_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
+{
+    gt_cval_write(env, ri, GTIMER_HYPVIRT, value);
+}
+
+static uint64_t gt_hv_tval_read(CPUARMState *env, const ARMCPRegInfo *ri)
+{
+    return gt_tval_read(env, ri, GTIMER_HYPVIRT);
+}
+
+static void gt_hv_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
+{
+    gt_tval_write(env, ri, GTIMER_HYPVIRT, value);
+}
+
+static void gt_hv_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                            uint64_t value)
+{
+    gt_ctl_write(env, ri, GTIMER_HYPVIRT, value);
+}
+
 void arm_gt_ptimer_cb(void *opaque)
 {
     ARMCPU *cpu = opaque;
@@ -XXX,XX +XXX,XX @@ void arm_gt_stimer_cb(void *opaque)
     gt_recalc_timer(cpu, GTIMER_SEC);
 }
 
+void arm_gt_hvtimer_cb(void *opaque)
+{
+    ARMCPU *cpu = opaque;
+
+    gt_recalc_timer(cpu, GTIMER_HYPVIRT);
+}
+
 static void arm_gt_cntfrq_reset(CPUARMState *env, const ARMCPRegInfo *opaque)
 {
     ARMCPU *cpu = env_archcpu(env);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vhe_reginfo[] = {
       .opc0 = 3, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 1,
       .access = PL2_RW, .writefn = vmsa_tcr_ttbr_el2_write,
       .fieldoffset = offsetof(CPUARMState, cp15.ttbr1_el[2]) },
+#ifndef CONFIG_USER_ONLY
+    { .name = "CNTHV_CVAL_EL2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 3, .opc2 = 2,
+      .fieldoffset =
+        offsetof(CPUARMState, cp15.c14_timer[GTIMER_HYPVIRT].cval),
+      .type = ARM_CP_IO, .access = PL2_RW,
+      .writefn = gt_hv_cval_write, .raw_writefn = raw_write },
+    { .name = "CNTHV_TVAL_EL2", .state = ARM_CP_STATE_BOTH,
+      .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 3, .opc2 = 0,
+      .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL2_RW,
+      .resetfn = gt_hv_timer_reset,
+      .readfn = gt_hv_tval_read, .writefn = gt_hv_tval_write },
+    { .name = "CNTHV_CTL_EL2", .state = ARM_CP_STATE_BOTH,
+      .type = ARM_CP_IO,
+      .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 3, .opc2 = 1,
+      .access = PL2_RW,
+      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_HYPVIRT].ctl),
+      .writefn = gt_hv_ctl_write, .raw_writefn = raw_write },
+#endif
     REGINFO_SENTINEL
 };
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_cntfrq_access(CPUARMState *env, const ARMCPRegInfo *ri,
      * Writable only at the highest implemented exception level.
      */
     int el = arm_current_el(env);
+    uint64_t hcr;
+    uint32_t cntkctl;
 
     switch (el) {
     case 0:
-        if (!extract32(env->cp15.c14_cntkctl, 0, 2)) {
+        hcr = arm_hcr_el2_eff(env);
+        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+            cntkctl = env->cp15.cnthctl_el2;
+        } else {
+            cntkctl = env->cp15.c14_cntkctl;
+        }
+        if (!extract32(cntkctl, 0, 2)) {
             return CP_ACCESS_TRAP;
         }
         break;
@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_counter_access(CPUARMState *env, int timeridx,
 {
     unsigned int cur_el = arm_current_el(env);
     bool secure = arm_is_secure(env);
+    uint64_t hcr = arm_hcr_el2_eff(env);
 
-    /* CNT[PV]CT: not visible from PL0 if ELO[PV]CTEN is zero */
-    if (cur_el == 0 &&
-        !extract32(env->cp15.c14_cntkctl, timeridx, 1)) {
-        return CP_ACCESS_TRAP;
-    }
+    switch (cur_el) {
+    case 0:
+        /* If HCR_EL2.<E2H,TGE> == '11': check CNTHCTL_EL2.EL0[PV]CTEN. */
+        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+            return (extract32(env->cp15.cnthctl_el2, timeridx, 1)
+                    ? CP_ACCESS_OK : CP_ACCESS_TRAP_EL2);
+        }
 
-    if (arm_feature(env, ARM_FEATURE_EL2) &&
-        timeridx == GTIMER_PHYS && !secure && cur_el < 2 &&
-        !extract32(env->cp15.cnthctl_el2, 0, 1)) {
-        return CP_ACCESS_TRAP_EL2;
+        /* CNT[PV]CT: not visible from PL0 if EL0[PV]CTEN is zero */
+        if (!extract32(env->cp15.c14_cntkctl, timeridx, 1)) {
+            return CP_ACCESS_TRAP;
+        }
+
+        /* If HCR_EL2.<E2H,TGE> == '10': check CNTHCTL_EL2.EL1PCTEN. */
+        if (hcr & HCR_E2H) {
+            if (timeridx == GTIMER_PHYS &&
+                !extract32(env->cp15.cnthctl_el2, 10, 1)) {
+                return CP_ACCESS_TRAP_EL2;
+            }
+        } else {
+            /* If HCR_EL2.<E2H> == 0: check CNTHCTL_EL2.EL1PCEN. */
+            if (arm_feature(env, ARM_FEATURE_EL2) &&
+                timeridx == GTIMER_PHYS && !secure &&
+                !extract32(env->cp15.cnthctl_el2, 1, 1)) {
+                return CP_ACCESS_TRAP_EL2;
+            }
+        }
+        break;
+
+    case 1:
+        /* Check CNTHCTL_EL2.EL1PCTEN, which changes location based on E2H. */
+        if (arm_feature(env, ARM_FEATURE_EL2) &&
+            timeridx == GTIMER_PHYS && !secure &&
+            (hcr & HCR_E2H
+             ? !extract32(env->cp15.cnthctl_el2, 10, 1)
+             : !extract32(env->cp15.cnthctl_el2, 0, 1))) {
+            return CP_ACCESS_TRAP_EL2;
+        }
+        break;
     }
     return CP_ACCESS_OK;
 }
@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_timer_access(CPUARMState *env, int timeridx,
 {
     unsigned int cur_el = arm_current_el(env);
     bool secure = arm_is_secure(env);
+    uint64_t hcr = arm_hcr_el2_eff(env);
 
-    /* CNT[PV]_CVAL, CNT[PV]_CTL, CNT[PV]_TVAL: not visible from PL0 if
-     * EL0[PV]TEN is zero.
-     */
-    if (cur_el == 0 &&
-        !extract32(env->cp15.c14_cntkctl, 9 - timeridx, 1)) {
-        return CP_ACCESS_TRAP;
-    }
+    switch (cur_el) {
+    case 0:
+        if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+            /* If HCR_EL2.<E2H,TGE> == '11': check CNTHCTL_EL2.EL0[PV]TEN. */
+            return (extract32(env->cp15.cnthctl_el2, 9 - timeridx, 1)
+                    ? CP_ACCESS_OK : CP_ACCESS_TRAP_EL2);
+        }
 
-    if (arm_feature(env, ARM_FEATURE_EL2) &&
-        timeridx == GTIMER_PHYS && !secure && cur_el < 2 &&
-        !extract32(env->cp15.cnthctl_el2, 1, 1)) {
-        return CP_ACCESS_TRAP_EL2;
+        /*
+         * CNT[PV]_CVAL, CNT[PV]_CTL, CNT[PV]_TVAL: not visible from
+         * EL0 if EL0[PV]TEN is zero.
+         */
+        if (!extract32(env->cp15.c14_cntkctl, 9 - timeridx, 1)) {
+            return CP_ACCESS_TRAP;
+        }
+        /* fall through */
+
+    case 1:
+        if (arm_feature(env, ARM_FEATURE_EL2) &&
+            timeridx == GTIMER_PHYS && !secure) {
+            if (hcr & HCR_E2H) {
+                /* If HCR_EL2.<E2H,TGE> == '10': check CNTHCTL_EL2.EL1PTEN. */
+                if (!extract32(env->cp15.cnthctl_el2, 11, 1)) {
+                    return CP_ACCESS_TRAP_EL2;
+                }
+            } else {
+                /* If HCR_EL2.<E2H> == 0: check CNTHCTL_EL2.EL1PCEN. */
+                if (!extract32(env->cp15.cnthctl_el2, 1, 1)) {
+                    return CP_ACCESS_TRAP_EL2;
+                }
+            }
+        }
+        break;
     }
     return CP_ACCESS_OK;
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

For ARMv8.1, op1 == 5 is reserved for EL2 aliases of
EL1 and EL0 registers.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
             mask = PL0_RW;
             break;
         case 4:
+        case 5:
             /* min_EL EL2 */
             mask = PL2_RW;
             break;
-        case 5:
-            /* unallocated encoding, so not possible */
-            assert(false);
-            break;
         case 6:
             /* min_EL EL3 */
             mask = PL3_RW;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Several of the EL1/0 registers are redirected to the EL2 version when in
EL2 and HCR_EL2.E2H is set.  Many of these registers have side effects.
Link together the two ARMCPRegInfo structures after they have been
properly instantiated.  Install common dispatch routines to all of the
relevant registers.

The same set of registers that are redirected also have additional
EL12/EL02 aliases created to access the original register that was
redirected.

Omit the generic timer registers from redirection here, because we'll
need multiple kinds of redirection from both EL0 and EL2.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-29-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h    |  13 ++++
 target/arm/helper.c | 162 ++++++++++++++++++++++++++++++++++++++++++++
 2 files changed, 175 insertions(+)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPRegInfo {
      * fieldoffset is 0 then no reset will be done.
      */
     CPResetFn *resetfn;
+
+    /*
+     * "Original" writefn and readfn.
+     * For ARMv8.1-VHE register aliases, we overwrite the read/write
+     * accessor functions of various EL1/EL0 to perform the runtime
+     * check for which sysreg should actually be modified, and then
+     * forwards the operation.  Before overwriting the accessors,
+     * the original function is copied here, so that accesses that
+     * really do go to the EL1/EL0 version proceed normally.
+     * (The corresponding EL2 register is linked via opaque.)
+     */
+    CPReadFn *orig_readfn;
+    CPWriteFn *orig_writefn;
 };
 
 /* Macros which are lvalues for the field in CPUARMState for the
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_cp_reginfo[] = {
     REGINFO_SENTINEL
 };
 
+#ifndef CONFIG_USER_ONLY
+/* Test if system register redirection is to occur in the current state.  */
+static bool redirect_for_e2h(CPUARMState *env)
+{
+    return arm_current_el(env) == 2 && (arm_hcr_el2_eff(env) & HCR_E2H);
+}
+
+static uint64_t el2_e2h_read(CPUARMState *env, const ARMCPRegInfo *ri)
+{
+    CPReadFn *readfn;
+
+    if (redirect_for_e2h(env)) {
+        /* Switch to the saved EL2 version of the register.  */
+        ri = ri->opaque;
+        readfn = ri->readfn;
+    } else {
+        readfn = ri->orig_readfn;
+    }
+    if (readfn == NULL) {
+        readfn = raw_read;
+    }
+    return readfn(env, ri);
+}
+
+static void el2_e2h_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                          uint64_t value)
+{
+    CPWriteFn *writefn;
+
+    if (redirect_for_e2h(env)) {
+        /* Switch to the saved EL2 version of the register.  */
+        ri = ri->opaque;
+        writefn = ri->writefn;
+    } else {
+        writefn = ri->orig_writefn;
+    }
+    if (writefn == NULL) {
+        writefn = raw_write;
+    }
+    writefn(env, ri, value);
+}
+
+static void define_arm_vh_e2h_redirects_aliases(ARMCPU *cpu)
+{
+    struct E2HAlias {
+        uint32_t src_key, dst_key, new_key;
+        const char *src_name, *dst_name, *new_name;
+        bool (*feature)(const ARMISARegisters *id);
+    };
+
+#define K(op0, op1, crn, crm, op2) \
+    ENCODE_AA64_CP_REG(CP_REG_ARM64_SYSREG_CP, crn, crm, op0, op1, op2)
+
+    static const struct E2HAlias aliases[] = {
+        { K(3, 0,  1, 0, 0), K(3, 4,  1, 0, 0), K(3, 5, 1, 0, 0),
+          "SCTLR", "SCTLR_EL2", "SCTLR_EL12" },
+        { K(3, 0,  1, 0, 2), K(3, 4,  1, 1, 2), K(3, 5, 1, 0, 2),
+          "CPACR", "CPTR_EL2", "CPACR_EL12" },
+        { K(3, 0,  2, 0, 0), K(3, 4,  2, 0, 0), K(3, 5, 2, 0, 0),
+          "TTBR0_EL1", "TTBR0_EL2", "TTBR0_EL12" },
+        { K(3, 0,  2, 0, 1), K(3, 4,  2, 0, 1), K(3, 5, 2, 0, 1),
+          "TTBR1_EL1", "TTBR1_EL2", "TTBR1_EL12" },
+        { K(3, 0,  2, 0, 2), K(3, 4,  2, 0, 2), K(3, 5, 2, 0, 2),
+          "TCR_EL1", "TCR_EL2", "TCR_EL12" },
+        { K(3, 0,  4, 0, 0), K(3, 4,  4, 0, 0), K(3, 5, 4, 0, 0),
+          "SPSR_EL1", "SPSR_EL2", "SPSR_EL12" },
+        { K(3, 0,  4, 0, 1), K(3, 4,  4, 0, 1), K(3, 5, 4, 0, 1),
+          "ELR_EL1", "ELR_EL2", "ELR_EL12" },
+        { K(3, 0,  5, 1, 0), K(3, 4,  5, 1, 0), K(3, 5, 5, 1, 0),
+          "AFSR0_EL1", "AFSR0_EL2", "AFSR0_EL12" },
+        { K(3, 0,  5, 1, 1), K(3, 4,  5, 1, 1), K(3, 5, 5, 1, 1),
+          "AFSR1_EL1", "AFSR1_EL2", "AFSR1_EL12" },
+        { K(3, 0,  5, 2, 0), K(3, 4,  5, 2, 0), K(3, 5, 5, 2, 0),
+          "ESR_EL1", "ESR_EL2", "ESR_EL12" },
+        { K(3, 0,  6, 0, 0), K(3, 4,  6, 0, 0), K(3, 5, 6, 0, 0),
+          "FAR_EL1", "FAR_EL2", "FAR_EL12" },
+        { K(3, 0, 10, 2, 0), K(3, 4, 10, 2, 0), K(3, 5, 10, 2, 0),
+          "MAIR_EL1", "MAIR_EL2", "MAIR_EL12" },
+        { K(3, 0, 10, 3, 0), K(3, 4, 10, 3, 0), K(3, 5, 10, 3, 0),
+          "AMAIR0", "AMAIR_EL2", "AMAIR_EL12" },
+        { K(3, 0, 12, 0, 0), K(3, 4, 12, 0, 0), K(3, 5, 12, 0, 0),
+          "VBAR", "VBAR_EL2", "VBAR_EL12" },
+        { K(3, 0, 13, 0, 1), K(3, 4, 13, 0, 1), K(3, 5, 13, 0, 1),
+          "CONTEXTIDR_EL1", "CONTEXTIDR_EL2", "CONTEXTIDR_EL12" },
+        { K(3, 0, 14, 1, 0), K(3, 4, 14, 1, 0), K(3, 5, 14, 1, 0),
+          "CNTKCTL", "CNTHCTL_EL2", "CNTKCTL_EL12" },
+
+        /*
+         * Note that redirection of ZCR is mentioned in the description
+         * of ZCR_EL2, and aliasing in the description of ZCR_EL1, but
+         * not in the summary table.
+         */
+        { K(3, 0,  1, 2, 0), K(3, 4,  1, 2, 0), K(3, 5, 1, 2, 0),
+          "ZCR_EL1", "ZCR_EL2", "ZCR_EL12", isar_feature_aa64_sve },
+
+        /* TODO: ARMv8.2-SPE -- PMSCR_EL2 */
+        /* TODO: ARMv8.4-Trace -- TRFCR_EL2 */
+    };
+#undef K
+
+    size_t i;
+
+    for (i = 0; i < ARRAY_SIZE(aliases); i++) {
+        const struct E2HAlias *a = &aliases[i];
+        ARMCPRegInfo *src_reg, *dst_reg;
+
+        if (a->feature && !a->feature(&cpu->isar)) {
+            continue;
+        }
+
+        src_reg = g_hash_table_lookup(cpu->cp_regs, &a->src_key);
+        dst_reg = g_hash_table_lookup(cpu->cp_regs, &a->dst_key);
+        g_assert(src_reg != NULL);
+        g_assert(dst_reg != NULL);
+
+        /* Cross-compare names to detect typos in the keys.  */
+        g_assert(strcmp(src_reg->name, a->src_name) == 0);
+        g_assert(strcmp(dst_reg->name, a->dst_name) == 0);
+
+        /* None of the core system registers use opaque; we will.  */
+        g_assert(src_reg->opaque == NULL);
+
+        /* Create alias before redirection so we dup the right data. */
+        if (a->new_key) {
+            ARMCPRegInfo *new_reg = g_memdup(src_reg, sizeof(ARMCPRegInfo));
+            uint32_t *new_key = g_memdup(&a->new_key, sizeof(uint32_t));
+            bool ok;
+
+            new_reg->name = a->new_name;
+            new_reg->type |= ARM_CP_ALIAS;
+            /* Remove PL1/PL0 access, leaving PL2/PL3 R/W in place.  */
+            new_reg->access &= PL2_RW | PL3_RW;
+
+            ok = g_hash_table_insert(cpu->cp_regs, new_key, new_reg);
+            g_assert(ok);
+        }
+
+        src_reg->opaque = dst_reg;
+        src_reg->orig_readfn = src_reg->readfn ?: raw_read;
+        src_reg->orig_writefn = src_reg->writefn ?: raw_write;
+        if (!src_reg->raw_readfn) {
+            src_reg->raw_readfn = raw_read;
+        }
+        if (!src_reg->raw_writefn) {
+            src_reg->raw_writefn = raw_write;
+        }
+        src_reg->readfn = el2_e2h_read;
+        src_reg->writefn = el2_e2h_write;
+    }
+}
+#endif
+
 static CPAccessResult ctr_el0_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                      bool isread)
 {
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
         : cpu_isar_feature(aa32_predinv, cpu)) {
         define_arm_cp_regs(cpu, predinv_reginfo);
     }
+
+#ifndef CONFIG_USER_ONLY
+    /*
+     * Register redirections and aliases must be done last,
+     * after the registers from the other extensions have been defined.
+     */
+    if (arm_feature(env, ARM_FEATURE_EL2) && cpu_isar_feature(aa64_vh, cpu)) {
+        define_arm_vh_e2h_redirects_aliases(cpu);
+    }
+#endif
 }
 
 void arm_cpu_register_gdb_regs_for_features(ARMCPU *cpu)
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Apart from the wholesale redirection that HCR_EL2.E2H performs
for EL2, there's a separate redirection specific to the timers
that happens for EL0 when running in the EL2&0 regime.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-30-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 181 +++++++++++++++++++++++++++++++++++++++++---
 1 file changed, 169 insertions(+), 12 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void gt_phys_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
     gt_ctl_write(env, ri, GTIMER_PHYS, value);
 }
 
+static int gt_phys_redir_timeridx(CPUARMState *env)
+{
+    switch (arm_mmu_idx(env)) {
+    case ARMMMUIdx_E20_0:
+    case ARMMMUIdx_E20_2:
+        return GTIMER_HYP;
+    default:
+        return GTIMER_PHYS;
+    }
+}
+
+static int gt_virt_redir_timeridx(CPUARMState *env)
+{
+    switch (arm_mmu_idx(env)) {
+    case ARMMMUIdx_E20_0:
+    case ARMMMUIdx_E20_2:
+        return GTIMER_HYPVIRT;
+    default:
+        return GTIMER_VIRT;
+    }
+}
+
+static uint64_t gt_phys_redir_cval_read(CPUARMState *env,
+                                        const ARMCPRegInfo *ri)
+{
+    int timeridx = gt_phys_redir_timeridx(env);
+    return env->cp15.c14_timer[timeridx].cval;
+}
+
+static void gt_phys_redir_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                     uint64_t value)
+{
+    int timeridx = gt_phys_redir_timeridx(env);
+    gt_cval_write(env, ri, timeridx, value);
+}
+
+static uint64_t gt_phys_redir_tval_read(CPUARMState *env,
+                                        const ARMCPRegInfo *ri)
+{
+    int timeridx = gt_phys_redir_timeridx(env);
+    return gt_tval_read(env, ri, timeridx);
+}
+
+static void gt_phys_redir_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                     uint64_t value)
+{
+    int timeridx = gt_phys_redir_timeridx(env);
+    gt_tval_write(env, ri, timeridx, value);
+}
+
+static uint64_t gt_phys_redir_ctl_read(CPUARMState *env,
+                                       const ARMCPRegInfo *ri)
+{
+    int timeridx = gt_phys_redir_timeridx(env);
+    return env->cp15.c14_timer[timeridx].ctl;
+}
+
+static void gt_phys_redir_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    int timeridx = gt_phys_redir_timeridx(env);
+    gt_ctl_write(env, ri, timeridx, value);
+}
+
 static void gt_virt_timer_reset(CPUARMState *env, const ARMCPRegInfo *ri)
 {
     gt_timer_reset(env, ri, GTIMER_VIRT);
@@ -XXX,XX +XXX,XX @@ static void gt_cntvoff_write(CPUARMState *env, const ARMCPRegInfo *ri,
     gt_recalc_timer(cpu, GTIMER_VIRT);
 }
 
+static uint64_t gt_virt_redir_cval_read(CPUARMState *env,
+                                        const ARMCPRegInfo *ri)
+{
+    int timeridx = gt_virt_redir_timeridx(env);
+    return env->cp15.c14_timer[timeridx].cval;
+}
+
+static void gt_virt_redir_cval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                     uint64_t value)
+{
+    int timeridx = gt_virt_redir_timeridx(env);
+    gt_cval_write(env, ri, timeridx, value);
+}
+
+static uint64_t gt_virt_redir_tval_read(CPUARMState *env,
+                                        const ARMCPRegInfo *ri)
+{
+    int timeridx = gt_virt_redir_timeridx(env);
+    return gt_tval_read(env, ri, timeridx);
+}
+
+static void gt_virt_redir_tval_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                     uint64_t value)
+{
+    int timeridx = gt_virt_redir_timeridx(env);
+    gt_tval_write(env, ri, timeridx, value);
+}
+
+static uint64_t gt_virt_redir_ctl_read(CPUARMState *env,
+                                       const ARMCPRegInfo *ri)
+{
+    int timeridx = gt_virt_redir_timeridx(env);
+    return env->cp15.c14_timer[timeridx].ctl;
+}
+
+static void gt_virt_redir_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    int timeridx = gt_virt_redir_timeridx(env);
+    gt_ctl_write(env, ri, timeridx, value);
+}
+
 static void gt_hyp_timer_reset(CPUARMState *env, const ARMCPRegInfo *ri)
 {
     gt_timer_reset(env, ri, GTIMER_HYP);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .accessfn = gt_ptimer_access,
       .fieldoffset = offsetoflow32(CPUARMState,
                                    cp15.c14_timer[GTIMER_PHYS].ctl),
-      .writefn = gt_phys_ctl_write, .raw_writefn = raw_write,
+      .readfn = gt_phys_redir_ctl_read, .raw_readfn = raw_read,
+      .writefn = gt_phys_redir_ctl_write, .raw_writefn = raw_write,
     },
     { .name = "CNTP_CTL_S",
       .cp = 15, .crn = 14, .crm = 2, .opc1 = 0, .opc2 = 1,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .accessfn = gt_ptimer_access,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].ctl),
       .resetvalue = 0,
-      .writefn = gt_phys_ctl_write, .raw_writefn = raw_write,
+      .readfn = gt_phys_redir_ctl_read, .raw_readfn = raw_read,
+      .writefn = gt_phys_redir_ctl_write, .raw_writefn = raw_write,
     },
     { .name = "CNTV_CTL", .cp = 15, .crn = 14, .crm = 3, .opc1 = 0, .opc2 = 1,
       .type = ARM_CP_IO | ARM_CP_ALIAS, .access = PL0_RW,
       .accessfn = gt_vtimer_access,
       .fieldoffset = offsetoflow32(CPUARMState,
                                    cp15.c14_timer[GTIMER_VIRT].ctl),
-      .writefn = gt_virt_ctl_write, .raw_writefn = raw_write,
+      .readfn = gt_virt_redir_ctl_read, .raw_readfn = raw_read,
+      .writefn = gt_virt_redir_ctl_write, .raw_writefn = raw_write,
     },
     { .name = "CNTV_CTL_EL0", .state = ARM_CP_STATE_AA64,
       .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 3, .opc2 = 1,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .accessfn = gt_vtimer_access,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].ctl),
       .resetvalue = 0,
-      .writefn = gt_virt_ctl_write, .raw_writefn = raw_write,
+      .readfn = gt_virt_redir_ctl_read, .raw_readfn = raw_read,
+      .writefn = gt_virt_redir_ctl_write, .raw_writefn = raw_write,
     },
     /* TimerValue views: a 32 bit downcounting view of the underlying state */
     { .name = "CNTP_TVAL", .cp = 15, .crn = 14, .crm = 2, .opc1 = 0, .opc2 = 0,
       .secure = ARM_CP_SECSTATE_NS,
       .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
       .accessfn = gt_ptimer_access,
-      .readfn = gt_phys_tval_read, .writefn = gt_phys_tval_write,
+      .readfn = gt_phys_redir_tval_read, .writefn = gt_phys_redir_tval_write,
     },
     { .name = "CNTP_TVAL_S",
       .cp = 15, .crn = 14, .crm = 2, .opc1 = 0, .opc2 = 0,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 2, .opc2 = 0,
       .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
       .accessfn = gt_ptimer_access, .resetfn = gt_phys_timer_reset,
-      .readfn = gt_phys_tval_read, .writefn = gt_phys_tval_write,
+      .readfn = gt_phys_redir_tval_read, .writefn = gt_phys_redir_tval_write,
     },
     { .name = "CNTV_TVAL", .cp = 15, .crn = 14, .crm = 3, .opc1 = 0, .opc2 = 0,
       .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
       .accessfn = gt_vtimer_access,
-      .readfn = gt_virt_tval_read, .writefn = gt_virt_tval_write,
+      .readfn = gt_virt_redir_tval_read, .writefn = gt_virt_redir_tval_write,
     },
     { .name = "CNTV_TVAL_EL0", .state = ARM_CP_STATE_AA64,
       .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 3, .opc2 = 0,
       .type = ARM_CP_NO_RAW | ARM_CP_IO, .access = PL0_RW,
       .accessfn = gt_vtimer_access, .resetfn = gt_virt_timer_reset,
-      .readfn = gt_virt_tval_read, .writefn = gt_virt_tval_write,
+      .readfn = gt_virt_redir_tval_read, .writefn = gt_virt_redir_tval_write,
     },
     /* The counter itself */
     { .name = "CNTPCT", .cp = 15, .crm = 14, .opc1 = 0,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .type = ARM_CP_64BIT | ARM_CP_IO | ARM_CP_ALIAS,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].cval),
       .accessfn = gt_ptimer_access,
-      .writefn = gt_phys_cval_write, .raw_writefn = raw_write,
+      .readfn = gt_phys_redir_cval_read, .raw_readfn = raw_read,
+      .writefn = gt_phys_redir_cval_write, .raw_writefn = raw_write,
     },
     { .name = "CNTP_CVAL_S", .cp = 15, .crm = 14, .opc1 = 2,
       .secure = ARM_CP_SECSTATE_S,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .type = ARM_CP_IO,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].cval),
       .resetvalue = 0, .accessfn = gt_ptimer_access,
-      .writefn = gt_phys_cval_write, .raw_writefn = raw_write,
+      .readfn = gt_phys_redir_cval_read, .raw_readfn = raw_read,
+      .writefn = gt_phys_redir_cval_write, .raw_writefn = raw_write,
     },
     { .name = "CNTV_CVAL", .cp = 15, .crm = 14, .opc1 = 3,
       .access = PL0_RW,
       .type = ARM_CP_64BIT | ARM_CP_IO | ARM_CP_ALIAS,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].cval),
       .accessfn = gt_vtimer_access,
-      .writefn = gt_virt_cval_write, .raw_writefn = raw_write,
+      .readfn = gt_virt_redir_cval_read, .raw_readfn = raw_read,
+      .writefn = gt_virt_redir_cval_write, .raw_writefn = raw_write,
     },
     { .name = "CNTV_CVAL_EL0", .state = ARM_CP_STATE_AA64,
       .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 3, .opc2 = 2,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
       .type = ARM_CP_IO,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].cval),
       .resetvalue = 0, .accessfn = gt_vtimer_access,
-      .writefn = gt_virt_cval_write, .raw_writefn = raw_write,
+      .readfn = gt_virt_redir_cval_read, .raw_readfn = raw_read,
+      .writefn = gt_virt_redir_cval_write, .raw_writefn = raw_write,
     },
     /* Secure timer -- this is actually restricted to only EL3
      * and configurably Secure-EL1 via the accessfn.
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
     REGINFO_SENTINEL
 };
 
+static CPAccessResult e2h_access(CPUARMState *env, const ARMCPRegInfo *ri,
+                                 bool isread)
+{
+    if (!(arm_hcr_el2_eff(env) & HCR_E2H)) {
+        return CP_ACCESS_TRAP;
+    }
+    return CP_ACCESS_OK;
+}
+
 #else
 
 /* In user-mode most of the generic timer registers are inaccessible
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vhe_reginfo[] = {
       .access = PL2_RW,
       .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_HYPVIRT].ctl),
       .writefn = gt_hv_ctl_write, .raw_writefn = raw_write },
+    { .name = "CNTP_CTL_EL02", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 2, .opc2 = 1,
+      .type = ARM_CP_IO | ARM_CP_ALIAS,
+      .access = PL2_RW, .accessfn = e2h_access,
+      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].ctl),
+      .writefn = gt_phys_ctl_write, .raw_writefn = raw_write },
+    { .name = "CNTV_CTL_EL02", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 3, .opc2 = 1,
+      .type = ARM_CP_IO | ARM_CP_ALIAS,
+      .access = PL2_RW, .accessfn = e2h_access,
+      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].ctl),
+      .writefn = gt_virt_ctl_write, .raw_writefn = raw_write },
+    { .name = "CNTP_TVAL_EL02", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 2, .opc2 = 0,
+      .type = ARM_CP_NO_RAW | ARM_CP_IO | ARM_CP_ALIAS,
+      .access = PL2_RW, .accessfn = e2h_access,
+      .readfn = gt_phys_tval_read, .writefn = gt_phys_tval_write },
+    { .name = "CNTV_TVAL_EL02", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 3, .opc2 = 0,
+      .type = ARM_CP_NO_RAW | ARM_CP_IO | ARM_CP_ALIAS,
+      .access = PL2_RW, .accessfn = e2h_access,
+      .readfn = gt_virt_tval_read, .writefn = gt_virt_tval_write },
+    { .name = "CNTP_CVAL_EL02", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 2, .opc2 = 2,
+      .type = ARM_CP_IO | ARM_CP_ALIAS,
+      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_PHYS].cval),
+      .access = PL2_RW, .accessfn = e2h_access,
+      .writefn = gt_phys_cval_write, .raw_writefn = raw_write },
+    { .name = "CNTV_CVAL_EL02", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 5, .crn = 14, .crm = 3, .opc2 = 2,
+      .type = ARM_CP_IO | ARM_CP_ALIAS,
+      .fieldoffset = offsetof(CPUARMState, cp15.c14_timer[GTIMER_VIRT].cval),
+      .access = PL2_RW, .accessfn = e2h_access,
+      .writefn = gt_virt_cval_write, .raw_writefn = raw_write },
 #endif
     REGINFO_SENTINEL
 };
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Since we only support a single ASID, flush the tlb when it changes.

Note that TCR_EL2, like TCR_EL1, has the A1 bit that chooses between
the two TTBR* registers for the location of the ASID.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-31-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 22 +++++++++++++++-------
 1 file changed, 15 insertions(+), 7 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void vmsa_ttbcr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
     tcr->base_mask = 0xffffc000u;
 }
 
-static void vmsa_tcr_el1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+static void vmsa_tcr_el12_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                uint64_t value)
 {
     ARMCPU *cpu = env_archcpu(env);
@@ -XXX,XX +XXX,XX @@ static void vmsa_ttbr_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static void vmsa_tcr_ttbr_el2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
 {
-    /* TODO: There are ASID fields in here with HCR_EL2.E2H */
+    /*
+     * If we are running with E2&0 regime, then an ASID is active.
+     * Flush if that might be changing.  Note we're not checking
+     * TCR_EL2.A1 to know if this is really the TTBRx_EL2 that
+     * holds the active ASID, only checking the field that might.
+     */
+    if (extract64(raw_read(env, ri) ^ value, 48, 16) &&
+        (arm_hcr_el2_eff(env) & HCR_E2H)) {
+        tlb_flush_by_mmuidx(env_cpu(env),
+                            ARMMMUIdxBit_E20_2 | ARMMMUIdxBit_E20_0);
+    }
     raw_write(env, ri, value);
 }
 
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vmsa_cp_reginfo[] = {
                              offsetof(CPUARMState, cp15.ttbr1_ns) } },
     { .name = "TCR_EL1", .state = ARM_CP_STATE_AA64,
       .opc0 = 3, .crn = 2, .crm = 0, .opc1 = 0, .opc2 = 2,
-      .access = PL1_RW, .writefn = vmsa_tcr_el1_write,
+      .access = PL1_RW, .writefn = vmsa_tcr_el12_write,
       .resetfn = vmsa_ttbcr_reset, .raw_writefn = raw_write,
       .fieldoffset = offsetof(CPUARMState, cp15.tcr_el[1]) },
     { .name = "TTBCR", .cp = 15, .crn = 2, .crm = 0, .opc1 = 0, .opc2 = 2,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
       .resetvalue = 0 },
     { .name = "TCR_EL2", .state = ARM_CP_STATE_BOTH,
       .opc0 = 3, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 2,
-      .access = PL2_RW,
-      /* no .writefn needed as this can't cause an ASID change;
-       * no .raw_writefn or .resetfn needed as we never use mask/base_mask
-       */
+      .access = PL2_RW, .writefn = vmsa_tcr_el12_write,
+      /* no .raw_writefn or .resetfn needed as we never use mask/base_mask */
       .fieldoffset = offsetof(CPUARMState, cp15.tcr_el[2]) },
     { .name = "VTCR", .state = ARM_CP_STATE_AA32,
       .cp = 15, .opc1 = 4, .crn = 2, .crm = 1, .opc2 = 2,
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-32-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 25 ++++++++++++++++++-------
 1 file changed, 18 insertions(+), 7 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static CPAccessResult aa64_cacheop_access(CPUARMState *env,
 
 static int vae1_tlbmask(CPUARMState *env)
 {
+    /* Since we exclude secure first, we may read HCR_EL2 directly. */
     if (arm_is_secure_below_el3(env)) {
         return ARMMMUIdxBit_SE10_1 | ARMMMUIdxBit_SE10_0;
+    } else if ((env->cp15.hcr_el2 & (HCR_E2H | HCR_TGE))
+               == (HCR_E2H | HCR_TGE)) {
+        return ARMMMUIdxBit_E20_2 | ARMMMUIdxBit_E20_0;
     } else {
         return ARMMMUIdxBit_E10_1 | ARMMMUIdxBit_E10_0;
     }
@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
     }
 }
 
+static int e2_tlbmask(CPUARMState *env)
+{
+    /* TODO: ARMv8.4-SecEL2 */
+    return ARMMMUIdxBit_E20_0 | ARMMMUIdxBit_E20_2 | ARMMMUIdxBit_E2;
+}
+
 static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
 {
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
+    CPUState *cs = env_cpu(env);
+    int mask = e2_tlbmask(env);
 
-    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E2);
+    tlb_flush_by_mmuidx(cs, mask);
 }
 
 static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
 {
     CPUState *cs = env_cpu(env);
+    int mask = e2_tlbmask(env);
 
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 }
 
 static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
      * Currently handles both VAE2 and VALE2, since we don't support
      * flush-last-level-only.
      */
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
+    CPUState *cs = env_cpu(env);
+    int mask = e2_tlbmask(env);
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
 
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
+    tlb_flush_page_by_mmuidx(cs, pageaddr, mask);
 }
 
 static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The TGE bit routes all asynchronous exceptions to EL2.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t arm_phys_excp_target_el(CPUState *cs, uint32_t excp_idx,
         break;
     };
 
+    /*
+     * For these purposes, TGE and AMO/IMO/FMO both force the
+     * interrupt to EL2.  Fold TGE into the bit extracted above.
+     */
+    hcr |= (hcr_el2 & HCR_TGE) != 0;
+
     /* Perform a table-lookup for the target EL given the current state */
     target_el = target_el_table[is64][scr][rw][hcr][secure][cur_el];
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

When TGE+E2H are both set, CPACR_EL1 is ignored.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-34-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 53 ++++++++++++++++++++++++---------------------
 1 file changed, 28 insertions(+), 25 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo debug_lpae_cp_reginfo[] = {
 int sve_exception_el(CPUARMState *env, int el)
 {
 #ifndef CONFIG_USER_ONLY
-    if (el <= 1) {
+    uint64_t hcr_el2 = arm_hcr_el2_eff(env);
+
+    if (el <= 1 && (hcr_el2 & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE)) {
         bool disabled = false;
 
         /* The CPACR.ZEN controls traps to EL1:
@@ -XXX,XX +XXX,XX @@ int sve_exception_el(CPUARMState *env, int el)
         }
         if (disabled) {
             /* route_to_el2 */
-            return (arm_feature(env, ARM_FEATURE_EL2)
-                    && (arm_hcr_el2_eff(env) & HCR_TGE) ? 2 : 1);
+            return hcr_el2 & HCR_TGE ? 2 : 1;
         }
 
         /* Check CPACR.FPEN.  */
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(crc32c)(uint32_t acc, uint32_t val, uint32_t bytes)
 int fp_exception_el(CPUARMState *env, int cur_el)
 {
 #ifndef CONFIG_USER_ONLY
-    int fpen;
-
     /* CPACR and the CPTR registers don't exist before v6, so FP is
      * always accessible
      */
@@ -XXX,XX +XXX,XX @@ int fp_exception_el(CPUARMState *env, int cur_el)
      * 0, 2 : trap EL0 and EL1/PL1 accesses
      * 1    : trap only EL0 accesses
      * 3    : trap no accesses
+     * This register is ignored if E2H+TGE are both set.
      */
-    fpen = extract32(env->cp15.cpacr_el1, 20, 2);
-    switch (fpen) {
-    case 0:
-    case 2:
-        if (cur_el == 0 || cur_el == 1) {
-            /* Trap to PL1, which might be EL1 or EL3 */
-            if (arm_is_secure(env) && !arm_el_is_aa64(env, 3)) {
+    if ((arm_hcr_el2_eff(env) & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE)) {
+        int fpen = extract32(env->cp15.cpacr_el1, 20, 2);
+
+        switch (fpen) {
+        case 0:
+        case 2:
+            if (cur_el == 0 || cur_el == 1) {
+                /* Trap to PL1, which might be EL1 or EL3 */
+                if (arm_is_secure(env) && !arm_el_is_aa64(env, 3)) {
+                    return 3;
+                }
+                return 1;
+            }
+            if (cur_el == 3 && !is_a64(env)) {
+                /* Secure PL1 running at EL3 */
                 return 3;
             }
-            return 1;
+            break;
+        case 1:
+            if (cur_el == 0) {
+                return 1;
+            }
+            break;
+        case 3:
+            break;
         }
-        if (cur_el == 3 && !is_a64(env)) {
-            /* Secure PL1 running at EL3 */
-            return 3;
-        }
-        break;
-    case 1:
-        if (cur_el == 0) {
-            return 1;
-        }
-        break;
-    case 3:
-        break;
     }
 
     /*
-- 
2.20.1

From: Alex Bennée <alex.bennee@linaro.org>

According to ARM ARM we should only trap from the EL1&0 regime.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-35-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/pauth_helper.c | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/target/arm/pauth_helper.c b/target/arm/pauth_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/pauth_helper.c
+++ b/target/arm/pauth_helper.c
@@ -XXX,XX +XXX,XX @@ static void pauth_check_trap(CPUARMState *env, int el, uintptr_t ra)
     if (el < 2 && arm_feature(env, ARM_FEATURE_EL2)) {
         uint64_t hcr = arm_hcr_el2_eff(env);
         bool trap = !(hcr & HCR_API);
-        /* FIXME: ARMv8.1-VHE: trap only applies to EL1&0 regime.  */
+        if (el == 0) {
+            /* Trap only applies to EL1&0 regime.  */
+            trap &= (hcr & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE);
+        }
         /* FIXME: ARMv8.3-NV: HCR_NV trap takes precedence for ERETA[AB].  */
         if (trap) {
             pauth_trap(env, 2, ra);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The EL2&0 translation regime is affected by Load Register (unpriv).

The code structure used here will facilitate later changes in this
area for implementing UAO and NV.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-36-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h           |  9 ++++----
 target/arm/translate.h     |  2 ++
 target/arm/helper.c        | 22 +++++++++++++++++++
 target/arm/translate-a64.c | 44 ++++++++++++++++++++++++--------------
 4 files changed, 57 insertions(+), 20 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef ARMCPU ArchCPU;
  * |              |     |   TBFLAG_A32   |              |
  * |              |     +-----+----------+  TBFLAG_AM32 |
  * |  TBFLAG_ANY  |           |TBFLAG_M32|              |
- * |              |           +-------------------------|
- * |              |           |       TBFLAG_A64        |
- * +--------------+-----------+-------------------------+
- *  31          20          14                         0
+ * |              |         +-+----------+--------------|
+ * |              |         |         TBFLAG_A64        |
+ * +--------------+---------+---------------------------+
+ *  31          20        15                           0
  *
  * Unless otherwise noted, these bits are cached in env->hflags.
  */
@@ -XXX,XX +XXX,XX @@ FIELD(TBFLAG_A64, PAUTH_ACTIVE, 8, 1)
 FIELD(TBFLAG_A64, BT, 9, 1)
 FIELD(TBFLAG_A64, BTYPE, 10, 2)         /* Not cached. */
 FIELD(TBFLAG_A64, TBID, 12, 2)
+FIELD(TBFLAG_A64, UNPRIV, 14, 1)
 
 static inline bool bswap_code(bool sctlr_b)
 {
diff --git a/target/arm/translate.h b/target/arm/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.h
+++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
      * ie A64 LDX*, LDAX*, A32/T32 LDREX*, LDAEX*.
      */
     bool is_ldex;
+    /* True if AccType_UNPRIV should be used for LDTR et al */
+    bool unpriv;
     /* True if v8.3-PAuth is active.  */
     bool pauth_active;
     /* True with v8.5-BTI and SCTLR_ELx.BT* set.  */
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
         }
     }
 
+    /* Compute the condition for using AccType_UNPRIV for LDTR et al. */
+    /* TODO: ARMv8.2-UAO */
+    switch (mmu_idx) {
+    case ARMMMUIdx_E10_1:
+    case ARMMMUIdx_SE10_1:
+        /* TODO: ARMv8.3-NV */
+        flags = FIELD_DP32(flags, TBFLAG_A64, UNPRIV, 1);
+        break;
+    case ARMMMUIdx_E20_2:
+        /* TODO: ARMv8.4-SecEL2 */
+        /*
+         * Note that E20_2 is gated by HCR_EL2.E2H == 1, but E20_0 is
+         * gated by HCR_EL2.<E2H,TGE> == '11', and so is LDTR.
+         */
+        if (env->cp15.hcr_el2 & HCR_TGE) {
+            flags = FIELD_DP32(flags, TBFLAG_A64, UNPRIV, 1);
+        }
+        break;
+    default:
+        break;
+    }
+
     return rebuild_hflags_common(env, fp_el, mmu_idx, flags);
 }
 
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ void a64_translate_init(void)
         offsetof(CPUARMState, exclusive_high), "exclusive_high");
 }
 
-static inline int get_a64_user_mem_index(DisasContext *s)
+/*
+ * Return the core mmu_idx to use for A64 "unprivileged load/store" insns
+ */
+static int get_a64_user_mem_index(DisasContext *s)
 {
-    /* Return the core mmu_idx to use for A64 "unprivileged load/store" insns:
-     *  if EL1, access as if EL0; otherwise access at current EL
+    /*
+     * If AccType_UNPRIV is not used, the insn uses AccType_NORMAL,
+     * which is the usual mmu_idx for this cpu state.
      */
-    ARMMMUIdx useridx;
+    ARMMMUIdx useridx = s->mmu_idx;
 
-    switch (s->mmu_idx) {
-    case ARMMMUIdx_E10_1:
-        useridx = ARMMMUIdx_E10_0;
-        break;
-    case ARMMMUIdx_SE10_1:
-        useridx = ARMMMUIdx_SE10_0;
-        break;
-    case ARMMMUIdx_Stage2:
-        g_assert_not_reached();
-    default:
-        useridx = s->mmu_idx;
-        break;
+    if (s->unpriv) {
+        /*
+         * We have pre-computed the condition for AccType_UNPRIV.
+         * Therefore we should never get here with a mmu_idx for
+         * which we do not know the corresponding user mmu_idx.
+         */
+        switch (useridx) {
+        case ARMMMUIdx_E10_1:
+            useridx = ARMMMUIdx_E10_0;
+            break;
+        case ARMMMUIdx_E20_2:
+            useridx = ARMMMUIdx_E20_0;
+            break;
+        case ARMMMUIdx_SE10_1:
+            useridx = ARMMMUIdx_SE10_0;
+            break;
+        default:
+            g_assert_not_reached();
+        }
     }
     return arm_to_core_mmu_idx(useridx);
 }
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_init_disas_context(DisasContextBase *dcbase,
     dc->pauth_active = FIELD_EX32(tb_flags, TBFLAG_A64, PAUTH_ACTIVE);
     dc->bt = FIELD_EX32(tb_flags, TBFLAG_A64, BT);
     dc->btype = FIELD_EX32(tb_flags, TBFLAG_A64, BTYPE);
+    dc->unpriv = FIELD_EX32(tb_flags, TBFLAG_A64, UNPRIV);
     dc->vec_len = 0;
     dc->vec_stride = 0;
     dc->cp_regs = arm_cpu->cp_regs;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

When VHE is enabled, the exception level below EL2 is not EL1,
but EL0, and so to identify the entry vector offset for exceptions
targeting EL2 we need to look at the width of EL0, not of EL1.

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_do_interrupt_aarch64(CPUState *cs)
          * immediately lower than the target level is using AArch32 or AArch64
          */
         bool is_aa64;
+        uint64_t hcr;
 
         switch (new_el) {
         case 3:
             is_aa64 = (env->cp15.scr_el3 & SCR_RW) != 0;
             break;
         case 2:
-            is_aa64 = (env->cp15.hcr_el2 & HCR_RW) != 0;
-            break;
+            hcr = arm_hcr_el2_eff(env);
+            if ((hcr & (HCR_E2H | HCR_TGE)) != (HCR_E2H | HCR_TGE)) {
+                is_aa64 = (hcr & HCR_RW) != 0;
+                break;
+            }
+            /* fall through */
         case 1:
             is_aa64 = is_a64(env);
             break;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This inline function has one user in cpu.c, and need not be exposed
otherwise.  Code movement only, with fixups for checkpatch.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-39-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h | 111 -------------------------------------------
 target/arm/cpu.c | 119 +++++++++++++++++++++++++++++++++++++++++++++++
 2 files changed, 119 insertions(+), 111 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ bool write_cpustate_to_list(ARMCPU *cpu, bool kvm_sync);
 #define ARM_CPUID_TI915T      0x54029152
 #define ARM_CPUID_TI925T      0x54029252
 
-static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
-                                     unsigned int target_el)
-{
-    CPUARMState *env = cs->env_ptr;
-    unsigned int cur_el = arm_current_el(env);
-    bool secure = arm_is_secure(env);
-    bool pstate_unmasked;
-    int8_t unmasked = 0;
-    uint64_t hcr_el2;
-
-    /* Don't take exceptions if they target a lower EL.
-     * This check should catch any exceptions that would not be taken but left
-     * pending.
-     */
-    if (cur_el > target_el) {
-        return false;
-    }
-
-    hcr_el2 = arm_hcr_el2_eff(env);
-
-    switch (excp_idx) {
-    case EXCP_FIQ:
-        pstate_unmasked = !(env->daif & PSTATE_F);
-        break;
-
-    case EXCP_IRQ:
-        pstate_unmasked = !(env->daif & PSTATE_I);
-        break;
-
-    case EXCP_VFIQ:
-        if (secure || !(hcr_el2 & HCR_FMO) || (hcr_el2 & HCR_TGE)) {
-            /* VFIQs are only taken when hypervized and non-secure.  */
-            return false;
-        }
-        return !(env->daif & PSTATE_F);
-    case EXCP_VIRQ:
-        if (secure || !(hcr_el2 & HCR_IMO) || (hcr_el2 & HCR_TGE)) {
-            /* VIRQs are only taken when hypervized and non-secure.  */
-            return false;
-        }
-        return !(env->daif & PSTATE_I);
-    default:
-        g_assert_not_reached();
-    }
-
-    /* Use the target EL, current execution state and SCR/HCR settings to
-     * determine whether the corresponding CPSR bit is used to mask the
-     * interrupt.
-     */
-    if ((target_el > cur_el) && (target_el != 1)) {
-        /* Exceptions targeting a higher EL may not be maskable */
-        if (arm_feature(env, ARM_FEATURE_AARCH64)) {
-            /* 64-bit masking rules are simple: exceptions to EL3
-             * can't be masked, and exceptions to EL2 can only be
-             * masked from Secure state. The HCR and SCR settings
-             * don't affect the masking logic, only the interrupt routing.
-             */
-            if (target_el == 3 || !secure) {
-                unmasked = 1;
-            }
-        } else {
-            /* The old 32-bit-only environment has a more complicated
-             * masking setup. HCR and SCR bits not only affect interrupt
-             * routing but also change the behaviour of masking.
-             */
-            bool hcr, scr;
-
-            switch (excp_idx) {
-            case EXCP_FIQ:
-                /* If FIQs are routed to EL3 or EL2 then there are cases where
-                 * we override the CPSR.F in determining if the exception is
-                 * masked or not. If neither of these are set then we fall back
-                 * to the CPSR.F setting otherwise we further assess the state
-                 * below.
-                 */
-                hcr = hcr_el2 & HCR_FMO;
-                scr = (env->cp15.scr_el3 & SCR_FIQ);
-
-                /* When EL3 is 32-bit, the SCR.FW bit controls whether the
-                 * CPSR.F bit masks FIQ interrupts when taken in non-secure
-                 * state. If SCR.FW is set then FIQs can be masked by CPSR.F
-                 * when non-secure but only when FIQs are only routed to EL3.
-                 */
-                scr = scr && !((env->cp15.scr_el3 & SCR_FW) && !hcr);
-                break;
-            case EXCP_IRQ:
-                /* When EL3 execution state is 32-bit, if HCR.IMO is set then
-                 * we may override the CPSR.I masking when in non-secure state.
-                 * The SCR.IRQ setting has already been taken into consideration
-                 * when setting the target EL, so it does not have a further
-                 * affect here.
-                 */
-                hcr = hcr_el2 & HCR_IMO;
-                scr = false;
-                break;
-            default:
-                g_assert_not_reached();
-            }
-
-            if ((scr || hcr) && !secure) {
-                unmasked = 1;
-            }
-        }
-    }
-
-    /* The PSTATE bits only mask the interrupt if we have not overriden the
-     * ability above.
-     */
-    return unmasked || pstate_unmasked;
-}
-
 #define ARM_CPU_TYPE_SUFFIX "-" TYPE_ARM_CPU
 #define ARM_CPU_TYPE_NAME(name) (name ARM_CPU_TYPE_SUFFIX)
 #define CPU_RESOLVING_TYPE TYPE_ARM_CPU
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
     arm_rebuild_hflags(env);
 }
 
+static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
+                                     unsigned int target_el)
+{
+    CPUARMState *env = cs->env_ptr;
+    unsigned int cur_el = arm_current_el(env);
+    bool secure = arm_is_secure(env);
+    bool pstate_unmasked;
+    int8_t unmasked = 0;
+    uint64_t hcr_el2;
+
+    /*
+     * Don't take exceptions if they target a lower EL.
+     * This check should catch any exceptions that would not be taken
+     * but left pending.
+     */
+    if (cur_el > target_el) {
+        return false;
+    }
+
+    hcr_el2 = arm_hcr_el2_eff(env);
+
+    switch (excp_idx) {
+    case EXCP_FIQ:
+        pstate_unmasked = !(env->daif & PSTATE_F);
+        break;
+
+    case EXCP_IRQ:
+        pstate_unmasked = !(env->daif & PSTATE_I);
+        break;
+
+    case EXCP_VFIQ:
+        if (secure || !(hcr_el2 & HCR_FMO) || (hcr_el2 & HCR_TGE)) {
+            /* VFIQs are only taken when hypervized and non-secure.  */
+            return false;
+        }
+        return !(env->daif & PSTATE_F);
+    case EXCP_VIRQ:
+        if (secure || !(hcr_el2 & HCR_IMO) || (hcr_el2 & HCR_TGE)) {
+            /* VIRQs are only taken when hypervized and non-secure.  */
+            return false;
+        }
+        return !(env->daif & PSTATE_I);
+    default:
+        g_assert_not_reached();
+    }
+
+    /*
+     * Use the target EL, current execution state and SCR/HCR settings to
+     * determine whether the corresponding CPSR bit is used to mask the
+     * interrupt.
+     */
+    if ((target_el > cur_el) && (target_el != 1)) {
+        /* Exceptions targeting a higher EL may not be maskable */
+        if (arm_feature(env, ARM_FEATURE_AARCH64)) {
+            /*
+             * 64-bit masking rules are simple: exceptions to EL3
+             * can't be masked, and exceptions to EL2 can only be
+             * masked from Secure state. The HCR and SCR settings
+             * don't affect the masking logic, only the interrupt routing.
+             */
+            if (target_el == 3 || !secure) {
+                unmasked = 1;
+            }
+        } else {
+            /*
+             * The old 32-bit-only environment has a more complicated
+             * masking setup. HCR and SCR bits not only affect interrupt
+             * routing but also change the behaviour of masking.
+             */
+            bool hcr, scr;
+
+            switch (excp_idx) {
+            case EXCP_FIQ:
+                /*
+                 * If FIQs are routed to EL3 or EL2 then there are cases where
+                 * we override the CPSR.F in determining if the exception is
+                 * masked or not. If neither of these are set then we fall back
+                 * to the CPSR.F setting otherwise we further assess the state
+                 * below.
+                 */
+                hcr = hcr_el2 & HCR_FMO;
+                scr = (env->cp15.scr_el3 & SCR_FIQ);
+
+                /*
+                 * When EL3 is 32-bit, the SCR.FW bit controls whether the
+                 * CPSR.F bit masks FIQ interrupts when taken in non-secure
+                 * state. If SCR.FW is set then FIQs can be masked by CPSR.F
+                 * when non-secure but only when FIQs are only routed to EL3.
+                 */
+                scr = scr && !((env->cp15.scr_el3 & SCR_FW) && !hcr);
+                break;
+            case EXCP_IRQ:
+                /*
+                 * When EL3 execution state is 32-bit, if HCR.IMO is set then
+                 * we may override the CPSR.I masking when in non-secure state.
+                 * The SCR.IRQ setting has already been taken into consideration
+                 * when setting the target EL, so it does not have a further
+                 * affect here.
+                 */
+                hcr = hcr_el2 & HCR_IMO;
+                scr = false;
+                break;
+            default:
+                g_assert_not_reached();
+            }
+
+            if ((scr || hcr) && !secure) {
+                unmasked = 1;
+            }
+        }
+    }
+
+    /*
+     * The PSTATE bits only mask the interrupt if we have not overriden the
+     * ability above.
+     */
+    return unmasked || pstate_unmasked;
+}
+
 bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
 {
     CPUClass *cc = CPU_GET_CLASS(cs);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Avoid redundant computation of cpu state by passing it in
from the caller, which has already computed it for itself.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-40-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.c | 22 ++++++++++++----------
 1 file changed, 12 insertions(+), 10 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
 }
 
 static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
-                                     unsigned int target_el)
+                                     unsigned int target_el,
+                                     unsigned int cur_el, bool secure,
+                                     uint64_t hcr_el2)
 {
     CPUARMState *env = cs->env_ptr;
-    unsigned int cur_el = arm_current_el(env);
-    bool secure = arm_is_secure(env);
     bool pstate_unmasked;
     int8_t unmasked = 0;
-    uint64_t hcr_el2;
 
     /*
      * Don't take exceptions if they target a lower EL.
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
         return false;
     }
 
-    hcr_el2 = arm_hcr_el2_eff(env);
-
     switch (excp_idx) {
     case EXCP_FIQ:
         pstate_unmasked = !(env->daif & PSTATE_F);
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
     CPUARMState *env = cs->env_ptr;
     uint32_t cur_el = arm_current_el(env);
     bool secure = arm_is_secure(env);
+    uint64_t hcr_el2 = arm_hcr_el2_eff(env);
     uint32_t target_el;
     uint32_t excp_idx;
     bool ret = false;
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
     if (interrupt_request & CPU_INTERRUPT_FIQ) {
         excp_idx = EXCP_FIQ;
         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
-        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+                              cur_el, secure, hcr_el2)) {
             cs->exception_index = excp_idx;
             env->exception.target_el = target_el;
             cc->do_interrupt(cs);
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
     if (interrupt_request & CPU_INTERRUPT_HARD) {
         excp_idx = EXCP_IRQ;
         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
-        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+                              cur_el, secure, hcr_el2)) {
             cs->exception_index = excp_idx;
             env->exception.target_el = target_el;
             cc->do_interrupt(cs);
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
     if (interrupt_request & CPU_INTERRUPT_VIRQ) {
         excp_idx = EXCP_VIRQ;
         target_el = 1;
-        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+                              cur_el, secure, hcr_el2)) {
             cs->exception_index = excp_idx;
             env->exception.target_el = target_el;
             cc->do_interrupt(cs);
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
     if (interrupt_request & CPU_INTERRUPT_VFIQ) {
         excp_idx = EXCP_VFIQ;
         target_el = 1;
-        if (arm_excp_unmasked(cs, excp_idx, target_el)) {
+        if (arm_excp_unmasked(cs, excp_idx, target_el,
+                              cur_el, secure, hcr_el2)) {
             cs->exception_index = excp_idx;
             env->exception.target_el = target_el;
             cc->do_interrupt(cs);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The value computed is fully boolean; using int8_t is odd.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-41-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.c | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
 {
     CPUARMState *env = cs->env_ptr;
     bool pstate_unmasked;
-    int8_t unmasked = 0;
+    bool unmasked = false;
 
     /*
      * Don't take exceptions if they target a lower EL.
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
              * don't affect the masking logic, only the interrupt routing.
              */
             if (target_el == 3 || !secure) {
-                unmasked = 1;
+                unmasked = true;
             }
         } else {
             /*
@@ -XXX,XX +XXX,XX @@ static inline bool arm_excp_unmasked(CPUState *cs, unsigned int excp_idx,
             }
 
             if ((scr || hcr) && !secure) {
-                unmasked = 1;
+                unmasked = true;
             }
         }
     }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The fall through organization of this function meant that we
would raise an interrupt, then might overwrite that with another.
Since interrupt prioritization is IMPLEMENTATION DEFINED, we
can recognize these in any order we choose.

Unify the code to raise the interrupt in a block at the end.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200206105448.4726-42-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.c | 30 ++++++++++++------------------
 1 file changed, 12 insertions(+), 18 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
     uint64_t hcr_el2 = arm_hcr_el2_eff(env);
     uint32_t target_el;
     uint32_t excp_idx;
-    bool ret = false;
+
+    /* The prioritization of interrupts is IMPLEMENTATION DEFINED. */
 
     if (interrupt_request & CPU_INTERRUPT_FIQ) {
         excp_idx = EXCP_FIQ;
         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
         if (arm_excp_unmasked(cs, excp_idx, target_el,
                               cur_el, secure, hcr_el2)) {
-            cs->exception_index = excp_idx;
-            env->exception.target_el = target_el;
-            cc->do_interrupt(cs);
-            ret = true;
+            goto found;
         }
     }
     if (interrupt_request & CPU_INTERRUPT_HARD) {
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
         target_el = arm_phys_excp_target_el(cs, excp_idx, cur_el, secure);
         if (arm_excp_unmasked(cs, excp_idx, target_el,
                               cur_el, secure, hcr_el2)) {
-            cs->exception_index = excp_idx;
-            env->exception.target_el = target_el;
-            cc->do_interrupt(cs);
-            ret = true;
+            goto found;
         }
     }
     if (interrupt_request & CPU_INTERRUPT_VIRQ) {
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
         target_el = 1;
         if (arm_excp_unmasked(cs, excp_idx, target_el,
                               cur_el, secure, hcr_el2)) {
-            cs->exception_index = excp_idx;
-            env->exception.target_el = target_el;
-            cc->do_interrupt(cs);
-            ret = true;
+            goto found;
         }
     }
     if (interrupt_request & CPU_INTERRUPT_VFIQ) {
@@ -XXX,XX +XXX,XX @@ bool arm_cpu_exec_interrupt(CPUState *cs, int interrupt_request)
         target_el = 1;
         if (arm_excp_unmasked(cs, excp_idx, target_el,
                               cur_el, secure, hcr_el2)) {
-            cs->exception_index = excp_idx;
-            env->exception.target_el = target_el;
-            cc->do_interrupt(cs);
-            ret = true;
+            goto found;
         }
     }
+    return false;
 
-    return ret;
+ found:
+    cs->exception_index = excp_idx;
+    env->exception.target_el = target_el;
+    cc->do_interrupt(cs);
+    return true;
 }
 
 #if !defined(CONFIG_USER_ONLY) || !defined(TARGET_AARCH64)
-- 
2.20.1

From: Rene Stange <rsta2@o2online.de>

In TD (two dimensions) DMA mode ylen has to be increased by one after
reading it from the TXFR_LEN register, because a value of zero has to
result in one run through of the ylen loop. This has been tested on a
real Raspberry Pi 3 Model B+. In the previous implementation the ylen
loop was not passed at all for a value of zero.

Signed-off-by: Rene Stange <rsta2@o2online.de>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/dma/bcm2835_dma.c | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/hw/dma/bcm2835_dma.c b/hw/dma/bcm2835_dma.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/bcm2835_dma.c
+++ b/hw/dma/bcm2835_dma.c
@@ -XXX,XX +XXX,XX @@ static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
         ch->stride = ldl_le_phys(&s->dma_as, ch->conblk_ad + 16);
         ch->nextconbk = ldl_le_phys(&s->dma_as, ch->conblk_ad + 20);
 
+        ylen = 1;
         if (ch->ti & BCM2708_DMA_TDMODE) {
             /* 2D transfer mode */
-            ylen = (ch->txfr_len >> 16) & 0x3fff;
+            ylen += (ch->txfr_len >> 16) & 0x3fff;
             xlen = ch->txfr_len & 0xffff;
             dst_stride = ch->stride >> 16;
             src_stride = ch->stride & 0xffff;
         } else {
-            ylen = 1;
             xlen = ch->txfr_len;
             dst_stride = 0;
             src_stride = 0;
-- 
2.20.1

From: Rene Stange <rsta2@o2online.de>

TD (two dimensions) DMA mode did not work, because the xlen variable
has not been re-initialized before each additional ylen run through
in bcm2835_dma_update(). Fix it.

diff --git a/hw/dma/bcm2835_dma.c b/hw/dma/bcm2835_dma.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/bcm2835_dma.c
+++ b/hw/dma/bcm2835_dma.c
@@ -XXX,XX +XXX,XX @@
 static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
 {
     BCM2835DMAChan *ch = &s->chan[c];
-    uint32_t data, xlen, ylen;
+    uint32_t data, xlen, xlen_td, ylen;
     int16_t dst_stride, src_stride;
 
     if (!(s->enable & (1 << c))) {
@@ -XXX,XX +XXX,XX @@ static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
             dst_stride = 0;
             src_stride = 0;
         }
+        xlen_td = xlen;
 
         while (ylen != 0) {
             /* Normal transfer mode */
@@ -XXX,XX +XXX,XX @@ static void bcm2835_dma_update(BCM2835DMAState *s, unsigned c)
             if (--ylen != 0) {
                 ch->source_ad += src_stride;
                 ch->dest_ad += dst_stride;
+                xlen = xlen_td;
             }
         }
         ch->cs |= BCM2708_DMA_END;
-- 
2.20.1

From: Philippe Mathieu-Daudé <philmd@redhat.com>

The bold text sounds like 'knock knock'. Only bolding the
second 'not' makes it easier to read.

Fixes: dea101a1ae
Signed-off-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Andrew Jones <drjones@redhat.com>
Message-id: 20200206225148.23923-1-philmd@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/arm-cpu-features.rst | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/arm-cpu-features.rst b/docs/arm-cpu-features.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/arm-cpu-features.rst
+++ b/docs/arm-cpu-features.rst
@@ -XXX,XX +XXX,XX @@ the list of KVM VCPU features and their descriptions.
 
   kvm-no-adjvtime          By default kvm-no-adjvtime is disabled.  This
                            means that by default the virtual time
-                           adjustment is enabled (vtime is *not not*
+                           adjustment is enabled (vtime is not *not*
                            adjusted).
 
                            When virtual time adjustment is enabled each
-- 
2.20.1

From: Pan Nengyuan <pannengyuan@huawei.com>

There is a memory leak when we call 'device_list_properties' with typename = armv7m_systick. It's easy to reproduce as follow:

virsh qemu-monitor-command vm1 --pretty '{"execute": "device-list-properties", "arguments": {"typename": "armv7m_systick"}}'

This patch delay timer_new to fix this memleaks.

Reported-by: Euler Robot <euler.robot@huawei.com>
Signed-off-by: Pan Nengyuan <pannengyuan@huawei.com>
Message-id: 20200205070659.22488-2-pannengyuan@huawei.com
Cc: qemu-arm@nongnu.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/timer/armv7m_systick.c | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/hw/timer/armv7m_systick.c b/hw/timer/armv7m_systick.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/timer/armv7m_systick.c
+++ b/hw/timer/armv7m_systick.c
@@ -XXX,XX +XXX,XX @@ static void systick_instance_init(Object *obj)
     memory_region_init_io(&s->iomem, obj, &systick_ops, s, "systick", 0xe0);
     sysbus_init_mmio(sbd, &s->iomem);
     sysbus_init_irq(sbd, &s->irq);
+}
+
+static void systick_realize(DeviceState *dev, Error **errp)
+{
+    SysTickState *s = SYSTICK(dev);
     s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, systick_timer_tick, s);
 }
 
@@ -XXX,XX +XXX,XX @@ static void systick_class_init(ObjectClass *klass, void *data)
 
     dc->vmsd = &vmstate_systick;
     dc->reset = systick_reset;
+    dc->realize = systick_realize;
 }
 
 static const TypeInfo armv7m_systick_info = {
-- 
2.20.1

From: Pan Nengyuan <pannengyuan@huawei.com>

There is a memory leak when we call 'device_list_properties' with typename = stm32f2xx_timer. It's easy to reproduce as follow:

virsh qemu-monitor-command vm1 --pretty '{"execute": "device-list-properties", "arguments": {"typename": "stm32f2xx_timer"}}'

This patch delay timer_new to fix this memleaks.

Reported-by: Euler Robot <euler.robot@huawei.com>
Signed-off-by: Pan Nengyuan <pannengyuan@huawei.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200205070659.22488-3-pannengyuan@huawei.com
Cc: Alistair Francis <alistair@alistair23.me>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/timer/stm32f2xx_timer.c | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/hw/timer/stm32f2xx_timer.c b/hw/timer/stm32f2xx_timer.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/timer/stm32f2xx_timer.c
+++ b/hw/timer/stm32f2xx_timer.c
@@ -XXX,XX +XXX,XX @@ static void stm32f2xx_timer_init(Object *obj)
     memory_region_init_io(&s->iomem, obj, &stm32f2xx_timer_ops, s,
                           "stm32f2xx_timer", 0x400);
     sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
+}
 
+static void stm32f2xx_timer_realize(DeviceState *dev, Error **errp)
+{
+    STM32F2XXTimerState *s = STM32F2XXTIMER(dev);
     s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, stm32f2xx_timer_interrupt, s);
 }
 
@@ -XXX,XX +XXX,XX @@ static void stm32f2xx_timer_class_init(ObjectClass *klass, void *data)
     dc->reset = stm32f2xx_timer_reset;
     device_class_set_props(dc, stm32f2xx_timer_properties);
     dc->vmsd = &vmstate_stm32f2xx_timer;
+    dc->realize = stm32f2xx_timer_realize;
 }
 
 static const TypeInfo stm32f2xx_timer_info = {
-- 
2.20.1

From: Pan Nengyuan <pannengyuan@huawei.com>

There is a memory leak when we call 'device_list_properties' with typename = stellaris-gptm. It's easy to reproduce as follow:

virsh qemu-monitor-command vm1 --pretty '{"execute": "device-list-properties", "arguments": {"typename": "stellaris-gptm"}}'

This patch delay timer_new in realize to fix it.

Reported-by: Euler Robot <euler.robot@huawei.com>
Signed-off-by: Pan Nengyuan <pannengyuan@huawei.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200205070659.22488-4-pannengyuan@huawei.com
Cc: qemu-arm@nongnu.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/stellaris.c | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/hw/arm/stellaris.c b/hw/arm/stellaris.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/stellaris.c
+++ b/hw/arm/stellaris.c
@@ -XXX,XX +XXX,XX @@ static void stellaris_gptm_init(Object *obj)
     sysbus_init_mmio(sbd, &s->iomem);
 
     s->opaque[0] = s->opaque[1] = s;
+}
+
+static void stellaris_gptm_realize(DeviceState *dev, Error **errp)
+{
+    gptm_state *s = STELLARIS_GPTM(dev);
     s->timer[0] = timer_new_ns(QEMU_CLOCK_VIRTUAL, gptm_tick, &s->opaque[0]);
     s->timer[1] = timer_new_ns(QEMU_CLOCK_VIRTUAL, gptm_tick, &s->opaque[1]);
 }
 
-
 /* System controller.  */
 
 typedef struct {
@@ -XXX,XX +XXX,XX @@ static void stellaris_gptm_class_init(ObjectClass *klass, void *data)
     DeviceClass *dc = DEVICE_CLASS(klass);
 
     dc->vmsd = &vmstate_stellaris_gptm;
+    dc->realize = stellaris_gptm_realize;
 }
 
 static const TypeInfo stellaris_gptm_info = {
-- 
2.20.1

Another very large pullreq (this one mostly because it has
RTH's decodetree conversion series in it), but this should be
the last of the really large things in my to-review queue...

thanks
-- PMM

The following changes since commit 83aaec1d5a49f158abaa31797a0f976b3c07e5ca:

Merge tag 'pull-tcg-20241212' of https://gitlab.com/rth7680/qemu into staging (2024-12-12 18:45:39 -0500)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20241213

for you to fetch changes up to 48e652c4bd9570f6f24def25355cb3009a7300f8:

target/arm: Simplify condition for tlbi_el2_cp_reginfo[] (2024-12-13 15:41:09 +0000)

----------------------------------------------------------------
target-arm queue:
 * Finish conversion of A64 decoder to decodetree
 * Use float_round_to_odd in helper_fcvtx_f64_to_f32
 * Move TLBI insn emulation code out to its own source file
 * docs/system/arm: fix broken links, document undocumented properties
 * MAINTAINERS: correct an email address

----------------------------------------------------------------
Brian Cain (1):
      MAINTAINERS: correct my email address

Peter Maydell (10):
      target/arm: Move some TLBI insns to their own source file
      target/arm: Move TLBI insns for AArch32 EL2 to tlbi_insn_helper.c
      target/arm: Move AArch64 TLBI insns from v8_cp_reginfo[]
      target/arm: Move the AArch64 EL2 TLBI insns
      target/arm: Move AArch64 EL3 TLBI insns
      target/arm: Move TLBI range insns
      target/arm: Move the TLBI OS insns to tlb-insns.c.
      target/arm: Move small helper functions to tlb-insns.c
      target/arm: Move RME TLB insns to tlb-insns.c
      target/arm: Simplify condition for tlbi_el2_cp_reginfo[]

Pierrick Bouvier (4):
      docs/system/arm/orangepi: update links
      docs/system/arm/fby35: document execute-in-place property
      docs/system/arm/xlnx-versal-virt: document ospi-flash property
      docs/system/arm/virt: document missing properties

Richard Henderson (70):
      target/arm: Add section labels for "Data Processing (register)"
      target/arm: Convert UDIV, SDIV to decodetree
      target/arm: Convert LSLV, LSRV, ASRV, RORV to decodetree
      target/arm: Convert CRC32, CRC32C to decodetree
      target/arm: Convert SUBP, IRG, GMI to decodetree
      target/arm: Convert PACGA to decodetree
      target/arm: Convert RBIT, REV16, REV32, REV64 to decodetree
      target/arm: Convert CLZ, CLS to decodetree
      target/arm: Convert PAC[ID]*, AUT[ID]* to decodetree
      target/arm: Convert XPAC[ID] to decodetree
      target/arm: Convert disas_logic_reg to decodetree
      target/arm: Convert disas_add_sub_ext_reg to decodetree
      target/arm: Convert disas_add_sub_reg to decodetree
      target/arm: Convert disas_data_proc_3src to decodetree
      target/arm: Convert disas_adc_sbc to decodetree
      target/arm: Convert RMIF to decodetree
      target/arm: Convert SETF8, SETF16 to decodetree
      target/arm: Convert CCMP, CCMN to decodetree
      target/arm: Convert disas_cond_select to decodetree
      target/arm: Introduce fp_access_check_scalar_hsd
      target/arm: Introduce fp_access_check_vector_hsd
      target/arm: Convert FCMP, FCMPE, FCCMP, FCCMPE to decodetree
      target/arm: Fix decode of fp16 vector fabs, fneg, fsqrt
      target/arm: Convert FMOV, FABS, FNEG (scalar) to decodetree
      target/arm: Pass fpstatus to vfp_sqrt*
      target/arm: Remove helper_sqrt_f16
      target/arm: Convert FSQRT (scalar) to decodetree
      target/arm: Convert FRINT[NPMSAXI] (scalar) to decodetree
      target/arm: Convert BFCVT to decodetree
      target/arm: Convert FRINT{32, 64}[ZX] (scalar) to decodetree
      target/arm: Convert FCVT (scalar) to decodetree
      target/arm: Convert handle_fpfpcvt to decodetree
      target/arm: Convert FJCVTZS to decodetree
      target/arm: Convert handle_fmov to decodetree
      target/arm: Convert SQABS, SQNEG to decodetree
      target/arm: Convert ABS, NEG to decodetree
      target/arm: Introduce gen_gvec_cls, gen_gvec_clz
      target/arm: Convert CLS, CLZ (vector) to decodetree
      target/arm: Introduce gen_gvec_cnt, gen_gvec_rbit
      target/arm: Convert CNT, NOT, RBIT (vector) to decodetree
      target/arm: Convert CMGT, CMGE, GMLT, GMLE, CMEQ (zero) to decodetree
      target/arm: Introduce gen_gvec_rev{16,32,64}
      target/arm: Convert handle_rev to decodetree
      target/arm: Move helper_neon_addlp_{s8, s16} to neon_helper.c
      target/arm: Introduce gen_gvec_{s,u}{add,ada}lp
      target/arm: Convert handle_2misc_pairwise to decodetree
      target/arm: Remove helper_neon_{add,sub}l_u{16,32}
      target/arm: Introduce clear_vec
      target/arm: Convert XTN, SQXTUN, SQXTN, UQXTN to decodetree
      target/arm: Convert FCVTN, BFCVTN to decodetree
      target/arm: Convert FCVTXN to decodetree
      target/arm: Convert SHLL to decodetree
      target/arm: Implement gen_gvec_fabs, gen_gvec_fneg
      target/arm: Convert FABS, FNEG (vector) to decodetree
      target/arm: Convert FSQRT (vector) to decodetree
      target/arm: Convert FRINT* (vector) to decodetree
      target/arm: Convert FCVT* (vector, integer) scalar to decodetree
      target/arm: Convert FCVT* (vector, fixed-point) scalar to decodetree
      target/arm: Convert [US]CVTF (vector, integer) scalar to decodetree
      target/arm: Convert [US]CVTF (vector, fixed-point) scalar to decodetree
      target/arm: Rename helper_gvec_vcvt_[hf][su] with _rz
      target/arm: Convert [US]CVTF (vector) to decodetree
      target/arm: Convert FCVTZ[SU] (vector, fixed-point) to decodetree
      target/arm: Convert FCVT* (vector, integer) to decodetree
      target/arm: Convert handle_2misc_fcmp_zero to decodetree
      target/arm: Convert FRECPE, FRECPX, FRSQRTE to decodetree
      target/arm: Introduce gen_gvec_urecpe, gen_gvec_ursqrte
      target/arm: Convert URECPE and URSQRTE to decodetree
      target/arm: Convert FCVTL to decodetree
      target/arm: Use float_round_to_odd in helper_fcvtx_f64_to_f32

From: Richard Henderson <richard.henderson@linaro.org>

At the same time, use ### to separate 3rd-level sections.
We already use ### for 4.1.92 Data Processing (immediate),
but not the two following two third-level sections:
4.1.93 Branches, and 4.1.94 Loads and stores.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode | 19 +++++++++++++++++--
 1 file changed, 17 insertions(+), 2 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ UBFM            . 10 100110 . ...... ...... ..... ..... @bitfield_32
 EXTR            1 00 100111 1 0 rm:5 imm:6 rn:5 rd:5     &extract sf=1
 EXTR            0 00 100111 0 0 rm:5 0 imm:5 rn:5 rd:5   &extract sf=0
 
-# Branches
+### Branches
 
 %imm26   0:s26 !function=times_4
 @branch         . ..... .......................... &i imm=%imm26
@@ -XXX,XX +XXX,XX @@ HLT             1101 0100 010 ................ 000 00 @i16
 # DCPS2         1101 0100 101 ................ 000 10 @i16
 # DCPS3         1101 0100 101 ................ 000 11 @i16
 
-# Loads and stores
+### Loads and stores
 
 &stxr           rn rt rt2 rs sz lasr
 &stlr           rn rt sz lasr
@@ -XXX,XX +XXX,XX @@ CPYP            00 011 1 01000 ..... .... 01 ..... ..... @cpy
 CPYM            00 011 1 01010 ..... .... 01 ..... ..... @cpy
 CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
 
+### Data Processing (register)
+
+# Data Processing (2-source)
+# Data Processing (1-source)
+# Logical (shifted reg)
+# Add/subtract (shifted reg)
+# Add/subtract (extended reg)
+# Add/subtract (carry)
+# Rotate right into flags
+# Evaluate into flags
+# Conditional compare (regster)
+# Conditional compare (immediate)
+# Conditional select
+# Data Processing (3-source)
+
 ### Cryptographic AES
 
 AESE            01001110 00 10100 00100 10 ..... .....  @r2r_q1e0
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  7 ++++
 target/arm/tcg/translate-a64.c | 64 +++++++++++++++++-----------------
 2 files changed, 39 insertions(+), 32 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 &r              rn
 &ri             rd imm
 &rri_sf         rd rn imm sf
+&rrr_sf         rd rn rm sf
 &i              imm
 &rr_e           rd rn esz
 &rri_e          rd rn imm esz
@@ -XXX,XX +XXX,XX @@ CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
 ### Data Processing (register)
 
 # Data Processing (2-source)
+
+@rrr_sf         sf:1 .......... rm:5 ...... rn:5 rd:5   &rrr_sf
+
+UDIV            . 00 11010110 ..... 00001 0 ..... ..... @rrr_sf
+SDIV            . 00 11010110 ..... 00001 1 ..... ..... @rrr_sf
+
 # Data Processing (1-source)
 # Logical (shifted reg)
 # Add/subtract (shifted reg)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(UQRSHRN_si, do_scalar_shift_imm_narrow, a, uqrshrn_fns, 0, false)
 TRANS(SQSHRUN_si, do_scalar_shift_imm_narrow, a, sqshrun_fns, MO_SIGN, false)
 TRANS(SQRSHRUN_si, do_scalar_shift_imm_narrow, a, sqrshrun_fns, MO_SIGN, false)
 
+static bool do_div(DisasContext *s, arg_rrr_sf *a, bool is_signed)
+{
+    TCGv_i64 tcg_n, tcg_m, tcg_rd;
+    tcg_rd = cpu_reg(s, a->rd);
+
+    if (!a->sf && is_signed) {
+        tcg_n = tcg_temp_new_i64();
+        tcg_m = tcg_temp_new_i64();
+        tcg_gen_ext32s_i64(tcg_n, cpu_reg(s, a->rn));
+        tcg_gen_ext32s_i64(tcg_m, cpu_reg(s, a->rm));
+    } else {
+        tcg_n = read_cpu_reg(s, a->rn, a->sf);
+        tcg_m = read_cpu_reg(s, a->rm, a->sf);
+    }
+
+    if (is_signed) {
+        gen_helper_sdiv64(tcg_rd, tcg_n, tcg_m);
+    } else {
+        gen_helper_udiv64(tcg_rd, tcg_n, tcg_m);
+    }
+
+    if (!a->sf) { /* zero extend final result */
+        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
+    }
+    return true;
+}
+
+TRANS(SDIV, do_div, a, true)
+TRANS(UDIV, do_div, a, false)
+
 /* Shift a TCGv src by TCGv shift_amount, put result in dst.
  * Note that it is the caller's responsibility to ensure that the
  * shift amount is in range (ie 0..31 or 0..63) and provide the ARM
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
 #undef MAP
 }
 
-static void handle_div(DisasContext *s, bool is_signed, unsigned int sf,
-                       unsigned int rm, unsigned int rn, unsigned int rd)
-{
-    TCGv_i64 tcg_n, tcg_m, tcg_rd;
-    tcg_rd = cpu_reg(s, rd);
-
-    if (!sf && is_signed) {
-        tcg_n = tcg_temp_new_i64();
-        tcg_m = tcg_temp_new_i64();
-        tcg_gen_ext32s_i64(tcg_n, cpu_reg(s, rn));
-        tcg_gen_ext32s_i64(tcg_m, cpu_reg(s, rm));
-    } else {
-        tcg_n = read_cpu_reg(s, rn, sf);
-        tcg_m = read_cpu_reg(s, rm, sf);
-    }
-
-    if (is_signed) {
-        gen_helper_sdiv64(tcg_rd, tcg_n, tcg_m);
-    } else {
-        gen_helper_udiv64(tcg_rd, tcg_n, tcg_m);
-    }
-
-    if (!sf) { /* zero extend final result */
-        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
-    }
-}
 
 /* LSLV, LSRV, ASRV, RORV */
 static void handle_shift_reg(DisasContext *s,
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
             }
         }
         break;
-    case 2: /* UDIV */
-        handle_div(s, false, sf, rm, rn, rd);
-        break;
-    case 3: /* SDIV */
-        handle_div(s, true, sf, rm, rn, rd);
-        break;
     case 4: /* IRG */
         if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
             goto do_unallocated;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
     }
     default:
     do_unallocated:
+    case 2: /* UDIV */
+    case 3: /* SDIV */
         unallocated_encoding(s);
         break;
     }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  4 +++
 target/arm/tcg/translate-a64.c | 46 ++++++++++++++++------------------
 2 files changed, 25 insertions(+), 25 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  12 ++++
 target/arm/tcg/translate-a64.c | 101 +++++++++++++--------------------
 2 files changed, 53 insertions(+), 60 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
 @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
 
+@rrr_b          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=0
 @rrr_h          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=1
+@rrr_s          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=2
 @rrr_d          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=3
 @rrr_sd         ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=%esz_sd
 @rrr_hsd        ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=%esz_hsd
@@ -XXX,XX +XXX,XX @@ LSRV            . 00 11010110 ..... 00100 1 ..... ..... @rrr_sf
 ASRV            . 00 11010110 ..... 00101 0 ..... ..... @rrr_sf
 RORV            . 00 11010110 ..... 00101 1 ..... ..... @rrr_sf
 
+CRC32           0 00 11010110 ..... 0100 00 ..... ..... @rrr_b
+CRC32           0 00 11010110 ..... 0100 01 ..... ..... @rrr_h
+CRC32           0 00 11010110 ..... 0100 10 ..... ..... @rrr_s
+CRC32           1 00 11010110 ..... 0100 11 ..... ..... @rrr_d
+
+CRC32C          0 00 11010110 ..... 0101 00 ..... ..... @rrr_b
+CRC32C          0 00 11010110 ..... 0101 01 ..... ..... @rrr_h
+CRC32C          0 00 11010110 ..... 0101 10 ..... ..... @rrr_s
+CRC32C          1 00 11010110 ..... 0101 11 ..... ..... @rrr_d
+
 # Data Processing (1-source)
 # Logical (shifted reg)
 # Add/subtract (shifted reg)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(LSRV, do_shift_reg, a, A64_SHIFT_TYPE_LSR)
 TRANS(ASRV, do_shift_reg, a, A64_SHIFT_TYPE_ASR)
 TRANS(RORV, do_shift_reg, a, A64_SHIFT_TYPE_ROR)
 
+static bool do_crc32(DisasContext *s, arg_rrr_e *a, bool crc32c)
+{
+    TCGv_i64 tcg_acc, tcg_val, tcg_rd;
+    TCGv_i32 tcg_bytes;
+
+    switch (a->esz) {
+    case MO_8:
+    case MO_16:
+    case MO_32:
+        tcg_val = tcg_temp_new_i64();
+        tcg_gen_extract_i64(tcg_val, cpu_reg(s, a->rm), 0, 8 << a->esz);
+        break;
+    case MO_64:
+        tcg_val = cpu_reg(s, a->rm);
+        break;
+    default:
+        g_assert_not_reached();
+    }
+    tcg_acc = cpu_reg(s, a->rn);
+    tcg_bytes = tcg_constant_i32(1 << a->esz);
+    tcg_rd = cpu_reg(s, a->rd);
+
+    if (crc32c) {
+        gen_helper_crc32c_64(tcg_rd, tcg_acc, tcg_val, tcg_bytes);
+    } else {
+        gen_helper_crc32_64(tcg_rd, tcg_acc, tcg_val, tcg_bytes);
+    }
+    return true;
+}
+
+TRANS_FEAT(CRC32, aa64_crc32, do_crc32, a, false)
+TRANS_FEAT(CRC32C, aa64_crc32, do_crc32, a, true)
+
 /* Logical (shifted register)
  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
  * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
 }
 
 
-/* CRC32[BHWX], CRC32C[BHWX] */
-static void handle_crc32(DisasContext *s,
-                         unsigned int sf, unsigned int sz, bool crc32c,
-                         unsigned int rm, unsigned int rn, unsigned int rd)
-{
-    TCGv_i64 tcg_acc, tcg_val;
-    TCGv_i32 tcg_bytes;
-
-    if (!dc_isar_feature(aa64_crc32, s)
-        || (sf == 1 && sz != 3)
-        || (sf == 0 && sz == 3)) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    if (sz == 3) {
-        tcg_val = cpu_reg(s, rm);
-    } else {
-        uint64_t mask;
-        switch (sz) {
-        case 0:
-            mask = 0xFF;
-            break;
-        case 1:
-            mask = 0xFFFF;
-            break;
-        case 2:
-            mask = 0xFFFFFFFF;
-            break;
-        default:
-            g_assert_not_reached();
-        }
-        tcg_val = tcg_temp_new_i64();
-        tcg_gen_andi_i64(tcg_val, cpu_reg(s, rm), mask);
-    }
-
-    tcg_acc = cpu_reg(s, rn);
-    tcg_bytes = tcg_constant_i32(1 << sz);
-
-    if (crc32c) {
-        gen_helper_crc32c_64(cpu_reg(s, rd), tcg_acc, tcg_val, tcg_bytes);
-    } else {
-        gen_helper_crc32_64(cpu_reg(s, rd), tcg_acc, tcg_val, tcg_bytes);
-    }
-}
-
 /* Data-processing (2 source)
  *   31   30  29 28             21 20  16 15    10 9    5 4    0
  * +----+---+---+-----------------+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
         gen_helper_pacga(cpu_reg(s, rd), tcg_env,
                          cpu_reg(s, rn), cpu_reg_sp(s, rm));
         break;
-    case 16:
-    case 17:
-    case 18:
-    case 19:
-    case 20:
-    case 21:
-    case 22:
-    case 23: /* CRC32 */
-    {
-        int sz = extract32(opcode, 0, 2);
-        bool crc32c = extract32(opcode, 2, 1);
-        handle_crc32(s, sf, sz, crc32c, rm, rn, rd);
-        break;
-    }
     default:
     do_unallocated:
     case 2: /* UDIV */
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
     case 9: /* LSRV */
     case 10: /* ASRV */
     case 11: /* RORV */
+    case 16:
+    case 17:
+    case 18:
+    case 19:
+    case 20:
+    case 21:
+    case 22:
+    case 23: /* CRC32 */
         unallocated_encoding(s);
         break;
     }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-6-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  7 +++
 target/arm/tcg/translate-a64.c | 94 +++++++++++++++++++---------------
 2 files changed, 59 insertions(+), 42 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 %hlm            11:1 20:2
 
 &r              rn
+&rrr            rd rn rm
 &ri             rd imm
 &rri_sf         rd rn imm sf
 &rrr_sf         rd rn rm sf
@@ -XXX,XX +XXX,XX @@ CPYE            00 011 1 01100 ..... .... 01 ..... ..... @cpy
 
 # Data Processing (2-source)
 
+@rrr            . .......... rm:5 ...... rn:5 rd:5      &rrr
 @rrr_sf         sf:1 .......... rm:5 ...... rn:5 rd:5   &rrr_sf
 
 UDIV            . 00 11010110 ..... 00001 0 ..... ..... @rrr_sf
@@ -XXX,XX +XXX,XX @@ CRC32C          0 00 11010110 ..... 0101 01 ..... ..... @rrr_h
 CRC32C          0 00 11010110 ..... 0101 10 ..... ..... @rrr_s
 CRC32C          1 00 11010110 ..... 0101 11 ..... ..... @rrr_d
 
+SUBP            1 00 11010110 ..... 000000 ..... .....  @rrr
+SUBPS           1 01 11010110 ..... 000000 ..... .....  @rrr
+IRG             1 00 11010110 ..... 000100 ..... .....  @rrr
+GMI             1 00 11010110 ..... 000101 ..... .....  @rrr
+
 # Data Processing (1-source)
 # Logical (shifted reg)
 # Add/subtract (shifted reg)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_crc32(DisasContext *s, arg_rrr_e *a, bool crc32c)
 TRANS_FEAT(CRC32, aa64_crc32, do_crc32, a, false)
 TRANS_FEAT(CRC32C, aa64_crc32, do_crc32, a, true)
 
+static bool do_subp(DisasContext *s, arg_rrr *a, bool setflag)
+{
+    TCGv_i64 tcg_n = read_cpu_reg_sp(s, a->rn, true);
+    TCGv_i64 tcg_m = read_cpu_reg_sp(s, a->rm, true);
+    TCGv_i64 tcg_d = cpu_reg(s, a->rd);
+
+    tcg_gen_sextract_i64(tcg_n, tcg_n, 0, 56);
+    tcg_gen_sextract_i64(tcg_m, tcg_m, 0, 56);
+
+    if (setflag) {
+        gen_sub_CC(true, tcg_d, tcg_n, tcg_m);
+    } else {
+        tcg_gen_sub_i64(tcg_d, tcg_n, tcg_m);
+    }
+    return true;
+}
+
+TRANS_FEAT(SUBP, aa64_mte_insn_reg, do_subp, a, false)
+TRANS_FEAT(SUBPS, aa64_mte_insn_reg, do_subp, a, true)
+
+static bool trans_IRG(DisasContext *s, arg_rrr *a)
+{
+    if (dc_isar_feature(aa64_mte_insn_reg, s)) {
+        TCGv_i64 tcg_rd = cpu_reg_sp(s, a->rd);
+        TCGv_i64 tcg_rn = cpu_reg_sp(s, a->rn);
+
+        if (s->ata[0]) {
+            gen_helper_irg(tcg_rd, tcg_env, tcg_rn, cpu_reg(s, a->rm));
+        } else {
+            gen_address_with_allocation_tag0(tcg_rd, tcg_rn);
+        }
+        return true;
+    }
+    return false;
+}
+
+static bool trans_GMI(DisasContext *s, arg_rrr *a)
+{
+    if (dc_isar_feature(aa64_mte_insn_reg, s)) {
+        TCGv_i64 t = tcg_temp_new_i64();
+
+        tcg_gen_extract_i64(t, cpu_reg_sp(s, a->rn), 56, 4);
+        tcg_gen_shl_i64(t, tcg_constant_i64(1), t);
+        tcg_gen_or_i64(cpu_reg(s, a->rd), cpu_reg(s, a->rm), t);
+        return true;
+    }
+    return false;
+}
+
 /* Logical (shifted register)
  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
  * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
     }
 
     switch (opcode) {
-    case 0: /* SUBP(S) */
-        if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
-            goto do_unallocated;
-        } else {
-            TCGv_i64 tcg_n, tcg_m, tcg_d;
-
-            tcg_n = read_cpu_reg_sp(s, rn, true);
-            tcg_m = read_cpu_reg_sp(s, rm, true);
-            tcg_gen_sextract_i64(tcg_n, tcg_n, 0, 56);
-            tcg_gen_sextract_i64(tcg_m, tcg_m, 0, 56);
-            tcg_d = cpu_reg(s, rd);
-
-            if (setflag) {
-                gen_sub_CC(true, tcg_d, tcg_n, tcg_m);
-            } else {
-                tcg_gen_sub_i64(tcg_d, tcg_n, tcg_m);
-            }
-        }
-        break;
-    case 4: /* IRG */
-        if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
-            goto do_unallocated;
-        }
-        if (s->ata[0]) {
-            gen_helper_irg(cpu_reg_sp(s, rd), tcg_env,
-                           cpu_reg_sp(s, rn), cpu_reg(s, rm));
-        } else {
-            gen_address_with_allocation_tag0(cpu_reg_sp(s, rd),
-                                             cpu_reg_sp(s, rn));
-        }
-        break;
-    case 5: /* GMI */
-        if (sf == 0 || !dc_isar_feature(aa64_mte_insn_reg, s)) {
-            goto do_unallocated;
-        } else {
-            TCGv_i64 t = tcg_temp_new_i64();
-
-            tcg_gen_extract_i64(t, cpu_reg_sp(s, rn), 56, 4);
-            tcg_gen_shl_i64(t, tcg_constant_i64(1), t);
-            tcg_gen_or_i64(cpu_reg(s, rd), cpu_reg(s, rm), t);
-        }
-        break;
     case 12: /* PACGA */
         if (sf == 0 || !dc_isar_feature(aa64_pauth, s)) {
             goto do_unallocated;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
         break;
     default:
     do_unallocated:
+    case 0: /* SUBP(S) */
     case 2: /* UDIV */
     case 3: /* SDIV */
+    case 4: /* IRG */
+    case 5: /* GMI */
     case 8: /* LSLV */
     case 9: /* LSRV */
     case 10: /* ASRV */
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove disas_data_proc_2src, as this was the last insn
decoded by that function.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-7-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  2 ++
 target/arm/tcg/translate-a64.c | 65 ++++++----------------------------
 2 files changed, 13 insertions(+), 54 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SUBPS           1 01 11010110 ..... 000000 ..... .....  @rrr
 IRG             1 00 11010110 ..... 000100 ..... .....  @rrr
 GMI             1 00 11010110 ..... 000101 ..... .....  @rrr
 
+PACGA           1 00 11010110 ..... 001100 ..... .....  @rrr
+
 # Data Processing (1-source)
 # Logical (shifted reg)
 # Add/subtract (shifted reg)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_GMI(DisasContext *s, arg_rrr *a)
     return false;
 }
 
+static bool trans_PACGA(DisasContext *s, arg_rrr *a)
+{
+    if (dc_isar_feature(aa64_pauth, s)) {
+        gen_helper_pacga(cpu_reg(s, a->rd), tcg_env,
+                         cpu_reg(s, a->rn), cpu_reg_sp(s, a->rm));
+        return true;
+    }
+    return false;
+}
+
 /* Logical (shifted register)
  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
  * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
 }
 
 
-/* Data-processing (2 source)
- *   31   30  29 28             21 20  16 15    10 9    5 4    0
- * +----+---+---+-----------------+------+--------+------+------+
- * | sf | 0 | S | 1 1 0 1 0 1 1 0 |  Rm  | opcode |  Rn  |  Rd  |
- * +----+---+---+-----------------+------+--------+------+------+
- */
-static void disas_data_proc_2src(DisasContext *s, uint32_t insn)
-{
-    unsigned int sf, rm, opcode, rn, rd, setflag;
-    sf = extract32(insn, 31, 1);
-    setflag = extract32(insn, 29, 1);
-    rm = extract32(insn, 16, 5);
-    opcode = extract32(insn, 10, 6);
-    rn = extract32(insn, 5, 5);
-    rd = extract32(insn, 0, 5);
-
-    if (setflag && opcode != 0) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    switch (opcode) {
-    case 12: /* PACGA */
-        if (sf == 0 || !dc_isar_feature(aa64_pauth, s)) {
-            goto do_unallocated;
-        }
-        gen_helper_pacga(cpu_reg(s, rd), tcg_env,
-                         cpu_reg(s, rn), cpu_reg_sp(s, rm));
-        break;
-    default:
-    do_unallocated:
-    case 0: /* SUBP(S) */
-    case 2: /* UDIV */
-    case 3: /* SDIV */
-    case 4: /* IRG */
-    case 5: /* GMI */
-    case 8: /* LSLV */
-    case 9: /* LSRV */
-    case 10: /* ASRV */
-    case 11: /* RORV */
-    case 16:
-    case 17:
-    case 18:
-    case 19:
-    case 20:
-    case 21:
-    case 22:
-    case 23: /* CRC32 */
-        unallocated_encoding(s);
-        break;
-    }
-}
-
 /*
  * Data processing - register
  *  31  30 29  28      25    21  20  16      10         0
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
         if (op0) {    /* (1 source) */
             disas_data_proc_1src(s, insn);
         } else {      /* (2 source) */
-            disas_data_proc_2src(s, insn);
+            goto do_unallocated;
         }
         break;
     case 0x8 ... 0xf: /* (3 source) */
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-8-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  11 +++
 target/arm/tcg/translate-a64.c | 137 +++++++++++++++------------------
 2 files changed, 72 insertions(+), 76 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 &r              rn
 &rrr            rd rn rm
 &ri             rd imm
+&rr             rd rn
+&rr_sf          rd rn sf
 &rri_sf         rd rn imm sf
 &rrr_sf         rd rn rm sf
 &i              imm
@@ -XXX,XX +XXX,XX @@ GMI             1 00 11010110 ..... 000101 ..... .....  @rrr
 PACGA           1 00 11010110 ..... 001100 ..... .....  @rrr
 
 # Data Processing (1-source)
+
+@rr             . .......... ..... ...... rn:5 rd:5     &rr
+@rr_sf          sf:1 .......... ..... ...... rn:5 rd:5  &rr_sf
+
+RBIT            . 10 11010110 00000 000000 ..... .....  @rr_sf
+REV16           . 10 11010110 00000 000001 ..... .....  @rr_sf
+REV32           . 10 11010110 00000 000010 ..... .....  @rr_sf
+REV64           1 10 11010110 00000 000011 ..... .....  @rr
+
 # Logical (shifted reg)
 # Add/subtract (shifted reg)
 # Add/subtract (extended reg)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_PACGA(DisasContext *s, arg_rrr *a)
     return false;
 }
 
+typedef void ArithOneOp(TCGv_i64, TCGv_i64);
+
+static bool gen_rr(DisasContext *s, int rd, int rn, ArithOneOp fn)
+{
+    fn(cpu_reg(s, rd), cpu_reg(s, rn));
+    return true;
+}
+
+static void gen_rbit32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
+{
+    TCGv_i32 t32 = tcg_temp_new_i32();
+
+    tcg_gen_extrl_i64_i32(t32, tcg_rn);
+    gen_helper_rbit(t32, t32);
+    tcg_gen_extu_i32_i64(tcg_rd, t32);
+}
+
+static void gen_rev16_xx(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn, TCGv_i64 mask)
+{
+    TCGv_i64 tcg_tmp = tcg_temp_new_i64();
+
+    tcg_gen_shri_i64(tcg_tmp, tcg_rn, 8);
+    tcg_gen_and_i64(tcg_rd, tcg_rn, mask);
+    tcg_gen_and_i64(tcg_tmp, tcg_tmp, mask);
+    tcg_gen_shli_i64(tcg_rd, tcg_rd, 8);
+    tcg_gen_or_i64(tcg_rd, tcg_rd, tcg_tmp);
+}
+
+static void gen_rev16_32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
+{
+    gen_rev16_xx(tcg_rd, tcg_rn, tcg_constant_i64(0x00ff00ff));
+}
+
+static void gen_rev16_64(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
+{
+    gen_rev16_xx(tcg_rd, tcg_rn, tcg_constant_i64(0x00ff00ff00ff00ffull));
+}
+
+static void gen_rev_32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
+{
+    tcg_gen_bswap32_i64(tcg_rd, tcg_rn, TCG_BSWAP_OZ);
+}
+
+static void gen_rev32(TCGv_i64 tcg_rd, TCGv_i64 tcg_rn)
+{
+    tcg_gen_bswap64_i64(tcg_rd, tcg_rn);
+    tcg_gen_rotri_i64(tcg_rd, tcg_rd, 32);
+}
+
+TRANS(RBIT, gen_rr, a->rd, a->rn, a->sf ? gen_helper_rbit64 : gen_rbit32)
+TRANS(REV16, gen_rr, a->rd, a->rn, a->sf ? gen_rev16_64 : gen_rev16_32)
+TRANS(REV32, gen_rr, a->rd, a->rn, a->sf ? gen_rev32 : gen_rev_32)
+TRANS(REV64, gen_rr, a->rd, a->rn, tcg_gen_bswap64_i64)
+
 /* Logical (shifted register)
  *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
  * +----+-----+-----------+-------+---+------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void handle_cls(DisasContext *s, unsigned int sf,
     }
 }
 
-static void handle_rbit(DisasContext *s, unsigned int sf,
-                        unsigned int rn, unsigned int rd)
-{
-    TCGv_i64 tcg_rd, tcg_rn;
-    tcg_rd = cpu_reg(s, rd);
-    tcg_rn = cpu_reg(s, rn);
-
-    if (sf) {
-        gen_helper_rbit64(tcg_rd, tcg_rn);
-    } else {
-        TCGv_i32 tcg_tmp32 = tcg_temp_new_i32();
-        tcg_gen_extrl_i64_i32(tcg_tmp32, tcg_rn);
-        gen_helper_rbit(tcg_tmp32, tcg_tmp32);
-        tcg_gen_extu_i32_i64(tcg_rd, tcg_tmp32);
-    }
-}
-
-/* REV with sf==1, opcode==3 ("REV64") */
-static void handle_rev64(DisasContext *s, unsigned int sf,
-                         unsigned int rn, unsigned int rd)
-{
-    if (!sf) {
-        unallocated_encoding(s);
-        return;
-    }
-    tcg_gen_bswap64_i64(cpu_reg(s, rd), cpu_reg(s, rn));
-}
-
-/* REV with sf==0, opcode==2
- * REV32 (sf==1, opcode==2)
- */
-static void handle_rev32(DisasContext *s, unsigned int sf,
-                         unsigned int rn, unsigned int rd)
-{
-    TCGv_i64 tcg_rd = cpu_reg(s, rd);
-    TCGv_i64 tcg_rn = cpu_reg(s, rn);
-
-    if (sf) {
-        tcg_gen_bswap64_i64(tcg_rd, tcg_rn);
-        tcg_gen_rotri_i64(tcg_rd, tcg_rd, 32);
-    } else {
-        tcg_gen_bswap32_i64(tcg_rd, tcg_rn, TCG_BSWAP_OZ);
-    }
-}
-
-/* REV16 (opcode==1) */
-static void handle_rev16(DisasContext *s, unsigned int sf,
-                         unsigned int rn, unsigned int rd)
-{
-    TCGv_i64 tcg_rd = cpu_reg(s, rd);
-    TCGv_i64 tcg_tmp = tcg_temp_new_i64();
-    TCGv_i64 tcg_rn = read_cpu_reg(s, rn, sf);
-    TCGv_i64 mask = tcg_constant_i64(sf ? 0x00ff00ff00ff00ffull : 0x00ff00ff);
-
-    tcg_gen_shri_i64(tcg_tmp, tcg_rn, 8);
-    tcg_gen_and_i64(tcg_rd, tcg_rn, mask);
-    tcg_gen_and_i64(tcg_tmp, tcg_tmp, mask);
-    tcg_gen_shli_i64(tcg_rd, tcg_rd, 8);
-    tcg_gen_or_i64(tcg_rd, tcg_rd, tcg_tmp);
-}
-
 /* Data-processing (1 source)
  *   31  30  29  28             21 20     16 15    10 9    5 4    0
  * +----+---+---+-----------------+---------+--------+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
 #define MAP(SF, O2, O1) ((SF) | (O1 << 1) | (O2 << 7))
 
     switch (MAP(sf, opcode2, opcode)) {
-    case MAP(0, 0x00, 0x00): /* RBIT */
-    case MAP(1, 0x00, 0x00):
-        handle_rbit(s, sf, rn, rd);
-        break;
-    case MAP(0, 0x00, 0x01): /* REV16 */
-    case MAP(1, 0x00, 0x01):
-        handle_rev16(s, sf, rn, rd);
-        break;
-    case MAP(0, 0x00, 0x02): /* REV/REV32 */
-    case MAP(1, 0x00, 0x02):
-        handle_rev32(s, sf, rn, rd);
-        break;
-    case MAP(1, 0x00, 0x03): /* REV64 */
-        handle_rev64(s, sf, rn, rd);
-        break;
     case MAP(0, 0x00, 0x04): /* CLZ */
     case MAP(1, 0x00, 0x04):
         handle_clz(s, sf, rn, rd);
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_1src(DisasContext *s, uint32_t insn)
         break;
     default:
     do_unallocated:
+    case MAP(0, 0x00, 0x00): /* RBIT */
+    case MAP(1, 0x00, 0x00):
+    case MAP(0, 0x00, 0x01): /* REV16 */
+    case MAP(1, 0x00, 0x01):
+    case MAP(0, 0x00, 0x02): /* REV/REV32 */
+    case MAP(1, 0x00, 0x02):
+    case MAP(1, 0x00, 0x03): /* REV64 */
         unallocated_encoding(s);
         break;
     }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-9-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  3 ++
 target/arm/tcg/translate-a64.c | 72 ++++++++++++++--------------------
 2 files changed, 33 insertions(+), 42 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

This includes PACIA, PACIZA, PACIB, PACIZB, PACDA, PACDZA, PACDB,
PACDZB, AUTIA, AUTIZA, AUTIB, AUTIZB, AUTDA, AUTDZA, AUTDB, AUTDZB.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-10-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  13 +++
 target/arm/tcg/translate-a64.c | 173 +++++++++------------------------
 2 files changed, 58 insertions(+), 128 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove disas_data_proc_1src, as these were the last insns
decoded by that function.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-11-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  3 ++
 target/arm/tcg/translate-a64.c | 99 +++++-----------------------------
 2 files changed, 16 insertions(+), 86 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

This includes AND, BIC, ORR, ORN, EOR, EON, ANDS, BICS (shifted reg).

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-12-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   9 +++
 target/arm/tcg/translate-a64.c | 117 ++++++++++++---------------------
 2 files changed, 51 insertions(+), 75 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ XPACI           1 10 11010110 00001 010000 11111 rd:5
 XPACD           1 10 11010110 00001 010001 11111 rd:5
 
 # Logical (shifted reg)
+
+&logic_shift    rd rn rm sf sa st n
+@logic_shift    sf:1 .. ..... st:2 n:1 rm:5 sa:6 rn:5 rd:5  &logic_shift
+
+AND_r           . 00 01010 .. . ..... ...... ..... .....    @logic_shift
+ORR_r           . 01 01010 .. . ..... ...... ..... .....    @logic_shift
+EOR_r           . 10 01010 .. . ..... ...... ..... .....    @logic_shift
+ANDS_r          . 11 01010 .. . ..... ...... ..... .....    @logic_shift
+
 # Add/subtract (shifted reg)
 # Add/subtract (extended reg)
 # Add/subtract (carry)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_xpac(DisasContext *s, int rd, NeonGenOne64OpEnvFn *fn)
 TRANS_FEAT(XPACI, aa64_pauth, do_xpac, a->rd, gen_helper_xpaci)
 TRANS_FEAT(XPACD, aa64_pauth, do_xpac, a->rd, gen_helper_xpacd)
 
-/* Logical (shifted register)
- *   31  30 29 28       24 23   22 21  20  16 15    10 9    5 4    0
- * +----+-----+-----------+-------+---+------+--------+------+------+
- * | sf | opc | 0 1 0 1 0 | shift | N |  Rm  |  imm6  |  Rn  |  Rd  |
- * +----+-----+-----------+-------+---+------+--------+------+------+
- */
-static void disas_logic_reg(DisasContext *s, uint32_t insn)
+static bool do_logic_reg(DisasContext *s, arg_logic_shift *a,
+                         ArithTwoOp *fn, ArithTwoOp *inv_fn, bool setflags)
 {
     TCGv_i64 tcg_rd, tcg_rn, tcg_rm;
-    unsigned int sf, opc, shift_type, invert, rm, shift_amount, rn, rd;
 
-    sf = extract32(insn, 31, 1);
-    opc = extract32(insn, 29, 2);
-    shift_type = extract32(insn, 22, 2);
-    invert = extract32(insn, 21, 1);
-    rm = extract32(insn, 16, 5);
-    shift_amount = extract32(insn, 10, 6);
-    rn = extract32(insn, 5, 5);
-    rd = extract32(insn, 0, 5);
-
-    if (!sf && (shift_amount & (1 << 5))) {
-        unallocated_encoding(s);
-        return;
+    if (!a->sf && (a->sa & (1 << 5))) {
+        return false;
     }
 
-    tcg_rd = cpu_reg(s, rd);
+    tcg_rd = cpu_reg(s, a->rd);
+    tcg_rn = cpu_reg(s, a->rn);
 
-    if (opc == 1 && shift_amount == 0 && shift_type == 0 && rn == 31) {
-        /* Unshifted ORR and ORN with WZR/XZR is the standard encoding for
-         * register-register MOV and MVN, so it is worth special casing.
-         */
-        tcg_rm = cpu_reg(s, rm);
-        if (invert) {
+    tcg_rm = read_cpu_reg(s, a->rm, a->sf);
+    if (a->sa) {
+        shift_reg_imm(tcg_rm, tcg_rm, a->sf, a->st, a->sa);
+    }
+
+    (a->n ? inv_fn : fn)(tcg_rd, tcg_rn, tcg_rm);
+    if (!a->sf) {
+        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
+    }
+    if (setflags) {
+        gen_logic_CC(a->sf, tcg_rd);
+    }
+    return true;
+}
+
+static bool trans_ORR_r(DisasContext *s, arg_logic_shift *a)
+{
+    /*
+     * Unshifted ORR and ORN with WZR/XZR is the standard encoding for
+     * register-register MOV and MVN, so it is worth special casing.
+     */
+    if (a->sa == 0 && a->st == 0 && a->rn == 31) {
+        TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
+        TCGv_i64 tcg_rm = cpu_reg(s, a->rm);
+
+        if (a->n) {
             tcg_gen_not_i64(tcg_rd, tcg_rm);
-            if (!sf) {
+            if (!a->sf) {
                 tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
             }
         } else {
-            if (sf) {
+            if (a->sf) {
                 tcg_gen_mov_i64(tcg_rd, tcg_rm);
             } else {
                 tcg_gen_ext32u_i64(tcg_rd, tcg_rm);
             }
         }
-        return;
+        return true;
     }
 
-    tcg_rm = read_cpu_reg(s, rm, sf);
-
-    if (shift_amount) {
-        shift_reg_imm(tcg_rm, tcg_rm, sf, shift_type, shift_amount);
-    }
-
-    tcg_rn = cpu_reg(s, rn);
-
-    switch (opc | (invert << 2)) {
-    case 0: /* AND */
-    case 3: /* ANDS */
-        tcg_gen_and_i64(tcg_rd, tcg_rn, tcg_rm);
-        break;
-    case 1: /* ORR */
-        tcg_gen_or_i64(tcg_rd, tcg_rn, tcg_rm);
-        break;
-    case 2: /* EOR */
-        tcg_gen_xor_i64(tcg_rd, tcg_rn, tcg_rm);
-        break;
-    case 4: /* BIC */
-    case 7: /* BICS */
-        tcg_gen_andc_i64(tcg_rd, tcg_rn, tcg_rm);
-        break;
-    case 5: /* ORN */
-        tcg_gen_orc_i64(tcg_rd, tcg_rn, tcg_rm);
-        break;
-    case 6: /* EON */
-        tcg_gen_eqv_i64(tcg_rd, tcg_rn, tcg_rm);
-        break;
-    default:
-        assert(FALSE);
-        break;
-    }
-
-    if (!sf) {
-        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
-    }
-
-    if (opc == 3) {
-        gen_logic_CC(sf, tcg_rd);
-    }
+    return do_logic_reg(s, a, tcg_gen_or_i64, tcg_gen_orc_i64, false);
 }
 
+TRANS(AND_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, false)
+TRANS(ANDS_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, true)
+TRANS(EOR_r, do_logic_reg, a, tcg_gen_xor_i64, tcg_gen_eqv_i64, false)
+
 /*
  * Add/subtract (extended register)
  *
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
                 /* Add/sub (shifted register) */
                 disas_add_sub_reg(s, insn);
             }
-        } else {
-            /* Logical (shifted register) */
-            disas_logic_reg(s, insn);
+            return;
         }
-        return;
+        goto do_unallocated;
     }
 
     switch (op2) {
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes ADD, SUB, ADDS, SUBS (extended register).

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-13-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  9 +++++
 target/arm/tcg/translate-a64.c | 65 +++++++++++-----------------------
 2 files changed, 29 insertions(+), 45 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ ANDS_r          . 11 01010 .. . ..... ...... ..... .....    @logic_shift
 
 # Add/subtract (shifted reg)
 # Add/subtract (extended reg)
+
+&addsub_ext     rd rn rm sf sa st
+@addsub_ext     sf:1 .. ........ rm:5 st:3 sa:3 rn:5 rd:5   &addsub_ext
+
+ADD_ext         . 00 01011001 ..... ... ... ..... .....     @addsub_ext
+SUB_ext         . 10 01011001 ..... ... ... ..... .....     @addsub_ext
+ADDS_ext        . 01 01011001 ..... ... ... ..... .....     @addsub_ext
+SUBS_ext        . 11 01011001 ..... ... ... ..... .....     @addsub_ext
+
 # Add/subtract (carry)
 # Rotate right into flags
 # Evaluate into flags
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(AND_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, false)
 TRANS(ANDS_r, do_logic_reg, a, tcg_gen_and_i64, tcg_gen_andc_i64, true)
 TRANS(EOR_r, do_logic_reg, a, tcg_gen_xor_i64, tcg_gen_eqv_i64, false)
 
-/*
- * Add/subtract (extended register)
- *
- *  31|30|29|28       24|23 22|21|20   16|15  13|12  10|9  5|4  0|
- * +--+--+--+-----------+-----+--+-------+------+------+----+----+
- * |sf|op| S| 0 1 0 1 1 | opt | 1|  Rm   |option| imm3 | Rn | Rd |
- * +--+--+--+-----------+-----+--+-------+------+------+----+----+
- *
- *  sf: 0 -> 32bit, 1 -> 64bit
- *  op: 0 -> add  , 1 -> sub
- *   S: 1 -> set flags
- * opt: 00
- * option: extension type (see DecodeRegExtend)
- * imm3: optional shift to Rm
- *
- * Rd = Rn + LSL(extend(Rm), amount)
- */
-static void disas_add_sub_ext_reg(DisasContext *s, uint32_t insn)
+static bool do_addsub_ext(DisasContext *s, arg_addsub_ext *a,
+                          bool sub_op, bool setflags)
 {
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int imm3 = extract32(insn, 10, 3);
-    int option = extract32(insn, 13, 3);
-    int rm = extract32(insn, 16, 5);
-    int opt = extract32(insn, 22, 2);
-    bool setflags = extract32(insn, 29, 1);
-    bool sub_op = extract32(insn, 30, 1);
-    bool sf = extract32(insn, 31, 1);
+    TCGv_i64 tcg_rm, tcg_rn, tcg_rd, tcg_result;
 
-    TCGv_i64 tcg_rm, tcg_rn; /* temps */
-    TCGv_i64 tcg_rd;
-    TCGv_i64 tcg_result;
-
-    if (imm3 > 4 || opt != 0) {
-        unallocated_encoding(s);
-        return;
+    if (a->sa > 4) {
+        return false;
     }
 
     /* non-flag setting ops may use SP */
     if (!setflags) {
-        tcg_rd = cpu_reg_sp(s, rd);
+        tcg_rd = cpu_reg_sp(s, a->rd);
     } else {
-        tcg_rd = cpu_reg(s, rd);
+        tcg_rd = cpu_reg(s, a->rd);
     }
-    tcg_rn = read_cpu_reg_sp(s, rn, sf);
+    tcg_rn = read_cpu_reg_sp(s, a->rn, a->sf);
 
-    tcg_rm = read_cpu_reg(s, rm, sf);
-    ext_and_shift_reg(tcg_rm, tcg_rm, option, imm3);
+    tcg_rm = read_cpu_reg(s, a->rm, a->sf);
+    ext_and_shift_reg(tcg_rm, tcg_rm, a->st, a->sa);
 
     tcg_result = tcg_temp_new_i64();
-
     if (!setflags) {
         if (sub_op) {
             tcg_gen_sub_i64(tcg_result, tcg_rn, tcg_rm);
@@ -XXX,XX +XXX,XX @@ static void disas_add_sub_ext_reg(DisasContext *s, uint32_t insn)
         }
     } else {
         if (sub_op) {
-            gen_sub_CC(sf, tcg_result, tcg_rn, tcg_rm);
+            gen_sub_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
         } else {
-            gen_add_CC(sf, tcg_result, tcg_rn, tcg_rm);
+            gen_add_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
         }
     }
 
-    if (sf) {
+    if (a->sf) {
         tcg_gen_mov_i64(tcg_rd, tcg_result);
     } else {
         tcg_gen_ext32u_i64(tcg_rd, tcg_result);
     }
+    return true;
 }
 
+TRANS(ADD_ext, do_addsub_ext, a, false, false)
+TRANS(SUB_ext, do_addsub_ext, a, true, false)
+TRANS(ADDS_ext, do_addsub_ext, a, false, true)
+TRANS(SUBS_ext, do_addsub_ext, a, true, true)
+
 /*
  * Add/subtract (shifted register)
  *
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
     if (!op1) {
         if (op2 & 8) {
             if (op2 & 1) {
-                /* Add/sub (extended register) */
-                disas_add_sub_ext_reg(s, insn);
+                goto do_unallocated;
             } else {
                 /* Add/sub (shifted register) */
                 disas_add_sub_reg(s, insn);
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes ADD, SUB, ADDS, SUBS (shifted register).

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-14-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  9 +++++
 target/arm/tcg/translate-a64.c | 64 ++++++++++------------------------
 2 files changed, 27 insertions(+), 46 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ EOR_r           . 10 01010 .. . ..... ...... ..... .....    @logic_shift
 ANDS_r          . 11 01010 .. . ..... ...... ..... .....    @logic_shift
 
 # Add/subtract (shifted reg)
+
+&addsub_shift    rd rn rm sf sa st
+@addsub_shift    sf:1 .. ..... st:2 . rm:5 sa:6 rn:5 rd:5   &addsub_shift
+
+ADD_r           . 00 01011 .. 0 ..... ...... ..... .....    @addsub_shift
+SUB_r           . 10 01011 .. 0 ..... ...... ..... .....    @addsub_shift
+ADDS_r          . 01 01011 .. 0 ..... ...... ..... .....    @addsub_shift
+SUBS_r          . 11 01011 .. 0 ..... ...... ..... .....    @addsub_shift
+
 # Add/subtract (extended reg)
 
 &addsub_ext     rd rn rm sf sa st
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(SUB_ext, do_addsub_ext, a, true, false)
 TRANS(ADDS_ext, do_addsub_ext, a, false, true)
 TRANS(SUBS_ext, do_addsub_ext, a, true, true)
 
-/*
- * Add/subtract (shifted register)
- *
- *  31 30 29 28       24 23 22 21 20   16 15     10 9    5 4    0
- * +--+--+--+-----------+-----+--+-------+---------+------+------+
- * |sf|op| S| 0 1 0 1 1 |shift| 0|  Rm   |  imm6   |  Rn  |  Rd  |
- * +--+--+--+-----------+-----+--+-------+---------+------+------+
- *
- *    sf: 0 -> 32bit, 1 -> 64bit
- *    op: 0 -> add  , 1 -> sub
- *     S: 1 -> set flags
- * shift: 00 -> LSL, 01 -> LSR, 10 -> ASR, 11 -> RESERVED
- *  imm6: Shift amount to apply to Rm before the add/sub
- */
-static void disas_add_sub_reg(DisasContext *s, uint32_t insn)
+static bool do_addsub_reg(DisasContext *s, arg_addsub_shift *a,
+                          bool sub_op, bool setflags)
 {
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int imm6 = extract32(insn, 10, 6);
-    int rm = extract32(insn, 16, 5);
-    int shift_type = extract32(insn, 22, 2);
-    bool setflags = extract32(insn, 29, 1);
-    bool sub_op = extract32(insn, 30, 1);
-    bool sf = extract32(insn, 31, 1);
+    TCGv_i64 tcg_rd, tcg_rn, tcg_rm, tcg_result;
 
-    TCGv_i64 tcg_rd = cpu_reg(s, rd);
-    TCGv_i64 tcg_rn, tcg_rm;
-    TCGv_i64 tcg_result;
-
-    if ((shift_type == 3) || (!sf && (imm6 > 31))) {
-        unallocated_encoding(s);
-        return;
+    if (a->st == 3 || (!a->sf && (a->sa & 32))) {
+        return false;
     }
 
-    tcg_rn = read_cpu_reg(s, rn, sf);
-    tcg_rm = read_cpu_reg(s, rm, sf);
+    tcg_rd = cpu_reg(s, a->rd);
+    tcg_rn = read_cpu_reg(s, a->rn, a->sf);
+    tcg_rm = read_cpu_reg(s, a->rm, a->sf);
 
-    shift_reg_imm(tcg_rm, tcg_rm, sf, shift_type, imm6);
+    shift_reg_imm(tcg_rm, tcg_rm, a->sf, a->st, a->sa);
 
     tcg_result = tcg_temp_new_i64();
-
     if (!setflags) {
         if (sub_op) {
             tcg_gen_sub_i64(tcg_result, tcg_rn, tcg_rm);
@@ -XXX,XX +XXX,XX @@ static void disas_add_sub_reg(DisasContext *s, uint32_t insn)
         }
     } else {
         if (sub_op) {
-            gen_sub_CC(sf, tcg_result, tcg_rn, tcg_rm);
+            gen_sub_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
         } else {
-            gen_add_CC(sf, tcg_result, tcg_rn, tcg_rm);
+            gen_add_CC(a->sf, tcg_result, tcg_rn, tcg_rm);
         }
     }
 
-    if (sf) {
+    if (a->sf) {
         tcg_gen_mov_i64(tcg_rd, tcg_result);
     } else {
         tcg_gen_ext32u_i64(tcg_rd, tcg_result);
     }
+    return true;
 }
 
+TRANS(ADD_r, do_addsub_reg, a, false, false)
+TRANS(SUB_r, do_addsub_reg, a, true, false)
+TRANS(ADDS_r, do_addsub_reg, a, false, true)
+TRANS(SUBS_r, do_addsub_reg, a, true, true)
+
 /* Data-processing (3 source)
  *
  *    31 30  29 28       24 23 21  20  16  15  14  10 9    5 4    0
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
     int op3 = extract32(insn, 10, 6);
 
     if (!op1) {
-        if (op2 & 8) {
-            if (op2 & 1) {
-                goto do_unallocated;
-            } else {
-                /* Add/sub (shifted register) */
-                disas_add_sub_reg(s, insn);
-            }
-            return;
-        }
         goto do_unallocated;
     }
 
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes MADD, MSUB, SMADDL, SMSUBL, UMADDL, UMSUBL, SMULH, UMULH.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-15-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  16 +++++
 target/arm/tcg/translate-a64.c | 119 ++++++++++++---------------------
 2 files changed, 59 insertions(+), 76 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SUBS_ext        . 11 01011001 ..... ... ... ..... .....     @addsub_ext
 # Conditional select
 # Data Processing (3-source)
 
+&rrrr           rd rn rm ra
+@rrrr           . .. ........ rm:5 . ra:5 rn:5 rd:5     &rrrr
+
+MADD_w          0 00 11011000 ..... 0 ..... ..... ..... @rrrr
+MSUB_w          0 00 11011000 ..... 1 ..... ..... ..... @rrrr
+MADD_x          1 00 11011000 ..... 0 ..... ..... ..... @rrrr
+MSUB_x          1 00 11011000 ..... 1 ..... ..... ..... @rrrr
+
+SMADDL          1 00 11011001 ..... 0 ..... ..... ..... @rrrr
+SMSUBL          1 00 11011001 ..... 1 ..... ..... ..... @rrrr
+UMADDL          1 00 11011101 ..... 0 ..... ..... ..... @rrrr
+UMSUBL          1 00 11011101 ..... 1 ..... ..... ..... @rrrr
+
+SMULH           1 00 11011010 ..... 0 11111 ..... ..... @rrr
+UMULH           1 00 11011110 ..... 0 11111 ..... ..... @rrr
+
 ### Cryptographic AES
 
 AESE            01001110 00 10100 00100 10 ..... .....  @r2r_q1e0
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(SUB_r, do_addsub_reg, a, true, false)
 TRANS(ADDS_r, do_addsub_reg, a, false, true)
 TRANS(SUBS_r, do_addsub_reg, a, true, true)
 
-/* Data-processing (3 source)
- *
- *    31 30  29 28       24 23 21  20  16  15  14  10 9    5 4    0
- *  +--+------+-----------+------+------+----+------+------+------+
- *  |sf| op54 | 1 1 0 1 1 | op31 |  Rm  | o0 |  Ra  |  Rn  |  Rd  |
- *  +--+------+-----------+------+------+----+------+------+------+
- */
-static void disas_data_proc_3src(DisasContext *s, uint32_t insn)
+static bool do_mulh(DisasContext *s, arg_rrr *a,
+                    void (*fn)(TCGv_i64, TCGv_i64, TCGv_i64, TCGv_i64))
 {
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int ra = extract32(insn, 10, 5);
-    int rm = extract32(insn, 16, 5);
-    int op_id = (extract32(insn, 29, 3) << 4) |
-        (extract32(insn, 21, 3) << 1) |
-        extract32(insn, 15, 1);
-    bool sf = extract32(insn, 31, 1);
-    bool is_sub = extract32(op_id, 0, 1);
-    bool is_high = extract32(op_id, 2, 1);
-    bool is_signed = false;
-    TCGv_i64 tcg_op1;
-    TCGv_i64 tcg_op2;
-    TCGv_i64 tcg_tmp;
+    TCGv_i64 discard = tcg_temp_new_i64();
+    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
+    TCGv_i64 tcg_rn = cpu_reg(s, a->rn);
+    TCGv_i64 tcg_rm = cpu_reg(s, a->rm);
 
-    /* Note that op_id is sf:op54:op31:o0 so it includes the 32/64 size flag */
-    switch (op_id) {
-    case 0x42: /* SMADDL */
-    case 0x43: /* SMSUBL */
-    case 0x44: /* SMULH */
-        is_signed = true;
-        break;
-    case 0x0: /* MADD (32bit) */
-    case 0x1: /* MSUB (32bit) */
-    case 0x40: /* MADD (64bit) */
-    case 0x41: /* MSUB (64bit) */
-    case 0x4a: /* UMADDL */
-    case 0x4b: /* UMSUBL */
-    case 0x4c: /* UMULH */
-        break;
-    default:
-        unallocated_encoding(s);
-        return;
-    }
+    fn(discard, tcg_rd, tcg_rn, tcg_rm);
+    return true;
+}
 
-    if (is_high) {
-        TCGv_i64 low_bits = tcg_temp_new_i64(); /* low bits discarded */
-        TCGv_i64 tcg_rd = cpu_reg(s, rd);
-        TCGv_i64 tcg_rn = cpu_reg(s, rn);
-        TCGv_i64 tcg_rm = cpu_reg(s, rm);
+TRANS(SMULH, do_mulh, a, tcg_gen_muls2_i64)
+TRANS(UMULH, do_mulh, a, tcg_gen_mulu2_i64)
 
-        if (is_signed) {
-            tcg_gen_muls2_i64(low_bits, tcg_rd, tcg_rn, tcg_rm);
-        } else {
-            tcg_gen_mulu2_i64(low_bits, tcg_rd, tcg_rn, tcg_rm);
-        }
-        return;
-    }
+static bool do_muladd(DisasContext *s, arg_rrrr *a,
+                      bool sf, bool is_sub, MemOp mop)
+{
+    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
+    TCGv_i64 tcg_op1, tcg_op2;
 
-    tcg_op1 = tcg_temp_new_i64();
-    tcg_op2 = tcg_temp_new_i64();
-    tcg_tmp = tcg_temp_new_i64();
-
-    if (op_id < 0x42) {
-        tcg_gen_mov_i64(tcg_op1, cpu_reg(s, rn));
-        tcg_gen_mov_i64(tcg_op2, cpu_reg(s, rm));
+    if (mop == MO_64) {
+        tcg_op1 = cpu_reg(s, a->rn);
+        tcg_op2 = cpu_reg(s, a->rm);
     } else {
-        if (is_signed) {
-            tcg_gen_ext32s_i64(tcg_op1, cpu_reg(s, rn));
-            tcg_gen_ext32s_i64(tcg_op2, cpu_reg(s, rm));
-        } else {
-            tcg_gen_ext32u_i64(tcg_op1, cpu_reg(s, rn));
-            tcg_gen_ext32u_i64(tcg_op2, cpu_reg(s, rm));
-        }
+        tcg_op1 = tcg_temp_new_i64();
+        tcg_op2 = tcg_temp_new_i64();
+        tcg_gen_ext_i64(tcg_op1, cpu_reg(s, a->rn), mop);
+        tcg_gen_ext_i64(tcg_op2, cpu_reg(s, a->rm), mop);
     }
 
-    if (ra == 31 && !is_sub) {
+    if (a->ra == 31 && !is_sub) {
         /* Special-case MADD with rA == XZR; it is the standard MUL alias */
-        tcg_gen_mul_i64(cpu_reg(s, rd), tcg_op1, tcg_op2);
+        tcg_gen_mul_i64(tcg_rd, tcg_op1, tcg_op2);
     } else {
+        TCGv_i64 tcg_tmp = tcg_temp_new_i64();
+        TCGv_i64 tcg_ra = cpu_reg(s, a->ra);
+
         tcg_gen_mul_i64(tcg_tmp, tcg_op1, tcg_op2);
         if (is_sub) {
-            tcg_gen_sub_i64(cpu_reg(s, rd), cpu_reg(s, ra), tcg_tmp);
+            tcg_gen_sub_i64(tcg_rd, tcg_ra, tcg_tmp);
         } else {
-            tcg_gen_add_i64(cpu_reg(s, rd), cpu_reg(s, ra), tcg_tmp);
+            tcg_gen_add_i64(tcg_rd, tcg_ra, tcg_tmp);
         }
     }
 
     if (!sf) {
-        tcg_gen_ext32u_i64(cpu_reg(s, rd), cpu_reg(s, rd));
+        tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
     }
+    return true;
 }
 
+TRANS(MADD_w, do_muladd, a, false, false, MO_64)
+TRANS(MSUB_w, do_muladd, a, false, true, MO_64)
+TRANS(MADD_x, do_muladd, a, true, false, MO_64)
+TRANS(MSUB_x, do_muladd, a, true, true, MO_64)
+
+TRANS(SMADDL, do_muladd, a, true, false, MO_SL)
+TRANS(SMSUBL, do_muladd, a, true, true, MO_SL)
+TRANS(UMADDL, do_muladd, a, true, false, MO_UL)
+TRANS(UMSUBL, do_muladd, a, true, true, MO_UL)
+
 /* Add/subtract (with carry)
  *  31 30 29 28 27 26 25 24 23 22 21  20  16  15       10  9    5 4   0
  * +--+--+--+------------------------+------+-------------+------+-----+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
         disas_cond_select(s, insn);
         break;
 
-    case 0x8 ... 0xf: /* (3 source) */
-        disas_data_proc_3src(s, insn);
-        break;
-
     default:
     do_unallocated:
     case 0x6: /* Data-processing */
+    case 0x8 ... 0xf: /* (3 source) */
         unallocated_encoding(s);
         break;
     }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes ADC, SBC, ADCS, SBCS.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-16-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  6 +++++
 target/arm/tcg/translate-a64.c | 43 +++++++++++++---------------------
 2 files changed, 22 insertions(+), 27 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ ADDS_ext        . 01 01011001 ..... ... ... ..... .....     @addsub_ext
 SUBS_ext        . 11 01011001 ..... ... ... ..... .....     @addsub_ext
 
 # Add/subtract (carry)
+
+ADC             . 00 11010000 ..... 000000 ..... .....  @rrr_sf
+ADCS            . 01 11010000 ..... 000000 ..... .....  @rrr_sf
+SBC             . 10 11010000 ..... 000000 ..... .....  @rrr_sf
+SBCS            . 11 11010000 ..... 000000 ..... .....  @rrr_sf
+
 # Rotate right into flags
 # Evaluate into flags
 # Conditional compare (regster)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(SMSUBL, do_muladd, a, true, true, MO_SL)
 TRANS(UMADDL, do_muladd, a, true, false, MO_UL)
 TRANS(UMSUBL, do_muladd, a, true, true, MO_UL)
 
-/* Add/subtract (with carry)
- *  31 30 29 28 27 26 25 24 23 22 21  20  16  15       10  9    5 4   0
- * +--+--+--+------------------------+------+-------------+------+-----+
- * |sf|op| S| 1  1  0  1  0  0  0  0 |  rm  | 0 0 0 0 0 0 |  Rn  |  Rd |
- * +--+--+--+------------------------+------+-------------+------+-----+
- */
-
-static void disas_adc_sbc(DisasContext *s, uint32_t insn)
+static bool do_adc_sbc(DisasContext *s, arg_rrr_sf *a,
+                       bool is_sub, bool setflags)
 {
-    unsigned int sf, op, setflags, rm, rn, rd;
     TCGv_i64 tcg_y, tcg_rn, tcg_rd;
 
-    sf = extract32(insn, 31, 1);
-    op = extract32(insn, 30, 1);
-    setflags = extract32(insn, 29, 1);
-    rm = extract32(insn, 16, 5);
-    rn = extract32(insn, 5, 5);
-    rd = extract32(insn, 0, 5);
+    tcg_rd = cpu_reg(s, a->rd);
+    tcg_rn = cpu_reg(s, a->rn);
 
-    tcg_rd = cpu_reg(s, rd);
-    tcg_rn = cpu_reg(s, rn);
-
-    if (op) {
+    if (is_sub) {
         tcg_y = tcg_temp_new_i64();
-        tcg_gen_not_i64(tcg_y, cpu_reg(s, rm));
+        tcg_gen_not_i64(tcg_y, cpu_reg(s, a->rm));
     } else {
-        tcg_y = cpu_reg(s, rm);
+        tcg_y = cpu_reg(s, a->rm);
     }
 
     if (setflags) {
-        gen_adc_CC(sf, tcg_rd, tcg_rn, tcg_y);
+        gen_adc_CC(a->sf, tcg_rd, tcg_rn, tcg_y);
     } else {
-        gen_adc(sf, tcg_rd, tcg_rn, tcg_y);
+        gen_adc(a->sf, tcg_rd, tcg_rn, tcg_y);
     }
+    return true;
 }
 
+TRANS(ADC, do_adc_sbc, a, false, false)
+TRANS(SBC, do_adc_sbc, a, true, false)
+TRANS(ADCS, do_adc_sbc, a, false, true)
+TRANS(SBCS, do_adc_sbc, a, true, true)
+
 /*
  * Rotate right into flags
  *  31 30 29                21       15          10      5  4      0
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
     switch (op2) {
     case 0x0:
         switch (op3) {
-        case 0x00: /* Add/subtract (with carry) */
-            disas_adc_sbc(s, insn);
-            break;
-
         case 0x01: /* Rotate right into flags */
         case 0x21:
             disas_rotate_right_into_flags(s, insn);
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
             break;
 
         default:
+        case 0x00: /* Add/subtract (with carry) */
             goto do_unallocated;
         }
         break;
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-17-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  3 +++
 target/arm/tcg/translate-a64.c | 32 +++++++++-----------------------
 2 files changed, 12 insertions(+), 23 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SBC             . 10 11010000 ..... 000000 ..... .....  @rrr_sf
 SBCS            . 11 11010000 ..... 000000 ..... .....  @rrr_sf
 
 # Rotate right into flags
+
+RMIF            1 01 11010000 imm:6 00001 rn:5 0 mask:4
+
 # Evaluate into flags
 # Conditional compare (regster)
 # Conditional compare (immediate)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(SBC, do_adc_sbc, a, true, false)
 TRANS(ADCS, do_adc_sbc, a, false, true)
 TRANS(SBCS, do_adc_sbc, a, true, true)
 
-/*
- * Rotate right into flags
- *  31 30 29                21       15          10      5  4      0
- * +--+--+--+-----------------+--------+-----------+------+--+------+
- * |sf|op| S| 1 1 0 1 0 0 0 0 |  imm6  | 0 0 0 0 1 |  Rn  |o2| mask |
- * +--+--+--+-----------------+--------+-----------+------+--+------+
- */
-static void disas_rotate_right_into_flags(DisasContext *s, uint32_t insn)
+static bool trans_RMIF(DisasContext *s, arg_RMIF *a)
 {
-    int mask = extract32(insn, 0, 4);
-    int o2 = extract32(insn, 4, 1);
-    int rn = extract32(insn, 5, 5);
-    int imm6 = extract32(insn, 15, 6);
-    int sf_op_s = extract32(insn, 29, 3);
+    int mask = a->mask;
     TCGv_i64 tcg_rn;
     TCGv_i32 nzcv;
 
-    if (sf_op_s != 5 || o2 != 0 || !dc_isar_feature(aa64_condm_4, s)) {
-        unallocated_encoding(s);
-        return;
+    if (!dc_isar_feature(aa64_condm_4, s)) {
+        return false;
     }
 
-    tcg_rn = read_cpu_reg(s, rn, 1);
-    tcg_gen_rotri_i64(tcg_rn, tcg_rn, imm6);
+    tcg_rn = read_cpu_reg(s, a->rn, 1);
+    tcg_gen_rotri_i64(tcg_rn, tcg_rn, a->imm);
 
     nzcv = tcg_temp_new_i32();
     tcg_gen_extrl_i64_i32(nzcv, tcg_rn);
@@ -XXX,XX +XXX,XX @@ static void disas_rotate_right_into_flags(DisasContext *s, uint32_t insn)
     if (mask & 1) { /* V */
         tcg_gen_shli_i32(cpu_VF, nzcv, 31 - 0);
     }
+    return true;
 }
 
 /*
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
     switch (op2) {
     case 0x0:
         switch (op3) {
-        case 0x01: /* Rotate right into flags */
-        case 0x21:
-            disas_rotate_right_into_flags(s, insn);
-            break;
-
         case 0x02: /* Evaluate into flags */
         case 0x12:
         case 0x22:
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
 
         default:
         case 0x00: /* Add/subtract (with carry) */
+        case 0x01: /* Rotate right into flags */
+        case 0x21:
             goto do_unallocated;
         }
         break;
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-18-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  4 +++
 target/arm/tcg/translate-a64.c | 48 +++++-----------------------------
 2 files changed, 11 insertions(+), 41 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SBCS            . 11 11010000 ..... 000000 ..... .....  @rrr_sf
 RMIF            1 01 11010000 imm:6 00001 rn:5 0 mask:4
 
 # Evaluate into flags
+
+SETF8           0 01 11010000 00000 000010 rn:5 01101
+SETF16          0 01 11010000 00000 010010 rn:5 01101
+
 # Conditional compare (regster)
 # Conditional compare (immediate)
 # Conditional select
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_RMIF(DisasContext *s, arg_RMIF *a)
     return true;
 }
 
-/*
- * Evaluate into flags
- *  31 30 29                21        15   14        10      5  4      0
- * +--+--+--+-----------------+---------+----+---------+------+--+------+
- * |sf|op| S| 1 1 0 1 0 0 0 0 | opcode2 | sz | 0 0 1 0 |  Rn  |o3| mask |
- * +--+--+--+-----------------+---------+----+---------+------+--+------+
- */
-static void disas_evaluate_into_flags(DisasContext *s, uint32_t insn)
+static bool do_setf(DisasContext *s, int rn, int shift)
 {
-    int o3_mask = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int o2 = extract32(insn, 15, 6);
-    int sz = extract32(insn, 14, 1);
-    int sf_op_s = extract32(insn, 29, 3);
-    TCGv_i32 tmp;
-    int shift;
+    TCGv_i32 tmp = tcg_temp_new_i32();
 
-    if (sf_op_s != 1 || o2 != 0 || o3_mask != 0xd ||
-        !dc_isar_feature(aa64_condm_4, s)) {
-        unallocated_encoding(s);
-        return;
-    }
-    shift = sz ? 16 : 24;  /* SETF16 or SETF8 */
-
-    tmp = tcg_temp_new_i32();
     tcg_gen_extrl_i64_i32(tmp, cpu_reg(s, rn));
     tcg_gen_shli_i32(cpu_NF, tmp, shift);
     tcg_gen_shli_i32(cpu_VF, tmp, shift - 1);
     tcg_gen_mov_i32(cpu_ZF, cpu_NF);
     tcg_gen_xor_i32(cpu_VF, cpu_VF, cpu_NF);
+    return true;
 }
 
+TRANS_FEAT(SETF8, aa64_condm_4, do_setf, a->rn, 24)
+TRANS_FEAT(SETF16, aa64_condm_4, do_setf, a->rn, 16)
+
 /* Conditional compare (immediate / register)
  *  31 30 29 28 27 26 25 24 23 22 21  20    16 15  12  11  10  9   5  4 3   0
  * +--+--+--+------------------------+--------+------+----+--+------+--+-----+
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
 {
     int op1 = extract32(insn, 28, 1);
     int op2 = extract32(insn, 21, 4);
-    int op3 = extract32(insn, 10, 6);
 
     if (!op1) {
         goto do_unallocated;
     }
 
     switch (op2) {
-    case 0x0:
-        switch (op3) {
-        case 0x02: /* Evaluate into flags */
-        case 0x12:
-        case 0x22:
-        case 0x32:
-            disas_evaluate_into_flags(s, insn);
-            break;
-
-        default:
-        case 0x00: /* Add/subtract (with carry) */
-        case 0x01: /* Rotate right into flags */
-        case 0x21:
-            goto do_unallocated;
-        }
-        break;
-
     case 0x2: /* Conditional compare */
         disas_cc(s, insn); /* both imm and reg forms */
         break;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
 
     default:
     do_unallocated:
+    case 0x0:
     case 0x6: /* Data-processing */
     case 0x8 ... 0xf: /* (3 source) */
         unallocated_encoding(s);
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-19-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  6 ++--
 target/arm/tcg/translate-a64.c | 66 +++++++++++-----------------------
 2 files changed, 25 insertions(+), 47 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ RMIF            1 01 11010000 imm:6 00001 rn:5 0 mask:4
 SETF8           0 01 11010000 00000 000010 rn:5 01101
 SETF16          0 01 11010000 00000 010010 rn:5 01101
 
-# Conditional compare (regster)
-# Conditional compare (immediate)
+# Conditional compare
+
+CCMP            sf:1 op:1 1 11010010 y:5 cond:4 imm:1 0 rn:5 0 nzcv:4
+
 # Conditional select
 # Data Processing (3-source)
 
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_setf(DisasContext *s, int rn, int shift)
 TRANS_FEAT(SETF8, aa64_condm_4, do_setf, a->rn, 24)
 TRANS_FEAT(SETF16, aa64_condm_4, do_setf, a->rn, 16)
 
-/* Conditional compare (immediate / register)
- *  31 30 29 28 27 26 25 24 23 22 21  20    16 15  12  11  10  9   5  4 3   0
- * +--+--+--+------------------------+--------+------+----+--+------+--+-----+
- * |sf|op| S| 1  1  0  1  0  0  1  0 |imm5/rm | cond |i/r |o2|  Rn  |o3|nzcv |
- * +--+--+--+------------------------+--------+------+----+--+------+--+-----+
- *        [1]                             y                [0]       [0]
- */
-static void disas_cc(DisasContext *s, uint32_t insn)
+/* CCMP, CCMN */
+static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
 {
-    unsigned int sf, op, y, cond, rn, nzcv, is_imm;
-    TCGv_i32 tcg_t0, tcg_t1, tcg_t2;
-    TCGv_i64 tcg_tmp, tcg_y, tcg_rn;
+    TCGv_i32 tcg_t0 = tcg_temp_new_i32();
+    TCGv_i32 tcg_t1 = tcg_temp_new_i32();
+    TCGv_i32 tcg_t2 = tcg_temp_new_i32();
+    TCGv_i64 tcg_tmp = tcg_temp_new_i64();
+    TCGv_i64 tcg_rn, tcg_y;
     DisasCompare c;
-
-    if (!extract32(insn, 29, 1)) {
-        unallocated_encoding(s);
-        return;
-    }
-    if (insn & (1 << 10 | 1 << 4)) {
-        unallocated_encoding(s);
-        return;
-    }
-    sf = extract32(insn, 31, 1);
-    op = extract32(insn, 30, 1);
-    is_imm = extract32(insn, 11, 1);
-    y = extract32(insn, 16, 5); /* y = rm (reg) or imm5 (imm) */
-    cond = extract32(insn, 12, 4);
-    rn = extract32(insn, 5, 5);
-    nzcv = extract32(insn, 0, 4);
+    unsigned nzcv;
 
     /* Set T0 = !COND.  */
-    tcg_t0 = tcg_temp_new_i32();
-    arm_test_cc(&c, cond);
+    arm_test_cc(&c, a->cond);
     tcg_gen_setcondi_i32(tcg_invert_cond(c.cond), tcg_t0, c.value, 0);
 
     /* Load the arguments for the new comparison.  */
-    if (is_imm) {
-        tcg_y = tcg_temp_new_i64();
-        tcg_gen_movi_i64(tcg_y, y);
+    if (a->imm) {
+        tcg_y = tcg_constant_i64(a->y);
     } else {
-        tcg_y = cpu_reg(s, y);
+        tcg_y = cpu_reg(s, a->y);
     }
-    tcg_rn = cpu_reg(s, rn);
+    tcg_rn = cpu_reg(s, a->rn);
 
     /* Set the flags for the new comparison.  */
-    tcg_tmp = tcg_temp_new_i64();
-    if (op) {
-        gen_sub_CC(sf, tcg_tmp, tcg_rn, tcg_y);
+    if (a->op) {
+        gen_sub_CC(a->sf, tcg_tmp, tcg_rn, tcg_y);
     } else {
-        gen_add_CC(sf, tcg_tmp, tcg_rn, tcg_y);
+        gen_add_CC(a->sf, tcg_tmp, tcg_rn, tcg_y);
     }
 
-    /* If COND was false, force the flags to #nzcv.  Compute two masks
+    /*
+     * If COND was false, force the flags to #nzcv.  Compute two masks
      * to help with this: T1 = (COND ? 0 : -1), T2 = (COND ? -1 : 0).
      * For tcg hosts that support ANDC, we can make do with just T1.
      * In either case, allow the tcg optimizer to delete any unused mask.
      */
-    tcg_t1 = tcg_temp_new_i32();
-    tcg_t2 = tcg_temp_new_i32();
     tcg_gen_neg_i32(tcg_t1, tcg_t0);
     tcg_gen_subi_i32(tcg_t2, tcg_t0, 1);
 
+    nzcv = a->nzcv;
     if (nzcv & 8) { /* N */
         tcg_gen_or_i32(cpu_NF, cpu_NF, tcg_t1);
     } else {
@@ -XXX,XX +XXX,XX @@ static void disas_cc(DisasContext *s, uint32_t insn)
             tcg_gen_and_i32(cpu_VF, cpu_VF, tcg_t2);
         }
     }
+    return true;
 }
 
 /* Conditional select
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
     }
 
     switch (op2) {
-    case 0x2: /* Conditional compare */
-        disas_cc(s, insn); /* both imm and reg forms */
-        break;
-
     case 0x4: /* Conditional select */
         disas_cond_select(s, insn);
         break;
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
     default:
     do_unallocated:
     case 0x0:
+    case 0x2: /* Conditional compare */
     case 0x6: /* Data-processing */
     case 0x8 ... 0xf: /* (3 source) */
         unallocated_encoding(s);
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes CSEL, CSINC, CSINV, CSNEG.  Remove disas_data_proc_reg,
as these were the last insns decoded by that function.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-20-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  3 ++
 target/arm/tcg/translate-a64.c | 84 ++++++----------------------------
 2 files changed, 17 insertions(+), 70 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SETF16          0 01 11010000 00000 010010 rn:5 01101
 CCMP            sf:1 op:1 1 11010010 y:5 cond:4 imm:1 0 rn:5 0 nzcv:4
 
 # Conditional select
+
+CSEL            sf:1 else_inv:1 011010100 rm:5 cond:4 0 else_inc:1 rn:5 rd:5
+
 # Data Processing (3-source)
 
 &rrrr           rd rn rm ra
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
     return true;
 }
 
-/* Conditional select
- *   31   30  29  28             21 20  16 15  12 11 10 9    5 4    0
- * +----+----+---+-----------------+------+------+-----+------+------+
- * | sf | op | S | 1 1 0 1 0 1 0 0 |  Rm  | cond | op2 |  Rn  |  Rd  |
- * +----+----+---+-----------------+------+------+-----+------+------+
- */
-static void disas_cond_select(DisasContext *s, uint32_t insn)
+static bool trans_CSEL(DisasContext *s, arg_CSEL *a)
 {
-    unsigned int sf, else_inv, rm, cond, else_inc, rn, rd;
-    TCGv_i64 tcg_rd, zero;
+    TCGv_i64 tcg_rd = cpu_reg(s, a->rd);
+    TCGv_i64 zero = tcg_constant_i64(0);
     DisasCompare64 c;
 
-    if (extract32(insn, 29, 1) || extract32(insn, 11, 1)) {
-        /* S == 1 or op2<1> == 1 */
-        unallocated_encoding(s);
-        return;
-    }
-    sf = extract32(insn, 31, 1);
-    else_inv = extract32(insn, 30, 1);
-    rm = extract32(insn, 16, 5);
-    cond = extract32(insn, 12, 4);
-    else_inc = extract32(insn, 10, 1);
-    rn = extract32(insn, 5, 5);
-    rd = extract32(insn, 0, 5);
+    a64_test_cc(&c, a->cond);
 
-    tcg_rd = cpu_reg(s, rd);
-
-    a64_test_cc(&c, cond);
-    zero = tcg_constant_i64(0);
-
-    if (rn == 31 && rm == 31 && (else_inc ^ else_inv)) {
+    if (a->rn == 31 && a->rm == 31 && (a->else_inc ^ a->else_inv)) {
         /* CSET & CSETM.  */
-        if (else_inv) {
+        if (a->else_inv) {
             tcg_gen_negsetcond_i64(tcg_invert_cond(c.cond),
                                    tcg_rd, c.value, zero);
         } else {
@@ -XXX,XX +XXX,XX @@ static void disas_cond_select(DisasContext *s, uint32_t insn)
                                 tcg_rd, c.value, zero);
         }
     } else {
-        TCGv_i64 t_true = cpu_reg(s, rn);
-        TCGv_i64 t_false = read_cpu_reg(s, rm, 1);
-        if (else_inv && else_inc) {
+        TCGv_i64 t_true = cpu_reg(s, a->rn);
+        TCGv_i64 t_false = read_cpu_reg(s, a->rm, 1);
+
+        if (a->else_inv && a->else_inc) {
             tcg_gen_neg_i64(t_false, t_false);
-        } else if (else_inv) {
+        } else if (a->else_inv) {
             tcg_gen_not_i64(t_false, t_false);
-        } else if (else_inc) {
+        } else if (a->else_inc) {
             tcg_gen_addi_i64(t_false, t_false, 1);
         }
         tcg_gen_movcond_i64(c.cond, tcg_rd, c.value, zero, t_true, t_false);
     }
 
-    if (!sf) {
+    if (!a->sf) {
         tcg_gen_ext32u_i64(tcg_rd, tcg_rd);
     }
-}
-
-/*
- * Data processing - register
- *  31  30 29  28      25    21  20  16      10         0
- * +--+---+--+---+-------+-----+-------+-------+---------+
- * |  |op0|  |op1| 1 0 1 | op2 |       |  op3  |         |
- * +--+---+--+---+-------+-----+-------+-------+---------+
- */
-static void disas_data_proc_reg(DisasContext *s, uint32_t insn)
-{
-    int op1 = extract32(insn, 28, 1);
-    int op2 = extract32(insn, 21, 4);
-
-    if (!op1) {
-        goto do_unallocated;
-    }
-
-    switch (op2) {
-    case 0x4: /* Conditional select */
-        disas_cond_select(s, insn);
-        break;
-
-    default:
-    do_unallocated:
-    case 0x0:
-    case 0x2: /* Conditional compare */
-    case 0x6: /* Data-processing */
-    case 0x8 ... 0xf: /* (3 source) */
-        unallocated_encoding(s);
-        break;
-    }
+    return true;
 }
 
 static void handle_fp_compare(DisasContext *s, int size,
@@ -XXX,XX +XXX,XX @@ static bool btype_destination_ok(uint32_t insn, bool bt, int btype)
 static void disas_a64_legacy(DisasContext *s, uint32_t insn)
 {
     switch (extract32(insn, 25, 4)) {
-    case 0x5:
-    case 0xd:      /* Data processing - register */
-        disas_data_proc_reg(s, insn);
-        break;
     case 0x7:
     case 0xf:      /* Data processing - SIMD and floating point */
         disas_data_proc_simd_fp(s, insn);
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Provide a simple way to check for float64, float32,
and float16 support, as well as the fpu enabled.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-21-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate-a64.c | 62 ++++++++++++++++++----------------
 1 file changed, 32 insertions(+), 30 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Provide a simple way to check for float64, float32, and float16
support vs vector width, as well as the fpu enabled.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-22-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate-a64.c | 135 +++++++++++++--------------------
 1 file changed, 54 insertions(+), 81 deletions(-)

diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static int fp_access_check_scalar_hsd(DisasContext *s, MemOp esz)
     return fp_access_check(s);
 }
 
+/* Likewise, but vector MO_64 must have two elements. */
+static int fp_access_check_vector_hsd(DisasContext *s, bool is_q, MemOp esz)
+{
+    switch (esz) {
+    case MO_64:
+        if (!is_q) {
+            return -1;
+        }
+        break;
+    case MO_32:
+        break;
+    case MO_16:
+        if (!dc_isar_feature(aa64_fp16, s)) {
+            return -1;
+        }
+        break;
+    default:
+        return -1;
+    }
+    return fp_access_check(s);
+}
+
 /*
  * Check that SVE access is enabled.  If it is, return true.
  * If not, emit code to generate an appropriate exception and return false.
@@ -XXX,XX +XXX,XX @@ static bool do_fp3_vector(DisasContext *s, arg_qrrr_e *a, int data,
                           gen_helper_gvec_3_ptr * const fns[3])
 {
     MemOp esz = a->esz;
+    int check = fp_access_check_vector_hsd(s, a->q, esz);
 
-    switch (esz) {
-    case MO_64:
-        if (!a->q) {
-            return false;
-        }
-        break;
-    case MO_32:
-        break;
-    case MO_16:
-        if (!dc_isar_feature(aa64_fp16, s)) {
-            return false;
-        }
-        break;
-    default:
-        return false;
-    }
-    if (fp_access_check(s)) {
-        gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
-                          esz == MO_16, data, fns[esz - 1]);
+    if (check <= 0) {
+        return check == 0;
     }
+
+    gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
+                      esz == MO_16, data, fns[esz - 1]);
     return true;
 }
 
@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FCADD_270, aa64_fcma, do_fp3_vector, a, 1, f_vector_fcadd)
 
 static bool trans_FCMLA_v(DisasContext *s, arg_FCMLA_v *a)
 {
-    gen_helper_gvec_4_ptr *fn;
+    static gen_helper_gvec_4_ptr * const fn[] = {
+        [MO_16] = gen_helper_gvec_fcmlah,
+        [MO_32] = gen_helper_gvec_fcmlas,
+        [MO_64] = gen_helper_gvec_fcmlad,
+    };
+    int check;
 
     if (!dc_isar_feature(aa64_fcma, s)) {
         return false;
     }
-    switch (a->esz) {
-    case MO_64:
-        if (!a->q) {
-            return false;
-        }
-        fn = gen_helper_gvec_fcmlad;
-        break;
-    case MO_32:
-        fn = gen_helper_gvec_fcmlas;
-        break;
-    case MO_16:
-        if (!dc_isar_feature(aa64_fp16, s)) {
-            return false;
-        }
-        fn = gen_helper_gvec_fcmlah;
-        break;
-    default:
-        return false;
-    }
-    if (fp_access_check(s)) {
-        gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
-                          a->esz == MO_16, a->rot, fn);
+
+    check = fp_access_check_vector_hsd(s, a->q, a->esz);
+    if (check <= 0) {
+        return check == 0;
     }
+
+    gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
+                      a->esz == MO_16, a->rot, fn[a->esz]);
     return true;
 }
 
@@ -XXX,XX +XXX,XX @@ static bool do_fp3_vector_idx(DisasContext *s, arg_qrrx_e *a,
                               gen_helper_gvec_3_ptr * const fns[3])
 {
     MemOp esz = a->esz;
+    int check = fp_access_check_vector_hsd(s, a->q, esz);
 
-    switch (esz) {
-    case MO_64:
-        if (!a->q) {
-            return false;
-        }
-        break;
-    case MO_32:
-        break;
-    case MO_16:
-        if (!dc_isar_feature(aa64_fp16, s)) {
-            return false;
-        }
-        break;
-    default:
-        g_assert_not_reached();
-    }
-    if (fp_access_check(s)) {
-        gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
-                          esz == MO_16, a->idx, fns[esz - 1]);
+    if (check <= 0) {
+        return check == 0;
     }
+
+    gen_gvec_op3_fpst(s, a->q, a->rd, a->rn, a->rm,
+                      esz == MO_16, a->idx, fns[esz - 1]);
     return true;
 }
 
@@ -XXX,XX +XXX,XX @@ static bool do_fmla_vector_idx(DisasContext *s, arg_qrrx_e *a, bool neg)
         gen_helper_gvec_fmla_idx_d,
     };
     MemOp esz = a->esz;
+    int check = fp_access_check_vector_hsd(s, a->q, esz);
 
-    switch (esz) {
-    case MO_64:
-        if (!a->q) {
-            return false;
-        }
-        break;
-    case MO_32:
-        break;
-    case MO_16:
-        if (!dc_isar_feature(aa64_fp16, s)) {
-            return false;
-        }
-        break;
-    default:
-        g_assert_not_reached();
-    }
-    if (fp_access_check(s)) {
-        gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
-                          esz == MO_16, (a->idx << 1) | neg,
-                          fns[esz - 1]);
+    if (check <= 0) {
+        return check == 0;
     }
+
+    gen_gvec_op4_fpst(s, a->q, a->rd, a->rn, a->rm, a->rd,
+                      esz == MO_16, (a->idx << 1) | neg,
+                      fns[esz - 1]);
     return true;
 }
 
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-23-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   8 +
 target/arm/tcg/translate-a64.c | 283 ++++++++++++---------------------
 2 files changed, 112 insertions(+), 179 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

These opcodes are only supported as vector operations,
not as advsimd scalar.  Set only_in_vector, and remove
the unreachable implementation of scalar fneg.

Reported-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20241211163036.2297116-24-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate-a64.c | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
         break;
     case 0x2f: /* FABS */
     case 0x6f: /* FNEG */
+        only_in_vector = true;
         need_fpst = false;
         break;
     case 0x7d: /* FRSQRTE */
+        break;
     case 0x7f: /* FSQRT (vector) */
+        only_in_vector = true;
         break;
     default:
         unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
         case 0x7b: /* FCVTZU */
             gen_helper_advsimd_f16touinth(tcg_res, tcg_op, tcg_fpstatus);
             break;
-        case 0x6f: /* FNEG */
-            tcg_gen_xori_i32(tcg_res, tcg_op, 0x8000);
-            break;
         case 0x7d: /* FRSQRTE */
             gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
             break;
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-25-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   7 +++
 target/arm/tcg/translate-a64.c | 105 +++++++++++++++++++++++----------
 2 files changed, 81 insertions(+), 31 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 @rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
 @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
 @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
+@rr_hsd         ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_hsd
 
 @rrr_b          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=0
 @rrr_h          ........ ... rm:5 ...... rn:5 rd:5      &rrr_e esz=1
@@ -XXX,XX +XXX,XX @@ FMAXV_s         0110 1110 00 11000 01111 10 ..... .....     @rr_q1e2
 FMINV_h         0.00 1110 10 11000 01111 10 ..... .....     @qrr_h
 FMINV_s         0110 1110 10 11000 01111 10 ..... .....     @rr_q1e2
 
+# Floating-point data processing (1 source)
+
+FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
+FABS_s          00011110 .. 1 000001 10000 ..... .....      @rr_hsd
+FNEG_s          00011110 .. 1 000010 10000 ..... .....      @rr_hsd
+
 # Floating-point Immediate
 
 FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_CSEL(DisasContext *s, arg_CSEL *a)
     return true;
 }
 
+typedef struct FPScalar1Int {
+    void (*gen_h)(TCGv_i32, TCGv_i32);
+    void (*gen_s)(TCGv_i32, TCGv_i32);
+    void (*gen_d)(TCGv_i64, TCGv_i64);
+} FPScalar1Int;
+
+static bool do_fp1_scalar_int(DisasContext *s, arg_rr_e *a,
+                              const FPScalar1Int *f)
+{
+    switch (a->esz) {
+    case MO_64:
+        if (fp_access_check(s)) {
+            TCGv_i64 t = read_fp_dreg(s, a->rn);
+            f->gen_d(t, t);
+            write_fp_dreg(s, a->rd, t);
+        }
+        break;
+    case MO_32:
+        if (fp_access_check(s)) {
+            TCGv_i32 t = read_fp_sreg(s, a->rn);
+            f->gen_s(t, t);
+            write_fp_sreg(s, a->rd, t);
+        }
+        break;
+    case MO_16:
+        if (!dc_isar_feature(aa64_fp16, s)) {
+            return false;
+        }
+        if (fp_access_check(s)) {
+            TCGv_i32 t = read_fp_hreg(s, a->rn);
+            f->gen_h(t, t);
+            write_fp_sreg(s, a->rd, t);
+        }
+        break;
+    default:
+        return false;
+    }
+    return true;
+}
+
+static const FPScalar1Int f_scalar_fmov = {
+    tcg_gen_mov_i32,
+    tcg_gen_mov_i32,
+    tcg_gen_mov_i64,
+};
+TRANS(FMOV_s, do_fp1_scalar_int, a, &f_scalar_fmov)
+
+static const FPScalar1Int f_scalar_fabs = {
+    gen_vfp_absh,
+    gen_vfp_abss,
+    gen_vfp_absd,
+};
+TRANS(FABS_s, do_fp1_scalar_int, a, &f_scalar_fabs)
+
+static const FPScalar1Int f_scalar_fneg = {
+    gen_vfp_negh,
+    gen_vfp_negs,
+    gen_vfp_negd,
+};
+TRANS(FNEG_s, do_fp1_scalar_int, a, &f_scalar_fneg)
+
 /* Floating-point data-processing (1 source) - half precision */
 static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
 {
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
     TCGv_i32 tcg_res = tcg_temp_new_i32();
 
     switch (opcode) {
-    case 0x0: /* FMOV */
-        tcg_gen_mov_i32(tcg_res, tcg_op);
-        break;
-    case 0x1: /* FABS */
-        gen_vfp_absh(tcg_res, tcg_op);
-        break;
-    case 0x2: /* FNEG */
-        gen_vfp_negh(tcg_res, tcg_op);
-        break;
     case 0x3: /* FSQRT */
         fpst = fpstatus_ptr(FPST_FPCR_F16);
         gen_helper_sqrt_f16(tcg_res, tcg_op, fpst);
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
         gen_helper_advsimd_rinth(tcg_res, tcg_op, fpst);
         break;
     default:
+    case 0x0: /* FMOV */
+    case 0x1: /* FABS */
+    case 0x2: /* FNEG */
         g_assert_not_reached();
     }
 
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
     tcg_res = tcg_temp_new_i32();
 
     switch (opcode) {
-    case 0x0: /* FMOV */
-        tcg_gen_mov_i32(tcg_res, tcg_op);
-        goto done;
-    case 0x1: /* FABS */
-        gen_vfp_abss(tcg_res, tcg_op);
-        goto done;
-    case 0x2: /* FNEG */
-        gen_vfp_negs(tcg_res, tcg_op);
-        goto done;
     case 0x3: /* FSQRT */
         gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_env);
         goto done;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
         gen_fpst = gen_helper_frint64_s;
         break;
     default:
+    case 0x0: /* FMOV */
+    case 0x1: /* FABS */
+    case 0x2: /* FNEG */
         g_assert_not_reached();
     }
 
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
     TCGv_ptr fpst;
     int rmode = -1;
 
-    switch (opcode) {
-    case 0x0: /* FMOV */
-        gen_gvec_fn2(s, false, rd, rn, tcg_gen_gvec_mov, 0);
-        return;
-    }
-
     tcg_op = read_fp_dreg(s, rn);
     tcg_res = tcg_temp_new_i64();
 
     switch (opcode) {
-    case 0x1: /* FABS */
-        gen_vfp_absd(tcg_res, tcg_op);
-        goto done;
-    case 0x2: /* FNEG */
-        gen_vfp_negd(tcg_res, tcg_op);
-        goto done;
     case 0x3: /* FSQRT */
         gen_helper_vfp_sqrtd(tcg_res, tcg_op, tcg_env);
         goto done;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
         gen_fpst = gen_helper_frint64_d;
         break;
     default:
+    case 0x0: /* FMOV */
+    case 0x1: /* FABS */
+    case 0x2: /* FNEG */
         g_assert_not_reached();
     }
 
@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
             goto do_unallocated;
         }
         /* fall through */
-    case 0x0 ... 0x3:
+    case 0x3:
     case 0x8 ... 0xc:
     case 0xe ... 0xf:
         /* 32-to-32 and 64-to-64 ops */
@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
 
     default:
     do_unallocated:
+    case 0x0: /* FMOV */
+    case 0x1: /* FABS */
+    case 0x2: /* FNEG */
         unallocated_encoding(s);
         break;
     }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Pass fpstatus not env, like most other fp helpers.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-26-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h            |  6 +++---
 target/arm/tcg/translate-a64.c | 15 +++++++--------
 target/arm/tcg/translate-vfp.c |  6 +++---
 target/arm/vfp_helper.c        | 12 ++++++------
 4 files changed, 19 insertions(+), 20 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
 DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
-DEF_HELPER_2(vfp_sqrth, f16, f16, env)
-DEF_HELPER_2(vfp_sqrts, f32, f32, env)
-DEF_HELPER_2(vfp_sqrtd, f64, f64, env)
+DEF_HELPER_2(vfp_sqrth, f16, f16, ptr)
+DEF_HELPER_2(vfp_sqrts, f32, f32, ptr)
+DEF_HELPER_2(vfp_sqrtd, f64, f64, ptr)
 DEF_HELPER_3(vfp_cmph, void, f16, f16, env)
 DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
 DEF_HELPER_3(vfp_cmpd, void, f64, f64, env)
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
 
     switch (opcode) {
     case 0x3: /* FSQRT */
-        gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_env);
-        goto done;
+        gen_fpst = gen_helper_vfp_sqrts;
+        break;
     case 0x6: /* BFCVT */
         gen_fpst = gen_helper_bfcvt;
         break;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
         gen_fpst(tcg_res, tcg_op, fpst);
     }
 
- done:
     write_fp_sreg(s, rd, tcg_res);
 }
 
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
 
     switch (opcode) {
     case 0x3: /* FSQRT */
-        gen_helper_vfp_sqrtd(tcg_res, tcg_op, tcg_env);
-        goto done;
+        gen_fpst = gen_helper_vfp_sqrtd;
+        break;
     case 0x8: /* FRINTN */
     case 0x9: /* FRINTP */
     case 0xa: /* FRINTM */
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_double(DisasContext *s, int opcode, int rd, int rn)
         gen_fpst(tcg_res, tcg_op, fpst);
     }
 
- done:
     write_fp_dreg(s, rd, tcg_res);
 }
 
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
         gen_vfp_negd(tcg_rd, tcg_rn);
         break;
     case 0x7f: /* FSQRT */
-        gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_env);
+        gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_fpstatus);
         break;
     case 0x1a: /* FCVTNS */
     case 0x1b: /* FCVTMS */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
             return;
         case 0x7f: /* FSQRT */
+            need_fpstatus = true;
             if (size == 3 && !is_q) {
                 unallocated_encoding(s);
                 return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                     gen_vfp_negs(tcg_res, tcg_op);
                     break;
                 case 0x7f: /* FSQRT */
-                    gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_env);
+                    gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_fpstatus);
                     break;
                 case 0x1a: /* FCVTNS */
                 case 0x1b: /* FCVTMS */
diff --git a/target/arm/tcg/translate-vfp.c b/target/arm/tcg/translate-vfp.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-vfp.c
+++ b/target/arm/tcg/translate-vfp.c
@@ -XXX,XX +XXX,XX @@ DO_VFP_2OP(VNEG, dp, gen_vfp_negd, aa32_fpdp_v2)
 
 static void gen_VSQRT_hp(TCGv_i32 vd, TCGv_i32 vm)
 {
-    gen_helper_vfp_sqrth(vd, vm, tcg_env);
+    gen_helper_vfp_sqrth(vd, vm, fpstatus_ptr(FPST_FPCR_F16));
 }
 
 static void gen_VSQRT_sp(TCGv_i32 vd, TCGv_i32 vm)
 {
-    gen_helper_vfp_sqrts(vd, vm, tcg_env);
+    gen_helper_vfp_sqrts(vd, vm, fpstatus_ptr(FPST_FPCR));
 }
 
 static void gen_VSQRT_dp(TCGv_i64 vd, TCGv_i64 vm)
 {
-    gen_helper_vfp_sqrtd(vd, vm, tcg_env);
+    gen_helper_vfp_sqrtd(vd, vm, fpstatus_ptr(FPST_FPCR));
 }
 
 DO_VFP_2OP(VSQRT, hp, gen_VSQRT_hp, aa32_fp16_arith)
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ VFP_BINOP(minnum)
 VFP_BINOP(maxnum)
 #undef VFP_BINOP
 
-dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, CPUARMState *env)
+dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, void *fpstp)
 {
-    return float16_sqrt(a, &env->vfp.fp_status_f16);
+    return float16_sqrt(a, fpstp);
 }
 
-float32 VFP_HELPER(sqrt, s)(float32 a, CPUARMState *env)
+float32 VFP_HELPER(sqrt, s)(float32 a, void *fpstp)
 {
-    return float32_sqrt(a, &env->vfp.fp_status);
+    return float32_sqrt(a, fpstp);
 }
 
-float64 VFP_HELPER(sqrt, d)(float64 a, CPUARMState *env)
+float64 VFP_HELPER(sqrt, d)(float64 a, void *fpstp)
 {
-    return float64_sqrt(a, &env->vfp.fp_status);
+    return float64_sqrt(a, fpstp);
 }
 
 static void softfloat_to_vfp_compare(CPUARMState *env, FloatRelation cmp)
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This function is identical with helper_vfp_sqrth.
Replace all uses.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-27-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/helper-a64.h    |  1 -
 target/arm/tcg/helper-a64.c    | 11 -----------
 target/arm/tcg/translate-a64.c |  4 ++--
 3 files changed, 2 insertions(+), 14 deletions(-)

diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.h
+++ b/target/arm/tcg/helper-a64.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(advsimd_rinth_exact, f16, f16, ptr)
 DEF_HELPER_2(advsimd_rinth, f16, f16, ptr)
 DEF_HELPER_2(advsimd_f16tosinth, i32, f16, ptr)
 DEF_HELPER_2(advsimd_f16touinth, i32, f16, ptr)
-DEF_HELPER_2(sqrt_f16, f16, f16, ptr)
 
 DEF_HELPER_2(exception_return, void, env, i64)
 DEF_HELPER_FLAGS_2(dc_zva, TCG_CALL_NO_WG, void, env, i64)
diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.c
+++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ illegal_return:
                   "resuming execution at 0x%" PRIx64 "\n", cur_el, env->pc);
 }
 
-/*
- * Square Root and Reciprocal square root
- */
-
-uint32_t HELPER(sqrt_f16)(uint32_t a, void *fpstp)
-{
-    float_status *s = fpstp;
-
-    return float16_sqrt(a, s);
-}
-
 void HELPER(dc_zva)(CPUARMState *env, uint64_t vaddr_in)
 {
     uintptr_t ra = GETPC();
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_half(DisasContext *s, int opcode, int rd, int rn)
     switch (opcode) {
     case 0x3: /* FSQRT */
         fpst = fpstatus_ptr(FPST_FPCR_F16);
-        gen_helper_sqrt_f16(tcg_res, tcg_op, fpst);
+        gen_helper_vfp_sqrth(tcg_res, tcg_op, fpst);
         break;
     case 0x8: /* FRINTN */
     case 0x9: /* FRINTP */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
                 break;
             case 0x7f: /* FSQRT */
-                gen_helper_sqrt_f16(tcg_res, tcg_op, tcg_fpstatus);
+                gen_helper_vfp_sqrth(tcg_res, tcg_op, tcg_fpstatus);
                 break;
             default:
                 g_assert_not_reached();
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-28-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  1 +
 target/arm/tcg/translate-a64.c | 72 ++++++++++++++++++++++++++++------
 2 files changed, 62 insertions(+), 11 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_fp_1src_half as these were the last insns
decoded by that function.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-29-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   8 +++
 target/arm/tcg/translate-a64.c | 117 +++++++++++----------------------
 2 files changed, 46 insertions(+), 79 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-30-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  3 +++
 target/arm/tcg/translate-a64.c | 26 +++++++-------------------
 2 files changed, 10 insertions(+), 19 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 &qrrrr_e        q rd rn rm ra esz
 
 @rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
+@rr_s           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=2
 @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
 @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
 @rr_hsd         ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_hsd
@@ -XXX,XX +XXX,XX @@ FRINTA_s        00011110 .. 1 001100 10000 ..... .....      @rr_hsd
 FRINTX_s        00011110 .. 1 001110 10000 ..... .....      @rr_hsd
 FRINTI_s        00011110 .. 1 001111 10000 ..... .....      @rr_hsd
 
+BFCVT_s         00011110 01 1 000110 10000 ..... .....      @rr_s
+
 # Floating-point Immediate
 
 FMOVI_s         0001 1110 .. 1 imm:8 100 00000 rd:5         esz=%esz_hsd
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static const FPScalar1 f_scalar_frintx = {
 };
 TRANS(FRINTX_s, do_fp1_scalar, a, &f_scalar_frintx, -1)
 
+static const FPScalar1 f_scalar_bfcvt = {
+    .gen_s = gen_helper_bfcvt,
+};
+TRANS_FEAT(BFCVT_s, aa64_bf16, do_fp1_scalar, a, &f_scalar_bfcvt, -1)
+
 /* Floating-point data-processing (1 source) - single precision */
 static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
 {
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
     tcg_res = tcg_temp_new_i32();
 
     switch (opcode) {
-    case 0x6: /* BFCVT */
-        gen_fpst = gen_helper_bfcvt;
-        break;
     case 0x10: /* FRINT32Z */
         rmode = FPROUNDING_ZERO;
         gen_fpst = gen_helper_frint32_s;
@@ -XXX,XX +XXX,XX @@ static void handle_fp_1src_single(DisasContext *s, int opcode, int rd, int rn)
     case 0x1: /* FABS */
     case 0x2: /* FNEG */
     case 0x3: /* FSQRT */
+    case 0x6: /* BFCVT */
     case 0x8: /* FRINTN */
     case 0x9: /* FRINTP */
     case 0xa: /* FRINTM */
@@ -XXX,XX +XXX,XX @@ static void disas_fp_1src(DisasContext *s, uint32_t insn)
         }
         break;
 
-    case 0x6:
-        switch (type) {
-        case 1: /* BFCVT */
-            if (!dc_isar_feature(aa64_bf16, s)) {
-                goto do_unallocated;
-            }
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_fp_1src_single(s, opcode, rd, rn);
-            break;
-        default:
-            goto do_unallocated;
-        }
-        break;
-
     default:
     do_unallocated:
     case 0x0: /* FMOV */
     case 0x1: /* FABS */
     case 0x2: /* FNEG */
     case 0x3: /* FSQRT */
+    case 0x6: /* BFCVT */
     case 0x8: /* FRINTN */
     case 0x9: /* FRINTP */
     case 0xa: /* FRINTM */
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_fp_1src_single and handle_fp_1src_double as
these were the last insns decoded by those functions.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-31-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   5 ++
 target/arm/tcg/translate-a64.c | 146 ++++-----------------------------
 2 files changed, 22 insertions(+), 129 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_fp_fcvt and disas_fp_1src as these were
the last insns decoded by those functions.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-32-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   7 ++
 target/arm/tcg/translate-a64.c | 172 +++++++++++++--------------------
 2 files changed, 74 insertions(+), 105 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

This includes SCVTF, UCVTF, FCVT{N,P,M,Z,A}{S,U}.
Remove disas_fp_fixed_conv as those were the last insns
decoded by that function.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-33-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  40 ++++
 target/arm/tcg/translate-a64.c | 391 ++++++++++++++-------------------
 2 files changed, 209 insertions(+), 222 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ FMAXV_s         0110 1110 00 11000 01111 10 ..... .....     @rr_q1e2
 FMINV_h         0.00 1110 10 11000 01111 10 ..... .....     @qrr_h
 FMINV_s         0110 1110 10 11000 01111 10 ..... .....     @rr_q1e2
 
+# Conversion between floating-point and fixed-point (general register)
+
+&fcvt           rd rn esz sf shift
+%fcvt_shift32   10:5 !function=rsub_32
+%fcvt_shift64   10:6 !function=rsub_64
+
+@fcvt32         0 ....... .. ...... 1..... rn:5 rd:5    \
+                &fcvt sf=0 esz=%esz_hsd shift=%fcvt_shift32
+@fcvt64         1 ....... .. ...... ...... rn:5 rd:5    \
+                &fcvt sf=1 esz=%esz_hsd shift=%fcvt_shift64
+
+SCVTF_g         . 0011110 .. 000010 ...... ..... .....  @fcvt32
+SCVTF_g         . 0011110 .. 000010 ...... ..... .....  @fcvt64
+UCVTF_g         . 0011110 .. 000011 ...... ..... .....  @fcvt32
+UCVTF_g         . 0011110 .. 000011 ...... ..... .....  @fcvt64
+
+FCVTZS_g        . 0011110 .. 011000 ...... ..... .....  @fcvt32
+FCVTZS_g        . 0011110 .. 011000 ...... ..... .....  @fcvt64
+FCVTZU_g        . 0011110 .. 011001 ...... ..... .....  @fcvt32
+FCVTZU_g        . 0011110 .. 011001 ...... ..... .....  @fcvt64
+
+# Conversion between floating-point and integer (general register)
+
+@icvt           sf:1 ....... .. ...... ...... rn:5 rd:5 \
+                &fcvt esz=%esz_hsd shift=0
+
+SCVTF_g         . 0011110 .. 100010 000000 ..... .....  @icvt
+UCVTF_g         . 0011110 .. 100011 000000 ..... .....  @icvt
+
+FCVTNS_g        . 0011110 .. 100000 000000 ..... .....  @icvt
+FCVTNU_g        . 0011110 .. 100001 000000 ..... .....  @icvt
+FCVTPS_g        . 0011110 .. 101000 000000 ..... .....  @icvt
+FCVTPU_g        . 0011110 .. 101001 000000 ..... .....  @icvt
+FCVTMS_g        . 0011110 .. 110000 000000 ..... .....  @icvt
+FCVTMU_g        . 0011110 .. 110001 000000 ..... .....  @icvt
+FCVTZS_g        . 0011110 .. 111000 000000 ..... .....  @icvt
+FCVTZU_g        . 0011110 .. 111001 000000 ..... .....  @icvt
+FCVTAS_g        . 0011110 .. 100100 000000 ..... .....  @icvt
+FCVTAU_g        . 0011110 .. 100101 000000 ..... .....  @icvt
+
 # Floating-point data processing (1 source)
 
 FMOV_s          00011110 .. 1 000000 10000 ..... .....      @rr_hsd
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVT_s_dh(DisasContext *s, arg_rr *a)
     return true;
 }
 
-/* Handle floating point <=> fixed point conversions. Note that we can
- * also deal with fp <=> integer conversions as a special case (scale == 64)
- * OPTME: consider handling that special case specially or at least skipping
- * the call to scalbn in the helpers for zero shifts.
- */
-static void handle_fpfpcvt(DisasContext *s, int rd, int rn, int opcode,
-                           bool itof, int rmode, int scale, int sf, int type)
+static bool do_cvtf_scalar(DisasContext *s, MemOp esz, int rd, int shift,
+                           TCGv_i64 tcg_int, bool is_signed)
 {
-    bool is_signed = !(opcode & 1);
     TCGv_ptr tcg_fpstatus;
     TCGv_i32 tcg_shift, tcg_single;
     TCGv_i64 tcg_double;
 
-    tcg_fpstatus = fpstatus_ptr(type == 3 ? FPST_FPCR_F16 : FPST_FPCR);
+    tcg_fpstatus = fpstatus_ptr(esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
+    tcg_shift = tcg_constant_i32(shift);
 
-    tcg_shift = tcg_constant_i32(64 - scale);
-
-    if (itof) {
-        TCGv_i64 tcg_int = cpu_reg(s, rn);
-        if (!sf) {
-            TCGv_i64 tcg_extend = tcg_temp_new_i64();
-
-            if (is_signed) {
-                tcg_gen_ext32s_i64(tcg_extend, tcg_int);
-            } else {
-                tcg_gen_ext32u_i64(tcg_extend, tcg_int);
-            }
-
-            tcg_int = tcg_extend;
+    switch (esz) {
+    case MO_64:
+        tcg_double = tcg_temp_new_i64();
+        if (is_signed) {
+            gen_helper_vfp_sqtod(tcg_double, tcg_int, tcg_shift, tcg_fpstatus);
+        } else {
+            gen_helper_vfp_uqtod(tcg_double, tcg_int, tcg_shift, tcg_fpstatus);
         }
+        write_fp_dreg(s, rd, tcg_double);
+        break;
 
-        switch (type) {
-        case 1: /* float64 */
-            tcg_double = tcg_temp_new_i64();
-            if (is_signed) {
-                gen_helper_vfp_sqtod(tcg_double, tcg_int,
-                                     tcg_shift, tcg_fpstatus);
-            } else {
-                gen_helper_vfp_uqtod(tcg_double, tcg_int,
-                                     tcg_shift, tcg_fpstatus);
-            }
-            write_fp_dreg(s, rd, tcg_double);
-            break;
-
-        case 0: /* float32 */
-            tcg_single = tcg_temp_new_i32();
-            if (is_signed) {
-                gen_helper_vfp_sqtos(tcg_single, tcg_int,
-                                     tcg_shift, tcg_fpstatus);
-            } else {
-                gen_helper_vfp_uqtos(tcg_single, tcg_int,
-                                     tcg_shift, tcg_fpstatus);
-            }
-            write_fp_sreg(s, rd, tcg_single);
-            break;
-
-        case 3: /* float16 */
-            tcg_single = tcg_temp_new_i32();
-            if (is_signed) {
-                gen_helper_vfp_sqtoh(tcg_single, tcg_int,
-                                     tcg_shift, tcg_fpstatus);
-            } else {
-                gen_helper_vfp_uqtoh(tcg_single, tcg_int,
-                                     tcg_shift, tcg_fpstatus);
-            }
-            write_fp_sreg(s, rd, tcg_single);
-            break;
-
-        default:
-            g_assert_not_reached();
+    case MO_32:
+        tcg_single = tcg_temp_new_i32();
+        if (is_signed) {
+            gen_helper_vfp_sqtos(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
+        } else {
+            gen_helper_vfp_uqtos(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
         }
-    } else {
-        TCGv_i64 tcg_int = cpu_reg(s, rd);
-        TCGv_i32 tcg_rmode;
+        write_fp_sreg(s, rd, tcg_single);
+        break;
 
-        if (extract32(opcode, 2, 1)) {
-            /* There are too many rounding modes to all fit into rmode,
-             * so FCVTA[US] is a special case.
-             */
-            rmode = FPROUNDING_TIEAWAY;
+    case MO_16:
+        tcg_single = tcg_temp_new_i32();
+        if (is_signed) {
+            gen_helper_vfp_sqtoh(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
+        } else {
+            gen_helper_vfp_uqtoh(tcg_single, tcg_int, tcg_shift, tcg_fpstatus);
         }
+        write_fp_sreg(s, rd, tcg_single);
+        break;
 
-        tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
-
-        switch (type) {
-        case 1: /* float64 */
-            tcg_double = read_fp_dreg(s, rn);
-            if (is_signed) {
-                if (!sf) {
-                    gen_helper_vfp_tosld(tcg_int, tcg_double,
-                                         tcg_shift, tcg_fpstatus);
-                } else {
-                    gen_helper_vfp_tosqd(tcg_int, tcg_double,
-                                         tcg_shift, tcg_fpstatus);
-                }
-            } else {
-                if (!sf) {
-                    gen_helper_vfp_tould(tcg_int, tcg_double,
-                                         tcg_shift, tcg_fpstatus);
-                } else {
-                    gen_helper_vfp_touqd(tcg_int, tcg_double,
-                                         tcg_shift, tcg_fpstatus);
-                }
-            }
-            if (!sf) {
-                tcg_gen_ext32u_i64(tcg_int, tcg_int);
-            }
-            break;
-
-        case 0: /* float32 */
-            tcg_single = read_fp_sreg(s, rn);
-            if (sf) {
-                if (is_signed) {
-                    gen_helper_vfp_tosqs(tcg_int, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                } else {
-                    gen_helper_vfp_touqs(tcg_int, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                }
-            } else {
-                TCGv_i32 tcg_dest = tcg_temp_new_i32();
-                if (is_signed) {
-                    gen_helper_vfp_tosls(tcg_dest, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                } else {
-                    gen_helper_vfp_touls(tcg_dest, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                }
-                tcg_gen_extu_i32_i64(tcg_int, tcg_dest);
-            }
-            break;
-
-        case 3: /* float16 */
-            tcg_single = read_fp_sreg(s, rn);
-            if (sf) {
-                if (is_signed) {
-                    gen_helper_vfp_tosqh(tcg_int, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                } else {
-                    gen_helper_vfp_touqh(tcg_int, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                }
-            } else {
-                TCGv_i32 tcg_dest = tcg_temp_new_i32();
-                if (is_signed) {
-                    gen_helper_vfp_toslh(tcg_dest, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                } else {
-                    gen_helper_vfp_toulh(tcg_dest, tcg_single,
-                                         tcg_shift, tcg_fpstatus);
-                }
-                tcg_gen_extu_i32_i64(tcg_int, tcg_dest);
-            }
-            break;
-
-        default:
-            g_assert_not_reached();
-        }
-
-        gen_restore_rmode(tcg_rmode, tcg_fpstatus);
+    default:
+        g_assert_not_reached();
     }
+    return true;
 }
 
-/* Floating point <-> fixed point conversions
- *   31   30  29 28       24 23  22  21 20   19 18    16 15   10 9    5 4    0
- * +----+---+---+-----------+------+---+-------+--------+-------+------+------+
- * | sf | 0 | S | 1 1 1 1 0 | type | 0 | rmode | opcode | scale |  Rn  |  Rd  |
- * +----+---+---+-----------+------+---+-------+--------+-------+------+------+
- */
-static void disas_fp_fixed_conv(DisasContext *s, uint32_t insn)
+static bool do_cvtf_g(DisasContext *s, arg_fcvt *a, bool is_signed)
 {
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int scale = extract32(insn, 10, 6);
-    int opcode = extract32(insn, 16, 3);
-    int rmode = extract32(insn, 19, 2);
-    int type = extract32(insn, 22, 2);
-    bool sbit = extract32(insn, 29, 1);
-    bool sf = extract32(insn, 31, 1);
-    bool itof;
+    TCGv_i64 tcg_int;
+    int check = fp_access_check_scalar_hsd(s, a->esz);
 
-    if (sbit || (!sf && scale < 32)) {
-        unallocated_encoding(s);
-        return;
+    if (check <= 0) {
+        return check == 0;
     }
 
-    switch (type) {
-    case 0: /* float32 */
-    case 1: /* float64 */
-        break;
-    case 3: /* float16 */
-        if (dc_isar_feature(aa64_fp16, s)) {
-            break;
+    if (a->sf) {
+        tcg_int = cpu_reg(s, a->rn);
+    } else {
+        tcg_int = read_cpu_reg(s, a->rn, true);
+        if (is_signed) {
+            tcg_gen_ext32s_i64(tcg_int, tcg_int);
+        } else {
+            tcg_gen_ext32u_i64(tcg_int, tcg_int);
         }
-        /* fallthru */
-    default:
-        unallocated_encoding(s);
-        return;
     }
-
-    switch ((rmode << 3) | opcode) {
-    case 0x2: /* SCVTF */
-    case 0x3: /* UCVTF */
-        itof = true;
-        break;
-    case 0x18: /* FCVTZS */
-    case 0x19: /* FCVTZU */
-        itof = false;
-        break;
-    default:
-        unallocated_encoding(s);
-        return;
-    }
-
-    if (!fp_access_check(s)) {
-        return;
-    }
-
-    handle_fpfpcvt(s, rd, rn, opcode, itof, FPROUNDING_ZERO, scale, sf, type);
+    return do_cvtf_scalar(s, a->esz, a->rd, a->shift, tcg_int, is_signed);
 }
 
+TRANS(SCVTF_g, do_cvtf_g, a, true)
+TRANS(UCVTF_g, do_cvtf_g, a, false)
+
+static void do_fcvt_scalar(DisasContext *s, MemOp out, MemOp esz,
+                           TCGv_i64 tcg_out, int shift, int rn,
+                           ARMFPRounding rmode)
+{
+    TCGv_ptr tcg_fpstatus;
+    TCGv_i32 tcg_shift, tcg_rmode, tcg_single;
+
+    tcg_fpstatus = fpstatus_ptr(esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
+    tcg_shift = tcg_constant_i32(shift);
+    tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
+
+    switch (esz) {
+    case MO_64:
+        read_vec_element(s, tcg_out, rn, 0, MO_64);
+        switch (out) {
+        case MO_64 | MO_SIGN:
+            gen_helper_vfp_tosqd(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_64:
+            gen_helper_vfp_touqd(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_32 | MO_SIGN:
+            gen_helper_vfp_tosld(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_32:
+            gen_helper_vfp_tould(tcg_out, tcg_out, tcg_shift, tcg_fpstatus);
+            break;
+        default:
+            g_assert_not_reached();
+        }
+        break;
+
+    case MO_32:
+        tcg_single = read_fp_sreg(s, rn);
+        switch (out) {
+        case MO_64 | MO_SIGN:
+            gen_helper_vfp_tosqs(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_64:
+            gen_helper_vfp_touqs(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_32 | MO_SIGN:
+            gen_helper_vfp_tosls(tcg_single, tcg_single,
+                                 tcg_shift, tcg_fpstatus);
+            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
+            break;
+        case MO_32:
+            gen_helper_vfp_touls(tcg_single, tcg_single,
+                                 tcg_shift, tcg_fpstatus);
+            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
+            break;
+        default:
+            g_assert_not_reached();
+        }
+        break;
+
+    case MO_16:
+        tcg_single = read_fp_hreg(s, rn);
+        switch (out) {
+        case MO_64 | MO_SIGN:
+            gen_helper_vfp_tosqh(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_64:
+            gen_helper_vfp_touqh(tcg_out, tcg_single, tcg_shift, tcg_fpstatus);
+            break;
+        case MO_32 | MO_SIGN:
+            gen_helper_vfp_toslh(tcg_single, tcg_single,
+                                 tcg_shift, tcg_fpstatus);
+            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
+            break;
+        case MO_32:
+            gen_helper_vfp_toulh(tcg_single, tcg_single,
+                                 tcg_shift, tcg_fpstatus);
+            tcg_gen_extu_i32_i64(tcg_out, tcg_single);
+            break;
+        default:
+            g_assert_not_reached();
+        }
+        break;
+
+    default:
+        g_assert_not_reached();
+    }
+
+    gen_restore_rmode(tcg_rmode, tcg_fpstatus);
+}
+
+static bool do_fcvt_g(DisasContext *s, arg_fcvt *a,
+                      ARMFPRounding rmode, bool is_signed)
+{
+    TCGv_i64 tcg_int;
+    int check = fp_access_check_scalar_hsd(s, a->esz);
+
+    if (check <= 0) {
+        return check == 0;
+    }
+
+    tcg_int = cpu_reg(s, a->rd);
+    do_fcvt_scalar(s, (a->sf ? MO_64 : MO_32) | (is_signed ? MO_SIGN : 0),
+                   a->esz, tcg_int, a->shift, a->rn, rmode);
+
+    if (!a->sf) {
+        tcg_gen_ext32u_i64(tcg_int, tcg_int);
+    }
+    return true;
+}
+
+TRANS(FCVTNS_g, do_fcvt_g, a, FPROUNDING_TIEEVEN, true)
+TRANS(FCVTNU_g, do_fcvt_g, a, FPROUNDING_TIEEVEN, false)
+TRANS(FCVTPS_g, do_fcvt_g, a, FPROUNDING_POSINF, true)
+TRANS(FCVTPU_g, do_fcvt_g, a, FPROUNDING_POSINF, false)
+TRANS(FCVTMS_g, do_fcvt_g, a, FPROUNDING_NEGINF, true)
+TRANS(FCVTMU_g, do_fcvt_g, a, FPROUNDING_NEGINF, false)
+TRANS(FCVTZS_g, do_fcvt_g, a, FPROUNDING_ZERO, true)
+TRANS(FCVTZU_g, do_fcvt_g, a, FPROUNDING_ZERO, false)
+TRANS(FCVTAS_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, true)
+TRANS(FCVTAU_g, do_fcvt_g, a, FPROUNDING_TIEAWAY, false)
+
 static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
 {
     /* FMOV: gpr to or from float, double, or top half of quad fp reg,
@@ -XXX,XX +XXX,XX @@ static void disas_fp_int_conv(DisasContext *s, uint32_t insn)
     switch (opcode) {
     case 2: /* SCVTF */
     case 3: /* UCVTF */
-        itof = true;
-        /* fallthru */
     case 4: /* FCVTAS */
     case 5: /* FCVTAU */
-        if (rmode != 0) {
-            goto do_unallocated;
-        }
-        /* fallthru */
     case 0: /* FCVT[NPMZ]S */
     case 1: /* FCVT[NPMZ]U */
-        switch (type) {
-        case 0: /* float32 */
-        case 1: /* float64 */
-            break;
-        case 3: /* float16 */
-            if (!dc_isar_feature(aa64_fp16, s)) {
-                goto do_unallocated;
-            }
-            break;
-        default:
-            goto do_unallocated;
-        }
-        if (!fp_access_check(s)) {
-            return;
-        }
-        handle_fpfpcvt(s, rd, rn, opcode, itof, rmode, 64, sf, type);
-        break;
+        goto do_unallocated;
 
     default:
         switch (sf << 7 | type << 5 | rmode << 3 | opcode) {
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_fp(DisasContext *s, uint32_t insn)
         unallocated_encoding(s); /* in decodetree */
     } else if (extract32(insn, 21, 1) == 0) {
         /* Floating point to fixed point conversions */
-        disas_fp_fixed_conv(s, insn);
+        unallocated_encoding(s); /* in decodetree */
     } else {
         switch (extract32(insn, 10, 2)) {
         case 1: /* Floating point conditional compare */
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-34-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  2 ++
 target/arm/tcg/translate-a64.c | 41 +++++++++++++++++-----------------
 2 files changed, 22 insertions(+), 21 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove disas_fp_int_conv and disas_data_proc_fp as these
were the last insns decoded by those functions.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-35-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  14 ++
 target/arm/tcg/translate-a64.c | 232 ++++++++++-----------------------
 2 files changed, 86 insertions(+), 160 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-36-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  11 +++
 target/arm/tcg/translate-a64.c | 123 +++++++++++++++++++++------------
 2 files changed, 89 insertions(+), 45 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 @rr_h           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=1
 @rr_s           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=2
 @rr_d           ........ ... ..... ...... rn:5 rd:5     &rr_e esz=3
+@rr_e           ........ esz:2 . ..... ...... rn:5 rd:5 &rr_e
 @rr_sd          ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_sd
 @rr_hsd         ........ ... ..... ...... rn:5 rd:5     &rr_e esz=%esz_hsd
 
@@ -XXX,XX +XXX,XX @@ UQRSHRN_si      0111 11110 .... ... 10011 1 ..... .....     @shri_s
 SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_b
 SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_h
 SQRSHRUN_si     0111 11110 .... ... 10001 1 ..... .....     @shri_s
+
+# Advanced SIMD scalar two-register miscellaneous
+
+SQABS_s         0101 1110 ..1 00000 01111 0 ..... .....     @rr_e
+SQNEG_s         0111 1110 ..1 00000 01111 0 ..... .....     @rr_e
+
+# Advanced SIMD two-register miscellaneous
+
+SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
+SQNEG_v         0.10 1110 ..1 00000 01111 0 ..... .....     @qrr_e
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FMOV_xu(DisasContext *s, arg_rr *a)
     return true;
 }
 
+typedef struct ENVScalar1 {
+    NeonGenOneOpEnvFn *gen_bhs[3];
+    NeonGenOne64OpEnvFn *gen_d;
+} ENVScalar1;
+
+static bool do_env_scalar1(DisasContext *s, arg_rr_e *a, const ENVScalar1 *f)
+{
+    if (!fp_access_check(s)) {
+        return true;
+    }
+    if (a->esz == MO_64) {
+        TCGv_i64 t = read_fp_dreg(s, a->rn);
+        f->gen_d(t, tcg_env, t);
+        write_fp_dreg(s, a->rd, t);
+    } else {
+        TCGv_i32 t = tcg_temp_new_i32();
+
+        read_vec_element_i32(s, t, a->rn, 0, a->esz);
+        f->gen_bhs[a->esz](t, tcg_env, t);
+        write_fp_sreg(s, a->rd, t);
+    }
+    return true;
+}
+
+static bool do_env_vector1(DisasContext *s, arg_qrr_e *a, const ENVScalar1 *f)
+{
+    if (a->esz == MO_64 && !a->q) {
+        return false;
+    }
+    if (!fp_access_check(s)) {
+        return true;
+    }
+    if (a->esz == MO_64) {
+        TCGv_i64 t = tcg_temp_new_i64();
+
+        for (int i = 0; i < 2; ++i) {
+            read_vec_element(s, t, a->rn, i, MO_64);
+            f->gen_d(t, tcg_env, t);
+            write_vec_element(s, t, a->rd, i, MO_64);
+        }
+    } else {
+        TCGv_i32 t = tcg_temp_new_i32();
+        int n = (a->q ? 16 : 8) >> a->esz;
+
+        for (int i = 0; i < n; ++i) {
+            read_vec_element_i32(s, t, a->rn, i, a->esz);
+            f->gen_bhs[a->esz](t, tcg_env, t);
+            write_vec_element_i32(s, t, a->rd, i, a->esz);
+        }
+    }
+    clear_vec_high(s, a->q, a->rd);
+    return true;
+}
+
+static const ENVScalar1 f_scalar_sqabs = {
+    { gen_helper_neon_qabs_s8,
+      gen_helper_neon_qabs_s16,
+      gen_helper_neon_qabs_s32 },
+    gen_helper_neon_qabs_s64,
+};
+TRANS(SQABS_s, do_env_scalar1, a, &f_scalar_sqabs)
+TRANS(SQABS_v, do_env_vector1, a, &f_scalar_sqabs)
+
+static const ENVScalar1 f_scalar_sqneg = {
+    { gen_helper_neon_qneg_s8,
+      gen_helper_neon_qneg_s16,
+      gen_helper_neon_qneg_s32 },
+    gen_helper_neon_qneg_s64,
+};
+TRANS(SQNEG_s, do_env_scalar1, a, &f_scalar_sqneg)
+TRANS(SQNEG_v, do_env_vector1, a, &f_scalar_sqneg)
+
 /* Common vector code for handling integer to FP conversion */
 static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
                                    int elements, int is_signed,
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
          */
         tcg_gen_not_i64(tcg_rd, tcg_rn);
         break;
-    case 0x7: /* SQABS, SQNEG */
-        if (u) {
-            gen_helper_neon_qneg_s64(tcg_rd, tcg_env, tcg_rn);
-        } else {
-            gen_helper_neon_qabs_s64(tcg_rd, tcg_env, tcg_rn);
-        }
-        break;
     case 0xa: /* CMLT */
         cond = TCG_COND_LT;
     do_cmop:
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
         gen_helper_frint64_d(tcg_rd, tcg_rn, tcg_fpstatus);
         break;
     default:
+    case 0x7: /* SQABS, SQNEG */
         g_assert_not_reached();
     }
 }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
     TCGv_ptr tcg_fpstatus;
 
     switch (opcode) {
-    case 0x7: /* SQABS / SQNEG */
-        break;
     case 0xa: /* CMLT */
         if (u) {
             unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
         break;
     default:
     case 0x3: /* USQADD / SUQADD */
+    case 0x7: /* SQABS / SQNEG */
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
         read_vec_element_i32(s, tcg_rn, rn, 0, size);
 
         switch (opcode) {
-        case 0x7: /* SQABS, SQNEG */
-        {
-            NeonGenOneOpEnvFn *genfn;
-            static NeonGenOneOpEnvFn * const fns[3][2] = {
-                { gen_helper_neon_qabs_s8, gen_helper_neon_qneg_s8 },
-                { gen_helper_neon_qabs_s16, gen_helper_neon_qneg_s16 },
-                { gen_helper_neon_qabs_s32, gen_helper_neon_qneg_s32 },
-            };
-            genfn = fns[size][u];
-            genfn(tcg_rd, tcg_env, tcg_rn);
-            break;
-        }
         case 0x1a: /* FCVTNS */
         case 0x1b: /* FCVTMS */
         case 0x1c: /* FCVTAS */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
                                  tcg_fpstatus);
             break;
         default:
+        case 0x7: /* SQABS, SQNEG */
             g_assert_not_reached();
         }
 
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             return;
         }
         break;
-    case 0x7: /* SQABS, SQNEG */
-        if (size == 3 && !is_q) {
-            unallocated_encoding(s);
-            return;
-        }
-        break;
     case 0xc ... 0xf:
     case 0x16 ... 0x1f:
     {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     }
     default:
     case 0x3: /* SUQADD, USQADD */
+    case 0x7: /* SQABS, SQNEG */
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                         tcg_gen_clrsb_i32(tcg_res, tcg_op);
                     }
                     break;
-                case 0x7: /* SQABS, SQNEG */
-                    if (u) {
-                        gen_helper_neon_qneg_s32(tcg_res, tcg_env, tcg_op);
-                    } else {
-                        gen_helper_neon_qabs_s32(tcg_res, tcg_env, tcg_op);
-                    }
-                    break;
                 case 0x2f: /* FABS */
                     gen_vfp_abss(tcg_res, tcg_op);
                     break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                     gen_helper_frint64_s(tcg_res, tcg_op, tcg_fpstatus);
                     break;
                 default:
+                case 0x7: /* SQABS, SQNEG */
                     g_assert_not_reached();
                 }
             } else {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                         gen_helper_neon_cnt_u8(tcg_res, tcg_op);
                     }
                     break;
-                case 0x7: /* SQABS, SQNEG */
-                {
-                    NeonGenOneOpEnvFn *genfn;
-                    static NeonGenOneOpEnvFn * const fns[2][2] = {
-                        { gen_helper_neon_qabs_s8, gen_helper_neon_qneg_s8 },
-                        { gen_helper_neon_qabs_s16, gen_helper_neon_qneg_s16 },
-                    };
-                    genfn = fns[size][u];
-                    genfn(tcg_res, tcg_env, tcg_op);
-                    break;
-                }
                 case 0x4: /* CLS, CLZ */
                     if (u) {
                         if (size == 0) {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                     }
                     break;
                 default:
+                case 0x7: /* SQABS, SQNEG */
                     g_assert_not_reached();
                 }
             }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-37-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  4 +++
 target/arm/tcg/translate-a64.c | 46 +++++++++++++++++++++++-----------
 2 files changed, 35 insertions(+), 15 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Add gvec interfaces for CLS and CLZ operations.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-38-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate.h      |  5 +++++
 target/arm/tcg/gengvec.c        | 35 +++++++++++++++++++++++++++++++++
 target/arm/tcg/translate-a64.c  | 29 +++++++--------------------
 target/arm/tcg/translate-neon.c | 29 ++-------------------------
 4 files changed, 49 insertions(+), 49 deletions(-)

diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate.h
+++ b/target/arm/tcg/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_umaxp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 void gen_gvec_uminp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                     uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 
+void gen_gvec_cls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz);
+
 /*
  * Forward to the isar_feature_* tests given a DisasContext pointer.
  */
diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/gengvec.c
+++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_urhadd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
     assert(vece <= MO_32);
     tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &g[vece]);
 }
+
+void gen_gvec_cls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz)
+{
+    static const GVecGen2 g[] = {
+        { .fni4 = gen_helper_neon_cls_s8,
+          .vece = MO_8 },
+        { .fni4 = gen_helper_neon_cls_s16,
+          .vece = MO_16 },
+        { .fni4 = tcg_gen_clrsb_i32,
+          .vece = MO_32 },
+    };
+    assert(vece <= MO_32);
+    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+}
+
+static void gen_clz32_i32(TCGv_i32 d, TCGv_i32 n)
+{
+    tcg_gen_clzi_i32(d, n, 32);
+}
+
+void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz)
+{
+    static const GVecGen2 g[] = {
+        { .fni4 = gen_helper_neon_clz_u8,
+          .vece = MO_8 },
+        { .fni4 = gen_helper_neon_clz_u16,
+          .vece = MO_16 },
+        { .fni4 = gen_clz32_i32,
+          .vece = MO_32 },
+    };
+    assert(vece <= MO_32);
+    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+}
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     }
 
     switch (opcode) {
+    case 0x4: /* CLZ, CLS */
+        if (u) {
+            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clz, size);
+        } else {
+            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cls, size);
+        }
+        return;
     case 0x5:
         if (u && size == 0) { /* NOT */
             gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             if (size == 2) {
                 /* Special cases for 32 bit elements */
                 switch (opcode) {
-                case 0x4: /* CLS */
-                    if (u) {
-                        tcg_gen_clzi_i32(tcg_res, tcg_op, 32);
-                    } else {
-                        tcg_gen_clrsb_i32(tcg_res, tcg_op);
-                    }
-                    break;
                 case 0x2f: /* FABS */
                     gen_vfp_abss(tcg_res, tcg_op);
                     break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                         gen_helper_neon_cnt_u8(tcg_res, tcg_op);
                     }
                     break;
-                case 0x4: /* CLS, CLZ */
-                    if (u) {
-                        if (size == 0) {
-                            gen_helper_neon_clz_u8(tcg_res, tcg_op);
-                        } else {
-                            gen_helper_neon_clz_u16(tcg_res, tcg_op);
-                        }
-                    } else {
-                        if (size == 0) {
-                            gen_helper_neon_cls_s8(tcg_res, tcg_op);
-                        } else {
-                            gen_helper_neon_cls_s16(tcg_res, tcg_op);
-                        }
-                    }
-                    break;
                 default:
                 case 0x7: /* SQABS, SQNEG */
                     g_assert_not_reached();
diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-neon.c
+++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ DO_2MISC_VEC(VCGT0, gen_gvec_cgt0)
 DO_2MISC_VEC(VCLE0, gen_gvec_cle0)
 DO_2MISC_VEC(VCGE0, gen_gvec_cge0)
 DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
+DO_2MISC_VEC(VCLS, gen_gvec_cls)
+DO_2MISC_VEC(VCLZ, gen_gvec_clz)
 
 static bool trans_VMVN(DisasContext *s, arg_2misc *a)
 {
@@ -XXX,XX +XXX,XX @@ static bool trans_VREV16(DisasContext *s, arg_2misc *a)
     return do_2misc(s, a, gen_rev16);
 }
 
-static bool trans_VCLS(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenOneOpFn * const fn[] = {
-        gen_helper_neon_cls_s8,
-        gen_helper_neon_cls_s16,
-        gen_helper_neon_cls_s32,
-        NULL,
-    };
-    return do_2misc(s, a, fn[a->size]);
-}
-
-static void do_VCLZ_32(TCGv_i32 rd, TCGv_i32 rm)
-{
-    tcg_gen_clzi_i32(rd, rm, 32);
-}
-
-static bool trans_VCLZ(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenOneOpFn * const fn[] = {
-        gen_helper_neon_clz_u8,
-        gen_helper_neon_clz_u16,
-        do_VCLZ_32,
-        NULL,
-    };
-    return do_2misc(s, a, fn[a->size]);
-}
-
 static bool trans_VCNT(DisasContext *s, arg_2misc *a)
 {
     if (a->size != 0) {
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-39-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  2 ++
 target/arm/tcg/translate-a64.c | 37 ++++++++++++++++------------------
 2 files changed, 19 insertions(+), 20 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Add gvec interfaces for CNT and RBIT operations.
Use ctpop8 for CNT and revbit+bswap for RBIT.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-40-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h             |  4 ++--
 target/arm/tcg/translate.h      |  4 ++++
 target/arm/tcg/gengvec.c        | 16 ++++++++++++++++
 target/arm/tcg/neon_helper.c    | 21 ---------------------
 target/arm/tcg/translate-a64.c  | 32 +++++++++-----------------------
 target/arm/tcg/translate-neon.c | 16 ++++++++--------
 target/arm/tcg/vec_helper.c     | 24 ++++++++++++++++++++++++
 7 files changed, 63 insertions(+), 54 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(neon_clz_u16, i32, i32)
 DEF_HELPER_1(neon_cls_s8, i32, i32)
 DEF_HELPER_1(neon_cls_s16, i32, i32)
 DEF_HELPER_1(neon_cls_s32, i32, i32)
-DEF_HELPER_1(neon_cnt_u8, i32, i32)
-DEF_HELPER_FLAGS_1(neon_rbit_u8, TCG_CALL_NO_RWG_SE, i32, i32)
+DEF_HELPER_FLAGS_3(gvec_cnt_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+DEF_HELPER_FLAGS_3(gvec_rbit_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 
 DEF_HELPER_3(neon_qdmulh_s16, i32, env, i32, i32)
 DEF_HELPER_3(neon_qrdmulh_s16, i32, env, i32, i32)
diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate.h
+++ b/target/arm/tcg/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_cls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                   uint32_t opr_sz, uint32_t max_sz);
 void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                   uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                   uint32_t opr_sz, uint32_t max_sz);
 
 /*
  * Forward to the isar_feature_* tests given a DisasContext pointer.
diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/gengvec.c
+++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_clz(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
     assert(vece <= MO_32);
     tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
 }
+
+void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz)
+{
+    assert(vece == MO_8);
+    tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
+                       gen_helper_gvec_cnt_b);
+}
+
+void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                  uint32_t opr_sz, uint32_t max_sz)
+{
+    assert(vece == MO_8);
+    tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
+                       gen_helper_gvec_rbit_b);
+}
diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/neon_helper.c
+++ b/target/arm/tcg/neon_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(neon_cls_s32)(uint32_t x)
     return count - 1;
 }
 
-/* Bit count.  */
-uint32_t HELPER(neon_cnt_u8)(uint32_t x)
-{
-    x = (x & 0x55555555) + ((x >>  1) & 0x55555555);
-    x = (x & 0x33333333) + ((x >>  2) & 0x33333333);
-    x = (x & 0x0f0f0f0f) + ((x >>  4) & 0x0f0f0f0f);
-    return x;
-}
-
-/* Reverse bits in each 8 bit word */
-uint32_t HELPER(neon_rbit_u8)(uint32_t x)
-{
-    x =  ((x & 0xf0f0f0f0) >> 4)
-       | ((x & 0x0f0f0f0f) << 4);
-    x =  ((x & 0x88888888) >> 3)
-       | ((x & 0x44444444) >> 1)
-       | ((x & 0x22222222) << 1)
-       | ((x & 0x11111111) << 3);
-    return x;
-}
-
 #define NEON_QDMULH16(dest, src1, src2, round) do { \
     uint32_t tmp = (int32_t)(int16_t) src1 * (int16_t) src2; \
     if ((tmp ^ (tmp << 1)) & SIGNBIT) { \
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     }
 
     switch (opcode) {
-    case 0x5:
-        if (u && size == 0) { /* NOT */
+    case 0x5: /* CNT, NOT, RBIT */
+        if (!u) {
+            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cnt, 0);
+        } else if (size) {
+            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_rbit, 0);
+        } else {
             gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
-            return;
         }
-        break;
+        return;
     case 0x8: /* CMGT, CMGE */
         if (u) {
             gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     } else {
         int pass;
 
+        assert(size == 2);
         for (pass = 0; pass < (is_q ? 4 : 2); pass++) {
             TCGv_i32 tcg_op = tcg_temp_new_i32();
             TCGv_i32 tcg_res = tcg_temp_new_i32();
 
             read_vec_element_i32(s, tcg_op, rn, pass, MO_32);
 
-            if (size == 2) {
+            {
                 /* Special cases for 32 bit elements */
                 switch (opcode) {
                 case 0x2f: /* FABS */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                 case 0x7: /* SQABS, SQNEG */
                     g_assert_not_reached();
                 }
-            } else {
-                /* Use helpers for 8 and 16 bit elements */
-                switch (opcode) {
-                case 0x5: /* CNT, RBIT */
-                    /* For these two insns size is part of the opcode specifier
-                     * (handled earlier); they always operate on byte elements.
-                     */
-                    if (u) {
-                        gen_helper_neon_rbit_u8(tcg_res, tcg_op);
-                    } else {
-                        gen_helper_neon_cnt_u8(tcg_res, tcg_op);
-                    }
-                    break;
-                default:
-                case 0x7: /* SQABS, SQNEG */
-                    g_assert_not_reached();
-                }
             }
-
             write_vec_element_i32(s, tcg_res, rd, pass, MO_32);
         }
     }
diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-neon.c
+++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VMVN(DisasContext *s, arg_2misc *a)
     return do_2misc_vec(s, a, tcg_gen_gvec_not);
 }
 
+static bool trans_VCNT(DisasContext *s, arg_2misc *a)
+{
+    if (a->size != 0) {
+        return false;
+    }
+    return do_2misc_vec(s, a, gen_gvec_cnt);
+}
+
 #define WRAP_2M_3_OOL_FN(WRAPNAME, FUNC, DATA)                          \
     static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
                          uint32_t rm_ofs, uint32_t oprsz,               \
@@ -XXX,XX +XXX,XX @@ static bool trans_VREV16(DisasContext *s, arg_2misc *a)
     return do_2misc(s, a, gen_rev16);
 }
 
-static bool trans_VCNT(DisasContext *s, arg_2misc *a)
-{
-    if (a->size != 0) {
-        return false;
-    }
-    return do_2misc(s, a, gen_helper_neon_cnt_u8);
-}
-
 static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
                        uint32_t oprsz, uint32_t maxsz)
 {
diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/vec_helper.c
+++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_CLAMP(gvec_uclamp_b, uint8_t)
 DO_CLAMP(gvec_uclamp_h, uint16_t)
 DO_CLAMP(gvec_uclamp_s, uint32_t)
 DO_CLAMP(gvec_uclamp_d, uint64_t)
+
+/* Bit count in each 8-bit word. */
+void HELPER(gvec_cnt_b)(void *vd, void *vn, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint8_t *d = vd, *n = vn;
+
+    for (i = 0; i < opr_sz; ++i) {
+        d[i] = ctpop8(n[i]);
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+/* Reverse bits in each 8 bit word */
+void HELPER(gvec_rbit_b)(void *vd, void *vn, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint64_t *d = vd, *n = vn;
+
+    for (i = 0; i < opr_sz / 8; ++i) {
+        d[i] = revbit64(bswap64(n[i]));
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-41-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  4 ++++
 target/arm/tcg/translate-a64.c | 34 ++++++----------------------------
 2 files changed, 10 insertions(+), 28 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 @rrr_q1e3       ........ ... rm:5 ...... rn:5 rd:5      &qrrr_e q=1 esz=3
 @rrrr_q1e3      ........ ... rm:5 . ra:5 rn:5 rd:5      &qrrrr_e q=1 esz=3
 
+@qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
 @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
 @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
 
@@ -XXX,XX +XXX,XX @@ ABS_v           0.00 1110 ..1 00000 10111 0 ..... .....     @qrr_e
 NEG_v           0.10 1110 ..1 00000 10111 0 ..... .....     @qrr_e
 CLS_v           0.00 1110 ..1 00000 01001 0 ..... .....     @qrr_e
 CLZ_v           0.10 1110 ..1 00000 01001 0 ..... .....     @qrr_e
+CNT_v           0.00 1110 001 00000 01011 0 ..... .....     @qrr_b
+NOT_v           0.10 1110 001 00000 01011 0 ..... .....     @qrr_b
+RBIT_v          0.10 1110 011 00000 01011 0 ..... .....     @qrr_b
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
 
 TRANS(ABS_v, do_gvec_fn2, a, tcg_gen_gvec_abs)
 TRANS(NEG_v, do_gvec_fn2, a, tcg_gen_gvec_neg)
+TRANS(NOT_v, do_gvec_fn2, a, tcg_gen_gvec_not)
+TRANS(CNT_v, do_gvec_fn2, a, gen_gvec_cnt)
+TRANS(RBIT_v, do_gvec_fn2, a, gen_gvec_rbit)
 
 static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
 {
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
     TCGCond cond;
 
     switch (opcode) {
-    case 0x5: /* NOT */
-        /* This opcode is shared with CNT and RBIT but we have earlier
-         * enforced that size == 3 if and only if this is the NOT insn.
-         */
-        tcg_gen_not_i64(tcg_rd, tcg_rn);
-        break;
     case 0xa: /* CMLT */
         cond = TCG_COND_LT;
     do_cmop:
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
         break;
     default:
     case 0x4: /* CLS, CLZ */
+    case 0x5: /* NOT */
     case 0x7: /* SQABS, SQNEG */
     case 0xb: /* ABS, NEG */
         g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     case 0x1: /* REV16 */
         handle_rev(s, opcode, u, is_q, size, rn, rd);
         return;
-    case 0x5: /* CNT, NOT, RBIT */
-        if (u && size == 0) {
-            /* NOT */
-            break;
-        } else if (u && size == 1) {
-            /* RBIT */
-            break;
-        } else if (!u && size == 0) {
-            /* CNT */
-            break;
-        }
-        unallocated_encoding(s);
-        return;
     case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
     case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
         if (size == 3) {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     default:
     case 0x3: /* SUQADD, USQADD */
     case 0x4: /* CLS, CLZ */
+    case 0x5: /* CNT, NOT, RBIT */
     case 0x7: /* SQABS, SQNEG */
     case 0xb: /* ABS, NEG */
         unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     }
 
     switch (opcode) {
-    case 0x5: /* CNT, NOT, RBIT */
-        if (!u) {
-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cnt, 0);
-        } else if (size) {
-            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_rbit, 0);
-        } else {
-            gen_gvec_fn2(s, is_q, rd, rn, tcg_gen_gvec_not, 0);
-        }
-        return;
     case 0x8: /* CMGT, CMGE */
         if (u) {
             gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
         return;
     case 0x4: /* CLZ, CLS */
+    case 0x5: /* CNT, NOT, RBIT */
     case 0xb:
         g_assert_not_reached();
     }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-42-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      | 10 ++++
 target/arm/tcg/translate-a64.c | 94 +++++++++++-----------------------
 2 files changed, 40 insertions(+), 64 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-43-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate.h      |  6 +++
 target/arm/tcg/gengvec.c        | 58 ++++++++++++++++++++++
 target/arm/tcg/translate-neon.c | 88 +++++++--------------------------
 3 files changed, 81 insertions(+), 71 deletions(-)

diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate.h
+++ b/target/arm/tcg/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_cnt(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                   uint32_t opr_sz, uint32_t max_sz);
 void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                    uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_rev16(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz);
 
 /*
  * Forward to the isar_feature_* tests given a DisasContext pointer.
diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/gengvec.c
+++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_rbit(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
     tcg_gen_gvec_2_ool(rd_ofs, rn_ofs, opr_sz, max_sz, 0,
                        gen_helper_gvec_rbit_b);
 }
+
+void gen_gvec_rev16(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz)
+{
+    assert(vece == MO_8);
+    tcg_gen_gvec_rotli(MO_16, rd_ofs, rn_ofs, 8, opr_sz, max_sz);
+}
+
+static void gen_bswap32_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    tcg_gen_bswap64_i64(d, n);
+    tcg_gen_rotli_i64(d, d, 32);
+}
+
+void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz)
+{
+    static const GVecGen2 g = {
+        .fni8 = gen_bswap32_i64,
+        .fni4 = tcg_gen_bswap32_i32,
+        .prefer_i64 = TCG_TARGET_REG_BITS == 64,
+        .vece = MO_32
+    };
+
+    switch (vece) {
+    case MO_16:
+        tcg_gen_gvec_rotli(MO_32, rd_ofs, rn_ofs, 16, opr_sz, max_sz);
+        break;
+    case MO_8:
+        tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g);
+        break;
+    default:
+        g_assert_not_reached();
+    }
+}
+
+void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                    uint32_t opr_sz, uint32_t max_sz)
+{
+    static const GVecGen2 g[] = {
+        { .fni8 = tcg_gen_bswap64_i64,
+          .vece = MO_64 },
+        { .fni8 = tcg_gen_hswap_i64,
+          .vece = MO_64 },
+    };
+
+    switch (vece) {
+    case MO_32:
+        tcg_gen_gvec_rotli(MO_64, rd_ofs, rn_ofs, 32, opr_sz, max_sz);
+        break;
+    case MO_8:
+    case MO_16:
+        tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+        break;
+    default:
+        g_assert_not_reached();
+    }
+}
diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-neon.c
+++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP_scalar(DisasContext *s, arg_VDUP_scalar *a)
     return true;
 }
 
-static bool trans_VREV64(DisasContext *s, arg_VREV64 *a)
-{
-    int pass, half;
-    TCGv_i32 tmp[2];
-
-    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-        return false;
-    }
-
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vm) & 0x10)) {
-        return false;
-    }
-
-    if ((a->vd | a->vm) & a->q) {
-        return false;
-    }
-
-    if (a->size == 3) {
-        return false;
-    }
-
-    if (!vfp_access_check(s)) {
-        return true;
-    }
-
-    tmp[0] = tcg_temp_new_i32();
-    tmp[1] = tcg_temp_new_i32();
-
-    for (pass = 0; pass < (a->q ? 2 : 1); pass++) {
-        for (half = 0; half < 2; half++) {
-            read_neon_element32(tmp[half], a->vm, pass * 2 + half, MO_32);
-            switch (a->size) {
-            case 0:
-                tcg_gen_bswap32_i32(tmp[half], tmp[half]);
-                break;
-            case 1:
-                gen_swap_half(tmp[half], tmp[half]);
-                break;
-            case 2:
-                break;
-            default:
-                g_assert_not_reached();
-            }
-        }
-        write_neon_element32(tmp[1], a->vd, pass * 2, MO_32);
-        write_neon_element32(tmp[0], a->vd, pass * 2 + 1, MO_32);
-    }
-    return true;
-}
-
 static bool do_2misc_pairwise(DisasContext *s, arg_2misc *a,
                               NeonGenWidenFn *widenfn,
                               NeonGenTwo64OpFn *opfn,
@@ -XXX,XX +XXX,XX @@ DO_2MISC_VEC(VCGE0, gen_gvec_cge0)
 DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
 DO_2MISC_VEC(VCLS, gen_gvec_cls)
 DO_2MISC_VEC(VCLZ, gen_gvec_clz)
+DO_2MISC_VEC(VREV64, gen_gvec_rev64)
 
 static bool trans_VMVN(DisasContext *s, arg_2misc *a)
 {
@@ -XXX,XX +XXX,XX @@ static bool trans_VCNT(DisasContext *s, arg_2misc *a)
     return do_2misc_vec(s, a, gen_gvec_cnt);
 }
 
+static bool trans_VREV16(DisasContext *s, arg_2misc *a)
+{
+    if (a->size != 0) {
+        return false;
+    }
+    return do_2misc_vec(s, a, gen_gvec_rev16);
+}
+
+static bool trans_VREV32(DisasContext *s, arg_2misc *a)
+{
+    if (a->size != 0 && a->size != 1) {
+        return false;
+    }
+    return do_2misc_vec(s, a, gen_gvec_rev32);
+}
+
 #define WRAP_2M_3_OOL_FN(WRAPNAME, FUNC, DATA)                          \
     static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
                          uint32_t rm_ofs, uint32_t oprsz,               \
@@ -XXX,XX +XXX,XX @@ static bool do_2misc(DisasContext *s, arg_2misc *a, NeonGenOneOpFn *fn)
     return true;
 }
 
-static bool trans_VREV32(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenOneOpFn * const fn[] = {
-        tcg_gen_bswap32_i32,
-        gen_swap_half,
-        NULL,
-        NULL,
-    };
-    return do_2misc(s, a, fn[a->size]);
-}
-
-static bool trans_VREV16(DisasContext *s, arg_2misc *a)
-{
-    if (a->size != 0) {
-        return false;
-    }
-    return do_2misc(s, a, gen_rev16);
-}
-
 static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
                        uint32_t oprsz, uint32_t maxsz)
 {
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes REV16, REV32, REV64.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-44-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  5 +++
 target/arm/tcg/translate-a64.c | 79 +++-------------------------------
 2 files changed, 10 insertions(+), 74 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 
 @qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
 @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
+@qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
 @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
 
 @qrrr_b         . q:1 ...... ... rm:5 ...... rn:5 rd:5  &qrrr_e esz=0
@@ -XXX,XX +XXX,XX @@ CMGE0_v         0.10 1110 ..1 00000 10001 0 ..... .....     @qrr_e
 CMEQ0_v         0.00 1110 ..1 00000 10011 0 ..... .....     @qrr_e
 CMLE0_v         0.10 1110 ..1 00000 10011 0 ..... .....     @qrr_e
 CMLT0_v         0.00 1110 ..1 00000 10101 0 ..... .....     @qrr_e
+
+REV16_v         0.00 1110 001 00000 00011 0 ..... .....     @qrr_b
+REV32_v         0.10 1110 0.1 00000 00001 0 ..... .....     @qrr_bh
+REV64_v         0.00 1110 ..1 00000 00001 0 ..... .....     @qrr_e
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(CMGE0_v, do_gvec_fn2, a, gen_gvec_cge0)
 TRANS(CMLT0_v, do_gvec_fn2, a, gen_gvec_clt0)
 TRANS(CMLE0_v, do_gvec_fn2, a, gen_gvec_cle0)
 TRANS(CMEQ0_v, do_gvec_fn2, a, gen_gvec_ceq0)
+TRANS(REV16_v, do_gvec_fn2, a, gen_gvec_rev16)
+TRANS(REV32_v, do_gvec_fn2, a, gen_gvec_rev32)
 
 static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
 {
@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
 
 TRANS(CLS_v, do_gvec_fn2_bhs, a, gen_gvec_cls)
 TRANS(CLZ_v, do_gvec_fn2_bhs, a, gen_gvec_clz)
+TRANS(REV64_v, do_gvec_fn2_bhs, a, gen_gvec_rev64)
 
 /* Common vector code for handling integer to FP conversion */
 static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
     }
 }
 
-static void handle_rev(DisasContext *s, int opcode, bool u,
-                       bool is_q, int size, int rn, int rd)
-{
-    int op = (opcode << 1) | u;
-    int opsz = op + size;
-    int grp_size = 3 - opsz;
-    int dsize = is_q ? 128 : 64;
-    int i;
-
-    if (opsz >= 3) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    if (!fp_access_check(s)) {
-        return;
-    }
-
-    if (size == 0) {
-        /* Special case bytes, use bswap op on each group of elements */
-        int groups = dsize / (8 << grp_size);
-
-        for (i = 0; i < groups; i++) {
-            TCGv_i64 tcg_tmp = tcg_temp_new_i64();
-
-            read_vec_element(s, tcg_tmp, rn, i, grp_size);
-            switch (grp_size) {
-            case MO_16:
-                tcg_gen_bswap16_i64(tcg_tmp, tcg_tmp, TCG_BSWAP_IZ);
-                break;
-            case MO_32:
-                tcg_gen_bswap32_i64(tcg_tmp, tcg_tmp, TCG_BSWAP_IZ);
-                break;
-            case MO_64:
-                tcg_gen_bswap64_i64(tcg_tmp, tcg_tmp);
-                break;
-            default:
-                g_assert_not_reached();
-            }
-            write_vec_element(s, tcg_tmp, rd, i, grp_size);
-        }
-        clear_vec_high(s, is_q, rd);
-    } else {
-        int revmask = (1 << grp_size) - 1;
-        int esize = 8 << size;
-        int elements = dsize / esize;
-        TCGv_i64 tcg_rn = tcg_temp_new_i64();
-        TCGv_i64 tcg_rd[2];
-
-        for (i = 0; i < 2; i++) {
-            tcg_rd[i] = tcg_temp_new_i64();
-            tcg_gen_movi_i64(tcg_rd[i], 0);
-        }
-
-        for (i = 0; i < elements; i++) {
-            int e_rev = (i & 0xf) ^ revmask;
-            int w = (e_rev * esize) / 64;
-            int o = (e_rev * esize) % 64;
-
-            read_vec_element(s, tcg_rn, rn, i, size);
-            tcg_gen_deposit_i64(tcg_rd[w], tcg_rd[w], tcg_rn, o, esize);
-        }
-
-        for (i = 0; i < 2; i++) {
-            write_vec_element(s, tcg_rd[i], rd, i, MO_64);
-        }
-        clear_vec_high(s, true, rd);
-    }
-}
-
 static void handle_2misc_pairwise(DisasContext *s, int opcode, bool u,
                                   bool is_q, int size, int rn, int rd)
 {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     TCGv_ptr tcg_fpstatus;
 
     switch (opcode) {
-    case 0x0: /* REV64, REV32 */
-    case 0x1: /* REV16 */
-        handle_rev(s, opcode, u, is_q, size, rn, rd);
-        return;
     case 0x12: /* XTN, XTN2, SQXTUN, SQXTUN2 */
     case 0x14: /* SQXTN, SQXTN2, UQXTN, UQXTN2 */
         if (size == 3) {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         break;
     }
     default:
+    case 0x0: /* REV64, REV32 */
+    case 0x1: /* REV16 */
     case 0x3: /* SUQADD, USQADD */
     case 0x4: /* CLS, CLZ */
     case 0x5: /* CNT, NOT, RBIT */
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Move from helper-a64.c to neon_helper.c so that these
functions are available for arm32 code as well.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-45-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h          |  2 ++
 target/arm/tcg/helper-a64.h  |  2 --
 target/arm/tcg/helper-a64.c  | 43 ------------------------------------
 target/arm/tcg/neon_helper.c | 43 ++++++++++++++++++++++++++++++++++++
 4 files changed, 45 insertions(+), 45 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_addl_u16, i64, i64, i64)
 DEF_HELPER_2(neon_addl_u32, i64, i64, i64)
 DEF_HELPER_2(neon_paddl_u16, i64, i64, i64)
 DEF_HELPER_2(neon_paddl_u32, i64, i64, i64)
+DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
+DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_2(neon_subl_u16, i64, i64, i64)
 DEF_HELPER_2(neon_subl_u32, i64, i64, i64)
 DEF_HELPER_3(neon_addl_saturate_s32, i64, env, i64, i64)
diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.h
+++ b/target/arm/tcg/helper-a64.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(recpsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
 DEF_HELPER_FLAGS_3(rsqrtsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
 DEF_HELPER_FLAGS_3(rsqrtsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
 DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
-DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_FLAGS_1(neon_addlp_u8, TCG_CALL_NO_RWG_SE, i64, i64)
-DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_FLAGS_1(neon_addlp_u16, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
 DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.c
+++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, void *fpstp)
     return float64_muladd(a, b, float64_three, float_muladd_halve_result, fpst);
 }
 
-/* Pairwise long add: add pairs of adjacent elements into
- * double-width elements in the result (eg _s8 is an 8x8->16 op)
- */
-uint64_t HELPER(neon_addlp_s8)(uint64_t a)
-{
-    uint64_t nsignmask = 0x0080008000800080ULL;
-    uint64_t wsignmask = 0x8000800080008000ULL;
-    uint64_t elementmask = 0x00ff00ff00ff00ffULL;
-    uint64_t tmp1, tmp2;
-    uint64_t res, signres;
-
-    /* Extract odd elements, sign extend each to a 16 bit field */
-    tmp1 = a & elementmask;
-    tmp1 ^= nsignmask;
-    tmp1 |= wsignmask;
-    tmp1 = (tmp1 - nsignmask) ^ wsignmask;
-    /* Ditto for the even elements */
-    tmp2 = (a >> 8) & elementmask;
-    tmp2 ^= nsignmask;
-    tmp2 |= wsignmask;
-    tmp2 = (tmp2 - nsignmask) ^ wsignmask;
-
-    /* calculate the result by summing bits 0..14, 16..22, etc,
-     * and then adjusting the sign bits 15, 23, etc manually.
-     * This ensures the addition can't overflow the 16 bit field.
-     */
-    signres = (tmp1 ^ tmp2) & wsignmask;
-    res = (tmp1 & ~wsignmask) + (tmp2 & ~wsignmask);
-    res ^= signres;
-
-    return res;
-}
-
 uint64_t HELPER(neon_addlp_u8)(uint64_t a)
 {
     uint64_t tmp;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addlp_u8)(uint64_t a)
     return tmp;
 }
 
-uint64_t HELPER(neon_addlp_s16)(uint64_t a)
-{
-    int32_t reslo, reshi;
-
-    reslo = (int32_t)(int16_t)a + (int32_t)(int16_t)(a >> 16);
-    reshi = (int32_t)(int16_t)(a >> 32) + (int32_t)(int16_t)(a >> 48);
-
-    return (uint32_t)reslo | (((uint64_t)reshi) << 32);
-}
-
 uint64_t HELPER(neon_addlp_u16)(uint64_t a)
 {
     uint64_t tmp;
diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/neon_helper.c
+++ b/target/arm/tcg/neon_helper.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_paddl_u32)(uint64_t a, uint64_t b)
     return low + ((uint64_t)high << 32);
 }
 
+/* Pairwise long add: add pairs of adjacent elements into
+ * double-width elements in the result (eg _s8 is an 8x8->16 op)
+ */
+uint64_t HELPER(neon_addlp_s8)(uint64_t a)
+{
+    uint64_t nsignmask = 0x0080008000800080ULL;
+    uint64_t wsignmask = 0x8000800080008000ULL;
+    uint64_t elementmask = 0x00ff00ff00ff00ffULL;
+    uint64_t tmp1, tmp2;
+    uint64_t res, signres;
+
+    /* Extract odd elements, sign extend each to a 16 bit field */
+    tmp1 = a & elementmask;
+    tmp1 ^= nsignmask;
+    tmp1 |= wsignmask;
+    tmp1 = (tmp1 - nsignmask) ^ wsignmask;
+    /* Ditto for the even elements */
+    tmp2 = (a >> 8) & elementmask;
+    tmp2 ^= nsignmask;
+    tmp2 |= wsignmask;
+    tmp2 = (tmp2 - nsignmask) ^ wsignmask;
+
+    /* calculate the result by summing bits 0..14, 16..22, etc,
+     * and then adjusting the sign bits 15, 23, etc manually.
+     * This ensures the addition can't overflow the 16 bit field.
+     */
+    signres = (tmp1 ^ tmp2) & wsignmask;
+    res = (tmp1 & ~wsignmask) + (tmp2 & ~wsignmask);
+    res ^= signres;
+
+    return res;
+}
+
+uint64_t HELPER(neon_addlp_s16)(uint64_t a)
+{
+    int32_t reslo, reshi;
+
+    reslo = (int32_t)(int16_t)a + (int32_t)(int16_t)(a >> 16);
+    reshi = (int32_t)(int16_t)(a >> 32) + (int32_t)(int16_t)(a >> 48);
+
+    return (uint32_t)reslo | (((uint64_t)reshi) << 32);
+}
+
 uint64_t HELPER(neon_subl_u16)(uint64_t a, uint64_t b)
 {
     uint64_t mask;
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Pairwise addition with and without accumulation.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-46-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h             |   2 -
 target/arm/tcg/translate.h      |   9 ++
 target/arm/tcg/gengvec.c        | 230 ++++++++++++++++++++++++++++++++
 target/arm/tcg/neon_helper.c    |  22 ---
 target/arm/tcg/translate-neon.c | 150 +--------------------
 5 files changed, 243 insertions(+), 170 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(neon_widen_s16, i64, i32)
 
 DEF_HELPER_2(neon_addl_u16, i64, i64, i64)
 DEF_HELPER_2(neon_addl_u32, i64, i64, i64)
-DEF_HELPER_2(neon_paddl_u16, i64, i64, i64)
-DEF_HELPER_2(neon_paddl_u32, i64, i64, i64)
 DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_2(neon_subl_u16, i64, i64, i64)
diff --git a/target/arm/tcg/translate.h b/target/arm/tcg/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate.h
+++ b/target/arm/tcg/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_rev32(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                     uint32_t opr_sz, uint32_t max_sz);
 
+void gen_gvec_saddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_sadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_uaddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz);
+void gen_gvec_uadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz);
+
 /*
  * Forward to the isar_feature_* tests given a DisasContext pointer.
  */
diff --git a/target/arm/tcg/gengvec.c b/target/arm/tcg/gengvec.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/gengvec.c
+++ b/target/arm/tcg/gengvec.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_rev64(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
         g_assert_not_reached();
     }
 }
+
+static void gen_saddlp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
+{
+    int half = 4 << vece;
+    TCGv_vec t = tcg_temp_new_vec_matching(d);
+
+    tcg_gen_shli_vec(vece, t, n, half);
+    tcg_gen_sari_vec(vece, d, n, half);
+    tcg_gen_sari_vec(vece, t, t, half);
+    tcg_gen_add_vec(vece, d, d, t);
+}
+
+static void gen_saddlp_s_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    tcg_gen_ext32s_i64(t, n);
+    tcg_gen_sari_i64(d, n, 32);
+    tcg_gen_add_i64(d, d, t);
+}
+
+void gen_gvec_saddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz)
+{
+    static const TCGOpcode vecop_list[] = {
+        INDEX_op_sari_vec, INDEX_op_shli_vec, INDEX_op_add_vec, 0
+    };
+    static const GVecGen2 g[] = {
+        { .fniv = gen_saddlp_vec,
+          .fni8 = gen_helper_neon_addlp_s8,
+          .opt_opc = vecop_list,
+          .vece = MO_16 },
+        { .fniv = gen_saddlp_vec,
+          .fni8 = gen_helper_neon_addlp_s16,
+          .opt_opc = vecop_list,
+          .vece = MO_32 },
+        { .fniv = gen_saddlp_vec,
+          .fni8 = gen_saddlp_s_i64,
+          .opt_opc = vecop_list,
+          .vece = MO_64 },
+    };
+    assert(vece <= MO_32);
+    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+}
+
+static void gen_sadalp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
+{
+    TCGv_vec t = tcg_temp_new_vec_matching(d);
+
+    gen_saddlp_vec(vece, t, n);
+    tcg_gen_add_vec(vece, d, d, t);
+}
+
+static void gen_sadalp_b_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    gen_helper_neon_addlp_s8(t, n);
+    tcg_gen_vec_add16_i64(d, d, t);
+}
+
+static void gen_sadalp_h_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    gen_helper_neon_addlp_s16(t, n);
+    tcg_gen_vec_add32_i64(d, d, t);
+}
+
+static void gen_sadalp_s_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    gen_saddlp_s_i64(t, n);
+    tcg_gen_add_i64(d, d, t);
+}
+
+void gen_gvec_sadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz)
+{
+    static const TCGOpcode vecop_list[] = {
+        INDEX_op_sari_vec, INDEX_op_shli_vec, INDEX_op_add_vec, 0
+    };
+    static const GVecGen2 g[] = {
+        { .fniv = gen_sadalp_vec,
+          .fni8 = gen_sadalp_b_i64,
+          .opt_opc = vecop_list,
+          .load_dest = true,
+          .vece = MO_16 },
+        { .fniv = gen_sadalp_vec,
+          .fni8 = gen_sadalp_h_i64,
+          .opt_opc = vecop_list,
+          .load_dest = true,
+          .vece = MO_32 },
+        { .fniv = gen_sadalp_vec,
+          .fni8 = gen_sadalp_s_i64,
+          .opt_opc = vecop_list,
+          .load_dest = true,
+          .vece = MO_64 },
+    };
+    assert(vece <= MO_32);
+    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+}
+
+static void gen_uaddlp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
+{
+    int half = 4 << vece;
+    TCGv_vec t = tcg_temp_new_vec_matching(d);
+    TCGv_vec m = tcg_constant_vec_matching(d, vece, MAKE_64BIT_MASK(0, half));
+
+    tcg_gen_shri_vec(vece, t, n, half);
+    tcg_gen_and_vec(vece, d, n, m);
+    tcg_gen_add_vec(vece, d, d, t);
+}
+
+static void gen_uaddlp_b_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+    TCGv_i64 m = tcg_constant_i64(dup_const(MO_16, 0xff));
+
+    tcg_gen_shri_i64(t, n, 8);
+    tcg_gen_and_i64(d, n, m);
+    tcg_gen_and_i64(t, t, m);
+    /* No carry between widened unsigned elements. */
+    tcg_gen_add_i64(d, d, t);
+}
+
+static void gen_uaddlp_h_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+    TCGv_i64 m = tcg_constant_i64(dup_const(MO_32, 0xffff));
+
+    tcg_gen_shri_i64(t, n, 16);
+    tcg_gen_and_i64(d, n, m);
+    tcg_gen_and_i64(t, t, m);
+    /* No carry between widened unsigned elements. */
+    tcg_gen_add_i64(d, d, t);
+}
+
+static void gen_uaddlp_s_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    tcg_gen_ext32u_i64(t, n);
+    tcg_gen_shri_i64(d, n, 32);
+    tcg_gen_add_i64(d, d, t);
+}
+
+void gen_gvec_uaddlp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz)
+{
+    static const TCGOpcode vecop_list[] = {
+        INDEX_op_shri_vec, INDEX_op_add_vec, 0
+    };
+    static const GVecGen2 g[] = {
+        { .fniv = gen_uaddlp_vec,
+          .fni8 = gen_uaddlp_b_i64,
+          .opt_opc = vecop_list,
+          .vece = MO_16 },
+        { .fniv = gen_uaddlp_vec,
+          .fni8 = gen_uaddlp_h_i64,
+          .opt_opc = vecop_list,
+          .vece = MO_32 },
+        { .fniv = gen_uaddlp_vec,
+          .fni8 = gen_uaddlp_s_i64,
+          .opt_opc = vecop_list,
+          .vece = MO_64 },
+    };
+    assert(vece <= MO_32);
+    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+}
+
+static void gen_uadalp_vec(unsigned vece, TCGv_vec d, TCGv_vec n)
+{
+    TCGv_vec t = tcg_temp_new_vec_matching(d);
+
+    gen_uaddlp_vec(vece, t, n);
+    tcg_gen_add_vec(vece, d, d, t);
+}
+
+static void gen_uadalp_b_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    gen_uaddlp_b_i64(t, n);
+    tcg_gen_vec_add16_i64(d, d, t);
+}
+
+static void gen_uadalp_h_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    gen_uaddlp_h_i64(t, n);
+    tcg_gen_vec_add32_i64(d, d, t);
+}
+
+static void gen_uadalp_s_i64(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i64 t = tcg_temp_new_i64();
+
+    gen_uaddlp_s_i64(t, n);
+    tcg_gen_add_i64(d, d, t);
+}
+
+void gen_gvec_uadalp(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+                     uint32_t opr_sz, uint32_t max_sz)
+{
+    static const TCGOpcode vecop_list[] = {
+        INDEX_op_shri_vec, INDEX_op_add_vec, 0
+    };
+    static const GVecGen2 g[] = {
+        { .fniv = gen_uadalp_vec,
+          .fni8 = gen_uadalp_b_i64,
+          .load_dest = true,
+          .opt_opc = vecop_list,
+          .vece = MO_16 },
+        { .fniv = gen_uadalp_vec,
+          .fni8 = gen_uadalp_h_i64,
+          .load_dest = true,
+          .opt_opc = vecop_list,
+          .vece = MO_32 },
+        { .fniv = gen_uadalp_vec,
+          .fni8 = gen_uadalp_s_i64,
+          .load_dest = true,
+          .opt_opc = vecop_list,
+          .vece = MO_64 },
+    };
+    assert(vece <= MO_32);
+    tcg_gen_gvec_2(rd_ofs, rn_ofs, opr_sz, max_sz, &g[vece]);
+}
diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/neon_helper.c
+++ b/target/arm/tcg/neon_helper.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addl_u32)(uint64_t a, uint64_t b)
     return (a + b) ^ mask;
 }
 
-uint64_t HELPER(neon_paddl_u16)(uint64_t a, uint64_t b)
-{
-    uint64_t tmp;
-    uint64_t tmp2;
-
-    tmp = a & 0x0000ffff0000ffffull;
-    tmp += (a >> 16) & 0x0000ffff0000ffffull;
-    tmp2 = b & 0xffff0000ffff0000ull;
-    tmp2 += (b << 16) & 0xffff0000ffff0000ull;
-    return    ( tmp         & 0xffff)
-            | ((tmp  >> 16) & 0xffff0000ull)
-            | ((tmp2 << 16) & 0xffff00000000ull)
-            | ( tmp2        & 0xffff000000000000ull);
-}
-
-uint64_t HELPER(neon_paddl_u32)(uint64_t a, uint64_t b)
-{
-    uint32_t low = a + (a >> 32);
-    uint32_t high = b + (b >> 32);
-    return low + ((uint64_t)high << 32);
-}
-
 /* Pairwise long add: add pairs of adjacent elements into
  * double-width elements in the result (eg _s8 is an 8x8->16 op)
  */
diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-neon.c
+++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP_scalar(DisasContext *s, arg_VDUP_scalar *a)
     return true;
 }
 
-static bool do_2misc_pairwise(DisasContext *s, arg_2misc *a,
-                              NeonGenWidenFn *widenfn,
-                              NeonGenTwo64OpFn *opfn,
-                              NeonGenTwo64OpFn *accfn)
-{
-    /*
-     * Pairwise long operations: widen both halves of the pair,
-     * combine the pairs with the opfn, and then possibly accumulate
-     * into the destination with the accfn.
-     */
-    int pass;
-
-    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-        return false;
-    }
-
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vm) & 0x10)) {
-        return false;
-    }
-
-    if ((a->vd | a->vm) & a->q) {
-        return false;
-    }
-
-    if (!widenfn) {
-        return false;
-    }
-
-    if (!vfp_access_check(s)) {
-        return true;
-    }
-
-    for (pass = 0; pass < a->q + 1; pass++) {
-        TCGv_i32 tmp;
-        TCGv_i64 rm0_64, rm1_64, rd_64;
-
-        rm0_64 = tcg_temp_new_i64();
-        rm1_64 = tcg_temp_new_i64();
-        rd_64 = tcg_temp_new_i64();
-
-        tmp = tcg_temp_new_i32();
-        read_neon_element32(tmp, a->vm, pass * 2, MO_32);
-        widenfn(rm0_64, tmp);
-        read_neon_element32(tmp, a->vm, pass * 2 + 1, MO_32);
-        widenfn(rm1_64, tmp);
-
-        opfn(rd_64, rm0_64, rm1_64);
-
-        if (accfn) {
-            TCGv_i64 tmp64 = tcg_temp_new_i64();
-            read_neon_element64(tmp64, a->vd, pass, MO_64);
-            accfn(rd_64, tmp64, rd_64);
-        }
-        write_neon_element64(rd_64, a->vd, pass, MO_64);
-    }
-    return true;
-}
-
-static bool trans_VPADDL_S(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenWidenFn * const widenfn[] = {
-        gen_helper_neon_widen_s8,
-        gen_helper_neon_widen_s16,
-        tcg_gen_ext_i32_i64,
-        NULL,
-    };
-    static NeonGenTwo64OpFn * const opfn[] = {
-        gen_helper_neon_paddl_u16,
-        gen_helper_neon_paddl_u32,
-        tcg_gen_add_i64,
-        NULL,
-    };
-
-    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size], NULL);
-}
-
-static bool trans_VPADDL_U(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenWidenFn * const widenfn[] = {
-        gen_helper_neon_widen_u8,
-        gen_helper_neon_widen_u16,
-        tcg_gen_extu_i32_i64,
-        NULL,
-    };
-    static NeonGenTwo64OpFn * const opfn[] = {
-        gen_helper_neon_paddl_u16,
-        gen_helper_neon_paddl_u32,
-        tcg_gen_add_i64,
-        NULL,
-    };
-
-    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size], NULL);
-}
-
-static bool trans_VPADAL_S(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenWidenFn * const widenfn[] = {
-        gen_helper_neon_widen_s8,
-        gen_helper_neon_widen_s16,
-        tcg_gen_ext_i32_i64,
-        NULL,
-    };
-    static NeonGenTwo64OpFn * const opfn[] = {
-        gen_helper_neon_paddl_u16,
-        gen_helper_neon_paddl_u32,
-        tcg_gen_add_i64,
-        NULL,
-    };
-    static NeonGenTwo64OpFn * const accfn[] = {
-        gen_helper_neon_addl_u16,
-        gen_helper_neon_addl_u32,
-        tcg_gen_add_i64,
-        NULL,
-    };
-
-    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size],
-                             accfn[a->size]);
-}
-
-static bool trans_VPADAL_U(DisasContext *s, arg_2misc *a)
-{
-    static NeonGenWidenFn * const widenfn[] = {
-        gen_helper_neon_widen_u8,
-        gen_helper_neon_widen_u16,
-        tcg_gen_extu_i32_i64,
-        NULL,
-    };
-    static NeonGenTwo64OpFn * const opfn[] = {
-        gen_helper_neon_paddl_u16,
-        gen_helper_neon_paddl_u32,
-        tcg_gen_add_i64,
-        NULL,
-    };
-    static NeonGenTwo64OpFn * const accfn[] = {
-        gen_helper_neon_addl_u16,
-        gen_helper_neon_addl_u32,
-        tcg_gen_add_i64,
-        NULL,
-    };
-
-    return do_2misc_pairwise(s, a, widenfn[a->size], opfn[a->size],
-                             accfn[a->size]);
-}
-
 typedef void ZipFn(TCGv_ptr, TCGv_ptr);
 
 static bool do_zip_uzp(DisasContext *s, arg_2misc *a,
@@ -XXX,XX +XXX,XX @@ DO_2MISC_VEC(VCLT0, gen_gvec_clt0)
 DO_2MISC_VEC(VCLS, gen_gvec_cls)
 DO_2MISC_VEC(VCLZ, gen_gvec_clz)
 DO_2MISC_VEC(VREV64, gen_gvec_rev64)
+DO_2MISC_VEC(VPADDL_S, gen_gvec_saddlp)
+DO_2MISC_VEC(VPADDL_U, gen_gvec_uaddlp)
+DO_2MISC_VEC(VPADAL_S, gen_gvec_sadalp)
+DO_2MISC_VEC(VPADAL_U, gen_gvec_uadalp)
 
 static bool trans_VMVN(DisasContext *s, arg_2misc *a)
 {
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes SADDLP, UADDLP, SADALP, UADALP.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-47-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/helper-a64.h    |  2 -
 target/arm/tcg/a64.decode      |  5 ++
 target/arm/tcg/helper-a64.c    | 18 --------
 target/arm/tcg/translate-a64.c | 84 +++-------------------------------
 4 files changed, 11 insertions(+), 98 deletions(-)

diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.h
+++ b/target/arm/tcg/helper-a64.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(recpsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
 DEF_HELPER_FLAGS_3(rsqrtsf_f16, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
 DEF_HELPER_FLAGS_3(rsqrtsf_f32, TCG_CALL_NO_RWG, f32, f32, f32, ptr)
 DEF_HELPER_FLAGS_3(rsqrtsf_f64, TCG_CALL_NO_RWG, f64, f64, f64, ptr)
-DEF_HELPER_FLAGS_1(neon_addlp_u8, TCG_CALL_NO_RWG_SE, i64, i64)
-DEF_HELPER_FLAGS_1(neon_addlp_u16, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_FLAGS_2(frecpx_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
 DEF_HELPER_FLAGS_2(frecpx_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
 DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ CMLT0_v         0.00 1110 ..1 00000 10101 0 ..... .....     @qrr_e
 REV16_v         0.00 1110 001 00000 00011 0 ..... .....     @qrr_b
 REV32_v         0.10 1110 0.1 00000 00001 0 ..... .....     @qrr_bh
 REV64_v         0.00 1110 ..1 00000 00001 0 ..... .....     @qrr_e
+
+SADDLP_v        0.00 1110 ..1 00000 00101 0 ..... .....     @qrr_e
+UADDLP_v        0.10 1110 ..1 00000 00101 0 ..... .....     @qrr_e
+SADALP_v        0.00 1110 ..1 00000 01101 0 ..... .....     @qrr_e
+UADALP_v        0.10 1110 ..1 00000 01101 0 ..... .....     @qrr_e
diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.c
+++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrtsf_f64)(float64 a, float64 b, void *fpstp)
     return float64_muladd(a, b, float64_three, float_muladd_halve_result, fpst);
 }
 
-uint64_t HELPER(neon_addlp_u8)(uint64_t a)
-{
-    uint64_t tmp;
-
-    tmp = a & 0x00ff00ff00ff00ffULL;
-    tmp += (a >> 8) & 0x00ff00ff00ff00ffULL;
-    return tmp;
-}
-
-uint64_t HELPER(neon_addlp_u16)(uint64_t a)
-{
-    uint64_t tmp;
-
-    tmp = a & 0x0000ffff0000ffffULL;
-    tmp += (a >> 16) & 0x0000ffff0000ffffULL;
-    return tmp;
-}
-
 /* Floating-point reciprocal exponent - see FPRecpX in ARM ARM */
 uint32_t HELPER(frecpx_f16)(uint32_t a, void *fpstp)
 {
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_gvec_fn2_bhs(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
 TRANS(CLS_v, do_gvec_fn2_bhs, a, gen_gvec_cls)
 TRANS(CLZ_v, do_gvec_fn2_bhs, a, gen_gvec_clz)
 TRANS(REV64_v, do_gvec_fn2_bhs, a, gen_gvec_rev64)
+TRANS(SADDLP_v, do_gvec_fn2_bhs, a, gen_gvec_saddlp)
+TRANS(UADDLP_v, do_gvec_fn2_bhs, a, gen_gvec_uaddlp)
+TRANS(SADALP_v, do_gvec_fn2_bhs, a, gen_gvec_sadalp)
+TRANS(UADALP_v, do_gvec_fn2_bhs, a, gen_gvec_uadalp)
 
 /* Common vector code for handling integer to FP conversion */
 static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
     }
 }
 
-static void handle_2misc_pairwise(DisasContext *s, int opcode, bool u,
-                                  bool is_q, int size, int rn, int rd)
-{
-    /* Implement the pairwise operations from 2-misc:
-     * SADDLP, UADDLP, SADALP, UADALP.
-     * These all add pairs of elements in the input to produce a
-     * double-width result element in the output (possibly accumulating).
-     */
-    bool accum = (opcode == 0x6);
-    int maxpass = is_q ? 2 : 1;
-    int pass;
-    TCGv_i64 tcg_res[2];
-
-    if (size == 2) {
-        /* 32 + 32 -> 64 op */
-        MemOp memop = size + (u ? 0 : MO_SIGN);
-
-        for (pass = 0; pass < maxpass; pass++) {
-            TCGv_i64 tcg_op1 = tcg_temp_new_i64();
-            TCGv_i64 tcg_op2 = tcg_temp_new_i64();
-
-            tcg_res[pass] = tcg_temp_new_i64();
-
-            read_vec_element(s, tcg_op1, rn, pass * 2, memop);
-            read_vec_element(s, tcg_op2, rn, pass * 2 + 1, memop);
-            tcg_gen_add_i64(tcg_res[pass], tcg_op1, tcg_op2);
-            if (accum) {
-                read_vec_element(s, tcg_op1, rd, pass, MO_64);
-                tcg_gen_add_i64(tcg_res[pass], tcg_res[pass], tcg_op1);
-            }
-        }
-    } else {
-        for (pass = 0; pass < maxpass; pass++) {
-            TCGv_i64 tcg_op = tcg_temp_new_i64();
-            NeonGenOne64OpFn *genfn;
-            static NeonGenOne64OpFn * const fns[2][2] = {
-                { gen_helper_neon_addlp_s8,  gen_helper_neon_addlp_u8 },
-                { gen_helper_neon_addlp_s16,  gen_helper_neon_addlp_u16 },
-            };
-
-            genfn = fns[size][u];
-
-            tcg_res[pass] = tcg_temp_new_i64();
-
-            read_vec_element(s, tcg_op, rn, pass, MO_64);
-            genfn(tcg_res[pass], tcg_op);
-
-            if (accum) {
-                read_vec_element(s, tcg_op, rd, pass, MO_64);
-                if (size == 0) {
-                    gen_helper_neon_addl_u16(tcg_res[pass],
-                                             tcg_res[pass], tcg_op);
-                } else {
-                    gen_helper_neon_addl_u32(tcg_res[pass],
-                                             tcg_res[pass], tcg_op);
-                }
-            }
-        }
-    }
-    if (!is_q) {
-        tcg_res[1] = tcg_constant_i64(0);
-    }
-    for (pass = 0; pass < 2; pass++) {
-        write_vec_element(s, tcg_res[pass], rd, pass, MO_64);
-    }
-}
-
 static void handle_shll(DisasContext *s, bool is_q, int size, int rn, int rd)
 {
     /* Implement SHLL and SHLL2 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
 
         handle_2misc_narrow(s, false, opcode, u, is_q, size, rn, rd);
         return;
-    case 0x2: /* SADDLP, UADDLP */
-    case 0x6: /* SADALP, UADALP */
-        if (size == 3) {
-            unallocated_encoding(s);
-            return;
-        }
-        if (!fp_access_check(s)) {
-            return;
-        }
-        handle_2misc_pairwise(s, opcode, u, is_q, size, rn, rd);
-        return;
     case 0x13: /* SHLL, SHLL2 */
         if (u == 0 || size == 3) {
             unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     default:
     case 0x0: /* REV64, REV32 */
     case 0x1: /* REV16 */
+    case 0x2: /* SADDLP, UADDLP */
     case 0x3: /* SUQADD, USQADD */
     case 0x4: /* CLS, CLZ */
     case 0x5: /* CNT, NOT, RBIT */
+    case 0x6: /* SADALP, UADALP */
     case 0x7: /* SQABS, SQNEG */
     case 0x8: /* CMGT, CMGE */
     case 0x9: /* CMEQ, CMLE */
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

These have generic equivalents: tcg_gen_vec_{add,sub}{16,32}_i64.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-48-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h             |  4 ----
 target/arm/tcg/neon_helper.c    | 36 ---------------------------------
 target/arm/tcg/translate-neon.c | 22 ++++++++++----------
 3 files changed, 11 insertions(+), 51 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(neon_widen_s8, i64, i32)
 DEF_HELPER_1(neon_widen_u16, i64, i32)
 DEF_HELPER_1(neon_widen_s16, i64, i32)
 
-DEF_HELPER_2(neon_addl_u16, i64, i64, i64)
-DEF_HELPER_2(neon_addl_u32, i64, i64, i64)
 DEF_HELPER_FLAGS_1(neon_addlp_s8, TCG_CALL_NO_RWG_SE, i64, i64)
 DEF_HELPER_FLAGS_1(neon_addlp_s16, TCG_CALL_NO_RWG_SE, i64, i64)
-DEF_HELPER_2(neon_subl_u16, i64, i64, i64)
-DEF_HELPER_2(neon_subl_u32, i64, i64, i64)
 DEF_HELPER_3(neon_addl_saturate_s32, i64, env, i64, i64)
 DEF_HELPER_3(neon_addl_saturate_s64, i64, env, i64, i64)
 DEF_HELPER_2(neon_abdl_u16, i64, i32, i32)
diff --git a/target/arm/tcg/neon_helper.c b/target/arm/tcg/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/neon_helper.c
+++ b/target/arm/tcg/neon_helper.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_widen_s16)(uint32_t x)
     return ((uint32_t)(int16_t)x) | (high << 32);
 }
 
-uint64_t HELPER(neon_addl_u16)(uint64_t a, uint64_t b)
-{
-    uint64_t mask;
-    mask = (a ^ b) & 0x8000800080008000ull;
-    a &= ~0x8000800080008000ull;
-    b &= ~0x8000800080008000ull;
-    return (a + b) ^ mask;
-}
-
-uint64_t HELPER(neon_addl_u32)(uint64_t a, uint64_t b)
-{
-    uint64_t mask;
-    mask = (a ^ b) & 0x8000000080000000ull;
-    a &= ~0x8000000080000000ull;
-    b &= ~0x8000000080000000ull;
-    return (a + b) ^ mask;
-}
-
 /* Pairwise long add: add pairs of adjacent elements into
  * double-width elements in the result (eg _s8 is an 8x8->16 op)
  */
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addlp_s16)(uint64_t a)
     return (uint32_t)reslo | (((uint64_t)reshi) << 32);
 }
 
-uint64_t HELPER(neon_subl_u16)(uint64_t a, uint64_t b)
-{
-    uint64_t mask;
-    mask = (a ^ ~b) & 0x8000800080008000ull;
-    a |= 0x8000800080008000ull;
-    b &= ~0x8000800080008000ull;
-    return (a - b) ^ mask;
-}
-
-uint64_t HELPER(neon_subl_u32)(uint64_t a, uint64_t b)
-{
-    uint64_t mask;
-    mask = (a ^ ~b) & 0x8000000080000000ull;
-    a |= 0x8000000080000000ull;
-    b &= ~0x8000000080000000ull;
-    return (a - b) ^ mask;
-}
-
 uint64_t HELPER(neon_addl_saturate_s32)(CPUARMState *env, uint64_t a, uint64_t b)
 {
     uint32_t x, y;
diff --git a/target/arm/tcg/translate-neon.c b/target/arm/tcg/translate-neon.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-neon.c
+++ b/target/arm/tcg/translate-neon.c
@@ -XXX,XX +XXX,XX @@ static bool do_prewiden_3d(DisasContext *s, arg_3diff *a,
             NULL, NULL,                                                 \
         };                                                              \
         static NeonGenTwo64OpFn * const addfn[] = {                     \
-            gen_helper_neon_##OP##l_u16,                                \
-            gen_helper_neon_##OP##l_u32,                                \
+            tcg_gen_vec_##OP##16_i64,                                   \
+            tcg_gen_vec_##OP##32_i64,                                   \
             tcg_gen_##OP##_i64,                                         \
             NULL,                                                       \
         };                                                              \
@@ -XXX,XX +XXX,XX @@ static bool do_narrow_3d(DisasContext *s, arg_3diff *a,
     static bool trans_##INSN##_3d(DisasContext *s, arg_3diff *a)        \
     {                                                                   \
         static NeonGenTwo64OpFn * const addfn[] = {                     \
-            gen_helper_neon_##OP##l_u16,                                \
-            gen_helper_neon_##OP##l_u32,                                \
+            tcg_gen_vec_##OP##16_i64,                                   \
+            tcg_gen_vec_##OP##32_i64,                                   \
             tcg_gen_##OP##_i64,                                         \
             NULL,                                                       \
         };                                                              \
@@ -XXX,XX +XXX,XX @@ static bool trans_VABAL_S_3d(DisasContext *s, arg_3diff *a)
         NULL,
     };
     static NeonGenTwo64OpFn * const addfn[] = {
-        gen_helper_neon_addl_u16,
-        gen_helper_neon_addl_u32,
+        tcg_gen_vec_add16_i64,
+        tcg_gen_vec_add32_i64,
         tcg_gen_add_i64,
         NULL,
     };
@@ -XXX,XX +XXX,XX @@ static bool trans_VABAL_U_3d(DisasContext *s, arg_3diff *a)
         NULL,
     };
     static NeonGenTwo64OpFn * const addfn[] = {
-        gen_helper_neon_addl_u16,
-        gen_helper_neon_addl_u32,
+        tcg_gen_vec_add16_i64,
+        tcg_gen_vec_add32_i64,
         tcg_gen_add_i64,
         NULL,
     };
@@ -XXX,XX +XXX,XX @@ static bool trans_VMULL_U_3d(DisasContext *s, arg_3diff *a)
             NULL,                                                       \
         };                                                              \
         static NeonGenTwo64OpFn * const accfn[] = {                     \
-            gen_helper_neon_##ACC##l_u16,                               \
-            gen_helper_neon_##ACC##l_u32,                               \
+            tcg_gen_vec_##ACC##16_i64,                                  \
+            tcg_gen_vec_##ACC##32_i64,                                  \
             tcg_gen_##ACC##_i64,                                        \
             NULL,                                                       \
         };                                                              \
@@ -XXX,XX +XXX,XX @@ static bool trans_VMULL_U_2sc(DisasContext *s, arg_2scalar *a)
         };                                                              \
         static NeonGenTwo64OpFn * const accfn[] = {                     \
             NULL,                                                       \
-            gen_helper_neon_##ACC##l_u32,                               \
+            tcg_gen_vec_##ACC##32_i64,                                  \
             tcg_gen_##ACC##_i64,                                        \
             NULL,                                                       \
         };                                                              \
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

In a couple of places, clearing the entire vector before storing one
element is the easiest solution.  Wrap that into a helper function.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-49-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate-a64.c | 21 ++++++++++++---------
 1 file changed, 12 insertions(+), 9 deletions(-)

diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static TCGv_i32 read_fp_hreg(DisasContext *s, int reg)
     return v;
 }
 
-/* Clear the bits above an N-bit vector, for N = (is_q ? 128 : 64).
+static void clear_vec(DisasContext *s, int rd)
+{
+    unsigned ofs = fp_reg_offset(s, rd, MO_64);
+    unsigned vsz = vec_full_reg_size(s);
+
+    tcg_gen_gvec_dup_imm(MO_64, ofs, vsz, vsz, 0);
+}
+
+/*
+ * Clear the bits above an N-bit vector, for N = (is_q ? 128 : 64).
  * If SVE is not enabled, then there are only 128 bits in the vector.
  */
 static void clear_vec_high(DisasContext *s, bool is_q, int rd)
@@ -XXX,XX +XXX,XX @@ static bool trans_SM3SS1(DisasContext *s, arg_SM3SS1 *a)
         TCGv_i32 tcg_op2 = tcg_temp_new_i32();
         TCGv_i32 tcg_op3 = tcg_temp_new_i32();
         TCGv_i32 tcg_res = tcg_temp_new_i32();
-        unsigned vsz, dofs;
 
         read_vec_element_i32(s, tcg_op1, a->rn, 3, MO_32);
         read_vec_element_i32(s, tcg_op2, a->rm, 3, MO_32);
@@ -XXX,XX +XXX,XX @@ static bool trans_SM3SS1(DisasContext *s, arg_SM3SS1 *a)
         tcg_gen_rotri_i32(tcg_res, tcg_res, 25);
 
         /* Clear the whole register first, then store bits [127:96]. */
-        vsz = vec_full_reg_size(s);
-        dofs = vec_full_reg_offset(s, a->rd);
-        tcg_gen_gvec_dup_imm(MO_64, dofs, vsz, vsz, 0);
+        clear_vec(s, a->rd);
         write_vec_element_i32(s, tcg_res, a->rd, 3, MO_32);
     }
     return true;
@@ -XXX,XX +XXX,XX @@ static bool do_scalar_muladd_widening_idx(DisasContext *s, arg_rrx_e *a,
         TCGv_i64 t0 = tcg_temp_new_i64();
         TCGv_i64 t1 = tcg_temp_new_i64();
         TCGv_i64 t2 = tcg_temp_new_i64();
-        unsigned vsz, dofs;
 
         if (acc) {
             read_vec_element(s, t0, a->rd, 0, a->esz + 1);
@@ -XXX,XX +XXX,XX @@ static bool do_scalar_muladd_widening_idx(DisasContext *s, arg_rrx_e *a,
         fn(t0, t1, t2);
 
         /* Clear the whole register first, then store scalar. */
-        vsz = vec_full_reg_size(s);
-        dofs = vec_full_reg_offset(s, a->rd);
-        tcg_gen_gvec_dup_imm(MO_64, dofs, vsz, vsz, 0);
+        clear_vec(s, a->rd);
         write_vec_element(s, t0, a->rd, 0, a->esz + 1);
     }
     return true;
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-50-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   9 ++
 target/arm/tcg/translate-a64.c | 153 ++++++++++++++++++++-------------
 2 files changed, 102 insertions(+), 60 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-51-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  5 ++
 target/arm/tcg/translate-a64.c | 89 ++++++++++++++++++----------------
 2 files changed, 52 insertions(+), 42 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 
 %rd             0:5
 %esz_sd         22:1 !function=plus_2
+%esz_hs         22:1 !function=plus_1
 %esz_hsd        22:2 !function=xor_2
 %hl             11:1 21:1
 %hlm            11:1 20:2
@@ -XXX,XX +XXX,XX @@
 @qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
 @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
 @qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
+@qrr_hs         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_hs
 @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
 
 @qrrr_b         . q:1 ...... ... rm:5 ...... rn:5 rd:5  &qrrr_e esz=0
@@ -XXX,XX +XXX,XX @@ XTN             0.00 1110 ..1 00001 00101 0 ..... .....     @qrr_e
 SQXTUN_v        0.10 1110 ..1 00001 00101 0 ..... .....     @qrr_e
 SQXTN_v         0.00 1110 ..1 00001 01001 0 ..... .....     @qrr_e
 UQXTN_v         0.10 1110 ..1 00001 01001 0 ..... .....     @qrr_e
+
+FCVTN_v         0.00 1110 0.1 00001 01101 0 ..... .....     @qrr_hs
+BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(SQXTUN_v, do_2misc_narrow_vector, a, f_scalar_sqxtun)
 TRANS(SQXTN_v, do_2misc_narrow_vector, a, f_scalar_sqxtn)
 TRANS(UQXTN_v, do_2misc_narrow_vector, a, f_scalar_uqxtn)
 
+static void gen_fcvtn_hs(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i32 tcg_lo = tcg_temp_new_i32();
+    TCGv_i32 tcg_hi = tcg_temp_new_i32();
+    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
+    TCGv_i32 ahp = get_ahp_flag();
+
+    tcg_gen_extr_i64_i32(tcg_lo, tcg_hi, n);
+    gen_helper_vfp_fcvt_f32_to_f16(tcg_lo, tcg_lo, fpst, ahp);
+    gen_helper_vfp_fcvt_f32_to_f16(tcg_hi, tcg_hi, fpst, ahp);
+    tcg_gen_deposit_i32(tcg_lo, tcg_lo, tcg_hi, 16, 16);
+    tcg_gen_extu_i32_i64(d, tcg_lo);
+}
+
+static void gen_fcvtn_sd(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_i32 tmp = tcg_temp_new_i32();
+    gen_helper_vfp_fcvtsd(tmp, n, tcg_env);
+    tcg_gen_extu_i32_i64(d, tmp);
+}
+
+static ArithOneOp * const f_vector_fcvtn[] = {
+    NULL,
+    gen_fcvtn_hs,
+    gen_fcvtn_sd,
+};
+TRANS(FCVTN_v, do_2misc_narrow_vector, a, f_vector_fcvtn)
+
+static void gen_bfcvtn_hs(TCGv_i64 d, TCGv_i64 n)
+{
+    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
+    TCGv_i32 tmp = tcg_temp_new_i32();
+    gen_helper_bfcvt_pair(tmp, n, fpst);
+    tcg_gen_extu_i32_i64(d, tmp);
+}
+
+static ArithOneOp * const f_vector_bfcvtn[] = {
+    NULL,
+    gen_bfcvtn_hs,
+    NULL,
+};
+TRANS_FEAT(BFCVTN_v, aa64_bf16, do_2misc_narrow_vector, a, f_vector_bfcvtn)
+
 /* Common vector code for handling integer to FP conversion */
 static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
                                    int elements, int is_signed,
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_narrow(DisasContext *s, bool scalar,
         tcg_res[pass] = tcg_temp_new_i64();
 
         switch (opcode) {
-        case 0x16: /* FCVTN, FCVTN2 */
-            /* 32 bit to 16 bit or 64 bit to 32 bit float conversion */
-            if (size == 2) {
-                TCGv_i32 tmp = tcg_temp_new_i32();
-                gen_helper_vfp_fcvtsd(tmp, tcg_op, tcg_env);
-                tcg_gen_extu_i32_i64(tcg_res[pass], tmp);
-            } else {
-                TCGv_i32 tcg_lo = tcg_temp_new_i32();
-                TCGv_i32 tcg_hi = tcg_temp_new_i32();
-                TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-                TCGv_i32 ahp = get_ahp_flag();
-
-                tcg_gen_extr_i64_i32(tcg_lo, tcg_hi, tcg_op);
-                gen_helper_vfp_fcvt_f32_to_f16(tcg_lo, tcg_lo, fpst, ahp);
-                gen_helper_vfp_fcvt_f32_to_f16(tcg_hi, tcg_hi, fpst, ahp);
-                tcg_gen_deposit_i32(tcg_lo, tcg_lo, tcg_hi, 16, 16);
-                tcg_gen_extu_i32_i64(tcg_res[pass], tcg_lo);
-            }
-            break;
-        case 0x36: /* BFCVTN, BFCVTN2 */
-            {
-                TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
-                TCGv_i32 tmp = tcg_temp_new_i32();
-                gen_helper_bfcvt_pair(tmp, tcg_op, fpst);
-                tcg_gen_extu_i32_i64(tcg_res[pass], tmp);
-            }
-            break;
         case 0x56:  /* FCVTXN, FCVTXN2 */
             {
                 /*
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_narrow(DisasContext *s, bool scalar,
         default:
         case 0x12: /* XTN, SQXTUN */
         case 0x14: /* SQXTN, UQXTN */
+        case 0x16: /* FCVTN, FCVTN2 */
+        case 0x36: /* BFCVTN, BFCVTN2 */
             g_assert_not_reached();
         }
 
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                 unallocated_encoding(s);
                 return;
             }
-            /* fall through */
-        case 0x16: /* FCVTN, FCVTN2 */
-            /* handle_2misc_narrow does a 2*size -> size operation, but these
-             * instructions encode the source size rather than dest size.
-             */
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_2misc_narrow(s, false, opcode, 0, is_q, size - 1, rn, rd);
-            return;
-        case 0x36: /* BFCVTN, BFCVTN2 */
-            if (!dc_isar_feature(aa64_bf16, s) || size != 2) {
-                unallocated_encoding(s);
-                return;
-            }
             if (!fp_access_check(s)) {
                 return;
             }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             }
             break;
         default:
+        case 0x16: /* FCVTN, FCVTN2 */
+        case 0x36: /* BFCVTN, BFCVTN2 */
             unallocated_encoding(s);
             return;
         }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_2misc_narrow as this was the last insn decoded
by that function.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-52-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   4 ++
 target/arm/tcg/translate-a64.c | 101 +++++++--------------------------
 2 files changed, 24 insertions(+), 81 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 
 @qrr_b          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=0
 @qrr_h          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=1
+@qrr_s          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=2
 @qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
 @qrr_hs         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_hs
 @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
@@ -XXX,XX +XXX,XX @@ SQXTUN_s        0111 1110 ..1 00001 00101 0 ..... .....     @rr_e
 SQXTN_s         0101 1110 ..1 00001 01001 0 ..... .....     @rr_e
 UQXTN_s         0111 1110 ..1 00001 01001 0 ..... .....     @rr_e
 
+FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
+
 # Advanced SIMD two-register miscellaneous
 
 SQABS_v         0.00 1110 ..1 00000 01111 0 ..... .....     @qrr_e
@@ -XXX,XX +XXX,XX @@ SQXTN_v         0.00 1110 ..1 00001 01001 0 ..... .....     @qrr_e
 UQXTN_v         0.10 1110 ..1 00001 01001 0 ..... .....     @qrr_e
 
 FCVTN_v         0.00 1110 0.1 00001 01101 0 ..... .....     @qrr_hs
+FCVTXN_v        0.10 1110 011 00001 01101 0 ..... .....     @qrr_s
 BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static ArithOneOp * const f_scalar_uqxtn[] = {
 };
 TRANS(UQXTN_s, do_2misc_narrow_scalar, a, f_scalar_uqxtn)
 
+static void gen_fcvtxn_sd(TCGv_i64 d, TCGv_i64 n)
+{
+    /*
+     * 64 bit to 32 bit float conversion
+     * with von Neumann rounding (round to odd)
+     */
+    TCGv_i32 tmp = tcg_temp_new_i32();
+    gen_helper_fcvtx_f64_to_f32(tmp, n, tcg_env);
+    tcg_gen_extu_i32_i64(d, tmp);
+}
+
+static ArithOneOp * const f_scalar_fcvtxn[] = {
+    NULL,
+    NULL,
+    gen_fcvtxn_sd,
+};
+TRANS(FCVTXN_s, do_2misc_narrow_scalar, a, f_scalar_fcvtxn)
+
 #undef WRAP_ENV
 
 static bool do_gvec_fn2(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
@@ -XXX,XX +XXX,XX @@ static ArithOneOp * const f_vector_fcvtn[] = {
     gen_fcvtn_sd,
 };
 TRANS(FCVTN_v, do_2misc_narrow_vector, a, f_vector_fcvtn)
+TRANS(FCVTXN_v, do_2misc_narrow_vector, a, f_scalar_fcvtxn)
 
 static void gen_bfcvtn_hs(TCGv_i64 d, TCGv_i64 n)
 {
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
     }
 }
 
-static void handle_2misc_narrow(DisasContext *s, bool scalar,
-                                int opcode, bool u, bool is_q,
-                                int size, int rn, int rd)
-{
-    /* Handle 2-reg-misc ops which are narrowing (so each 2*size element
-     * in the source becomes a size element in the destination).
-     */
-    int pass;
-    TCGv_i64 tcg_res[2];
-    int destelt = is_q ? 2 : 0;
-    int passes = scalar ? 1 : 2;
-
-    if (scalar) {
-        tcg_res[1] = tcg_constant_i64(0);
-    }
-
-    for (pass = 0; pass < passes; pass++) {
-        TCGv_i64 tcg_op = tcg_temp_new_i64();
-        NeonGenOne64OpFn *genfn = NULL;
-        NeonGenOne64OpEnvFn *genenvfn = NULL;
-
-        if (scalar) {
-            read_vec_element(s, tcg_op, rn, pass, size + 1);
-        } else {
-            read_vec_element(s, tcg_op, rn, pass, MO_64);
-        }
-        tcg_res[pass] = tcg_temp_new_i64();
-
-        switch (opcode) {
-        case 0x56:  /* FCVTXN, FCVTXN2 */
-            {
-                /*
-                 * 64 bit to 32 bit float conversion
-                 * with von Neumann rounding (round to odd)
-                 */
-                TCGv_i32 tmp = tcg_temp_new_i32();
-                assert(size == 2);
-                gen_helper_fcvtx_f64_to_f32(tmp, tcg_op, tcg_env);
-                tcg_gen_extu_i32_i64(tcg_res[pass], tmp);
-            }
-            break;
-        default:
-        case 0x12: /* XTN, SQXTUN */
-        case 0x14: /* SQXTN, UQXTN */
-        case 0x16: /* FCVTN, FCVTN2 */
-        case 0x36: /* BFCVTN, BFCVTN2 */
-            g_assert_not_reached();
-        }
-
-        if (genfn) {
-            genfn(tcg_res[pass], tcg_op);
-        } else if (genenvfn) {
-            genenvfn(tcg_res[pass], tcg_env, tcg_op);
-        }
-    }
-
-    for (pass = 0; pass < 2; pass++) {
-        write_vec_element(s, tcg_res[pass], rd, destelt + pass, MO_32);
-    }
-    clear_vec_high(s, is_q, rd);
-}
-
 /* AdvSIMD scalar two reg misc
  *  31 30  29 28       24 23  22 21       17 16    12 11 10 9    5 4    0
  * +-----+---+-----------+------+-----------+--------+-----+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
             rmode = FPROUNDING_TIEAWAY;
             break;
         case 0x56: /* FCVTXN, FCVTXN2 */
-            if (size == 2) {
-                unallocated_encoding(s);
-                return;
-            }
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_2misc_narrow(s, true, opcode, u, false, size - 1, rn, rd);
-            return;
         default:
             unallocated_encoding(s);
             return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             }
             handle_2misc_reciprocal(s, opcode, false, u, is_q, size, rn, rd);
             return;
-        case 0x56: /* FCVTXN, FCVTXN2 */
-            if (size == 2) {
-                unallocated_encoding(s);
-                return;
-            }
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_2misc_narrow(s, false, opcode, 0, is_q, size - 1, rn, rd);
-            return;
         case 0x17: /* FCVTL, FCVTL2 */
             if (!fp_access_check(s)) {
                 return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         default:
         case 0x16: /* FCVTN, FCVTN2 */
         case 0x36: /* BFCVTN, BFCVTN2 */
+        case 0x56: /* FCVTXN, FCVTXN2 */
             unallocated_encoding(s);
             return;
         }
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-53-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  2 +
 target/arm/tcg/translate-a64.c | 75 +++++++++++++++++-----------------
 2 files changed, 40 insertions(+), 37 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Move the current implementation out of translate-neon.c,
and extend to handle all element sizes.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-54-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/translate.h      |  6 ++++++
 target/arm/tcg/gengvec.c        | 14 ++++++++++++++
 target/arm/tcg/translate-neon.c | 20 ++------------------
 3 files changed, 22 insertions(+), 18 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-55-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  7 +++++
 target/arm/tcg/translate-a64.c | 54 +++++++++++++++-------------------
 2 files changed, 31 insertions(+), 30 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@
 @qrr_s          . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=2
 @qrr_bh         . q:1 ...... . esz:1 ...... ...... rn:5 rd:5  &qrr_e
 @qrr_hs         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_hs
+@qrr_sd         . q:1 ...... .. ...... ...... rn:5 rd:5  &qrr_e esz=%esz_sd
 @qrr_e          . q:1 ...... esz:2 ...... ...... rn:5 rd:5  &qrr_e
 
 @qrrr_b         . q:1 ...... ... rm:5 ...... rn:5 rd:5  &qrrr_e esz=0
@@ -XXX,XX +XXX,XX @@ FCVTXN_v        0.10 1110 011 00001 01101 0 ..... .....     @qrr_s
 BFCVTN_v        0.00 1110 101 00001 01101 0 ..... .....     @qrr_h
 
 SHLL_v          0.10 1110 ..1 00001 00111 0 ..... .....     @qrr_e
+
+FABS_v          0.00 1110 111 11000 11111 0 ..... .....     @qrr_h
+FABS_v          0.00 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
+
+FNEG_v          0.10 1110 111 11000 11111 0 ..... .....     @qrr_h
+FNEG_v          0.10 1110 1.1 00000 11111 0 ..... .....     @qrr_sd
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_SHLL_v(DisasContext *s, arg_qrr_e *a)
     return true;
 }
 
+static bool do_fabs_fneg_v(DisasContext *s, arg_qrr_e *a, GVecGen2Fn *fn)
+{
+    int check = fp_access_check_vector_hsd(s, a->q, a->esz);
+
+    if (check <= 0) {
+        return check == 0;
+    }
+
+    gen_gvec_fn2(s, a->q, a->rd, a->rn, fn, a->esz);
+    return true;
+}
+
+TRANS(FABS_v, do_fabs_fneg_v, a, gen_gvec_fabs)
+TRANS(FNEG_v, do_fabs_fneg_v, a, gen_gvec_fneg)
 
 /* Common vector code for handling integer to FP conversion */
 static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
      * requires them.
      */
     switch (opcode) {
-    case 0x2f: /* FABS */
-        gen_vfp_absd(tcg_rd, tcg_rn);
-        break;
-    case 0x6f: /* FNEG */
-        gen_vfp_negd(tcg_rd, tcg_rn);
-        break;
     case 0x7f: /* FSQRT */
         gen_helper_vfp_sqrtd(tcg_rd, tcg_rn, tcg_fpstatus);
         break;
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_64(DisasContext *s, int opcode, bool u,
     case 0x9: /* CMEQ, CMLE */
     case 0xa: /* CMLT */
     case 0xb: /* ABS, NEG */
+    case 0x2f: /* FABS */
+    case 0x6f: /* FNEG */
         g_assert_not_reached();
     }
 }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
         size = is_double ? 3 : 2;
         switch (opcode) {
-        case 0x2f: /* FABS */
-        case 0x6f: /* FNEG */
-            if (size == 3 && !is_q) {
-                unallocated_encoding(s);
-                return;
-            }
-            break;
         case 0x1d: /* SCVTF */
         case 0x5d: /* UCVTF */
         {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x16: /* FCVTN, FCVTN2 */
         case 0x36: /* BFCVTN, BFCVTN2 */
         case 0x56: /* FCVTXN, FCVTXN2 */
+        case 0x2f: /* FABS */
+        case 0x6f: /* FNEG */
             unallocated_encoding(s);
             return;
         }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             {
                 /* Special cases for 32 bit elements */
                 switch (opcode) {
-                case 0x2f: /* FABS */
-                    gen_vfp_abss(tcg_res, tcg_op);
-                    break;
-                case 0x6f: /* FNEG */
-                    gen_vfp_negs(tcg_res, tcg_op);
-                    break;
                 case 0x7f: /* FSQRT */
                     gen_helper_vfp_sqrts(tcg_res, tcg_op, tcg_fpstatus);
                     break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                     break;
                 default:
                 case 0x7: /* SQABS, SQNEG */
+                case 0x2f: /* FABS */
+                case 0x6f: /* FNEG */
                     g_assert_not_reached();
                 }
             }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     case 0x7b: /* FCVTZU */
         rmode = FPROUNDING_ZERO;
         break;
-    case 0x2f: /* FABS */
-    case 0x6f: /* FNEG */
-        only_in_vector = true;
-        need_fpst = false;
-        break;
     case 0x7d: /* FRSQRTE */
         break;
     case 0x7f: /* FSQRT (vector) */
         only_in_vector = true;
         break;
     default:
+    case 0x2f: /* FABS */
+    case 0x6f: /* FNEG */
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
             case 0x59: /* FRINTX */
                 gen_helper_advsimd_rinth_exact(tcg_res, tcg_op, tcg_fpstatus);
                 break;
-            case 0x2f: /* FABS */
-                tcg_gen_andi_i32(tcg_res, tcg_op, 0x7fff);
-                break;
-            case 0x6f: /* FNEG */
-                tcg_gen_xori_i32(tcg_res, tcg_op, 0x8000);
-                break;
             case 0x7d: /* FRSQRTE */
                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
                 break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
                 gen_helper_vfp_sqrth(tcg_res, tcg_op, tcg_fpstatus);
                 break;
             default:
+            case 0x2f: /* FABS */
+            case 0x6f: /* FNEG */
                 g_assert_not_reached();
             }
 
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-56-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  3 ++
 target/arm/tcg/translate-a64.c | 69 ++++++++++++++++++++++++----------
 2 files changed, 53 insertions(+), 19 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-57-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  26 +++++
 target/arm/tcg/translate-a64.c | 176 ++++++++++++---------------------
 2 files changed, 88 insertions(+), 114 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Arm silliness with naming, the scalar insns described
as part of the vector instructions, as separate from
the "regular" scalar insns which output to general registers.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-58-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  30 ++++++++
 target/arm/tcg/translate-a64.c | 133 ++++++++++++++-------------------
 2 files changed, 86 insertions(+), 77 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-59-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      | 19 +++++++++++++++++++
 target/arm/tcg/translate-a64.c |  4 +---
 2 files changed, 20 insertions(+), 3 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-60-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  6 ++++++
 target/arm/tcg/translate-a64.c | 35 ++++++++++++++++++++++++----------
 2 files changed, 31 insertions(+), 10 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
 @icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
                 &fcvt sf=0 esz=%esz_sd shift=0
 
+SCVTF_f         0101 1110 011 11001 11011 0 ..... .....     @icvt_h
+SCVTF_f         0101 1110 0.1 00001 11011 0 ..... .....     @icvt_sd
+
+UCVTF_f         0111 1110 011 11001 11011 0 ..... .....     @icvt_h
+UCVTF_f         0111 1110 0.1 00001 11011 0 ..... .....     @icvt_sd
+
 FCVTNS_f        0101 1110 011 11001 10101 0 ..... .....     @icvt_h
 FCVTNS_f        0101 1110 0.1 00001 10101 0 ..... .....     @icvt_sd
 FCVTNU_f        0111 1110 011 11001 10101 0 ..... .....     @icvt_h
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool do_cvtf_g(DisasContext *s, arg_fcvt *a, bool is_signed)
 TRANS(SCVTF_g, do_cvtf_g, a, true)
 TRANS(UCVTF_g, do_cvtf_g, a, false)
 
+/*
+ * [US]CVTF (vector), scalar version.
+ * Which sounds weird, but really just means input from fp register
+ * instead of input from general register.  Input and output element
+ * size are always equal.
+ */
+static bool do_cvtf_f(DisasContext *s, arg_fcvt *a, bool is_signed)
+{
+    TCGv_i64 tcg_int;
+    int check = fp_access_check_scalar_hsd(s, a->esz);
+
+    if (check <= 0) {
+        return check == 0;
+    }
+
+    tcg_int = tcg_temp_new_i64();
+    read_vec_element(s, tcg_int, a->rn, 0, a->esz | (is_signed ? MO_SIGN : 0));
+    return do_cvtf_scalar(s, a->esz, a->rd, a->shift, tcg_int, is_signed);
+}
+
+TRANS(SCVTF_f, do_cvtf_f, a, true)
+TRANS(UCVTF_f, do_cvtf_f, a, false)
+
 static void do_fcvt_scalar(DisasContext *s, MemOp out, MemOp esz,
                            TCGv_i64 tcg_out, int shift, int rn,
                            ARMFPRounding rmode)
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x6d: /* FCMLE (zero) */
             handle_2misc_fcmp_zero(s, opcode, true, u, true, size, rn, rd);
             return;
-        case 0x1d: /* SCVTF */
-        case 0x5d: /* UCVTF */
-        {
-            bool is_signed = (opcode == 0x1d);
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_simd_intfp_conv(s, rd, rn, 1, is_signed, 0, size);
-            return;
-        }
         case 0x3d: /* FRECPE */
         case 0x3f: /* FRECPX */
         case 0x7d: /* FRSQRTE */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x1c: /* FCVTAS */
         case 0x5c: /* FCVTAU */
         case 0x56: /* FCVTXN, FCVTXN2 */
+        case 0x1d: /* SCVTF */
+        case 0x5d: /* UCVTF */
         default:
             unallocated_encoding(s);
             return;
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove disas_simd_scalar_shift_imm as these were the
last insns decoded by that function.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-61-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  8 ++++++
 target/arm/tcg/translate-a64.c | 47 ----------------------------------
 2 files changed, 8 insertions(+), 47 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ FCVTAU_f        0111 1110 0.1 00001 11001 0 ..... .....     @icvt_sd
 @fcvt_fixed_d   .... .... . 1 ...... ...... rn:5 rd:5       \
                 &fcvt sf=0 esz=3 shift=%fcvt_f_sh_d
 
+SCVTF_f         0101 1111 0 ....... 111001 ..... .....      @fcvt_fixed_h
+SCVTF_f         0101 1111 0 ....... 111001 ..... .....      @fcvt_fixed_s
+SCVTF_f         0101 1111 0 ....... 111001 ..... .....      @fcvt_fixed_d
+
+UCVTF_f         0111 1111 0 ....... 111001 ..... .....      @fcvt_fixed_h
+UCVTF_f         0111 1111 0 ....... 111001 ..... .....      @fcvt_fixed_s
+UCVTF_f         0111 1111 0 ....... 111001 ..... .....      @fcvt_fixed_d
+
 FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_h
 FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_s
 FCVTZS_f        0101 1111 0 ....... 111111 ..... .....      @fcvt_fixed_d
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
     gen_restore_rmode(tcg_rmode, tcg_fpstatus);
 }
 
-/* AdvSIMD scalar shift by immediate
- *  31 30  29 28         23 22  19 18  16 15    11  10 9    5 4    0
- * +-----+---+-------------+------+------+--------+---+------+------+
- * | 0 1 | U | 1 1 1 1 1 0 | immh | immb | opcode | 1 |  Rn  |  Rd  |
- * +-----+---+-------------+------+------+--------+---+------+------+
- *
- * This is the scalar version so it works on a fixed sized registers
- */
-static void disas_simd_scalar_shift_imm(DisasContext *s, uint32_t insn)
-{
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int opcode = extract32(insn, 11, 5);
-    int immb = extract32(insn, 16, 3);
-    int immh = extract32(insn, 19, 4);
-    bool is_u = extract32(insn, 29, 1);
-
-    if (immh == 0) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    switch (opcode) {
-    case 0x1c: /* SCVTF, UCVTF */
-        handle_simd_shift_intfp_conv(s, true, false, is_u, immh, immb,
-                                     opcode, rn, rd);
-        break;
-    default:
-    case 0x00: /* SSHR / USHR */
-    case 0x02: /* SSRA / USRA */
-    case 0x04: /* SRSHR / URSHR */
-    case 0x06: /* SRSRA / URSRA */
-    case 0x08: /* SRI */
-    case 0x0a: /* SHL / SLI */
-    case 0x0c: /* SQSHLU */
-    case 0x0e: /* SQSHL, UQSHL */
-    case 0x10: /* SQSHRUN */
-    case 0x11: /* SQRSHRUN */
-    case 0x12: /* SQSHRN, UQSHRN */
-    case 0x13: /* SQRSHRN, UQRSHRN */
-    case 0x1f: /* FCVTZS, FCVTZU */
-        unallocated_encoding(s);
-        break;
-    }
-}
-
 static void handle_2misc_64(DisasContext *s, int opcode, bool u,
                             TCGv_i64 tcg_rd, TCGv_i64 tcg_rn,
                             TCGv_i32 tcg_rmode, TCGv_ptr tcg_fpstatus)
@@ -XXX,XX +XXX,XX @@ static const AArch64DecodeTable data_proc_simd[] = {
     { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
     { 0x0f000400, 0x9f800400, disas_simd_shift_imm },
     { 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
-    { 0x5f000400, 0xdf800400, disas_simd_scalar_shift_imm },
     { 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
     { 0x00000000, 0x00000000, NULL }
 };
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Emphasize that these functions use round-to-zero mode.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-62-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h             | 8 ++++----
 target/arm/tcg/translate-neon.c | 8 ++++----
 target/arm/tcg/vec_helper.c     | 8 ++++----
 3 files changed, 12 insertions(+), 12 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_simd_intfp_conv and handle_simd_shift_intfp_conv
as these were the last insns decoded by those functions.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-63-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h            |   3 +
 target/arm/tcg/a64.decode      |  22 ++++
 target/arm/tcg/translate-a64.c | 201 ++++++---------------------------
 target/arm/tcg/vec_helper.c    |   7 +-
 4 files changed, 66 insertions(+), 167 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vcvt_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ FRINT32Z_v      0.00 1110 0.1 00001 11101 0 ..... .....     @qrr_sd
 FRINT32X_v      0.10 1110 0.1 00001 11101 0 ..... .....     @qrr_sd
 FRINT64Z_v      0.00 1110 0.1 00001 11111 0 ..... .....     @qrr_sd
 FRINT64X_v      0.10 1110 0.1 00001 11111 0 ..... .....     @qrr_sd
+
+SCVTF_vi        0.00 1110 011 11001 11011 0 ..... .....     @qrr_h
+SCVTF_vi        0.00 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
+
+UCVTF_vi        0.10 1110 011 11001 11011 0 ..... .....     @qrr_h
+UCVTF_vi        0.10 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
+
+&fcvt_q         rd rn esz q shift
+@fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
+                &fcvt_q esz=1 shift=%fcvt_f_sh_h
+@fcvtq_s        . q:1 . ...... 01 ..... ...... rn:5 rd:5    \
+                &fcvt_q esz=2 shift=%fcvt_f_sh_s
+@fcvtq_d        . q:1 . ...... 1 ...... ...... rn:5 rd:5    \
+                &fcvt_q esz=3 shift=%fcvt_f_sh_d
+
+SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_h
+SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_s
+SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_d
+
+UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_h
+UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_s
+UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_d
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FRINT64Z_v, aa64_frint, do_fp1_vector, a,
            &f_scalar_frint64, FPROUNDING_ZERO)
 TRANS_FEAT(FRINT64X_v, aa64_frint, do_fp1_vector, a, &f_scalar_frint64, -1)
 
-/* Common vector code for handling integer to FP conversion */
-static void handle_simd_intfp_conv(DisasContext *s, int rd, int rn,
-                                   int elements, int is_signed,
-                                   int fracbits, int size)
+static bool do_gvec_op2_fpst(DisasContext *s, MemOp esz, bool is_q,
+                             int rd, int rn, int data,
+                             gen_helper_gvec_2_ptr * const fns[3])
 {
-    TCGv_ptr tcg_fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
-    TCGv_i32 tcg_shift = NULL;
+    int check = fp_access_check_vector_hsd(s, is_q, esz);
+    TCGv_ptr fpst;
 
-    MemOp mop = size | (is_signed ? MO_SIGN : 0);
-    int pass;
-
-    if (fracbits || size == MO_64) {
-        tcg_shift = tcg_constant_i32(fracbits);
+    if (check <= 0) {
+        return check == 0;
     }
 
-    if (size == MO_64) {
-        TCGv_i64 tcg_int64 = tcg_temp_new_i64();
-        TCGv_i64 tcg_double = tcg_temp_new_i64();
-
-        for (pass = 0; pass < elements; pass++) {
-            read_vec_element(s, tcg_int64, rn, pass, mop);
-
-            if (is_signed) {
-                gen_helper_vfp_sqtod(tcg_double, tcg_int64,
-                                     tcg_shift, tcg_fpst);
-            } else {
-                gen_helper_vfp_uqtod(tcg_double, tcg_int64,
-                                     tcg_shift, tcg_fpst);
-            }
-            if (elements == 1) {
-                write_fp_dreg(s, rd, tcg_double);
-            } else {
-                write_vec_element(s, tcg_double, rd, pass, MO_64);
-            }
-        }
-    } else {
-        TCGv_i32 tcg_int32 = tcg_temp_new_i32();
-        TCGv_i32 tcg_float = tcg_temp_new_i32();
-
-        for (pass = 0; pass < elements; pass++) {
-            read_vec_element_i32(s, tcg_int32, rn, pass, mop);
-
-            switch (size) {
-            case MO_32:
-                if (fracbits) {
-                    if (is_signed) {
-                        gen_helper_vfp_sltos(tcg_float, tcg_int32,
-                                             tcg_shift, tcg_fpst);
-                    } else {
-                        gen_helper_vfp_ultos(tcg_float, tcg_int32,
-                                             tcg_shift, tcg_fpst);
-                    }
-                } else {
-                    if (is_signed) {
-                        gen_helper_vfp_sitos(tcg_float, tcg_int32, tcg_fpst);
-                    } else {
-                        gen_helper_vfp_uitos(tcg_float, tcg_int32, tcg_fpst);
-                    }
-                }
-                break;
-            case MO_16:
-                if (fracbits) {
-                    if (is_signed) {
-                        gen_helper_vfp_sltoh(tcg_float, tcg_int32,
-                                             tcg_shift, tcg_fpst);
-                    } else {
-                        gen_helper_vfp_ultoh(tcg_float, tcg_int32,
-                                             tcg_shift, tcg_fpst);
-                    }
-                } else {
-                    if (is_signed) {
-                        gen_helper_vfp_sitoh(tcg_float, tcg_int32, tcg_fpst);
-                    } else {
-                        gen_helper_vfp_uitoh(tcg_float, tcg_int32, tcg_fpst);
-                    }
-                }
-                break;
-            default:
-                g_assert_not_reached();
-            }
-
-            if (elements == 1) {
-                write_fp_sreg(s, rd, tcg_float);
-            } else {
-                write_vec_element_i32(s, tcg_float, rd, pass, size);
-            }
-        }
-    }
-
-    clear_vec_high(s, elements << size == 16, rd);
+    fpst = fpstatus_ptr(esz == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
+    tcg_gen_gvec_2_ptr(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn), fpst,
+                       is_q ? 16 : 8, vec_full_reg_size(s),
+                       data, fns[esz - 1]);
+    return true;
 }
 
-/* UCVTF/SCVTF - Integer to FP conversion */
-static void handle_simd_shift_intfp_conv(DisasContext *s, bool is_scalar,
-                                         bool is_q, bool is_u,
-                                         int immh, int immb, int opcode,
-                                         int rn, int rd)
-{
-    int size, elements, fracbits;
-    int immhb = immh << 3 | immb;
+static gen_helper_gvec_2_ptr * const f_scvtf_v[] = {
+    gen_helper_gvec_vcvt_sh,
+    gen_helper_gvec_vcvt_sf,
+    gen_helper_gvec_vcvt_sd,
+};
+TRANS(SCVTF_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, 0, f_scvtf_v)
+TRANS(SCVTF_vf, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, a->shift, f_scvtf_v)
 
-    if (immh & 8) {
-        size = MO_64;
-        if (!is_scalar && !is_q) {
-            unallocated_encoding(s);
-            return;
-        }
-    } else if (immh & 4) {
-        size = MO_32;
-    } else if (immh & 2) {
-        size = MO_16;
-        if (!dc_isar_feature(aa64_fp16, s)) {
-            unallocated_encoding(s);
-            return;
-        }
-    } else {
-        /* immh == 0 would be a failure of the decode logic */
-        g_assert(immh == 1);
-        unallocated_encoding(s);
-        return;
-    }
-
-    if (is_scalar) {
-        elements = 1;
-    } else {
-        elements = (8 << is_q) >> size;
-    }
-    fracbits = (16 << size) - immhb;
-
-    if (!fp_access_check(s)) {
-        return;
-    }
-
-    handle_simd_intfp_conv(s, rd, rn, elements, !is_u, fracbits, size);
-}
+static gen_helper_gvec_2_ptr * const f_ucvtf_v[] = {
+    gen_helper_gvec_vcvt_uh,
+    gen_helper_gvec_vcvt_uf,
+    gen_helper_gvec_vcvt_ud,
+};
+TRANS(UCVTF_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, 0, f_ucvtf_v)
+TRANS(UCVTF_vf, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, a->shift, f_ucvtf_v)
 
 /* FCVTZS, FVCVTZU - FP to fixedpoint conversion */
 static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_shift_imm(DisasContext *s, uint32_t insn)
     }
 
     switch (opcode) {
-    case 0x1c: /* SCVTF / UCVTF */
-        handle_simd_shift_intfp_conv(s, false, is_q, is_u, immh, immb,
-                                     opcode, rn, rd);
-        break;
     case 0x1f: /* FCVTZS/ FCVTZU */
         handle_simd_shift_fpint_conv(s, false, is_q, is_u, immh, immb, rn, rd);
         return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_shift_imm(DisasContext *s, uint32_t insn)
     case 0x12: /* SQSHRN / UQSHRN */
     case 0x13: /* SQRSHRN / UQRSHRN */
     case 0x14: /* SSHLL / USHLL */
+    case 0x1c: /* SCVTF / UCVTF */
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
         size = is_double ? 3 : 2;
         switch (opcode) {
-        case 0x1d: /* SCVTF */
-        case 0x5d: /* UCVTF */
-        {
-            bool is_signed = (opcode == 0x1d) ? true : false;
-            int elements = is_double ? 2 : is_q ? 4 : 2;
-            if (is_double && !is_q) {
-                unallocated_encoding(s);
-                return;
-            }
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_simd_intfp_conv(s, rd, rn, elements, is_signed, 0, size);
-            return;
-        }
         case 0x2c: /* FCMGT (zero) */
         case 0x2d: /* FCMEQ (zero) */
         case 0x2e: /* FCMLT (zero) */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x1f: /* FRINT64Z */
         case 0x5e: /* FRINT32X */
         case 0x5f: /* FRINT64X */
+        case 0x1d: /* SCVTF */
+        case 0x5d: /* UCVTF */
             unallocated_encoding(s);
             return;
         }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     fpop = deposit32(fpop, 6, 1, u);
 
     switch (fpop) {
-    case 0x1d: /* SCVTF */
-    case 0x5d: /* UCVTF */
-    {
-        int elements;
-
-        if (is_scalar) {
-            elements = 1;
-        } else {
-            elements = (is_q ? 8 : 4);
-        }
-
-        if (!fp_access_check(s)) {
-            return;
-        }
-        handle_simd_intfp_conv(s, rd, rn, elements, !u, 0, MO_16);
-        return;
-    }
-    break;
     case 0x2c: /* FCMGT (zero) */
     case 0x2d: /* FCMEQ (zero) */
     case 0x2e: /* FCMLT (zero) */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     case 0x58: /* FRINTA */
     case 0x59: /* FRINTX */
     case 0x79: /* FRINTI */
+    case 0x1d: /* SCVTF */
+    case 0x5d: /* UCVTF */
         unallocated_encoding(s);
         return;
     }
diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/vec_helper.c
+++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_3OP_PAIR(gvec_uminp_s, MIN, uint32_t, H4)
         clear_tail(d, oprsz, simd_maxsz(desc));                         \
     }
 
+DO_VCVT_FIXED(gvec_vcvt_sd, helper_vfp_sqtod, uint64_t)
+DO_VCVT_FIXED(gvec_vcvt_ud, helper_vfp_uqtod, uint64_t)
 DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
-DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
-DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
 DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
+
+DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
+DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_rz_hs, helper_vfp_toshh_round_to_zero, uint16_t)
 DO_VCVT_FIXED(gvec_vcvt_rz_hu, helper_vfp_touhh_round_to_zero, uint16_t)
 
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_simd_shift_fpint_conv and disas_simd_shift_imm
as these were the last insns decoded by those functions.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-64-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h            |   4 +
 target/arm/tcg/a64.decode      |   8 ++
 target/arm/tcg/translate-a64.c | 160 +++------------------------------
 target/arm/tcg/vec_helper.c    |   2 +
 target/arm/vfp_helper.c        |   4 +
 5 files changed, 32 insertions(+), 146 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_touhs_round_to_zero, i32, f32, i32, ptr)
 DEF_HELPER_3(vfp_touls_round_to_zero, i32, f32, i32, ptr)
 DEF_HELPER_3(vfp_toshd_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_tosld_round_to_zero, i64, f64, i32, ptr)
+DEF_HELPER_3(vfp_tosqd_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_touhd_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_tould_round_to_zero, i64, f64, i32, ptr)
+DEF_HELPER_3(vfp_touqd_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_touhh, i32, f16, i32, ptr)
 DEF_HELPER_3(vfp_toshh, i32, f16, i32, ptr)
 DEF_HELPER_3(vfp_toulh, i32, f16, i32, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_rz_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_vcvt_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_rz_ds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_rz_du, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SCVTF_vf        0.00 11110 ....... 111001 ..... .....       @fcvtq_d
 UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_h
 UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_s
 UCVTF_vf        0.10 11110 ....... 111001 ..... .....       @fcvtq_d
+
+FCVTZS_vf       0.00 11110 ....... 111111 ..... .....       @fcvtq_h
+FCVTZS_vf       0.00 11110 ....... 111111 ..... .....       @fcvtq_s
+FCVTZS_vf       0.00 11110 ....... 111111 ..... .....       @fcvtq_d
+
+FCVTZU_vf       0.10 11110 ....... 111111 ..... .....       @fcvtq_h
+FCVTZU_vf       0.10 11110 ....... 111111 ..... .....       @fcvtq_s
+FCVTZU_vf       0.10 11110 ....... 111111 ..... .....       @fcvtq_d
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS(UCVTF_vi, do_gvec_op2_fpst,
 TRANS(UCVTF_vf, do_gvec_op2_fpst,
       a->esz, a->q, a->rd, a->rn, a->shift, f_ucvtf_v)
 
-/* FCVTZS, FVCVTZU - FP to fixedpoint conversion */
-static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
-                                         bool is_q, bool is_u,
-                                         int immh, int immb, int rn, int rd)
-{
-    int immhb = immh << 3 | immb;
-    int pass, size, fracbits;
-    TCGv_ptr tcg_fpstatus;
-    TCGv_i32 tcg_rmode, tcg_shift;
+static gen_helper_gvec_2_ptr * const f_fcvtzs_vf[] = {
+    gen_helper_gvec_vcvt_rz_hs,
+    gen_helper_gvec_vcvt_rz_fs,
+    gen_helper_gvec_vcvt_rz_ds,
+};
+TRANS(FCVTZS_vf, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, a->shift, f_fcvtzs_vf)
 
-    if (immh & 0x8) {
-        size = MO_64;
-        if (!is_scalar && !is_q) {
-            unallocated_encoding(s);
-            return;
-        }
-    } else if (immh & 0x4) {
-        size = MO_32;
-    } else if (immh & 0x2) {
-        size = MO_16;
-        if (!dc_isar_feature(aa64_fp16, s)) {
-            unallocated_encoding(s);
-            return;
-        }
-    } else {
-        /* Should have split out AdvSIMD modified immediate earlier.  */
-        assert(immh == 1);
-        unallocated_encoding(s);
-        return;
-    }
-
-    if (!fp_access_check(s)) {
-        return;
-    }
-
-    assert(!(is_scalar && is_q));
-
-    tcg_fpstatus = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
-    tcg_rmode = gen_set_rmode(FPROUNDING_ZERO, tcg_fpstatus);
-    fracbits = (16 << size) - immhb;
-    tcg_shift = tcg_constant_i32(fracbits);
-
-    if (size == MO_64) {
-        int maxpass = is_scalar ? 1 : 2;
-
-        for (pass = 0; pass < maxpass; pass++) {
-            TCGv_i64 tcg_op = tcg_temp_new_i64();
-
-            read_vec_element(s, tcg_op, rn, pass, MO_64);
-            if (is_u) {
-                gen_helper_vfp_touqd(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
-            } else {
-                gen_helper_vfp_tosqd(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
-            }
-            write_vec_element(s, tcg_op, rd, pass, MO_64);
-        }
-        clear_vec_high(s, is_q, rd);
-    } else {
-        void (*fn)(TCGv_i32, TCGv_i32, TCGv_i32, TCGv_ptr);
-        int maxpass = is_scalar ? 1 : ((8 << is_q) >> size);
-
-        switch (size) {
-        case MO_16:
-            if (is_u) {
-                fn = gen_helper_vfp_touhh;
-            } else {
-                fn = gen_helper_vfp_toshh;
-            }
-            break;
-        case MO_32:
-            if (is_u) {
-                fn = gen_helper_vfp_touls;
-            } else {
-                fn = gen_helper_vfp_tosls;
-            }
-            break;
-        default:
-            g_assert_not_reached();
-        }
-
-        for (pass = 0; pass < maxpass; pass++) {
-            TCGv_i32 tcg_op = tcg_temp_new_i32();
-
-            read_vec_element_i32(s, tcg_op, rn, pass, size);
-            fn(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
-            if (is_scalar) {
-                if (size == MO_16 && !is_u) {
-                    tcg_gen_ext16u_i32(tcg_op, tcg_op);
-                }
-                write_fp_sreg(s, rd, tcg_op);
-            } else {
-                write_vec_element_i32(s, tcg_op, rd, pass, size);
-            }
-        }
-        if (!is_scalar) {
-            clear_vec_high(s, is_q, rd);
-        }
-    }
-
-    gen_restore_rmode(tcg_rmode, tcg_fpstatus);
-}
+static gen_helper_gvec_2_ptr * const f_fcvtzu_vf[] = {
+    gen_helper_gvec_vcvt_rz_hu,
+    gen_helper_gvec_vcvt_rz_fu,
+    gen_helper_gvec_vcvt_rz_du,
+};
+TRANS(FCVTZU_vf, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, a->shift, f_fcvtzu_vf)
 
 static void handle_2misc_64(DisasContext *s, int opcode, bool u,
                             TCGv_i64 tcg_rd, TCGv_i64 tcg_rn,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
     g_assert_not_reached();
 }
 
-/* AdvSIMD shift by immediate
- *  31  30   29 28         23 22  19 18  16 15    11  10 9    5 4    0
- * +---+---+---+-------------+------+------+--------+---+------+------+
- * | 0 | Q | U | 0 1 1 1 1 0 | immh | immb | opcode | 1 |  Rn  |  Rd  |
- * +---+---+---+-------------+------+------+--------+---+------+------+
- */
-static void disas_simd_shift_imm(DisasContext *s, uint32_t insn)
-{
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int opcode = extract32(insn, 11, 5);
-    int immb = extract32(insn, 16, 3);
-    int immh = extract32(insn, 19, 4);
-    bool is_u = extract32(insn, 29, 1);
-    bool is_q = extract32(insn, 30, 1);
-
-    if (immh == 0) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    switch (opcode) {
-    case 0x1f: /* FCVTZS/ FCVTZU */
-        handle_simd_shift_fpint_conv(s, false, is_q, is_u, immh, immb, rn, rd);
-        return;
-    default:
-    case 0x00: /* SSHR / USHR */
-    case 0x02: /* SSRA / USRA (accumulate) */
-    case 0x04: /* SRSHR / URSHR (rounding) */
-    case 0x06: /* SRSRA / URSRA (accum + rounding) */
-    case 0x08: /* SRI */
-    case 0x0a: /* SHL / SLI */
-    case 0x0c: /* SQSHLU */
-    case 0x0e: /* SQSHL, UQSHL */
-    case 0x10: /* SHRN / SQSHRUN */
-    case 0x11: /* RSHRN / SQRSHRUN */
-    case 0x12: /* SQSHRN / UQSHRN */
-    case 0x13: /* SQRSHRN / UQRSHRN */
-    case 0x14: /* SSHLL / USHLL */
-    case 0x1c: /* SCVTF / UCVTF */
-        unallocated_encoding(s);
-        return;
-    }
-}
-
 static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
                                   int size, int rn, int rd)
 {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
 static const AArch64DecodeTable data_proc_simd[] = {
     /* pattern  ,  mask     ,  fn                        */
     { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
-    { 0x0f000400, 0x9f800400, disas_simd_shift_imm },
     { 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
     { 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
     { 0x00000000, 0x00000000, NULL }
diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/vec_helper.c
+++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
 DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
 
+DO_VCVT_FIXED(gvec_vcvt_rz_ds, helper_vfp_tosqd_round_to_zero, uint64_t)
+DO_VCVT_FIXED(gvec_vcvt_rz_du, helper_vfp_touqd_round_to_zero, uint64_t)
 DO_VCVT_FIXED(gvec_vcvt_rz_fs, helper_vfp_tosls_round_to_zero, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_rz_fu, helper_vfp_touls_round_to_zero, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_rz_hs, helper_vfp_toshh_round_to_zero, uint16_t)
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ VFP_CONV_FIX_A64(sq, h, 16, dh_ctype_f16, 64, int64)
 VFP_CONV_FIX(uh, h, 16, dh_ctype_f16, 32, uint16)
 VFP_CONV_FIX(ul, h, 16, dh_ctype_f16, 32, uint32)
 VFP_CONV_FIX_A64(uq, h, 16, dh_ctype_f16, 64, uint64)
+VFP_CONV_FLOAT_FIX_ROUND(sq, d, 64, float64, 64, int64,
+                         float_round_to_zero, _round_to_zero)
+VFP_CONV_FLOAT_FIX_ROUND(uq, d, 64, float64, 64, uint64,
+                         float_round_to_zero, _round_to_zero)
 
 #undef VFP_CONV_FIX
 #undef VFP_CONV_FIX_FLOAT
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_2misc_64 as these were the last insns decoded
by that function.  Remove helper_advsimd_f16to[su]inth as unused;
we now always go through helper_vfp_to[su]hh or a specialized
vector function instead.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-65-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h            |   2 +
 target/arm/tcg/helper-a64.h    |   2 -
 target/arm/tcg/a64.decode      |  25 ++++
 target/arm/tcg/helper-a64.c    |  32 -----
 target/arm/tcg/translate-a64.c | 227 +++++++++++----------------------
 target/arm/tcg/vec_helper.c    |   2 +
 6 files changed, 102 insertions(+), 188 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rz_ds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rz_du, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sd, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ud, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/tcg/helper-a64.h b/target/arm/tcg/helper-a64.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.h
+++ b/target/arm/tcg/helper-a64.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(advsimd_mulx2h, i32, i32, i32, ptr)
 DEF_HELPER_4(advsimd_muladd2h, i32, i32, i32, i32, ptr)
 DEF_HELPER_2(advsimd_rinth_exact, f16, f16, ptr)
 DEF_HELPER_2(advsimd_rinth, f16, f16, ptr)
-DEF_HELPER_2(advsimd_f16tosinth, i32, f16, ptr)
-DEF_HELPER_2(advsimd_f16touinth, i32, f16, ptr)
 
 DEF_HELPER_2(exception_return, void, env, i64)
 DEF_HELPER_FLAGS_2(dc_zva, TCG_CALL_NO_WG, void, env, i64)
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ SCVTF_vi        0.00 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
 UCVTF_vi        0.10 1110 011 11001 11011 0 ..... .....     @qrr_h
 UCVTF_vi        0.10 1110 0.1 00001 11011 0 ..... .....     @qrr_sd
 
+FCVTNS_vi       0.00 1110 011 11001 10101 0 ..... .....     @qrr_h
+FCVTNS_vi       0.00 1110 0.1 00001 10101 0 ..... .....     @qrr_sd
+FCVTNU_vi       0.10 1110 011 11001 10101 0 ..... .....     @qrr_h
+FCVTNU_vi       0.10 1110 0.1 00001 10101 0 ..... .....     @qrr_sd
+
+FCVTPS_vi       0.00 1110 111 11001 10101 0 ..... .....     @qrr_h
+FCVTPS_vi       0.00 1110 1.1 00001 10101 0 ..... .....     @qrr_sd
+FCVTPU_vi       0.10 1110 111 11001 10101 0 ..... .....     @qrr_h
+FCVTPU_vi       0.10 1110 1.1 00001 10101 0 ..... .....     @qrr_sd
+
+FCVTMS_vi       0.00 1110 011 11001 10111 0 ..... .....     @qrr_h
+FCVTMS_vi       0.00 1110 0.1 00001 10111 0 ..... .....     @qrr_sd
+FCVTMU_vi       0.10 1110 011 11001 10111 0 ..... .....     @qrr_h
+FCVTMU_vi       0.10 1110 0.1 00001 10111 0 ..... .....     @qrr_sd
+
+FCVTZS_vi       0.00 1110 111 11001 10111 0 ..... .....     @qrr_h
+FCVTZS_vi       0.00 1110 1.1 00001 10111 0 ..... .....     @qrr_sd
+FCVTZU_vi       0.10 1110 111 11001 10111 0 ..... .....     @qrr_h
+FCVTZU_vi       0.10 1110 1.1 00001 10111 0 ..... .....     @qrr_sd
+
+FCVTAS_vi       0.00 1110 011 11001 11001 0 ..... .....     @qrr_h
+FCVTAS_vi       0.00 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
+FCVTAU_vi       0.10 1110 011 11001 11001 0 ..... .....     @qrr_h
+FCVTAU_vi       0.10 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
+
 &fcvt_q         rd rn esz q shift
 @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                 &fcvt_q esz=1 shift=%fcvt_f_sh_h
diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.c
+++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_rinth)(uint32_t x, void *fp_status)
     return ret;
 }
 
-/*
- * Half-precision floating point conversion functions
- *
- * There are a multitude of conversion functions with various
- * different rounding modes. This is dealt with by the calling code
- * setting the mode appropriately before calling the helper.
- */
-
-uint32_t HELPER(advsimd_f16tosinth)(uint32_t a, void *fpstp)
-{
-    float_status *fpst = fpstp;
-
-    /* Invalid if we are passed a NaN */
-    if (float16_is_any_nan(a)) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_int16(a, fpst);
-}
-
-uint32_t HELPER(advsimd_f16touinth)(uint32_t a, void *fpstp)
-{
-    float_status *fpst = fpstp;
-
-    /* Invalid if we are passed a NaN */
-    if (float16_is_any_nan(a)) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_uint16(a, fpst);
-}
-
 static int el_from_spsr(uint32_t spsr)
 {
     /* Return the exception level that this SPSR is requesting a return to,
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_2_ptr * const f_fcvtzu_vf[] = {
 TRANS(FCVTZU_vf, do_gvec_op2_fpst,
       a->esz, a->q, a->rd, a->rn, a->shift, f_fcvtzu_vf)
 
-static void handle_2misc_64(DisasContext *s, int opcode, bool u,
-                            TCGv_i64 tcg_rd, TCGv_i64 tcg_rn,
-                            TCGv_i32 tcg_rmode, TCGv_ptr tcg_fpstatus)
-{
-    /* Handle 64->64 opcodes which are shared between the scalar and
-     * vector 2-reg-misc groups. We cover every integer opcode where size == 3
-     * is valid in either group and also the double-precision fp ops.
-     * The caller only need provide tcg_rmode and tcg_fpstatus if the op
-     * requires them.
-     */
-    switch (opcode) {
-    case 0x1a: /* FCVTNS */
-    case 0x1b: /* FCVTMS */
-    case 0x1c: /* FCVTAS */
-    case 0x3a: /* FCVTPS */
-    case 0x3b: /* FCVTZS */
-        gen_helper_vfp_tosqd(tcg_rd, tcg_rn, tcg_constant_i32(0), tcg_fpstatus);
-        break;
-    case 0x5a: /* FCVTNU */
-    case 0x5b: /* FCVTMU */
-    case 0x5c: /* FCVTAU */
-    case 0x7a: /* FCVTPU */
-    case 0x7b: /* FCVTZU */
-        gen_helper_vfp_touqd(tcg_rd, tcg_rn, tcg_constant_i32(0), tcg_fpstatus);
-        break;
-    default:
-    case 0x4: /* CLS, CLZ */
-    case 0x5: /* NOT */
-    case 0x7: /* SQABS, SQNEG */
-    case 0x8: /* CMGT, CMGE */
-    case 0x9: /* CMEQ, CMLE */
-    case 0xa: /* CMLT */
-    case 0xb: /* ABS, NEG */
-    case 0x2f: /* FABS */
-    case 0x6f: /* FNEG */
-    case 0x7f: /* FSQRT */
-    case 0x18: /* FRINTN */
-    case 0x19: /* FRINTM */
-    case 0x38: /* FRINTP */
-    case 0x39: /* FRINTZ */
-    case 0x58: /* FRINTA */
-    case 0x79: /* FRINTI */
-    case 0x59: /* FRINTX */
-    case 0x1e: /* FRINT32Z */
-    case 0x5e: /* FRINT32X */
-    case 0x1f: /* FRINT64Z */
-    case 0x5f: /* FRINT64X */
-        g_assert_not_reached();
-    }
-}
+static gen_helper_gvec_2_ptr * const f_fcvt_s_vi[] = {
+    gen_helper_gvec_vcvt_rm_sh,
+    gen_helper_gvec_vcvt_rm_ss,
+    gen_helper_gvec_vcvt_rm_sd,
+};
+
+static gen_helper_gvec_2_ptr * const f_fcvt_u_vi[] = {
+    gen_helper_gvec_vcvt_rm_uh,
+    gen_helper_gvec_vcvt_rm_us,
+    gen_helper_gvec_vcvt_rm_ud,
+};
+
+TRANS(FCVTNS_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_nearest_even, f_fcvt_s_vi)
+TRANS(FCVTNU_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_nearest_even, f_fcvt_u_vi)
+TRANS(FCVTPS_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_up, f_fcvt_s_vi)
+TRANS(FCVTPU_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_up, f_fcvt_u_vi)
+TRANS(FCVTMS_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_down, f_fcvt_s_vi)
+TRANS(FCVTMU_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_down, f_fcvt_u_vi)
+TRANS(FCVTZS_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_to_zero, f_fcvt_s_vi)
+TRANS(FCVTZU_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_to_zero, f_fcvt_u_vi)
+TRANS(FCVTAS_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_ties_away, f_fcvt_s_vi)
+TRANS(FCVTAU_vi, do_gvec_op2_fpst,
+      a->esz, a->q, a->rd, a->rn, float_round_ties_away, f_fcvt_u_vi)
 
 static void handle_2misc_fcmp_zero(DisasContext *s, int opcode,
                                    bool is_scalar, bool is_u, bool is_q,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             }
             handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
             return;
-        case 0x1a: /* FCVTNS */
-        case 0x1b: /* FCVTMS */
-        case 0x3a: /* FCVTPS */
-        case 0x3b: /* FCVTZS */
-        case 0x5a: /* FCVTNU */
-        case 0x5b: /* FCVTMU */
-        case 0x7a: /* FCVTPU */
-        case 0x7b: /* FCVTZU */
-            need_fpstatus = true;
-            rmode = extract32(opcode, 5, 1) | (extract32(opcode, 0, 1) << 1);
-            if (size == 3 && !is_q) {
-                unallocated_encoding(s);
-                return;
-            }
-            break;
-        case 0x5c: /* FCVTAU */
-        case 0x1c: /* FCVTAS */
-            need_fpstatus = true;
-            rmode = FPROUNDING_TIEAWAY;
-            if (size == 3 && !is_q) {
-                unallocated_encoding(s);
-                return;
-            }
-            break;
         case 0x3c: /* URECPE */
             if (size == 3) {
                 unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x5f: /* FRINT64X */
         case 0x1d: /* SCVTF */
         case 0x5d: /* UCVTF */
+        case 0x1a: /* FCVTNS */
+        case 0x1b: /* FCVTMS */
+        case 0x3a: /* FCVTPS */
+        case 0x3b: /* FCVTZS */
+        case 0x5a: /* FCVTNU */
+        case 0x5b: /* FCVTMU */
+        case 0x7a: /* FCVTPU */
+        case 0x7b: /* FCVTZU */
+        case 0x5c: /* FCVTAU */
+        case 0x1c: /* FCVTAS */
             unallocated_encoding(s);
             return;
         }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         tcg_rmode = NULL;
     }
 
-    if (size == 3) {
-        /* All 64-bit element operations can be shared with scalar 2misc */
-        int pass;
-
-        /* Coverity claims (size == 3 && !is_q) has been eliminated
-         * from all paths leading to here.
-         */
-        tcg_debug_assert(is_q);
-        for (pass = 0; pass < 2; pass++) {
-            TCGv_i64 tcg_op = tcg_temp_new_i64();
-            TCGv_i64 tcg_res = tcg_temp_new_i64();
-
-            read_vec_element(s, tcg_op, rn, pass, MO_64);
-
-            handle_2misc_64(s, opcode, u, tcg_res, tcg_op,
-                            tcg_rmode, tcg_fpstatus);
-
-            write_vec_element(s, tcg_res, rd, pass, MO_64);
-        }
-    } else {
+    {
         int pass;
 
         assert(size == 2);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
             {
                 /* Special cases for 32 bit elements */
                 switch (opcode) {
-                case 0x1a: /* FCVTNS */
-                case 0x1b: /* FCVTMS */
-                case 0x1c: /* FCVTAS */
-                case 0x3a: /* FCVTPS */
-                case 0x3b: /* FCVTZS */
-                    gen_helper_vfp_tosls(tcg_res, tcg_op,
-                                         tcg_constant_i32(0), tcg_fpstatus);
-                    break;
-                case 0x5a: /* FCVTNU */
-                case 0x5b: /* FCVTMU */
-                case 0x5c: /* FCVTAU */
-                case 0x7a: /* FCVTPU */
-                case 0x7b: /* FCVTZU */
-                    gen_helper_vfp_touls(tcg_res, tcg_op,
-                                         tcg_constant_i32(0), tcg_fpstatus);
-                    break;
                 case 0x7c: /* URSQRTE */
                     gen_helper_rsqrte_u32(tcg_res, tcg_op);
                     break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                 case 0x5e: /* FRINT32X */
                 case 0x1f: /* FRINT64Z */
                 case 0x5f: /* FRINT64X */
+                case 0x1a: /* FCVTNS */
+                case 0x1b: /* FCVTMS */
+                case 0x1c: /* FCVTAS */
+                case 0x3a: /* FCVTPS */
+                case 0x3b: /* FCVTZS */
+                case 0x5a: /* FCVTNU */
+                case 0x5b: /* FCVTMU */
+                case 0x5c: /* FCVTAU */
+                case 0x7a: /* FCVTPU */
+                case 0x7b: /* FCVTZU */
                     g_assert_not_reached();
                 }
             }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     case 0x3d: /* FRECPE */
     case 0x3f: /* FRECPX */
         break;
-    case 0x1a: /* FCVTNS */
-        rmode = FPROUNDING_TIEEVEN;
-        break;
-    case 0x1b: /* FCVTMS */
-        rmode = FPROUNDING_NEGINF;
-        break;
-    case 0x1c: /* FCVTAS */
-        rmode = FPROUNDING_TIEAWAY;
-        break;
-    case 0x3a: /* FCVTPS */
-        rmode = FPROUNDING_POSINF;
-        break;
-    case 0x3b: /* FCVTZS */
-        rmode = FPROUNDING_ZERO;
-        break;
-    case 0x5a: /* FCVTNU */
-        rmode = FPROUNDING_TIEEVEN;
-        break;
-    case 0x5b: /* FCVTMU */
-        rmode = FPROUNDING_NEGINF;
-        break;
-    case 0x5c: /* FCVTAU */
-        rmode = FPROUNDING_TIEAWAY;
-        break;
-    case 0x7a: /* FCVTPU */
-        rmode = FPROUNDING_POSINF;
-        break;
-    case 0x7b: /* FCVTZU */
-        rmode = FPROUNDING_ZERO;
-        break;
     case 0x7d: /* FRSQRTE */
         break;
     default:
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     case 0x79: /* FRINTI */
     case 0x1d: /* SCVTF */
     case 0x5d: /* UCVTF */
+    case 0x1a: /* FCVTNS */
+    case 0x1b: /* FCVTMS */
+    case 0x1c: /* FCVTAS */
+    case 0x3a: /* FCVTPS */
+    case 0x3b: /* FCVTZS */
+    case 0x5a: /* FCVTNU */
+    case 0x5b: /* FCVTMU */
+    case 0x5c: /* FCVTAU */
+    case 0x7a: /* FCVTPU */
+    case 0x7b: /* FCVTZU */
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
             read_vec_element_i32(s, tcg_op, rn, pass, MO_16);
 
             switch (fpop) {
-            case 0x1a: /* FCVTNS */
-            case 0x1b: /* FCVTMS */
-            case 0x1c: /* FCVTAS */
-            case 0x3a: /* FCVTPS */
-            case 0x3b: /* FCVTZS */
-                gen_helper_advsimd_f16tosinth(tcg_res, tcg_op, tcg_fpstatus);
-                break;
             case 0x3d: /* FRECPE */
                 gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
                 break;
-            case 0x5a: /* FCVTNU */
-            case 0x5b: /* FCVTMU */
-            case 0x5c: /* FCVTAU */
-            case 0x7a: /* FCVTPU */
-            case 0x7b: /* FCVTZU */
-                gen_helper_advsimd_f16touinth(tcg_res, tcg_op, tcg_fpstatus);
-                break;
             case 0x7d: /* FRSQRTE */
                 gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
                 break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
             case 0x58: /* FRINTA */
             case 0x79: /* FRINTI */
             case 0x59: /* FRINTX */
+            case 0x1a: /* FCVTNS */
+            case 0x1b: /* FCVTMS */
+            case 0x1c: /* FCVTAS */
+            case 0x3a: /* FCVTPS */
+            case 0x3b: /* FCVTZS */
+            case 0x5a: /* FCVTNU */
+            case 0x5b: /* FCVTMU */
+            case 0x5c: /* FCVTAU */
+            case 0x7a: /* FCVTPU */
+            case 0x7b: /* FCVTZU */
                 g_assert_not_reached();
             }
 
diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/vec_helper.c
+++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_rz_hu, helper_vfp_touhh_round_to_zero, uint16_t)
         clear_tail(d, oprsz, simd_maxsz(desc));                         \
     }
 
+DO_VCVT_RMODE(gvec_vcvt_rm_sd, helper_vfp_tosqd, uint64_t)
+DO_VCVT_RMODE(gvec_vcvt_rm_ud, helper_vfp_touqd, uint64_t)
 DO_VCVT_RMODE(gvec_vcvt_rm_ss, helper_vfp_tosls, uint32_t)
 DO_VCVT_RMODE(gvec_vcvt_rm_us, helper_vfp_touls, uint32_t)
 DO_VCVT_RMODE(gvec_vcvt_rm_sh, helper_vfp_toshh, uint16_t)
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

This includes FCMEQ, FCMGT, FCMGE, FCMLT, FCMLE.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-66-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h            |   5 +
 target/arm/tcg/a64.decode      |  30 ++++
 target/arm/tcg/translate-a64.c | 249 +++++++++++++--------------------
 target/arm/tcg/vec_helper.c    |   4 +-
 4 files changed, 138 insertions(+), 150 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fcgt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fcge0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fceq0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fcle0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fclt0_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ UQXTN_s         0111 1110 ..1 00001 01001 0 ..... .....     @rr_e
 
 FCVTXN_s        0111 1110 011 00001 01101 0 ..... .....     @rr_s
 
+FCMGT0_s        0101 1110 111 11000 11001 0 ..... .....     @rr_h
+FCMGT0_s        0101 1110 1.1 00000 11001 0 ..... .....     @rr_sd
+
+FCMGE0_s        0111 1110 111 11000 11001 0 ..... .....     @rr_h
+FCMGE0_s        0111 1110 1.1 00000 11001 0 ..... .....     @rr_sd
+
+FCMEQ0_s        0101 1110 111 11000 11011 0 ..... .....     @rr_h
+FCMEQ0_s        0101 1110 1.1 00000 11011 0 ..... .....     @rr_sd
+
+FCMLE0_s        0111 1110 111 11000 11011 0 ..... .....     @rr_h
+FCMLE0_s        0111 1110 1.1 00000 11011 0 ..... .....     @rr_sd
+
+FCMLT0_s        0101 1110 111 11000 11101 0 ..... .....     @rr_h
+FCMLT0_s        0101 1110 1.1 00000 11101 0 ..... .....     @rr_sd
+
 @icvt_h         . ....... .. ...... ...... rn:5 rd:5 \
                 &fcvt sf=0 esz=1 shift=0
 @icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
@@ -XXX,XX +XXX,XX @@ FCVTAS_vi       0.00 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
 FCVTAU_vi       0.10 1110 011 11001 11001 0 ..... .....     @qrr_h
 FCVTAU_vi       0.10 1110 0.1 00001 11001 0 ..... .....     @qrr_sd
 
+FCMGT0_v        0.00 1110 111 11000 11001 0 ..... .....     @qrr_h
+FCMGT0_v        0.00 1110 1.1 00000 11001 0 ..... .....     @qrr_sd
+
+FCMGE0_v        0.10 1110 111 11000 11001 0 ..... .....     @qrr_h
+FCMGE0_v        0.10 1110 1.1 00000 11001 0 ..... .....     @qrr_sd
+
+FCMEQ0_v        0.00 1110 111 11000 11011 0 ..... .....     @qrr_h
+FCMEQ0_v        0.00 1110 1.1 00000 11011 0 ..... .....     @qrr_sd
+
+FCMLE0_v        0.10 1110 111 11000 11011 0 ..... .....     @qrr_h
+FCMLE0_v        0.10 1110 1.1 00000 11011 0 ..... .....     @qrr_sd
+
+FCMLT0_v        0.00 1110 111 11000 11101 0 ..... .....     @qrr_h
+FCMLT0_v        0.00 1110 1.1 00000 11101 0 ..... .....     @qrr_sd
+
 &fcvt_q         rd rn esz q shift
 @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                 &fcvt_q esz=1 shift=%fcvt_f_sh_h
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static const FPScalar f_scalar_frsqrts = {
 };
 TRANS(FRSQRTS_s, do_fp3_scalar, a, &f_scalar_frsqrts)
 
+static bool do_fcmp0_s(DisasContext *s, arg_rr_e *a,
+                       const FPScalar *f, bool swap)
+{
+    switch (a->esz) {
+    case MO_64:
+        if (fp_access_check(s)) {
+            TCGv_i64 t0 = read_fp_dreg(s, a->rn);
+            TCGv_i64 t1 = tcg_constant_i64(0);
+            if (swap) {
+                f->gen_d(t0, t1, t0, fpstatus_ptr(FPST_FPCR));
+            } else {
+                f->gen_d(t0, t0, t1, fpstatus_ptr(FPST_FPCR));
+            }
+            write_fp_dreg(s, a->rd, t0);
+        }
+        break;
+    case MO_32:
+        if (fp_access_check(s)) {
+            TCGv_i32 t0 = read_fp_sreg(s, a->rn);
+            TCGv_i32 t1 = tcg_constant_i32(0);
+            if (swap) {
+                f->gen_s(t0, t1, t0, fpstatus_ptr(FPST_FPCR));
+            } else {
+                f->gen_s(t0, t0, t1, fpstatus_ptr(FPST_FPCR));
+            }
+            write_fp_sreg(s, a->rd, t0);
+        }
+        break;
+    case MO_16:
+        if (!dc_isar_feature(aa64_fp16, s)) {
+            return false;
+        }
+        if (fp_access_check(s)) {
+            TCGv_i32 t0 = read_fp_hreg(s, a->rn);
+            TCGv_i32 t1 = tcg_constant_i32(0);
+            if (swap) {
+                f->gen_h(t0, t1, t0, fpstatus_ptr(FPST_FPCR_F16));
+            } else {
+                f->gen_h(t0, t0, t1, fpstatus_ptr(FPST_FPCR_F16));
+            }
+            write_fp_sreg(s, a->rd, t0);
+        }
+        break;
+    default:
+        return false;
+    }
+    return true;
+}
+
+TRANS(FCMEQ0_s, do_fcmp0_s, a, &f_scalar_fcmeq, false)
+TRANS(FCMGT0_s, do_fcmp0_s, a, &f_scalar_fcmgt, false)
+TRANS(FCMGE0_s, do_fcmp0_s, a, &f_scalar_fcmge, false)
+TRANS(FCMLT0_s, do_fcmp0_s, a, &f_scalar_fcmgt, true)
+TRANS(FCMLE0_s, do_fcmp0_s, a, &f_scalar_fcmge, true)
+
 static bool do_satacc_s(DisasContext *s, arg_rrr_e *a,
                 MemOp sgn_n, MemOp sgn_m,
                 void (*gen_bhs)(TCGv_i64, TCGv_i64, TCGv_i64, TCGv_i64, MemOp),
@@ -XXX,XX +XXX,XX @@ TRANS(FCVTAS_vi, do_gvec_op2_fpst,
 TRANS(FCVTAU_vi, do_gvec_op2_fpst,
       a->esz, a->q, a->rd, a->rn, float_round_ties_away, f_fcvt_u_vi)
 
-static void handle_2misc_fcmp_zero(DisasContext *s, int opcode,
-                                   bool is_scalar, bool is_u, bool is_q,
-                                   int size, int rn, int rd)
-{
-    bool is_double = (size == MO_64);
-    TCGv_ptr fpst;
+static gen_helper_gvec_2_ptr * const f_fceq0[] = {
+    gen_helper_gvec_fceq0_h,
+    gen_helper_gvec_fceq0_s,
+    gen_helper_gvec_fceq0_d,
+};
+TRANS(FCMEQ0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fceq0)
 
-    if (!fp_access_check(s)) {
-        return;
-    }
+static gen_helper_gvec_2_ptr * const f_fcgt0[] = {
+    gen_helper_gvec_fcgt0_h,
+    gen_helper_gvec_fcgt0_s,
+    gen_helper_gvec_fcgt0_d,
+};
+TRANS(FCMGT0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcgt0)
 
-    fpst = fpstatus_ptr(size == MO_16 ? FPST_FPCR_F16 : FPST_FPCR);
+static gen_helper_gvec_2_ptr * const f_fcge0[] = {
+    gen_helper_gvec_fcge0_h,
+    gen_helper_gvec_fcge0_s,
+    gen_helper_gvec_fcge0_d,
+};
+TRANS(FCMGE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcge0)
 
-    if (is_double) {
-        TCGv_i64 tcg_op = tcg_temp_new_i64();
-        TCGv_i64 tcg_zero = tcg_constant_i64(0);
-        TCGv_i64 tcg_res = tcg_temp_new_i64();
-        NeonGenTwoDoubleOpFn *genfn;
-        bool swap = false;
-        int pass;
+static gen_helper_gvec_2_ptr * const f_fclt0[] = {
+    gen_helper_gvec_fclt0_h,
+    gen_helper_gvec_fclt0_s,
+    gen_helper_gvec_fclt0_d,
+};
+TRANS(FCMLT0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fclt0)
 
-        switch (opcode) {
-        case 0x2e: /* FCMLT (zero) */
-            swap = true;
-            /* fallthrough */
-        case 0x2c: /* FCMGT (zero) */
-            genfn = gen_helper_neon_cgt_f64;
-            break;
-        case 0x2d: /* FCMEQ (zero) */
-            genfn = gen_helper_neon_ceq_f64;
-            break;
-        case 0x6d: /* FCMLE (zero) */
-            swap = true;
-            /* fall through */
-        case 0x6c: /* FCMGE (zero) */
-            genfn = gen_helper_neon_cge_f64;
-            break;
-        default:
-            g_assert_not_reached();
-        }
-
-        for (pass = 0; pass < (is_scalar ? 1 : 2); pass++) {
-            read_vec_element(s, tcg_op, rn, pass, MO_64);
-            if (swap) {
-                genfn(tcg_res, tcg_zero, tcg_op, fpst);
-            } else {
-                genfn(tcg_res, tcg_op, tcg_zero, fpst);
-            }
-            write_vec_element(s, tcg_res, rd, pass, MO_64);
-        }
-
-        clear_vec_high(s, !is_scalar, rd);
-    } else {
-        TCGv_i32 tcg_op = tcg_temp_new_i32();
-        TCGv_i32 tcg_zero = tcg_constant_i32(0);
-        TCGv_i32 tcg_res = tcg_temp_new_i32();
-        NeonGenTwoSingleOpFn *genfn;
-        bool swap = false;
-        int pass, maxpasses;
-
-        if (size == MO_16) {
-            switch (opcode) {
-            case 0x2e: /* FCMLT (zero) */
-                swap = true;
-                /* fall through */
-            case 0x2c: /* FCMGT (zero) */
-                genfn = gen_helper_advsimd_cgt_f16;
-                break;
-            case 0x2d: /* FCMEQ (zero) */
-                genfn = gen_helper_advsimd_ceq_f16;
-                break;
-            case 0x6d: /* FCMLE (zero) */
-                swap = true;
-                /* fall through */
-            case 0x6c: /* FCMGE (zero) */
-                genfn = gen_helper_advsimd_cge_f16;
-                break;
-            default:
-                g_assert_not_reached();
-            }
-        } else {
-            switch (opcode) {
-            case 0x2e: /* FCMLT (zero) */
-                swap = true;
-                /* fall through */
-            case 0x2c: /* FCMGT (zero) */
-                genfn = gen_helper_neon_cgt_f32;
-                break;
-            case 0x2d: /* FCMEQ (zero) */
-                genfn = gen_helper_neon_ceq_f32;
-                break;
-            case 0x6d: /* FCMLE (zero) */
-                swap = true;
-                /* fall through */
-            case 0x6c: /* FCMGE (zero) */
-                genfn = gen_helper_neon_cge_f32;
-                break;
-            default:
-                g_assert_not_reached();
-            }
-        }
-
-        if (is_scalar) {
-            maxpasses = 1;
-        } else {
-            int vector_size = 8 << is_q;
-            maxpasses = vector_size >> size;
-        }
-
-        for (pass = 0; pass < maxpasses; pass++) {
-            read_vec_element_i32(s, tcg_op, rn, pass, size);
-            if (swap) {
-                genfn(tcg_res, tcg_zero, tcg_op, fpst);
-            } else {
-                genfn(tcg_res, tcg_op, tcg_zero, fpst);
-            }
-            if (is_scalar) {
-                write_fp_sreg(s, rd, tcg_res);
-            } else {
-                write_vec_element_i32(s, tcg_res, rd, pass, size);
-            }
-        }
-
-        if (!is_scalar) {
-            clear_vec_high(s, is_q, rd);
-        }
-    }
-}
+static gen_helper_gvec_2_ptr * const f_fcle0[] = {
+    gen_helper_gvec_fcle0_h,
+    gen_helper_gvec_fcle0_s,
+    gen_helper_gvec_fcle0_d,
+};
+TRANS(FCMLE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcle0)
 
 static void handle_2misc_reciprocal(DisasContext *s, int opcode,
                                     bool is_scalar, bool is_u, bool is_q,
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
         size = extract32(size, 0, 1) ? 3 : 2;
         switch (opcode) {
-        case 0x2c: /* FCMGT (zero) */
-        case 0x2d: /* FCMEQ (zero) */
-        case 0x2e: /* FCMLT (zero) */
-        case 0x6c: /* FCMGE (zero) */
-        case 0x6d: /* FCMLE (zero) */
-            handle_2misc_fcmp_zero(s, opcode, true, u, true, size, rn, rd);
-            return;
         case 0x3d: /* FRECPE */
         case 0x3f: /* FRECPX */
         case 0x7d: /* FRSQRTE */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x56: /* FCVTXN, FCVTXN2 */
         case 0x1d: /* SCVTF */
         case 0x5d: /* UCVTF */
+        case 0x2c: /* FCMGT (zero) */
+        case 0x2d: /* FCMEQ (zero) */
+        case 0x2e: /* FCMLT (zero) */
+        case 0x6c: /* FCMGE (zero) */
+        case 0x6d: /* FCMLE (zero) */
         default:
             unallocated_encoding(s);
             return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
         size = is_double ? 3 : 2;
         switch (opcode) {
-        case 0x2c: /* FCMGT (zero) */
-        case 0x2d: /* FCMEQ (zero) */
-        case 0x2e: /* FCMLT (zero) */
-        case 0x6c: /* FCMGE (zero) */
-        case 0x6d: /* FCMLE (zero) */
-            if (size == 3 && !is_q) {
-                unallocated_encoding(s);
-                return;
-            }
-            handle_2misc_fcmp_zero(s, opcode, false, u, is_q, size, rn, rd);
-            return;
         case 0x3c: /* URECPE */
             if (size == 3) {
                 unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x7b: /* FCVTZU */
         case 0x5c: /* FCVTAU */
         case 0x1c: /* FCVTAS */
+        case 0x2c: /* FCMGT (zero) */
+        case 0x2d: /* FCMEQ (zero) */
+        case 0x2e: /* FCMLT (zero) */
+        case 0x6c: /* FCMGE (zero) */
+        case 0x6d: /* FCMLE (zero) */
             unallocated_encoding(s);
             return;
         }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     fpop = deposit32(fpop, 6, 1, u);
 
     switch (fpop) {
-    case 0x2c: /* FCMGT (zero) */
-    case 0x2d: /* FCMEQ (zero) */
-    case 0x2e: /* FCMLT (zero) */
-    case 0x6c: /* FCMGE (zero) */
-    case 0x6d: /* FCMLE (zero) */
-        handle_2misc_fcmp_zero(s, fpop, is_scalar, 0, is_q, MO_16, rn, rd);
-        return;
     case 0x3d: /* FRECPE */
     case 0x3f: /* FRECPX */
         break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
     case 0x5c: /* FCVTAU */
     case 0x7a: /* FCVTPU */
     case 0x7b: /* FCVTZU */
+    case 0x2c: /* FCMGT (zero) */
+    case 0x2d: /* FCMEQ (zero) */
+    case 0x2e: /* FCMLT (zero) */
+    case 0x6c: /* FCMGE (zero) */
+    case 0x6d: /* FCMLE (zero) */
         unallocated_encoding(s);
         return;
     }
diff --git a/target/arm/tcg/vec_helper.c b/target/arm/tcg/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/vec_helper.c
+++ b/target/arm/tcg/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_touszh, vfp_touszh, float16)
 #define DO_2OP_CMP0(FN, CMPOP, DIRN)                    \
     WRAP_CMP0_##DIRN(FN, CMPOP, float16)                \
     WRAP_CMP0_##DIRN(FN, CMPOP, float32)                \
+    WRAP_CMP0_##DIRN(FN, CMPOP, float64)                \
     DO_2OP(gvec_f##FN##0_h, float16_##FN##0, float16)   \
-    DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)
+    DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)   \
+    DO_2OP(gvec_f##FN##0_d, float64_##FN##0, float64)
 
 DO_2OP_CMP0(cgt, cgt, FWD)
 DO_2OP_CMP0(cge, cge, FWD)
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Remove disas_simd_scalar_two_reg_misc and
disas_simd_two_reg_misc_fp16 as these were the
last insns decoded by those functions.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-67-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |  15 ++
 target/arm/tcg/translate-a64.c | 329 ++++-----------------------------
 2 files changed, 53 insertions(+), 291 deletions(-)

diff --git a/target/arm/tcg/a64.decode b/target/arm/tcg/a64.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/a64.decode
+++ b/target/arm/tcg/a64.decode
@@ -XXX,XX +XXX,XX @@ FCMLE0_s        0111 1110 1.1 00000 11011 0 ..... .....     @rr_sd
 FCMLT0_s        0101 1110 111 11000 11101 0 ..... .....     @rr_h
 FCMLT0_s        0101 1110 1.1 00000 11101 0 ..... .....     @rr_sd
 
+FRECPE_s        0101 1110 111 11001 11011 0 ..... .....     @rr_h
+FRECPE_s        0101 1110 1.1 00001 11011 0 ..... .....     @rr_sd
+
+FRECPX_s        0101 1110 111 11001 11111 0 ..... .....     @rr_h
+FRECPX_s        0101 1110 1.1 00001 11111 0 ..... .....     @rr_sd
+
+FRSQRTE_s       0111 1110 111 11001 11011 0 ..... .....     @rr_h
+FRSQRTE_s       0111 1110 1.1 00001 11011 0 ..... .....     @rr_sd
+
 @icvt_h         . ....... .. ...... ...... rn:5 rd:5 \
                 &fcvt sf=0 esz=1 shift=0
 @icvt_sd        . ....... .. ...... ...... rn:5 rd:5 \
@@ -XXX,XX +XXX,XX @@ FCMLE0_v        0.10 1110 1.1 00000 11011 0 ..... .....     @qrr_sd
 FCMLT0_v        0.00 1110 111 11000 11101 0 ..... .....     @qrr_h
 FCMLT0_v        0.00 1110 1.1 00000 11101 0 ..... .....     @qrr_sd
 
+FRECPE_v        0.00 1110 111 11001 11011 0 ..... .....     @qrr_h
+FRECPE_v        0.00 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
+
+FRSQRTE_v       0.10 1110 111 11001 11011 0 ..... .....     @qrr_h
+FRSQRTE_v       0.10 1110 1.1 00001 11011 0 ..... .....     @qrr_sd
+
 &fcvt_q         rd rn esz q shift
 @fcvtq_h        . q:1 . ...... 001 .... ...... rn:5 rd:5    \
                 &fcvt_q esz=1 shift=%fcvt_f_sh_h
diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ TRANS_FEAT(FRINT64Z_s, aa64_frint, do_fp1_scalar, a,
            &f_scalar_frint64, FPROUNDING_ZERO)
 TRANS_FEAT(FRINT64X_s, aa64_frint, do_fp1_scalar, a, &f_scalar_frint64, -1)
 
+static const FPScalar1 f_scalar_frecpe = {
+    gen_helper_recpe_f16,
+    gen_helper_recpe_f32,
+    gen_helper_recpe_f64,
+};
+TRANS(FRECPE_s, do_fp1_scalar, a, &f_scalar_frecpe, -1)
+
+static const FPScalar1 f_scalar_frecpx = {
+    gen_helper_frecpx_f16,
+    gen_helper_frecpx_f32,
+    gen_helper_frecpx_f64,
+};
+TRANS(FRECPX_s, do_fp1_scalar, a, &f_scalar_frecpx, -1)
+
+static const FPScalar1 f_scalar_frsqrte = {
+    gen_helper_rsqrte_f16,
+    gen_helper_rsqrte_f32,
+    gen_helper_rsqrte_f64,
+};
+TRANS(FRSQRTE_s, do_fp1_scalar, a, &f_scalar_frsqrte, -1)
+
 static bool trans_FCVT_s_ds(DisasContext *s, arg_rr *a)
 {
     if (fp_access_check(s)) {
@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_2_ptr * const f_fcle0[] = {
 };
 TRANS(FCMLE0_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_fcle0)
 
+static gen_helper_gvec_2_ptr * const f_frecpe[] = {
+    gen_helper_gvec_frecpe_h,
+    gen_helper_gvec_frecpe_s,
+    gen_helper_gvec_frecpe_d,
+};
+TRANS(FRECPE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frecpe)
+
+static gen_helper_gvec_2_ptr * const f_frsqrte[] = {
+    gen_helper_gvec_frsqrte_h,
+    gen_helper_gvec_frsqrte_s,
+    gen_helper_gvec_frsqrte_d,
+};
+TRANS(FRSQRTE_v, do_gvec_op2_fpst, a->esz, a->q, a->rd, a->rn, 0, f_frsqrte)
+
 static void handle_2misc_reciprocal(DisasContext *s, int opcode,
                                     bool is_scalar, bool is_u, bool is_q,
                                     int size, int rn, int rd)
 {
     bool is_double = (size == 3);
-    TCGv_ptr fpst = fpstatus_ptr(FPST_FPCR);
 
     if (is_double) {
-        TCGv_i64 tcg_op = tcg_temp_new_i64();
-        TCGv_i64 tcg_res = tcg_temp_new_i64();
-        int pass;
-
-        for (pass = 0; pass < (is_scalar ? 1 : 2); pass++) {
-            read_vec_element(s, tcg_op, rn, pass, MO_64);
-            switch (opcode) {
-            case 0x3d: /* FRECPE */
-                gen_helper_recpe_f64(tcg_res, tcg_op, fpst);
-                break;
-            case 0x3f: /* FRECPX */
-                gen_helper_frecpx_f64(tcg_res, tcg_op, fpst);
-                break;
-            case 0x7d: /* FRSQRTE */
-                gen_helper_rsqrte_f64(tcg_res, tcg_op, fpst);
-                break;
-            default:
-                g_assert_not_reached();
-            }
-            write_vec_element(s, tcg_res, rd, pass, MO_64);
-        }
-        clear_vec_high(s, !is_scalar, rd);
+        g_assert_not_reached();
     } else {
         TCGv_i32 tcg_op = tcg_temp_new_i32();
         TCGv_i32 tcg_res = tcg_temp_new_i32();
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
                 gen_helper_recpe_u32(tcg_res, tcg_op);
                 break;
             case 0x3d: /* FRECPE */
-                gen_helper_recpe_f32(tcg_res, tcg_op, fpst);
-                break;
             case 0x3f: /* FRECPX */
-                gen_helper_frecpx_f32(tcg_res, tcg_op, fpst);
-                break;
             case 0x7d: /* FRSQRTE */
-                gen_helper_rsqrte_f32(tcg_res, tcg_op, fpst);
-                break;
             default:
                 g_assert_not_reached();
             }
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
     }
 }
 
-/* AdvSIMD scalar two reg misc
- *  31 30  29 28       24 23  22 21       17 16    12 11 10 9    5 4    0
- * +-----+---+-----------+------+-----------+--------+-----+------+------+
- * | 0 1 | U | 1 1 1 1 0 | size | 1 0 0 0 0 | opcode | 1 0 |  Rn  |  Rd  |
- * +-----+---+-----------+------+-----------+--------+-----+------+------+
- */
-static void disas_simd_scalar_two_reg_misc(DisasContext *s, uint32_t insn)
-{
-    int rd = extract32(insn, 0, 5);
-    int rn = extract32(insn, 5, 5);
-    int opcode = extract32(insn, 12, 5);
-    int size = extract32(insn, 22, 2);
-    bool u = extract32(insn, 29, 1);
-
-    switch (opcode) {
-    case 0xc ... 0xf:
-    case 0x16 ... 0x1d:
-    case 0x1f:
-        /* Floating point: U, size[1] and opcode indicate operation;
-         * size[0] indicates single or double precision.
-         */
-        opcode |= (extract32(size, 1, 1) << 5) | (u << 6);
-        size = extract32(size, 0, 1) ? 3 : 2;
-        switch (opcode) {
-        case 0x3d: /* FRECPE */
-        case 0x3f: /* FRECPX */
-        case 0x7d: /* FRSQRTE */
-            if (!fp_access_check(s)) {
-                return;
-            }
-            handle_2misc_reciprocal(s, opcode, true, u, true, size, rn, rd);
-            return;
-        case 0x1a: /* FCVTNS */
-        case 0x1b: /* FCVTMS */
-        case 0x3a: /* FCVTPS */
-        case 0x3b: /* FCVTZS */
-        case 0x5a: /* FCVTNU */
-        case 0x5b: /* FCVTMU */
-        case 0x7a: /* FCVTPU */
-        case 0x7b: /* FCVTZU */
-        case 0x1c: /* FCVTAS */
-        case 0x5c: /* FCVTAU */
-        case 0x56: /* FCVTXN, FCVTXN2 */
-        case 0x1d: /* SCVTF */
-        case 0x5d: /* UCVTF */
-        case 0x2c: /* FCMGT (zero) */
-        case 0x2d: /* FCMEQ (zero) */
-        case 0x2e: /* FCMLT (zero) */
-        case 0x6c: /* FCMGE (zero) */
-        case 0x6d: /* FCMLE (zero) */
-        default:
-            unallocated_encoding(s);
-            return;
-        }
-        break;
-    default:
-    case 0x3: /* USQADD / SUQADD */
-    case 0x7: /* SQABS / SQNEG */
-    case 0x8: /* CMGT, CMGE */
-    case 0x9: /* CMEQ, CMLE */
-    case 0xa: /* CMLT */
-    case 0xb: /* ABS, NEG */
-    case 0x12: /* SQXTUN */
-    case 0x14: /* SQXTN, UQXTN */
-        unallocated_encoding(s);
-        return;
-    }
-    g_assert_not_reached();
-}
-
 static void handle_2misc_widening(DisasContext *s, int opcode, bool is_q,
                                   int size, int rn, int rd)
 {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                 unallocated_encoding(s);
                 return;
             }
-            /* fall through */
-        case 0x3d: /* FRECPE */
-        case 0x7d: /* FRSQRTE */
-            if (size == 3 && !is_q) {
-                unallocated_encoding(s);
-                return;
-            }
             if (!fp_access_check(s)) {
                 return;
             }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
         case 0x2e: /* FCMLT (zero) */
         case 0x6c: /* FCMGE (zero) */
         case 0x6d: /* FCMLE (zero) */
+        case 0x3d: /* FRECPE */
+        case 0x7d: /* FRSQRTE */
             unallocated_encoding(s);
             return;
         }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
     }
 }
 
-/* AdvSIMD [scalar] two register miscellaneous (FP16)
- *
- *   31  30  29 28  27     24  23 22 21       17 16    12 11 10 9    5 4    0
- * +---+---+---+---+---------+---+-------------+--------+-----+------+------+
- * | 0 | Q | U | S | 1 1 1 0 | a | 1 1 1 1 0 0 | opcode | 1 0 |  Rn  |  Rd  |
- * +---+---+---+---+---------+---+-------------+--------+-----+------+------+
- *   mask: 1000 1111 0111 1110 0000 1100 0000 0000 0x8f7e 0c00
- *   val:  0000 1110 0111 1000 0000 1000 0000 0000 0x0e78 0800
- *
- * This actually covers two groups where scalar access is governed by
- * bit 28. A bunch of the instructions (float to integral) only exist
- * in the vector form and are un-allocated for the scalar decode. Also
- * in the scalar decode Q is always 1.
- */
-static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
-{
-    int fpop, opcode, a, u;
-    int rn, rd;
-    bool is_q;
-    bool is_scalar;
-
-    int pass;
-    TCGv_i32 tcg_rmode = NULL;
-    TCGv_ptr tcg_fpstatus = NULL;
-    bool need_fpst = true;
-    int rmode = -1;
-
-    if (!dc_isar_feature(aa64_fp16, s)) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    rd = extract32(insn, 0, 5);
-    rn = extract32(insn, 5, 5);
-
-    a = extract32(insn, 23, 1);
-    u = extract32(insn, 29, 1);
-    is_scalar = extract32(insn, 28, 1);
-    is_q = extract32(insn, 30, 1);
-
-    opcode = extract32(insn, 12, 5);
-    fpop = deposit32(opcode, 5, 1, a);
-    fpop = deposit32(fpop, 6, 1, u);
-
-    switch (fpop) {
-    case 0x3d: /* FRECPE */
-    case 0x3f: /* FRECPX */
-        break;
-    case 0x7d: /* FRSQRTE */
-        break;
-    default:
-    case 0x2f: /* FABS */
-    case 0x6f: /* FNEG */
-    case 0x7f: /* FSQRT (vector) */
-    case 0x18: /* FRINTN */
-    case 0x19: /* FRINTM */
-    case 0x38: /* FRINTP */
-    case 0x39: /* FRINTZ */
-    case 0x58: /* FRINTA */
-    case 0x59: /* FRINTX */
-    case 0x79: /* FRINTI */
-    case 0x1d: /* SCVTF */
-    case 0x5d: /* UCVTF */
-    case 0x1a: /* FCVTNS */
-    case 0x1b: /* FCVTMS */
-    case 0x1c: /* FCVTAS */
-    case 0x3a: /* FCVTPS */
-    case 0x3b: /* FCVTZS */
-    case 0x5a: /* FCVTNU */
-    case 0x5b: /* FCVTMU */
-    case 0x5c: /* FCVTAU */
-    case 0x7a: /* FCVTPU */
-    case 0x7b: /* FCVTZU */
-    case 0x2c: /* FCMGT (zero) */
-    case 0x2d: /* FCMEQ (zero) */
-    case 0x2e: /* FCMLT (zero) */
-    case 0x6c: /* FCMGE (zero) */
-    case 0x6d: /* FCMLE (zero) */
-        unallocated_encoding(s);
-        return;
-    }
-
-
-    /* Check additional constraints for the scalar encoding */
-    if (is_scalar) {
-        if (!is_q) {
-            unallocated_encoding(s);
-            return;
-        }
-    }
-
-    if (!fp_access_check(s)) {
-        return;
-    }
-
-    if (rmode >= 0 || need_fpst) {
-        tcg_fpstatus = fpstatus_ptr(FPST_FPCR_F16);
-    }
-
-    if (rmode >= 0) {
-        tcg_rmode = gen_set_rmode(rmode, tcg_fpstatus);
-    }
-
-    if (is_scalar) {
-        TCGv_i32 tcg_op = read_fp_hreg(s, rn);
-        TCGv_i32 tcg_res = tcg_temp_new_i32();
-
-        switch (fpop) {
-        case 0x3d: /* FRECPE */
-            gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
-            break;
-        case 0x3f: /* FRECPX */
-            gen_helper_frecpx_f16(tcg_res, tcg_op, tcg_fpstatus);
-            break;
-        case 0x7d: /* FRSQRTE */
-            gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
-            break;
-        default:
-        case 0x1a: /* FCVTNS */
-        case 0x1b: /* FCVTMS */
-        case 0x1c: /* FCVTAS */
-        case 0x3a: /* FCVTPS */
-        case 0x3b: /* FCVTZS */
-        case 0x5a: /* FCVTNU */
-        case 0x5b: /* FCVTMU */
-        case 0x5c: /* FCVTAU */
-        case 0x7a: /* FCVTPU */
-        case 0x7b: /* FCVTZU */
-            g_assert_not_reached();
-        }
-
-        /* limit any sign extension going on */
-        tcg_gen_andi_i32(tcg_res, tcg_res, 0xffff);
-        write_fp_sreg(s, rd, tcg_res);
-    } else {
-        for (pass = 0; pass < (is_q ? 8 : 4); pass++) {
-            TCGv_i32 tcg_op = tcg_temp_new_i32();
-            TCGv_i32 tcg_res = tcg_temp_new_i32();
-
-            read_vec_element_i32(s, tcg_op, rn, pass, MO_16);
-
-            switch (fpop) {
-            case 0x3d: /* FRECPE */
-                gen_helper_recpe_f16(tcg_res, tcg_op, tcg_fpstatus);
-                break;
-            case 0x7d: /* FRSQRTE */
-                gen_helper_rsqrte_f16(tcg_res, tcg_op, tcg_fpstatus);
-                break;
-            default:
-            case 0x2f: /* FABS */
-            case 0x6f: /* FNEG */
-            case 0x7f: /* FSQRT */
-            case 0x18: /* FRINTN */
-            case 0x19: /* FRINTM */
-            case 0x38: /* FRINTP */
-            case 0x39: /* FRINTZ */
-            case 0x58: /* FRINTA */
-            case 0x79: /* FRINTI */
-            case 0x59: /* FRINTX */
-            case 0x1a: /* FCVTNS */
-            case 0x1b: /* FCVTMS */
-            case 0x1c: /* FCVTAS */
-            case 0x3a: /* FCVTPS */
-            case 0x3b: /* FCVTZS */
-            case 0x5a: /* FCVTNU */
-            case 0x5b: /* FCVTMU */
-            case 0x5c: /* FCVTAU */
-            case 0x7a: /* FCVTPU */
-            case 0x7b: /* FCVTZU */
-                g_assert_not_reached();
-            }
-
-            write_vec_element_i32(s, tcg_res, rd, pass, MO_16);
-        }
-
-        clear_vec_high(s, is_q, rd);
-    }
-
-    if (tcg_rmode) {
-        gen_restore_rmode(tcg_rmode, tcg_fpstatus);
-    }
-}
-
 /* C3.6 Data processing - SIMD, inc Crypto
  *
  * As the decode gets a little complex we are using a table based
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc_fp16(DisasContext *s, uint32_t insn)
 static const AArch64DecodeTable data_proc_simd[] = {
     /* pattern  ,  mask     ,  fn                        */
     { 0x0e200800, 0x9f3e0c00, disas_simd_two_reg_misc },
-    { 0x5e200800, 0xdf3e0c00, disas_simd_scalar_two_reg_misc },
-    { 0x0e780800, 0x8f7e0c00, disas_simd_two_reg_misc_fp16 },
     { 0x00000000, 0x00000000, NULL }
 };
 
-- 
2.34.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-68-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h             |  3 +++
 target/arm/tcg/translate.h      |  5 +++++
 target/arm/tcg/gengvec.c        | 16 ++++++++++++++++
 target/arm/tcg/translate-neon.c |  4 ++--
 target/arm/tcg/vec_helper.c     | 22 ++++++++++++++++++++++
 5 files changed, 48 insertions(+), 2 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove handle_2misc_reciprocal as these were the last
insns decoded by that function.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-69-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   3 +
 target/arm/tcg/translate-a64.c | 139 ++-------------------------------
 2 files changed, 8 insertions(+), 134 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Remove lookup_disas_fn, handle_2misc_widening,
disas_simd_two_reg_misc, disas_data_proc_simd,
disas_data_proc_simd_fp, disas_a64_legacy, as
this is the final insn to be converted.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241211163036.2297116-70-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/a64.decode      |   2 +
 target/arm/tcg/translate-a64.c | 202 +++------------------------------
 2 files changed, 18 insertions(+), 186 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Softfloat has native support for round-to-odd.  Use it.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241206031428.78634-1-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tcg/helper-a64.c | 18 ++++--------------
 1 file changed, 4 insertions(+), 14 deletions(-)

diff --git a/target/arm/tcg/helper-a64.c b/target/arm/tcg/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/helper-a64.c
+++ b/target/arm/tcg/helper-a64.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(frecpx_f64)(float64 a, void *fpstp)
 
 float32 HELPER(fcvtx_f64_to_f32)(float64 a, CPUARMState *env)
 {
-    /* Von Neumann rounding is implemented by using round-to-zero
-     * and then setting the LSB of the result if Inexact was raised.
-     */
     float32 r;
     float_status *fpst = &env->vfp.fp_status;
-    float_status tstat = *fpst;
-    int exflags;
+    int old = get_float_rounding_mode(fpst);
 
-    set_float_rounding_mode(float_round_to_zero, &tstat);
-    set_float_exception_flags(0, &tstat);
-    r = float64_to_float32(a, &tstat);
-    exflags = get_float_exception_flags(&tstat);
-    if (exflags & float_flag_inexact) {
-        r = make_float32(float32_val(r) | 1);
-    }
-    exflags |= get_float_exception_flags(fpst);
-    set_float_exception_flags(exflags, fpst);
+    set_float_rounding_mode(float_round_to_odd, fpst);
+    r = float64_to_float32(a, fpst);
+    set_float_rounding_mode(old, fpst);
     return r;
 }
 
-- 
2.34.1

From: Pierrick Bouvier <pierrick.bouvier@linaro.org>

www.orangepi.org does not support https, it's expected to stick to http.

Reviewed-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
Message-id: 20241206192254.3889131-2-pierrick.bouvier@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/orangepi.rst | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docs/system/arm/orangepi.rst b/docs/system/arm/orangepi.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/orangepi.rst
+++ b/docs/system/arm/orangepi.rst
@@ -XXX,XX +XXX,XX @@ Orange Pi PC images
 Note that the mainline kernel does not have a root filesystem. You may provide it
 with an official Orange Pi PC image from the official website:
 
-  http://www.orangepi.org/downloadresources/
+  http://www.orangepi.org/html/serviceAndSupport/index.html
 
 Another possibility is to run an Armbian image for Orange Pi PC which
 can be downloaded from:
@@ -XXX,XX +XXX,XX @@ including the Orange Pi PC. NetBSD 9.0 is known to work best for the Orange Pi P
 board and provides a fully working system with serial console, networking and storage.
 For the Orange Pi PC machine, get the 'evbarm-earmv7hf' based image from:
 
-  https://cdn.netbsd.org/pub/NetBSD/NetBSD-9.0/evbarm-earmv7hf/binary/gzimg/armv7.img.gz
+  https://archive.netbsd.org/pub/NetBSD-archive/NetBSD-9.0/evbarm-earmv7hf/binary/gzimg/armv7.img.gz
 
 The image requires manually installing U-Boot in the image. Build U-Boot with
 the orangepi_pc_defconfig configuration as described in the previous section.
-- 
2.34.1

From: Pierrick Bouvier <pierrick.bouvier@linaro.org>

Reviewed-by: Cédric Le Goater <clg@redhat.com>
Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
Message-id: 20241206192254.3889131-3-pierrick.bouvier@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/fby35.rst | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/docs/system/arm/fby35.rst b/docs/system/arm/fby35.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/fby35.rst
+++ b/docs/system/arm/fby35.rst
@@ -XXX,XX +XXX,XX @@ process starts.
     $ screen /dev/tty0 # In a separate TMUX pane, terminal window, etc.
     $ screen /dev/tty1
     $ (qemu) c		   # Start the boot process once screen is setup.
+
+This machine model supports emulation of the boot from the CE0 flash device by
+setting option ``execute-in-place``. When using this option, the CPU fetches
+instructions to execute by reading CE0 and not from a preloaded ROM
+initialized at machine init time. As a result, execution will be slower.
-- 
2.34.1

From: Pierrick Bouvier <pierrick.bouvier@linaro.org>

Signed-off-by: Pierrick Bouvier <pierrick.bouvier@linaro.org>
Message-id: 20241206192254.3889131-5-pierrick.bouvier@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/virt.rst | 16 ++++++++++++++++
 1 file changed, 16 insertions(+)

diff --git a/docs/system/arm/virt.rst b/docs/system/arm/virt.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/virt.rst
+++ b/docs/system/arm/virt.rst
@@ -XXX,XX +XXX,XX @@ iommu
   ``smmuv3``
     Create an SMMUv3
 
+default-bus-bypass-iommu
+  Set ``on``/``off`` to enable/disable `bypass_iommu
+  <https://gitlab.com/qemu-project/qemu/-/blob/master/docs/bypass-iommu.txt>`_
+  for default root bus.
+
 ras
   Set ``on``/``off`` to enable/disable reporting host memory errors to a guest
   using ACPI and guest external abort exceptions. The default is off.
 
+acpi
+  Set ``on``/``off``/``auto`` to enable/disable ACPI.
+
 dtb-randomness
   Set ``on``/``off`` to pass random seeds via the guest DTB
   rng-seed and kaslr-seed nodes (in both "/chosen" and
@@ -XXX,XX +XXX,XX @@ dtb-randomness
 dtb-kaslr-seed
   A deprecated synonym for dtb-randomness.
 
+x-oem-id
+  Set string (up to 6 bytes) to override the default value of field OEMID in ACPI
+  table header.
+
+x-oem-table-id
+  Set string (up to 8 bytes) to override the default value of field OEM Table ID
+  in ACPI table header.
+
 Linux guest kernel configuration
 """"""""""""""""""""""""""""""""
 
-- 
2.34.1

target/arm/helper.c is very large and unwieldy.  One subset of code
that we can pull out into its own file is the cpreg arrays and
corresponding functions for the TLBI instructions.

Because these are instructions they are only relevant for TCG and we
can make the new file only be built for CONFIG_TCG.

In this commit we move the AArch32 instructions from:
 not_v7_cp_reginfo[]
 v7_cp_reginfo[]
 v7mp_cp_reginfo[]
 v8_cp_reginfo[]
into a new file target/arm/tcg/tlb-insns.c.

A few small functions are used both by functions we haven't yet moved
across and by functions we have already moved.  We temporarily make
these global with a prototype in cpregs.h; when the move of all TLBI
insns is complete these will return to being file-local.

For CONFIG_TCG, this is just moving code around.  For a KVM only
build, these cpregs will no longer be added to the cpregs hashtable
for the CPU.  However this should not be a behaviour change, because:
 * we never try to migration sync or otherwise include
   ARM_CP_NO_RAW cpregs
 * for migration we treat the kernel's list of system registers
   as the authoritative one, so these TLBI insns were never
   in it anyway
The no-tcg stub of define_tlb_insn_regs() therefore does nothing.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-2-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |  14 +++
 target/arm/internals.h     |   3 +
 target/arm/helper.c        | 231 ++--------------------------------
 target/arm/tcg-stubs.c     |   5 +
 target/arm/tcg/tlb-insns.c | 246 +++++++++++++++++++++++++++++++++++++
 target/arm/tcg/meson.build |   1 +
 6 files changed, 280 insertions(+), 220 deletions(-)
 create mode 100644 target/arm/tcg/tlb-insns.c

diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpregs.h
+++ b/target/arm/cpregs.h
@@ -XXX,XX +XXX,XX @@ static inline bool arm_cpreg_traps_in_nv(const ARMCPRegInfo *ri)
     return ri->opc1 == 4 || ri->opc1 == 5;
 }
 
+/*
+ * Temporary declarations of functions until the move to tlb_insn_helper.c
+ * is complete and we can make the functions static again
+ */
+CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
+                           bool isread);
+CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
+                             bool isread);
+bool tlb_force_broadcast(CPUARMState *env);
+void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                       uint64_t value);
+void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                          uint64_t value);
+
 #endif /* TARGET_ARM_CPREGS_H */
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline uint64_t pauth_ptr_mask(ARMVAParameters param)
 /* Add the cpreg definitions for debug related system registers */
 void define_debug_regs(ARMCPU *cpu);
 
+/* Add the cpreg definitions for TLBI instructions */
+void define_tlb_insn_regs(ARMCPU *cpu);
+
 /* Effective value of MDCR_EL2 */
 static inline uint64_t arm_mdcr_el2_eff(CPUARMState *env)
 {
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tacr(CPUARMState *env, const ARMCPRegInfo *ri,
 }
 
 /* Check for traps from EL1 due to HCR_EL2.TTLB. */
-static CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-                                  bool isread)
+CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
+                           bool isread)
 {
     if (arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_TTLB)) {
         return CP_ACCESS_TRAP_EL2;
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
 }
 
 /* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBIS. */
-static CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
-                                    bool isread)
+CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
+                             bool isread)
 {
     if (arm_current_el(env) == 1 &&
         (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBIS))) {
@@ -XXX,XX +XXX,XX @@ static int alle1_tlbmask(CPUARMState *env)
             ARMMMUIdxBit_Stage2_S);
 }
 
-
-/* IS variants of TLB operations must affect all cores */
-static void tlbiall_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush_all_cpus_synced(cs);
-}
-
-static void tlbiasid_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush_all_cpus_synced(cs);
-}
-
-static void tlbimva_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
-}
-
-static void tlbimvaa_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
-}
-
 /*
  * Non-IS variants of TLB operations are upgraded to
  * IS versions if we are at EL1 and HCR_EL2.FB is effectively set to
  * force broadcast of these operations.
  */
-static bool tlb_force_broadcast(CPUARMState *env)
+bool tlb_force_broadcast(CPUARMState *env)
 {
     return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
 }
 
-static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                          uint64_t value)
-{
-    /* Invalidate all (TLBIALL) */
-    CPUState *cs = env_cpu(env);
-
-    if (tlb_force_broadcast(env)) {
-        tlb_flush_all_cpus_synced(cs);
-    } else {
-        tlb_flush(cs);
-    }
-}
-
-static void tlbimva_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                          uint64_t value)
-{
-    /* Invalidate single TLB entry by MVA and ASID (TLBIMVA) */
-    CPUState *cs = env_cpu(env);
-
-    value &= TARGET_PAGE_MASK;
-    if (tlb_force_broadcast(env)) {
-        tlb_flush_page_all_cpus_synced(cs, value);
-    } else {
-        tlb_flush_page(cs, value);
-    }
-}
-
-static void tlbiasid_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                           uint64_t value)
-{
-    /* Invalidate by ASID (TLBIASID) */
-    CPUState *cs = env_cpu(env);
-
-    if (tlb_force_broadcast(env)) {
-        tlb_flush_all_cpus_synced(cs);
-    } else {
-        tlb_flush(cs);
-    }
-}
-
-static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                           uint64_t value)
-{
-    /* Invalidate single entry by MVA, all ASIDs (TLBIMVAA) */
-    CPUState *cs = env_cpu(env);
-
-    value &= TARGET_PAGE_MASK;
-    if (tlb_force_broadcast(env)) {
-        tlb_flush_page_all_cpus_synced(cs, value);
-    } else {
-        tlb_flush_page(cs, value);
-    }
-}
-
 static void tlbiall_nsnh_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
 }
 
-static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                              uint64_t value)
+void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                       uint64_t value)
 {
     CPUState *cs = env_cpu(env);
     uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E2);
 }
 
-static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                 uint64_t value)
+void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                          uint64_t value)
 {
     CPUState *cs = env_cpu(env);
     uint64_t pageaddr = value & ~MAKE_64BIT_MASK(0, 12);
@@ -XXX,XX +XXX,XX @@ static void tlbimva_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                              ARMMMUIdxBit_E2);
 }
 
-static void tlbiipas2_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
-
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
-}
-
-static void tlbiipas2is_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
-
-    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, ARMMMUIdxBit_Stage2);
-}
-
 static const ARMCPRegInfo cp_reginfo[] = {
     /*
      * Define the secure and non-secure FCSE identifier CP registers
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo not_v7_cp_reginfo[] = {
      */
     { .name = "DBGDIDR", .cp = 14, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 0,
       .access = PL0_R, .type = ARM_CP_CONST, .resetvalue = 0 },
-    /*
-     * MMU TLB control. Note that the wildcarding means we cover not just
-     * the unified TLB ops but also the dside/iside/inner-shareable variants.
-     */
-    { .name = "TLBIALL", .cp = 15, .crn = 8, .crm = CP_ANY,
-      .opc1 = CP_ANY, .opc2 = 0, .access = PL1_W, .writefn = tlbiall_write,
-      .type = ARM_CP_NO_RAW },
-    { .name = "TLBIMVA", .cp = 15, .crn = 8, .crm = CP_ANY,
-      .opc1 = CP_ANY, .opc2 = 1, .access = PL1_W, .writefn = tlbimva_write,
-      .type = ARM_CP_NO_RAW },
-    { .name = "TLBIASID", .cp = 15, .crn = 8, .crm = CP_ANY,
-      .opc1 = CP_ANY, .opc2 = 2, .access = PL1_W, .writefn = tlbiasid_write,
-      .type = ARM_CP_NO_RAW },
-    { .name = "TLBIMVAA", .cp = 15, .crn = 8, .crm = CP_ANY,
-      .opc1 = CP_ANY, .opc2 = 3, .access = PL1_W, .writefn = tlbimvaa_write,
-      .type = ARM_CP_NO_RAW },
     { .name = "PRRR", .cp = 15, .crn = 10, .crm = 2,
       .opc1 = 0, .opc2 = 0, .access = PL1_RW, .type = ARM_CP_NOP },
     { .name = "NMRR", .cp = 15, .crn = 10, .crm = 2,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
       .opc0 = 3, .opc1 = 0, .crn = 12, .crm = 1, .opc2 = 0,
       .fgt = FGT_ISR_EL1,
       .type = ARM_CP_NO_RAW, .access = PL1_R, .readfn = isr_read },
-    /* 32 bit ITLB invalidates */
-    { .name = "ITLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 0,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbiall_write },
-    { .name = "ITLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbimva_write },
-    { .name = "ITLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 2,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbiasid_write },
-    /* 32 bit DTLB invalidates */
-    { .name = "DTLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 0,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbiall_write },
-    { .name = "DTLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbimva_write },
-    { .name = "DTLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 2,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbiasid_write },
-    /* 32 bit TLB invalidates */
-    { .name = "TLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbiall_write },
-    { .name = "TLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbimva_write },
-    { .name = "TLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbiasid_write },
-    { .name = "TLBIMVAA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbimvaa_write },
-};
-
-static const ARMCPRegInfo v7mp_cp_reginfo[] = {
-    /* 32 bit TLB invalidates, Inner Shareable */
-    { .name = "TLBIALLIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
-      .writefn = tlbiall_is_write },
-    { .name = "TLBIMVAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
-      .writefn = tlbimva_is_write },
-    { .name = "TLBIASIDIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
-      .writefn = tlbiasid_is_write },
-    { .name = "TLBIMVAAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
-      .writefn = tlbimvaa_is_write },
 };
 
 static const ARMCPRegInfo pmovsset_cp_reginfo[] = {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v8_cp_reginfo[] = {
       .fieldoffset = offsetof(CPUARMState, cp15.par_el[1]),
       .writefn = par_write },
 #endif
-    /* TLB invalidate last level of translation table walk */
-    { .name = "TLBIMVALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
-      .writefn = tlbimva_is_write },
-    { .name = "TLBIMVAALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
-      .writefn = tlbimvaa_is_write },
-    { .name = "TLBIMVAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbimva_write },
-    { .name = "TLBIMVAAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
-      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
-      .writefn = tlbimvaa_write },
-    { .name = "TLBIMVALH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
-      .type = ARM_CP_NO_RAW, .access = PL2_W,
-      .writefn = tlbimva_hyp_write },
-    { .name = "TLBIMVALHIS",
-      .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
-      .type = ARM_CP_NO_RAW, .access = PL2_W,
-      .writefn = tlbimva_hyp_is_write },
-    { .name = "TLBIIPAS2",
-      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
-      .type = ARM_CP_NO_RAW, .access = PL2_W,
-      .writefn = tlbiipas2_hyp_write },
-    { .name = "TLBIIPAS2IS",
-      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
-      .type = ARM_CP_NO_RAW, .access = PL2_W,
-      .writefn = tlbiipas2is_hyp_write },
-    { .name = "TLBIIPAS2L",
-      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
-      .type = ARM_CP_NO_RAW, .access = PL2_W,
-      .writefn = tlbiipas2_hyp_write },
-    { .name = "TLBIIPAS2LIS",
-      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
-      .type = ARM_CP_NO_RAW, .access = PL2_W,
-      .writefn = tlbiipas2is_hyp_write },
     /* 32 bit cache operations */
     { .name = "ICIALLUIS", .cp = 15, .opc1 = 0, .crn = 7, .crm = 1, .opc2 = 0,
       .type = ARM_CP_NOP, .access = PL1_W, .accessfn = access_ticab },
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
         define_arm_cp_regs(cpu, not_v8_cp_reginfo);
     }
 
+    define_tlb_insn_regs(cpu);
+
     if (arm_feature(env, ARM_FEATURE_V6)) {
         /* The ID registers all have impdef reset values */
         ARMCPRegInfo v6_idregs[] = {
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
     if (arm_feature(env, ARM_FEATURE_V6K)) {
         define_arm_cp_regs(cpu, v6k_cp_reginfo);
     }
-    if (arm_feature(env, ARM_FEATURE_V7MP) &&
-        !arm_feature(env, ARM_FEATURE_PMSA)) {
-        define_arm_cp_regs(cpu, v7mp_cp_reginfo);
-    }
     if (arm_feature(env, ARM_FEATURE_V7VE)) {
         define_arm_cp_regs(cpu, pmovsset_cp_reginfo);
     }
diff --git a/target/arm/tcg-stubs.c b/target/arm/tcg-stubs.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg-stubs.c
+++ b/target/arm/tcg-stubs.c
@@ -XXX,XX +XXX,XX @@ void raise_exception_ra(CPUARMState *env, uint32_t excp, uint32_t syndrome,
 void assert_hflags_rebuild_correctly(CPUARMState *env)
 {
 }
+
+/* TLBI insns are only used by TCG, so we don't need to do anything for KVM */
+void define_tlb_insn_regs(ARMCPU *cpu)
+{
+}
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Helpers for TLBI insns
+ *
+ * This code is licensed under the GNU GPL v2 or later.
+ *
+ * SPDX-License-Identifier: GPL-2.0-or-later
+ */
+#include "qemu/osdep.h"
+#include "exec/exec-all.h"
+#include "cpu.h"
+#include "internals.h"
+#include "cpu-features.h"
+#include "cpregs.h"
+
+/* IS variants of TLB operations must affect all cores */
+static void tlbiall_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush_all_cpus_synced(cs);
+}
+
+static void tlbiasid_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush_all_cpus_synced(cs);
+}
+
+static void tlbimva_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
+}
+
+static void tlbimvaa_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
+}
+
+static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                          uint64_t value)
+{
+    /* Invalidate all (TLBIALL) */
+    CPUState *cs = env_cpu(env);
+
+    if (tlb_force_broadcast(env)) {
+        tlb_flush_all_cpus_synced(cs);
+    } else {
+        tlb_flush(cs);
+    }
+}
+
+static void tlbimva_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                          uint64_t value)
+{
+    /* Invalidate single TLB entry by MVA and ASID (TLBIMVA) */
+    CPUState *cs = env_cpu(env);
+
+    value &= TARGET_PAGE_MASK;
+    if (tlb_force_broadcast(env)) {
+        tlb_flush_page_all_cpus_synced(cs, value);
+    } else {
+        tlb_flush_page(cs, value);
+    }
+}
+
+static void tlbiasid_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                           uint64_t value)
+{
+    /* Invalidate by ASID (TLBIASID) */
+    CPUState *cs = env_cpu(env);
+
+    if (tlb_force_broadcast(env)) {
+        tlb_flush_all_cpus_synced(cs);
+    } else {
+        tlb_flush(cs);
+    }
+}
+
+static void tlbimvaa_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                           uint64_t value)
+{
+    /* Invalidate single entry by MVA, all ASIDs (TLBIMVAA) */
+    CPUState *cs = env_cpu(env);
+
+    value &= TARGET_PAGE_MASK;
+    if (tlb_force_broadcast(env)) {
+        tlb_flush_page_all_cpus_synced(cs, value);
+    } else {
+        tlb_flush_page(cs, value);
+    }
+}
+
+static void tlbiipas2_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
+
+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_Stage2);
+}
+
+static void tlbiipas2is_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    uint64_t pageaddr = (value & MAKE_64BIT_MASK(0, 28)) << 12;
+
+    tlb_flush_page_by_mmuidx_all_cpus_synced(cs, pageaddr, ARMMMUIdxBit_Stage2);
+}
+
+static const ARMCPRegInfo tlbi_not_v7_cp_reginfo[] = {
+    /*
+     * MMU TLB control. Note that the wildcarding means we cover not just
+     * the unified TLB ops but also the dside/iside/inner-shareable variants.
+     */
+    { .name = "TLBIALL", .cp = 15, .crn = 8, .crm = CP_ANY,
+      .opc1 = CP_ANY, .opc2 = 0, .access = PL1_W, .writefn = tlbiall_write,
+      .type = ARM_CP_NO_RAW },
+    { .name = "TLBIMVA", .cp = 15, .crn = 8, .crm = CP_ANY,
+      .opc1 = CP_ANY, .opc2 = 1, .access = PL1_W, .writefn = tlbimva_write,
+      .type = ARM_CP_NO_RAW },
+    { .name = "TLBIASID", .cp = 15, .crn = 8, .crm = CP_ANY,
+      .opc1 = CP_ANY, .opc2 = 2, .access = PL1_W, .writefn = tlbiasid_write,
+      .type = ARM_CP_NO_RAW },
+    { .name = "TLBIMVAA", .cp = 15, .crn = 8, .crm = CP_ANY,
+      .opc1 = CP_ANY, .opc2 = 3, .access = PL1_W, .writefn = tlbimvaa_write,
+      .type = ARM_CP_NO_RAW },
+};
+
+static const ARMCPRegInfo tlbi_v7_cp_reginfo[] = {
+    /* 32 bit ITLB invalidates */
+    { .name = "ITLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 0,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbiall_write },
+    { .name = "ITLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbimva_write },
+    { .name = "ITLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 2,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbiasid_write },
+    /* 32 bit DTLB invalidates */
+    { .name = "DTLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 0,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbiall_write },
+    { .name = "DTLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbimva_write },
+    { .name = "DTLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 2,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbiasid_write },
+    /* 32 bit TLB invalidates */
+    { .name = "TLBIALL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 0,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbiall_write },
+    { .name = "TLBIMVA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 1,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbimva_write },
+    { .name = "TLBIASID", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 2,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbiasid_write },
+    { .name = "TLBIMVAA", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 3,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbimvaa_write },
+};
+
+static const ARMCPRegInfo tlbi_v7mp_cp_reginfo[] = {
+    /* 32 bit TLB invalidates, Inner Shareable */
+    { .name = "TLBIALLIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 0,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
+      .writefn = tlbiall_is_write },
+    { .name = "TLBIMVAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 1,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
+      .writefn = tlbimva_is_write },
+    { .name = "TLBIASIDIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 2,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
+      .writefn = tlbiasid_is_write },
+    { .name = "TLBIMVAAIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 3,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
+      .writefn = tlbimvaa_is_write },
+};
+
+static const ARMCPRegInfo tlbi_v8_cp_reginfo[] = {
+    /* AArch32 TLB invalidate last level of translation table walk */
+    { .name = "TLBIMVALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 5,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
+      .writefn = tlbimva_is_write },
+    { .name = "TLBIMVAALIS", .cp = 15, .opc1 = 0, .crn = 8, .crm = 3, .opc2 = 7,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlbis,
+      .writefn = tlbimvaa_is_write },
+    { .name = "TLBIMVAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 5,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbimva_write },
+    { .name = "TLBIMVAAL", .cp = 15, .opc1 = 0, .crn = 8, .crm = 7, .opc2 = 7,
+      .type = ARM_CP_NO_RAW, .access = PL1_W, .accessfn = access_ttlb,
+      .writefn = tlbimvaa_write },
+    { .name = "TLBIMVALH", .cp = 15, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
+      .type = ARM_CP_NO_RAW, .access = PL2_W,
+      .writefn = tlbimva_hyp_write },
+    { .name = "TLBIMVALHIS",
+      .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
+      .type = ARM_CP_NO_RAW, .access = PL2_W,
+      .writefn = tlbimva_hyp_is_write },
+    { .name = "TLBIIPAS2",
+      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 1,
+      .type = ARM_CP_NO_RAW, .access = PL2_W,
+      .writefn = tlbiipas2_hyp_write },
+    { .name = "TLBIIPAS2IS",
+      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 1,
+      .type = ARM_CP_NO_RAW, .access = PL2_W,
+      .writefn = tlbiipas2is_hyp_write },
+    { .name = "TLBIIPAS2L",
+      .cp = 15, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 5,
+      .type = ARM_CP_NO_RAW, .access = PL2_W,
+      .writefn = tlbiipas2_hyp_write },
+    { .name = "TLBIIPAS2LIS",
+      .cp = 15, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 5,
+      .type = ARM_CP_NO_RAW, .access = PL2_W,
+      .writefn = tlbiipas2is_hyp_write },
+};
+
+void define_tlb_insn_regs(ARMCPU *cpu)
+{
+    CPUARMState *env = &cpu->env;
+
+    if (!arm_feature(env, ARM_FEATURE_V7)) {
+        define_arm_cp_regs(cpu, tlbi_not_v7_cp_reginfo);
+    } else {
+        define_arm_cp_regs(cpu, tlbi_v7_cp_reginfo);
+    }
+    if (arm_feature(env, ARM_FEATURE_V7MP) &&
+        !arm_feature(env, ARM_FEATURE_PMSA)) {
+        define_arm_cp_regs(cpu, tlbi_v7mp_cp_reginfo);
+    }
+    if (arm_feature(env, ARM_FEATURE_V8)) {
+        define_arm_cp_regs(cpu, tlbi_v8_cp_reginfo);
+    }
+}
diff --git a/target/arm/tcg/meson.build b/target/arm/tcg/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/meson.build
+++ b/target/arm/tcg/meson.build
@@ -XXX,XX +XXX,XX @@ arm_ss.add(files(
   'op_helper.c',
   'tlb_helper.c',
   'vec_helper.c',
+  'tlb-insns.c',
 ))
 
 arm_ss.add(when: 'TARGET_AARCH64', if_true: files(
-- 
2.34.1

Move the AArch32 TLBI insns for AArch32 EL2 to tlbi_insn_helper.c.
To keep this as an obviously pure code-movement, we retain the
same condition for registering tlbi_el2_cp_reginfo that we use for
el2_cp_reginfo. We'll be able to simplify this condition later,
since the need to define the reginfo for EL3-without-EL2 doesn't
apply for the TLBI ops specifically.

This move brings all the uses of tlbimva_hyp_write() and
tlbimva_hyp_is_write() back into a single file, so we can move those
also, and make them file-local again.

The helper alle1_tlbmask() is an exception to the pattern that we
only need to make these functions global temporarily, because once
this refactoring is complete it will be called by both code in
helper.c (vttbr_write()) and by code in tlb-insns.c.  We therefore
put its prototype in a permanent home in internals.h.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-3-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |  4 --
 target/arm/internals.h     |  6 +++
 target/arm/helper.c        | 74 +--------------------------------
 target/arm/tcg/tlb-insns.c | 85 ++++++++++++++++++++++++++++++++++++++
 4 files changed, 92 insertions(+), 77 deletions(-)

Move the AArch64 TLBI insns that are declared in v8_cp_reginfo[]
into tlb-insns.c.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-4-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |  11 +++
 target/arm/helper.c        | 182 +++----------------------------------
 target/arm/tcg/tlb-insns.c | 160 ++++++++++++++++++++++++++++++++
 3 files changed, 182 insertions(+), 171 deletions(-)

Move the AArch64 EL2 TLBI insn definitions that were
in el2_cp_reginfo[] across to tlb-insns.c.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-5-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |  7 +++++
 target/arm/helper.c        | 61 ++++----------------------------------
 target/arm/tcg/tlb-insns.c | 49 ++++++++++++++++++++++++++++++
 3 files changed, 62 insertions(+), 55 deletions(-)

diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpregs.h
+++ b/target/arm/cpregs.h
@@ -XXX,XX +XXX,XX @@ bool tlb_force_broadcast(CPUARMState *env);
 int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
                        uint64_t addr);
 int vae1_tlbbits(CPUARMState *env, uint64_t addr);
+int vae2_tlbbits(CPUARMState *env, uint64_t addr);
 int vae1_tlbmask(CPUARMState *env);
+int vae2_tlbmask(CPUARMState *env);
 int ipas2e1_tlbmask(CPUARMState *env, int64_t value);
+int e2_tlbmask(CPUARMState *env);
 void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                uint64_t value);
 void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                              uint64_t value);
 void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                             uint64_t value);
+void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value);
+void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                            uint64_t value);
 
 #endif /* TARGET_ARM_CPREGS_H */
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ int vae1_tlbmask(CPUARMState *env)
     return mask;
 }
 
-static int vae2_tlbmask(CPUARMState *env)
+int vae2_tlbmask(CPUARMState *env)
 {
     uint64_t hcr = arm_hcr_el2_eff(env);
     uint16_t mask;
@@ -XXX,XX +XXX,XX @@ int vae1_tlbbits(CPUARMState *env, uint64_t addr)
     return tlbbits_for_regime(env, mmu_idx, addr);
 }
 
-static int vae2_tlbbits(CPUARMState *env, uint64_t addr)
+int vae2_tlbbits(CPUARMState *env, uint64_t addr)
 {
     uint64_t hcr = arm_hcr_el2_eff(env);
     ARMMMUIdx mmu_idx;
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 }
 
-static int e2_tlbmask(CPUARMState *env)
+int e2_tlbmask(CPUARMState *env)
 {
     return (ARMMMUIdxBit_E20_0 |
             ARMMMUIdxBit_E20_2 |
@@ -XXX,XX +XXX,XX @@ static int e2_tlbmask(CPUARMState *env)
             ARMMMUIdxBit_E2);
 }
 
-static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                  uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    int mask = e2_tlbmask(env);
-
-    tlb_flush_by_mmuidx(cs, mask);
-}
-
 static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 }
 
-static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                    uint64_t value)
+void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
 {
     CPUState *cs = env_cpu(env);
     int mask = e2_tlbmask(env);
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
 }
 
-static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                 uint64_t value)
-{
-    /*
-     * Invalidate by VA, EL2
-     * Currently handles both VAE2 and VALE2, since we don't support
-     * flush-last-level-only.
-     */
-    CPUState *cs = env_cpu(env);
-    int mask = vae2_tlbmask(env);
-    uint64_t pageaddr = sextract64(value << 12, 0, 56);
-    int bits = vae2_tlbbits(env, pageaddr);
-
-    tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
-}
-
 static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 }
 
-static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                    uint64_t value)
 {
     CPUState *cs = env_cpu(env);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
     { .name = "HTTBR", .cp = 15, .opc1 = 4, .crm = 2,
       .access = PL2_RW, .type = ARM_CP_64BIT | ARM_CP_ALIAS,
       .fieldoffset = offsetof(CPUARMState, cp15.ttbr0_el[2]) },
-    { .name = "TLBI_ALLE2", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_alle2_write },
-    { .name = "TLBI_VAE2", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_vae2_write },
-    { .name = "TLBI_VALE2", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_vae2_write },
-    { .name = "TLBI_ALLE2IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_alle2is_write },
-    { .name = "TLBI_VAE2IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_vae2is_write },
-    { .name = "TLBI_VALE2IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_vae2is_write },
 #ifndef CONFIG_USER_ONLY
     /*
      * Unlike the other EL2-related AT operations, these must
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx(cs, mask);
 }
 
+static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = e2_tlbmask(env);
+
+    tlb_flush_by_mmuidx(cs, mask);
+}
+
+static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                 uint64_t value)
+{
+    /*
+     * Invalidate by VA, EL2
+     * Currently handles both VAE2 and VALE2, since we don't support
+     * flush-last-level-only.
+     */
+    CPUState *cs = env_cpu(env);
+    int mask = vae2_tlbmask(env);
+    uint64_t pageaddr = sextract64(value << 12, 0, 56);
+    int bits = vae2_tlbbits(env, pageaddr);
+
+    tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
+}
+
 static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
     { .name = "TLBIMVAHIS", .cp = 15, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
       .type = ARM_CP_NO_RAW, .access = PL2_W,
       .writefn = tlbimva_hyp_is_write },
+    { .name = "TLBI_ALLE2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 0,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_alle2_write },
+    { .name = "TLBI_VAE2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 1,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_vae2_write },
+    { .name = "TLBI_VALE2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 7, .opc2 = 5,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_vae2_write },
+    { .name = "TLBI_ALLE2IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 0,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_alle2is_write },
+    { .name = "TLBI_VAE2IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 1,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_vae2is_write },
+    { .name = "TLBI_VALE2IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 3, .opc2 = 5,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_vae2is_write },
 };
 
 void define_tlb_insn_regs(ARMCPU *cpu)
-- 
2.34.1

Move the AArch64 EL3 TLBI insns from el3_cp_reginfo[] across
to tlb-insns.c.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-6-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |  4 +++
 target/arm/helper.c        | 56 +++-----------------------------------
 target/arm/tcg/tlb-insns.c | 54 ++++++++++++++++++++++++++++++++++++
 3 files changed, 62 insertions(+), 52 deletions(-)

diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpregs.h
+++ b/target/arm/cpregs.h
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                              uint64_t value);
 void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                             uint64_t value);
+void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                            uint64_t value);
+void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value);
 
 #endif /* TARGET_ARM_CPREGS_H */
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ int e2_tlbmask(CPUARMState *env)
             ARMMMUIdxBit_E2);
 }
 
-static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                  uint64_t value)
-{
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
-
-    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
-}
-
 void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                              uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
 }
 
-static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                    uint64_t value)
+void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                             uint64_t value)
 {
     CPUState *cs = env_cpu(env);
 
     tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
 }
 
-static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                 uint64_t value)
-{
-    /*
-     * Invalidate by VA, EL3
-     * Currently handles both VAE3 and VALE3, since we don't support
-     * flush-last-level-only.
-     */
-    ARMCPU *cpu = env_archcpu(env);
-    CPUState *cs = CPU(cpu);
-    uint64_t pageaddr = sextract64(value << 12, 0, 56);
-
-    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
-}
-
 void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                             uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
 }
 
-static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                   uint64_t value)
+void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                            uint64_t value)
 {
     CPUState *cs = env_cpu(env);
     uint64_t pageaddr = sextract64(value << 12, 0, 56);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_cp_reginfo[] = {
       .opc0 = 3, .opc1 = 6, .crn = 5, .crm = 1, .opc2 = 1,
       .access = PL3_RW, .type = ARM_CP_CONST,
       .resetvalue = 0 },
-    { .name = "TLBI_ALLE3IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 0,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_alle3is_write },
-    { .name = "TLBI_VAE3IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 1,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae3is_write },
-    { .name = "TLBI_VALE3IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 5,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae3is_write },
-    { .name = "TLBI_ALLE3", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 0,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_alle3_write },
-    { .name = "TLBI_VAE3", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 1,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae3_write },
-    { .name = "TLBI_VALE3", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 5,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae3_write },
 };
 
 #ifndef CONFIG_USER_ONLY
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle2_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx(cs, mask);
 }
 
+static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    ARMCPU *cpu = env_archcpu(env);
+    CPUState *cs = CPU(cpu);
+
+    tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
+}
+
 static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_page_bits_by_mmuidx(cs, pageaddr, mask, bits);
 }
 
+static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                 uint64_t value)
+{
+    /*
+     * Invalidate by VA, EL3
+     * Currently handles both VAE3 and VALE3, since we don't support
+     * flush-last-level-only.
+     */
+    ARMCPU *cpu = env_archcpu(env);
+    CPUState *cs = CPU(cpu);
+    uint64_t pageaddr = sextract64(value << 12, 0, 56);
+
+    tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
+}
+
 static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el2_cp_reginfo[] = {
       .writefn = tlbi_aa64_vae2is_write },
 };
 
+static const ARMCPRegInfo tlbi_el3_cp_reginfo[] = {
+    { .name = "TLBI_ALLE3IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 0,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_alle3is_write },
+    { .name = "TLBI_VAE3IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 1,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae3is_write },
+    { .name = "TLBI_VALE3IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 3, .opc2 = 5,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae3is_write },
+    { .name = "TLBI_ALLE3", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 0,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_alle3_write },
+    { .name = "TLBI_VAE3", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 1,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae3_write },
+    { .name = "TLBI_VALE3", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 5,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae3_write },
+};
+
 void define_tlb_insn_regs(ARMCPU *cpu)
 {
     CPUARMState *env = &cpu->env;
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
             && arm_feature(env, ARM_FEATURE_V8))) {
         define_arm_cp_regs(cpu, tlbi_el2_cp_reginfo);
     }
+    if (arm_feature(env, ARM_FEATURE_EL3)) {
+        define_arm_cp_regs(cpu, tlbi_el3_cp_reginfo);
+    }
 }
-- 
2.34.1

Move the TLBI invalidate-range insns across to tlb-insns.c.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-7-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |   2 +
 target/arm/helper.c        | 330 +------------------------------------
 target/arm/tcg/tlb-insns.c | 329 ++++++++++++++++++++++++++++++++++++
 3 files changed, 333 insertions(+), 328 deletions(-)

diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpregs.h
+++ b/target/arm/cpregs.h
@@ -XXX,XX +XXX,XX @@ CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
                            bool isread);
 CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
                              bool isread);
+CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
+                             bool isread);
 bool tlb_force_broadcast(CPUARMState *env);
 int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
                        uint64_t addr);
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
 
 #ifdef TARGET_AARCH64
 /* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBOS. */
-static CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
-                                    bool isread)
+CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
+                             bool isread)
 {
     if (arm_current_el(env) == 1 &&
         (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBOS))) {
@@ -XXX,XX +XXX,XX @@ int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
             : ARMMMUIdxBit_Stage2);
 }
 
-#ifdef TARGET_AARCH64
-typedef struct {
-    uint64_t base;
-    uint64_t length;
-} TLBIRange;
-
-static ARMGranuleSize tlbi_range_tg_to_gran_size(int tg)
-{
-    /*
-     * Note that the TLBI range TG field encoding differs from both
-     * TG0 and TG1 encodings.
-     */
-    switch (tg) {
-    case 1:
-        return Gran4K;
-    case 2:
-        return Gran16K;
-    case 3:
-        return Gran64K;
-    default:
-        return GranInvalid;
-    }
-}
-
-static TLBIRange tlbi_aa64_get_range(CPUARMState *env, ARMMMUIdx mmuidx,
-                                     uint64_t value)
-{
-    unsigned int page_size_granule, page_shift, num, scale, exponent;
-    /* Extract one bit to represent the va selector in use. */
-    uint64_t select = sextract64(value, 36, 1);
-    ARMVAParameters param = aa64_va_parameters(env, select, mmuidx, true, false);
-    TLBIRange ret = { };
-    ARMGranuleSize gran;
-
-    page_size_granule = extract64(value, 46, 2);
-    gran = tlbi_range_tg_to_gran_size(page_size_granule);
-
-    /* The granule encoded in value must match the granule in use. */
-    if (gran != param.gran) {
-        qemu_log_mask(LOG_GUEST_ERROR, "Invalid tlbi page size granule %d\n",
-                      page_size_granule);
-        return ret;
-    }
-
-    page_shift = arm_granule_bits(gran);
-    num = extract64(value, 39, 5);
-    scale = extract64(value, 44, 2);
-    exponent = (5 * scale) + 1;
-
-    ret.length = (num + 1) << (exponent + page_shift);
-
-    if (param.select) {
-        ret.base = sextract64(value, 0, 37);
-    } else {
-        ret.base = extract64(value, 0, 37);
-    }
-    if (param.ds) {
-        /*
-         * With DS=1, BaseADDR is always shifted 16 so that it is able
-         * to address all 52 va bits.  The input address is perforce
-         * aligned on a 64k boundary regardless of translation granule.
-         */
-        page_shift = 16;
-    }
-    ret.base <<= page_shift;
-
-    return ret;
-}
-
-static void do_rvae_write(CPUARMState *env, uint64_t value,
-                          int idxmap, bool synced)
-{
-    ARMMMUIdx one_idx = ARM_MMU_IDX_A | ctz32(idxmap);
-    TLBIRange range;
-    int bits;
-
-    range = tlbi_aa64_get_range(env, one_idx, value);
-    bits = tlbbits_for_regime(env, one_idx, range.base);
-
-    if (synced) {
-        tlb_flush_range_by_mmuidx_all_cpus_synced(env_cpu(env),
-                                                  range.base,
-                                                  range.length,
-                                                  idxmap,
-                                                  bits);
-    } else {
-        tlb_flush_range_by_mmuidx(env_cpu(env), range.base,
-                                  range.length, idxmap, bits);
-    }
-}
-
-static void tlbi_aa64_rvae1_write(CPUARMState *env,
-                                  const ARMCPRegInfo *ri,
-                                  uint64_t value)
-{
-    /*
-     * Invalidate by VA range, EL1&0.
-     * Currently handles all of RVAE1, RVAAE1, RVAALE1 and RVALE1,
-     * since we don't support flush-for-specific-ASID-only or
-     * flush-last-level-only.
-     */
-
-    do_rvae_write(env, value, vae1_tlbmask(env),
-                  tlb_force_broadcast(env));
-}
-
-static void tlbi_aa64_rvae1is_write(CPUARMState *env,
-                                    const ARMCPRegInfo *ri,
-                                    uint64_t value)
-{
-    /*
-     * Invalidate by VA range, Inner/Outer Shareable EL1&0.
-     * Currently handles all of RVAE1IS, RVAE1OS, RVAAE1IS, RVAAE1OS,
-     * RVAALE1IS, RVAALE1OS, RVALE1IS and RVALE1OS, since we don't support
-     * flush-for-specific-ASID-only, flush-last-level-only or inner/outer
-     * shareable specific flushes.
-     */
-
-    do_rvae_write(env, value, vae1_tlbmask(env), true);
-}
-
-static void tlbi_aa64_rvae2_write(CPUARMState *env,
-                                  const ARMCPRegInfo *ri,
-                                  uint64_t value)
-{
-    /*
-     * Invalidate by VA range, EL2.
-     * Currently handles all of RVAE2 and RVALE2,
-     * since we don't support flush-for-specific-ASID-only or
-     * flush-last-level-only.
-     */
-
-    do_rvae_write(env, value, vae2_tlbmask(env),
-                  tlb_force_broadcast(env));
-
-
-}
-
-static void tlbi_aa64_rvae2is_write(CPUARMState *env,
-                                    const ARMCPRegInfo *ri,
-                                    uint64_t value)
-{
-    /*
-     * Invalidate by VA range, Inner/Outer Shareable, EL2.
-     * Currently handles all of RVAE2IS, RVAE2OS, RVALE2IS and RVALE2OS,
-     * since we don't support flush-for-specific-ASID-only,
-     * flush-last-level-only or inner/outer shareable specific flushes.
-     */
-
-    do_rvae_write(env, value, vae2_tlbmask(env), true);
-
-}
-
-static void tlbi_aa64_rvae3_write(CPUARMState *env,
-                                  const ARMCPRegInfo *ri,
-                                  uint64_t value)
-{
-    /*
-     * Invalidate by VA range, EL3.
-     * Currently handles all of RVAE3 and RVALE3,
-     * since we don't support flush-for-specific-ASID-only or
-     * flush-last-level-only.
-     */
-
-    do_rvae_write(env, value, ARMMMUIdxBit_E3, tlb_force_broadcast(env));
-}
-
-static void tlbi_aa64_rvae3is_write(CPUARMState *env,
-                                    const ARMCPRegInfo *ri,
-                                    uint64_t value)
-{
-    /*
-     * Invalidate by VA range, EL3, Inner/Outer Shareable.
-     * Currently handles all of RVAE3IS, RVAE3OS, RVALE3IS and RVALE3OS,
-     * since we don't support flush-for-specific-ASID-only,
-     * flush-last-level-only or inner/outer specific flushes.
-     */
-
-    do_rvae_write(env, value, ARMMMUIdxBit_E3, true);
-}
-
-static void tlbi_aa64_ripas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                     uint64_t value)
-{
-    do_rvae_write(env, value, ipas2e1_tlbmask(env, value),
-                  tlb_force_broadcast(env));
-}
-
-static void tlbi_aa64_ripas2e1is_write(CPUARMState *env,
-                                       const ARMCPRegInfo *ri,
-                                       uint64_t value)
-{
-    do_rvae_write(env, value, ipas2e1_tlbmask(env, value), true);
-}
-#endif
-
 static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                       bool isread)
 {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo pauth_reginfo[] = {
       .fieldoffset = offsetof(CPUARMState, keys.apib.hi) },
 };
 
-static const ARMCPRegInfo tlbirange_reginfo[] = {
-    { .name = "TLBI_RVAE1IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 1,
-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAE1IS,
-      .writefn = tlbi_aa64_rvae1is_write },
-    { .name = "TLBI_RVAAE1IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 3,
-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAAE1IS,
-      .writefn = tlbi_aa64_rvae1is_write },
-   { .name = "TLBI_RVALE1IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 5,
-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVALE1IS,
-      .writefn = tlbi_aa64_rvae1is_write },
-    { .name = "TLBI_RVAALE1IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 7,
-      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAALE1IS,
-      .writefn = tlbi_aa64_rvae1is_write },
-    { .name = "TLBI_RVAE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAE1OS,
-      .writefn = tlbi_aa64_rvae1is_write },
-    { .name = "TLBI_RVAAE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 3,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAAE1OS,
-      .writefn = tlbi_aa64_rvae1is_write },
-   { .name = "TLBI_RVALE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 5,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVALE1OS,
-      .writefn = tlbi_aa64_rvae1is_write },
-    { .name = "TLBI_RVAALE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 7,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAALE1OS,
-      .writefn = tlbi_aa64_rvae1is_write },
-    { .name = "TLBI_RVAE1", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAE1,
-      .writefn = tlbi_aa64_rvae1_write },
-    { .name = "TLBI_RVAAE1", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 3,
-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAAE1,
-      .writefn = tlbi_aa64_rvae1_write },
-   { .name = "TLBI_RVALE1", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 5,
-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVALE1,
-      .writefn = tlbi_aa64_rvae1_write },
-    { .name = "TLBI_RVAALE1", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 7,
-      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIRVAALE1,
-      .writefn = tlbi_aa64_rvae1_write },
-    { .name = "TLBI_RIPAS2E1IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 2,
-      .access = PL2_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_ripas2e1is_write },
-    { .name = "TLBI_RIPAS2LE1IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 6,
-      .access = PL2_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_ripas2e1is_write },
-    { .name = "TLBI_RVAE2IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 1,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_rvae2is_write },
-   { .name = "TLBI_RVALE2IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 5,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_rvae2is_write },
-    { .name = "TLBI_RIPAS2E1", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 2,
-      .access = PL2_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_ripas2e1_write },
-    { .name = "TLBI_RIPAS2LE1", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 6,
-      .access = PL2_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_ripas2e1_write },
-   { .name = "TLBI_RVAE2OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 1,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_rvae2is_write },
-   { .name = "TLBI_RVALE2OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 5,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_rvae2is_write },
-    { .name = "TLBI_RVAE2", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 1,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_rvae2_write },
-   { .name = "TLBI_RVALE2", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 5,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_rvae2_write },
-   { .name = "TLBI_RVAE3IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 1,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_rvae3is_write },
-   { .name = "TLBI_RVALE3IS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 5,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_rvae3is_write },
-   { .name = "TLBI_RVAE3OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 1,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_rvae3is_write },
-   { .name = "TLBI_RVALE3OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 5,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_rvae3is_write },
-   { .name = "TLBI_RVAE3", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 1,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_rvae3_write },
-   { .name = "TLBI_RVALE3", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 5,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_rvae3_write },
-};
-
 static const ARMCPRegInfo tlbios_reginfo[] = {
     { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
       .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
     if (cpu_isar_feature(aa64_rndr, cpu)) {
         define_arm_cp_regs(cpu, rndr_reginfo);
     }
-    if (cpu_isar_feature(aa64_tlbirange, cpu)) {
-        define_arm_cp_regs(cpu, tlbirange_reginfo);
-    }
     if (cpu_isar_feature(aa64_tlbios, cpu)) {
         define_arm_cp_regs(cpu, tlbios_reginfo);
     }
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@
  * SPDX-License-Identifier: GPL-2.0-or-later
  */
 #include "qemu/osdep.h"
+#include "qemu/log.h"
 #include "exec/exec-all.h"
 #include "cpu.h"
 #include "internals.h"
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbi_el3_cp_reginfo[] = {
       .writefn = tlbi_aa64_vae3_write },
 };
 
+#ifdef TARGET_AARCH64
+typedef struct {
+    uint64_t base;
+    uint64_t length;
+} TLBIRange;
+
+static ARMGranuleSize tlbi_range_tg_to_gran_size(int tg)
+{
+    /*
+     * Note that the TLBI range TG field encoding differs from both
+     * TG0 and TG1 encodings.
+     */
+    switch (tg) {
+    case 1:
+        return Gran4K;
+    case 2:
+        return Gran16K;
+    case 3:
+        return Gran64K;
+    default:
+        return GranInvalid;
+    }
+}
+
+static TLBIRange tlbi_aa64_get_range(CPUARMState *env, ARMMMUIdx mmuidx,
+                                     uint64_t value)
+{
+    unsigned int page_size_granule, page_shift, num, scale, exponent;
+    /* Extract one bit to represent the va selector in use. */
+    uint64_t select = sextract64(value, 36, 1);
+    ARMVAParameters param = aa64_va_parameters(env, select, mmuidx, true, false);
+    TLBIRange ret = { };
+    ARMGranuleSize gran;
+
+    page_size_granule = extract64(value, 46, 2);
+    gran = tlbi_range_tg_to_gran_size(page_size_granule);
+
+    /* The granule encoded in value must match the granule in use. */
+    if (gran != param.gran) {
+        qemu_log_mask(LOG_GUEST_ERROR, "Invalid tlbi page size granule %d\n",
+                      page_size_granule);
+        return ret;
+    }
+
+    page_shift = arm_granule_bits(gran);
+    num = extract64(value, 39, 5);
+    scale = extract64(value, 44, 2);
+    exponent = (5 * scale) + 1;
+
+    ret.length = (num + 1) << (exponent + page_shift);
+
+    if (param.select) {
+        ret.base = sextract64(value, 0, 37);
+    } else {
+        ret.base = extract64(value, 0, 37);
+    }
+    if (param.ds) {
+        /*
+         * With DS=1, BaseADDR is always shifted 16 so that it is able
+         * to address all 52 va bits.  The input address is perforce
+         * aligned on a 64k boundary regardless of translation granule.
+         */
+        page_shift = 16;
+    }
+    ret.base <<= page_shift;
+
+    return ret;
+}
+
+static void do_rvae_write(CPUARMState *env, uint64_t value,
+                          int idxmap, bool synced)
+{
+    ARMMMUIdx one_idx = ARM_MMU_IDX_A | ctz32(idxmap);
+    TLBIRange range;
+    int bits;
+
+    range = tlbi_aa64_get_range(env, one_idx, value);
+    bits = tlbbits_for_regime(env, one_idx, range.base);
+
+    if (synced) {
+        tlb_flush_range_by_mmuidx_all_cpus_synced(env_cpu(env),
+                                                  range.base,
+                                                  range.length,
+                                                  idxmap,
+                                                  bits);
+    } else {
+        tlb_flush_range_by_mmuidx(env_cpu(env), range.base,
+                                  range.length, idxmap, bits);
+    }
+}
+
+static void tlbi_aa64_rvae1_write(CPUARMState *env,
+                                  const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    /*
+     * Invalidate by VA range, EL1&0.
+     * Currently handles all of RVAE1, RVAAE1, RVAALE1 and RVALE1,
+     * since we don't support flush-for-specific-ASID-only or
+     * flush-last-level-only.
+     */
+
+    do_rvae_write(env, value, vae1_tlbmask(env),
+                  tlb_force_broadcast(env));
+}
+
+static void tlbi_aa64_rvae1is_write(CPUARMState *env,
+                                    const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    /*
+     * Invalidate by VA range, Inner/Outer Shareable EL1&0.
+     * Currently handles all of RVAE1IS, RVAE1OS, RVAAE1IS, RVAAE1OS,
+     * RVAALE1IS, RVAALE1OS, RVALE1IS and RVALE1OS, since we don't support
+     * flush-for-specific-ASID-only, flush-last-level-only or inner/outer
+     * shareable specific flushes.
+     */
+
+    do_rvae_write(env, value, vae1_tlbmask(env), true);
+}
+
+static void tlbi_aa64_rvae2_write(CPUARMState *env,
+                                  const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    /*
+     * Invalidate by VA range, EL2.
+     * Currently handles all of RVAE2 and RVALE2,
+     * since we don't support flush-for-specific-ASID-only or
+     * flush-last-level-only.
+     */
+
+    do_rvae_write(env, value, vae2_tlbmask(env),
+                  tlb_force_broadcast(env));
+
+
+}
+
+static void tlbi_aa64_rvae2is_write(CPUARMState *env,
+                                    const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    /*
+     * Invalidate by VA range, Inner/Outer Shareable, EL2.
+     * Currently handles all of RVAE2IS, RVAE2OS, RVALE2IS and RVALE2OS,
+     * since we don't support flush-for-specific-ASID-only,
+     * flush-last-level-only or inner/outer shareable specific flushes.
+     */
+
+    do_rvae_write(env, value, vae2_tlbmask(env), true);
+
+}
+
+static void tlbi_aa64_rvae3_write(CPUARMState *env,
+                                  const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    /*
+     * Invalidate by VA range, EL3.
+     * Currently handles all of RVAE3 and RVALE3,
+     * since we don't support flush-for-specific-ASID-only or
+     * flush-last-level-only.
+     */
+
+    do_rvae_write(env, value, ARMMMUIdxBit_E3, tlb_force_broadcast(env));
+}
+
+static void tlbi_aa64_rvae3is_write(CPUARMState *env,
+                                    const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    /*
+     * Invalidate by VA range, EL3, Inner/Outer Shareable.
+     * Currently handles all of RVAE3IS, RVAE3OS, RVALE3IS and RVALE3OS,
+     * since we don't support flush-for-specific-ASID-only,
+     * flush-last-level-only or inner/outer specific flushes.
+     */
+
+    do_rvae_write(env, value, ARMMMUIdxBit_E3, true);
+}
+
+static void tlbi_aa64_ripas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                     uint64_t value)
+{
+    do_rvae_write(env, value, ipas2e1_tlbmask(env, value),
+                  tlb_force_broadcast(env));
+}
+
+static void tlbi_aa64_ripas2e1is_write(CPUARMState *env,
+                                       const ARMCPRegInfo *ri,
+                                       uint64_t value)
+{
+    do_rvae_write(env, value, ipas2e1_tlbmask(env, value), true);
+}
+
+static const ARMCPRegInfo tlbirange_reginfo[] = {
+    { .name = "TLBI_RVAE1IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 1,
+      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAE1IS,
+      .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVAAE1IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 3,
+      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAAE1IS,
+      .writefn = tlbi_aa64_rvae1is_write },
+   { .name = "TLBI_RVALE1IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 5,
+      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVALE1IS,
+      .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVAALE1IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 2, .opc2 = 7,
+      .access = PL1_W, .accessfn = access_ttlbis, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAALE1IS,
+      .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVAE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 1,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAE1OS,
+      .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVAAE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 3,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAAE1OS,
+      .writefn = tlbi_aa64_rvae1is_write },
+   { .name = "TLBI_RVALE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 5,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVALE1OS,
+      .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVAALE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 5, .opc2 = 7,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAALE1OS,
+      .writefn = tlbi_aa64_rvae1is_write },
+    { .name = "TLBI_RVAE1", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 1,
+      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAE1,
+      .writefn = tlbi_aa64_rvae1_write },
+    { .name = "TLBI_RVAAE1", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 3,
+      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAAE1,
+      .writefn = tlbi_aa64_rvae1_write },
+   { .name = "TLBI_RVALE1", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 5,
+      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVALE1,
+      .writefn = tlbi_aa64_rvae1_write },
+    { .name = "TLBI_RVAALE1", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 6, .opc2 = 7,
+      .access = PL1_W, .accessfn = access_ttlb, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIRVAALE1,
+      .writefn = tlbi_aa64_rvae1_write },
+    { .name = "TLBI_RIPAS2E1IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 2,
+      .access = PL2_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_ripas2e1is_write },
+    { .name = "TLBI_RIPAS2LE1IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 0, .opc2 = 6,
+      .access = PL2_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_ripas2e1is_write },
+    { .name = "TLBI_RVAE2IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 1,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_rvae2is_write },
+   { .name = "TLBI_RVALE2IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 2, .opc2 = 5,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_rvae2is_write },
+    { .name = "TLBI_RIPAS2E1", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 2,
+      .access = PL2_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_ripas2e1_write },
+    { .name = "TLBI_RIPAS2LE1", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 6,
+      .access = PL2_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_ripas2e1_write },
+   { .name = "TLBI_RVAE2OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 1,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_rvae2is_write },
+   { .name = "TLBI_RVALE2OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 5, .opc2 = 5,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_rvae2is_write },
+    { .name = "TLBI_RVAE2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 1,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_rvae2_write },
+   { .name = "TLBI_RVALE2", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 6, .opc2 = 5,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_rvae2_write },
+   { .name = "TLBI_RVAE3IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 1,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_rvae3is_write },
+   { .name = "TLBI_RVALE3IS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 2, .opc2 = 5,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_rvae3is_write },
+   { .name = "TLBI_RVAE3OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 1,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_rvae3is_write },
+   { .name = "TLBI_RVALE3OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 5, .opc2 = 5,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_rvae3is_write },
+   { .name = "TLBI_RVAE3", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 1,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_rvae3_write },
+   { .name = "TLBI_RVALE3", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 6, .opc2 = 5,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_rvae3_write },
+};
+#endif
+
 void define_tlb_insn_regs(ARMCPU *cpu)
 {
     CPUARMState *env = &cpu->env;
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
     if (arm_feature(env, ARM_FEATURE_EL3)) {
         define_arm_cp_regs(cpu, tlbi_el3_cp_reginfo);
     }
+#ifdef TARGET_AARCH64
+    if (cpu_isar_feature(aa64_tlbirange, cpu)) {
+        define_arm_cp_regs(cpu, tlbirange_reginfo);
+    }
+#endif
 }
-- 
2.34.1

Move the TLBI OS insns across to tlb-insns.c.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-8-peter.maydell@linaro.org
---
 target/arm/helper.c        | 80 --------------------------------------
 target/arm/tcg/tlb-insns.c | 80 ++++++++++++++++++++++++++++++++++++++
 2 files changed, 80 insertions(+), 80 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo pauth_reginfo[] = {
       .fieldoffset = offsetof(CPUARMState, keys.apib.hi) },
 };
 
-static const ARMCPRegInfo tlbios_reginfo[] = {
-    { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIVMALLE1OS,
-      .writefn = tlbi_aa64_vmalle1is_write },
-    { .name = "TLBI_VAE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 1,
-      .fgt = FGT_TLBIVAE1OS,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae1is_write },
-    { .name = "TLBI_ASIDE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 2,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIASIDE1OS,
-      .writefn = tlbi_aa64_vmalle1is_write },
-    { .name = "TLBI_VAAE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 3,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIVAAE1OS,
-      .writefn = tlbi_aa64_vae1is_write },
-    { .name = "TLBI_VALE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 5,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIVALE1OS,
-      .writefn = tlbi_aa64_vae1is_write },
-    { .name = "TLBI_VAALE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 7,
-      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
-      .fgt = FGT_TLBIVAALE1OS,
-      .writefn = tlbi_aa64_vae1is_write },
-    { .name = "TLBI_ALLE2OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 0,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_alle2is_write },
-    { .name = "TLBI_VAE2OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 1,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_vae2is_write },
-   { .name = "TLBI_ALLE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 4,
-      .access = PL2_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_alle1is_write },
-    { .name = "TLBI_VALE2OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 5,
-      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
-      .writefn = tlbi_aa64_vae2is_write },
-    { .name = "TLBI_VMALLS12E1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 6,
-      .access = PL2_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_alle1is_write },
-    { .name = "TLBI_IPAS2E1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 0,
-      .access = PL2_W, .type = ARM_CP_NOP },
-    { .name = "TLBI_RIPAS2E1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 3,
-      .access = PL2_W, .type = ARM_CP_NOP },
-    { .name = "TLBI_IPAS2LE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 4,
-      .access = PL2_W, .type = ARM_CP_NOP },
-    { .name = "TLBI_RIPAS2LE1OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 7,
-      .access = PL2_W, .type = ARM_CP_NOP },
-    { .name = "TLBI_ALLE3OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 0,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_alle3is_write },
-    { .name = "TLBI_VAE3OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 1,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae3is_write },
-    { .name = "TLBI_VALE3OS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 5,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_vae3is_write },
-};
-
 static uint64_t rndr_readfn(CPUARMState *env, const ARMCPRegInfo *ri)
 {
     Error *err = NULL;
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
     if (cpu_isar_feature(aa64_rndr, cpu)) {
         define_arm_cp_regs(cpu, rndr_reginfo);
     }
-    if (cpu_isar_feature(aa64_tlbios, cpu)) {
-        define_arm_cp_regs(cpu, tlbios_reginfo);
-    }
     /* Data Cache clean instructions up to PoP */
     if (cpu_isar_feature(aa64_dcpop, cpu)) {
         define_one_arm_cp_reg(cpu, dcpop_reg);
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbirange_reginfo[] = {
       .access = PL3_W, .type = ARM_CP_NO_RAW,
       .writefn = tlbi_aa64_rvae3_write },
 };
+
+static const ARMCPRegInfo tlbios_reginfo[] = {
+    { .name = "TLBI_VMALLE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 0,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIVMALLE1OS,
+      .writefn = tlbi_aa64_vmalle1is_write },
+    { .name = "TLBI_VAE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 1,
+      .fgt = FGT_TLBIVAE1OS,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae1is_write },
+    { .name = "TLBI_ASIDE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 2,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIASIDE1OS,
+      .writefn = tlbi_aa64_vmalle1is_write },
+    { .name = "TLBI_VAAE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 3,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIVAAE1OS,
+      .writefn = tlbi_aa64_vae1is_write },
+    { .name = "TLBI_VALE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 5,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIVALE1OS,
+      .writefn = tlbi_aa64_vae1is_write },
+    { .name = "TLBI_VAALE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 0, .crn = 8, .crm = 1, .opc2 = 7,
+      .access = PL1_W, .accessfn = access_ttlbos, .type = ARM_CP_NO_RAW,
+      .fgt = FGT_TLBIVAALE1OS,
+      .writefn = tlbi_aa64_vae1is_write },
+    { .name = "TLBI_ALLE2OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 0,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_alle2is_write },
+    { .name = "TLBI_VAE2OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 1,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_vae2is_write },
+   { .name = "TLBI_ALLE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 4,
+      .access = PL2_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_alle1is_write },
+    { .name = "TLBI_VALE2OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 5,
+      .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
+      .writefn = tlbi_aa64_vae2is_write },
+    { .name = "TLBI_VMALLS12E1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 1, .opc2 = 6,
+      .access = PL2_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_alle1is_write },
+    { .name = "TLBI_IPAS2E1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 0,
+      .access = PL2_W, .type = ARM_CP_NOP },
+    { .name = "TLBI_RIPAS2E1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 3,
+      .access = PL2_W, .type = ARM_CP_NOP },
+    { .name = "TLBI_IPAS2LE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 4,
+      .access = PL2_W, .type = ARM_CP_NOP },
+    { .name = "TLBI_RIPAS2LE1OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 4, .crn = 8, .crm = 4, .opc2 = 7,
+      .access = PL2_W, .type = ARM_CP_NOP },
+    { .name = "TLBI_ALLE3OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 0,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_alle3is_write },
+    { .name = "TLBI_VAE3OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 1,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae3is_write },
+    { .name = "TLBI_VALE3OS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 5,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_vae3is_write },
+};
 #endif
 
 void define_tlb_insn_regs(ARMCPU *cpu)
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
     if (cpu_isar_feature(aa64_tlbirange, cpu)) {
         define_arm_cp_regs(cpu, tlbirange_reginfo);
     }
+    if (cpu_isar_feature(aa64_tlbios, cpu)) {
+        define_arm_cp_regs(cpu, tlbios_reginfo);
+    }
 #endif
 }
-- 
2.34.1

The remaining functions that we temporarily made global are now
used only from callsits in tlb-insns.c; move them across and
make them file-local again.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-9-peter.maydell@linaro.org
---
 target/arm/cpregs.h        |  34 ------
 target/arm/helper.c        | 220 -------------------------------------
 target/arm/tcg/tlb-insns.c | 220 +++++++++++++++++++++++++++++++++++++
 3 files changed, 220 insertions(+), 254 deletions(-)

diff --git a/target/arm/cpregs.h b/target/arm/cpregs.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpregs.h
+++ b/target/arm/cpregs.h
@@ -XXX,XX +XXX,XX @@ static inline bool arm_cpreg_traps_in_nv(const ARMCPRegInfo *ri)
     return ri->opc1 == 4 || ri->opc1 == 5;
 }
 
-/*
- * Temporary declarations of functions until the move to tlb_insn_helper.c
- * is complete and we can make the functions static again
- */
-CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-                           bool isread);
-CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
-                             bool isread);
-CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
-                             bool isread);
-bool tlb_force_broadcast(CPUARMState *env);
-int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
-                       uint64_t addr);
-int vae1_tlbbits(CPUARMState *env, uint64_t addr);
-int vae2_tlbbits(CPUARMState *env, uint64_t addr);
-int vae1_tlbmask(CPUARMState *env);
-int vae2_tlbmask(CPUARMState *env);
-int ipas2e1_tlbmask(CPUARMState *env, int64_t value);
-int e2_tlbmask(CPUARMState *env);
-void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                               uint64_t value);
-void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value);
-void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                            uint64_t value);
-void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value);
-void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                            uint64_t value);
-void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                            uint64_t value);
-void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value);
-
 #endif /* TARGET_ARM_CPREGS_H */
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tacr(CPUARMState *env, const ARMCPRegInfo *ri,
     return CP_ACCESS_OK;
 }
 
-/* Check for traps from EL1 due to HCR_EL2.TTLB. */
-CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
-                           bool isread)
-{
-    if (arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_TTLB)) {
-        return CP_ACCESS_TRAP_EL2;
-    }
-    return CP_ACCESS_OK;
-}
-
-/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBIS. */
-CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
-                             bool isread)
-{
-    if (arm_current_el(env) == 1 &&
-        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBIS))) {
-        return CP_ACCESS_TRAP_EL2;
-    }
-    return CP_ACCESS_OK;
-}
-
-#ifdef TARGET_AARCH64
-/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBOS. */
-CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
-                             bool isread)
-{
-    if (arm_current_el(env) == 1 &&
-        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBOS))) {
-        return CP_ACCESS_TRAP_EL2;
-    }
-    return CP_ACCESS_OK;
-}
-#endif
-
 static void dacr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
 {
     ARMCPU *cpu = env_archcpu(env);
@@ -XXX,XX +XXX,XX @@ int alle1_tlbmask(CPUARMState *env)
             ARMMMUIdxBit_Stage2_S);
 }
 
-/*
- * Non-IS variants of TLB operations are upgraded to
- * IS versions if we are at EL1 and HCR_EL2.FB is effectively set to
- * force broadcast of these operations.
- */
-bool tlb_force_broadcast(CPUARMState *env)
-{
-    return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
-}
-
 static const ARMCPRegInfo cp_reginfo[] = {
     /*
      * Define the secure and non-secure FCSE identifier CP registers
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tocu(CPUARMState *env, const ARMCPRegInfo *ri,
     return do_cacheop_pou_access(env, HCR_TOCU | HCR_TPU);
 }
 
-/*
- * See: D4.7.2 TLB maintenance requirements and the TLB maintenance instructions
- * Page D4-1736 (DDI0487A.b)
- */
-
-int vae1_tlbmask(CPUARMState *env)
-{
-    uint64_t hcr = arm_hcr_el2_eff(env);
-    uint16_t mask;
-
-    assert(arm_feature(env, ARM_FEATURE_AARCH64));
-
-    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
-        mask = ARMMMUIdxBit_E20_2 |
-               ARMMMUIdxBit_E20_2_PAN |
-               ARMMMUIdxBit_E20_0;
-    } else {
-        /* This is AArch64 only, so we don't need to touch the EL30_x TLBs */
-        mask = ARMMMUIdxBit_E10_1 |
-               ARMMMUIdxBit_E10_1_PAN |
-               ARMMMUIdxBit_E10_0;
-    }
-    return mask;
-}
-
-int vae2_tlbmask(CPUARMState *env)
-{
-    uint64_t hcr = arm_hcr_el2_eff(env);
-    uint16_t mask;
-
-    if (hcr & HCR_E2H) {
-        mask = ARMMMUIdxBit_E20_2 |
-               ARMMMUIdxBit_E20_2_PAN |
-               ARMMMUIdxBit_E20_0;
-    } else {
-        mask = ARMMMUIdxBit_E2;
-    }
-    return mask;
-}
-
-/* Return 56 if TBI is enabled, 64 otherwise. */
-int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
-                       uint64_t addr)
-{
-    uint64_t tcr = regime_tcr(env, mmu_idx);
-    int tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
-    int select = extract64(addr, 55, 1);
-
-    return (tbi >> select) & 1 ? 56 : 64;
-}
-
-int vae1_tlbbits(CPUARMState *env, uint64_t addr)
-{
-    uint64_t hcr = arm_hcr_el2_eff(env);
-    ARMMMUIdx mmu_idx;
-
-    assert(arm_feature(env, ARM_FEATURE_AARCH64));
-
-    /* Only the regime of the mmu_idx below is significant. */
-    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
-        mmu_idx = ARMMMUIdx_E20_0;
-    } else {
-        mmu_idx = ARMMMUIdx_E10_0;
-    }
-
-    return tlbbits_for_regime(env, mmu_idx, addr);
-}
-
-int vae2_tlbbits(CPUARMState *env, uint64_t addr)
-{
-    uint64_t hcr = arm_hcr_el2_eff(env);
-    ARMMMUIdx mmu_idx;
-
-    /*
-     * Only the regime of the mmu_idx below is significant.
-     * Regime EL2&0 has two ranges with separate TBI configuration, while EL2
-     * only has one.
-     */
-    if (hcr & HCR_E2H) {
-        mmu_idx = ARMMMUIdx_E20_2;
-    } else {
-        mmu_idx = ARMMMUIdx_E2;
-    }
-
-    return tlbbits_for_regime(env, mmu_idx, addr);
-}
-
-void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                               uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    int mask = vae1_tlbmask(env);
-
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
-}
-
-int e2_tlbmask(CPUARMState *env)
-{
-    return (ARMMMUIdxBit_E20_0 |
-            ARMMMUIdxBit_E20_2 |
-            ARMMMUIdxBit_E20_2_PAN |
-            ARMMMUIdxBit_E2);
-}
-
-void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    int mask = alle1_tlbmask(env);
-
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
-}
-
-void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    int mask = e2_tlbmask(env);
-
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
-}
-
-void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                             uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
-}
-
-void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                            uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    int mask = vae1_tlbmask(env);
-    uint64_t pageaddr = sextract64(value << 12, 0, 56);
-    int bits = vae1_tlbbits(env, pageaddr);
-
-    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
-}
-
-void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                   uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    int mask = vae2_tlbmask(env);
-    uint64_t pageaddr = sextract64(value << 12, 0, 56);
-    int bits = vae2_tlbbits(env, pageaddr);
-
-    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
-}
-
-void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                            uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-    uint64_t pageaddr = sextract64(value << 12, 0, 56);
-    int bits = tlbbits_for_regime(env, ARMMMUIdx_E3, pageaddr);
-
-    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr,
-                                                  ARMMMUIdxBit_E3, bits);
-}
-
-int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
-{
-    /*
-     * The MSB of value is the NS field, which only applies if SEL2
-     * is implemented and SCR_EL3.NS is not set (i.e. in secure mode).
-     */
-    return (value >= 0
-            && cpu_isar_feature(aa64_sel2, env_archcpu(env))
-            && arm_is_secure_below_el3(env)
-            ? ARMMMUIdxBit_Stage2_S
-            : ARMMMUIdxBit_Stage2);
-}
-
 static CPAccessResult aa64_zva_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                       bool isread)
 {
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@
 #include "cpu-features.h"
 #include "cpregs.h"
 
+/* Check for traps from EL1 due to HCR_EL2.TTLB. */
+static CPAccessResult access_ttlb(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  bool isread)
+{
+    if (arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_TTLB)) {
+        return CP_ACCESS_TRAP_EL2;
+    }
+    return CP_ACCESS_OK;
+}
+
+/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBIS. */
+static CPAccessResult access_ttlbis(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    bool isread)
+{
+    if (arm_current_el(env) == 1 &&
+        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBIS))) {
+        return CP_ACCESS_TRAP_EL2;
+    }
+    return CP_ACCESS_OK;
+}
+
+#ifdef TARGET_AARCH64
+/* Check for traps from EL1 due to HCR_EL2.TTLB or TTLBOS. */
+static CPAccessResult access_ttlbos(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    bool isread)
+{
+    if (arm_current_el(env) == 1 &&
+        (arm_hcr_el2_eff(env) & (HCR_TTLB | HCR_TTLBOS))) {
+        return CP_ACCESS_TRAP_EL2;
+    }
+    return CP_ACCESS_OK;
+}
+#endif
+
 /* IS variants of TLB operations must affect all cores */
 static void tlbiall_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
                              uint64_t value)
@@ -XXX,XX +XXX,XX @@ static void tlbimvaa_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_page_all_cpus_synced(cs, value & TARGET_PAGE_MASK);
 }
 
+/*
+ * Non-IS variants of TLB operations are upgraded to
+ * IS versions if we are at EL1 and HCR_EL2.FB is effectively set to
+ * force broadcast of these operations.
+ */
+static bool tlb_force_broadcast(CPUARMState *env)
+{
+    return arm_current_el(env) == 1 && (arm_hcr_el2_eff(env) & HCR_FB);
+}
+
 static void tlbiall_write(CPUARMState *env, const ARMCPRegInfo *ri,
                           uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbiall_hyp_is_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E2);
 }
 
+/*
+ * See: D4.7.2 TLB maintenance requirements and the TLB maintenance instructions
+ * Page D4-1736 (DDI0487A.b)
+ */
+
+static int vae1_tlbmask(CPUARMState *env)
+{
+    uint64_t hcr = arm_hcr_el2_eff(env);
+    uint16_t mask;
+
+    assert(arm_feature(env, ARM_FEATURE_AARCH64));
+
+    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+        mask = ARMMMUIdxBit_E20_2 |
+               ARMMMUIdxBit_E20_2_PAN |
+               ARMMMUIdxBit_E20_0;
+    } else {
+        /* This is AArch64 only, so we don't need to touch the EL30_x TLBs */
+        mask = ARMMMUIdxBit_E10_1 |
+               ARMMMUIdxBit_E10_1_PAN |
+               ARMMMUIdxBit_E10_0;
+    }
+    return mask;
+}
+
+static int vae2_tlbmask(CPUARMState *env)
+{
+    uint64_t hcr = arm_hcr_el2_eff(env);
+    uint16_t mask;
+
+    if (hcr & HCR_E2H) {
+        mask = ARMMMUIdxBit_E20_2 |
+               ARMMMUIdxBit_E20_2_PAN |
+               ARMMMUIdxBit_E20_0;
+    } else {
+        mask = ARMMMUIdxBit_E2;
+    }
+    return mask;
+}
+
+/* Return 56 if TBI is enabled, 64 otherwise. */
+static int tlbbits_for_regime(CPUARMState *env, ARMMMUIdx mmu_idx,
+                       uint64_t addr)
+{
+    uint64_t tcr = regime_tcr(env, mmu_idx);
+    int tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
+    int select = extract64(addr, 55, 1);
+
+    return (tbi >> select) & 1 ? 56 : 64;
+}
+
+static int vae1_tlbbits(CPUARMState *env, uint64_t addr)
+{
+    uint64_t hcr = arm_hcr_el2_eff(env);
+    ARMMMUIdx mmu_idx;
+
+    assert(arm_feature(env, ARM_FEATURE_AARCH64));
+
+    /* Only the regime of the mmu_idx below is significant. */
+    if ((hcr & (HCR_E2H | HCR_TGE)) == (HCR_E2H | HCR_TGE)) {
+        mmu_idx = ARMMMUIdx_E20_0;
+    } else {
+        mmu_idx = ARMMMUIdx_E10_0;
+    }
+
+    return tlbbits_for_regime(env, mmu_idx, addr);
+}
+
+static int vae2_tlbbits(CPUARMState *env, uint64_t addr)
+{
+    uint64_t hcr = arm_hcr_el2_eff(env);
+    ARMMMUIdx mmu_idx;
+
+    /*
+     * Only the regime of the mmu_idx below is significant.
+     * Regime EL2&0 has two ranges with separate TBI configuration, while EL2
+     * only has one.
+     */
+    if (hcr & HCR_E2H) {
+        mmu_idx = ARMMMUIdx_E20_2;
+    } else {
+        mmu_idx = ARMMMUIdx_E2;
+    }
+
+    return tlbbits_for_regime(env, mmu_idx, addr);
+}
+
+static void tlbi_aa64_vmalle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                      uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = vae1_tlbmask(env);
+
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+}
+
 static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vmalle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
     }
 }
 
+static int e2_tlbmask(CPUARMState *env)
+{
+    return (ARMMMUIdxBit_E20_0 |
+            ARMMMUIdxBit_E20_2 |
+            ARMMMUIdxBit_E20_2_PAN |
+            ARMMMUIdxBit_E2);
+}
+
 static void tlbi_aa64_alle1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_by_mmuidx(cs, ARMMMUIdxBit_E3);
 }
 
+static void tlbi_aa64_alle1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = alle1_tlbmask(env);
+
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+}
+
+static void tlbi_aa64_alle2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = e2_tlbmask(env);
+
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, mask);
+}
+
+static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush_by_mmuidx_all_cpus_synced(cs, ARMMMUIdxBit_E3);
+}
+
 static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
     tlb_flush_page_by_mmuidx(cs, pageaddr, ARMMMUIdxBit_E3);
 }
 
+static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                   uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = vae1_tlbmask(env);
+    uint64_t pageaddr = sextract64(value << 12, 0, 56);
+    int bits = vae1_tlbbits(env, pageaddr);
+
+    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
+}
+
 static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                  uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
     }
 }
 
+static void tlbi_aa64_vae2is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                   uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    int mask = vae2_tlbmask(env);
+    uint64_t pageaddr = sextract64(value << 12, 0, 56);
+    int bits = vae2_tlbbits(env, pageaddr);
+
+    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr, mask, bits);
+}
+
+static void tlbi_aa64_vae3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                   uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+    uint64_t pageaddr = sextract64(value << 12, 0, 56);
+    int bits = tlbbits_for_regime(env, ARMMMUIdx_E3, pageaddr);
+
+    tlb_flush_page_bits_by_mmuidx_all_cpus_synced(cs, pageaddr,
+                                                  ARMMMUIdxBit_E3, bits);
+}
+
+static int ipas2e1_tlbmask(CPUARMState *env, int64_t value)
+{
+    /*
+     * The MSB of value is the NS field, which only applies if SEL2
+     * is implemented and SCR_EL3.NS is not set (i.e. in secure mode).
+     */
+    return (value >= 0
+            && cpu_isar_feature(aa64_sel2, env_archcpu(env))
+            && arm_is_secure_below_el3(env)
+            ? ARMMMUIdxBit_Stage2_S
+            : ARMMMUIdxBit_Stage2);
+}
+
 static void tlbi_aa64_ipas2e1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                     uint64_t value)
 {
-- 
2.34.1

Move the FEAT_RME specific TLB insns across to tlb-insns.c.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-10-peter.maydell@linaro.org
---
 target/arm/helper.c        | 38 --------------------------------
 target/arm/tcg/tlb-insns.c | 45 ++++++++++++++++++++++++++++++++++++++
 2 files changed, 45 insertions(+), 38 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo sme_reginfo[] = {
       .type = ARM_CP_CONST, .resetvalue = 0 },
 };
 
-static void tlbi_aa64_paall_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                  uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush(cs);
-}
-
 static void gpccr_write(CPUARMState *env, const ARMCPRegInfo *ri,
                         uint64_t value)
 {
@@ -XXX,XX +XXX,XX @@ static void gpccr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
                                      env_archcpu(env)->reset_l0gptsz);
 }
 
-static void tlbi_aa64_paallos_write(CPUARMState *env, const ARMCPRegInfo *ri,
-                                    uint64_t value)
-{
-    CPUState *cs = env_cpu(env);
-
-    tlb_flush_all_cpus_synced(cs);
-}
-
 static const ARMCPRegInfo rme_reginfo[] = {
     { .name = "GPCCR_EL3", .state = ARM_CP_STATE_AA64,
       .opc0 = 3, .opc1 = 6, .crn = 2, .crm = 1, .opc2 = 6,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo rme_reginfo[] = {
     { .name = "MFAR_EL3", .state = ARM_CP_STATE_AA64,
       .opc0 = 3, .opc1 = 6, .crn = 6, .crm = 0, .opc2 = 5,
       .access = PL3_RW, .fieldoffset = offsetof(CPUARMState, cp15.mfar_el3) },
-    { .name = "TLBI_PAALL", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 4,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_paall_write },
-    { .name = "TLBI_PAALLOS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 4,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_paallos_write },
-    /*
-     * QEMU does not have a way to invalidate by physical address, thus
-     * invalidating a range of physical addresses is accomplished by
-     * flushing all tlb entries in the outer shareable domain,
-     * just like PAALLOS.
-     */
-    { .name = "TLBI_RPALOS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 7,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_paallos_write },
-    { .name = "TLBI_RPAOS", .state = ARM_CP_STATE_AA64,
-      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 3,
-      .access = PL3_W, .type = ARM_CP_NO_RAW,
-      .writefn = tlbi_aa64_paallos_write },
     { .name = "DC_CIPAPA", .state = ARM_CP_STATE_AA64,
       .opc0 = 1, .opc1 = 6, .crn = 7, .crm = 14, .opc2 = 1,
       .access = PL3_W, .type = ARM_CP_NOP },
diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo tlbios_reginfo[] = {
       .access = PL3_W, .type = ARM_CP_NO_RAW,
       .writefn = tlbi_aa64_vae3is_write },
 };
+
+static void tlbi_aa64_paall_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                  uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush(cs);
+}
+
+static void tlbi_aa64_paallos_write(CPUARMState *env, const ARMCPRegInfo *ri,
+                                    uint64_t value)
+{
+    CPUState *cs = env_cpu(env);
+
+    tlb_flush_all_cpus_synced(cs);
+}
+
+static const ARMCPRegInfo tlbi_rme_reginfo[] = {
+    { .name = "TLBI_PAALL", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 7, .opc2 = 4,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_paall_write },
+    { .name = "TLBI_PAALLOS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 1, .opc2 = 4,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_paallos_write },
+    /*
+     * QEMU does not have a way to invalidate by physical address, thus
+     * invalidating a range of physical addresses is accomplished by
+     * flushing all tlb entries in the outer shareable domain,
+     * just like PAALLOS.
+     */
+    { .name = "TLBI_RPALOS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 7,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_paallos_write },
+    { .name = "TLBI_RPAOS", .state = ARM_CP_STATE_AA64,
+      .opc0 = 1, .opc1 = 6, .crn = 8, .crm = 4, .opc2 = 3,
+      .access = PL3_W, .type = ARM_CP_NO_RAW,
+      .writefn = tlbi_aa64_paallos_write },
+};
+
 #endif
 
 void define_tlb_insn_regs(ARMCPU *cpu)
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
     if (cpu_isar_feature(aa64_tlbios, cpu)) {
         define_arm_cp_regs(cpu, tlbios_reginfo);
     }
+    if (cpu_isar_feature(aa64_rme, cpu)) {
+        define_arm_cp_regs(cpu, tlbi_rme_reginfo);
+    }
 #endif
 }
-- 
2.34.1

We currently register the tlbi_el2_cp_reginfo[] TLBI insns if EL2 is
implemented, or if EL3 and v8 is implemented.  This is a copy of the
logic used for el2_cp_reginfo[], but for the specific case of the
TLBI insns we can simplify it.  This is because we do not need the
"if EL2 does not exist but EL3 does then EL2 registers should exist
and be RAZ/WI" handling here: all our cpregs are for instructions,
which UNDEF when EL3 exists and EL2 does not.

Simplify the condition down to just "if EL2 exists".
This is not a behaviour change because:
 * for AArch64 insns we marked them with ARM_CP_EL3_NO_EL2_UNDEF,
   which meant that define_arm_cp_regs() would ignore them if
   EL2 wasn't present
 * for AArch32 insns, the .access = PL2_W meant that if EL2
   was not present the only way to get at them was from AArch32
   EL3; but we have no CPUs which have ARM_FEATURE_V8 but
   start in AArch32

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20241210160452.2427965-11-peter.maydell@linaro.org
---
 target/arm/tcg/tlb-insns.c | 4 +---
 1 file changed, 1 insertion(+), 3 deletions(-)

diff --git a/target/arm/tcg/tlb-insns.c b/target/arm/tcg/tlb-insns.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/tlb-insns.c
+++ b/target/arm/tcg/tlb-insns.c
@@ -XXX,XX +XXX,XX @@ void define_tlb_insn_regs(ARMCPU *cpu)
      * ops (i.e. matching the condition for el2_cp_reginfo[] in
      * helper.c), but we will be able to simplify this later.
      */
-    if (arm_feature(env, ARM_FEATURE_EL2)
-        || (arm_feature(env, ARM_FEATURE_EL3)
-            && arm_feature(env, ARM_FEATURE_V8))) {
+    if (arm_feature(env, ARM_FEATURE_EL2)) {
         define_arm_cp_regs(cpu, tlbi_el2_cp_reginfo);
     }
     if (arm_feature(env, ARM_FEATURE_EL3)) {
-- 
2.34.1