Series comparison

-[PULL 00/45] target-arm queue
+[PULL 00/34] target-arm queue
-Mostly this is patches from me and RTH cleaning up and doing
+Some arm patches; my to-review queue is by no means empty, but
-more decodetree conversion for AArch32 Neon. The major new feature
+this is a big enough set of patches to be getting on with...
 is Dongjiu Geng's patchset to report host memory errors to KVM guests;
 also a new aspeed board from Patrick Williams.
-thanks
 -- PMM
-The following changes since commit 035b448b84f3557206abc44d786c5d3db2638f7d:
+The following changes since commit cb9c6a8e5ad6a1f0ce164d352e3102df46986e22:
-  Merge remote-tracking branch 'remotes/gkurz/tags/9p-next-2020-05-14' into staging (2020-05-14 10:58:30 +0100)
+  .gitlab-ci.d/windows: Work-around timeout and OpenGL problems of the MSYS2 jobs (2023-01-04 18:58:33 +0000)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200514
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20230105
-for you to fetch changes up to e95485f85657be21135c17a9226e297c21e73360:
+for you to fetch changes up to 93c9678de9dc7d2e68f9e8477da072bac30ef132:
-  target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree (2020-05-14 15:03:09 +0100)
+  hw/net: Fix read of uninitialized memory in imx_fec. (2023-01-05 15:33:00 +0000)
 ----------------------------------------------------------------
 target-arm queue:
- * target/arm: Use correct GDB XML for M-profile cores
+ * Implement AArch32 ARMv8-R support
- * target/arm: Code cleanup to use gvec APIs better
+ * Add Cortex-R52 CPU
- * aspeed: Add support for the sonorapass-bmc board
+ * fix handling of HLT semihosting in system mode
- * target/arm: Support reporting KVM host memory errors
+ * hw/timer/ixm_epit: cleanup and fix bug in compare handling
-   to the guest via ACPI notifications
+ * target/arm: Coding style fixes
- * target/arm: Finish conversion of Neon 3-reg-same insns to decodetree
+ * target/arm: Clean up includes
  * nseries: minor code cleanups
  * target/arm: align exposed ID registers with Linux
  * hw/arm/smmu-common: remove unnecessary inlines
  * i.MX7D: Handle GPT timers
  * i.MX7D: Connect IRQs to GPIO devices
  * i.MX6UL: Add a specific GPT timer instance
  * hw/net: Fix read of uninitialized memory in imx_fec
 ----------------------------------------------------------------
-Dongjiu Geng (10):
+Alex Bennée (1):
-      acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
+      target/arm: fix handling of HLT semihosting in system mode
       hw/arm/virt: Introduce a RAS machine option
       docs: APEI GHES generation and CPER record description
       ACPI: Build related register address fields via hardware error fw_cfg blob
       ACPI: Build Hardware Error Source Table
       ACPI: Record the Generic Error Status Block address
       KVM: Move hwpoison page related functions into kvm-all.c
       ACPI: Record Generic Error Status Block(GESB) table
       target-arm: kvm64: handle SIGBUS signal from kernel or KVM
       MAINTAINERS: Add ACPI/HEST/GHES entries
-Patrick Williams (1):
+Axel Heider (8):
-      aspeed: Add support for the sonorapass-bmc board
+      hw/timer/imx_epit: improve comments
       hw/timer/imx_epit: cleanup CR defines
       hw/timer/imx_epit: define SR_OCIF
       hw/timer/imx_epit: update interrupt state on CR write access
       hw/timer/imx_epit: hard reset initializes CR with 0
       hw/timer/imx_epit: factor out register write handlers
       hw/timer/imx_epit: remove explicit fields cnt and freq
       hw/timer/imx_epit: fix compare timer handling
-Peter Maydell (18):
+Claudio Fontana (1):
-      target/arm: Use correct GDB XML for M-profile cores
+      target/arm: cleanup cpu includes
       target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
       target/arm: Convert Neon 3-reg-same SHA to decodetree
       target/arm: Convert Neon 64-bit element 3-reg-same insns
       target/arm: Convert Neon VHADD 3-reg-same insns
       target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
       target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
       target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
       target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
       target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
       target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
       target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
       target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
       target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
       target/arm: Convert Neon 3-reg-same compare insns to decodetree
       target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
       target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
       target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree
-Richard Henderson (16):
+Fabiano Rosas (5):
-      target/arm: Create gen_gvec_[us]sra
+      target/arm: Fix checkpatch comment style warnings in helper.c
-      target/arm: Create gen_gvec_{u,s}{rshr,rsra}
+      target/arm: Fix checkpatch space errors in helper.c
-      target/arm: Create gen_gvec_{sri,sli}
+      target/arm: Fix checkpatch brace errors in helper.c
-      target/arm: Remove unnecessary range check for VSHL
+      target/arm: Remove unused includes from m_helper.c
-      target/arm: Tidy handle_vec_simd_shri
+      target/arm: Remove unused includes from helper.c
       target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
       target/arm: Create gen_gvec_{mla,mls}
       target/arm: Swap argument order for VSHL during decode
       target/arm: Create gen_gvec_{cmtst,ushl,sshl}
       target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
       target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
       target/arm: Create gen_gvec_{qrdmla,qrdmls}
       target/arm: Pass pointer to qc to qrdmla/qrdmls
       target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
       target/arm: Vectorize SABD/UABD
       target/arm: Vectorize SABA/UABA
- docs/specs/acpi_hest_ghes.rst          |  110 ++
+Jean-Christophe Dubois (4):
- docs/specs/index.rst                   |    1 +
+      i.MX7D: Connect GPT timers to IRQ
- configure                              |    4 +-
+      i.MX7D: Compute clock frequency for the fixed frequency clocks.
- default-configs/arm-softmmu.mak        |    1 +
+      i.MX6UL: Add a specific GPT timer instance for the i.MX6UL
- include/hw/acpi/aml-build.h            |    1 +
+      i.MX7D: Connect IRQs to GPIO devices.
  include/hw/acpi/generic_event_device.h |    2 +
  include/hw/acpi/ghes.h                 |   74 +
  include/hw/arm/virt.h                  |    1 +
  include/qemu/uuid.h                    |   27 +
  include/sysemu/kvm.h                   |    3 +-
  include/sysemu/kvm_int.h               |   12 +
  target/arm/cpu.h                       |    4 +
  target/arm/helper.h                    |   78 +-
  target/arm/internals.h                 |    5 +-
  target/arm/translate.h                 |   84 +-
  target/i386/cpu.h                      |    2 +
  target/arm/neon-dp.decode              |  119 +-
  accel/kvm/kvm-all.c                    |   36 +
  hw/acpi/aml-build.c                    |    2 +
  hw/acpi/generic_event_device.c         |   19 +
  hw/acpi/ghes.c                         |  448 ++++++
  hw/acpi/nvdimm.c                       |   10 +-
  hw/arm/aspeed.c                        |   78 ++
  hw/arm/virt-acpi-build.c               |   15 +
  hw/arm/virt.c                          |   23 +
  target/arm/cpu_tcg.c                   |    1 +
  target/arm/gdbstub.c                   |   22 +-
  target/arm/helper.c                    |    2 +-
  target/arm/kvm64.c                     |   77 ++
  target/arm/neon_helper.c               |   17 -
  target/arm/tlb_helper.c                |    2 +-
  target/arm/translate-a64.c             |  210 +--
  target/arm/translate-neon.inc.c        |  682 +++++++++-
  target/arm/translate.c                 | 2349 +++++++++++++++++---------------
  target/arm/vec_helper.c                |  240 +++-
  target/arm/vfp_helper.c                |    9 +-
  target/i386/kvm.c                      |   36 -
  MAINTAINERS                            |    9 +
  gdb-xml/arm-m-profile.xml              |   27 +
  hw/acpi/Kconfig                        |    4 +
  hw/acpi/Makefile.objs                  |    1 +
 files changed, 3402 insertions(+), 1445 deletions(-)
  create mode 100644 docs/specs/acpi_hest_ghes.rst
  create mode 100644 include/hw/acpi/ghes.h
  create mode 100644 hw/acpi/ghes.c
  create mode 100644 gdb-xml/arm-m-profile.xml
+Peter Maydell (1):
+      target/arm:Set lg_page_size to 0 if either S1 or S2 asks for it
+Philippe Mathieu-Daudé (5):
+      hw/input/tsc2xxx: Constify set_transform()'s MouseTransformInfo arg
+      hw/arm/nseries: Constify various read-only arrays
+      hw/arm/nseries: Silent -Wmissing-field-initializers warning
+      hw/arm/smmu-common: Reduce smmu_inv_notifiers_mr() scope
+      hw/arm/smmu-common: Avoid using inlined functions with external linkage
+Stephen Longfield (1):
+      hw/net: Fix read of uninitialized memory in imx_fec.
+Tobias Röhmel (7):
+      target/arm: Don't add all MIDR aliases for cores that implement PMSA
+      target/arm: Make RVBAR available for all ARMv8 CPUs
+      target/arm: Make stage_2_format for cache attributes optional
+      target/arm: Enable TTBCR_EAE for ARMv8-R AArch32
+      target/arm: Add PMSAv8r registers
+      target/arm: Add PMSAv8r functionality
+      target/arm: Add ARM Cortex-R52 CPU
+Zhuojia Shen (1):
+      target/arm: align exposed ID registers with Linux
+ include/hw/arm/fsl-imx7.h         |  20 +
+ include/hw/arm/smmu-common.h      |   3 -
+ include/hw/input/tsc2xxx.h        |   4 +-
+ include/hw/timer/imx_epit.h       |   8 +-
+ include/hw/timer/imx_gpt.h        |   1 +
+ target/arm/cpu.h                  |   6 +
+ target/arm/internals.h            |   4 +
+ hw/arm/fsl-imx6ul.c               |   2 +-
+ hw/arm/fsl-imx7.c                 |  41 +-
+ hw/arm/nseries.c                  |  28 +-
+ hw/arm/smmu-common.c              |  15 +-
+ hw/input/tsc2005.c                |   2 +-
+ hw/input/tsc210x.c                |   3 +-
+ hw/misc/imx6ul_ccm.c              |   6 -
+ hw/misc/imx7_ccm.c                |  49 ++-
+ hw/net/imx_fec.c                  |   8 +-
+ hw/timer/imx_epit.c               | 376 +++++++++-------
+ hw/timer/imx_gpt.c                |  25 ++
+ target/arm/cpu.c                  |  35 +-
+ target/arm/cpu64.c                |   6 -
+ target/arm/cpu_tcg.c              |  42 ++
+ target/arm/debug_helper.c         |   3 +
+ target/arm/helper.c               | 871 +++++++++++++++++++++++++++++---------
+ target/arm/m_helper.c             |  16 -
+ target/arm/machine.c              |  28 ++
+ target/arm/ptw.c                  | 152 +++++--
+ target/arm/tlb_helper.c           |   4 +
+ target/arm/translate.c            |   2 +-
+ tests/tcg/aarch64/sysregs.c       |  24 +-
+ tests/tcg/aarch64/Makefile.target |   7 +-
+files changed, 1330 insertions(+), 461 deletions(-)

-[PULL 42/45] target/arm: Convert Neon 3-reg-same compare insns to decodetree
+[PULL 01/34] target/arm:Set lg_page_size to 0 if either S1 or S2 asks for it
-Convert the Neon integer 3-reg-same compare insns VCGE, VCGT,
+In get_phys_addr_twostage() we set the lg_page_size of the result to
-VCEQ, VACGE and VACGT to decodetree.
+the maximum of the stage 1 and stage 2 page sizes.  This works for
 the case where we do want to create a TLB entry, because we know the
 common TLB code only creates entries of the TARGET_PAGE_SIZE and
 asking for a size larger than that only means that invalidations
 invalidate the whole larger area.  However, if lg_page_size is
 smaller than TARGET_PAGE_SIZE this effectively means "don't create a
 TLB entry"; in this case if either S1 or S2 said "this covers less
 than a page and can't go in a TLB" then the final result also should
 be marked that way.  Set the resulting page size to 0 if either
 stage asked for a less-than-a-page entry, and expand the comment
 to explain what's going on.
 This has no effect for VMSA because currently the VMSA lookup always
 returns results that cover at least TARGET_PAGE_SIZE; however when we
 add v8R support it will reuse this code path, and for v8R the S1 and
 S2 results can be smaller than TARGET_PAGE_SIZE.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-15-peter.maydell@linaro.org
+Message-id: 20221212142708.610090-1-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  5 +++++
+ target/arm/ptw.c | 16 +++++++++++++---
- target/arm/translate-neon.inc.c |  6 +++++
+file changed, 13 insertions(+), 3 deletions(-)
  target/arm/translate.c          | 39 ++-------------------------------
 files changed, 13 insertions(+), 37 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/ptw.c b/target/arm/ptw.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/ptw.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/ptw.c
-@@ -XXX,XX +XXX,XX @@ VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_twostage(CPUARMState *env, S1Translate *ptw,
  VMLA_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
  VMLS_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 1 .... @3same_fp
  VMUL_fp_3s       1111 001 1 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
 +VCEQ_fp_3s       1111 001 0 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
 +VCGE_fp_3s       1111 001 1 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
 +VACGE_fp_3s      1111 001 1 0 . 0 . .... .... 1110 ... 1 .... @3same_fp
 +VCGT_fp_3s       1111 001 1 0 . 1 . .... .... 1110 ... 0 .... @3same_fp
 +VACGT_fp_3s      1111 001 1 0 . 1 . .... .... 1110 ... 1 .... @3same_fp
  VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
  VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
          return do_3same_fp(s, a, FUNC, READS_VD);                   \
      }
-+DO_3S_FP(VCEQ, gen_helper_neon_ceq_f32, false)
+     /*
-+DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
+-     * Use the maximum of the S1 & S2 page size, so that invalidation
-+DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
+-     * of pages > TARGET_PAGE_SIZE works correctly.
-+DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
++     * If either S1 or S2 returned a result smaller than TARGET_PAGE_SIZE,
-+DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
++     * this means "don't put this in the TLB"; in this case, return a
-+
++     * result with lg_page_size == 0 to achieve that. Otherwise,
- static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
++     * use the maximum of the S1 & S2 page size, so that invalidation
-                             TCGv_ptr fpstatus)
++     * of pages > TARGET_PAGE_SIZE works correctly. (This works even though
- {
++     * we know the combined result permissions etc only cover the minimum
-diff --git a/target/arm/translate.c b/target/arm/translate.c
++     * of the S1 and S2 page size, because we know that the common TLB code
-index XXXXXXX..XXXXXXX 100644
++     * never actually creates TLB entries bigger than TARGET_PAGE_SIZE,
---- a/target/arm/translate.c
++     * and passing a larger page size value only affects invalidations.)
-+++ b/target/arm/translate.c
+      */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+-    if (result->f.lg_page_size < s1_lgpgsz) {
-         case NEON_3R_VQDMULH_VQRDMULH:
++    if (result->f.lg_page_size < TARGET_PAGE_BITS ||
-         case NEON_3R_FLOAT_ARITH:
++        s1_lgpgsz < TARGET_PAGE_BITS) {
-         case NEON_3R_FLOAT_MULTIPLY:
++        result->f.lg_page_size = 0;
-+        case NEON_3R_FLOAT_CMP:
++    } else if (result->f.lg_page_size < s1_lgpgsz) {
-+        case NEON_3R_FLOAT_ACMP:
+         result->f.lg_page_size = s1_lgpgsz;
-             /* Already handled by decodetree */
+     }
-             return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  return 1; /* VPMIN/VPMAX handled by decodetree */
              }
              break;
 -        case NEON_3R_FLOAT_CMP:
 -            if (!u && size) {
 -                /* no encoding for U=0 C=1x */
 -                return 1;
 -            }
 -            break;
 -        case NEON_3R_FLOAT_ACMP:
 -            if (!u) {
 -                return 1;
 -            }
 -            break;
          case NEON_3R_FLOAT_MISC:
              /* VMAXNM/VMINNM in ARMv8 */
              if (u && !arm_dc_feature(s, ARM_FEATURE_V8)) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_CMP:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (!u) {
 -                gen_helper_neon_ceq_f32(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                if (size == 0) {
 -                    gen_helper_neon_cge_f32(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_neon_cgt_f32(tmp, tmp, tmp2, fpstatus);
 -                }
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        case NEON_3R_FLOAT_ACMP:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (size == 0) {
 -                gen_helper_neon_acge_f32(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                gen_helper_neon_acgt_f32(tmp, tmp, tmp2, fpstatus);
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
          case NEON_3R_FLOAT_MINMAX:
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
-.20.1
+.25.1

-[PULL 33/45] target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
+[PULL 02/34] target/arm: Don't add all MIDR aliases for cores that implement PMSA
-Convert the Neon VABA and VABD insns in the 3-reg-same group to
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 decodetree.
+Cores with PMSA have the MPUIR register which has the
+same encoding as the MIDR alias with opc2=4. So we only
+add that alias if we are not realizing a core that
+implements PMSA.
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20221206102504.165775-2-tobias.roehmel@rwth-aachen.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-6-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  6 ++++++
+ target/arm/helper.c | 13 +++++++++----
- target/arm/translate-neon.inc.c |  4 ++++
+file changed, 9 insertions(+), 4 deletions(-)
  target/arm/translate.c          | 22 ++--------------------
 files changed, 12 insertions(+), 20 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/helper.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
- VMIN_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 1 .... @3same
+               .access = PL1_R, .type = ARM_CP_NO_RAW, .resetvalue = cpu->midr,
- VMIN_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 1 .... @3same
+               .fieldoffset = offsetof(CPUARMState, cp15.c0_cpuid),
+               .readfn = midr_read },
-+VABD_S_3s        1111 001 0 0 . .. .... .... 0111 . . . 0 .... @3same
+-            /* crn = 0 op1 = 0 crm = 0 op2 = 4,7 : AArch32 aliases of MIDR */
-+VABD_U_3s        1111 001 1 0 . .. .... .... 0111 . . . 0 .... @3same
+-            { .name = "MIDR", .type = ARM_CP_ALIAS | ARM_CP_CONST,
-+
+-              .cp = 15, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 4,
-+VABA_S_3s        1111 001 0 0 . .. .... .... 0111 . . . 1 .... @3same
+-              .access = PL1_R, .resetvalue = cpu->midr },
-+VABA_U_3s        1111 001 1 0 . .. .... .... 0111 . . . 1 .... @3same
++            /* crn = 0 op1 = 0 crm = 0 op2 = 7 : AArch32 aliases of MIDR */
-+
+             { .name = "MIDR", .type = ARM_CP_ALIAS | ARM_CP_CONST,
- VADD_3s          1111 001 0 0 . .. .... .... 1000 . . . 0 .... @3same
+               .cp = 15, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 7,
- VSUB_3s          1111 001 1 0 . .. .... .... 1000 . . . 0 .... @3same
+               .access = PL1_R, .resetvalue = cpu->midr },
+@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+               .accessfn = access_aa64_tid1,
-index XXXXXXX..XXXXXXX 100644
+               .type = ARM_CP_CONST, .resetvalue = cpu->revidr },
---- a/target/arm/translate-neon.inc.c
+         };
-+++ b/target/arm/translate-neon.inc.c
++        ARMCPRegInfo id_v8_midr_alias_cp_reginfo = {
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
++            .name = "MIDR", .type = ARM_CP_ALIAS | ARM_CP_CONST,
- DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
++            .cp = 15, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 4,
- DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
++            .access = PL1_R, .resetvalue = cpu->midr
- DO_3SAME_NO_SZ_3(VTST, gen_gvec_cmtst)
++        };
-+DO_3SAME_NO_SZ_3(VABD_S, gen_gvec_sabd)
+         ARMCPRegInfo id_cp_reginfo[] = {
-+DO_3SAME_NO_SZ_3(VABA_S, gen_gvec_saba)
+             /* These are common to v8 and pre-v8 */
-+DO_3SAME_NO_SZ_3(VABD_U, gen_gvec_uabd)
+             { .name = "CTR",
-+DO_3SAME_NO_SZ_3(VABA_U, gen_gvec_uaba)
+@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
+         }
- #define DO_3SAME_CMP(INSN, COND)                                        \
+         if (arm_feature(env, ARM_FEATURE_V8)) {
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
+             define_arm_cp_regs(cpu, id_v8_midr_cp_reginfo);
-diff --git a/target/arm/translate.c b/target/arm/translate.c
++            if (!arm_feature(env, ARM_FEATURE_PMSA)) {
-index XXXXXXX..XXXXXXX 100644
++                define_one_arm_cp_reg(cpu, &id_v8_midr_alias_cp_reginfo);
---- a/target/arm/translate.c
++            }
-+++ b/target/arm/translate.c
+         } else {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+             define_arm_cp_regs(cpu, id_pre_v8_midr_cp_reginfo);
              /* VQRDMLSH : handled by decodetree */
              return 1;
 -        case NEON_3R_VABD:
 -            if (u) {
 -                gen_gvec_uabd(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            } else {
 -                gen_gvec_sabd(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            }
 -            return 0;
 -
 -        case NEON_3R_VABA:
 -            if (u) {
 -                gen_gvec_uaba(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            } else {
 -                gen_gvec_saba(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            }
 -            return 0;
 -
          case NEON_3R_VADD_VSUB:
          case NEON_3R_LOGIC:
          case NEON_3R_VMAX:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
          case NEON_3R_VHADD:
 +        case NEON_3R_VABD:
 +        case NEON_3R_VABA:
              /* Already handled by decodetree */
              return 1;
          }
 --
-.20.1
+.25.1

-[PULL 35/45] target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
+[PULL 03/34] target/arm: Make RVBAR available for all ARMv8 CPUs
-Convert the VQSHL, VRSHL and VQRSHL insns in the 3-reg-same
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 group to decodetree. We have already implemented the size==0b11
 case of these insns; this commit handles the remaining sizes.
+RVBAR shadows RVBAR_ELx where x is the highest exception
+level if the highest EL is not EL3. This patch also allows
+ARMv8 CPUs to change the reset address with
+the rvbar property.
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20221206102504.165775-3-tobias.roehmel@rwth-aachen.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-8-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       | 30 ++++++++++++++++++-----
+ target/arm/cpu.c    |  6 +++++-
- target/arm/translate-neon.inc.c | 43 +++++++++++++++++++++++++++++++++
+ target/arm/helper.c | 21 ++++++++++++++-------
- target/arm/translate.c          | 22 +++--------------
+files changed, 19 insertions(+), 8 deletions(-)
 files changed, 70 insertions(+), 25 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/cpu.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
+@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset_hold(Object *obj)
- @3same_64_rev    .... ... . . . 11 .... .... .... . q:1 . . .... \
+         env->cp15.cpacr_el1 = FIELD_DP64(env->cp15.cpacr_el1,
-                  &3same vm=%vn_dp vn=%vm_dp vd=%vd_dp size=3
+                                          CPACR, CP11, 3);
+ #endif
--VQSHL_S64_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
++        if (arm_feature(env, ARM_FEATURE_V8)) {
--VQSHL_U64_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
++            env->cp15.rvbar = cpu->rvbar_prop;
--VRSHL_S64_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
++            env->regs[15] = cpu->rvbar_prop;
--VRSHL_U64_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
++        }
--VQRSHL_S64_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
+     }
--VQRSHL_U64_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
-+{
+ #if defined(CONFIG_USER_ONLY)
-+  VQSHL_S64_3s   1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+@@ -XXX,XX +XXX,XX @@ void arm_cpu_post_init(Object *obj)
-+  VQSHL_S_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_rev
+         qdev_property_add_static(DEVICE(obj), &arm_cpu_reset_hivecs_property);
-+}
+     }
-+{
-+  VQSHL_U64_3s   1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+-    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-+  VQSHL_U_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_rev
++    if (arm_feature(&cpu->env, ARM_FEATURE_V8)) {
-+}
+         object_property_add_uint64_ptr(obj, "rvbar",
-+{
+                                        &cpu->rvbar_prop,
-+  VRSHL_S64_3s   1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
+                                        OBJ_PROP_FLAG_READWRITE);
-+  VRSHL_S_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_rev
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 +}
 +{
 +  VRSHL_U64_3s   1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
 +  VRSHL_U_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_rev
 +}
 +{
 +  VQRSHL_S64_3s  1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
 +  VQRSHL_S_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_rev
 +}
 +{
 +  VQRSHL_U64_3s  1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
 +  VQRSHL_U_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_rev
 +}
  VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
  VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/target/arm/helper.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
+@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-         return do_3same(s, a, gen_##INSN##_3s);                         \
+         if (!arm_feature(env, ARM_FEATURE_EL3) &&
              !arm_feature(env, ARM_FEATURE_EL2)) {
              ARMCPRegInfo rvbar = {
 -                .name = "RVBAR_EL1", .state = ARM_CP_STATE_AA64,
 +                .name = "RVBAR_EL1", .state = ARM_CP_STATE_BOTH,
                  .opc0 = 3, .opc1 = 0, .crn = 12, .crm = 0, .opc2 = 1,
                  .access = PL1_R,
                  .fieldoffset = offsetof(CPUARMState, cp15.rvbar),
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          }
          /* RVBAR_EL2 is only implemented if EL2 is the highest EL */
          if (!arm_feature(env, ARM_FEATURE_EL3)) {
 -            ARMCPRegInfo rvbar = {
 -                .name = "RVBAR_EL2", .state = ARM_CP_STATE_AA64,
 -                .opc0 = 3, .opc1 = 4, .crn = 12, .crm = 0, .opc2 = 1,
 -                .access = PL2_R,
 -                .fieldoffset = offsetof(CPUARMState, cp15.rvbar),
 +            ARMCPRegInfo rvbar[] = {
 +                {
 +                    .name = "RVBAR_EL2", .state = ARM_CP_STATE_AA64,
 +                    .opc0 = 3, .opc1 = 4, .crn = 12, .crm = 0, .opc2 = 1,
 +                    .access = PL2_R,
 +                    .fieldoffset = offsetof(CPUARMState, cp15.rvbar),
 +                },
 +                {   .name = "RVBAR", .type = ARM_CP_ALIAS,
 +                    .cp = 15, .opc1 = 0, .crn = 12, .crm = 0, .opc2 = 1,
 +                    .access = PL2_R,
 +                    .fieldoffset = offsetof(CPUARMState, cp15.rvbar),
 +                },
              };
 -            define_one_arm_cp_reg(cpu, &rvbar);
 +            define_arm_cp_regs(cpu, rvbar);
          }
      }
-+/*
-+ * Some helper functions need to be passed the cpu_env. In order
-+ * to use those with the gvec APIs like tcg_gen_gvec_3() we need
-+ * to create wrapper functions whose prototype is a NeonGenTwoOpFn()
-+ * and which call a NeonGenTwoOpEnvFn().
-+ */
-+#define WRAP_ENV_FN(WRAPNAME, FUNC)                                     \
-+    static void WRAPNAME(TCGv_i32 d, TCGv_i32 n, TCGv_i32 m)            \
-+    {                                                                   \
-+        FUNC(d, cpu_env, n, m);                                         \
-+    }
-+
-+#define DO_3SAME_32_ENV(INSN, FUNC)                                     \
-+    WRAP_ENV_FN(gen_##INSN##_tramp8, gen_helper_neon_##FUNC##8);        \
-+    WRAP_ENV_FN(gen_##INSN##_tramp16, gen_helper_neon_##FUNC##16);      \
-+    WRAP_ENV_FN(gen_##INSN##_tramp32, gen_helper_neon_##FUNC##32);      \
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
-+                                uint32_t oprsz, uint32_t maxsz)         \
-+    {                                                                   \
-+        static const GVecGen3 ops[4] = {                                \
-+            { .fni4 = gen_##INSN##_tramp8 },                            \
-+            { .fni4 = gen_##INSN##_tramp16 },                           \
-+            { .fni4 = gen_##INSN##_tramp32 },                           \
-+            { 0 },                                                      \
-+        };                                                              \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece]); \
-+    }                                                                   \
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
-+    {                                                                   \
-+        if (a->size > 2) {                                              \
-+            return false;                                               \
-+        }                                                               \
-+        return do_3same(s, a, gen_##INSN##_3s);                         \
-+    }
-+
- DO_3SAME_32(VHADD_S, hadd_s)
- DO_3SAME_32(VHADD_U, hadd_u)
- DO_3SAME_32(VHSUB_S, hsub_s)
- DO_3SAME_32(VHSUB_U, hsub_u)
- DO_3SAME_32(VRHADD_S, rhadd_s)
- DO_3SAME_32(VRHADD_U, rhadd_u)
-+DO_3SAME_32(VRSHL_S, rshl_s)
-+DO_3SAME_32(VRSHL_U, rshl_u)
-+
-+DO_3SAME_32_ENV(VQSHL_S, qshl_s)
-+DO_3SAME_32_ENV(VQSHL_U, qshl_u)
-+DO_3SAME_32_ENV(VQRSHL_S, qrshl_s)
-+DO_3SAME_32_ENV(VQRSHL_U, qrshl_u)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VHSUB:
-         case NEON_3R_VABD:
-         case NEON_3R_VABA:
-+        case NEON_3R_VQSHL:
-+        case NEON_3R_VRSHL:
-+        case NEON_3R_VQRSHL:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         }
-         pairwise = 0;
-         switch (op) {
--        case NEON_3R_VQSHL:
--        case NEON_3R_VRSHL:
--        case NEON_3R_VQRSHL:
--            {
--                int rtmp;
--                /* Shift instruction operands are reversed.  */
--                rtmp = rn;
--                rn = rm;
--                rm = rtmp;
--            }
--            break;
-         case NEON_3R_VPADD_VQRDMLAH:
-         case NEON_3R_VPMAX:
-         case NEON_3R_VPMIN:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             tmp2 = neon_load_reg(rm, pass);
-         }
-         switch (op) {
--        case NEON_3R_VQSHL:
--            GEN_NEON_INTEGER_OP_ENV(qshl);
--            break;
--        case NEON_3R_VRSHL:
--            GEN_NEON_INTEGER_OP(rshl);
--            break;
--        case NEON_3R_VQRSHL:
--            GEN_NEON_INTEGER_OP_ENV(qrshl);
-             break;
-         case NEON_3R_VPMAX:
-             GEN_NEON_INTEGER_OP(pmax);
 --
-.20.1
+.25.1

-[PULL 28/45] MAINTAINERS: Add ACPI/HEST/GHES entries
+[PULL 04/34] target/arm: Make stage_2_format for cache attributes optional
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
-I and Xiang are willing to review the APEI-related patches and
+The v8R PMSAv8 has a two-stage MPU translation process, but, unlike
-volunteer as the reviewers for the HEST/GHES part.
+VMSAv8, the stage 2 attributes are in the same format as the stage 1
 attributes (8-bit MAIR format). Rather than converting the MAIR
 format to the format used for VMSA stage 2 (bits [5:2] of a VMSA
 stage 2 descriptor) and then converting back to do the attribute
 combination, allow combined_attrs_nofwb() to accept s2 attributes
 that are already in the MAIR format.
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+We move the assert() to combined_attrs_fwb(), because that function
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+really does require a VMSA stage 2 attribute format. (We will never
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+get there for v8R, because PMSAv8 does not implement FEAT_S2FWB.)
-Acked-by: Michael S. Tsirkin <mst@redhat.com>
-Message-id: 20200512030609.19593-11-gengdongjiu@huawei.com
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20221206102504.165775-4-tobias.roehmel@rwth-aachen.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- MAINTAINERS | 9 +++++++++
+ target/arm/ptw.c | 10 ++++++++--
-file changed, 9 insertions(+)
+file changed, 8 insertions(+), 2 deletions(-)
-diff --git a/MAINTAINERS b/MAINTAINERS
+diff --git a/target/arm/ptw.c b/target/arm/ptw.c
 index XXXXXXX..XXXXXXX 100644
---- a/MAINTAINERS
+--- a/target/arm/ptw.c
-+++ b/MAINTAINERS
++++ b/target/arm/ptw.c
-@@ -XXX,XX +XXX,XX @@ F: tests/qtest/bios-tables-test.c
+@@ -XXX,XX +XXX,XX @@ static uint8_t combined_attrs_nofwb(uint64_t hcr,
- F: tests/qtest/acpi-utils.[hc]
+ {
- F: tests/data/acpi/
+     uint8_t s1lo, s2lo, s1hi, s2hi, s2_mair_attrs, ret_attrs;
-+ACPI/HEST/GHES
+-    s2_mair_attrs = convert_stage2_attrs(hcr, s2.attrs);
-+R: Dongjiu Geng <gengdongjiu@huawei.com>
++    if (s2.is_s2_format) {
-+R: Xiang Zheng <zhengxiang9@huawei.com>
++        s2_mair_attrs = convert_stage2_attrs(hcr, s2.attrs);
-+L: qemu-arm@nongnu.org
++    } else {
-+S: Maintained
++        s2_mair_attrs = s2.attrs;
-+F: hw/acpi/ghes.c
++    }
-+F: include/hw/acpi/ghes.h
-+F: docs/specs/acpi_hest_ghes.rst
+     s1lo = extract32(s1.attrs, 0, 4);
      s2lo = extract32(s2_mair_attrs, 0, 4);
@@ -XXX,XX +XXX,XX @@ static uint8_t force_cacheattr_nibble_wb(uint8_t attr)
   */
  static uint8_t combined_attrs_fwb(ARMCacheAttrs s1, ARMCacheAttrs s2)
  {
 +    assert(s2.is_s2_format && !s1.is_s2_format);
 +
- ppc4xx
+     switch (s2.attrs) {
- M: David Gibson <david@gibson.dropbear.id.au>
+     case 7:
- L: qemu-ppc@nongnu.org
+         /* Use stage 1 attributes */
@@ -XXX,XX +XXX,XX @@ static ARMCacheAttrs combine_cacheattrs(uint64_t hcr,
      ARMCacheAttrs ret;
      bool tagged = false;
 -    assert(s2.is_s2_format && !s1.is_s2_format);
 +    assert(!s1.is_s2_format);
      ret.is_s2_format = false;
      if (s1.attrs == 0xf0) {
 --
-.20.1
+.25.1

-[PULL 30/45] target/arm: Convert Neon 3-reg-same SHA to decodetree
+[PULL 05/34] target/arm: Enable TTBCR_EAE for ARMv8-R AArch32
-Convert the Neon SHA instructions in the 3-reg-same group
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 to decodetree.
+ARMv8-R AArch32 CPUs behave as if TTBCR.EAE is always 1 even
+tough they don't have the TTBCR register.
+See ARM Architecture Reference Manual Supplement - ARMv8, for the ARMv8-R
+AArch32 architecture profile Version:A.c section C1.2.
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20221206102504.165775-5-tobias.roehmel@rwth-aachen.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-3-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  10 +++
+ target/arm/internals.h    | 4 ++++
- target/arm/translate-neon.inc.c | 139 ++++++++++++++++++++++++++++++++
+ target/arm/debug_helper.c | 3 +++
- target/arm/translate.c          |  46 +----------
+ target/arm/tlb_helper.c   | 4 ++++
-files changed, 151 insertions(+), 44 deletions(-)
+files changed, 11 insertions(+)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/internals.h b/target/arm/internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/internals.h
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/internals.h
-@@ -XXX,XX +XXX,XX @@ VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
+@@ -XXX,XX +XXX,XX @@ unsigned int arm_pamax(ARMCPU *cpu);
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
+ static inline bool extended_addresses_enabled(CPUARMState *env)
+ {
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
+     uint64_t tcr = env->cp15.tcr_el[arm_is_secure(env) ? 3 : 1];
-+
++    if (arm_feature(env, ARM_FEATURE_PMSA) &&
-+SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
++        arm_feature(env, ARM_FEATURE_V8)) {
 +                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +SHA256H_3s       1111 001 1 0 . 00 .... .... 1100 . 1 . 0 .... \
 +                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +SHA256H2_3s      1111 001 1 0 . 01 .... .... 1100 . 1 . 0 .... \
 +                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
 +                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +
  VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
  DO_VQRDMLAH(VQRDMLAH, gen_gvec_sqrdmlah_qc)
  DO_VQRDMLAH(VQRDMLSH, gen_gvec_sqrdmlsh_qc)
 +
 +static bool trans_SHA1_3s(DisasContext *s, arg_SHA1_3s *a)
 +{
 +    TCGv_ptr ptr1, ptr2, ptr3;
 +    TCGv_i32 tmp;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 +        !dc_isar_feature(aa32_sha1, s)) {
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
-+
+     return arm_el_is_aa64(env, 1) ||
-+    ptr1 = vfp_reg_ptr(true, a->vd);
+            (arm_feature(env, ARM_FEATURE_LPAE) && (tcr & TTBCR_EAE));
-+    ptr2 = vfp_reg_ptr(true, a->vn);
+ }
-+    ptr3 = vfp_reg_ptr(true, a->vm);
+diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
-+    tmp = tcg_const_i32(a->optype);
+index XXXXXXX..XXXXXXX 100644
-+    gen_helper_crypto_sha1_3reg(ptr1, ptr2, ptr3, tmp);
+--- a/target/arm/debug_helper.c
-+    tcg_temp_free_i32(tmp);
++++ b/target/arm/debug_helper.c
-+    tcg_temp_free_ptr(ptr1);
+@@ -XXX,XX +XXX,XX @@ static uint32_t arm_debug_exception_fsr(CPUARMState *env)
-+    tcg_temp_free_ptr(ptr2);
-+    tcg_temp_free_ptr(ptr3);
+     if (target_el == 2 || arm_el_is_aa64(env, target_el)) {
-+
+         using_lpae = true;
-+    return true;
++    } else if (arm_feature(env, ARM_FEATURE_PMSA) &&
-+}
++               arm_feature(env, ARM_FEATURE_V8)) {
-+
++        using_lpae = true;
-+static bool trans_SHA256H_3s(DisasContext *s, arg_SHA256H_3s *a)
+     } else {
-+{
+         if (arm_feature(env, ARM_FEATURE_LPAE) &&
-+    TCGv_ptr ptr1, ptr2, ptr3;
+             (env->cp15.tcr_el[target_el] & TTBCR_EAE)) {
-+
+diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
+index XXXXXXX..XXXXXXX 100644
-+        !dc_isar_feature(aa32_sha2, s)) {
+--- a/target/arm/tlb_helper.c
-+        return false;
++++ b/target/arm/tlb_helper.c
-+    }
+@@ -XXX,XX +XXX,XX @@ bool regime_using_lpae_format(CPUARMState *env, ARMMMUIdx mmu_idx)
-+
+     if (el == 2 || arm_el_is_aa64(env, el)) {
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
+         return true;
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+     }
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
++    if (arm_feature(env, ARM_FEATURE_PMSA) &&
-+        return false;
++        arm_feature(env, ARM_FEATURE_V8)) {
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
-+
+     if (arm_feature(env, ARM_FEATURE_LPAE)
-+    ptr1 = vfp_reg_ptr(true, a->vd);
+         && (regime_tcr(env, mmu_idx) & TTBCR_EAE)) {
-+    ptr2 = vfp_reg_ptr(true, a->vn);
+         return true;
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    gen_helper_crypto_sha256h(ptr1, ptr2, ptr3);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 +
 +static bool trans_SHA256H2_3s(DisasContext *s, arg_SHA256H2_3s *a)
 +{
 +    TCGv_ptr ptr1, ptr2, ptr3;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 +        !dc_isar_feature(aa32_sha2, s)) {
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    ptr1 = vfp_reg_ptr(true, a->vd);
 +    ptr2 = vfp_reg_ptr(true, a->vn);
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    gen_helper_crypto_sha256h2(ptr1, ptr2, ptr3);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 +
 +static bool trans_SHA256SU1_3s(DisasContext *s, arg_SHA256SU1_3s *a)
 +{
 +    TCGv_ptr ptr1, ptr2, ptr3;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 +        !dc_isar_feature(aa32_sha2, s)) {
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    ptr1 = vfp_reg_ptr(true, a->vd);
 +    ptr2 = vfp_reg_ptr(true, a->vn);
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    gen_helper_crypto_sha256su1(ptr1, ptr2, ptr3);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
      int vec_size;
      uint32_t imm;
      TCGv_i32 tmp, tmp2, tmp3, tmp4, tmp5;
 -    TCGv_ptr ptr1, ptr2, ptr3;
 +    TCGv_ptr ptr1, ptr2;
      TCGv_i64 tmp64;
      if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              return 1;
          }
          switch (op) {
 -        case NEON_3R_SHA:
 -            /* The SHA-1/SHA-256 3-register instructions require special
 -             * treatment here, as their size field is overloaded as an
 -             * op type selector, and they all consume their input in a
 -             * single pass.
 -             */
 -            if (!q) {
 -                return 1;
 -            }
 -            if (!u) { /* SHA-1 */
 -                if (!dc_isar_feature(aa32_sha1, s)) {
 -                    return 1;
 -                }
 -                ptr1 = vfp_reg_ptr(true, rd);
 -                ptr2 = vfp_reg_ptr(true, rn);
 -                ptr3 = vfp_reg_ptr(true, rm);
 -                tmp4 = tcg_const_i32(size);
 -                gen_helper_crypto_sha1_3reg(ptr1, ptr2, ptr3, tmp4);
 -                tcg_temp_free_i32(tmp4);
 -            } else { /* SHA-256 */
 -                if (!dc_isar_feature(aa32_sha2, s) || size == 3) {
 -                    return 1;
 -                }
 -                ptr1 = vfp_reg_ptr(true, rd);
 -                ptr2 = vfp_reg_ptr(true, rn);
 -                ptr3 = vfp_reg_ptr(true, rm);
 -                switch (size) {
 -                case 0:
 -                    gen_helper_crypto_sha256h(ptr1, ptr2, ptr3);
 -                    break;
 -                case 1:
 -                    gen_helper_crypto_sha256h2(ptr1, ptr2, ptr3);
 -                    break;
 -                case 2:
 -                    gen_helper_crypto_sha256su1(ptr1, ptr2, ptr3);
 -                    break;
 -                }
 -            }
 -            tcg_temp_free_ptr(ptr1);
 -            tcg_temp_free_ptr(ptr2);
 -            tcg_temp_free_ptr(ptr3);
 -            return 0;
 -
          case NEON_3R_VPADD_VQRDMLAH:
              if (!u) {
                  break;  /* VPADD */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VMUL:
          case NEON_3R_VML:
          case NEON_3R_VSHL:
 +        case NEON_3R_SHA:
              /* Already handled by decodetree */
              return 1;
          }
 --
-.20.1
+.25.1

-[PULL 27/45] target-arm: kvm64: handle SIGBUS signal from kernel or KVM
+[PULL 06/34] target/arm: Add PMSAv8r registers
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
-Add a SIGBUS signal handler. In this handler, it checks the SIGBUS type,
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
-translates the host VA delivered by host to guest PA, then fills this PA
+Message-id: 20221206102504.165775-6-tobias.roehmel@rwth-aachen.de
 to guest APEI GHES memory, then notifies guest according to the SIGBUS
 type.
 When guest accesses the poisoned memory, it will generate a Synchronous
 External Abort(SEA). Then host kernel gets an APEI notification and calls
 memory_failure() to unmapped the affected page in stage 2, finally
 returns to guest.
 Guest continues to access the PG_hwpoison page, it will trap to KVM as
 stage2 fault, then a SIGBUS_MCEERR_AR synchronous signal is delivered to
 Qemu, Qemu records this error address into guest APEI GHES memory and
 notifes guest using Synchronous-External-Abort(SEA).
 In order to inject a vSEA, we introduce the kvm_inject_arm_sea() function
 in which we can setup the type of exception and the syndrome information.
 When switching to guest, the target vcpu will jump to the synchronous
 external abort vector table entry.
 The ESR_ELx.DFSC is set to synchronous external abort(0x10), and the
 ESR_ELx.FnV is set to not valid(0x1), which will tell guest that FAR is
 not valid and hold an UNKNOWN value. These values will be set to KVM
 register structures through KVM_SET_ONE_REG IOCTL.
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Message-id: 20200512030609.19593-10-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/sysemu/kvm.h    |  3 +-
+ target/arm/cpu.h     |   6 +
- target/arm/cpu.h        |  4 +++
+ target/arm/cpu.c     |  28 +++-
- target/arm/internals.h  |  5 +--
+ target/arm/helper.c  | 302 +++++++++++++++++++++++++++++++++++++++++++
- target/i386/cpu.h       |  2 ++
+ target/arm/machine.c |  28 ++++
- target/arm/helper.c     |  2 +-
+files changed, 360 insertions(+), 4 deletions(-)
  target/arm/kvm64.c      | 77 +++++++++++++++++++++++++++++++++++++++++
  target/arm/tlb_helper.c |  2 +-
 files changed, 89 insertions(+), 6 deletions(-)
-diff --git a/include/sysemu/kvm.h b/include/sysemu/kvm.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/kvm.h
-+++ b/include/sysemu/kvm.h
-@@ -XXX,XX +XXX,XX @@ bool kvm_vcpu_id_is_valid(int vcpu_id);
- /* Returns VCPU ID to be used on KVM_CREATE_VCPU ioctl() */
- unsigned long kvm_arch_vcpu_id(CPUState *cpu);
--#ifdef TARGET_I386
--#define KVM_HAVE_MCE_INJECTION 1
-+#ifdef KVM_HAVE_MCE_INJECTION
- void kvm_arch_on_sigbus_vcpu(CPUState *cpu, int code, void *addr);
- #endif
 diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.h
 +++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef struct CPUArchState {
- /* ARM processors have a weak memory model */
+             };
- #define TCG_GUEST_DEFAULT_MO      (0)
+             uint64_t sctlr_el[4];
+         };
-+#ifdef TARGET_AARCH64
++        uint64_t vsctlr; /* Virtualization System control register. */
-+#define KVM_HAVE_MCE_INJECTION 1
+         uint64_t cpacr_el1; /* Architectural feature access control register */
-+#endif
+         uint64_t cptr_el[4];  /* ARMv8 feature trap registers */
-+
+         uint32_t c1_xscaleauxcr; /* XScale auxiliary control register.  */
- #define EXCP_UDEF            1   /* undefined instruction */
+@@ -XXX,XX +XXX,XX @@ typedef struct CPUArchState {
- #define EXCP_SWI             2   /* software interrupt */
+          */
- #define EXCP_PREFETCH_ABORT  3
+         uint32_t *rbar[M_REG_NUM_BANKS];
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+         uint32_t *rlar[M_REG_NUM_BANKS];
 +        uint32_t *hprbar;
 +        uint32_t *hprlar;
          uint32_t mair0[M_REG_NUM_BANKS];
          uint32_t mair1[M_REG_NUM_BANKS];
 +        uint32_t hprselr;
      } pmsav8;
      /* v8M SAU */
@@ -XXX,XX +XXX,XX @@ struct ArchCPU {
      bool has_mpu;
      /* PMSAv7 MPU number of supported regions */
      uint32_t pmsav7_dregion;
 +    /* PMSAv8 MPU number of supported hyp regions */
 +    uint32_t pmsav8r_hdregion;
      /* v8M SAU number of supported regions */
      uint32_t sau_sregion;
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/target/arm/cpu.c
-+++ b/target/arm/internals.h
++++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static inline uint32_t syn_insn_abort(int same_el, int ea, int s1ptw, int fsc)
+@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset_hold(Object *obj)
-         | ARM_EL_IL | (ea << 9) | (s1ptw << 7) | fsc;
+                        sizeof(*env->pmsav7.dracr) * cpu->pmsav7_dregion);
- }
+             }
+         }
--static inline uint32_t syn_data_abort_no_iss(int same_el,
++
-+static inline uint32_t syn_data_abort_no_iss(int same_el, int fnv,
++        if (cpu->pmsav8r_hdregion > 0) {
-                                              int ea, int cm, int s1ptw,
++            memset(env->pmsav8.hprbar, 0,
-                                              int wnr, int fsc)
++                   sizeof(*env->pmsav8.hprbar) * cpu->pmsav8r_hdregion);
- {
++            memset(env->pmsav8.hprlar, 0,
-     return (EC_DATAABORT << ARM_EL_EC_SHIFT) | (same_el << ARM_EL_EC_SHIFT)
++                   sizeof(*env->pmsav8.hprlar) * cpu->pmsav8r_hdregion);
-            | ARM_EL_IL
++        }
--           | (ea << 9) | (cm << 8) | (s1ptw << 7) | (wnr << 6) | fsc;
++
-+           | (fnv << 10) | (ea << 9) | (cm << 8) | (s1ptw << 7)
+         env->pmsav7.rnr[M_REG_NS] = 0;
-+           | (wnr << 6) | fsc;
+         env->pmsav7.rnr[M_REG_S] = 0;
- }
+         env->pmsav8.mair0[M_REG_NS] = 0;
+@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
- static inline uint32_t syn_data_abort_with_iss(int same_el,
+     /* MPU can be configured out of a PMSA CPU either by setting has-mpu
-diff --git a/target/i386/cpu.h b/target/i386/cpu.h
+      * to false or by setting pmsav7-dregion to 0.
-index XXXXXXX..XXXXXXX 100644
+      */
---- a/target/i386/cpu.h
+-    if (!cpu->has_mpu) {
-+++ b/target/i386/cpu.h
+-        cpu->pmsav7_dregion = 0;
-@@ -XXX,XX +XXX,XX @@
+-    }
- /* The x86 has a strong memory model with some store-after-load re-ordering */
+-    if (cpu->pmsav7_dregion == 0) {
- #define TCG_GUEST_DEFAULT_MO      (TCG_MO_ALL & ~TCG_MO_ST_LD)
++    if (!cpu->has_mpu || cpu->pmsav7_dregion == 0) {
+         cpu->has_mpu = false;
-+#define KVM_HAVE_MCE_INJECTION 1
++        cpu->pmsav7_dregion = 0;
-+
++        cpu->pmsav8r_hdregion = 0;
- /* Maximum instruction code size */
+     }
- #define TARGET_MAX_INSN_SIZE 16
+     if (arm_feature(env, ARM_FEATURE_PMSA) &&
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
                  env->pmsav7.dracr = g_new0(uint32_t, nr);
              }
          }
 +
 +        if (cpu->pmsav8r_hdregion > 0xff) {
 +            error_setg(errp, "PMSAv8 MPU EL2 #regions invalid %" PRIu32,
 +                              cpu->pmsav8r_hdregion);
 +            return;
 +        }
 +
 +        if (cpu->pmsav8r_hdregion) {
 +            env->pmsav8.hprbar = g_new0(uint32_t,
 +                                        cpu->pmsav8r_hdregion);
 +            env->pmsav8.hprlar = g_new0(uint32_t,
 +                                        cpu->pmsav8r_hdregion);
 +        }
      }
      if (arm_feature(env, ARM_FEATURE_M_SECURITY)) {
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
+@@ -XXX,XX +XXX,XX @@ static void pmsav7_rgnr_write(CPUARMState *env, const ARMCPRegInfo *ri,
-              * Report exception with ESR indicating a fault due to a
+     raw_write(env, ri, value);
-              * translation table walk for a cache maintenance instruction.
+ }
-              */
--            syn = syn_data_abort_no_iss(current_el == target_el,
++static void prbar_write(CPUARMState *env, const ARMCPRegInfo *ri,
-+            syn = syn_data_abort_no_iss(current_el == target_el, 0,
++                          uint64_t value)
-                                         fi.ea, 1, fi.s1ptw, 1, fsc);
++{
-             env->exception.vaddress = value;
++    ARMCPU *cpu = env_archcpu(env);
-             env->exception.fsr = fsr;
++
-diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
++    tlb_flush(CPU(cpu)); /* Mappings may have changed - purge! */
 +    env->pmsav8.rbar[M_REG_NS][env->pmsav7.rnr[M_REG_NS]] = value;
 +}
 +
 +static uint64_t prbar_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    return env->pmsav8.rbar[M_REG_NS][env->pmsav7.rnr[M_REG_NS]];
 +}
 +
 +static void prlar_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    tlb_flush(CPU(cpu)); /* Mappings may have changed - purge! */
 +    env->pmsav8.rlar[M_REG_NS][env->pmsav7.rnr[M_REG_NS]] = value;
 +}
 +
 +static uint64_t prlar_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    return env->pmsav8.rlar[M_REG_NS][env->pmsav7.rnr[M_REG_NS]];
 +}
 +
 +static void prselr_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                           uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    /*
 +     * Ignore writes that would select not implemented region.
 +     * This is architecturally UNPREDICTABLE.
 +     */
 +    if (value >= cpu->pmsav7_dregion) {
 +        return;
 +    }
 +
 +    env->pmsav7.rnr[M_REG_NS] = value;
 +}
 +
 +static void hprbar_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    tlb_flush(CPU(cpu)); /* Mappings may have changed - purge! */
 +    env->pmsav8.hprbar[env->pmsav8.hprselr] = value;
 +}
 +
 +static uint64_t hprbar_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    return env->pmsav8.hprbar[env->pmsav8.hprselr];
 +}
 +
 +static void hprlar_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    tlb_flush(CPU(cpu)); /* Mappings may have changed - purge! */
 +    env->pmsav8.hprlar[env->pmsav8.hprselr] = value;
 +}
 +
 +static uint64_t hprlar_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    return env->pmsav8.hprlar[env->pmsav8.hprselr];
 +}
 +
 +static void hprenr_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
 +{
 +    uint32_t n;
 +    uint32_t bit;
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    /* Ignore writes to unimplemented regions */
 +    int rmax = MIN(cpu->pmsav8r_hdregion, 32);
 +    value &= MAKE_64BIT_MASK(0, rmax);
 +
 +    tlb_flush(CPU(cpu)); /* Mappings may have changed - purge! */
 +
 +    /* Register alias is only valid for first 32 indexes */
 +    for (n = 0; n < rmax; ++n) {
 +        bit = extract32(value, n, 1);
 +        env->pmsav8.hprlar[n] = deposit32(
 +                    env->pmsav8.hprlar[n], 0, 1, bit);
 +    }
 +}
 +
 +static uint64_t hprenr_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    uint32_t n;
 +    uint32_t result = 0x0;
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    /* Register alias is only valid for first 32 indexes */
 +    for (n = 0; n < MIN(cpu->pmsav8r_hdregion, 32); ++n) {
 +        if (env->pmsav8.hprlar[n] & 0x1) {
 +            result |= (0x1 << n);
 +        }
 +    }
 +    return result;
 +}
 +
 +static void hprselr_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                           uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +
 +    /*
 +     * Ignore writes that would select not implemented region.
 +     * This is architecturally UNPREDICTABLE.
 +     */
 +    if (value >= cpu->pmsav8r_hdregion) {
 +        return;
 +    }
 +
 +    env->pmsav8.hprselr = value;
 +}
 +
 +static void pmsav8r_regn_write(CPUARMState *env, const ARMCPRegInfo *ri,
 +                          uint64_t value)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +    uint8_t index = (extract32(ri->opc0, 0, 1) << 4) |
 +                    (extract32(ri->crm, 0, 3) << 1) | extract32(ri->opc2, 2, 1);
 +
 +    tlb_flush(CPU(cpu)); /* Mappings may have changed - purge! */
 +
 +    if (ri->opc1 & 4) {
 +        if (index >= cpu->pmsav8r_hdregion) {
 +            return;
 +        }
 +        if (ri->opc2 & 0x1) {
 +            env->pmsav8.hprlar[index] = value;
 +        } else {
 +            env->pmsav8.hprbar[index] = value;
 +        }
 +    } else {
 +        if (index >= cpu->pmsav7_dregion) {
 +            return;
 +        }
 +        if (ri->opc2 & 0x1) {
 +            env->pmsav8.rlar[M_REG_NS][index] = value;
 +        } else {
 +            env->pmsav8.rbar[M_REG_NS][index] = value;
 +        }
 +    }
 +}
 +
 +static uint64_t pmsav8r_regn_read(CPUARMState *env, const ARMCPRegInfo *ri)
 +{
 +    ARMCPU *cpu = env_archcpu(env);
 +    uint8_t index = (extract32(ri->opc0, 0, 1) << 4) |
 +                    (extract32(ri->crm, 0, 3) << 1) | extract32(ri->opc2, 2, 1);
 +
 +    if (ri->opc1 & 4) {
 +        if (index >= cpu->pmsav8r_hdregion) {
 +            return 0x0;
 +        }
 +        if (ri->opc2 & 0x1) {
 +            return env->pmsav8.hprlar[index];
 +        } else {
 +            return env->pmsav8.hprbar[index];
 +        }
 +    } else {
 +        if (index >= cpu->pmsav7_dregion) {
 +            return 0x0;
 +        }
 +        if (ri->opc2 & 0x1) {
 +            return env->pmsav8.rlar[M_REG_NS][index];
 +        } else {
 +            return env->pmsav8.rbar[M_REG_NS][index];
 +        }
 +    }
 +}
 +
 +static const ARMCPRegInfo pmsav8r_cp_reginfo[] = {
 +    { .name = "PRBAR",
 +      .cp = 15, .opc1 = 0, .crn = 6, .crm = 3, .opc2 = 0,
 +      .access = PL1_RW, .type = ARM_CP_NO_RAW,
 +      .accessfn = access_tvm_trvm,
 +      .readfn = prbar_read, .writefn = prbar_write },
 +    { .name = "PRLAR",
 +      .cp = 15, .opc1 = 0, .crn = 6, .crm = 3, .opc2 = 1,
 +      .access = PL1_RW, .type = ARM_CP_NO_RAW,
 +      .accessfn = access_tvm_trvm,
 +      .readfn = prlar_read, .writefn = prlar_write },
 +    { .name = "PRSELR", .resetvalue = 0,
 +      .cp = 15, .opc1 = 0, .crn = 6, .crm = 2, .opc2 = 1,
 +      .access = PL1_RW, .accessfn = access_tvm_trvm,
 +      .writefn = prselr_write,
 +      .fieldoffset = offsetof(CPUARMState, pmsav7.rnr[M_REG_NS]) },
 +    { .name = "HPRBAR", .resetvalue = 0,
 +      .cp = 15, .opc1 = 4, .crn = 6, .crm = 3, .opc2 = 0,
 +      .access = PL2_RW, .type = ARM_CP_NO_RAW,
 +      .readfn = hprbar_read, .writefn = hprbar_write },
 +    { .name = "HPRLAR",
 +      .cp = 15, .opc1 = 4, .crn = 6, .crm = 3, .opc2 = 1,
 +      .access = PL2_RW, .type = ARM_CP_NO_RAW,
 +      .readfn = hprlar_read, .writefn = hprlar_write },
 +    { .name = "HPRSELR", .resetvalue = 0,
 +      .cp = 15, .opc1 = 4, .crn = 6, .crm = 2, .opc2 = 1,
 +      .access = PL2_RW,
 +      .writefn = hprselr_write,
 +      .fieldoffset = offsetof(CPUARMState, pmsav8.hprselr) },
 +    { .name = "HPRENR",
 +      .cp = 15, .opc1 = 4, .crn = 6, .crm = 1, .opc2 = 1,
 +      .access = PL2_RW, .type = ARM_CP_NO_RAW,
 +      .readfn = hprenr_read, .writefn = hprenr_write },
 +};
 +
  static const ARMCPRegInfo pmsav7_cp_reginfo[] = {
      /* Reset for all these registers is handled in arm_cpu_reset(),
       * because the PMSAv7 is also used by M-profile CPUs, which do
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .access = PL1_R, .type = ARM_CP_CONST,
                .resetvalue = cpu->pmsav7_dregion << 8
          };
 +        /* HMPUIR is specific to PMSA V8 */
 +        ARMCPRegInfo id_hmpuir_reginfo = {
 +            .name = "HMPUIR",
 +            .cp = 15, .opc1 = 4, .crn = 0, .crm = 0, .opc2 = 4,
 +            .access = PL2_R, .type = ARM_CP_CONST,
 +            .resetvalue = cpu->pmsav8r_hdregion
 +        };
          static const ARMCPRegInfo crn0_wi_reginfo = {
              .name = "CRN0_WI", .cp = 15, .crn = 0, .crm = CP_ANY,
              .opc1 = CP_ANY, .opc2 = CP_ANY, .access = PL1_W,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          define_arm_cp_regs(cpu, id_cp_reginfo);
          if (!arm_feature(env, ARM_FEATURE_PMSA)) {
              define_one_arm_cp_reg(cpu, &id_tlbtr_reginfo);
 +        } else if (arm_feature(env, ARM_FEATURE_PMSA) &&
 +                   arm_feature(env, ARM_FEATURE_V8)) {
 +            uint32_t i = 0;
 +            char *tmp_string;
 +
 +            define_one_arm_cp_reg(cpu, &id_mpuir_reginfo);
 +            define_one_arm_cp_reg(cpu, &id_hmpuir_reginfo);
 +            define_arm_cp_regs(cpu, pmsav8r_cp_reginfo);
 +
 +            /* Register alias is only valid for first 32 indexes */
 +            for (i = 0; i < MIN(cpu->pmsav7_dregion, 32); ++i) {
 +                uint8_t crm = 0b1000 | extract32(i, 1, 3);
 +                uint8_t opc1 = extract32(i, 4, 1);
 +                uint8_t opc2 = extract32(i, 0, 1) << 2;
 +
 +                tmp_string = g_strdup_printf("PRBAR%u", i);
 +                ARMCPRegInfo tmp_prbarn_reginfo = {
 +                    .name = tmp_string, .type = ARM_CP_ALIAS | ARM_CP_NO_RAW,
 +                    .cp = 15, .opc1 = opc1, .crn = 6, .crm = crm, .opc2 = opc2,
 +                    .access = PL1_RW, .resetvalue = 0,
 +                    .accessfn = access_tvm_trvm,
 +                    .writefn = pmsav8r_regn_write, .readfn = pmsav8r_regn_read
 +                };
 +                define_one_arm_cp_reg(cpu, &tmp_prbarn_reginfo);
 +                g_free(tmp_string);
 +
 +                opc2 = extract32(i, 0, 1) << 2 | 0x1;
 +                tmp_string = g_strdup_printf("PRLAR%u", i);
 +                ARMCPRegInfo tmp_prlarn_reginfo = {
 +                    .name = tmp_string, .type = ARM_CP_ALIAS | ARM_CP_NO_RAW,
 +                    .cp = 15, .opc1 = opc1, .crn = 6, .crm = crm, .opc2 = opc2,
 +                    .access = PL1_RW, .resetvalue = 0,
 +                    .accessfn = access_tvm_trvm,
 +                    .writefn = pmsav8r_regn_write, .readfn = pmsav8r_regn_read
 +                };
 +                define_one_arm_cp_reg(cpu, &tmp_prlarn_reginfo);
 +                g_free(tmp_string);
 +            }
 +
 +            /* Register alias is only valid for first 32 indexes */
 +            for (i = 0; i < MIN(cpu->pmsav8r_hdregion, 32); ++i) {
 +                uint8_t crm = 0b1000 | extract32(i, 1, 3);
 +                uint8_t opc1 = 0b100 | extract32(i, 4, 1);
 +                uint8_t opc2 = extract32(i, 0, 1) << 2;
 +
 +                tmp_string = g_strdup_printf("HPRBAR%u", i);
 +                ARMCPRegInfo tmp_hprbarn_reginfo = {
 +                    .name = tmp_string,
 +                    .type = ARM_CP_NO_RAW,
 +                    .cp = 15, .opc1 = opc1, .crn = 6, .crm = crm, .opc2 = opc2,
 +                    .access = PL2_RW, .resetvalue = 0,
 +                    .writefn = pmsav8r_regn_write, .readfn = pmsav8r_regn_read
 +                };
 +                define_one_arm_cp_reg(cpu, &tmp_hprbarn_reginfo);
 +                g_free(tmp_string);
 +
 +                opc2 = extract32(i, 0, 1) << 2 | 0x1;
 +                tmp_string = g_strdup_printf("HPRLAR%u", i);
 +                ARMCPRegInfo tmp_hprlarn_reginfo = {
 +                    .name = tmp_string,
 +                    .type = ARM_CP_NO_RAW,
 +                    .cp = 15, .opc1 = opc1, .crn = 6, .crm = crm, .opc2 = opc2,
 +                    .access = PL2_RW, .resetvalue = 0,
 +                    .writefn = pmsav8r_regn_write, .readfn = pmsav8r_regn_read
 +                };
 +                define_one_arm_cp_reg(cpu, &tmp_hprlarn_reginfo);
 +                g_free(tmp_string);
 +            }
          } else if (arm_feature(env, ARM_FEATURE_V7)) {
              define_one_arm_cp_reg(cpu, &id_mpuir_reginfo);
          }
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
              sctlr.type |= ARM_CP_SUPPRESS_TB_END;
          }
          define_one_arm_cp_reg(cpu, &sctlr);
 +
 +        if (arm_feature(env, ARM_FEATURE_PMSA) &&
 +            arm_feature(env, ARM_FEATURE_V8)) {
 +            ARMCPRegInfo vsctlr = {
 +                .name = "VSCTLR", .state = ARM_CP_STATE_AA32,
 +                .cp = 15, .opc1 = 4, .crn = 2, .crm = 0, .opc2 = 0,
 +                .access = PL2_RW, .resetvalue = 0x0,
 +                .fieldoffset = offsetoflow32(CPUARMState, cp15.vsctlr),
 +            };
 +            define_one_arm_cp_reg(cpu, &vsctlr);
 +        }
      }
      if (cpu_isar_feature(aa64_lor, cpu)) {
 diff --git a/target/arm/machine.c b/target/arm/machine.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/kvm64.c
+--- a/target/arm/machine.c
-+++ b/target/arm/kvm64.c
++++ b/target/arm/machine.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static bool pmsav8_needed(void *opaque)
- #include "sysemu/kvm_int.h"
+         arm_feature(env, ARM_FEATURE_V8);
  #include "kvm_arm.h"
  #include "internals.h"
 +#include "hw/acpi/acpi.h"
 +#include "hw/acpi/ghes.h"
 +#include "hw/arm/virt.h"
  static bool have_guest_debug;
@@ -XXX,XX +XXX,XX @@ int kvm_arm_cpreg_level(uint64_t regidx)
      return KVM_PUT_RUNTIME_STATE;
  }
-+/* Callers must hold the iothread mutex lock */
++static bool pmsav8r_needed(void *opaque)
-+static void kvm_inject_arm_sea(CPUState *c)
++{
-+{
++    ARMCPU *cpu = opaque;
 +    ARMCPU *cpu = ARM_CPU(c);
 +    CPUARMState *env = &cpu->env;
-+    CPUClass *cc = CPU_GET_CLASS(c);
++
-+    uint32_t esr;
++    return arm_feature(env, ARM_FEATURE_PMSA) &&
-+    bool same_el;
++        arm_feature(env, ARM_FEATURE_V8) &&
-+
++        !arm_feature(env, ARM_FEATURE_M);
-+    c->exception_index = EXCP_DATA_ABORT;
++}
-+    env->exception.target_el = 1;
++
-+
++static const VMStateDescription vmstate_pmsav8r = {
-+    /*
++    .name = "cpu/pmsav8/pmsav8r",
-+     * Set the DFSC to synchronous external abort and set FnV to not valid,
++    .version_id = 1,
-+     * this will tell guest the FAR_ELx is UNKNOWN for this abort.
++    .minimum_version_id = 1,
-+     */
++    .needed = pmsav8r_needed,
-+    same_el = arm_current_el(env) == env->exception.target_el;
++    .fields = (VMStateField[]) {
-+    esr = syn_data_abort_no_iss(same_el, 1, 0, 0, 0, 0, 0x10);
++        VMSTATE_VARRAY_UINT32(env.pmsav8.hprbar, ARMCPU,
-+
++                        pmsav8r_hdregion, 0, vmstate_info_uint32, uint32_t),
-+    env->exception.syndrome = esr;
++        VMSTATE_VARRAY_UINT32(env.pmsav8.hprlar, ARMCPU,
-+
++                        pmsav8r_hdregion, 0, vmstate_info_uint32, uint32_t),
-+    cc->do_interrupt(c);
++        VMSTATE_END_OF_LIST()
-+}
++    },
-+
++};
- #define AARCH64_CORE_REG(x)   (KVM_REG_ARM64 | KVM_REG_SIZE_U64 | \
++
-                  KVM_REG_ARM_CORE | KVM_REG_ARM_CORE_REG(x))
+ static const VMStateDescription vmstate_pmsav8 = {
+     .name = "cpu/pmsav8",
-@@ -XXX,XX +XXX,XX @@ int kvm_arch_get_registers(CPUState *cs)
+     .version_id = 1,
-     return ret;
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_pmsav8 = {
- }
+         VMSTATE_UINT32(env.pmsav8.mair0[M_REG_NS], ARMCPU),
+         VMSTATE_UINT32(env.pmsav8.mair1[M_REG_NS], ARMCPU),
-+void kvm_arch_on_sigbus_vcpu(CPUState *c, int code, void *addr)
+         VMSTATE_END_OF_LIST()
-+{
++    },
-+    ram_addr_t ram_addr;
++    .subsections = (const VMStateDescription * []) {
-+    hwaddr paddr;
++        &vmstate_pmsav8r,
-+    Object *obj = qdev_get_machine();
++        NULL
-+    VirtMachineState *vms = VIRT_MACHINE(obj);
+     }
-+    bool acpi_enabled = virt_is_acpi_enabled(vms);
+ };
-+
 +    assert(code == BUS_MCEERR_AR || code == BUS_MCEERR_AO);
 +
 +    if (acpi_enabled && addr &&
 +            object_property_get_bool(obj, "ras", NULL)) {
 +        ram_addr = qemu_ram_addr_from_host(addr);
 +        if (ram_addr != RAM_ADDR_INVALID &&
 +            kvm_physical_memory_addr_from_host(c->kvm_state, addr, &paddr)) {
 +            kvm_hwpoison_page_add(ram_addr);
 +            /*
 +             * If this is a BUS_MCEERR_AR, we know we have been called
 +             * synchronously from the vCPU thread, so we can easily
 +             * synchronize the state and inject an error.
 +             *
 +             * TODO: we currently don't tell the guest at all about
 +             * BUS_MCEERR_AO. In that case we might either be being
 +             * called synchronously from the vCPU thread, or a bit
 +             * later from the main thread, so doing the injection of
 +             * the error would be more complicated.
 +             */
 +            if (code == BUS_MCEERR_AR) {
 +                kvm_cpu_synchronize_state(c);
 +                if (!acpi_ghes_record_errors(ACPI_HEST_SRC_ID_SEA, paddr)) {
 +                    kvm_inject_arm_sea(c);
 +                } else {
 +                    error_report("failed to record the error");
 +                    abort();
 +                }
 +            }
 +            return;
 +        }
 +        if (code == BUS_MCEERR_AO) {
 +            error_report("Hardware memory error at addr %p for memory used by "
 +                "QEMU itself instead of guest system!", addr);
 +        }
 +    }
 +
 +    if (code == BUS_MCEERR_AR) {
 +        error_report("Hardware memory error!");
 +        exit(1);
 +    }
 +}
 +
  /* C6.6.29 BRK instruction */
  static const uint32_t brk_insn = 0xd4200000;
 diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tlb_helper.c
 +++ b/target/arm/tlb_helper.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
       * ISV field.
       */
      if (!(template_syn & ARM_EL_ISV) || target_el != 2 || s1ptw) {
 -        syn = syn_data_abort_no_iss(same_el,
 +        syn = syn_data_abort_no_iss(same_el, 0,
                                      ea, 0, s1ptw, is_write, fsc);
      } else {
          /*
 --
-.20.1
+.25.1

-[PULL 25/45] KVM: Move hwpoison page related functions into kvm-all.c
+[PULL 07/34] target/arm: Add PMSAv8r functionality
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
-kvm_hwpoison_page_add() and kvm_unpoison_all() will both
+Add PMSAv8r translation.
-be used by X86 and ARM platforms, so moving them into
-"accel/kvm/kvm-all.c" to avoid duplicate code.
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 For architectures that don't use the poison-list functionality
 the reset handler will harmlessly do nothing, so let's register
 the kvm_unpoison_all() function in the generic kvm_init() function.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Message-id: 20221206102504.165775-7-tobias.roehmel@rwth-aachen.de
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
 Message-id: 20200512030609.19593-8-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/sysemu/kvm_int.h | 12 ++++++++++++
+ target/arm/ptw.c | 126 ++++++++++++++++++++++++++++++++++++++---------
- accel/kvm/kvm-all.c      | 36 ++++++++++++++++++++++++++++++++++++
+file changed, 104 insertions(+), 22 deletions(-)
- target/i386/kvm.c        | 36 ------------------------------------
-files changed, 48 insertions(+), 36 deletions(-)
+diff --git a/target/arm/ptw.c b/target/arm/ptw.c
 diff --git a/include/sysemu/kvm_int.h b/include/sysemu/kvm_int.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/kvm_int.h
+--- a/target/arm/ptw.c
-+++ b/include/sysemu/kvm_int.h
++++ b/target/arm/ptw.c
-@@ -XXX,XX +XXX,XX @@ void kvm_memory_listener_register(KVMState *s, KVMMemoryListener *kml,
+@@ -XXX,XX +XXX,XX @@ static bool pmsav7_use_background_region(ARMCPU *cpu, ARMMMUIdx mmu_idx,
-                                   AddressSpace *as, int as_id);
+     if (arm_feature(env, ARM_FEATURE_M)) {
- void kvm_set_max_memslot_size(hwaddr max_slot_size);
+         return env->v7m.mpu_ctrl[is_secure] & R_V7M_MPU_CTRL_PRIVDEFENA_MASK;
-+
+-    } else {
-+/**
+-        return regime_sctlr(env, mmu_idx) & SCTLR_BR;
-+ * kvm_hwpoison_page_add:
+     }
-+ *
++
-+ * Parameters:
++    if (mmu_idx == ARMMMUIdx_Stage2) {
-+ *  @ram_addr: the address in the RAM for the poisoned page
++        return false;
-+ *
++    }
-+ * Add a poisoned page to the list
++
-+ *
++    return regime_sctlr(env, mmu_idx) & SCTLR_BR;
 + * Return: None.
 + */
 +void kvm_hwpoison_page_add(ram_addr_t ram_addr);
  #endif
 diff --git a/accel/kvm/kvm-all.c b/accel/kvm/kvm-all.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/kvm/kvm-all.c
 +++ b/accel/kvm/kvm-all.c
@@ -XXX,XX +XXX,XX @@
  #include "qapi/visitor.h"
  #include "qapi/qapi-types-common.h"
  #include "qapi/qapi-visit-common.h"
 +#include "sysemu/reset.h"
  #include "hw/boards.h"
@@ -XXX,XX +XXX,XX @@ int kvm_vm_check_extension(KVMState *s, unsigned int extension)
      return ret;
  }
-+typedef struct HWPoisonPage {
+ static bool get_phys_addr_pmsav7(CPUARMState *env, uint32_t address,
-+    ram_addr_t ram_addr;
+@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_pmsav7(CPUARMState *env, uint32_t address,
-+    QLIST_ENTRY(HWPoisonPage) list;
+     return !(result->f.prot & (1 << access_type));
-+} HWPoisonPage;
+ }
-+
-+static QLIST_HEAD(, HWPoisonPage) hwpoison_page_list =
++static uint32_t *regime_rbar(CPUARMState *env, ARMMMUIdx mmu_idx,
-+    QLIST_HEAD_INITIALIZER(hwpoison_page_list);
++                             uint32_t secure)
 +
 +static void kvm_unpoison_all(void *param)
 +{
-+    HWPoisonPage *page, *next_page;
++    if (regime_el(env, mmu_idx) == 2) {
-+
++        return env->pmsav8.hprbar;
-+    QLIST_FOREACH_SAFE(page, &hwpoison_page_list, list, next_page) {
++    } else {
-+        QLIST_REMOVE(page, list);
++        return env->pmsav8.rbar[secure];
 +        qemu_ram_remap(page->ram_addr, TARGET_PAGE_SIZE);
 +        g_free(page);
 +    }
 +}
 +
-+void kvm_hwpoison_page_add(ram_addr_t ram_addr)
++static uint32_t *regime_rlar(CPUARMState *env, ARMMMUIdx mmu_idx,
 +                             uint32_t secure)
 +{
-+    HWPoisonPage *page;
++    if (regime_el(env, mmu_idx) == 2) {
-+
++        return env->pmsav8.hprlar;
-+    QLIST_FOREACH(page, &hwpoison_page_list, list) {
++    } else {
-+        if (page->ram_addr == ram_addr) {
++        return env->pmsav8.rlar[secure];
-+            return;
++    }
 +        }
 +    }
 +    page = g_new(HWPoisonPage, 1);
 +    page->ram_addr = ram_addr;
 +    QLIST_INSERT_HEAD(&hwpoison_page_list, page, list);
 +}
 +
- static uint32_t adjust_ioeventfd_endianness(uint32_t val, uint32_t size)
+ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
- {
+                        MMUAccessType access_type, ARMMMUIdx mmu_idx,
- #if defined(HOST_WORDS_BIGENDIAN) != defined(TARGET_WORDS_BIGENDIAN)
+                        bool secure, GetPhysAddrResult *result,
-@@ -XXX,XX +XXX,XX @@ static int kvm_init(MachineState *ms)
+@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
-         s->kernel_irqchip_split = mc->default_kernel_irqchip_split ? ON_OFF_AUTO_ON : ON_OFF_AUTO_OFF;
+     bool hit = false;
-     }
+     uint32_t addr_page_base = address & TARGET_PAGE_MASK;
+     uint32_t addr_page_limit = addr_page_base + (TARGET_PAGE_SIZE - 1);
-+    qemu_register_reset(kvm_unpoison_all, NULL);
++    int region_counter;
 +
-     if (s->kernel_irqchip_allowed) {
++    if (regime_el(env, mmu_idx) == 2) {
-         kvm_irqchip_create(s);
++        region_counter = cpu->pmsav8r_hdregion;
-     }
++    } else {
-diff --git a/target/i386/kvm.c b/target/i386/kvm.c
++        region_counter = cpu->pmsav7_dregion;
-index XXXXXXX..XXXXXXX 100644
++    }
---- a/target/i386/kvm.c
-+++ b/target/i386/kvm.c
+     result->f.lg_page_size = TARGET_PAGE_BITS;
-@@ -XXX,XX +XXX,XX @@
+     result->f.phys_addr = address;
- #include "sysemu/sysemu.h"
+@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
- #include "sysemu/hw_accel.h"
+         *mregion = -1;
- #include "sysemu/kvm_int.h"
+     }
--#include "sysemu/reset.h"
- #include "sysemu/runstate.h"
++    if (mmu_idx == ARMMMUIdx_Stage2) {
- #include "kvm_i386.h"
++        fi->stage2 = true;
- #include "hyperv.h"
++    }
-@@ -XXX,XX +XXX,XX @@ uint64_t kvm_arch_get_supported_msr_feature(KVMState *s, uint32_t index)
++
-     }
+     /*
       * Unlike the ARM ARM pseudocode, we don't need to check whether this
       * was an exception vector read from the vector table (which is always
@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
              hit = true;
          }
 -        for (n = (int)cpu->pmsav7_dregion - 1; n >= 0; n--) {
 +        uint32_t bitmask;
 +        if (arm_feature(env, ARM_FEATURE_M)) {
 +            bitmask = 0x1f;
 +        } else {
 +            bitmask = 0x3f;
 +            fi->level = 0;
 +        }
 +
 +        for (n = region_counter - 1; n >= 0; n--) {
              /* region search */
              /*
 -             * Note that the base address is bits [31:5] from the register
 -             * with bits [4:0] all zeroes, but the limit address is bits
 -             * [31:5] from the register with bits [4:0] all ones.
 +             * Note that the base address is bits [31:x] from the register
 +             * with bits [x-1:0] all zeroes, but the limit address is bits
 +             * [31:x] from the register with bits [x:0] all ones. Where x is
 +             * 5 for Cortex-M and 6 for Cortex-R
               */
 -            uint32_t base = env->pmsav8.rbar[secure][n] & ~0x1f;
 -            uint32_t limit = env->pmsav8.rlar[secure][n] | 0x1f;
 +            uint32_t base = regime_rbar(env, mmu_idx, secure)[n] & ~bitmask;
 +            uint32_t limit = regime_rlar(env, mmu_idx, secure)[n] | bitmask;
 -            if (!(env->pmsav8.rlar[secure][n] & 0x1)) {
 +            if (!(regime_rlar(env, mmu_idx, secure)[n] & 0x1)) {
                  /* Region disabled */
                  continue;
              }
@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
                   * PMSAv7 where highest-numbered-region wins)
                   */
                  fi->type = ARMFault_Permission;
 -                fi->level = 1;
 +                if (arm_feature(env, ARM_FEATURE_M)) {
 +                    fi->level = 1;
 +                }
                  return true;
              }
@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
      }
      if (!hit) {
 -        /* background fault */
 -        fi->type = ARMFault_Background;
 +        if (arm_feature(env, ARM_FEATURE_M)) {
 +            fi->type = ARMFault_Background;
 +        } else {
 +            fi->type = ARMFault_Permission;
 +        }
          return true;
      }
@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
          /* hit using the background region */
          get_phys_addr_pmsav7_default(env, mmu_idx, address, &result->f.prot);
      } else {
 -        uint32_t ap = extract32(env->pmsav8.rbar[secure][matchregion], 1, 2);
 -        uint32_t xn = extract32(env->pmsav8.rbar[secure][matchregion], 0, 1);
 +        uint32_t matched_rbar = regime_rbar(env, mmu_idx, secure)[matchregion];
 +        uint32_t matched_rlar = regime_rlar(env, mmu_idx, secure)[matchregion];
 +        uint32_t ap = extract32(matched_rbar, 1, 2);
 +        uint32_t xn = extract32(matched_rbar, 0, 1);
          bool pxn = false;
          if (arm_feature(env, ARM_FEATURE_V8_1M)) {
 -            pxn = extract32(env->pmsav8.rlar[secure][matchregion], 4, 1);
 +            pxn = extract32(matched_rlar, 4, 1);
          }
          if (m_is_system_region(env, address)) {
@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
              xn = 1;
          }
 -        result->f.prot = simple_ap_to_rw_prot(env, mmu_idx, ap);
 +        if (regime_el(env, mmu_idx) == 2) {
 +            result->f.prot = simple_ap_to_rw_prot_is_user(ap,
 +                                            mmu_idx != ARMMMUIdx_E2);
 +        } else {
 +            result->f.prot = simple_ap_to_rw_prot(env, mmu_idx, ap);
 +        }
 +
 +        if (!arm_feature(env, ARM_FEATURE_M)) {
 +            uint8_t attrindx = extract32(matched_rlar, 1, 3);
 +            uint64_t mair = env->cp15.mair_el[regime_el(env, mmu_idx)];
 +            uint8_t sh = extract32(matched_rlar, 3, 2);
 +
 +            if (regime_sctlr(env, mmu_idx) & SCTLR_WXN &&
 +                result->f.prot & PAGE_WRITE && mmu_idx != ARMMMUIdx_Stage2) {
 +                xn = 0x1;
 +            }
 +
 +            if ((regime_el(env, mmu_idx) == 1) &&
 +                regime_sctlr(env, mmu_idx) & SCTLR_UWXN && ap == 0x1) {
 +                pxn = 0x1;
 +            }
 +
 +            result->cacheattrs.is_s2_format = false;
 +            result->cacheattrs.attrs = extract64(mair, attrindx * 8, 8);
 +            result->cacheattrs.shareability = sh;
 +        }
 +
          if (result->f.prot && !xn && !(pxn && !is_user)) {
              result->f.prot |= PAGE_EXEC;
          }
 -        /*
 -         * We don't need to look the attribute up in the MAIR0/MAIR1
 -         * registers because that only tells us about cacheability.
 -         */
 +
          if (mregion) {
              *mregion = matchregion;
          }
      }
      fi->type = ARMFault_Permission;
 -    fi->level = 1;
 +    if (arm_feature(env, ARM_FEATURE_M)) {
 +        fi->level = 1;
 +    }
      return !(result->f.prot & (1 << access_type));
  }
--
+@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_twostage(CPUARMState *env, S1Translate *ptw,
--typedef struct HWPoisonPage {
+     cacheattrs1 = result->cacheattrs;
--    ram_addr_t ram_addr;
+     memset(result, 0, sizeof(*result));
--    QLIST_ENTRY(HWPoisonPage) list;
--} HWPoisonPage;
+-    ret = get_phys_addr_lpae(env, ptw, ipa, access_type, is_el0, result, fi);
--
++    if (arm_feature(env, ARM_FEATURE_PMSA)) {
--static QLIST_HEAD(, HWPoisonPage) hwpoison_page_list =
++        ret = get_phys_addr_pmsav8(env, ipa, access_type,
--    QLIST_HEAD_INITIALIZER(hwpoison_page_list);
++                                   ptw->in_mmu_idx, is_secure, result, fi);
--
++    } else {
--static void kvm_unpoison_all(void *param)
++        ret = get_phys_addr_lpae(env, ptw, ipa, access_type,
--{
++                                 is_el0, result, fi);
--    HWPoisonPage *page, *next_page;
++    }
--
+     fi->s2addr = ipa;
--    QLIST_FOREACH_SAFE(page, &hwpoison_page_list, list, next_page) {
--        QLIST_REMOVE(page, list);
+     /* Combine the S1 and S2 perms.  */
 -        qemu_ram_remap(page->ram_addr, TARGET_PAGE_SIZE);
 -        g_free(page);
 -    }
 -}
 -
 -static void kvm_hwpoison_page_add(ram_addr_t ram_addr)
 -{
 -    HWPoisonPage *page;
 -
 -    QLIST_FOREACH(page, &hwpoison_page_list, list) {
 -        if (page->ram_addr == ram_addr) {
 -            return;
 -        }
 -    }
 -    page = g_new(HWPoisonPage, 1);
 -    page->ram_addr = ram_addr;
 -    QLIST_INSERT_HEAD(&hwpoison_page_list, page, list);
 -}
 -
  static int kvm_get_mce_cap_supported(KVMState *s, uint64_t *mce_cap,
                                       int *max_banks)
  {
@@ -XXX,XX +XXX,XX @@ int kvm_arch_init(MachineState *ms, KVMState *s)
          fprintf(stderr, "e820_add_entry() table is full\n");
          return ret;
      }
 -    qemu_register_reset(kvm_unpoison_all, NULL);
      shadow_mem = object_property_get_int(OBJECT(s), "kvm-shadow-mem", &error_abort);
      if (shadow_mem != -1) {
 --
-.20.1
+.25.1

-[PULL 01/45] target/arm: Use correct GDB XML for M-profile cores
+[PULL 08/34] target/arm: Add ARM Cortex-R52 CPU
-GDB's remote protocol requires M-profile cores to use the feature
+From: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 name 'org.gnu.gdb.arm.m-profile' instead of the 'org.gnu.gdb.arm.core'
 feature used for A- and R-profile cores. We weren't doing this, which
 meant GDB treated our M-profile cores like A-profile ones. This mostly
 doesn't matter, but for instance means that it doesn't correctly
 handle backtraces where an M-profile exception frame is involved.
-Ship a copy of GDB's arm-m-profile.xml and use it on the M-profile
+All constants are taken from the ARM Cortex-R52 Processor TRM Revision: r1p3
 cores.  The integer registers have the same offsets as the
 arm-core.xml, but register 25 is the M-profile XPSR rather than the
 A-profile CPSR, so we need to update arm_cpu_gdb_read_register() and
 arm_cpu_gdb_write_register() to handle XSPR reads and writes.
-Fixes: https://bugs.launchpad.net/qemu/+bug/1877136
+Signed-off-by: Tobias Röhmel <tobias.roehmel@rwth-aachen.de>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20221206102504.165775-8-tobias.roehmel@rwth-aachen.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200507134755.13997-1-peter.maydell@linaro.org
 ---
- configure                 |  4 ++--
+ target/arm/cpu_tcg.c | 42 ++++++++++++++++++++++++++++++++++++++++++
- target/arm/cpu_tcg.c      |  1 +
+file changed, 42 insertions(+)
  target/arm/gdbstub.c      | 22 ++++++++++++++++++----
  gdb-xml/arm-m-profile.xml | 27 +++++++++++++++++++++++++++
 files changed, 48 insertions(+), 6 deletions(-)
  create mode 100644 gdb-xml/arm-m-profile.xml
-diff --git a/configure b/configure
-index XXXXXXX..XXXXXXX 100755
---- a/configure
-+++ b/configure
-@@ -XXX,XX +XXX,XX @@ case "$target_name" in
-     TARGET_SYSTBL_ABI=common,oabi
-     bflt="yes"
-     mttcg="yes"
--    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
-+    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
-   ;;
-   aarch64|aarch64_be)
-     TARGET_ARCH=aarch64
-     TARGET_BASE_ARCH=arm
-     bflt="yes"
-     mttcg="yes"
--    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
-+    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
-   ;;
-   cris)
-   ;;
 diff --git a/target/arm/cpu_tcg.c b/target/arm/cpu_tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu_tcg.c
 +++ b/target/arm/cpu_tcg.c
-@@ -XXX,XX +XXX,XX @@ static void arm_v7m_class_init(ObjectClass *oc, void *data)
+@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
- #endif
+     define_arm_cp_regs(cpu, cortexr5_cp_reginfo);
      cc->cpu_exec_interrupt = arm_v7m_cpu_exec_interrupt;
 +    cc->gdb_core_xml_file = "arm-m-profile.xml";
  }
- static const ARMCPUInfo arm_tcg_cpus[] = {
++static void cortex_r52_initfn(Object *obj)
-diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
++{
-index XXXXXXX..XXXXXXX 100644
++    ARMCPU *cpu = ARM_CPU(obj);
 --- a/target/arm/gdbstub.c
 +++ b/target/arm/gdbstub.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_read_register(CPUState *cs, GByteArray *mem_buf, int n)
          }
          return gdb_get_reg32(mem_buf, 0);
      case 25:
 -        /* CPSR */
 -        return gdb_get_reg32(mem_buf, cpsr_read(env));
 +        /* CPSR, or XPSR for M-profile */
 +        if (arm_feature(env, ARM_FEATURE_M)) {
 +            return gdb_get_reg32(mem_buf, xpsr_read(env));
 +        } else {
 +            return gdb_get_reg32(mem_buf, cpsr_read(env));
 +        }
      }
      /* Unknown register.  */
      return 0;
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
          }
          return 4;
      case 25:
 -        /* CPSR */
 -        cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
 +        /* CPSR, or XPSR for M-profile */
 +        if (arm_feature(env, ARM_FEATURE_M)) {
 +            /*
 +             * Don't allow writing to XPSR.Exception as it can cause
 +             * a transition into or out of handler mode (it's not
 +             * writeable via the MSR insn so this is a reasonable
 +             * restriction). Other fields are safe to update.
 +             */
 +            xpsr_write(env, tmp, ~XPSR_EXCP);
 +        } else {
 +            cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
 +        }
          return 4;
      }
      /* Unknown register.  */
 diff --git a/gdb-xml/arm-m-profile.xml b/gdb-xml/arm-m-profile.xml
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/gdb-xml/arm-m-profile.xml
@@ -XXX,XX +XXX,XX @@
 +<?xml version="1.0"?>
 +<!-- Copyright (C) 2010-2020 Free Software Foundation, Inc.
 +
-+     Copying and distribution of this file, with or without modification,
++    set_feature(&cpu->env, ARM_FEATURE_V8);
-+     are permitted in any medium without royalty provided the copyright
++    set_feature(&cpu->env, ARM_FEATURE_EL2);
-+     notice and this notice are preserved.  -->
++    set_feature(&cpu->env, ARM_FEATURE_PMSA);
 +    set_feature(&cpu->env, ARM_FEATURE_NEON);
 +    set_feature(&cpu->env, ARM_FEATURE_GENERIC_TIMER);
 +    cpu->midr = 0x411fd133; /* r1p3 */
 +    cpu->revidr = 0x00000000;
 +    cpu->reset_fpsid = 0x41034023;
 +    cpu->isar.mvfr0 = 0x10110222;
 +    cpu->isar.mvfr1 = 0x12111111;
 +    cpu->isar.mvfr2 = 0x00000043;
 +    cpu->ctr = 0x8144c004;
 +    cpu->reset_sctlr = 0x30c50838;
 +    cpu->isar.id_pfr0 = 0x00000131;
 +    cpu->isar.id_pfr1 = 0x10111001;
 +    cpu->isar.id_dfr0 = 0x03010006;
 +    cpu->id_afr0 = 0x00000000;
 +    cpu->isar.id_mmfr0 = 0x00211040;
 +    cpu->isar.id_mmfr1 = 0x40000000;
 +    cpu->isar.id_mmfr2 = 0x01200000;
 +    cpu->isar.id_mmfr3 = 0xf0102211;
 +    cpu->isar.id_mmfr4 = 0x00000010;
 +    cpu->isar.id_isar0 = 0x02101110;
 +    cpu->isar.id_isar1 = 0x13112111;
 +    cpu->isar.id_isar2 = 0x21232142;
 +    cpu->isar.id_isar3 = 0x01112131;
 +    cpu->isar.id_isar4 = 0x00010142;
 +    cpu->isar.id_isar5 = 0x00010001;
 +    cpu->isar.dbgdidr = 0x77168000;
 +    cpu->clidr = (1 << 27) | (1 << 24) | 0x3;
 +    cpu->ccsidr[0] = 0x700fe01a; /* 32KB L1 dcache */
 +    cpu->ccsidr[1] = 0x201fe00a; /* 32KB L1 icache */
 +
-+<!DOCTYPE feature SYSTEM "gdb-target.dtd">
++    cpu->pmsav7_dregion = 16;
-+<feature name="org.gnu.gdb.arm.m-profile">
++    cpu->pmsav8r_hdregion = 16;
-+  <reg name="r0" bitsize="32"/>
++}
-+  <reg name="r1" bitsize="32"/>
++
-+  <reg name="r2" bitsize="32"/>
+ static void cortex_r5f_initfn(Object *obj)
-+  <reg name="r3" bitsize="32"/>
+ {
-+  <reg name="r4" bitsize="32"/>
+     ARMCPU *cpu = ARM_CPU(obj);
-+  <reg name="r5" bitsize="32"/>
+@@ -XXX,XX +XXX,XX @@ static const ARMCPUInfo arm_tcg_cpus[] = {
-+  <reg name="r6" bitsize="32"/>
+                              .class_init = arm_v7m_class_init },
-+  <reg name="r7" bitsize="32"/>
+     { .name = "cortex-r5",   .initfn = cortex_r5_initfn },
-+  <reg name="r8" bitsize="32"/>
+     { .name = "cortex-r5f",  .initfn = cortex_r5f_initfn },
-+  <reg name="r9" bitsize="32"/>
++    { .name = "cortex-r52",  .initfn = cortex_r52_initfn },
-+  <reg name="r10" bitsize="32"/>
+     { .name = "ti925t",      .initfn = ti925t_initfn },
-+  <reg name="r11" bitsize="32"/>
+     { .name = "sa1100",      .initfn = sa1100_initfn },
-+  <reg name="r12" bitsize="32"/>
+     { .name = "sa1110",      .initfn = sa1110_initfn },
 +  <reg name="sp" bitsize="32" type="data_ptr"/>
 +  <reg name="lr" bitsize="32"/>
 +  <reg name="pc" bitsize="32" type="code_ptr"/>
 +  <reg name="xpsr" bitsize="32" regnum="25"/>
 +</feature>
 --
-.20.1
+.25.1

-[PULL 05/45] target/arm: Remove unnecessary range check for VSHL
+[PULL 09/34] target/arm: fix handling of HLT semihosting in system mode
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Alex Bennée <alex.bennee@linaro.org>
-In 1dc8425e551, while converting to gvec, I added an extra range check
+The check semihosting_enabled() wants to know if the guest is
-against the shift count.  This was unnecessary because the encoding of
+currently in user mode. Unlike the other cases the test was inverted
-the shift count produces 0 to the element size - 1.
+causing us to block semihosting calls in non-EL0 modes.
+Cc: qemu-stable@nongnu.org
+Fixes: 19b26317e9 (target/arm: Honour -semihosting-config userspace=on)
+Signed-off-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.c | 12 ++----------
+ target/arm/translate.c | 2 +-
-file changed, 2 insertions(+), 10 deletions(-)
+file changed, 1 insertion(+), 1 deletion(-)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static inline void gen_hlt(DisasContext *s, int imm)
-                         gen_gvec_sli(size, rd_ofs, rm_ofs, shift,
+      * semihosting, to provide some semblance of security
-                                      vec_size, vec_size);
+      * (and for consistency with our 32-bit semihosting).
-                     } else { /* VSHL */
+      */
--                        /* Shifts larger than the element size are
+-    if (semihosting_enabled(s->current_el != 0) &&
--                         * architecturally valid and results in zero.
++    if (semihosting_enabled(s->current_el == 0) &&
--                         */
+         (imm == (s->thumb ? 0x3c : 0xf000))) {
--                        if (shift >= 8 << size) {
+         gen_exception_internal_insn(s, EXCP_SEMIHOST);
--                            tcg_gen_gvec_dup_imm(size, rd_ofs,
+         return;
 -                                                 vec_size, vec_size, 0);
 -                        } else {
 -                            tcg_gen_gvec_shli(size, rd_ofs, rm_ofs, shift,
 -                                              vec_size, vec_size);
 -                        }
 +                        tcg_gen_gvec_shli(size, rd_ofs, rm_ofs, shift,
 +                                          vec_size, vec_size);
                      }
                      return 0;
                  }
 --
-.20.1
+.25.1

-[PULL 02/45] target/arm: Create gen_gvec_[us]sra
+[PULL 10/34] hw/timer/imx_epit: improve comments
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Axel Heider <axel.heider@hensoldt.net>
-The functions eliminate duplication of the special cases for
+Fix typos, add background information
 this operation.  They match up with the GVecGen2iFn typedef.
-Add out-of-line helpers.  We got away with only having inline
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
 expanders because the neon vector size is only 16 bytes, and
 we know that the inline expansion will always succeed.
 When we reuse this for SVE, tcg-gvec-op may decide to use an
 out-of-line helper due to longer vector lengths.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-2-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  10 +++
+ hw/timer/imx_epit.c | 20 ++++++++++++++++----
- target/arm/translate.h     |   7 +-
+file changed, 16 insertions(+), 4 deletions(-)
  target/arm/translate-a64.c |  15 +---
  target/arm/translate.c     | 161 ++++++++++++++++++++++---------------
  target/arm/vec_helper.c    |  25 ++++++
 files changed, 139 insertions(+), 79 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/timer/imx_epit.c
-+++ b/target/arm/helper.h
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_set_freq(IMXEPITState *s)
+     }
  DEF_HELPER_FLAGS_4(neon_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_ssra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_ssra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_ssra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_ssra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_3(gvec_usra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_usra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_usra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_usra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.h
 +++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ extern const GVecGen3 mls_op[4];
  extern const GVecGen3 cmtst_op[4];
  extern const GVecGen3 sshl_op[4];
  extern const GVecGen3 ushl_op[4];
 -extern const GVecGen2i ssra_op[4];
 -extern const GVecGen2i usra_op[4];
  extern const GVecGen2i sri_op[4];
  extern const GVecGen2i sli_op[4];
  extern const GVecGen4 uqadd_op[4];
@@ -XXX,XX +XXX,XX @@ void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
  void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
  void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
 +void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
      switch (opcode) {
      case 0x02: /* SSRA / USRA (accumulate) */
 -        if (is_u) {
 -            /* Shift count same as element size produces zero to add.  */
 -            if (shift == 8 << size) {
 -                goto done;
 -            }
 -            gen_gvec_op2i(s, is_q, rd, rn, shift, &usra_op[size]);
 -        } else {
 -            /* Shift count same as element size produces all sign to add.  */
 -            if (shift == 8 << size) {
 -                shift -= 1;
 -            }
 -            gen_gvec_op2i(s, is_q, rd, rn, shift, &ssra_op[size]);
 -        }
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 +                      is_u ? gen_gvec_usra : gen_gvec_ssra, size);
          return;
      case 0x08: /* SRI */
          /* Shift count same as element size is valid but does nothing.  */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_ssra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
      tcg_gen_add_vec(vece, d, d, a);
  }
--static const TCGOpcode vecop_list_ssra[] = {
++/*
--    INDEX_op_sari_vec, INDEX_op_add_vec, 0
++ * This is called both on hardware (device) reset and software reset.
--};
++ */
-+void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+ static void imx_epit_reset(DeviceState *dev)
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz)
+ {
-+{
+     IMXEPITState *s = IMX_EPIT(dev);
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sari_vec, INDEX_op_add_vec, 0
+-    /*
-+    };
+-     * Soft reset doesn't touch some bits; hard reset clears them
-+    static const GVecGen2i ops[4] = {
+-     */
-+        { .fni8 = gen_ssra8_i64,
++    /* Soft reset doesn't touch some bits; hard reset clears them */
-+          .fniv = gen_ssra_vec,
+     s->cr &= (CR_EN|CR_ENMOD|CR_STOPEN|CR_DOZEN|CR_WAITEN|CR_DBGEN);
-+          .fno = gen_helper_gvec_ssra_b,
+     s->sr = 0;
-+          .load_dest = true,
+     s->lr = EPIT_TIMER_MAX;
-+          .opt_opc = vecop_list,
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_write(void *opaque, hwaddr offset, uint64_t value,
-+          .vece = MO_8 },
+         ptimer_transaction_begin(s->timer_cmp);
-+        { .fni8 = gen_ssra16_i64,
+         ptimer_transaction_begin(s->timer_reload);
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_h,
++        /* Update the frequency. Has been done already in case of a reset. */
-+          .load_dest = true,
+         if (!(s->cr & CR_SWR)) {
-+          .opt_opc = vecop_list,
+             imx_epit_set_freq(s);
-+          .vece = MO_16 },
+         }
-+        { .fni4 = gen_ssra32_i32,
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_write(void *opaque, hwaddr offset, uint64_t value,
-+          .fniv = gen_ssra_vec,
+         break;
-+          .fno = gen_helper_gvec_ssra_s,
-+          .load_dest = true,
+     case 1: /* SR - ACK*/
-+          .opt_opc = vecop_list,
+-        /* writing 1 to OCIF clear the OCIF bit */
-+          .vece = MO_32 },
++        /* writing 1 to OCIF clears the OCIF bit */
-+        { .fni8 = gen_ssra64_i64,
+         if (value & 0x01) {
-+          .fniv = gen_ssra_vec,
+             s->sr = 0;
-+          .fno = gen_helper_gvec_ssra_b,
+             imx_epit_update_int(s);
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_realize(DeviceState *dev, Error **errp)
-+          .opt_opc = vecop_list,
+x00001000);
-+          .load_dest = true,
+     sysbus_init_mmio(sbd, &s->iomem);
-+          .vece = MO_64 },
 +    };
 -const GVecGen2i ssra_op[4] = {
 -    { .fni8 = gen_ssra8_i64,
 -      .fniv = gen_ssra_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_ssra,
 -      .vece = MO_8 },
 -    { .fni8 = gen_ssra16_i64,
 -      .fniv = gen_ssra_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_ssra,
 -      .vece = MO_16 },
 -    { .fni4 = gen_ssra32_i32,
 -      .fniv = gen_ssra_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_ssra,
 -      .vece = MO_32 },
 -    { .fni8 = gen_ssra64_i64,
 -      .fniv = gen_ssra_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .opt_opc = vecop_list_ssra,
 -      .load_dest = true,
 -      .vece = MO_64 },
 -};
 +    /* tszimm encoding produces immediates in the range [1..esize]. */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    /*
-+     * Shifts larger than the element size are architecturally valid.
++     * The reload timer keeps running when the peripheral is enabled. It is a
-+     * Signed results in all sign bits.
++     * kind of wall clock that does not generate any interrupts. The callback
 +     * needs to be provided, but it does nothing as the ptimer already supports
 +     * all necessary reloading functionality.
 +     */
-+    shift = MIN(shift, (8 << vece) - 1);
+     s->timer_reload = ptimer_init(imx_epit_reload, s, PTIMER_POLICY_LEGACY);
-+    tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+}
++    /*
++     * The compare timer is running only when the peripheral configuration is
- static void gen_usra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
++     * in a state that will generate compare interrupts.
- {
++     */
-@@ -XXX,XX +XXX,XX @@ static void gen_usra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
+     s->timer_cmp = ptimer_init(imx_epit_cmp, s, PTIMER_POLICY_LEGACY);
      tcg_gen_add_vec(vece, d, d, a);
  }
--static const TCGOpcode vecop_list_usra[] = {
--    INDEX_op_shri_vec, INDEX_op_add_vec, 0
--};
-+void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_shri_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen2i ops[4] = {
-+        { .fni8 = gen_usra8_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8, },
-+        { .fni8 = gen_usra16_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16, },
-+        { .fni4 = gen_usra32_i32,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32, },
-+        { .fni8 = gen_usra64_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64, },
-+    };
--const GVecGen2i usra_op[4] = {
--    { .fni8 = gen_usra8_i64,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_8, },
--    { .fni8 = gen_usra16_i64,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_16, },
--    { .fni4 = gen_usra32_i32,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_32, },
--    { .fni8 = gen_usra64_i64,
--      .fniv = gen_usra_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_64, },
--};
-+    /* tszimm encoding produces immediates in the range [1..esize]. */
-+    tcg_debug_assert(shift > 0);
-+    tcg_debug_assert(shift <= (8 << vece));
-+
-+    /*
-+     * Shifts larger than the element size are architecturally valid.
-+     * Unsigned results in all zeros as input to accumulate: nop.
-+     */
-+    if (shift < (8 << vece)) {
-+        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+    } else {
-+        /* Nop, but we do need to clear the tail. */
-+        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
-+    }
-+}
- static void gen_shr8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 case 1:  /* VSRA */
-                     /* Right shift comes here negative.  */
-                     shift = -shift;
--                    /* Shifts larger than the element size are architecturally
--                     * valid.  Unsigned results in all zeros; signed results
--                     * in all sign bits.
--                     */
--                    if (!u) {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        MIN(shift, (8 << size) - 1),
--                                        &ssra_op[size]);
--                    } else if (shift >= 8 << size) {
--                        /* rd += 0 */
-+                    if (u) {
-+                        gen_gvec_usra(size, rd_ofs, rm_ofs, shift,
-+                                      vec_size, vec_size);
-                     } else {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        shift, &usra_op[size]);
-+                        gen_gvec_ssra(size, rd_ofs, rm_ofs, shift,
-+                                      vec_size, vec_size);
-                     }
-                     return 0;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_sqsub_d)(void *vd, void *vq, void *vn,
-     clear_tail(d, oprsz, simd_maxsz(desc));
- }
-+
-+#define DO_SRA(NAME, TYPE)                              \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        d[i] += n[i] >> shift;                          \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_SRA(gvec_ssra_b, int8_t)
-+DO_SRA(gvec_ssra_h, int16_t)
-+DO_SRA(gvec_ssra_s, int32_t)
-+DO_SRA(gvec_ssra_d, int64_t)
-+
-+DO_SRA(gvec_usra_b, uint8_t)
-+DO_SRA(gvec_usra_h, uint16_t)
-+DO_SRA(gvec_usra_s, uint32_t)
-+DO_SRA(gvec_usra_d, uint64_t)
-+
-+#undef DO_SRA
-+
- /*
-  * Convert float16 to float32, raising no exceptions and
-  * preserving exceptional values, including SNaN.
 --
-.20.1
+.25.1

-[PULL 10/45] target/arm: Create gen_gvec_{cmtst,ushl,sshl}
+[PULL 11/34] hw/timer/imx_epit: cleanup CR defines
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Axel Heider <axel.heider@hensoldt.net>
-Provide a functional interface for the vector expansion.
+remove unused defines, add needed defines
 This fits better with the existing set of helpers that
 we provide for other operations.
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-10-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.h          |  10 ++-
+ include/hw/timer/imx_epit.h | 4 ++--
- target/arm/translate-a64.c      |  18 ++--
+ hw/timer/imx_epit.c         | 4 ++--
- target/arm/translate-neon.inc.c |  23 +----
+files changed, 4 insertions(+), 4 deletions(-)
  target/arm/translate.c          | 146 +++++++++++++++++---------------
 files changed, 95 insertions(+), 102 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+diff --git a/include/hw/timer/imx_epit.h b/include/hw/timer/imx_epit.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/include/hw/timer/imx_epit.h
-+++ b/target/arm/translate.h
++++ b/include/hw/timer/imx_epit.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+@@ -XXX,XX +XXX,XX @@
- void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ #define CR_OCIEN    (1 << 2)
-                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
+ #define CR_RLD      (1 << 3)
+ #define CR_PRESCALE_SHIFT (4)
--extern const GVecGen3 cmtst_op[4];
+-#define CR_PRESCALE_MASK  (0xfff)
--extern const GVecGen3 sshl_op[4];
++#define CR_PRESCALE_BITS  (12)
--extern const GVecGen3 ushl_op[4];
+ #define CR_SWR      (1 << 16)
-+void gen_gvec_cmtst(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ #define CR_IOVW     (1 << 17)
-+                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
+ #define CR_DBGEN    (1 << 18)
-+void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+@@ -XXX,XX +XXX,XX @@
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
+ #define CR_DOZEN    (1 << 20)
-+void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ #define CR_STOPEN   (1 << 21)
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
+ #define CR_CLKSRC_SHIFT (24)
-+
+-#define CR_CLKSRC_MASK  (0x3 << CR_CLKSRC_SHIFT)
- extern const GVecGen4 uqadd_op[4];
++#define CR_CLKSRC_BITS  (2)
- extern const GVecGen4 sqadd_op[4];
- extern const GVecGen4 uqsub_op[4];
+ #define EPIT_TIMER_MAX  0XFFFFFFFFUL
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/timer/imx_epit.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn4(DisasContext *s, bool is_q, int rd, int rn, int rm,
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_set_freq(IMXEPITState *s)
-             is_q ? 16 : 8, vec_full_reg_size(s));
+     uint32_t clksrc;
- }
+     uint32_t prescaler;
--/* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
+-    clksrc = extract32(s->cr, CR_CLKSRC_SHIFT, 2);
--static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
+-    prescaler = 1 + extract32(s->cr, CR_PRESCALE_SHIFT, 12);
--                         int rn, int rm, const GVecGen3 *gvec_op)
++    clksrc = extract32(s->cr, CR_CLKSRC_SHIFT, CR_CLKSRC_BITS);
--{
++    prescaler = 1 + extract32(s->cr, CR_PRESCALE_SHIFT, CR_PRESCALE_BITS);
--    tcg_gen_gvec_3(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
--                   vec_full_reg_offset(s, rm), is_q ? 16 : 8,
+     s->freq = imx_ccm_get_clock_frequency(s->ccm,
--                   vec_full_reg_size(s), gvec_op);
+                                 imx_epit_clocks[clksrc]) / prescaler;
 -}
 -
  /* Expand a 3-operand operation using an out-of-line helper.  */
  static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
                               int rn, int rm, int data, gen_helper_gvec_3 *fn)
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                         (u ? uqsub_op : sqsub_op) + size);
          return;
      case 0x08: /* SSHL, USHL */
 -        gen_gvec_op3(s, is_q, rd, rn, rm,
 -                     u ? &ushl_op[size] : &sshl_op[size]);
 +        if (u) {
 +            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_ushl, size);
 +        } else {
 +            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sshl, size);
 +        }
          return;
      case 0x0c: /* SMAX, UMAX */
          if (u) {
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
          return;
      case 0x11:
          if (!u) { /* CMTST */
 -            gen_gvec_op3(s, is_q, rd, rn, rm, &cmtst_op[size]);
 +            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_cmtst, size);
              return;
          }
          /* else CMEQ */
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME(VBIC, tcg_gen_gvec_andc)
  DO_3SAME(VORR, tcg_gen_gvec_or)
  DO_3SAME(VORN, tcg_gen_gvec_orc)
  DO_3SAME(VEOR, tcg_gen_gvec_xor)
 +DO_3SAME(VSHL_S, gen_gvec_sshl)
 +DO_3SAME(VSHL_U, gen_gvec_ushl)
  /* These insns are all gvec_bitsel but with the inputs in various orders. */
  #define DO_3SAME_BITSEL(INSN, O1, O2, O3)                               \
@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMIN_U, tcg_gen_gvec_umin)
  DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
  DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
  DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
 +DO_3SAME_NO_SZ_3(VTST, gen_gvec_cmtst)
  #define DO_3SAME_CMP(INSN, COND)                                        \
      static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
@@ -XXX,XX +XXX,XX @@ DO_3SAME_CMP(VCGE_S, TCG_COND_GE)
  DO_3SAME_CMP(VCGE_U, TCG_COND_GEU)
  DO_3SAME_CMP(VCEQ, TCG_COND_EQ)
 -static void gen_VTST_3s(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 -                         uint32_t rm_ofs, uint32_t oprsz, uint32_t maxsz)
 -{
 -    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &cmtst_op[vece]);
 -}
 -DO_3SAME_NO_SZ_3(VTST, gen_VTST_3s)
 -
  #define DO_3SAME_GVEC4(INSN, OPARRAY)                                   \
      static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
                                  uint32_t rn_ofs, uint32_t rm_ofs,       \
@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
      }
      return do_3same(s, a, gen_VMUL_p_3s);
  }
 -
 -#define DO_3SAME_GVEC3_SHIFT(INSN, OPARRAY)                             \
 -    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 -                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 -                                uint32_t oprsz, uint32_t maxsz)         \
 -    {                                                                   \
 -        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
 -                       oprsz, maxsz, &OPARRAY[vece]);                   \
 -    }                                                                   \
 -    DO_3SAME(INSN, gen_##INSN##_3s)
 -
 -DO_3SAME_GVEC3_SHIFT(VSHL_S, sshl_op)
 -DO_3SAME_GVEC3_SHIFT(VSHL_U, ushl_op)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_cmtst_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
      tcg_gen_cmp_vec(TCG_COND_NE, vece, d, d, a);
  }
 -static const TCGOpcode vecop_list_cmtst[] = { INDEX_op_cmp_vec, 0 };
 -
 -const GVecGen3 cmtst_op[4] = {
 -    { .fni4 = gen_helper_neon_tst_u8,
 -      .fniv = gen_cmtst_vec,
 -      .opt_opc = vecop_list_cmtst,
 -      .vece = MO_8 },
 -    { .fni4 = gen_helper_neon_tst_u16,
 -      .fniv = gen_cmtst_vec,
 -      .opt_opc = vecop_list_cmtst,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cmtst_i32,
 -      .fniv = gen_cmtst_vec,
 -      .opt_opc = vecop_list_cmtst,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cmtst_i64,
 -      .fniv = gen_cmtst_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .opt_opc = vecop_list_cmtst,
 -      .vece = MO_64 },
 -};
 +void gen_gvec_cmtst(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = { INDEX_op_cmp_vec, 0 };
 +    static const GVecGen3 ops[4] = {
 +        { .fni4 = gen_helper_neon_tst_u8,
 +          .fniv = gen_cmtst_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni4 = gen_helper_neon_tst_u16,
 +          .fniv = gen_cmtst_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_cmtst_i32,
 +          .fniv = gen_cmtst_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_cmtst_i64,
 +          .fniv = gen_cmtst_vec,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
  void gen_ushl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
  {
@@ -XXX,XX +XXX,XX @@ static void gen_ushl_vec(unsigned vece, TCGv_vec dst,
      tcg_temp_free_vec(rsh);
  }
 -static const TCGOpcode ushl_list[] = {
 -    INDEX_op_neg_vec, INDEX_op_shlv_vec,
 -    INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
 -};
 -
 -const GVecGen3 ushl_op[4] = {
 -    { .fniv = gen_ushl_vec,
 -      .fno = gen_helper_gvec_ushl_b,
 -      .opt_opc = ushl_list,
 -      .vece = MO_8 },
 -    { .fniv = gen_ushl_vec,
 -      .fno = gen_helper_gvec_ushl_h,
 -      .opt_opc = ushl_list,
 -      .vece = MO_16 },
 -    { .fni4 = gen_ushl_i32,
 -      .fniv = gen_ushl_vec,
 -      .opt_opc = ushl_list,
 -      .vece = MO_32 },
 -    { .fni8 = gen_ushl_i64,
 -      .fniv = gen_ushl_vec,
 -      .opt_opc = ushl_list,
 -      .vece = MO_64 },
 -};
 +void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_neg_vec, INDEX_op_shlv_vec,
 +        INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_ushl_vec,
 +          .fno = gen_helper_gvec_ushl_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fniv = gen_ushl_vec,
 +          .fno = gen_helper_gvec_ushl_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_ushl_i32,
 +          .fniv = gen_ushl_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_ushl_i64,
 +          .fniv = gen_ushl_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
  void gen_sshl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
  {
@@ -XXX,XX +XXX,XX @@ static void gen_sshl_vec(unsigned vece, TCGv_vec dst,
      tcg_temp_free_vec(tmp);
  }
 -static const TCGOpcode sshl_list[] = {
 -    INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
 -    INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
 -};
 -
 -const GVecGen3 sshl_op[4] = {
 -    { .fniv = gen_sshl_vec,
 -      .fno = gen_helper_gvec_sshl_b,
 -      .opt_opc = sshl_list,
 -      .vece = MO_8 },
 -    { .fniv = gen_sshl_vec,
 -      .fno = gen_helper_gvec_sshl_h,
 -      .opt_opc = sshl_list,
 -      .vece = MO_16 },
 -    { .fni4 = gen_sshl_i32,
 -      .fniv = gen_sshl_vec,
 -      .opt_opc = sshl_list,
 -      .vece = MO_32 },
 -    { .fni8 = gen_sshl_i64,
 -      .fniv = gen_sshl_vec,
 -      .opt_opc = sshl_list,
 -      .vece = MO_64 },
 -};
 +void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
 +        INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_sshl_vec,
 +          .fno = gen_helper_gvec_sshl_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fniv = gen_sshl_vec,
 +          .fno = gen_helper_gvec_sshl_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_sshl_i32,
 +          .fniv = gen_sshl_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_sshl_i64,
 +          .fniv = gen_sshl_vec,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
  static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
                            TCGv_vec a, TCGv_vec b)
 --
-.20.1
+.25.1

-[PULL 07/45] target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
+[PULL 12/34] hw/timer/imx_epit: define SR_OCIF
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Axel Heider <axel.heider@hensoldt.net>
 Provide a functional interface for the vector expansion.
 This fits better with the existing set of helpers that
 we provide for other operations.
 Macro-ize the 5 nearly identical comparisons.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-7-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.h     |  16 ++-
+ include/hw/timer/imx_epit.h |  2 ++
- target/arm/translate-a64.c |  22 ++--
+ hw/timer/imx_epit.c         | 12 ++++++------
- target/arm/translate.c     | 254 ++++++++-----------------------------
+files changed, 8 insertions(+), 6 deletions(-)
 files changed, 74 insertions(+), 218 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+diff --git a/include/hw/timer/imx_epit.h b/include/hw/timer/imx_epit.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/include/hw/timer/imx_epit.h
-+++ b/target/arm/translate.h
++++ b/include/hw/timer/imx_epit.h
-@@ -XXX,XX +XXX,XX @@ static inline void gen_swstep_exception(DisasContext *s, int isv, int ex)
+@@ -XXX,XX +XXX,XX @@
- uint64_t vfp_expand_imm(int size, uint8_t imm8);
+ #define CR_CLKSRC_SHIFT (24)
+ #define CR_CLKSRC_BITS  (2)
- /* Vector operations shared between ARM and AArch64.  */
--extern const GVecGen2 ceq0_op[4];
++#define SR_OCIF     (1 << 0)
 -extern const GVecGen2 clt0_op[4];
 -extern const GVecGen2 cgt0_op[4];
 -extern const GVecGen2 cle0_op[4];
 -extern const GVecGen2 cge0_op[4];
 +void gen_gvec_ceq0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_clt0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cgt0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cle0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cge0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +
- extern const GVecGen3 mla_op[4];
+ #define EPIT_TIMER_MAX  0XFFFFFFFFUL
- extern const GVecGen3 mls_op[4];
- extern const GVecGen3 cmtst_op[4];
+ #define TYPE_IMX_EPIT "imx.epit"
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/timer/imx_epit.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn4(DisasContext *s, bool is_q, int rd, int rn, int rm,
+@@ -XXX,XX +XXX,XX @@ static const IMXClk imx_epit_clocks[] =  {
-             is_q ? 16 : 8, vec_full_reg_size(s));
+  */
- }
+ static void imx_epit_update_int(IMXEPITState *s)
+ {
--/* Expand a 2-operand AdvSIMD vector operation using an op descriptor. */
+-    if (s->sr && (s->cr & CR_OCIEN) && (s->cr & CR_EN)) {
--static void gen_gvec_op2(DisasContext *s, bool is_q, int rd,
++    if ((s->sr & SR_OCIF) && (s->cr & CR_OCIEN) && (s->cr & CR_EN)) {
--                         int rn, const GVecGen2 *gvec_op)
+         qemu_irq_raise(s->irq);
--{
+     } else {
--    tcg_gen_gvec_2(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
+         qemu_irq_lower(s->irq);
--                   is_q ? 16 : 8, vec_full_reg_size(s), gvec_op);
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_write(void *opaque, hwaddr offset, uint64_t value,
--}
+         break;
--
- /* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
+     case 1: /* SR - ACK*/
- static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
+-        /* writing 1 to OCIF clears the OCIF bit */
-                          int rn, int rm, const GVecGen3 *gvec_op)
+-        if (value & 0x01) {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
+-            s->sr = 0;
 +        /* writing 1 to SR.OCIF clears this bit and turns the interrupt off */
 +        if (value & SR_OCIF) {
 +            s->sr = 0; /* SR.OCIF is the only bit in this register anyway */
              imx_epit_update_int(s);
          }
          break;
-     case 0x8: /* CMGT, CMGE */
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_cmp(void *opaque)
--        gen_gvec_op2(s, is_q, rd, rn, u ? &cge0_op[size] : &cgt0_op[size]);
+     IMXEPITState *s = IMX_EPIT(opaque);
-+        if (u) {
-+            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
+     DPRINTF("sr was %d\n", s->sr);
-+        } else {
+-
-+            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cgt0, size);
+-    s->sr = 1;
-+        }
++    /* Set interrupt status bit SR.OCIF and update the interrupt state */
-         return;
++    s->sr |= SR_OCIF;
-     case 0x9: /* CMEQ, CMLE */
+     imx_epit_update_int(s);
 -        gen_gvec_op2(s, is_q, rd, rn, u ? &cle0_op[size] : &ceq0_op[size]);
 +        if (u) {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cle0, size);
 +        } else {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_ceq0, size);
 +        }
          return;
      case 0xa: /* CMLT */
 -        gen_gvec_op2(s, is_q, rd, rn, &clt0_op[size]);
 +        gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
          return;
      case 0xb:
          if (u) { /* ABS, NEG */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int do_v81_helper(DisasContext *s, gen_helper_gvec_3_ptr *fn,
      return 1;
  }
--static void gen_ceq0_i32(TCGv_i32 d, TCGv_i32 a)
--{
--    tcg_gen_setcondi_i32(TCG_COND_EQ, d, a, 0);
--    tcg_gen_neg_i32(d, d);
--}
--
--static void gen_ceq0_i64(TCGv_i64 d, TCGv_i64 a)
--{
--    tcg_gen_setcondi_i64(TCG_COND_EQ, d, a, 0);
--    tcg_gen_neg_i64(d, d);
--}
--
--static void gen_ceq0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
--{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
--    tcg_gen_cmp_vec(TCG_COND_EQ, vece, d, a, zero);
--    tcg_temp_free_vec(zero);
--}
-+#define GEN_CMP0(NAME, COND)                                            \
-+    static void gen_##NAME##0_i32(TCGv_i32 d, TCGv_i32 a)               \
-+    {                                                                   \
-+        tcg_gen_setcondi_i32(COND, d, a, 0);                            \
-+        tcg_gen_neg_i32(d, d);                                          \
-+    }                                                                   \
-+    static void gen_##NAME##0_i64(TCGv_i64 d, TCGv_i64 a)               \
-+    {                                                                   \
-+        tcg_gen_setcondi_i64(COND, d, a, 0);                            \
-+        tcg_gen_neg_i64(d, d);                                          \
-+    }                                                                   \
-+    static void gen_##NAME##0_vec(unsigned vece, TCGv_vec d, TCGv_vec a) \
-+    {                                                                   \
-+        TCGv_vec zero = tcg_const_zeros_vec_matching(d);                \
-+        tcg_gen_cmp_vec(COND, vece, d, a, zero);                        \
-+        tcg_temp_free_vec(zero);                                        \
-+    }                                                                   \
-+    void gen_gvec_##NAME##0(unsigned vece, uint32_t d, uint32_t m,      \
-+                            uint32_t opr_sz, uint32_t max_sz)           \
-+    {                                                                   \
-+        const GVecGen2 op[4] = {                                        \
-+            { .fno = gen_helper_gvec_##NAME##0_b,                       \
-+              .fniv = gen_##NAME##0_vec,                                \
-+              .opt_opc = vecop_list_cmp,                                \
-+              .vece = MO_8 },                                           \
-+            { .fno = gen_helper_gvec_##NAME##0_h,                       \
-+              .fniv = gen_##NAME##0_vec,                                \
-+              .opt_opc = vecop_list_cmp,                                \
-+              .vece = MO_16 },                                          \
-+            { .fni4 = gen_##NAME##0_i32,                                \
-+              .fniv = gen_##NAME##0_vec,                                \
-+              .opt_opc = vecop_list_cmp,                                \
-+              .vece = MO_32 },                                          \
-+            { .fni8 = gen_##NAME##0_i64,                                \
-+              .fniv = gen_##NAME##0_vec,                                \
-+              .opt_opc = vecop_list_cmp,                                \
-+              .prefer_i64 = TCG_TARGET_REG_BITS == 64,                  \
-+              .vece = MO_64 },                                          \
-+        };                                                              \
-+        tcg_gen_gvec_2(d, m, opr_sz, max_sz, &op[vece]);                \
-+    }
- static const TCGOpcode vecop_list_cmp[] = {
-     INDEX_op_cmp_vec, 0
- };
--const GVecGen2 ceq0_op[4] = {
--    { .fno = gen_helper_gvec_ceq0_b,
--      .fniv = gen_ceq0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_8 },
--    { .fno = gen_helper_gvec_ceq0_h,
--      .fniv = gen_ceq0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_16 },
--    { .fni4 = gen_ceq0_i32,
--      .fniv = gen_ceq0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_32 },
--    { .fni8 = gen_ceq0_i64,
--      .fniv = gen_ceq0_vec,
--      .opt_opc = vecop_list_cmp,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .vece = MO_64 },
--};
-+GEN_CMP0(ceq, TCG_COND_EQ)
-+GEN_CMP0(cle, TCG_COND_LE)
-+GEN_CMP0(cge, TCG_COND_GE)
-+GEN_CMP0(clt, TCG_COND_LT)
-+GEN_CMP0(cgt, TCG_COND_GT)
--static void gen_cle0_i32(TCGv_i32 d, TCGv_i32 a)
--{
--    tcg_gen_setcondi_i32(TCG_COND_LE, d, a, 0);
--    tcg_gen_neg_i32(d, d);
--}
--
--static void gen_cle0_i64(TCGv_i64 d, TCGv_i64 a)
--{
--    tcg_gen_setcondi_i64(TCG_COND_LE, d, a, 0);
--    tcg_gen_neg_i64(d, d);
--}
--
--static void gen_cle0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
--{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
--    tcg_gen_cmp_vec(TCG_COND_LE, vece, d, a, zero);
--    tcg_temp_free_vec(zero);
--}
--
--const GVecGen2 cle0_op[4] = {
--    { .fno = gen_helper_gvec_cle0_b,
--      .fniv = gen_cle0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_8 },
--    { .fno = gen_helper_gvec_cle0_h,
--      .fniv = gen_cle0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_16 },
--    { .fni4 = gen_cle0_i32,
--      .fniv = gen_cle0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_32 },
--    { .fni8 = gen_cle0_i64,
--      .fniv = gen_cle0_vec,
--      .opt_opc = vecop_list_cmp,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .vece = MO_64 },
--};
--
--static void gen_cge0_i32(TCGv_i32 d, TCGv_i32 a)
--{
--    tcg_gen_setcondi_i32(TCG_COND_GE, d, a, 0);
--    tcg_gen_neg_i32(d, d);
--}
--
--static void gen_cge0_i64(TCGv_i64 d, TCGv_i64 a)
--{
--    tcg_gen_setcondi_i64(TCG_COND_GE, d, a, 0);
--    tcg_gen_neg_i64(d, d);
--}
--
--static void gen_cge0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
--{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
--    tcg_gen_cmp_vec(TCG_COND_GE, vece, d, a, zero);
--    tcg_temp_free_vec(zero);
--}
--
--const GVecGen2 cge0_op[4] = {
--    { .fno = gen_helper_gvec_cge0_b,
--      .fniv = gen_cge0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_8 },
--    { .fno = gen_helper_gvec_cge0_h,
--      .fniv = gen_cge0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_16 },
--    { .fni4 = gen_cge0_i32,
--      .fniv = gen_cge0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_32 },
--    { .fni8 = gen_cge0_i64,
--      .fniv = gen_cge0_vec,
--      .opt_opc = vecop_list_cmp,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .vece = MO_64 },
--};
--
--static void gen_clt0_i32(TCGv_i32 d, TCGv_i32 a)
--{
--    tcg_gen_setcondi_i32(TCG_COND_LT, d, a, 0);
--    tcg_gen_neg_i32(d, d);
--}
--
--static void gen_clt0_i64(TCGv_i64 d, TCGv_i64 a)
--{
--    tcg_gen_setcondi_i64(TCG_COND_LT, d, a, 0);
--    tcg_gen_neg_i64(d, d);
--}
--
--static void gen_clt0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
--{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
--    tcg_gen_cmp_vec(TCG_COND_LT, vece, d, a, zero);
--    tcg_temp_free_vec(zero);
--}
--
--const GVecGen2 clt0_op[4] = {
--    { .fno = gen_helper_gvec_clt0_b,
--      .fniv = gen_clt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_8 },
--    { .fno = gen_helper_gvec_clt0_h,
--      .fniv = gen_clt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_16 },
--    { .fni4 = gen_clt0_i32,
--      .fniv = gen_clt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_32 },
--    { .fni8 = gen_clt0_i64,
--      .fniv = gen_clt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .vece = MO_64 },
--};
--
--static void gen_cgt0_i32(TCGv_i32 d, TCGv_i32 a)
--{
--    tcg_gen_setcondi_i32(TCG_COND_GT, d, a, 0);
--    tcg_gen_neg_i32(d, d);
--}
--
--static void gen_cgt0_i64(TCGv_i64 d, TCGv_i64 a)
--{
--    tcg_gen_setcondi_i64(TCG_COND_GT, d, a, 0);
--    tcg_gen_neg_i64(d, d);
--}
--
--static void gen_cgt0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
--{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
--    tcg_gen_cmp_vec(TCG_COND_GT, vece, d, a, zero);
--    tcg_temp_free_vec(zero);
--}
--
--const GVecGen2 cgt0_op[4] = {
--    { .fno = gen_helper_gvec_cgt0_b,
--      .fniv = gen_cgt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_8 },
--    { .fno = gen_helper_gvec_cgt0_h,
--      .fniv = gen_cgt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_16 },
--    { .fni4 = gen_cgt0_i32,
--      .fniv = gen_cgt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .vece = MO_32 },
--    { .fni8 = gen_cgt0_i64,
--      .fniv = gen_cgt0_vec,
--      .opt_opc = vecop_list_cmp,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .vece = MO_64 },
--};
-+#undef GEN_CMP0
- static void gen_ssra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                     break;
-                 case NEON_2RM_VCEQ0:
--                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
--                                   vec_size, &ceq0_op[size]);
-+                    gen_gvec_ceq0(size, rd_ofs, rm_ofs, vec_size, vec_size);
-                     break;
-                 case NEON_2RM_VCGT0:
--                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
--                                   vec_size, &cgt0_op[size]);
-+                    gen_gvec_cgt0(size, rd_ofs, rm_ofs, vec_size, vec_size);
-                     break;
-                 case NEON_2RM_VCLE0:
--                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
--                                   vec_size, &cle0_op[size]);
-+                    gen_gvec_cle0(size, rd_ofs, rm_ofs, vec_size, vec_size);
-                     break;
-                 case NEON_2RM_VCGE0:
--                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
--                                   vec_size, &cge0_op[size]);
-+                    gen_gvec_cge0(size, rd_ofs, rm_ofs, vec_size, vec_size);
-                     break;
-                 case NEON_2RM_VCLT0:
--                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
--                                   vec_size, &clt0_op[size]);
-+                    gen_gvec_clt0(size, rd_ofs, rm_ofs, vec_size, vec_size);
-                     break;
-                 default:
 --
-.20.1
+.25.1

-[PULL 09/45] target/arm: Swap argument order for VSHL during decode
+[PULL 13/34] hw/timer/imx_epit: update interrupt state on CR write access
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Axel Heider <axel.heider@hensoldt.net>
-Rather than perform the argument swap during code generation,
+The interrupt state can change due to:
-perform it during decode.  This means it doesn't have to be
+- reset clears both SR.OCIF and CR.OCIE
-special cased later, and we can share code with aarch64 code
+- write to CR.EN or CR.OCIE
 generation.  Hopefully the decode comment addresses any confusion
 that might arise in between.
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-9-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/neon-dp.decode       | 17 +++++++++++++++--
+ hw/timer/imx_epit.c | 16 ++++++++++++----
- target/arm/translate-neon.inc.c |  3 +--
+file changed, 12 insertions(+), 4 deletions(-)
 files changed, 16 insertions(+), 4 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/timer/imx_epit.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ VCGT_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_write(void *opaque, hwaddr offset, uint64_t value,
- VCGE_S_3s        1111 001 0 0 . .. .... .... 0011 . . . 1 .... @3same
+         if (s->cr & CR_SWR) {
- VCGE_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 1 .... @3same
+             /* handle the reset */
+             imx_epit_reset(DEVICE(s));
--VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same
+-            /*
--VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same
+-             * TODO: could we 'break' here? following operations appear
-+# The _rev suffix indicates that Vn and Vm are reversed. This is
+-             * to duplicate the work imx_epit_reset() already did.
-+# the case for shifts. In the Arm ARM these insns are documented
+-             */
-+# with the Vm and Vn fields in their usual places, but in the
+         }
-+# assembly the operands are listed "backwards", ie in the order
-+# Dd, Dm, Dn where other insns use Dd, Dn, Dm. For QEMU we choose
++        /*
-+# to consider Vm and Vn as being in different fields in the insn,
++         * The interrupt state can change due to:
-+# which allows us to avoid special-casing shifts in the trans_
++         * - reset clears both SR.OCIF and CR.OCIE
-+# function code. We would otherwise need to manually swap the operands
++         * - write to CR.EN or CR.OCIE
-+# over to call Neon helper functions that are shared with AArch64,
++         */
-+# which does not have this odd reversed-operand situation.
++        imx_epit_update_int(s);
 +@3same_rev       .... ... . . . size:2 .... .... .... . q:1 . . .... \
 +                 &3same vn=%vm_dp vm=%vn_dp vd=%vd_dp
 +
-+VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same_rev
++        /*
-+VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
++         * TODO: could we 'break' here for reset? following operations appear
++         * to duplicate the work imx_epit_reset() already did.
- VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
++         */
- VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
++
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+         ptimer_transaction_begin(s->timer_cmp);
-index XXXXXXX..XXXXXXX 100644
+         ptimer_transaction_begin(s->timer_reload);
---- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
                                  uint32_t rn_ofs, uint32_t rm_ofs,       \
                                  uint32_t oprsz, uint32_t maxsz)         \
      {                                                                   \
 -        /* Note the operation is vshl vd,vm,vn */                       \
 -        tcg_gen_gvec_3(rd_ofs, rm_ofs, rn_ofs,                          \
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
                         oprsz, maxsz, &OPARRAY[vece]);                   \
      }                                                                   \
      DO_3SAME(INSN, gen_##INSN##_3s)
 --
-.20.1
+.25.1

-[PULL 17/45] target/arm: Vectorize SABA/UABA
+[PULL 14/34] hw/timer/imx_epit: hard reset initializes CR with 0
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Axel Heider <axel.heider@hensoldt.net>
-Include 64-bit element size in preparation for SVE2.
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-17-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  17 +++--
+ hw/timer/imx_epit.c | 20 ++++++++++++++------
- target/arm/translate.h     |   5 ++
+file changed, 14 insertions(+), 6 deletions(-)
  target/arm/neon_helper.c   |  10 ---
  target/arm/translate-a64.c |  17 ++---
  target/arm/translate.c     | 134 +++++++++++++++++++++++++++++++++++--
  target/arm/vec_helper.c    |  24 +++++++
 files changed, 174 insertions(+), 33 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/timer/imx_epit.c
-+++ b/target/arm/helper.h
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_pmax_s8, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_set_freq(IMXEPITState *s)
- DEF_HELPER_2(neon_pmax_u16, i32, i32, i32)
+ /*
- DEF_HELPER_2(neon_pmax_s16, i32, i32, i32)
+  * This is called both on hardware (device) reset and software reset.
+  */
--DEF_HELPER_2(neon_abd_u8, i32, i32, i32)
+-static void imx_epit_reset(DeviceState *dev)
--DEF_HELPER_2(neon_abd_s8, i32, i32, i32)
++static void imx_epit_reset(IMXEPITState *s, bool is_hard_reset)
--DEF_HELPER_2(neon_abd_u16, i32, i32, i32)
+ {
--DEF_HELPER_2(neon_abd_s16, i32, i32, i32)
+-    IMXEPITState *s = IMX_EPIT(dev);
 -DEF_HELPER_2(neon_abd_u32, i32, i32, i32)
 -DEF_HELPER_2(neon_abd_s32, i32, i32, i32)
 -
- DEF_HELPER_2(neon_shl_u16, i32, i32, i32)
+     /* Soft reset doesn't touch some bits; hard reset clears them */
- DEF_HELPER_2(neon_shl_s16, i32, i32, i32)
+-    s->cr &= (CR_EN|CR_ENMOD|CR_STOPEN|CR_DOZEN|CR_WAITEN|CR_DBGEN);
- DEF_HELPER_2(neon_rshl_u8, i32, i32, i32)
++    if (is_hard_reset) {
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_uabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++        s->cr = 0;
- DEF_HELPER_FLAGS_4(gvec_uabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    } else {
- DEF_HELPER_FLAGS_4(gvec_uabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++        s->cr &= (CR_EN|CR_ENMOD|CR_STOPEN|CR_DOZEN|CR_WAITEN|CR_DBGEN);
++    }
-+DEF_HELPER_FLAGS_4(gvec_saba_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     s->sr = 0;
-+DEF_HELPER_FLAGS_4(gvec_saba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     s->lr = EPIT_TIMER_MAX;
-+DEF_HELPER_FLAGS_4(gvec_saba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     s->cmp = 0;
-+DEF_HELPER_FLAGS_4(gvec_saba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_write(void *opaque, hwaddr offset, uint64_t value,
-+
+         s->cr = value & 0x03ffffff;
-+DEF_HELPER_FLAGS_4(gvec_uaba_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+         if (s->cr & CR_SWR) {
-+DEF_HELPER_FLAGS_4(gvec_uaba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             /* handle the reset */
-+DEF_HELPER_FLAGS_4(gvec_uaba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-            imx_epit_reset(DEVICE(s));
-+DEF_HELPER_FLAGS_4(gvec_uaba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            imx_epit_reset(s, false);
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.h
 +++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
  void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                     uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/neon_helper.c
 +++ b/target/arm/neon_helper.c
@@ -XXX,XX +XXX,XX @@ NEON_POP(pmax_s16, neon_s16, 2)
  NEON_POP(pmax_u16, neon_u16, 2)
  #undef NEON_FN
 -#define NEON_FN(dest, src1, src2) \
 -    dest = (src1 > src2) ? (src1 - src2) : (src2 - src1)
 -NEON_VOP(abd_s8, neon_s8, 4)
 -NEON_VOP(abd_u8, neon_u8, 4)
 -NEON_VOP(abd_s16, neon_s16, 2)
 -NEON_VOP(abd_u16, neon_u16, 2)
 -NEON_VOP(abd_s32, neon_s32, 1)
 -NEON_VOP(abd_u32, neon_u32, 1)
 -#undef NEON_FN
 -
  #define NEON_FN(dest, src1, src2) do { \
      int8_t tmp; \
      tmp = (int8_t)src2; \
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
              gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sabd, size);
          }
-         return;
-+    case 0xf: /* SABA, UABA */
+         /*
-+        if (u) {
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_realize(DeviceState *dev, Error **errp)
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uaba, size);
+     s->timer_cmp = ptimer_init(imx_epit_cmp, s, PTIMER_POLICY_LEGACY);
 +        } else {
 +            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_saba, size);
 +        }
 +        return;
      case 0x10: /* ADD, SUB */
          if (u) {
              gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_sub, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                  genenvfn = fns[size][u];
                  break;
              }
 -            case 0xf: /* SABA, UABA */
 -            {
 -                static NeonGenTwoOpFn * const fns[3][2] = {
 -                    { gen_helper_neon_abd_s8, gen_helper_neon_abd_u8 },
 -                    { gen_helper_neon_abd_s16, gen_helper_neon_abd_u16 },
 -                    { gen_helper_neon_abd_s32, gen_helper_neon_abd_u32 },
 -                };
 -                genfn = fns[size][u];
 -                break;
 -            }
              case 0x16: /* SQDMULH, SQRDMULH */
              {
                  static NeonGenTwoOpEnvFn * const fns[2][2] = {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
      tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
  }
-+static void gen_saba_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
++static void imx_epit_dev_reset(DeviceState *dev)
 +{
-+    TCGv_i32 t = tcg_temp_new_i32();
++    IMXEPITState *s = IMX_EPIT(dev);
-+    gen_sabd_i32(t, a, b);
++    imx_epit_reset(s, true);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
-+static void gen_saba_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
+ static void imx_epit_class_init(ObjectClass *klass, void *data)
-+{
+ {
-+    TCGv_i64 t = tcg_temp_new_i64();
+     DeviceClass *dc  = DEVICE_CLASS(klass);
-+    gen_sabd_i64(t, a, b);
-+    tcg_gen_add_i64(d, d, t);
+     dc->realize = imx_epit_realize;
-+    tcg_temp_free_i64(t);
+-    dc->reset = imx_epit_reset;
-+}
++    dc->reset = imx_epit_dev_reset;
-+
+     dc->vmsd = &vmstate_imx_timer_epit;
-+static void gen_saba_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
+     dc->desc = "i.MX periodic timer";
-+{
+ }
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    gen_sabd_vec(vece, t, a, b);
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sub_vec, INDEX_op_add_vec,
 +        INDEX_op_smin_vec, INDEX_op_smax_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_saba_i32,
 +          .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_saba_i64,
 +          .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 +
 +static void gen_uaba_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +    gen_uabd_i32(t, a, b);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_uaba_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +    gen_uabd_i64(t, a, b);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_uaba_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    gen_uabd_vec(vece, t, a, b);
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sub_vec, INDEX_op_add_vec,
 +        INDEX_op_umin_vec, INDEX_op_umax_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_uaba_i32,
 +          .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_uaba_i64,
 +          .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 +
  /* Translate a NEON data processing instruction.  Return nonzero if the
     instruction is invalid.
     We process data in a mixture of 32-bit and 64-bit chunks.
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              }
              return 0;
 +        case NEON_3R_VABA:
 +            if (u) {
 +                gen_gvec_uaba(size, rd_ofs, rn_ofs, rm_ofs,
 +                              vec_size, vec_size);
 +            } else {
 +                gen_gvec_saba(size, rd_ofs, rn_ofs, rm_ofs,
 +                              vec_size, vec_size);
 +            }
 +            return 0;
 +
          case NEON_3R_VADD_VSUB:
          case NEON_3R_LOGIC:
          case NEON_3R_VMAX:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQRSHL:
              GEN_NEON_INTEGER_OP_ENV(qrshl);
              break;
 -        case NEON_3R_VABA:
 -            GEN_NEON_INTEGER_OP(abd);
 -            tcg_temp_free_i32(tmp2);
 -            tmp2 = neon_load_reg(rd, pass);
 -            gen_neon_add(size, tmp, tmp2);
 -            break;
          case NEON_3R_VPMAX:
              GEN_NEON_INTEGER_OP(pmax);
              break;
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_ABD(gvec_uabd_s, uint32_t)
  DO_ABD(gvec_uabd_d, uint64_t)
  #undef DO_ABD
 +
 +#define DO_ABA(NAME, TYPE)                                      \
 +void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc)  \
 +{                                                               \
 +    intptr_t i, opr_sz = simd_oprsz(desc);                      \
 +    TYPE *d = vd, *n = vn, *m = vm;                             \
 +                                                                \
 +    for (i = 0; i < opr_sz / sizeof(TYPE); ++i) {               \
 +        d[i] += n[i] < m[i] ? m[i] - n[i] : n[i] - m[i];        \
 +    }                                                           \
 +    clear_tail(d, opr_sz, simd_maxsz(desc));                    \
 +}
 +
 +DO_ABA(gvec_saba_b, int8_t)
 +DO_ABA(gvec_saba_h, int16_t)
 +DO_ABA(gvec_saba_s, int32_t)
 +DO_ABA(gvec_saba_d, int64_t)
 +
 +DO_ABA(gvec_uaba_b, uint8_t)
 +DO_ABA(gvec_uaba_h, uint16_t)
 +DO_ABA(gvec_uaba_s, uint32_t)
 +DO_ABA(gvec_uaba_d, uint64_t)
 +
 +#undef DO_ABA
 --
-.20.1
+.25.1

-[PULL 45/45] target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree
+[PULL 15/34] hw/timer/imx_epit: factor out register write handlers
-Convert the Neon floating point VFMA and VFMS insn to decodetree.
+From: Axel Heider <axel.heider@hensoldt.net>
 These are the last insns in the 3-reg-same group so we can
 remove all the support/loop code from the old decoder.
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-18-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |   3 +
+ hw/timer/imx_epit.c | 215 ++++++++++++++++++++++++--------------------
- target/arm/translate-neon.inc.c |  41 ++++++++
+file changed, 117 insertions(+), 98 deletions(-)
  target/arm/translate.c          | 176 +-------------------------------
 files changed, 46 insertions(+), 174 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/timer/imx_epit.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ SHA256H2_3s      1111 001 1 0 . 01 .... .... 1100 . 1 . 0 .... \
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_reload_compare_timer(IMXEPITState *s)
  SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
                   vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +VFMA_fp_3s       1111 001 0 0 . 0 . .... .... 1100 ... 1 .... @3same_fp
 +VFMS_fp_3s       1111 001 0 0 . 1 . .... .... 1100 ... 1 .... @3same_fp
 +
  VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
  VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VRSQRTS_fp_3s);
  }
 +static void gen_VFMA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 +}
 +
 +static bool trans_VFMA_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!dc_isar_feature(aa32_simdfmac, s)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_VFMA_fp_3s, true);
 +}
 +
 +static void gen_VFMS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_negs(vn, vn);
 +    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 +}
 +
 +static bool trans_VFMS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!dc_isar_feature(aa32_simdfmac, s)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_VFMS_fp_3s, true);
 +}
 +
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
      /* FP operations handled pairwise 32 bits at a time */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_neon_narrow_op(int op, int u, int size,
      }
  }
--/* Symbolic constants for op fields for Neon 3-register same-length.
++static void imx_epit_write_cr(IMXEPITState *s, uint32_t value)
-- * The values correspond to bits [11:8,4]; see the ARM ARM DDI0406B
++{
-- * table A7-9.
++    uint32_t oldcr = s->cr;
-- */
++
--#define NEON_3R_VHADD 0
++    s->cr = value & 0x03ffffff;
--#define NEON_3R_VQADD 1
++
--#define NEON_3R_VRHADD 2
++    if (s->cr & CR_SWR) {
--#define NEON_3R_LOGIC 3 /* VAND,VBIC,VORR,VMOV,VORN,VEOR,VBIF,VBIT,VBSL */
++        /* handle the reset */
--#define NEON_3R_VHSUB 4
++        imx_epit_reset(s, false);
--#define NEON_3R_VQSUB 5
++    }
--#define NEON_3R_VCGT 6
++
--#define NEON_3R_VCGE 7
++    /*
--#define NEON_3R_VSHL 8
++     * The interrupt state can change due to:
--#define NEON_3R_VQSHL 9
++     * - reset clears both SR.OCIF and CR.OCIE
--#define NEON_3R_VRSHL 10
++     * - write to CR.EN or CR.OCIE
--#define NEON_3R_VQRSHL 11
++     */
--#define NEON_3R_VMAX 12
++    imx_epit_update_int(s);
--#define NEON_3R_VMIN 13
++
--#define NEON_3R_VABD 14
++    /*
--#define NEON_3R_VABA 15
++     * TODO: could we 'break' here for reset? following operations appear
--#define NEON_3R_VADD_VSUB 16
++     * to duplicate the work imx_epit_reset() already did.
--#define NEON_3R_VTST_VCEQ 17
++     */
--#define NEON_3R_VML 18 /* VMLA, VMLS */
++
--#define NEON_3R_VMUL 19
++    ptimer_transaction_begin(s->timer_cmp);
--#define NEON_3R_VPMAX 20
++    ptimer_transaction_begin(s->timer_reload);
--#define NEON_3R_VPMIN 21
++
--#define NEON_3R_VQDMULH_VQRDMULH 22
++    /* Update the frequency. Has been done already in case of a reset. */
--#define NEON_3R_VPADD_VQRDMLAH 23
++    if (!(s->cr & CR_SWR)) {
--#define NEON_3R_SHA 24 /* SHA1C,SHA1P,SHA1M,SHA1SU0,SHA256H{2},SHA256SU1 */
++        imx_epit_set_freq(s);
--#define NEON_3R_VFM_VQRDMLSH 25 /* VFMA, VFMS, VQRDMLSH */
++    }
--#define NEON_3R_FLOAT_ARITH 26 /* float VADD, VSUB, VPADD, VABD */
++
--#define NEON_3R_FLOAT_MULTIPLY 27 /* float VMLA, VMLS, VMUL */
++    if (s->freq && (s->cr & CR_EN) && !(oldcr & CR_EN)) {
--#define NEON_3R_FLOAT_CMP 28 /* float VCEQ, VCGE, VCGT */
++        if (s->cr & CR_ENMOD) {
--#define NEON_3R_FLOAT_ACMP 29 /* float VACGE, VACGT, VACLE, VACLT */
++            if (s->cr & CR_RLD) {
--#define NEON_3R_FLOAT_MINMAX 30 /* float VMIN, VMAX */
++                ptimer_set_limit(s->timer_reload, s->lr, 1);
--#define NEON_3R_FLOAT_MISC 31 /* float VRECPS, VRSQRTS, VMAXNM/MINNM */
++                ptimer_set_limit(s->timer_cmp, s->lr, 1);
--
++            } else {
--static const uint8_t neon_3r_sizes[] = {
++                ptimer_set_limit(s->timer_reload, EPIT_TIMER_MAX, 1);
--    [NEON_3R_VHADD] = 0x7,
++                ptimer_set_limit(s->timer_cmp, EPIT_TIMER_MAX, 1);
--    [NEON_3R_VQADD] = 0xf,
++            }
--    [NEON_3R_VRHADD] = 0x7,
++        }
--    [NEON_3R_LOGIC] = 0xf, /* size field encodes op type */
++
--    [NEON_3R_VHSUB] = 0x7,
++        imx_epit_reload_compare_timer(s);
--    [NEON_3R_VQSUB] = 0xf,
++        ptimer_run(s->timer_reload, 0);
--    [NEON_3R_VCGT] = 0x7,
++        if (s->cr & CR_OCIEN) {
--    [NEON_3R_VCGE] = 0x7,
++            ptimer_run(s->timer_cmp, 0);
--    [NEON_3R_VSHL] = 0xf,
++        } else {
--    [NEON_3R_VQSHL] = 0xf,
++            ptimer_stop(s->timer_cmp);
--    [NEON_3R_VRSHL] = 0xf,
++        }
--    [NEON_3R_VQRSHL] = 0xf,
++    } else if (!(s->cr & CR_EN)) {
--    [NEON_3R_VMAX] = 0x7,
++        /* stop both timers */
--    [NEON_3R_VMIN] = 0x7,
++        ptimer_stop(s->timer_reload);
--    [NEON_3R_VABD] = 0x7,
++        ptimer_stop(s->timer_cmp);
--    [NEON_3R_VABA] = 0x7,
++    } else  if (s->cr & CR_OCIEN) {
--    [NEON_3R_VADD_VSUB] = 0xf,
++        if (!(oldcr & CR_OCIEN)) {
--    [NEON_3R_VTST_VCEQ] = 0x7,
++            imx_epit_reload_compare_timer(s);
--    [NEON_3R_VML] = 0x7,
++            ptimer_run(s->timer_cmp, 0);
--    [NEON_3R_VMUL] = 0x7,
++        }
--    [NEON_3R_VPMAX] = 0x7,
++    } else {
--    [NEON_3R_VPMIN] = 0x7,
++        ptimer_stop(s->timer_cmp);
--    [NEON_3R_VQDMULH_VQRDMULH] = 0x6,
++    }
--    [NEON_3R_VPADD_VQRDMLAH] = 0x7,
++
--    [NEON_3R_SHA] = 0xf, /* size field encodes op type */
++    ptimer_transaction_commit(s->timer_cmp);
--    [NEON_3R_VFM_VQRDMLSH] = 0x7, /* For VFM, size bit 1 encodes op */
++    ptimer_transaction_commit(s->timer_reload);
--    [NEON_3R_FLOAT_ARITH] = 0x5, /* size bit 1 encodes op */
++}
--    [NEON_3R_FLOAT_MULTIPLY] = 0x5, /* size bit 1 encodes op */
++
--    [NEON_3R_FLOAT_CMP] = 0x5, /* size bit 1 encodes op */
++static void imx_epit_write_sr(IMXEPITState *s, uint32_t value)
--    [NEON_3R_FLOAT_ACMP] = 0x5, /* size bit 1 encodes op */
++{
--    [NEON_3R_FLOAT_MINMAX] = 0x5, /* size bit 1 encodes op */
++    /* writing 1 to SR.OCIF clears this bit and turns the interrupt off */
--    [NEON_3R_FLOAT_MISC] = 0x5, /* size bit 1 encodes op */
++    if (value & SR_OCIF) {
--};
++        s->sr = 0; /* SR.OCIF is the only bit in this register anyway */
--
++        imx_epit_update_int(s);
- /* Symbolic constants for op fields for Neon 2-register miscellaneous.
++    }
-  * The values correspond to bits [17:16,10:7]; see the ARM ARM DDI0406B
++}
-  * table A7-13.
++
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
++static void imx_epit_write_lr(IMXEPITState *s, uint32_t value)
-     rm_ofs = neon_reg_offset(rm, 0);
++{
++    s->lr = value;
-     if ((insn & (1 << 23)) == 0) {
++
--        /* Three register same length.  */
++    ptimer_transaction_begin(s->timer_cmp);
--        op = ((insn >> 7) & 0x1e) | ((insn >> 4) & 1);
++    ptimer_transaction_begin(s->timer_reload);
--        /* Catch invalid op and bad size combinations: UNDEF */
++    if (s->cr & CR_RLD) {
--        if ((neon_3r_sizes[op] & (1 << size)) == 0) {
++        /* Also set the limit if the LRD bit is set */
--            return 1;
++        /* If IOVW bit is set then set the timer value */
--        }
++        ptimer_set_limit(s->timer_reload, s->lr, s->cr & CR_IOVW);
--        /* All insns of this form UNDEF for either this condition or the
++        ptimer_set_limit(s->timer_cmp, s->lr, 0);
--         * superset of cases "Q==1"; we catch the latter later.
++    } else if (s->cr & CR_IOVW) {
 +        /* If IOVW bit is set then set the timer value */
 +        ptimer_set_count(s->timer_reload, s->lr);
 +    }
 +    /*
 +     * Commit the change to s->timer_reload, so it can propagate. Otherwise
 +     * the timer interrupt may not fire properly. The commit must happen
 +     * before calling imx_epit_reload_compare_timer(), which reads
 +     * s->timer_reload internally again.
 +     */
 +    ptimer_transaction_commit(s->timer_reload);
 +    imx_epit_reload_compare_timer(s);
 +    ptimer_transaction_commit(s->timer_cmp);
 +}
 +
 +static void imx_epit_write_cmp(IMXEPITState *s, uint32_t value)
 +{
 +    s->cmp = value;
 +
 +    ptimer_transaction_begin(s->timer_cmp);
 +    imx_epit_reload_compare_timer(s);
 +    ptimer_transaction_commit(s->timer_cmp);
 +}
 +
  static void imx_epit_write(void *opaque, hwaddr offset, uint64_t value,
                             unsigned size)
  {
      IMXEPITState *s = IMX_EPIT(opaque);
 -    uint64_t oldcr;
      DPRINTF("(%s, value = 0x%08x)\n", imx_epit_reg_name(offset >> 2),
              (uint32_t)value);
      switch (offset >> 2) {
      case 0: /* CR */
 -
 -        oldcr = s->cr;
 -        s->cr = value & 0x03ffffff;
 -        if (s->cr & CR_SWR) {
 -            /* handle the reset */
 -            imx_epit_reset(s, false);
 -        }
 -
 -        /*
 -         * The interrupt state can change due to:
 -         * - reset clears both SR.OCIF and CR.OCIE
 -         * - write to CR.EN or CR.OCIE
 -         */
--        if (q && ((rd | rn | rm) & 1)) {
+-        imx_epit_update_int(s);
--            return 1;
+-
--        }
+-        /*
--        switch (op) {
+-         * TODO: could we 'break' here for reset? following operations appear
--        case NEON_3R_VFM_VQRDMLSH:
+-         * to duplicate the work imx_epit_reset() already did.
--            if (!u) {
+-         */
--                /* VFM, VFMS */
+-
--                if (size == 1) {
+-        ptimer_transaction_begin(s->timer_cmp);
--                    return 1;
+-        ptimer_transaction_begin(s->timer_reload);
 -
 -        /* Update the frequency. Has been done already in case of a reset. */
 -        if (!(s->cr & CR_SWR)) {
 -            imx_epit_set_freq(s);
 -        }
 -
 -        if (s->freq && (s->cr & CR_EN) && !(oldcr & CR_EN)) {
 -            if (s->cr & CR_ENMOD) {
 -                if (s->cr & CR_RLD) {
 -                    ptimer_set_limit(s->timer_reload, s->lr, 1);
 -                    ptimer_set_limit(s->timer_cmp, s->lr, 1);
 -                } else {
 -                    ptimer_set_limit(s->timer_reload, EPIT_TIMER_MAX, 1);
 -                    ptimer_set_limit(s->timer_cmp, EPIT_TIMER_MAX, 1);
 -                }
--                break;
 -            }
--            /* VQRDMLSH : handled by decodetree */
+-
--            return 1;
+-            imx_epit_reload_compare_timer(s);
--
+-            ptimer_run(s->timer_reload, 0);
--        case NEON_3R_VADD_VSUB:
+-            if (s->cr & CR_OCIEN) {
--        case NEON_3R_LOGIC:
+-                ptimer_run(s->timer_cmp, 0);
--        case NEON_3R_VMAX:
+-            } else {
--        case NEON_3R_VMIN:
+-                ptimer_stop(s->timer_cmp);
 -        case NEON_3R_VTST_VCEQ:
 -        case NEON_3R_VCGT:
 -        case NEON_3R_VCGE:
 -        case NEON_3R_VQADD:
 -        case NEON_3R_VQSUB:
 -        case NEON_3R_VMUL:
 -        case NEON_3R_VML:
 -        case NEON_3R_VSHL:
 -        case NEON_3R_SHA:
 -        case NEON_3R_VHADD:
 -        case NEON_3R_VRHADD:
 -        case NEON_3R_VHSUB:
 -        case NEON_3R_VABD:
 -        case NEON_3R_VABA:
 -        case NEON_3R_VQSHL:
 -        case NEON_3R_VRSHL:
 -        case NEON_3R_VQRSHL:
 -        case NEON_3R_VPMAX:
 -        case NEON_3R_VPMIN:
 -        case NEON_3R_VPADD_VQRDMLAH:
 -        case NEON_3R_VQDMULH_VQRDMULH:
 -        case NEON_3R_FLOAT_ARITH:
 -        case NEON_3R_FLOAT_MULTIPLY:
 -        case NEON_3R_FLOAT_CMP:
 -        case NEON_3R_FLOAT_ACMP:
 -        case NEON_3R_FLOAT_MINMAX:
 -        case NEON_3R_FLOAT_MISC:
 -            /* Already handled by decodetree */
 -            return 1;
 -        }
 -
 -        if (size == 3) {
 -            /* 64-bit element instructions: handled by decodetree */
 -            return 1;
 -        }
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -            if (!dc_isar_feature(aa32_simdfmac, s)) {
 -                return 1;
 -            }
--            break;
+-        } else if (!(s->cr & CR_EN)) {
--        default:
+-            /* stop both timers */
--            break;
+-            ptimer_stop(s->timer_reload);
--        }
+-            ptimer_stop(s->timer_cmp);
--
+-        } else  if (s->cr & CR_OCIEN) {
--        for (pass = 0; pass < (q ? 4 : 2); pass++) {
+-            if (!(oldcr & CR_OCIEN)) {
--
+-                imx_epit_reload_compare_timer(s);
--        /* Elementwise.  */
+-                ptimer_run(s->timer_cmp, 0);
 -        tmp = neon_load_reg(rn, pass);
 -        tmp2 = neon_load_reg(rm, pass);
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -        {
 -            /* VFMA, VFMS: fused multiply-add */
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            TCGv_i32 tmp3 = neon_load_reg(rd, pass);
 -            if (size) {
 -                /* VFMS */
 -                gen_helper_vfp_negs(tmp, tmp);
 -            }
--            gen_helper_vfp_muladds(tmp, tmp, tmp2, tmp3, fpstatus);
+-        } else {
--            tcg_temp_free_i32(tmp3);
+-            ptimer_stop(s->timer_cmp);
--            tcg_temp_free_ptr(fpstatus);
+-        }
--            break;
+-
--        }
+-        ptimer_transaction_commit(s->timer_cmp);
--        default:
+-        ptimer_transaction_commit(s->timer_reload);
--            abort();
++        imx_epit_write_cr(s, (uint32_t)value);
--        }
+         break;
--        tcg_temp_free_i32(tmp2);
--
+-    case 1: /* SR - ACK*/
--        neon_store_reg(rd, pass, tmp);
+-        /* writing 1 to SR.OCIF clears this bit and turns the interrupt off */
--
+-        if (value & SR_OCIF) {
--        } /* for pass */
+-            s->sr = 0; /* SR.OCIF is the only bit in this register anyway */
--        /* End of 3 register same size operations.  */
+-            imx_epit_update_int(s);
-+        /* Three register same length: handled by decodetree */
+-        }
-+        return 1;
++    case 1: /* SR */
-     } else if (insn & (1 << 4)) {
++        imx_epit_write_sr(s, (uint32_t)value);
-         if ((insn & 0x00380080) != 0) {
+         break;
-             /* Two registers and shift.  */
 -    case 2: /* LR - set ticks */
 -        s->lr = value;
 -
 -        ptimer_transaction_begin(s->timer_cmp);
 -        ptimer_transaction_begin(s->timer_reload);
 -        if (s->cr & CR_RLD) {
 -            /* Also set the limit if the LRD bit is set */
 -            /* If IOVW bit is set then set the timer value */
 -            ptimer_set_limit(s->timer_reload, s->lr, s->cr & CR_IOVW);
 -            ptimer_set_limit(s->timer_cmp, s->lr, 0);
 -        } else if (s->cr & CR_IOVW) {
 -            /* If IOVW bit is set then set the timer value */
 -            ptimer_set_count(s->timer_reload, s->lr);
 -        }
 -        /*
 -         * Commit the change to s->timer_reload, so it can propagate. Otherwise
 -         * the timer interrupt may not fire properly. The commit must happen
 -         * before calling imx_epit_reload_compare_timer(), which reads
 -         * s->timer_reload internally again.
 -         */
 -        ptimer_transaction_commit(s->timer_reload);
 -        imx_epit_reload_compare_timer(s);
 -        ptimer_transaction_commit(s->timer_cmp);
 +    case 2: /* LR */
 +        imx_epit_write_lr(s, (uint32_t)value);
          break;
      case 3: /* CMP */
 -        s->cmp = value;
 -
 -        ptimer_transaction_begin(s->timer_cmp);
 -        imx_epit_reload_compare_timer(s);
 -        ptimer_transaction_commit(s->timer_cmp);
 -
 +        imx_epit_write_cmp(s, (uint32_t)value);
          break;
      default:
          qemu_log_mask(LOG_GUEST_ERROR, "[%s]%s: Bad register at offset 0x%"
                        HWADDR_PRIx "\n", TYPE_IMX_EPIT, __func__, offset);
 -
          break;
      }
  }
 +
  static void imx_epit_cmp(void *opaque)
  {
      IMXEPITState *s = IMX_EPIT(opaque);
 --
-.20.1
+.25.1

-[PULL 22/45] ACPI: Build related register address fields via hardware error fw_cfg blob
+[PULL 16/34] hw/timer/imx_epit: remove explicit fields cnt and freq
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Axel Heider <axel.heider@hensoldt.net>
-This patch builds error_block_address and read_ack_register fields
+The CNT register is a read-only register. There is no need to
-in hardware errors table , the error_block_address points to Generic
+store it's value, it can be calculated on demand.
-Error Status Block(GESB) via bios_linker. The max size for one GESB
+The calculated frequency is needed temporarily only.
 is 1kb, For more detailed information, please refer to
 document: docs/specs/acpi_hest_ghes.rst
-Now we only support one Error source, if necessary, we can extend to
+Note that this is a migration compatibility break for all boards
-support more.
+types that use the EPIT peripheral.
-Suggested-by: Laszlo Ersek <lersek@redhat.com>
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Jonathan Cameron <Jonathan.Cameron@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-5-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- default-configs/arm-softmmu.mak |  1 +
+ include/hw/timer/imx_epit.h |  2 -
- include/hw/acpi/aml-build.h     |  1 +
+ hw/timer/imx_epit.c         | 73 ++++++++++++++-----------------------
- include/hw/acpi/ghes.h          | 28 +++++++++++
+files changed, 28 insertions(+), 47 deletions(-)
  hw/acpi/aml-build.c             |  2 +
  hw/acpi/ghes.c                  | 89 +++++++++++++++++++++++++++++++++
  hw/arm/virt-acpi-build.c        |  5 ++
  hw/acpi/Kconfig                 |  4 ++
  hw/acpi/Makefile.objs           |  1 +
 files changed, 131 insertions(+)
  create mode 100644 include/hw/acpi/ghes.h
  create mode 100644 hw/acpi/ghes.c
-diff --git a/default-configs/arm-softmmu.mak b/default-configs/arm-softmmu.mak
+diff --git a/include/hw/timer/imx_epit.h b/include/hw/timer/imx_epit.h
 index XXXXXXX..XXXXXXX 100644
---- a/default-configs/arm-softmmu.mak
+--- a/include/hw/timer/imx_epit.h
-+++ b/default-configs/arm-softmmu.mak
++++ b/include/hw/timer/imx_epit.h
-@@ -XXX,XX +XXX,XX @@ CONFIG_FSL_IMX7=y
+@@ -XXX,XX +XXX,XX @@ struct IMXEPITState {
- CONFIG_FSL_IMX6UL=y
+     uint32_t sr;
- CONFIG_SEMIHOSTING=y
+     uint32_t lr;
- CONFIG_ALLWINNER_H3=y
+     uint32_t cmp;
-+CONFIG_ACPI_APEI=y
+-    uint32_t cnt;
-diff --git a/include/hw/acpi/aml-build.h b/include/hw/acpi/aml-build.h
 -    uint32_t freq;
      qemu_irq irq;
  };
 diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/aml-build.h
+--- a/hw/timer/imx_epit.c
-+++ b/include/hw/acpi/aml-build.h
++++ b/hw/timer/imx_epit.c
-@@ -XXX,XX +XXX,XX @@ struct AcpiBuildTables {
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_update_int(IMXEPITState *s)
-     GArray *rsdp;
+     }
      GArray *tcpalog;
      GArray *vmgenid;
 +    GArray *hardware_errors;
      BIOSLinker *linker;
  } AcpiBuildTables;
 diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/include/hw/acpi/ghes.h
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Support for generating APEI tables and recording CPER for Guests
 + *
 + * Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
 + *
 + * Author: Dongjiu Geng <gengdongjiu@huawei.com>
 + *
 + * This program is free software; you can redistribute it and/or modify
 + * it under the terms of the GNU General Public License as published by
 + * the Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 +
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 +
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#ifndef ACPI_GHES_H
 +#define ACPI_GHES_H
 +
 +#include "hw/acpi/bios-linker-loader.h"
 +
 +void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
 +#endif
 diff --git a/hw/acpi/aml-build.c b/hw/acpi/aml-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/aml-build.c
 +++ b/hw/acpi/aml-build.c
@@ -XXX,XX +XXX,XX @@ void acpi_build_tables_init(AcpiBuildTables *tables)
      tables->table_data = g_array_new(false, true /* clear */, 1);
      tables->tcpalog = g_array_new(false, true /* clear */, 1);
      tables->vmgenid = g_array_new(false, true /* clear */, 1);
 +    tables->hardware_errors = g_array_new(false, true /* clear */, 1);
      tables->linker = bios_linker_loader_init();
  }
-@@ -XXX,XX +XXX,XX @@ void acpi_build_tables_cleanup(AcpiBuildTables *tables, bool mfre)
+-/*
-     g_array_free(tables->table_data, true);
+- * Must be called from within a ptimer_transaction_begin/commit block
-     g_array_free(tables->tcpalog, mfre);
+- * for both s->timer_cmp and s->timer_reload.
-     g_array_free(tables->vmgenid, mfre);
+- */
-+    g_array_free(tables->hardware_errors, mfre);
+-static void imx_epit_set_freq(IMXEPITState *s)
 +static uint32_t imx_epit_get_freq(IMXEPITState *s)
  {
 -    uint32_t clksrc;
 -    uint32_t prescaler;
 -
 -    clksrc = extract32(s->cr, CR_CLKSRC_SHIFT, CR_CLKSRC_BITS);
 -    prescaler = 1 + extract32(s->cr, CR_PRESCALE_SHIFT, CR_PRESCALE_BITS);
 -
 -    s->freq = imx_ccm_get_clock_frequency(s->ccm,
 -                                imx_epit_clocks[clksrc]) / prescaler;
 -
 -    DPRINTF("Setting ptimer frequency to %u\n", s->freq);
 -
 -    if (s->freq) {
 -        ptimer_set_freq(s->timer_reload, s->freq);
 -        ptimer_set_freq(s->timer_cmp, s->freq);
 -    }
 +    uint32_t clksrc = extract32(s->cr, CR_CLKSRC_SHIFT, CR_CLKSRC_BITS);
 +    uint32_t prescaler = 1 + extract32(s->cr, CR_PRESCALE_SHIFT, CR_PRESCALE_BITS);
 +    uint32_t f_in = imx_ccm_get_clock_frequency(s->ccm, imx_epit_clocks[clksrc]);
 +    uint32_t freq = f_in / prescaler;
 +    DPRINTF("ptimer frequency is %u\n", freq);
 +    return freq;
  }
  /*
-diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_reset(IMXEPITState *s, bool is_hard_reset)
-new file mode 100644
+     s->sr = 0;
-index XXXXXXX..XXXXXXX
+     s->lr = EPIT_TIMER_MAX;
---- /dev/null
+     s->cmp = 0;
-+++ b/hw/acpi/ghes.c
+-    s->cnt = 0;
-@@ -XXX,XX +XXX,XX @@
+     ptimer_transaction_begin(s->timer_cmp);
-+/*
+     ptimer_transaction_begin(s->timer_reload);
-+ * Support for generating APEI tables and recording CPER for Guests
+-    /* stop both timers */
 + *
 + * Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
 + *
 + * Author: Dongjiu Geng <gengdongjiu@huawei.com>
 + *
 + * This program is free software; you can redistribute it and/or modify
 + * it under the terms of the GNU General Public License as published by
 + * the Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 +
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 +
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/units.h"
 +#include "hw/acpi/ghes.h"
 +#include "hw/acpi/aml-build.h"
 +
 +#define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
 +#define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
 +
 +/* The max size in bytes for one error block */
 +#define ACPI_GHES_MAX_RAW_DATA_LENGTH   (1 * KiB)
 +
 +/* Now only support ARMv8 SEA notification type error source */
 +#define ACPI_GHES_ERROR_SOURCE_COUNT        1
 +
 +/*
 + * Build table for the hardware error fw_cfg blob.
 + * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
 + * See docs/specs/acpi_hest_ghes.rst for blobs format.
 + */
 +void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker)
 +{
 +    int i, error_status_block_offset;
 +
 +    /* Build error_block_address */
 +    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
 +        build_append_int_noprefix(hardware_errors, 0, sizeof(uint64_t));
 +    }
 +
 +    /* Build read_ack_register */
 +    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
 +        /*
 +         * Initialize the value of read_ack_register to 1, so GHES can be
 +         * writeable after (re)boot.
 +         * ACPI 6.2: 18.3.2.8 Generic Hardware Error Source version 2
 +         * (GHESv2 - Type 10)
 +         */
 +        build_append_int_noprefix(hardware_errors, 1, sizeof(uint64_t));
 +    }
 +
 +    /* Generic Error Status Block offset in the hardware error fw_cfg blob */
 +    error_status_block_offset = hardware_errors->len;
 +
 +    /* Reserve space for Error Status Data Block */
 +    acpi_data_push(hardware_errors,
 +        ACPI_GHES_MAX_RAW_DATA_LENGTH * ACPI_GHES_ERROR_SOURCE_COUNT);
 +
 +    /* Tell guest firmware to place hardware_errors blob into RAM */
 +    bios_linker_loader_alloc(linker, ACPI_GHES_ERRORS_FW_CFG_FILE,
 +                             hardware_errors, sizeof(uint64_t), false);
 +
 +    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
 +        /*
 +         * Tell firmware to patch error_block_address entries to point to
 +         * corresponding "Generic Error Status Block"
 +         */
 +        bios_linker_loader_add_pointer(linker,
 +            ACPI_GHES_ERRORS_FW_CFG_FILE, sizeof(uint64_t) * i,
 +            sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE,
 +            error_status_block_offset + i * ACPI_GHES_MAX_RAW_DATA_LENGTH);
 +    }
 +
 +    /*
-+     * tell firmware to write hardware_errors GPA into
++     * The reset switches off the input clock, so even if the CR.EN is still
-+     * hardware_errors_addr fw_cfg, once the former has been initialized.
++     * set, the timers are no longer running.
 +     */
-+    bios_linker_loader_write_pointer(linker, ACPI_GHES_DATA_ADDR_FW_CFG_FILE,
++    assert(imx_epit_get_freq(s) == 0);
-+        0, sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE, 0);
+     ptimer_stop(s->timer_cmp);
-+}
+     ptimer_stop(s->timer_reload);
-diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
+-    /* compute new frequency */
-index XXXXXXX..XXXXXXX 100644
+-    imx_epit_set_freq(s);
---- a/hw/arm/virt-acpi-build.c
+     /* init both timers to EPIT_TIMER_MAX */
-+++ b/hw/arm/virt-acpi-build.c
+     ptimer_set_limit(s->timer_cmp, EPIT_TIMER_MAX, 1);
-@@ -XXX,XX +XXX,XX @@
+     ptimer_set_limit(s->timer_reload, EPIT_TIMER_MAX, 1);
- #include "sysemu/reset.h"
+-    if (s->freq && (s->cr & CR_EN)) {
- #include "kvm_arm.h"
+-        /* if the timer is still enabled, restart it */
- #include "migration/vmstate.h"
+-        ptimer_run(s->timer_reload, 0);
-+#include "hw/acpi/ghes.h"
+-    }
+     ptimer_transaction_commit(s->timer_cmp);
- #define ARM_SPI_BASE 32
+     ptimer_transaction_commit(s->timer_reload);
+ }
-@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
-     acpi_add_table(table_offsets, tables_blob);
+-static uint32_t imx_epit_update_count(IMXEPITState *s)
-     build_spcr(tables_blob, tables->linker, vms);
+-{
+-    s->cnt = ptimer_get_count(s->timer_reload);
-+    if (vms->ras) {
+-
-+        build_ghes_error_table(tables->hardware_errors, tables->linker);
+-    return s->cnt;
-+    }
+-}
-+
+-
-     if (ms->numa_state->num_nodes > 0) {
+ static uint64_t imx_epit_read(void *opaque, hwaddr offset, unsigned size)
-         acpi_add_table(table_offsets, tables_blob);
+ {
-         build_srat(tables_blob, tables->linker, vms);
+     IMXEPITState *s = IMX_EPIT(opaque);
-diff --git a/hw/acpi/Kconfig b/hw/acpi/Kconfig
+@@ -XXX,XX +XXX,XX @@ static uint64_t imx_epit_read(void *opaque, hwaddr offset, unsigned size)
-index XXXXXXX..XXXXXXX 100644
+         break;
---- a/hw/acpi/Kconfig
-+++ b/hw/acpi/Kconfig
+     case 4: /* CNT */
-@@ -XXX,XX +XXX,XX @@ config ACPI_HMAT
+-        imx_epit_update_count(s);
-     bool
+-        reg_value = s->cnt;
-     depends on ACPI
++        reg_value = ptimer_get_count(s->timer_reload);
+         break;
-+config ACPI_APEI
-+    bool
+     default:
-+    depends on ACPI
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_reload_compare_timer(IMXEPITState *s)
-+
+ {
- config ACPI_PCI
+     if ((s->cr & (CR_EN | CR_OCIEN)) == (CR_EN | CR_OCIEN))  {
-     bool
+         /* if the compare feature is on and timers are running */
-     depends on ACPI && PCI
+-        uint32_t tmp = imx_epit_update_count(s);
-diff --git a/hw/acpi/Makefile.objs b/hw/acpi/Makefile.objs
++        uint32_t tmp = ptimer_get_count(s->timer_reload);
-index XXXXXXX..XXXXXXX 100644
+         uint64_t next;
---- a/hw/acpi/Makefile.objs
+         if (tmp > s->cmp) {
-+++ b/hw/acpi/Makefile.objs
+             /* It'll fire in this round of the timer */
-@@ -XXX,XX +XXX,XX @@ common-obj-$(CONFIG_ACPI_NVDIMM) += nvdimm.o
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_reload_compare_timer(IMXEPITState *s)
- common-obj-$(CONFIG_ACPI_VMGENID) += vmgenid.o
- common-obj-$(CONFIG_ACPI_HW_REDUCED) += generic_event_device.o
+ static void imx_epit_write_cr(IMXEPITState *s, uint32_t value)
- common-obj-$(CONFIG_ACPI_HMAT) += hmat.o
+ {
-+common-obj-$(CONFIG_ACPI_APEI) += ghes.o
++    uint32_t freq = 0;
- common-obj-$(call lnot,$(CONFIG_ACPI_X86)) += acpi-stub.o
+     uint32_t oldcr = s->cr;
- common-obj-$(call lnot,$(CONFIG_PC)) += acpi-x86-stub.o
+     s->cr = value & 0x03ffffff;
@@ -XXX,XX +XXX,XX @@ static void imx_epit_write_cr(IMXEPITState *s, uint32_t value)
      ptimer_transaction_begin(s->timer_cmp);
      ptimer_transaction_begin(s->timer_reload);
 -    /* Update the frequency. Has been done already in case of a reset. */
 +    /*
 +     * Update the frequency. In case of a reset the input clock was
 +     * switched off, so this can be skipped.
 +     */
      if (!(s->cr & CR_SWR)) {
 -        imx_epit_set_freq(s);
 +        freq = imx_epit_get_freq(s);
 +        if (freq) {
 +            ptimer_set_freq(s->timer_reload, freq);
 +            ptimer_set_freq(s->timer_cmp, freq);
 +        }
      }
 -    if (s->freq && (s->cr & CR_EN) && !(oldcr & CR_EN)) {
 +    if (freq && (s->cr & CR_EN) && !(oldcr & CR_EN)) {
          if (s->cr & CR_ENMOD) {
              if (s->cr & CR_RLD) {
                  ptimer_set_limit(s->timer_reload, s->lr, 1);
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps imx_epit_ops = {
  static const VMStateDescription vmstate_imx_timer_epit = {
      .name = TYPE_IMX_EPIT,
 -    .version_id = 2,
 -    .minimum_version_id = 2,
 +    .version_id = 3,
 +    .minimum_version_id = 3,
      .fields = (VMStateField[]) {
          VMSTATE_UINT32(cr, IMXEPITState),
          VMSTATE_UINT32(sr, IMXEPITState),
          VMSTATE_UINT32(lr, IMXEPITState),
          VMSTATE_UINT32(cmp, IMXEPITState),
 -        VMSTATE_UINT32(cnt, IMXEPITState),
 -        VMSTATE_UINT32(freq, IMXEPITState),
          VMSTATE_PTIMER(timer_reload, IMXEPITState),
          VMSTATE_PTIMER(timer_cmp, IMXEPITState),
          VMSTATE_END_OF_LIST()
 --
-.20.1
+.25.1

-[PULL 26/45] ACPI: Record Generic Error Status Block(GESB) table
+[PULL 17/34] hw/timer/imx_epit: fix compare timer handling
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Axel Heider <axel.heider@hensoldt.net>
-kvm_arch_on_sigbus_vcpu() error injection uses source_id as
+- fix #1263 for CR writes
-index in etc/hardware_errors to find out Error Status Data
+- rework compare time handling
-Block entry corresponding to error source. So supported source_id
+  - The compare timer has to run even if CR.OCIEN is not set,
-values should be assigned here and not be changed afterwards to
+    as SR.OCIF must be updated.
-make sure that guest will write error into expected Error Status
+  - The compare timer fires exactly once when the
-Data Block.
+    compare value is less than the current value, but the
     reload values is less than the compare value.
   - The compare timer will never fire if the reload value is
     less than the compare value. Disable it in this case.
-Before QEMU writes a new error to ACPI table, it will check whether
+Signed-off-by: Axel Heider <axel.heider@hensoldt.net>
-previous error has been acknowledged. If not acknowledged, the new
+[PMM: fixed minor style nits]
-errors will be ignored and not be recorded. For the errors section
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 type, QEMU simulate it to memory section error.
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-9-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/ghes.h |   1 +
+ hw/timer/imx_epit.c | 192 ++++++++++++++++++++++++++------------------
- hw/acpi/ghes.c         | 219 +++++++++++++++++++++++++++++++++++++++++
+file changed, 116 insertions(+), 76 deletions(-)
 files changed, 220 insertions(+)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+diff --git a/hw/timer/imx_epit.c b/hw/timer/imx_epit.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/hw/timer/imx_epit.c
-+++ b/include/hw/acpi/ghes.h
++++ b/hw/timer/imx_epit.c
@@ -XXX,XX +XXX,XX @@ void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
  void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
  void acpi_ghes_add_fw_cfg(AcpiGhesState *vms, FWCfgState *s,
                            GArray *hardware_errors);
 +int acpi_ghes_record_errors(uint8_t notify, uint64_t error_physical_addr);
  #endif
 diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/ghes.c
 +++ b/hw/acpi/ghes.c
 @@ -XXX,XX +XXX,XX @@
- #include "qemu/error-report.h"
+  * Originally written by Hans Jiang
- #include "hw/acpi/generic_event_device.h"
+  * Updated by Peter Chubb
- #include "hw/nvram/fw_cfg.h"
+  * Updated by Jean-Christophe Dubois <jcd@tribudubois.net>
-+#include "qemu/uuid.h"
++ * Updated by Axel Heider
+  *
- #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
+  * This code is licensed under GPL version 2 or later.  See
- #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
+  * the COPYING file in the top-level directory.
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static uint64_t imx_epit_read(void *opaque, hwaddr offset, unsigned size)
- /* Address offset in Generic Address Structure(GAS) */
+     return reg_value;
- #define GAS_ADDR_OFFSET 4
+ }
 -/* Must be called from ptimer_transaction_begin/commit block for s->timer_cmp */
 -static void imx_epit_reload_compare_timer(IMXEPITState *s)
 +/*
-+ * The total size of Generic Error Data Entry
++ * Must be called from a ptimer_transaction_begin/commit block for
-+ * ACPI 6.1/6.2: 18.3.2.7.1 Generic Error Data,
++ * s->timer_cmp, but outside of a transaction block of s->timer_reload,
-+ * Table 18-343 Generic Error Data Entry
++ * so the proper counter value is read.
 + */
-+#define ACPI_GHES_DATA_LENGTH               72
++static void imx_epit_update_compare_timer(IMXEPITState *s)
-+
+ {
-+/* The memory section CPER size, UEFI 2.6: N.2.5 Memory Error Section */
+-    if ((s->cr & (CR_EN | CR_OCIEN)) == (CR_EN | CR_OCIEN))  {
-+#define ACPI_GHES_MEM_CPER_LENGTH           80
+-        /* if the compare feature is on and timers are running */
-+
+-        uint32_t tmp = ptimer_get_count(s->timer_reload);
-+/* Masks for block_status flags */
+-        uint64_t next;
-+#define ACPI_GEBS_UNCORRECTABLE         1
+-        if (tmp > s->cmp) {
-+
+-            /* It'll fire in this round of the timer */
-+/*
+-            next = tmp - s->cmp;
-+ * Total size for Generic Error Status Block except Generic Error Data Entries
+-        } else { /* catch it next time around */
-+ * ACPI 6.2: 18.3.2.7.1 Generic Error Data,
+-            next = tmp - s->cmp + ((s->cr & CR_RLD) ? EPIT_TIMER_MAX : s->lr);
-+ * Table 18-380 Generic Error Status Block
++    uint64_t counter = 0;
-+ */
++    bool is_oneshot = false;
 +#define ACPI_GHES_GESB_SIZE                 20
 +
 +/*
 + * Values for error_severity field
 + */
 +enum AcpiGenericErrorSeverity {
 +    ACPI_CPER_SEV_RECOVERABLE = 0,
 +    ACPI_CPER_SEV_FATAL = 1,
 +    ACPI_CPER_SEV_CORRECTED = 2,
 +    ACPI_CPER_SEV_NONE = 3,
 +};
 +
  /*
   * Hardware Error Notification
   * ACPI 4.0: 17.3.2.7 Hardware Error Notification
@@ -XXX,XX +XXX,XX @@ static void build_ghes_hw_error_notification(GArray *table, const uint8_t type)
      build_append_int_noprefix(table, 0, 4);
  }
 +/*
 + * Generic Error Data Entry
 + * ACPI 6.1: 18.3.2.7.1 Generic Error Data
 + */
 +static void acpi_ghes_generic_error_data(GArray *table,
 +                const uint8_t *section_type, uint32_t error_severity,
 +                uint8_t validation_bits, uint8_t flags,
 +                uint32_t error_data_length, QemuUUID fru_id,
 +                uint64_t time_stamp)
 +{
 +    const uint8_t fru_text[20] = {0};
 +
 +    /* Section Type */
 +    g_array_append_vals(table, section_type, 16);
 +
 +    /* Error Severity */
 +    build_append_int_noprefix(table, error_severity, 4);
 +    /* Revision */
 +    build_append_int_noprefix(table, 0x300, 2);
 +    /* Validation Bits */
 +    build_append_int_noprefix(table, validation_bits, 1);
 +    /* Flags */
 +    build_append_int_noprefix(table, flags, 1);
 +    /* Error Data Length */
 +    build_append_int_noprefix(table, error_data_length, 4);
 +
 +    /* FRU Id */
 +    g_array_append_vals(table, fru_id.data, ARRAY_SIZE(fru_id.data));
 +
 +    /* FRU Text */
 +    g_array_append_vals(table, fru_text, sizeof(fru_text));
 +
 +    /* Timestamp */
 +    build_append_int_noprefix(table, time_stamp, 8);
 +}
 +
 +/*
 + * Generic Error Status Block
 + * ACPI 6.1: 18.3.2.7.1 Generic Error Data
 + */
 +static void acpi_ghes_generic_error_status(GArray *table, uint32_t block_status,
 +                uint32_t raw_data_offset, uint32_t raw_data_length,
 +                uint32_t data_length, uint32_t error_severity)
 +{
 +    /* Block Status */
 +    build_append_int_noprefix(table, block_status, 4);
 +    /* Raw Data Offset */
 +    build_append_int_noprefix(table, raw_data_offset, 4);
 +    /* Raw Data Length */
 +    build_append_int_noprefix(table, raw_data_length, 4);
 +    /* Data Length */
 +    build_append_int_noprefix(table, data_length, 4);
 +    /* Error Severity */
 +    build_append_int_noprefix(table, error_severity, 4);
 +}
 +
 +/* UEFI 2.6: N.2.5 Memory Error Section */
 +static void acpi_ghes_build_append_mem_cper(GArray *table,
 +                                            uint64_t error_physical_addr)
 +{
 +    /*
-+     * Memory Error Record
++     * The compare timer only has to run if the timer peripheral is active
 +     * and there is an input clock, Otherwise it can be switched off.
 +     */
-+
++    bool is_active = (s->cr & CR_EN) && imx_epit_get_freq(s);
-+    /* Validation Bits */
++    if (is_active) {
-+    build_append_int_noprefix(table,
++        /*
-+                              (1ULL << 14) | /* Type Valid */
++         * Calculate next timeout for compare timer. Reading the reload
-+                              (1ULL << 1) /* Physical Address Valid */,
++         * counter returns proper results only if pending transactions
-+                              8);
++         * on it are committed here. Otherwise stale values are be read.
-+    /* Error Status */
++         */
-+    build_append_int_noprefix(table, 0, 8);
++        counter = ptimer_get_count(s->timer_reload);
-+    /* Physical Address */
++        uint64_t limit = ptimer_get_limit(s->timer_cmp);
-+    build_append_int_noprefix(table, error_physical_addr, 8);
++        /*
-+    /* Skip all the detailed information normally found in such a record */
++         * The compare timer is a periodic timer if the limit is at least
-+    build_append_int_noprefix(table, 0, 48);
++         * the compare value. Otherwise it may fire at most once in the
-+    /* Memory Error Type */
++         * current round.
-+    build_append_int_noprefix(table, 0 /* Unknown error */, 1);
++         */
-+    /* Skip all the detailed information normally found in such a record */
++        bool is_oneshot = (limit >= s->cmp);
-+    build_append_int_noprefix(table, 0, 7);
++        if (counter >= s->cmp) {
-+}
++            /* The compare timer fires in the current round. */
-+
++            counter -= s->cmp;
-+static int acpi_ghes_record_mem_error(uint64_t error_block_address,
++        } else if (!is_oneshot) {
-+                                      uint64_t error_physical_addr)
++            /*
-+{
++             * The compare timer fires after a reload, as it is below the
-+    GArray *block;
++             * compare value already in this round. Note that the counter
-+
++             * value calculated below can be above the 32-bit limit, which
-+    /* Memory Error Section Type */
++             * is legal here because the compare timer is an internal
-+    const uint8_t uefi_cper_mem_sec[] =
++             * helper ptimer only.
-+          UUID_LE(0xA5BC1114, 0x6F64, 0x4EDE, 0xB8, 0x63, 0x3E, 0x83, \
++             */
-+                  0xED, 0x7C, 0x83, 0xB1);
++            counter += limit - s->cmp;
-+
++        } else {
-+    /* invalid fru id: ACPI 4.0: 17.3.2.6.1 Generic Error Data,
++            /*
-+     * Table 17-13 Generic Error Data Entry
++             * The compare timer won't fire in this round, and the limit is
 +             * set to a value below the compare value. This practically means
 +             * it will never fire, so it can be switched off.
 +             */
 +            is_active = false;
          }
 -        ptimer_set_count(s->timer_cmp, next);
      }
 +
 +    /*
 +     * Set the compare timer and let it run, or stop it. This is agnostic
 +     * of CR.OCIEN bit, as this bit affects interrupt generation only. The
 +     * compare timer needs to run even if no interrupts are to be generated,
 +     * because the SR.OCIF bit must be updated also.
 +     * Note that the timer might already be stopped or be running with
 +     * counter values. However, finding out when an update is needed and
 +     * when not is not trivial. It's much easier applying the setting again,
 +     * as this does not harm either and the overhead is negligible.
 +     */
-+    QemuUUID fru_id = {};
++    if (is_active) {
-+    uint32_t data_length;
++        ptimer_set_count(s->timer_cmp, counter);
-+
++        ptimer_run(s->timer_cmp, is_oneshot ? 1 : 0);
-+    block = g_array_new(false, true /* clear */, 1);
++    } else {
-+
++        ptimer_stop(s->timer_cmp);
 +    /* This is the length if adding a new generic error data entry*/
 +    data_length = ACPI_GHES_DATA_LENGTH + ACPI_GHES_MEM_CPER_LENGTH;
 +
 +    /*
 +     * Check whether it will run out of the preallocated memory if adding a new
 +     * generic error data entry
 +     */
 +    if ((data_length + ACPI_GHES_GESB_SIZE) > ACPI_GHES_MAX_RAW_DATA_LENGTH) {
 +        error_report("Not enough memory to record new CPER!!!");
 +        g_array_free(block, true);
 +        return -1;
 +    }
 +
-+    /* Build the new generic error status block header */
+ }
-+    acpi_ghes_generic_error_status(block, ACPI_GEBS_UNCORRECTABLE,
-+        0, 0, data_length, ACPI_CPER_SEV_RECOVERABLE);
+ static void imx_epit_write_cr(IMXEPITState *s, uint32_t value)
-+
+ {
-+    /* Build this new generic error data entry header */
+-    uint32_t freq = 0;
-+    acpi_ghes_generic_error_data(block, uefi_cper_mem_sec,
+     uint32_t oldcr = s->cr;
-+        ACPI_CPER_SEV_RECOVERABLE, 0, 0,
-+        ACPI_GHES_MEM_CPER_LENGTH, fru_id, 0);
+     s->cr = value & 0x03ffffff;
-+
-+    /* Build the memory section CPER for above new generic error data entry */
+     if (s->cr & CR_SWR) {
-+    acpi_ghes_build_append_mem_cper(block, error_physical_addr);
+-        /* handle the reset */
-+
++        /*
-+    /* Write the generic error data entry into guest memory */
++         * Reset clears CR.SWR again. It does not touch CR.EN, but the timers
-+    cpu_physical_memory_write(error_block_address, block->data, block->len);
++         * are still stopped because the input clock is disabled.
-+
++         */
-+    g_array_free(block, true);
+         imx_epit_reset(s, false);
-+
++    } else {
-+    return 0;
++        uint32_t freq;
-+}
++        uint32_t toggled_cr_bits = oldcr ^ s->cr;
-+
++        /* re-initialize the limits if CR.RLD has changed */
- /*
++        bool set_limit = toggled_cr_bits & CR_RLD;
-  * Build table for the hardware error fw_cfg blob.
++        /* set the counter if the timer got just enabled and CR.ENMOD is set */
-  * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
++        bool is_switched_on = (toggled_cr_bits & s->cr) & CR_EN;
-@@ -XXX,XX +XXX,XX @@ void acpi_ghes_add_fw_cfg(AcpiGhesState *ags, FWCfgState *s,
++        bool set_counter = is_switched_on && (s->cr & CR_ENMOD);
-     fw_cfg_add_file_callback(s, ACPI_GHES_DATA_ADDR_FW_CFG_FILE, NULL, NULL,
++
-         NULL, &(ags->ghes_addr_le), sizeof(ags->ghes_addr_le), false);
++        ptimer_transaction_begin(s->timer_cmp);
- }
++        ptimer_transaction_begin(s->timer_reload);
-+
++        freq = imx_epit_get_freq(s);
-+int acpi_ghes_record_errors(uint8_t source_id, uint64_t physical_address)
++        if (freq) {
-+{
++            ptimer_set_freq(s->timer_reload, freq);
-+    uint64_t error_block_addr, read_ack_register_addr, read_ack_register = 0;
++            ptimer_set_freq(s->timer_cmp, freq);
 +    uint64_t start_addr;
 +    bool ret = -1;
 +    AcpiGedState *acpi_ged_state;
 +    AcpiGhesState *ags;
 +
 +    assert(source_id < ACPI_HEST_SRC_ID_RESERVED);
 +
 +    acpi_ged_state = ACPI_GED(object_resolve_path_type("", TYPE_ACPI_GED,
 +                                                       NULL));
 +    g_assert(acpi_ged_state);
 +    ags = &acpi_ged_state->ghes_state;
 +
 +    start_addr = le64_to_cpu(ags->ghes_addr_le);
 +
 +    if (physical_address) {
 +
 +        if (source_id < ACPI_HEST_SRC_ID_RESERVED) {
 +            start_addr += source_id * sizeof(uint64_t);
 +        }
 +
-+        cpu_physical_memory_read(start_addr, &error_block_addr,
++        if (set_limit || set_counter) {
-+                                 sizeof(error_block_addr));
++            uint64_t limit = (s->cr & CR_RLD) ? s->lr : EPIT_TIMER_MAX;
-+
++            ptimer_set_limit(s->timer_reload, limit, set_counter ? 1 : 0);
-+        error_block_addr = le64_to_cpu(error_block_addr);
++            if (set_limit) {
-+
++                ptimer_set_limit(s->timer_cmp, limit, 0);
-+        read_ack_register_addr = start_addr +
++            }
-+            ACPI_GHES_ERROR_SOURCE_COUNT * sizeof(uint64_t);
++        }
-+
++        /*
-+        cpu_physical_memory_read(read_ack_register_addr,
++         * If there is an input clock and the peripheral is enabled, then
-+                                 &read_ack_register, sizeof(read_ack_register));
++         * ensure the wall clock timer is ticking. Otherwise stop the timers.
-+
++         * The compare timer will be updated later.
-+        /* zero means OSPM does not acknowledge the error */
++         */
-+        if (!read_ack_register) {
++        if (freq && (s->cr & CR_EN)) {
-+            error_report("OSPM does not acknowledge previous error,"
++            ptimer_run(s->timer_reload, 0);
-+                " so can not record CPER for current error anymore");
++        } else {
-+        } else if (error_block_addr) {
++            ptimer_stop(s->timer_reload);
-+            read_ack_register = cpu_to_le64(0);
++        }
-+            /*
++        /* Commit changes to reload timer, so they can propagate. */
-+             * Clear the Read Ack Register, OSPM will write it to 1 when
++        ptimer_transaction_commit(s->timer_reload);
-+             * it acknowledges this error.
++        /* Update compare timer based on the committed reload timer value. */
-+             */
++        imx_epit_update_compare_timer(s);
-+            cpu_physical_memory_write(read_ack_register_addr,
++        ptimer_transaction_commit(s->timer_cmp);
-+                &read_ack_register, sizeof(uint64_t));
+     }
-+
-+            ret = acpi_ghes_record_mem_error(error_block_addr,
+     /*
-+                                             physical_address);
+@@ -XXX,XX +XXX,XX @@ static void imx_epit_write_cr(IMXEPITState *s, uint32_t value)
-+        } else
+      * - write to CR.EN or CR.OCIE
-+            error_report("can not find Generic Error Status Block");
+      */
-+    }
+     imx_epit_update_int(s);
-+
+-
-+    return ret;
+-    /*
-+}
+-     * TODO: could we 'break' here for reset? following operations appear
 -     * to duplicate the work imx_epit_reset() already did.
 -     */
 -
 -    ptimer_transaction_begin(s->timer_cmp);
 -    ptimer_transaction_begin(s->timer_reload);
 -
 -    /*
 -     * Update the frequency. In case of a reset the input clock was
 -     * switched off, so this can be skipped.
 -     */
 -    if (!(s->cr & CR_SWR)) {
 -        freq = imx_epit_get_freq(s);
 -        if (freq) {
 -            ptimer_set_freq(s->timer_reload, freq);
 -            ptimer_set_freq(s->timer_cmp, freq);
 -        }
 -    }
 -
 -    if (freq && (s->cr & CR_EN) && !(oldcr & CR_EN)) {
 -        if (s->cr & CR_ENMOD) {
 -            if (s->cr & CR_RLD) {
 -                ptimer_set_limit(s->timer_reload, s->lr, 1);
 -                ptimer_set_limit(s->timer_cmp, s->lr, 1);
 -            } else {
 -                ptimer_set_limit(s->timer_reload, EPIT_TIMER_MAX, 1);
 -                ptimer_set_limit(s->timer_cmp, EPIT_TIMER_MAX, 1);
 -            }
 -        }
 -
 -        imx_epit_reload_compare_timer(s);
 -        ptimer_run(s->timer_reload, 0);
 -        if (s->cr & CR_OCIEN) {
 -            ptimer_run(s->timer_cmp, 0);
 -        } else {
 -            ptimer_stop(s->timer_cmp);
 -        }
 -    } else if (!(s->cr & CR_EN)) {
 -        /* stop both timers */
 -        ptimer_stop(s->timer_reload);
 -        ptimer_stop(s->timer_cmp);
 -    } else  if (s->cr & CR_OCIEN) {
 -        if (!(oldcr & CR_OCIEN)) {
 -            imx_epit_reload_compare_timer(s);
 -            ptimer_run(s->timer_cmp, 0);
 -        }
 -    } else {
 -        ptimer_stop(s->timer_cmp);
 -    }
 -
 -    ptimer_transaction_commit(s->timer_cmp);
 -    ptimer_transaction_commit(s->timer_reload);
  }
  static void imx_epit_write_sr(IMXEPITState *s, uint32_t value)
@@ -XXX,XX +XXX,XX @@ static void imx_epit_write_lr(IMXEPITState *s, uint32_t value)
          /* If IOVW bit is set then set the timer value */
          ptimer_set_count(s->timer_reload, s->lr);
      }
 -    /*
 -     * Commit the change to s->timer_reload, so it can propagate. Otherwise
 -     * the timer interrupt may not fire properly. The commit must happen
 -     * before calling imx_epit_reload_compare_timer(), which reads
 -     * s->timer_reload internally again.
 -     */
 +    /* Commit the changes to s->timer_reload, so they can propagate. */
      ptimer_transaction_commit(s->timer_reload);
 -    imx_epit_reload_compare_timer(s);
 +    /* Update the compare timer based on the committed reload timer value. */
 +    imx_epit_update_compare_timer(s);
      ptimer_transaction_commit(s->timer_cmp);
  }
@@ -XXX,XX +XXX,XX @@ static void imx_epit_write_cmp(IMXEPITState *s, uint32_t value)
  {
      s->cmp = value;
 +    /* Update the compare timer based on the committed reload timer value. */
      ptimer_transaction_begin(s->timer_cmp);
 -    imx_epit_reload_compare_timer(s);
 +    imx_epit_update_compare_timer(s);
      ptimer_transaction_commit(s->timer_cmp);
  }
@@ -XXX,XX +XXX,XX @@ static void imx_epit_cmp(void *opaque)
  {
      IMXEPITState *s = IMX_EPIT(opaque);
 +    /* The cmp ptimer can't be running when the peripheral is disabled */
 +    assert(s->cr & CR_EN);
 +
      DPRINTF("sr was %d\n", s->sr);
      /* Set interrupt status bit SR.OCIF and update the interrupt state */
      s->sr |= SR_OCIF;
 --
-.20.1
+.25.1

-[PULL 03/45] target/arm: Create gen_gvec_{u,s}{rshr,rsra}
+[PULL 18/34] target/arm: Fix checkpatch comment style warnings in helper.c
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Fabiano Rosas <farosas@suse.de>
-Create vectorized versions of handle_shri_with_rndacc
+Fix these:
 for shift+round and shift+round+accumulate.  Add out-of-line
 helpers in preparation for longer vector lengths from SVE.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+WARNING: Block comments use a leading /* on a separate line
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+WARNING: Block comments use * on subsequent lines
-Message-id: 20200513163245.17915-3-richard.henderson@linaro.org
+WARNING: Block comments use a trailing */ on a separate line
 Signed-off-by: Fabiano Rosas <farosas@suse.de>
 Reviewed-by: Claudio Fontana <cfontana@suse.de>
 Reviewed-by: Cornelia Huck <cohuck@redhat.com>
 Message-id: 20221213190537.511-2-farosas@suse.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  20 ++
+ target/arm/helper.c | 323 +++++++++++++++++++++++++++++---------------
- target/arm/translate.h     |   9 +
+file changed, 215 insertions(+), 108 deletions(-)
  target/arm/translate-a64.c |  11 +-
  target/arm/translate.c     | 463 +++++++++++++++++++++++++++++++++++--
  target/arm/vec_helper.c    |  50 ++++
 files changed, 527 insertions(+), 26 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/target/arm/helper.c
-+++ b/target/arm/helper.h
++++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_usra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ uint64_t read_raw_cp_reg(CPUARMState *env, const ARMCPRegInfo *ri)
- DEF_HELPER_FLAGS_3(gvec_usra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ static void write_raw_cp_reg(CPUARMState *env, const ARMCPRegInfo *ri,
- DEF_HELPER_FLAGS_3(gvec_usra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+                              uint64_t v)
+ {
-+DEF_HELPER_FLAGS_3(gvec_srshr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-    /* Raw write of a coprocessor register (as needed for migration, etc).
-+DEF_HELPER_FLAGS_3(gvec_srshr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
++    /*
-+DEF_HELPER_FLAGS_3(gvec_srshr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
++     * Raw write of a coprocessor register (as needed for migration, etc).
-+DEF_HELPER_FLAGS_3(gvec_srshr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+      * Note that constant registers are treated as write-ignored; the
-+
+      * caller should check for success by whether a readback gives the
-+DEF_HELPER_FLAGS_3(gvec_urshr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+      * value written.
-+DEF_HELPER_FLAGS_3(gvec_urshr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void write_raw_cp_reg(CPUARMState *env, const ARMCPRegInfo *ri,
-+DEF_HELPER_FLAGS_3(gvec_urshr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_urshr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ static bool raw_accessors_invalid(const ARMCPRegInfo *ri)
-+
+ {
-+DEF_HELPER_FLAGS_3(gvec_srsra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-   /* Return true if the regdef would cause an assertion if you called
-+DEF_HELPER_FLAGS_3(gvec_srsra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
++   /*
-+DEF_HELPER_FLAGS_3(gvec_srsra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
++    * Return true if the regdef would cause an assertion if you called
-+DEF_HELPER_FLAGS_3(gvec_srsra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+     * read_raw_cp_reg() or write_raw_cp_reg() on it (ie if it is a
-+
+     * program bug for it not to have the NO_RAW flag).
-+DEF_HELPER_FLAGS_3(gvec_ursra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+     * NB that returning false here doesn't necessarily mean that calling
-+DEF_HELPER_FLAGS_3(gvec_ursra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ bool write_list_to_cpustate(ARMCPU *cpu)
-+DEF_HELPER_FLAGS_3(gvec_ursra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+         if (ri->type & ARM_CP_NO_RAW) {
-+DEF_HELPER_FLAGS_3(gvec_ursra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+             continue;
-+
+         }
- #ifdef TARGET_AARCH64
+-        /* Write value and confirm it reads back as written
- #include "helper-a64.h"
++        /*
- #include "helper-sve.h"
++         * Write value and confirm it reads back as written
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+          * (to catch read-only registers and partially read-only
-index XXXXXXX..XXXXXXX 100644
+          * registers where the incoming migration value doesn't match)
---- a/target/arm/translate.h
+          */
-+++ b/target/arm/translate.h
+@@ -XXX,XX +XXX,XX @@ static gint cpreg_key_compare(gconstpointer a, gconstpointer b)
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
- void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+ void init_cpreg_list(ARMCPU *cpu)
-                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
+ {
+-    /* Initialise the cpreg_tuples[] array based on the cp_regs hash.
-+void gen_gvec_srshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
++    /*
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
++     * Initialise the cpreg_tuples[] array based on the cp_regs hash.
-+void gen_gvec_urshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+      * Note that we require cpreg_tuples[] to be sorted by key ID.
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
+      */
-+void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+     GList *keys;
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
+@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_el3_aa32ns(CPUARMState *env,
-+void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+     return CP_ACCESS_OK;
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
+ }
-+
- /*
+-/* Some secure-only AArch32 registers trap to EL3 if used from
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
++/*
 + * Some secure-only AArch32 registers trap to EL3 if used from
   * Secure EL1 (but are just ordinary UNDEF in other non-EL3 contexts).
   * Note that an access from Secure EL1 can only happen if EL3 is AArch64.
   * We assume that the .access field is set to PL1_RW.
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_trap_aa32s_el1(CPUARMState *env,
      return CP_ACCESS_TRAP_UNCATEGORIZED;
  }
 -/* Check for traps to performance monitor registers, which are controlled
 +/*
 + * Check for traps to performance monitor registers, which are controlled
   * by MDCR_EL2.TPM for EL2 and MDCR_EL3.TPM for EL3.
   */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+ static CPAccessResult access_tpm(CPUARMState *env, const ARMCPRegInfo *ri,
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static void fcse_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
---- a/target/arm/translate-a64.c
+     ARMCPU *cpu = env_archcpu(env);
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
+     if (raw_read(env, ri) != value) {
 -        /* Unlike real hardware the qemu TLB uses virtual addresses,
 +        /*
 +         * Unlike real hardware the qemu TLB uses virtual addresses,
           * not modified virtual addresses, so this causes a TLB flush.
           */
          tlb_flush(CPU(cpu));
@@ -XXX,XX +XXX,XX @@ static void contextidr_write(CPUARMState *env, const ARMCPRegInfo *ri,
      if (raw_read(env, ri) != value && !arm_feature(env, ARM_FEATURE_PMSA)
          && !extended_addresses_enabled(env)) {
 -        /* For VMSA (when not using the LPAE long descriptor page table
 +        /*
 +         * For VMSA (when not using the LPAE long descriptor page table
           * format) this register includes the ASID, so do a TLB flush.
           * For PMSA it is purely a process ID and no action is needed.
           */
@@ -XXX,XX +XXX,XX @@ static void tlbiipas2is_hyp_write(CPUARMState *env, const ARMCPRegInfo *ri,
  }
  static const ARMCPRegInfo cp_reginfo[] = {
 -    /* Define the secure and non-secure FCSE identifier CP registers
 +    /*
 +     * Define the secure and non-secure FCSE identifier CP registers
       * separately because there is no secure bank in V8 (no _EL3).  This allows
       * the secure register to be properly reset and migrated. There is also no
       * v8 EL1 version of the register so the non-secure instance stands alone.
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo cp_reginfo[] = {
        .access = PL1_RW, .secure = ARM_CP_SECSTATE_S,
        .fieldoffset = offsetof(CPUARMState, cp15.fcseidr_s),
        .resetvalue = 0, .writefn = fcse_write, .raw_writefn = raw_write, },
 -    /* Define the secure and non-secure context identifier CP registers
 +    /*
 +     * Define the secure and non-secure context identifier CP registers
       * separately because there is no secure bank in V8 (no _EL3).  This allows
       * the secure register to be properly reset and migrated.  In the
       * non-secure case, the 32-bit register will have reset and migration
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo cp_reginfo[] = {
  };
  static const ARMCPRegInfo not_v8_cp_reginfo[] = {
 -    /* NB: Some of these registers exist in v8 but with more precise
 +    /*
 +     * NB: Some of these registers exist in v8 but with more precise
       * definitions that don't use CP_ANY wildcards (mostly in v8_cp_reginfo[]).
       */
      /* MMU Domain access control / MPU write buffer control */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo not_v8_cp_reginfo[] = {
        .writefn = dacr_write, .raw_writefn = raw_write,
        .bank_fieldoffsets = { offsetoflow32(CPUARMState, cp15.dacr_s),
                               offsetoflow32(CPUARMState, cp15.dacr_ns) } },
 -    /* ARMv7 allocates a range of implementation defined TLB LOCKDOWN regs.
 +    /*
 +     * ARMv7 allocates a range of implementation defined TLB LOCKDOWN regs.
       * For v6 and v5, these mappings are overly broad.
       */
      { .name = "TLB_LOCKDOWN", .cp = 15, .crn = 10, .crm = 0,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo not_v8_cp_reginfo[] = {
  };
  static const ARMCPRegInfo not_v6_cp_reginfo[] = {
 -    /* Not all pre-v6 cores implemented this WFI, so this is slightly
 +    /*
 +     * Not all pre-v6 cores implemented this WFI, so this is slightly
       * over-broad.
       */
      { .name = "WFI_v5", .cp = 15, .crn = 7, .crm = 8, .opc1 = 0, .opc2 = 2,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo not_v6_cp_reginfo[] = {
  };
  static const ARMCPRegInfo not_v7_cp_reginfo[] = {
 -    /* Standard v6 WFI (also used in some pre-v6 cores); not in v7 (which
 +    /*
 +     * Standard v6 WFI (also used in some pre-v6 cores); not in v7 (which
       * is UNPREDICTABLE; we choose to NOP as most implementations do).
       */
      { .name = "WFI_v6", .cp = 15, .crn = 7, .crm = 0, .opc1 = 0, .opc2 = 4,
        .access = PL1_W, .type = ARM_CP_WFI },
 -    /* L1 cache lockdown. Not architectural in v6 and earlier but in practice
 +    /*
 +     * L1 cache lockdown. Not architectural in v6 and earlier but in practice
       * implemented in 926, 946, 1026, 1136, 1176 and 11MPCore. StrongARM and
       * OMAPCP will override this space.
       */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo not_v7_cp_reginfo[] = {
      { .name = "DUMMY", .cp = 15, .crn = 0, .crm = 0, .opc1 = 1, .opc2 = CP_ANY,
        .access = PL1_R, .type = ARM_CP_CONST | ARM_CP_NO_RAW,
        .resetvalue = 0 },
 -    /* We don't implement pre-v7 debug but most CPUs had at least a DBGDIDR;
 +    /*
 +     * We don't implement pre-v7 debug but most CPUs had at least a DBGDIDR;
       * implementing it as RAZ means the "debug architecture version" bits
       * will read as a reserved value, which should cause Linux to not try
       * to use the debug hardware.
       */
      { .name = "DBGDIDR", .cp = 14, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 0,
        .access = PL0_R, .type = ARM_CP_CONST, .resetvalue = 0 },
 -    /* MMU TLB control. Note that the wildcarding means we cover not just
 +    /*
 +     * MMU TLB control. Note that the wildcarding means we cover not just
       * the unified TLB ops but also the dside/iside/inner-shareable variants.
       */
      { .name = "TLBIALL", .cp = 15, .crn = 8, .crm = CP_ANY,
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
      /* In ARMv8 most bits of CPACR_EL1 are RES0. */
      if (!arm_feature(env, ARM_FEATURE_V8)) {
 -        /* ARMv7 defines bits for unimplemented coprocessors as RAZ/WI.
 +        /*
 +         * ARMv7 defines bits for unimplemented coprocessors as RAZ/WI.
           * ASEDIS [31] and D32DIS [30] are both UNK/SBZP without VFP.
           * TRCDIS [28] is RAZ/WI since we do not implement a trace macrocell.
           */
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
                  value |= R_CPACR_ASEDIS_MASK;
              }
 -            /* VFPv3 and upwards with NEON implement 32 double precision
 +            /*
 +             * VFPv3 and upwards with NEON implement 32 double precision
               * registers (D0-D31).
               */
              if (!cpu_isar_feature(aa32_simd_r32, env_archcpu(env))) {
@@ -XXX,XX +XXX,XX @@ static uint64_t cpacr_read(CPUARMState *env, const ARMCPRegInfo *ri)
  static void cpacr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
  {
 -    /* Call cpacr_write() so that we reset with the correct RAO bits set
 +    /*
 +     * Call cpacr_write() so that we reset with the correct RAO bits set
       * for our CPU features.
       */
      cpacr_write(env, ri, 0);
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
      { .name = "MVA_prefetch",
        .cp = 15, .crn = 7, .crm = 13, .opc1 = 0, .opc2 = 1,
        .access = PL1_W, .type = ARM_CP_NOP },
 -    /* We need to break the TB after ISB to execute self-modifying code
 +    /*
 +     * We need to break the TB after ISB to execute self-modifying code
       * correctly and also to take any pending interrupts immediately.
       * So use arm_cp_write_ignore() function instead of ARM_CP_NOP flag.
       */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
        .bank_fieldoffsets = { offsetof(CPUARMState, cp15.ifar_s),
                               offsetof(CPUARMState, cp15.ifar_ns) },
        .resetvalue = 0, },
 -    /* Watchpoint Fault Address Register : should actually only be present
 +    /*
 +     * Watchpoint Fault Address Register : should actually only be present
       * for 1136, 1176, 11MPCore.
       */
      { .name = "WFAR", .cp = 15, .crn = 6, .crm = 0, .opc1 = 0, .opc2 = 1,
@@ -XXX,XX +XXX,XX @@ static bool event_supported(uint16_t number)
  static CPAccessResult pmreg_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                     bool isread)
  {
 -    /* Performance monitor registers user accessibility is controlled
 +    /*
 +     * Performance monitor registers user accessibility is controlled
       * by PMUSERENR. MDCR_EL2.TPM and MDCR_EL3.TPM allow configurable
       * trapping to EL2 or EL3 for other accesses.
       */
@@ -XXX,XX +XXX,XX @@ static CPAccessResult pmreg_access_ccntr(CPUARMState *env,
      (MDCR_HPME | MDCR_HPMD | MDCR_HPMN | MDCR_HCCD | MDCR_HLP)
  #define MDCR_EL3_PMU_ENABLE_BITS (MDCR_SPME | MDCR_SCCD)
 -/* Returns true if the counter (pass 31 for PMCCNTR) should count events using
 +/*
 + * Returns true if the counter (pass 31 for PMCCNTR) should count events using
   * the current EL, security state, and register configuration.
   */
  static bool pmu_counter_enabled(CPUARMState *env, uint8_t counter)
@@ -XXX,XX +XXX,XX @@ static uint64_t pmccntr_read(CPUARMState *env, const ARMCPRegInfo *ri)
  static void pmselr_write(CPUARMState *env, const ARMCPRegInfo *ri,
                           uint64_t value)
  {
 -    /* The value of PMSELR.SEL affects the behavior of PMXEVTYPER and
 +    /*
 +     * The value of PMSELR.SEL affects the behavior of PMXEVTYPER and
       * PMXEVCNTR. We allow [0..31] to be written to PMSELR here; in the
       * meanwhile, we check PMSELR.SEL when PMXEVTYPER and PMXEVCNTR are
       * accessed.
@@ -XXX,XX +XXX,XX @@ static void pmevtyper_write(CPUARMState *env, const ARMCPRegInfo *ri,
          env->cp15.c14_pmevtyper[counter] = value & PMXEVTYPER_MASK;
          pmevcntr_op_finish(env, counter);
      }
 -    /* Attempts to access PMXEVTYPER are CONSTRAINED UNPREDICTABLE when
 +    /*
 +     * Attempts to access PMXEVTYPER are CONSTRAINED UNPREDICTABLE when
       * PMSELR value is equal to or greater than the number of implemented
       * counters, but not equal to 0x1f. We opt to behave as a RAZ/WI.
       */
@@ -XXX,XX +XXX,XX @@ static uint64_t pmevcntr_read(CPUARMState *env, const ARMCPRegInfo *ri,
          }
          return ret;
      } else {
 -      /* We opt to behave as a RAZ/WI when attempts to access PM[X]EVCNTR
 -       * are CONSTRAINED UNPREDICTABLE. */
 +      /*
 +       * We opt to behave as a RAZ/WI when attempts to access PM[X]EVCNTR
 +       * are CONSTRAINED UNPREDICTABLE.
 +       */
          return 0;
      }
  }
@@ -XXX,XX +XXX,XX @@ static void pmintenclr_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static void vbar_write(CPUARMState *env, const ARMCPRegInfo *ri,
                         uint64_t value)
  {
 -    /* Note that even though the AArch64 view of this register has bits
 +    /*
 +     * Note that even though the AArch64 view of this register has bits
       * [10:0] all RES0 we can only mask the bottom 5, to comply with the
       * architectural requirements for bits which are RES0 only in some
       * contexts. (ARMv8 would permit us to do no masking at all, but ARMv7
@@ -XXX,XX +XXX,XX @@ static void scr_write(CPUARMState *env, const ARMCPRegInfo *ri, uint64_t value)
      if (!arm_feature(env, ARM_FEATURE_EL2)) {
          valid_mask &= ~SCR_HCE;
 -        /* On ARMv7, SMD (or SCD as it is called in v7) is only
 +        /*
 +         * On ARMv7, SMD (or SCD as it is called in v7) is only
           * supported if EL2 exists. The bit is UNK/SBZP when
           * EL2 is unavailable. In QEMU ARMv7, we force it to always zero
           * when EL2 is unavailable.
@@ -XXX,XX +XXX,XX @@ static uint64_t ccsidr_read(CPUARMState *env, const ARMCPRegInfo *ri)
  {
      ARMCPU *cpu = env_archcpu(env);
 -    /* Acquire the CSSELR index from the bank corresponding to the CCSIDR
 +    /*
 +     * Acquire the CSSELR index from the bank corresponding to the CCSIDR
       * bank
       */
      uint32_t index = A32_BANKED_REG_GET(env, csselr,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
      /* the old v6 WFI, UNPREDICTABLE in v7 but we choose to NOP */
      { .name = "NOP", .cp = 15, .crn = 7, .crm = 0, .opc1 = 0, .opc2 = 4,
        .access = PL1_W, .type = ARM_CP_NOP },
 -    /* Performance monitors are implementation defined in v7,
 +    /*
 +     * Performance monitors are implementation defined in v7,
       * but with an ARM recommended set of registers, which we
       * follow.
       *
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
        .writefn = csselr_write, .resetvalue = 0,
        .bank_fieldoffsets = { offsetof(CPUARMState, cp15.csselr_s),
                               offsetof(CPUARMState, cp15.csselr_ns) } },
 -    /* Auxiliary ID register: this actually has an IMPDEF value but for now
 +    /*
 +     * Auxiliary ID register: this actually has an IMPDEF value but for now
       * just RAZ for all cores:
       */
      { .name = "AIDR", .state = ARM_CP_STATE_BOTH,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
        .access = PL1_R, .type = ARM_CP_CONST,
        .accessfn = access_aa64_tid1,
        .resetvalue = 0 },
 -    /* Auxiliary fault status registers: these also are IMPDEF, and we
 +    /*
 +     * Auxiliary fault status registers: these also are IMPDEF, and we
       * choose to RAZ/WI for all cores.
       */
      { .name = "AFSR0_EL1", .state = ARM_CP_STATE_BOTH,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
        .opc0 = 3, .opc1 = 0, .crn = 5, .crm = 1, .opc2 = 1,
        .access = PL1_RW, .accessfn = access_tvm_trvm,
        .type = ARM_CP_CONST, .resetvalue = 0 },
 -    /* MAIR can just read-as-written because we don't implement caches
 +    /*
 +     * MAIR can just read-as-written because we don't implement caches
       * and so don't need to care about memory attributes.
       */
      { .name = "MAIR_EL1", .state = ARM_CP_STATE_AA64,
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
        .opc0 = 3, .opc1 = 6, .crn = 10, .crm = 2, .opc2 = 0,
        .access = PL3_RW, .fieldoffset = offsetof(CPUARMState, cp15.mair_el[3]),
        .resetvalue = 0 },
 -    /* For non-long-descriptor page tables these are PRRR and NMRR;
 +    /*
 +     * For non-long-descriptor page tables these are PRRR and NMRR;
       * regardless they still act as reads-as-written for QEMU.
       */
 -     /* MAIR0/1 are defined separately from their 64-bit counterpart which
 +     /*
 +      * MAIR0/1 are defined separately from their 64-bit counterpart which
        * allows them to assign the correct fieldoffset based on the endianness
        * handled in the field definitions.
        */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6k_cp_reginfo[] = {
  static CPAccessResult gt_cntfrq_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                         bool isread)
  {
 -    /* CNTFRQ: not visible from PL0 if both PL0PCTEN and PL0VCTEN are zero.
 +    /*
 +     * CNTFRQ: not visible from PL0 if both PL0PCTEN and PL0VCTEN are zero.
       * Writable only at the highest implemented exception level.
       */
      int el = arm_current_el(env);
@@ -XXX,XX +XXX,XX @@ static CPAccessResult gt_stimer_access(CPUARMState *env,
                                         const ARMCPRegInfo *ri,
                                         bool isread)
  {
 -    /* The AArch64 register view of the secure physical timer is
 +    /*
 +     * The AArch64 register view of the secure physical timer is
       * always accessible from EL3, and configurably accessible from
       * Secure EL1.
       */
@@ -XXX,XX +XXX,XX @@ static void gt_recalc_timer(ARMCPU *cpu, int timeridx)
      ARMGenericTimer *gt = &cpu->env.cp15.c14_timer[timeridx];
      if (gt->ctl & 1) {
 -        /* Timer enabled: calculate and set current ISTATUS, irq, and
 +        /*
 +         * Timer enabled: calculate and set current ISTATUS, irq, and
           * reset timer to when ISTATUS next has to change
           */
          uint64_t offset = timeridx == GTIMER_VIRT ?
@@ -XXX,XX +XXX,XX @@ static void gt_recalc_timer(ARMCPU *cpu, int timeridx)
              /* Next transition is when we hit cval */
              nexttick = gt->cval + offset;
          }
 -        /* Note that the desired next expiry time might be beyond the
 +        /*
 +         * Note that the desired next expiry time might be beyond the
           * signed-64-bit range of a QEMUTimer -- in this case we just
           * set the timer for as far in the future as possible. When the
           * timer expires we will reset the timer for any remaining period.
@@ -XXX,XX +XXX,XX @@ static void gt_ctl_write(CPUARMState *env, const ARMCPRegInfo *ri,
          /* Enable toggled */
          gt_recalc_timer(cpu, timeridx);
      } else if ((oldval ^ value) & 2) {
 -        /* IMASK toggled: don't need to recalculate,
 +        /*
 +         * IMASK toggled: don't need to recalculate,
           * just set the interrupt line based on ISTATUS
           */
          int irqstate = (oldval & 4) && !(value & 2);
@@ -XXX,XX +XXX,XX @@ static void arm_gt_cntfrq_reset(CPUARMState *env, const ARMCPRegInfo *opaque)
  }
  static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
 -    /* Note that CNTFRQ is purely reads-as-written for the benefit
 +    /*
 +     * Note that CNTFRQ is purely reads-as-written for the benefit
       * of software; writing it doesn't actually change the timer frequency.
       * Our reset value matches the fixed frequency we implement the timer at.
       */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
        .readfn = gt_virt_redir_cval_read, .raw_readfn = raw_read,
        .writefn = gt_virt_redir_cval_write, .raw_writefn = raw_write,
      },
 -    /* Secure timer -- this is actually restricted to only EL3
 +    /*
 +     * Secure timer -- this is actually restricted to only EL3
       * and configurably Secure-EL1 via the accessfn.
       */
      { .name = "CNTPS_TVAL_EL1", .state = ARM_CP_STATE_AA64,
@@ -XXX,XX +XXX,XX @@ static CPAccessResult e2h_access(CPUARMState *env, const ARMCPRegInfo *ri,
  #else
 -/* In user-mode most of the generic timer registers are inaccessible
 +/*
 + * In user-mode most of the generic timer registers are inaccessible
   * however modern kernels (4.12+) allow access to cntvct_el0
   */
@@ -XXX,XX +XXX,XX @@ static uint64_t gt_virt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
  {
      ARMCPU *cpu = env_archcpu(env);
 -    /* Currently we have no support for QEMUTimer in linux-user so we
 +    /*
 +     * Currently we have no support for QEMUTimer in linux-user so we
       * can't call gt_get_countervalue(env), instead we directly
       * call the lower level functions.
       */
@@ -XXX,XX +XXX,XX @@ static CPAccessResult ats_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                   bool isread)
  {
      if (ri->opc2 & 4) {
 -        /* The ATS12NSO* operations must trap to EL3 or EL2 if executed in
 +        /*
 +         * The ATS12NSO* operations must trap to EL3 or EL2 if executed in
           * Secure EL1 (which can only happen if EL3 is AArch64).
           * They are simply UNDEF if executed from NS EL1.
           * They function normally from EL2 or EL3.
@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
              }
          }
      } else {
 -        /* fsr is a DFSR/IFSR value for the short descriptor
 +        /*
 +         * fsr is a DFSR/IFSR value for the short descriptor
           * translation table format (with WnR always clear).
           * Convert it to a 32-bit PAR.
           */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo pmsav8r_cp_reginfo[] = {
  };
  static const ARMCPRegInfo pmsav7_cp_reginfo[] = {
 -    /* Reset for all these registers is handled in arm_cpu_reset(),
 +    /*
 +     * Reset for all these registers is handled in arm_cpu_reset(),
       * because the PMSAv7 is also used by M-profile CPUs, which do
       * not register cpregs but still need the state to be reset.
       */
@@ -XXX,XX +XXX,XX @@ static void vmsa_ttbcr_write(CPUARMState *env, const ARMCPRegInfo *ri,
      }
      if (arm_feature(env, ARM_FEATURE_LPAE)) {
 -        /* With LPAE the TTBCR could result in a change of ASID
 +        /*
 +         * With LPAE the TTBCR could result in a change of ASID
           * via the TTBCR.A1 bit, so do a TLB flush.
           */
          tlb_flush(CPU(cpu));
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo vmsa_cp_reginfo[] = {
                               offsetoflow32(CPUARMState, cp15.tcr_el[1])} },
  };
 -/* Note that unlike TTBCR, writing to TTBCR2 does not require flushing
 +/*
 + * Note that unlike TTBCR, writing to TTBCR2 does not require flushing
   * qemu tlbs nor adjusting cached masks.
   */
  static const ARMCPRegInfo ttbcr2_reginfo = {
@@ -XXX,XX +XXX,XX @@ static void omap_wfi_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static void omap_cachemaint_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                    uint64_t value)
  {
 -    /* On OMAP there are registers indicating the max/min index of dcache lines
 +    /*
 +     * On OMAP there are registers indicating the max/min index of dcache lines
       * containing a dirty line; cache flush operations have to reset these.
       */
      env->cp15.c15_i_max = 0x000;
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo omap_cp_reginfo[] = {
        .crm = 8, .opc1 = 0, .opc2 = 0, .access = PL1_RW,
        .type = ARM_CP_NO_RAW,
        .readfn = arm_cp_read_zero, .writefn = omap_wfi_write, },
 -    /* TODO: Peripheral port remap register:
 +    /*
 +     * TODO: Peripheral port remap register:
       * On OMAP2 mcr p15, 0, rn, c15, c2, 4 sets up the interrupt controller
       * base address at $rn & ~0xfff and map size of 0x200 << ($rn & 0xfff),
       * when MMU is off.
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo xscale_cp_reginfo[] = {
        .cp = 15, .crn = 1, .crm = 0, .opc1 = 0, .opc2 = 1, .access = PL1_RW,
        .fieldoffset = offsetof(CPUARMState, cp15.c1_xscaleauxcr),
        .resetvalue = 0, },
 -    /* XScale specific cache-lockdown: since we have no cache we NOP these
 +    /*
 +     * XScale specific cache-lockdown: since we have no cache we NOP these
       * and hope the guest does not really rely on cache behaviour.
       */
      { .name = "XSCALE_LOCK_ICACHE_LINE",
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo xscale_cp_reginfo[] = {
  };
  static const ARMCPRegInfo dummy_c15_cp_reginfo[] = {
 -    /* RAZ/WI the whole crn=15 space, when we don't have a more specific
 +    /*
 +     * RAZ/WI the whole crn=15 space, when we don't have a more specific
       * implementation of this implementation-defined space.
       * Ideally this should eventually disappear in favour of actually
       * implementing the correct behaviour for all cores.
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo cache_block_ops_cp_reginfo[] = {
  };
  static const ARMCPRegInfo cache_test_clean_cp_reginfo[] = {
 -    /* The cache test-and-clean instructions always return (1 << 30)
 +    /*
 +     * The cache test-and-clean instructions always return (1 << 30)
       * to indicate that there are no dirty cache lines.
       */
      { .name = "TC_DCACHE", .cp = 15, .crn = 7, .crm = 10, .opc1 = 0, .opc2 = 3,
@@ -XXX,XX +XXX,XX @@ static uint64_t mpidr_read_val(CPUARMState *env)
      if (arm_feature(env, ARM_FEATURE_V7MP)) {
          mpidr |= (1U << 31);
 -        /* Cores which are uniprocessor (non-coherent)
 +        /*
 +         * Cores which are uniprocessor (non-coherent)
           * but still implement the MP extensions set
           * bit 30. (For instance, Cortex-R5).
           */
@@ -XXX,XX +XXX,XX @@ static CPAccessResult access_tocu(CPUARMState *env, const ARMCPRegInfo *ri,
      return do_cacheop_pou_access(env, HCR_TOCU | HCR_TPU);
  }
 -/* See: D4.7.2 TLB maintenance requirements and the TLB maintenance instructions
 +/*
 + * See: D4.7.2 TLB maintenance requirements and the TLB maintenance instructions
   * Page D4-1736 (DDI0487A.b)
   */
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_alle3is_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
 -    /* Invalidate by VA, EL2
 +    /*
 +     * Invalidate by VA, EL2
       * Currently handles both VAE2 and VALE2, since we don't support
       * flush-last-level-only.
       */
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae2_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static void tlbi_aa64_vae3_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
 -    /* Invalidate by VA, EL3
 +    /*
 +     * Invalidate by VA, EL3
       * Currently handles both VAE3 and VALE3, since we don't support
       * flush-last-level-only.
       */
@@ -XXX,XX +XXX,XX @@ static void tlbi_aa64_vae1is_write(CPUARMState *env, const ARMCPRegInfo *ri,
  static void tlbi_aa64_vae1_write(CPUARMState *env, const ARMCPRegInfo *ri,
                                   uint64_t value)
  {
 -    /* Invalidate by VA, EL1&0 (AArch64 version).
 +    /*
 +     * Invalidate by VA, EL1&0 (AArch64 version).
       * Currently handles all of VAE1, VAAE1, VAALE1 and VALE1,
       * since we don't support flush-for-specific-ASID-only or
       * flush-last-level-only.
@@ -XXX,XX +XXX,XX @@ static CPAccessResult sp_el0_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                      bool isread)
  {
      if (!(env->pstate & PSTATE_SP)) {
 -        /* Access to SP_EL0 is undefined if it's being used as
 +        /*
 +         * Access to SP_EL0 is undefined if it's being used as
           * the stack pointer.
           */
          return CP_ACCESS_TRAP_UNCATEGORIZED;
@@ -XXX,XX +XXX,XX @@ static void sctlr_write(CPUARMState *env, const ARMCPRegInfo *ri,
      }
      if (raw_read(env, ri) == value) {
 -        /* Skip the TLB flush if nothing actually changed; Linux likes
 +        /*
 +         * Skip the TLB flush if nothing actually changed; Linux likes
           * to do a lot of pointless SCTLR writes.
           */
          return;
+@@ -XXX,XX +XXX,XX @@ static void mdcr_el2_write(CPUARMState *env, const ARMCPRegInfo *ri,
-     case 0x04: /* SRSHR / URSHR (rounding) */
+ }
--        break;
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift,
+ static const ARMCPRegInfo v8_cp_reginfo[] = {
-+                      is_u ? gen_gvec_urshr : gen_gvec_srshr, size);
+-    /* Minimal set of EL0-visible registers. This will need to be expanded
-+        return;
++    /*
-+
++     * Minimal set of EL0-visible registers. This will need to be expanded
-     case 0x06: /* SRSRA / URSRA (accum + rounding) */
+      * significantly for system emulation of AArch64 CPUs.
--        accumulate = true;
+      */
--        break;
+     { .name = "NZCV", .state = ARM_CP_STATE_AA64,
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift,
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v8_cp_reginfo[] = {
-+                      is_u ? gen_gvec_ursra : gen_gvec_srsra, size);
+       .opc0 = 3, .opc1 = 0, .crn = 4, .crm = 0, .opc2 = 0,
-+        return;
+       .access = PL1_RW,
-+
+       .fieldoffset = offsetof(CPUARMState, banked_spsr[BANK_SVC]) },
 -    /* We rely on the access checks not allowing the guest to write to the
 +    /*
 +     * We rely on the access checks not allowing the guest to write to the
       * state field when SPSel indicates that it's being used as the stack
       * pointer.
       */
@@ -XXX,XX +XXX,XX @@ static void do_hcr_write(CPUARMState *env, uint64_t value, uint64_t valid_mask)
      if (arm_feature(env, ARM_FEATURE_EL3)) {
          valid_mask &= ~HCR_HCD;
      } else if (cpu->psci_conduit != QEMU_PSCI_CONDUIT_SMC) {
 -        /* Architecturally HCR.TSC is RES0 if EL3 is not implemented.
 +        /*
 +         * Architecturally HCR.TSC is RES0 if EL3 is not implemented.
           * However, if we're using the SMC PSCI conduit then QEMU is
           * effectively acting like EL3 firmware and so the guest at
           * EL2 should retain the ability to prevent EL1 from being
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
        .access = PL2_W, .type = ARM_CP_NO_RAW | ARM_CP_EL3_NO_EL2_UNDEF,
        .writefn = tlbi_aa64_vae2is_write },
  #ifndef CONFIG_USER_ONLY
 -    /* Unlike the other EL2-related AT operations, these must
 +    /*
 +     * Unlike the other EL2-related AT operations, these must
       * UNDEF from EL3 if EL2 is not implemented, which is why we
       * define them here rather than with the rest of the AT ops.
       */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
        .access = PL2_W, .accessfn = at_s1e2_access,
        .type = ARM_CP_NO_RAW | ARM_CP_RAISES_EXC | ARM_CP_EL3_NO_EL2_UNDEF,
        .writefn = ats_write64 },
 -    /* The AArch32 ATS1H* operations are CONSTRAINED UNPREDICTABLE
 +    /*
 +     * The AArch32 ATS1H* operations are CONSTRAINED UNPREDICTABLE
       * if EL2 is not implemented; we choose to UNDEF. Behaviour at EL3
       * with SCR.NS == 0 outside Monitor mode is UNPREDICTABLE; we choose
       * to behave as if SCR.NS was 1.
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_cp_reginfo[] = {
        .writefn = ats1h_write, .type = ARM_CP_NO_RAW | ARM_CP_RAISES_EXC },
      { .name = "CNTHCTL_EL2", .state = ARM_CP_STATE_BOTH,
        .opc0 = 3, .opc1 = 4, .crn = 14, .crm = 1, .opc2 = 0,
 -      /* ARMv7 requires bit 0 and 1 to reset to 1. ARMv8 defines the
 +      /*
 +       * ARMv7 requires bit 0 and 1 to reset to 1. ARMv8 defines the
         * reset values as IMPDEF. We choose to reset to 3 to comply with
         * both ARMv7 and ARMv8.
         */
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el2_sec_cp_reginfo[] = {
  static CPAccessResult nsacr_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                     bool isread)
  {
 -    /* The NSACR is RW at EL3, and RO for NS EL1 and NS EL2.
 +    /*
 +     * The NSACR is RW at EL3, and RO for NS EL1 and NS EL2.
       * At Secure EL1 it traps to EL3 or EL2.
       */
      if (arm_current_el(env) == 3) {
@@ -XXX,XX +XXX,XX @@ static void define_pmu_regs(ARMCPU *cpu)
      }
  }
 -/* We don't know until after realize whether there's a GICv3
 +/*
 + * We don't know until after realize whether there's a GICv3
   * attached, and that is what registers the gicv3 sysregs.
   * So we have to fill in the GIC fields in ID_PFR/ID_PFR1_EL1/ID_AA64PFR0_EL1
   * at runtime.
@@ -XXX,XX +XXX,XX @@ static uint64_t id_aa64pfr0_read(CPUARMState *env, const ARMCPRegInfo *ri)
  }
  #endif
 -/* Shared logic between LORID and the rest of the LOR* registers.
 +/*
 + * Shared logic between LORID and the rest of the LOR* registers.
   * Secure state exclusion has already been dealt with.
   */
  static CPAccessResult access_lor_ns(CPUARMState *env,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
      define_arm_cp_regs(cpu, cp_reginfo);
      if (!arm_feature(env, ARM_FEATURE_V8)) {
 -        /* Must go early as it is full of wildcards that may be
 +        /*
 +         * Must go early as it is full of wildcards that may be
           * overridden by later definitions.
           */
          define_arm_cp_regs(cpu, not_v8_cp_reginfo);
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
                .resetvalue = cpu->isar.id_pfr0 },
 -            /* ID_PFR1 is not a plain ARM_CP_CONST because we don't know
 +            /*
 +             * ID_PFR1 is not a plain ARM_CP_CONST because we don't know
               * the value of the GIC field until after we define these regs.
               */
              { .name = "ID_PFR1", .state = ARM_CP_STATE_BOTH,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          define_arm_cp_regs(cpu, el3_regs);
      }
 -    /* The behaviour of NSACR is sufficiently various that we don't
 +    /*
 +     * The behaviour of NSACR is sufficiently various that we don't
       * try to describe it in a single reginfo:
       *  if EL3 is 64 bit, then trap to EL3 from S EL1,
       *     reads as constant 0xc00 from NS EL1 and NS EL2
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
      if (cpu_isar_feature(aa32_jazelle, cpu)) {
          define_arm_cp_regs(cpu, jazelle_regs);
      }
 -    /* Slightly awkwardly, the OMAP and StrongARM cores need all of
 +    /*
 +     * Slightly awkwardly, the OMAP and StrongARM cores need all of
       * cp15 crn=0 to be writes-ignored, whereas for other cores they should
       * be read-only (ie write causes UNDEF exception).
       */
      {
          ARMCPRegInfo id_pre_v8_midr_cp_reginfo[] = {
 -            /* Pre-v8 MIDR space.
 +            /*
 +             * Pre-v8 MIDR space.
               * Note that the MIDR isn't a simple constant register because
               * of the TI925 behaviour where writes to another register can
               * cause the MIDR value to change.
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          if (arm_feature(env, ARM_FEATURE_OMAPCP) ||
              arm_feature(env, ARM_FEATURE_STRONGARM)) {
              size_t i;
 -            /* Register the blanket "writes ignored" value first to cover the
 +            /*
 +             * Register the blanket "writes ignored" value first to cover the
               * whole space. Then update the specific ID registers to allow write
               * access, so that they ignore writes rather than causing them to
               * UNDEF.
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
              .raw_writefn = raw_write,
          };
          if (arm_feature(env, ARM_FEATURE_XSCALE)) {
 -            /* Normally we would always end the TB on an SCTLR write, but Linux
 +            /*
 +             * Normally we would always end the TB on an SCTLR write, but Linux
               * arch/arm/mach-pxa/sleep.S expects two instructions following
               * an MMU enable to execute from cache.  Imitate this behaviour.
               */
@@ -XXX,XX +XXX,XX @@ static void add_cpreg_to_hashtable(ARMCPU *cpu, const ARMCPRegInfo *r,
  void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
                                         const ARMCPRegInfo *r, void *opaque)
  {
 -    /* Define implementations of coprocessor registers.
 +    /*
 +     * Define implementations of coprocessor registers.
       * We store these in a hashtable because typically
       * there are less than 150 registers in a space which
       * is 16*16*16*8*8 = 262144 in size.
@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
      default:
          g_assert_not_reached();
      }
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+-    /* The AArch64 pseudocode CheckSystemAccess() specifies that op1
-index XXXXXXX..XXXXXXX 100644
++    /*
---- a/target/arm/translate.c
++     * The AArch64 pseudocode CheckSystemAccess() specifies that op1
-+++ b/target/arm/translate.c
+      * encodes a minimum access level for the register. We roll this
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+      * runtime check into our general permission check code, so check
-     }
+      * here that the reginfo's specified permissions are strict enough
- }
+@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
+         assert((r->access & ~mask) == 0);
-+/*
+     }
-+ * Shift one less than the requested amount, and the low bit is
-+ * the rounding bit.  For the 8 and 16-bit operations, because we
+-    /* Check that the register definition has enough info to handle
-+ * mask the low bit, we can perform a normal integer shift instead
++    /*
-+ * of a vector shift.
++     * Check that the register definition has enough info to handle
-+ */
+      * reads and writes if they are permitted.
-+static void gen_srshr8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
+      */
-+{
+     if (!(r->type & (ARM_CP_SPECIAL_MASK | ARM_CP_CONST))) {
-+    TCGv_i64 t = tcg_temp_new_i64();
+@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
-+
+                         continue;
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_8, 1));
 +    tcg_gen_vec_sar8i_i64(d, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srshr16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_16, 1));
 +    tcg_gen_vec_sar16i_i64(d, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srshr32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    tcg_gen_extract_i32(t, a, sh - 1, 1);
 +    tcg_gen_sari_i32(d, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_srshr64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_extract_i64(t, a, sh - 1, 1);
 +    tcg_gen_sari_i64(d, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srshr_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec ones = tcg_temp_new_vec_matching(d);
 +
 +    tcg_gen_shri_vec(vece, t, a, sh - 1);
 +    tcg_gen_dupi_vec(vece, ones, 1);
 +    tcg_gen_and_vec(vece, t, t, ones);
 +    tcg_gen_sari_vec(vece, d, a, sh);
 +    tcg_gen_add_vec(vece, d, d, t);
 +
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(ones);
 +}
 +
 +void gen_gvec_srshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_sari_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_srshr8_i64,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_srshr16_i64,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_srshr32_i32,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_srshr64_i64,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    if (shift == (8 << vece)) {
 +        /*
 +         * Shifts larger than the element size are architecturally valid.
 +         * Signed results in all sign bits.  With rounding, this produces
 +         *   (-1 + 1) >> 1 == 0, or (0 + 1) >> 1 == 0.
 +         * I.e. always zero.
 +         */
 +        tcg_gen_gvec_dup_imm(vece, rd_ofs, opr_sz, max_sz, 0);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_srsra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_srshr8_i64(t, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srsra16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_srshr16_i64(t, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srsra32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    gen_srshr32_i32(t, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_srsra64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_srshr64_i64(t, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srsra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    gen_srshr_vec(vece, t, a, sh);
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_sari_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_srsra8_i64,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fni8 = gen_srsra16_i64,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_srsra32_i32,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_srsra64_i64,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    /*
 +     * Shifts larger than the element size are architecturally valid.
 +     * Signed results in all sign bits.  With rounding, this produces
 +     *   (-1 + 1) >> 1 == 0, or (0 + 1) >> 1 == 0.
 +     * I.e. always zero.  With accumulation, this leaves D unchanged.
 +     */
 +    if (shift == (8 << vece)) {
 +        /* Nop, but we do need to clear the tail. */
 +        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_urshr8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_8, 1));
 +    tcg_gen_vec_shr8i_i64(d, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_16, 1));
 +    tcg_gen_vec_shr16i_i64(d, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    tcg_gen_extract_i32(t, a, sh - 1, 1);
 +    tcg_gen_shri_i32(d, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_urshr64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_extract_i64(t, a, sh - 1, 1);
 +    tcg_gen_shri_i64(d, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t shift)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec ones = tcg_temp_new_vec_matching(d);
 +
 +    tcg_gen_shri_vec(vece, t, a, shift - 1);
 +    tcg_gen_dupi_vec(vece, ones, 1);
 +    tcg_gen_and_vec(vece, t, t, ones);
 +    tcg_gen_shri_vec(vece, d, a, shift);
 +    tcg_gen_add_vec(vece, d, d, t);
 +
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(ones);
 +}
 +
 +void gen_gvec_urshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_urshr8_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_urshr16_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_urshr32_i32,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_urshr64_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    if (shift == (8 << vece)) {
 +        /*
 +         * Shifts larger than the element size are architecturally valid.
 +         * Unsigned results in zero.  With rounding, this produces a
 +         * copy of the most significant bit.
 +         */
 +        tcg_gen_gvec_shri(vece, rd_ofs, rm_ofs, shift - 1, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_ursra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 8) {
 +        tcg_gen_vec_shr8i_i64(t, a, 7);
 +    } else {
 +        gen_urshr8_i64(t, a, sh);
 +    }
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 16) {
 +        tcg_gen_vec_shr16i_i64(t, a, 15);
 +    } else {
 +        gen_urshr16_i64(t, a, sh);
 +    }
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    if (sh == 32) {
 +        tcg_gen_shri_i32(t, a, 31);
 +    } else {
 +        gen_urshr32_i32(t, a, sh);
 +    }
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_ursra64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 64) {
 +        tcg_gen_shri_i64(t, a, 63);
 +    } else {
 +        gen_urshr64_i64(t, a, sh);
 +    }
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    if (sh == (8 << vece)) {
 +        tcg_gen_shri_vec(vece, t, a, sh - 1);
 +    } else {
 +        gen_urshr_vec(vece, t, a, sh);
 +    }
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_ursra8_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fni8 = gen_ursra16_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_ursra32_i32,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_ursra64_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +}
 +
  static void gen_shr8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
      uint64_t mask = dup_const(MO_8, 0xff >> shift);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                      }
-                     return 0;
+                     if (state == ARM_CP_STATE_AA32) {
+-                        /* Under AArch32 CP registers can be common
-+                case 2: /* VRSHR */
++                        /*
-+                    /* Right shift comes here negative.  */
++                         * Under AArch32 CP registers can be common
-+                    shift = -shift;
+                          * (same for secure and non-secure world) or banked.
-+                    if (u) {
+                          */
-+                        gen_gvec_urshr(size, rd_ofs, rm_ofs, shift,
+                         char *name;
-+                                       vec_size, vec_size);
+@@ -XXX,XX +XXX,XX @@ void define_one_arm_cp_reg_with_opaque(ARMCPU *cpu,
 +                    } else {
 +                        gen_gvec_srshr(size, rd_ofs, rm_ofs, shift,
 +                                       vec_size, vec_size);
 +                    }
 +                    return 0;
 +
 +                case 3: /* VRSRA */
 +                    /* Right shift comes here negative.  */
 +                    shift = -shift;
 +                    if (u) {
 +                        gen_gvec_ursra(size, rd_ofs, rm_ofs, shift,
 +                                       vec_size, vec_size);
 +                    } else {
 +                        gen_gvec_srsra(size, rd_ofs, rm_ofs, shift,
 +                                       vec_size, vec_size);
 +                    }
 +                    return 0;
 +
                  case 4: /* VSRI */
                      if (!u) {
                          return 1;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                          neon_load_reg64(cpu_V0, rm + pass);
                          tcg_gen_movi_i64(cpu_V1, imm);
                          switch (op) {
 -                        case 2: /* VRSHR */
 -                        case 3: /* VRSRA */
 -                            if (u)
 -                                gen_helper_neon_rshl_u64(cpu_V0, cpu_V0, cpu_V1);
 -                            else
 -                                gen_helper_neon_rshl_s64(cpu_V0, cpu_V0, cpu_V1);
 -                            break;
                          case 6: /* VQSHLU */
                              gen_helper_neon_qshlu_s64(cpu_V0, cpu_env,
                                                        cpu_V0, cpu_V1);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                          default:
                              g_assert_not_reached();
                          }
--                        if (op == 3) {
+                     } else {
--                            /* Accumulate.  */
+-                        /* AArch64 registers get mapped to non-secure instance
--                            neon_load_reg64(cpu_V1, rd + pass);
+-                         * of AArch32 */
--                            tcg_gen_add_i64(cpu_V0, cpu_V0, cpu_V1);
++                        /*
--                        }
++                         * AArch64 registers get mapped to non-secure instance
-                         neon_store_reg64(cpu_V0, rd + pass);
++                         * of AArch32
-                     } else { /* size < 3 */
++                         */
-                         /* Operands in T0 and T1.  */
+                         add_cpreg_to_hashtable(cpu, r, opaque, state,
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+                                                ARM_CP_SECSTATE_NS,
-                         tmp2 = tcg_temp_new_i32();
+                                                crm, opc1, opc2, r->name);
-                         tcg_gen_movi_i32(tmp2, imm);
+@@ -XXX,XX +XXX,XX @@ void arm_cp_reset_ignore(CPUARMState *env, const ARMCPRegInfo *opaque)
-                         switch (op) {
--                        case 2: /* VRSHR */
+ static int bad_mode_switch(CPUARMState *env, int mode, CPSRWriteType write_type)
--                        case 3: /* VRSRA */
+ {
--                            GEN_NEON_INTEGER_OP(rshl);
+-    /* Return true if it is not valid for us to switch to
--                            break;
++    /*
-                         case 6: /* VQSHLU */
++     * Return true if it is not valid for us to switch to
-                             switch (size) {
+      * this CPU mode (ie all the UNPREDICTABLE cases in
-                             case 0:
+      * the ARM ARM CPSRWriteByInstr pseudocode).
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+      */
-                             g_assert_not_reached();
+@@ -XXX,XX +XXX,XX @@ static int bad_mode_switch(CPUARMState *env, int mode, CPSRWriteType write_type)
-                         }
+     case ARM_CPU_MODE_UND:
-                         tcg_temp_free_i32(tmp2);
+     case ARM_CPU_MODE_IRQ:
--
+     case ARM_CPU_MODE_FIQ:
--                        if (op == 3) {
+-        /* Note that we don't implement the IMPDEF NSACR.RFR which in v7
--                            /* Accumulate.  */
++        /*
--                            tmp2 = neon_load_reg(rd, pass);
++         * Note that we don't implement the IMPDEF NSACR.RFR which in v7
--                            gen_neon_add(size, tmp, tmp2);
+          * allows FIQ mode to be Secure-only. (In v8 this doesn't exist.)
--                            tcg_temp_free_i32(tmp2);
+          */
--                        }
+-        /* If HCR.TGE is set then changes from Monitor to NS PL1 via MSR
-                         neon_store_reg(rd, pass, tmp);
++        /*
-                     }
++         * If HCR.TGE is set then changes from Monitor to NS PL1 via MSR
-                 } /* for pass */
+          * and CPS are treated as illegal mode changes.
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+          */
-index XXXXXXX..XXXXXXX 100644
+         if (write_type == CPSRWriteByInstr &&
---- a/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-+++ b/target/arm/vec_helper.c
+         env->GE = (val >> 16) & 0xf;
-@@ -XXX,XX +XXX,XX @@ DO_SRA(gvec_usra_d, uint64_t)
+     }
- #undef DO_SRA
+-    /* In a V7 implementation that includes the security extensions but does
++    /*
-+#define DO_RSHR(NAME, TYPE)                             \
++     * In a V7 implementation that includes the security extensions but does
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
+      * not include Virtualization Extensions the SCR.FW and SCR.AW bits control
-+{                                                       \
+      * whether non-secure software is allowed to change the CPSR_F and CPSR_A
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
+      * bits respectively.
-+    int shift = simd_data(desc);                        \
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-+    TYPE *d = vd, *n = vn;                              \
+         changed_daif = (env->daif ^ val) & mask;
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        TYPE tmp = n[i] >> (shift - 1);                 \
+         if (changed_daif & CPSR_A) {
-+        d[i] = (tmp >> 1) + (tmp & 1);                  \
+-            /* Check to see if we are allowed to change the masking of async
-+    }                                                   \
++            /*
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
++             * Check to see if we are allowed to change the masking of async
-+}
+              * abort exceptions from a non-secure state.
-+
+              */
-+DO_RSHR(gvec_srshr_b, int8_t)
+             if (!(env->cp15.scr_el3 & SCR_AW)) {
-+DO_RSHR(gvec_srshr_h, int16_t)
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-+DO_RSHR(gvec_srshr_s, int32_t)
+         }
-+DO_RSHR(gvec_srshr_d, int64_t)
-+
+         if (changed_daif & CPSR_F) {
-+DO_RSHR(gvec_urshr_b, uint8_t)
+-            /* Check to see if we are allowed to change the masking of FIQ
-+DO_RSHR(gvec_urshr_h, uint16_t)
++            /*
-+DO_RSHR(gvec_urshr_s, uint32_t)
++             * Check to see if we are allowed to change the masking of FIQ
-+DO_RSHR(gvec_urshr_d, uint64_t)
+              * exceptions from a non-secure state.
-+
+              */
-+#undef DO_RSHR
+             if (!(env->cp15.scr_el3 & SCR_FW)) {
-+
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-+#define DO_RSRA(NAME, TYPE)                             \
+                 mask &= ~CPSR_F;
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
+             }
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
+-            /* Check whether non-maskable FIQ (NMFI) support is enabled.
-+    int shift = simd_data(desc);                        \
++            /*
-+    TYPE *d = vd, *n = vn;                              \
++             * Check whether non-maskable FIQ (NMFI) support is enabled.
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
+              * If this bit is set software is not allowed to mask
-+        TYPE tmp = n[i] >> (shift - 1);                 \
+              * FIQs, but is allowed to set CPSR_F to 0.
-+        d[i] += (tmp >> 1) + (tmp & 1);                 \
+              */
-+    }                                                   \
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
+     if (write_type != CPSRWriteRaw &&
-+}
+         ((env->uncached_cpsr ^ val) & mask & CPSR_M)) {
-+
+         if ((env->uncached_cpsr & CPSR_M) == ARM_CPU_MODE_USR) {
-+DO_RSRA(gvec_srsra_b, int8_t)
+-            /* Note that we can only get here in USR mode if this is a
-+DO_RSRA(gvec_srsra_h, int16_t)
++            /*
-+DO_RSRA(gvec_srsra_s, int32_t)
++             * Note that we can only get here in USR mode if this is a
-+DO_RSRA(gvec_srsra_d, int64_t)
+              * gdb stub write; for this case we follow the architectural
-+
+              * behaviour for guest writes in USR mode of ignoring an attempt
-+DO_RSRA(gvec_ursra_b, uint8_t)
+              * to switch mode. (Those are caught by translate.c for writes
-+DO_RSRA(gvec_ursra_h, uint16_t)
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-+DO_RSRA(gvec_ursra_s, uint32_t)
+              */
-+DO_RSRA(gvec_ursra_d, uint64_t)
+             mask &= ~CPSR_M;
-+
+         } else if (bad_mode_switch(env, val & CPSR_M, write_type)) {
-+#undef DO_RSRA
+-            /* Attempt to switch to an invalid mode: this is UNPREDICTABLE in
-+
++            /*
- /*
++             * Attempt to switch to an invalid mode: this is UNPREDICTABLE in
-  * Convert float16 to float32, raising no exceptions and
+              * v7, and has defined behaviour in v8:
-  * preserving exceptional values, including SNaN.
+              *  + leave CPSR.M untouched
               *  + allow changes to the other CPSR fields
@@ -XXX,XX +XXX,XX @@ static void switch_mode(CPUARMState *env, int mode)
      env->regs[14] = env->banked_r14[r14_bank_number(mode)];
  }
 -/* Physical Interrupt Target EL Lookup Table
 +/*
 + * Physical Interrupt Target EL Lookup Table
   *
   * [ From ARM ARM section G1.13.4 (Table G1-15) ]
   *
@@ -XXX,XX +XXX,XX @@ uint32_t arm_phys_excp_target_el(CPUState *cs, uint32_t excp_idx,
      if (arm_feature(env, ARM_FEATURE_EL3)) {
          rw = ((env->cp15.scr_el3 & SCR_RW) == SCR_RW);
      } else {
 -        /* Either EL2 is the highest EL (and so the EL2 register width
 +        /*
 +         * Either EL2 is the highest EL (and so the EL2 register width
           * is given by is64); or there is no EL2 or EL3, in which case
           * the value of 'rw' does not affect the table lookup anyway.
           */
@@ -XXX,XX +XXX,XX @@ void aarch64_sync_64_to_32(CPUARMState *env)
          env->banked_r13[bank_number(ARM_CPU_MODE_UND)] = env->xregs[23];
      }
 -    /* Registers x24-x30 are mapped to r8-r14 in FIQ mode.  If we are in FIQ
 +    /*
 +     * Registers x24-x30 are mapped to r8-r14 in FIQ mode.  If we are in FIQ
       * mode, then we can copy to r8-r14.  Otherwise, we copy to the
       * FIQ bank for r8-r14.
       */
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_do_interrupt_aarch32(CPUState *cs)
          /* High vectors. When enabled, base address cannot be remapped. */
          addr += 0xffff0000;
      } else {
 -        /* ARM v7 architectures provide a vector base address register to remap
 +        /*
 +         * ARM v7 architectures provide a vector base address register to remap
           * the interrupt vector table.
           * This register is only followed in non-monitor mode, and is banked.
           * Note: only bits 31:5 are valid.
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_do_interrupt_aarch64(CPUState *cs)
      aarch64_sve_change_el(env, cur_el, new_el, is_a64(env));
      if (cur_el < new_el) {
 -        /* Entry vector offset depends on whether the implemented EL
 +        /*
 +         * Entry vector offset depends on whether the implemented EL
           * immediately lower than the target level is using AArch32 or AArch64
           */
          bool is_aa64;
@@ -XXX,XX +XXX,XX @@ static void handle_semihosting(CPUState *cs)
  }
  #endif
 -/* Handle a CPU exception for A and R profile CPUs.
 +/*
 + * Handle a CPU exception for A and R profile CPUs.
   * Do any appropriate logging, handle PSCI calls, and then hand off
   * to the AArch64-entry or AArch32-entry function depending on the
   * target exception level's register width.
@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_interrupt(CPUState *cs)
      }
  #endif
 -    /* Hooks may change global state so BQL should be held, also the
 +    /*
 +     * Hooks may change global state so BQL should be held, also the
       * BQL needs to be held for any modification of
       * cs->interrupt_request.
       */
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
      };
  }
 -/* Note that signed overflow is undefined in C.  The following routines are
 -   careful to use unsigned types where modulo arithmetic is required.
 -   Failure to do so _will_ break on newer gcc.  */
 +/*
 + * Note that signed overflow is undefined in C.  The following routines are
 + * careful to use unsigned types where modulo arithmetic is required.
 + * Failure to do so _will_ break on newer gcc.
 + */
  /* Signed saturating arithmetic.  */
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sel_flags)(uint32_t flags, uint32_t a, uint32_t b)
      return (a & mask) | (b & ~mask);
  }
 -/* CRC helpers.
 +/*
 + * CRC helpers.
   * The upper bytes of val (above the number specified by 'bytes') must have
   * been zeroed out by the caller.
   */
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(crc32c)(uint32_t acc, uint32_t val, uint32_t bytes)
      return crc32c(acc, buf, bytes) ^ 0xffffffff;
  }
 -/* Return the exception level to which FP-disabled exceptions should
 +/*
 + * Return the exception level to which FP-disabled exceptions should
   * be taken, or 0 if FP is enabled.
   */
  int fp_exception_el(CPUARMState *env, int cur_el)
@@ -XXX,XX +XXX,XX @@ int fp_exception_el(CPUARMState *env, int cur_el)
  #ifndef CONFIG_USER_ONLY
      uint64_t hcr_el2;
 -    /* CPACR and the CPTR registers don't exist before v6, so FP is
 +    /*
 +     * CPACR and the CPTR registers don't exist before v6, so FP is
       * always accessible
       */
      if (!arm_feature(env, ARM_FEATURE_V6)) {
@@ -XXX,XX +XXX,XX @@ int fp_exception_el(CPUARMState *env, int cur_el)
      hcr_el2 = arm_hcr_el2_eff(env);
 -    /* The CPACR controls traps to EL1, or PL1 if we're 32 bit:
 +    /*
 +     * The CPACR controls traps to EL1, or PL1 if we're 32 bit:
       * 0, 2 : trap EL0 and EL1/PL1 accesses
       * 1    : trap only EL0 accesses
       * 3    : trap no accesses
 --
-.20.1
+.25.1

-[PULL 36/45] target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
+[PULL 19/34] target/arm: Fix checkpatch space errors in helper.c
-Convert the Neon integer VPMAX and VPMIN 3-reg-same insns to
+From: Fabiano Rosas <farosas@suse.de>
 decodetree. These are 'pairwise' operations.
+Fix the following:
+ERROR: spaces required around that '|' (ctx:VxV)
+ERROR: space required before the open parenthesis '('
+ERROR: spaces required around that '+' (ctx:VxB)
+ERROR: space prohibited between function name and open parenthesis '('
+(the last two still have some occurrences in macros which I left
+behind because it might impact readability)
+Signed-off-by: Fabiano Rosas <farosas@suse.de>
+Reviewed-by: Claudio Fontana <cfontana@suse.de>
+Reviewed-by: Cornelia Huck <cohuck@redhat.com>
+Message-id: 20221213190537.511-3-farosas@suse.de
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-9-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  9 +++++
+ target/arm/helper.c | 42 +++++++++++++++++++++---------------------
- target/arm/translate-neon.inc.c | 71 +++++++++++++++++++++++++++++++++
+file changed, 21 insertions(+), 21 deletions(-)
  target/arm/translate.c          | 17 +-------
 files changed, 82 insertions(+), 15 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/helper.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void add_cpreg_to_list(gpointer key, gpointer opaque)
- @3same           .... ... . . . size:2 .... .... .... . q:1 . . .... \
+     uint32_t regidx = (uintptr_t)key;
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
+     const ARMCPRegInfo *ri = get_arm_cp_reginfo(cpu->cp_regs, regidx);
-+@3same_q0        .... ... . . . size:2 .... .... .... . 0 . . .... \
+-    if (!(ri->type & (ARM_CP_NO_RAW|ARM_CP_ALIAS))) {
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
++    if (!(ri->type & (ARM_CP_NO_RAW | ARM_CP_ALIAS))) {
-+
+         cpu->cpreg_indexes[cpu->cpreg_array_len] = cpreg_to_kvm_id(regidx);
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+         /* The value array need not be initialized at this point */
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
+         cpu->cpreg_array_len++;
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
+@@ -XXX,XX +XXX,XX @@ static void count_cpreg(gpointer key, gpointer opaque)
-@@ -XXX,XX +XXX,XX @@ VMLS_3s          1111 001 1 0 . .. .... .... 1001 . . . 0 .... @3same
- VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
+     ri = g_hash_table_lookup(cpu->cp_regs, key);
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
+-    if (!(ri->type & (ARM_CP_NO_RAW|ARM_CP_ALIAS))) {
-+VPMAX_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 0 .... @3same_q0
++    if (!(ri->type & (ARM_CP_NO_RAW | ARM_CP_ALIAS))) {
-+VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
+         cpu->cpreg_array_len++;
 +
 +VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
 +VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
 +
  VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
  SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_32_ENV(VQSHL_S, qshl_s)
  DO_3SAME_32_ENV(VQSHL_U, qshl_u)
  DO_3SAME_32_ENV(VQRSHL_S, qrshl_s)
  DO_3SAME_32_ENV(VQRSHL_U, qrshl_u)
 +
 +static bool do_3same_pair(DisasContext *s, arg_3same *a, NeonGenTwoOpFn *fn)
 +{
 +    /* Operations handled pairwise 32 bits at a time */
 +    TCGv_i32 tmp, tmp2, tmp3;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if (a->size == 3) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    assert(a->q == 0); /* enforced by decode patterns */
 +
 +    /*
 +     * Note that we have to be careful not to clobber the source operands
 +     * in the "vm == vd" case by storing the result of the first pass too
 +     * early. Since Q is 0 there are always just two passes, so instead
 +     * of a complicated loop over each pass we just unroll.
 +     */
 +    tmp = neon_load_reg(a->vn, 0);
 +    tmp2 = neon_load_reg(a->vn, 1);
 +    fn(tmp, tmp, tmp2);
 +    tcg_temp_free_i32(tmp2);
 +
 +    tmp3 = neon_load_reg(a->vm, 0);
 +    tmp2 = neon_load_reg(a->vm, 1);
 +    fn(tmp3, tmp3, tmp2);
 +    tcg_temp_free_i32(tmp2);
 +
 +    neon_store_reg(a->vd, 0, tmp);
 +    neon_store_reg(a->vd, 1, tmp3);
 +    return true;
 +}
 +
 +#define DO_3SAME_PAIR(INSN, func)                                       \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        static NeonGenTwoOpFn * const fns[] = {                         \
 +            gen_helper_neon_##func##8,                                  \
 +            gen_helper_neon_##func##16,                                 \
 +            gen_helper_neon_##func##32,                                 \
 +        };                                                              \
 +        if (a->size > 2) {                                              \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same_pair(s, a, fns[a->size]);                       \
 +    }
 +
 +/* 32-bit pairwise ops end up the same as the elementwise versions.  */
 +#define gen_helper_neon_pmax_s32  tcg_gen_smax_i32
 +#define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
 +#define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
 +#define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
 +
 +DO_3SAME_PAIR(VPMAX_S, pmax_s)
 +DO_3SAME_PAIR(VPMIN_S, pmin_s)
 +DO_3SAME_PAIR(VPMAX_U, pmax_u)
 +DO_3SAME_PAIR(VPMIN_U, pmin_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline void gen_neon_rsb(int size, TCGv_i32 t0, TCGv_i32 t1)
      }
  }
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6k_cp_reginfo[] = {
--/* 32-bit pairwise ops end up the same as the elementwise versions.  */
+       .resetfn = arm_cp_reset_ignore },
--#define gen_helper_neon_pmax_s32  tcg_gen_smax_i32
+     { .name = "TPIDRRO_EL0", .state = ARM_CP_STATE_AA64,
--#define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
+       .opc0 = 3, .opc1 = 3, .opc2 = 3, .crn = 13, .crm = 0,
--#define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
+-      .access = PL0_R|PL1_W,
--#define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
++      .access = PL0_R | PL1_W,
--
+       .fieldoffset = offsetof(CPUARMState, cp15.tpidrro_el[0]),
- #define GEN_NEON_INTEGER_OP_ENV(name) do { \
+       .resetvalue = 0},
-     switch ((size << 1) | u) { \
+     { .name = "TPIDRURO", .cp = 15, .crn = 13, .crm = 0, .opc1 = 0, .opc2 = 3,
-     case 0: \
+-      .access = PL0_R|PL1_W,
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
++      .access = PL0_R | PL1_W,
-         case NEON_3R_VQSHL:
+       .bank_fieldoffsets = { offsetoflow32(CPUARMState, cp15.tpidruro_s),
-         case NEON_3R_VRSHL:
+                              offsetoflow32(CPUARMState, cp15.tpidruro_ns) },
-         case NEON_3R_VQRSHL:
+       .resetfn = arm_cp_reset_ignore },
-+        case NEON_3R_VPMAX:
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo cache_block_ops_cp_reginfo[] = {
-+        case NEON_3R_VPMIN:
+       .resetvalue = 0 },
-             /* Already handled by decodetree */
+     /* The cache ops themselves: these all NOP for QEMU */
-             return 1;
+     { .name = "IICR", .cp = 15, .crm = 5, .opc1 = 0,
-         }
+-      .access = PL1_W, .type = ARM_CP_NOP|ARM_CP_64BIT },
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
++      .access = PL1_W, .type = ARM_CP_NOP | ARM_CP_64BIT },
-         pairwise = 0;
+     { .name = "IDCR", .cp = 15, .crm = 6, .opc1 = 0,
-         switch (op) {
+-      .access = PL1_W, .type = ARM_CP_NOP|ARM_CP_64BIT },
-         case NEON_3R_VPADD_VQRDMLAH:
++      .access = PL1_W, .type = ARM_CP_NOP | ARM_CP_64BIT },
--        case NEON_3R_VPMAX:
+     { .name = "CDCR", .cp = 15, .crm = 12, .opc1 = 0,
--        case NEON_3R_VPMIN:
+-      .access = PL0_W, .type = ARM_CP_NOP|ARM_CP_64BIT },
-             pairwise = 1;
++      .access = PL0_W, .type = ARM_CP_NOP | ARM_CP_64BIT },
-             break;
+     { .name = "PIR", .cp = 15, .crm = 12, .opc1 = 1,
-         case NEON_3R_FLOAT_ARITH:
+-      .access = PL0_W, .type = ARM_CP_NOP|ARM_CP_64BIT },
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
++      .access = PL0_W, .type = ARM_CP_NOP | ARM_CP_64BIT },
-             tmp2 = neon_load_reg(rm, pass);
+     { .name = "PDR", .cp = 15, .crm = 12, .opc1 = 2,
-         }
+-      .access = PL0_W, .type = ARM_CP_NOP|ARM_CP_64BIT },
-         switch (op) {
++      .access = PL0_W, .type = ARM_CP_NOP | ARM_CP_64BIT },
--            break;
+     { .name = "CIDCR", .cp = 15, .crm = 14, .opc1 = 0,
--        case NEON_3R_VPMAX:
+-      .access = PL1_W, .type = ARM_CP_NOP|ARM_CP_64BIT },
--            GEN_NEON_INTEGER_OP(pmax);
++      .access = PL1_W, .type = ARM_CP_NOP | ARM_CP_64BIT },
--            break;
+ };
--        case NEON_3R_VPMIN:
--            GEN_NEON_INTEGER_OP(pmin);
+ static const ARMCPRegInfo cache_test_clean_cp_reginfo[] = {
--            break;
+@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-         case NEON_3R_VQDMULH_VQRDMULH: /* Multiply high.  */
+             ARMCPRegInfo cbar = {
-             if (!u) { /* VQDMULH */
+                 .name = "CBAR",
-                 switch (size) {
+                 .cp = 15, .crn = 15, .crm = 0, .opc1 = 4, .opc2 = 0,
 -                .access = PL1_R|PL3_W, .resetvalue = cpu->reset_cbar,
 +                .access = PL1_R | PL3_W, .resetvalue = cpu->reset_cbar,
                  .fieldoffset = offsetof(CPUARMState,
                                          cp15.c15_config_base_address)
              };
@@ -XXX,XX +XXX,XX @@ static void switch_mode(CPUARMState *env, int mode)
          return;
      if (old_mode == ARM_CPU_MODE_FIQ) {
 -        memcpy (env->fiq_regs, env->regs + 8, 5 * sizeof(uint32_t));
 -        memcpy (env->regs + 8, env->usr_regs, 5 * sizeof(uint32_t));
 +        memcpy(env->fiq_regs, env->regs + 8, 5 * sizeof(uint32_t));
 +        memcpy(env->regs + 8, env->usr_regs, 5 * sizeof(uint32_t));
      } else if (mode == ARM_CPU_MODE_FIQ) {
 -        memcpy (env->usr_regs, env->regs + 8, 5 * sizeof(uint32_t));
 -        memcpy (env->regs + 8, env->fiq_regs, 5 * sizeof(uint32_t));
 +        memcpy(env->usr_regs, env->regs + 8, 5 * sizeof(uint32_t));
 +        memcpy(env->regs + 8, env->fiq_regs, 5 * sizeof(uint32_t));
      }
      i = bank_number(old_mode);
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
      RESULT(sum, n, 16); \
      if (sum >= 0) \
          ge |= 3 << (n * 2); \
 -    } while(0)
 +    } while (0)
  #define SARITH8(a, b, n, op) do { \
      int32_t sum; \
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
      RESULT(sum, n, 8); \
      if (sum >= 0) \
          ge |= 1 << n; \
 -    } while(0)
 +    } while (0)
  #define ADD16(a, b, n) SARITH16(a, b, n, +)
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
      RESULT(sum, n, 16); \
      if ((sum >> 16) == 1) \
          ge |= 3 << (n * 2); \
 -    } while(0)
 +    } while (0)
  #define ADD8(a, b, n) do { \
      uint32_t sum; \
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
      RESULT(sum, n, 8); \
      if ((sum >> 8) == 1) \
          ge |= 1 << n; \
 -    } while(0)
 +    } while (0)
  #define SUB16(a, b, n) do { \
      uint32_t sum; \
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
      RESULT(sum, n, 16); \
      if ((sum >> 16) == 0) \
          ge |= 3 << (n * 2); \
 -    } while(0)
 +    } while (0)
  #define SUB8(a, b, n) do { \
      uint32_t sum; \
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
      RESULT(sum, n, 8); \
      if ((sum >> 8) == 0) \
          ge |= 1 << n; \
 -    } while(0)
 +    } while (0)
  #define PFX u
  #define ARITH_GE
 --
-.20.1
+.25.1

-[PULL 14/45] target/arm: Pass pointer to qc to qrdmla/qrdmls
+[PULL 20/34] target/arm: Fix checkpatch brace errors in helper.c
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Fabiano Rosas <farosas@suse.de>
-Pass a pointer directly to env->vfp.qc[0], rather than env.
+Fix this:
-This will allow SVE2, which does not modify QC, to pass a
+ERROR: braces {} are necessary for all arms of this statement
 pointer to dummy storage.
-Change the return type of inl_qrdml.h_s16 to match the
+Signed-off-by: Fabiano Rosas <farosas@suse.de>
-sense of the operation: signed.
+Reviewed-by: Claudio Fontana <cfontana@suse.de>
+Reviewed-by: Cornelia Huck <cohuck@redhat.com>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20221213190537.511-4-farosas@suse.de
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-14-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.c  | 18 ++++++++---
+ target/arm/helper.c | 67 ++++++++++++++++++++++++++++-----------------
- target/arm/vec_helper.c | 70 +++++++++++++++++++++++------------------
+file changed, 42 insertions(+), 25 deletions(-)
 files changed, 54 insertions(+), 34 deletions(-)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/target/arm/helper.c
-+++ b/target/arm/translate.c
++++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static const uint8_t neon_2rm_sizes[] = {
+@@ -XXX,XX +XXX,XX @@ void cpsr_write(CPUARMState *env, uint32_t val, uint32_t mask,
-     [NEON_2RM_VCVT_UF] = 0x4,
+         env->CF = (val >> 29) & 1;
- };
+         env->VF = (val << 3) & 0x80000000;
+     }
-+static void gen_gvec_fn3_qc(uint32_t rd_ofs, uint32_t rn_ofs, uint32_t rm_ofs,
+-    if (mask & CPSR_Q)
-+                            uint32_t opr_sz, uint32_t max_sz,
++    if (mask & CPSR_Q) {
-+                            gen_helper_gvec_3_ptr *fn)
+         env->QF = ((val & CPSR_Q) != 0);
-+{
+-    if (mask & CPSR_T)
-+    TCGv_ptr qc_ptr = tcg_temp_new_ptr();
++    }
-+
++    if (mask & CPSR_T) {
-+    tcg_gen_addi_ptr(qc_ptr, cpu_env, offsetof(CPUARMState, vfp.qc));
+         env->thumb = ((val & CPSR_T) != 0);
-+    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, qc_ptr,
++    }
-+                       opr_sz, max_sz, 0, fn);
+     if (mask & CPSR_IT_0_1) {
-+    tcg_temp_free_ptr(qc_ptr);
+         env->condexec_bits &= ~3;
-+}
+         env->condexec_bits |= (val >> 25) & 3;
-+
+@@ -XXX,XX +XXX,XX @@ static void switch_mode(CPUARMState *env, int mode)
- void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     int i;
-                           uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
      old_mode = env->uncached_cpsr & CPSR_M;
 -    if (mode == old_mode)
 +    if (mode == old_mode) {
          return;
 +    }
      if (old_mode == ARM_CPU_MODE_FIQ) {
          memcpy(env->fiq_regs, env->regs + 8, 5 * sizeof(uint32_t));
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_do_interrupt_aarch32(CPUState *cs)
          new_mode = ARM_CPU_MODE_UND;
          addr = 0x04;
          mask = CPSR_I;
 -        if (env->thumb)
 +        if (env->thumb) {
              offset = 2;
 -        else
 +        } else {
              offset = 4;
 +        }
          break;
      case EXCP_SWI:
          new_mode = ARM_CPU_MODE_SVC;
@@ -XXX,XX +XXX,XX @@ static inline uint16_t add16_sat(uint16_t a, uint16_t b)
      res = a + b;
      if (((res ^ a) & 0x8000) && !((a ^ b) & 0x8000)) {
 -        if (a & 0x8000)
 +        if (a & 0x8000) {
              res = 0x8000;
 -        else
 +        } else {
              res = 0x7fff;
 +        }
      }
      return res;
  }
@@ -XXX,XX +XXX,XX @@ static inline uint8_t add8_sat(uint8_t a, uint8_t b)
      res = a + b;
      if (((res ^ a) & 0x80) && !((a ^ b) & 0x80)) {
 -        if (a & 0x80)
 +        if (a & 0x80) {
              res = 0x80;
 -        else
 +        } else {
              res = 0x7f;
 +        }
      }
      return res;
  }
@@ -XXX,XX +XXX,XX @@ static inline uint16_t sub16_sat(uint16_t a, uint16_t b)
      res = a - b;
      if (((res ^ a) & 0x8000) && ((a ^ b) & 0x8000)) {
 -        if (a & 0x8000)
 +        if (a & 0x8000) {
              res = 0x8000;
 -        else
 +        } else {
              res = 0x7fff;
 +        }
      }
      return res;
  }
@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_sat(uint8_t a, uint8_t b)
      res = a - b;
      if (((res ^ a) & 0x80) && ((a ^ b) & 0x80)) {
 -        if (a & 0x80)
 +        if (a & 0x80) {
              res = 0x80;
 -        else
 +        } else {
              res = 0x7f;
 +        }
      }
      return res;
  }
@@ -XXX,XX +XXX,XX @@ static inline uint16_t add16_usat(uint16_t a, uint16_t b)
  {
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     uint16_t res;
-         gen_helper_gvec_qrdmlah_s16, gen_helper_gvec_qrdmlah_s32
+     res = a + b;
-     };
+-    if (res < a)
-     tcg_debug_assert(vece >= 1 && vece <= 2);
++    if (res < a) {
--    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
+         res = 0xffff;
--                       opr_sz, max_sz, 0, fns[vece - 1]);
++    }
-+    gen_gvec_fn3_qc(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, fns[vece - 1]);
+     return res;
  }
- void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ static inline uint16_t sub16_usat(uint16_t a, uint16_t b)
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ {
-         gen_helper_gvec_qrdmlsh_s16, gen_helper_gvec_qrdmlsh_s32
+-    if (a > b)
-     };
++    if (a > b) {
-     tcg_debug_assert(vece >= 1 && vece <= 2);
+         return a - b;
--    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
+-    else
--                       opr_sz, max_sz, 0, fns[vece - 1]);
++    } else {
-+    gen_gvec_fn3_qc(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, fns[vece - 1]);
+         return 0;
 +    }
  }
- #define GEN_CMP0(NAME, COND)                                            \
+ static inline uint8_t add8_usat(uint8_t a, uint8_t b)
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@
  #define H4(x)  (x)
  #endif
 -#define SET_QC() env->vfp.qc[0] = 1
 -
  static void clear_tail(void *vd, uintptr_t opr_sz, uintptr_t max_sz)
  {
-     uint64_t *d = vd + opr_sz;
+     uint8_t res;
-@@ -XXX,XX +XXX,XX @@ static void clear_tail(void *vd, uintptr_t opr_sz, uintptr_t max_sz)
+     res = a + b;
 -    if (res < a)
 +    if (res < a) {
          res = 0xff;
 +    }
      return res;
  }
- /* Signed saturating rounding doubling multiply-accumulate high half, 16-bit */
+ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
 -static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
 -                                int16_t src2, int16_t src3)
 +static int16_t inl_qrdmlah_s16(int16_t src1, int16_t src2,
 +                               int16_t src3, uint32_t *sat)
  {
-     /* Simplify:
+-    if (a > b)
-      * = ((a3 << 16) + ((e1 * e2) << 1) + (1 << 15)) >> 16
++    if (a > b) {
-@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
+         return a - b;
-     ret = ((int32_t)src3 << 15) + ret + (1 << 14);
+-    else
-     ret >>= 15;
++    } else {
-     if (ret != (int16_t)ret) {
+         return 0;
--        SET_QC();
++    }
-+        *sat = 1;
+ }
-         ret = (ret < 0 ? -0x8000 : 0x7fff);
-     }
+ #define ADD16(a, b, n) RESULT(add16_usat(a, b), n, 16);
-     return ret;
+@@ -XXX,XX +XXX,XX @@ static inline uint8_t sub8_usat(uint8_t a, uint8_t b)
-@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
- uint32_t HELPER(neon_qrdmlah_s16)(CPUARMState *env, uint32_t src1,
+ static inline uint8_t do_usad(uint8_t a, uint8_t b)
                                    uint32_t src2, uint32_t src3)
  {
--    uint16_t e1 = inl_qrdmlah_s16(env, src1, src2, src3);
+-    if (a > b)
--    uint16_t e2 = inl_qrdmlah_s16(env, src1 >> 16, src2 >> 16, src3 >> 16);
++    if (a > b) {
-+    uint32_t *sat = &env->vfp.qc[0];
+         return a - b;
-+    uint16_t e1 = inl_qrdmlah_s16(src1, src2, src3, sat);
+-    else
-+    uint16_t e2 = inl_qrdmlah_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
++    } else {
-     return deposit32(e1, 16, 16, e2);
+         return b - a;
 +    }
  }
- void HELPER(gvec_qrdmlah_s16)(void *vd, void *vn, void *vm,
+ /* Unsigned sum of absolute byte differences.  */
--                              void *ve, uint32_t desc)
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sel_flags)(uint32_t flags, uint32_t a, uint32_t b)
-+                              void *vq, uint32_t desc)
+     uint32_t mask;
- {
-     uintptr_t opr_sz = simd_oprsz(desc);
+     mask = 0;
-     int16_t *d = vd;
+-    if (flags & 1)
-     int16_t *n = vn;
++    if (flags & 1) {
-     int16_t *m = vm;
+         mask |= 0xff;
--    CPUARMState *env = ve;
+-    if (flags & 2)
-     uintptr_t i;
++    }
++    if (flags & 2) {
-     for (i = 0; i < opr_sz / 2; ++i) {
+         mask |= 0xff00;
--        d[i] = inl_qrdmlah_s16(env, n[i], m[i], d[i]);
+-    if (flags & 4)
-+        d[i] = inl_qrdmlah_s16(n[i], m[i], d[i], vq);
++    }
-     }
++    if (flags & 4) {
-     clear_tail(d, opr_sz, simd_maxsz(desc));
+         mask |= 0xff0000;
 -    if (flags & 8)
 +    }
 +    if (flags & 8) {
          mask |= 0xff000000;
 +    }
      return (a & mask) | (b & ~mask);
  }
- /* Signed saturating rounding doubling multiply-subtract high half, 16-bit */
--static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
--                                int16_t src2, int16_t src3)
-+static int16_t inl_qrdmlsh_s16(int16_t src1, int16_t src2,
-+                               int16_t src3, uint32_t *sat)
- {
-     /* Similarly, using subtraction:
-      * = ((a3 << 16) - ((e1 * e2) << 1) + (1 << 15)) >> 16
-@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
-     ret = ((int32_t)src3 << 15) - ret + (1 << 14);
-     ret >>= 15;
-     if (ret != (int16_t)ret) {
--        SET_QC();
-+        *sat = 1;
-         ret = (ret < 0 ? -0x8000 : 0x7fff);
-     }
-     return ret;
-@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
- uint32_t HELPER(neon_qrdmlsh_s16)(CPUARMState *env, uint32_t src1,
-                                   uint32_t src2, uint32_t src3)
- {
--    uint16_t e1 = inl_qrdmlsh_s16(env, src1, src2, src3);
--    uint16_t e2 = inl_qrdmlsh_s16(env, src1 >> 16, src2 >> 16, src3 >> 16);
-+    uint32_t *sat = &env->vfp.qc[0];
-+    uint16_t e1 = inl_qrdmlsh_s16(src1, src2, src3, sat);
-+    uint16_t e2 = inl_qrdmlsh_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
-     return deposit32(e1, 16, 16, e2);
- }
- void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
--                              void *ve, uint32_t desc)
-+                              void *vq, uint32_t desc)
- {
-     uintptr_t opr_sz = simd_oprsz(desc);
-     int16_t *d = vd;
-     int16_t *n = vn;
-     int16_t *m = vm;
--    CPUARMState *env = ve;
-     uintptr_t i;
-     for (i = 0; i < opr_sz / 2; ++i) {
--        d[i] = inl_qrdmlsh_s16(env, n[i], m[i], d[i]);
-+        d[i] = inl_qrdmlsh_s16(n[i], m[i], d[i], vq);
-     }
-     clear_tail(d, opr_sz, simd_maxsz(desc));
- }
- /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
--uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
--                                  int32_t src2, int32_t src3)
-+static int32_t inl_qrdmlah_s32(int32_t src1, int32_t src2,
-+                               int32_t src3, uint32_t *sat)
- {
-     /* Simplify similarly to int_qrdmlah_s16 above.  */
-     int64_t ret = (int64_t)src1 * src2;
-     ret = ((int64_t)src3 << 31) + ret + (1 << 30);
-     ret >>= 31;
-     if (ret != (int32_t)ret) {
--        SET_QC();
-+        *sat = 1;
-         ret = (ret < 0 ? INT32_MIN : INT32_MAX);
-     }
-     return ret;
- }
-+uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
-+                                  int32_t src2, int32_t src3)
-+{
-+    uint32_t *sat = &env->vfp.qc[0];
-+    return inl_qrdmlah_s32(src1, src2, src3, sat);
-+}
-+
- void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
--                              void *ve, uint32_t desc)
-+                              void *vq, uint32_t desc)
- {
-     uintptr_t opr_sz = simd_oprsz(desc);
-     int32_t *d = vd;
-     int32_t *n = vn;
-     int32_t *m = vm;
--    CPUARMState *env = ve;
-     uintptr_t i;
-     for (i = 0; i < opr_sz / 4; ++i) {
--        d[i] = helper_neon_qrdmlah_s32(env, n[i], m[i], d[i]);
-+        d[i] = inl_qrdmlah_s32(n[i], m[i], d[i], vq);
-     }
-     clear_tail(d, opr_sz, simd_maxsz(desc));
- }
- /* Signed saturating rounding doubling multiply-subtract high half, 32-bit */
--uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
--                                  int32_t src2, int32_t src3)
-+static int32_t inl_qrdmlsh_s32(int32_t src1, int32_t src2,
-+                               int32_t src3, uint32_t *sat)
- {
-     /* Simplify similarly to int_qrdmlsh_s16 above.  */
-     int64_t ret = (int64_t)src1 * src2;
-     ret = ((int64_t)src3 << 31) - ret + (1 << 30);
-     ret >>= 31;
-     if (ret != (int32_t)ret) {
--        SET_QC();
-+        *sat = 1;
-         ret = (ret < 0 ? INT32_MIN : INT32_MAX);
-     }
-     return ret;
- }
-+uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
-+                                  int32_t src2, int32_t src3)
-+{
-+    uint32_t *sat = &env->vfp.qc[0];
-+    return inl_qrdmlsh_s32(src1, src2, src3, sat);
-+}
-+
- void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
--                              void *ve, uint32_t desc)
-+                              void *vq, uint32_t desc)
- {
-     uintptr_t opr_sz = simd_oprsz(desc);
-     int32_t *d = vd;
-     int32_t *n = vn;
-     int32_t *m = vm;
--    CPUARMState *env = ve;
-     uintptr_t i;
-     for (i = 0; i < opr_sz / 4; ++i) {
--        d[i] = helper_neon_qrdmlsh_s32(env, n[i], m[i], d[i]);
-+        d[i] = inl_qrdmlsh_s32(n[i], m[i], d[i], vq);
-     }
-     clear_tail(d, opr_sz, simd_maxsz(desc));
- }
 --
-.20.1
+.25.1

-[PULL 16/45] target/arm: Vectorize SABD/UABD
+[PULL 21/34] target/arm: Remove unused includes from m_helper.c
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Fabiano Rosas <farosas@suse.de>
-Include 64-bit element size in preparation for SVE2.
+Signed-off-by: Fabiano Rosas <farosas@suse.de>
+Reviewed-by: Claudio Fontana <cfontana@suse.de>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Cornelia Huck <cohuck@redhat.com>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20221213190537.511-5-farosas@suse.de
 Message-id: 20200513163245.17915-16-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  10 +++
+ target/arm/m_helper.c | 16 ----------------
- target/arm/translate.h     |   5 ++
+file changed, 16 deletions(-)
  target/arm/translate-a64.c |   8 ++-
  target/arm/translate.c     | 133 ++++++++++++++++++++++++++++++++++++-
  target/arm/vec_helper.c    |  24 +++++++
 files changed, 176 insertions(+), 4 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/target/arm/m_helper.c
-+++ b/target/arm/helper.h
++++ b/target/arm/m_helper.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_sli_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@
  DEF_HELPER_FLAGS_3(gvec_sli_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
  DEF_HELPER_FLAGS_3(gvec_sli_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sabd_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_4(gvec_uabd_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_uabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_uabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_uabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.h
 +++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
  void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                            uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
+ #include "qemu/osdep.h"
---- a/target/arm/translate-a64.c
+-#include "qemu/units.h"
-+++ b/target/arm/translate-a64.c
+-#include "target/arm/idau.h"
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
+-#include "trace.h"
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_smin, size);
+ #include "cpu.h"
-         }
+ #include "internals.h"
-         return;
+-#include "exec/gdbstub.h"
-+    case 0xe: /* SABD, UABD */
+ #include "exec/helper-proto.h"
-+        if (u) {
+-#include "qemu/host-utils.h"
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uabd, size);
+ #include "qemu/main-loop.h"
-+        } else {
+ #include "qemu/bitops.h"
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sabd, size);
+-#include "qemu/crc32c.h"
-+        }
+-#include "qemu/qemu-print.h"
-+        return;
+ #include "qemu/log.h"
-     case 0x10: /* ADD, SUB */
+ #include "exec/exec-all.h"
-         if (u) {
+-#include <zlib.h> /* For crc32 */
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_sub, size);
+-#include "semihosting/semihost.h"
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
+-#include "sysemu/cpus.h"
-                 genenvfn = fns[size][u];
+-#include "sysemu/kvm.h"
-                 break;
+-#include "qemu/range.h"
-             }
+-#include "qapi/qapi-commands-machine-target.h"
--            case 0xe: /* SABD, UABD */
+-#include "qapi/error.h"
-             case 0xf: /* SABA, UABA */
+-#include "qemu/guest-random.h"
-             {
+ #ifdef CONFIG_TCG
-                 static NeonGenTwoOpFn * const fns[3][2] = {
+-#include "arm_ldst.h"
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+ #include "exec/cpu_ldst.h"
-index XXXXXXX..XXXXXXX 100644
+ #include "semihosting/common-semi.h"
---- a/target/arm/translate.c
+ #endif
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                     rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
  }
 +static void gen_sabd_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    tcg_gen_sub_i32(t, a, b);
 +    tcg_gen_sub_i32(d, b, a);
 +    tcg_gen_movcond_i32(TCG_COND_LT, d, a, b, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_sabd_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_sub_i64(t, a, b);
 +    tcg_gen_sub_i64(d, b, a);
 +    tcg_gen_movcond_i64(TCG_COND_LT, d, a, b, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_sabd_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    tcg_gen_smin_vec(vece, t, a, b);
 +    tcg_gen_smax_vec(vece, d, a, b);
 +    tcg_gen_sub_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sub_vec, INDEX_op_smin_vec, INDEX_op_smax_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_sabd_vec,
 +          .fno = gen_helper_gvec_sabd_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fniv = gen_sabd_vec,
 +          .fno = gen_helper_gvec_sabd_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_sabd_i32,
 +          .fniv = gen_sabd_vec,
 +          .fno = gen_helper_gvec_sabd_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_sabd_i64,
 +          .fniv = gen_sabd_vec,
 +          .fno = gen_helper_gvec_sabd_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 +
 +static void gen_uabd_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    tcg_gen_sub_i32(t, a, b);
 +    tcg_gen_sub_i32(d, b, a);
 +    tcg_gen_movcond_i32(TCG_COND_LTU, d, a, b, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_uabd_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_sub_i64(t, a, b);
 +    tcg_gen_sub_i64(d, b, a);
 +    tcg_gen_movcond_i64(TCG_COND_LTU, d, a, b, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_uabd_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    tcg_gen_umin_vec(vece, t, a, b);
 +    tcg_gen_umax_vec(vece, d, a, b);
 +    tcg_gen_sub_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sub_vec, INDEX_op_umin_vec, INDEX_op_umax_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_uabd_vec,
 +          .fno = gen_helper_gvec_uabd_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fniv = gen_uabd_vec,
 +          .fno = gen_helper_gvec_uabd_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_uabd_i32,
 +          .fniv = gen_uabd_vec,
 +          .fno = gen_helper_gvec_uabd_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_uabd_i64,
 +          .fniv = gen_uabd_vec,
 +          .fno = gen_helper_gvec_uabd_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 +
  /* Translate a NEON data processing instruction.  Return nonzero if the
     instruction is invalid.
     We process data in a mixture of 32-bit and 64-bit chunks.
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              }
              return 1;
 +        case NEON_3R_VABD:
 +            if (u) {
 +                gen_gvec_uabd(size, rd_ofs, rn_ofs, rm_ofs,
 +                              vec_size, vec_size);
 +            } else {
 +                gen_gvec_sabd(size, rd_ofs, rn_ofs, rm_ofs,
 +                              vec_size, vec_size);
 +            }
 +            return 0;
 +
          case NEON_3R_VADD_VSUB:
          case NEON_3R_LOGIC:
          case NEON_3R_VMAX:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQRSHL:
              GEN_NEON_INTEGER_OP_ENV(qrshl);
              break;
 -        case NEON_3R_VABD:
 -            GEN_NEON_INTEGER_OP(abd);
 -            break;
          case NEON_3R_VABA:
              GEN_NEON_INTEGER_OP(abd);
              tcg_temp_free_i32(tmp2);
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_CMP0(gvec_cgt0_h, int16_t, >)
  DO_CMP0(gvec_cge0_h, int16_t, >=)
  #undef DO_CMP0
 +
 +#define DO_ABD(NAME, TYPE)                                      \
 +void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc)  \
 +{                                                               \
 +    intptr_t i, opr_sz = simd_oprsz(desc);                      \
 +    TYPE *d = vd, *n = vn, *m = vm;                             \
 +                                                                \
 +    for (i = 0; i < opr_sz / sizeof(TYPE); ++i) {               \
 +        d[i] = n[i] < m[i] ? m[i] - n[i] : n[i] - m[i];         \
 +    }                                                           \
 +    clear_tail(d, opr_sz, simd_maxsz(desc));                    \
 +}
 +
 +DO_ABD(gvec_sabd_b, int8_t)
 +DO_ABD(gvec_sabd_h, int16_t)
 +DO_ABD(gvec_sabd_s, int32_t)
 +DO_ABD(gvec_sabd_d, int64_t)
 +
 +DO_ABD(gvec_uabd_b, uint8_t)
 +DO_ABD(gvec_uabd_h, uint16_t)
 +DO_ABD(gvec_uabd_s, uint32_t)
 +DO_ABD(gvec_uabd_d, uint64_t)
 +
 +#undef DO_ABD
 --
-.20.1
+.25.1

-[PULL 19/45] acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
+[PULL 22/34] target/arm: Remove unused includes from helper.c
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Fabiano Rosas <farosas@suse.de>
-The little end UUID is used in many places, so make
+Signed-off-by: Fabiano Rosas <farosas@suse.de>
-NVDIMM_UUID_LE to a common macro to convert the UUID
+Reviewed-by: Claudio Fontana <cfontana@suse.de>
-to a little end array.
+Reviewed-by: Cornelia Huck <cohuck@redhat.com>
+Message-id: 20221213190537.511-6-farosas@suse.de
 Reviewed-by: Xiang Zheng <zhengxiang9@huawei.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Message-id: 20200512030609.19593-2-gengdongjiu@huawei.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/qemu/uuid.h | 27 +++++++++++++++++++++++++++
+ target/arm/helper.c | 7 -------
- hw/acpi/nvdimm.c    | 10 +++-------
+file changed, 7 deletions(-)
 files changed, 30 insertions(+), 7 deletions(-)
-diff --git a/include/qemu/uuid.h b/include/qemu/uuid.h
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/qemu/uuid.h
+--- a/target/arm/helper.c
-+++ b/include/qemu/uuid.h
++++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ typedef struct {
      };
  } QemuUUID;
 +/**
 + * UUID_LE - converts the fields of UUID to little-endian array,
 + * each of parameters is the filed of UUID.
 + *
 + * @time_low: The low field of the timestamp
 + * @time_mid: The middle field of the timestamp
 + * @time_hi_and_version: The high field of the timestamp
 + *                       multiplexed with the version number
 + * @clock_seq_hi_and_reserved: The high field of the clock
 + *                             sequence multiplexed with the variant
 + * @clock_seq_low: The low field of the clock sequence
 + * @node0: The spatially unique node0 identifier
 + * @node1: The spatially unique node1 identifier
 + * @node2: The spatially unique node2 identifier
 + * @node3: The spatially unique node3 identifier
 + * @node4: The spatially unique node4 identifier
 + * @node5: The spatially unique node5 identifier
 + */
 +#define UUID_LE(time_low, time_mid, time_hi_and_version,                    \
 +  clock_seq_hi_and_reserved, clock_seq_low, node0, node1, node2,            \
 +  node3, node4, node5)                                                      \
 +  { (time_low) & 0xff, ((time_low) >> 8) & 0xff, ((time_low) >> 16) & 0xff, \
 +    ((time_low) >> 24) & 0xff, (time_mid) & 0xff, ((time_mid) >> 8) & 0xff, \
 +    (time_hi_and_version) & 0xff, ((time_hi_and_version) >> 8) & 0xff,      \
 +    (clock_seq_hi_and_reserved), (clock_seq_low), (node0), (node1), (node2),\
 +    (node3), (node4), (node5) }
 +
  #define UUID_FMT "%02hhx%02hhx%02hhx%02hhx-" \
                   "%02hhx%02hhx-%02hhx%02hhx-" \
                   "%02hhx%02hhx-" \
 diff --git a/hw/acpi/nvdimm.c b/hw/acpi/nvdimm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/nvdimm.c
 +++ b/hw/acpi/nvdimm.c
 @@ -XXX,XX +XXX,XX @@
   */
  #include "qemu/osdep.h"
-+#include "qemu/uuid.h"
+-#include "qemu/units.h"
- #include "hw/acpi/acpi.h"
+ #include "qemu/log.h"
- #include "hw/acpi/aml-build.h"
+ #include "trace.h"
- #include "hw/acpi/bios-linker-loader.h"
+ #include "cpu.h"
  #include "internals.h"
  #include "exec/helper-proto.h"
 -#include "qemu/host-utils.h"
  #include "qemu/main-loop.h"
  #include "qemu/timer.h"
  #include "qemu/bitops.h"
 @@ -XXX,XX +XXX,XX @@
- #include "hw/mem/nvdimm.h"
+ #include "exec/exec-all.h"
- #include "qemu/nvdimm-utils.h"
+ #include <zlib.h> /* For crc32 */
+ #include "hw/irq.h"
--#define NVDIMM_UUID_LE(a, b, c, d0, d1, d2, d3, d4, d5, d6, d7)             \
+-#include "semihosting/semihost.h"
--   { (a) & 0xff, ((a) >> 8) & 0xff, ((a) >> 16) & 0xff, ((a) >> 24) & 0xff, \
+-#include "sysemu/cpus.h"
--     (b) & 0xff, ((b) >> 8) & 0xff, (c) & 0xff, ((c) >> 8) & 0xff,          \
+ #include "sysemu/cpu-timers.h"
--     (d0), (d1), (d2), (d3), (d4), (d5), (d6), (d7) }
+ #include "sysemu/kvm.h"
--
+-#include "qemu/range.h"
- /*
+ #include "qapi/qapi-commands-machine-target.h"
-  * define Byte Addressable Persistent Memory (PM) Region according to
+ #include "qapi/error.h"
-  * ACPI 6.0: 5.2.25.1 System Physical Address Range Structure.
+ #include "qemu/guest-random.h"
-  */
+ #ifdef CONFIG_TCG
- static const uint8_t nvdimm_nfit_spa_uuid[] =
+-#include "arm_ldst.h"
--      NVDIMM_UUID_LE(0x66f0d379, 0xb4f3, 0x4074, 0xac, 0x43, 0x0d, 0x33,
+-#include "exec/cpu_ldst.h"
--                     0x18, 0xb7, 0x8c, 0xdb);
+ #include "semihosting/common-semi.h"
-+      UUID_LE(0x66f0d379, 0xb4f3, 0x4074, 0xac, 0x43, 0x0d, 0x33,
+ #endif
-+              0x18, 0xb7, 0x8c, 0xdb);
+ #include "cpregs.h"
  /*
   * NVDIMM Firmware Interface Table
 --
-.20.1
+.25.1

-[PULL 21/45] docs: APEI GHES generation and CPER record description
+[PULL 23/34] target/arm: cleanup cpu includes
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Claudio Fontana <cfontana@suse.de>
-Add APEI/GHES detailed design document
+Remove some unused headers.
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Signed-off-by: Claudio Fontana <cfontana@suse.de>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+Acked-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+Reviewed-by: Claudio Fontana <cfontana@suse.de>
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+Reviewed-by: Cornelia Huck <cohuck@redhat.com>
-Message-id: 20200512030609.19593-4-gengdongjiu@huawei.com
+Signed-off-by: Fabiano Rosas <farosas@suse.de>
 Message-id: 20221213190537.511-7-farosas@suse.de
 [added back some includes that are still needed at this point]
 Signed-off-by: Fabiano Rosas <farosas@suse.de>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- docs/specs/acpi_hest_ghes.rst | 110 ++++++++++++++++++++++++++++++++++
+ target/arm/cpu.c   | 1 -
- docs/specs/index.rst          |   1 +
+ target/arm/cpu64.c | 6 ------
-files changed, 111 insertions(+)
+files changed, 7 deletions(-)
  create mode 100644 docs/specs/acpi_hest_ghes.rst
-diff --git a/docs/specs/acpi_hest_ghes.rst b/docs/specs/acpi_hest_ghes.rst
+diff --git a/target/arm/cpu.c b/target/arm/cpu.c
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/target/arm/cpu.c
---- /dev/null
++++ b/target/arm/cpu.c
 +++ b/docs/specs/acpi_hest_ghes.rst
 @@ -XXX,XX +XXX,XX @@
-+APEI tables generating and CPER record
+ #include "target/arm/idau.h"
-+======================================
+ #include "qemu/module.h"
-+
+ #include "qapi/error.h"
-+..
+-#include "qapi/visitor.h"
-+   Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
+ #include "cpu.h"
-+
+ #ifdef CONFIG_TCG
-+   This work is licensed under the terms of the GNU GPL, version 2 or later.
+ #include "hw/core/tcg-cpu-ops.h"
-+   See the COPYING file in the top-level directory.
+diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
 +
 +Design Details
 +--------------
 +
 +::
 +
 +         etc/acpi/tables                           etc/hardware_errors
 +      ====================                   ===============================
 +  + +--------------------------+            +----------------------------+
 +  | | HEST                     | +--------->|    error_block_address1    |------+
 +  | +--------------------------+ |          +----------------------------+      |
 +  | | GHES1                    | | +------->|    error_block_address2    |------+-+
 +  | +--------------------------+ | |        +----------------------------+      | |
 +  | | .................        | | |        |      ..............        |      | |
 +  | | error_status_address-----+-+ |        -----------------------------+      | |
 +  | | .................        |   |   +--->|    error_block_addressN    |------+-+---+
 +  | | read_ack_register--------+-+ |   |    +----------------------------+      | |   |
 +  | | read_ack_preserve        | +-+---+--->|     read_ack_register1     |      | |   |
 +  | | read_ack_write           |   |   |    +----------------------------+      | |   |
 +  + +--------------------------+   | +-+--->|     read_ack_register2     |      | |   |
 +  | | GHES2                    |   | | |    +----------------------------+      | |   |
 +  + +--------------------------+   | | |    |       .............        |      | |   |
 +  | | .................        |   | | |    +----------------------------+      | |   |
 +  | | error_status_address-----+---+ | | +->|     read_ack_registerN     |      | |   |
 +  | | .................        |     | | |  +----------------------------+      | |   |
 +  | | read_ack_register--------+-----+ | |  |Generic Error Status Block 1|<-----+ |   |
 +  | | read_ack_preserve        |       | |  |-+------------------------+-+        |   |
 +  | | read_ack_write           |       | |  | |          CPER          | |        |   |
 +  + +--------------------------|       | |  | |          CPER          | |        |   |
 +  | | ...............          |       | |  | |          ....          | |        |   |
 +  + +--------------------------+       | |  | |          CPER          | |        |   |
 +  | | GHESN                    |       | |  |-+------------------------+-|        |   |
 +  + +--------------------------+       | |  |Generic Error Status Block 2|<-------+   |
 +  | | .................        |       | |  |-+------------------------+-+            |
 +  | | error_status_address-----+-------+ |  | |           CPER         | |            |
 +  | | .................        |         |  | |           CPER         | |            |
 +  | | read_ack_register--------+---------+  | |           ....         | |            |
 +  | | read_ack_preserve        |            | |           CPER         | |            |
 +  | | read_ack_write           |            +-+------------------------+-+            |
 +  + +--------------------------+            |         ..........         |            |
 +                                            |----------------------------+            |
 +                                            |Generic Error Status Block N |<----------+
 +                                            |-+-------------------------+-+
 +                                            | |          CPER           | |
 +                                            | |          CPER           | |
 +                                            | |          ....           | |
 +                                            | |          CPER           | |
 +                                            +-+-------------------------+-+
 +
 +
 +(1) QEMU generates the ACPI HEST table. This table goes in the current
 +    "etc/acpi/tables" fw_cfg blob. Each error source has different
 +    notification types.
 +
 +(2) A new fw_cfg blob called "etc/hardware_errors" is introduced. QEMU
 +    also needs to populate this blob. The "etc/hardware_errors" fw_cfg blob
 +    contains an address registers table and an Error Status Data Block table.
 +
 +(3) The address registers table contains N Error Block Address entries
 +    and N Read Ack Register entries. The size for each entry is 8-byte.
 +    The Error Status Data Block table contains N Error Status Data Block
 +    entries. The size for each entry is 4096(0x1000) bytes. The total size
 +    for the "etc/hardware_errors" fw_cfg blob is (N * 8 * 2 + N * 4096) bytes.
 +    N is the number of the kinds of hardware error sources.
 +
 +(4) QEMU generates the ACPI linker/loader script for the firmware. The
 +    firmware pre-allocates memory for "etc/acpi/tables", "etc/hardware_errors"
 +    and copies blob contents there.
 +
 +(5) QEMU generates N ADD_POINTER commands, which patch addresses in the
 +    "error_status_address" fields of the HEST table with a pointer to the
 +    corresponding "address registers" in the "etc/hardware_errors" blob.
 +
 +(6) QEMU generates N ADD_POINTER commands, which patch addresses in the
 +    "read_ack_register" fields of the HEST table with a pointer to the
 +    corresponding "read_ack_register" within the "etc/hardware_errors" blob.
 +
 +(7) QEMU generates N ADD_POINTER commands for the firmware, which patch
 +    addresses in the "error_block_address" fields with a pointer to the
 +    respective "Error Status Data Block" in the "etc/hardware_errors" blob.
 +
 +(8) QEMU defines a third and write-only fw_cfg blob which is called
 +    "etc/hardware_errors_addr". Through that blob, the firmware can send back
 +    the guest-side allocation addresses to QEMU. The "etc/hardware_errors_addr"
 +    blob contains a 8-byte entry. QEMU generates a single WRITE_POINTER command
 +    for the firmware. The firmware will write back the start address of
 +    "etc/hardware_errors" blob to the fw_cfg file "etc/hardware_errors_addr".
 +
 +(9) When QEMU gets a SIGBUS from the kernel, QEMU writes CPER into corresponding
 +    "Error Status Data Block", guest memory, and then injects platform specific
 +    interrupt (in case of arm/virt machine it's Synchronous External Abort) as a
 +    notification which is necessary for notifying the guest.
 +
 +(10) This notification (in virtual hardware) will be handled by the guest
 +     kernel, on receiving notification, guest APEI driver could read the CPER error
 +     and take appropriate action.
 +
 +(11) kvm_arch_on_sigbus_vcpu() uses source_id as index in "etc/hardware_errors" to
 +     find out "Error Status Data Block" entry corresponding to error source. So supported
 +     source_id values should be assigned here and not be changed afterwards to make sure
 +     that guest will write error into expected "Error Status Data Block" even if guest was
 +     migrated to a newer QEMU.
 diff --git a/docs/specs/index.rst b/docs/specs/index.rst
 index XXXXXXX..XXXXXXX 100644
---- a/docs/specs/index.rst
+--- a/target/arm/cpu64.c
-+++ b/docs/specs/index.rst
++++ b/target/arm/cpu64.c
-@@ -XXX,XX +XXX,XX @@ Contents:
+@@ -XXX,XX +XXX,XX @@
-    ppc-spapr-xive
+ #include "qemu/osdep.h"
-    acpi_hw_reduced_hotplug
+ #include "qapi/error.h"
-    tpm
+ #include "cpu.h"
-+   acpi_hest_ghes
+-#ifdef CONFIG_TCG
 -#include "hw/core/tcg-cpu-ops.h"
 -#endif /* CONFIG_TCG */
  #include "qemu/module.h"
 -#if !defined(CONFIG_USER_ONLY)
 -#include "hw/loader.h"
 -#endif
  #include "sysemu/kvm.h"
  #include "sysemu/hvf.h"
  #include "kvm_arm.h"
 --
-.20.1
+.25.1

-[PULL 20/45] hw/arm/virt: Introduce a RAS machine option
+[PULL 24/34] hw/input/tsc2xxx: Constify set_transform()'s MouseTransformInfo arg
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Philippe Mathieu-Daudé <philmd@linaro.org>
-RAS Virtualization feature is not supported now, so
+The pointed MouseTransformInfo structure is accessed read-only.
 add a RAS machine option and disable it by default.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+Message-id: 20221220142520.24094-2-philmd@linaro.org
 Reviewed-by: Jonathan Cameron <Jonathan.Cameron@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Message-id: 20200512030609.19593-3-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/arm/virt.h |  1 +
+ include/hw/input/tsc2xxx.h | 4 ++--
- hw/arm/virt.c         | 23 +++++++++++++++++++++++
+ hw/input/tsc2005.c         | 2 +-
-files changed, 24 insertions(+)
+ hw/input/tsc210x.c         | 3 +--
 files changed, 4 insertions(+), 5 deletions(-)
-diff --git a/include/hw/arm/virt.h b/include/hw/arm/virt.h
+diff --git a/include/hw/input/tsc2xxx.h b/include/hw/input/tsc2xxx.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/virt.h
+--- a/include/hw/input/tsc2xxx.h
-+++ b/include/hw/arm/virt.h
++++ b/include/hw/input/tsc2xxx.h
-@@ -XXX,XX +XXX,XX @@ typedef struct {
+@@ -XXX,XX +XXX,XX @@ uWireSlave *tsc2102_init(qemu_irq pint);
-     bool highmem_ecam;
+ uWireSlave *tsc2301_init(qemu_irq penirq, qemu_irq kbirq, qemu_irq dav);
-     bool its;
+ I2SCodec *tsc210x_codec(uWireSlave *chip);
-     bool virt;
+ uint32_t tsc210x_txrx(void *opaque, uint32_t value, int len);
-+    bool ras;
+-void tsc210x_set_transform(uWireSlave *chip, MouseTransformInfo *info);
-     OnOffAuto acpi;
++void tsc210x_set_transform(uWireSlave *chip, const MouseTransformInfo *info);
-     VirtGICType gic_version;
+ void tsc210x_key_event(uWireSlave *chip, int key, int down);
-     VirtIOMMUType iommu;
-diff --git a/hw/arm/virt.c b/hw/arm/virt.c
+ /* tsc2005.c */
  void *tsc2005_init(qemu_irq pintdav);
  uint32_t tsc2005_txrx(void *opaque, uint32_t value, int len);
 -void tsc2005_set_transform(void *opaque, MouseTransformInfo *info);
 +void tsc2005_set_transform(void *opaque, const MouseTransformInfo *info);
  #endif
 diff --git a/hw/input/tsc2005.c b/hw/input/tsc2005.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/virt.c
+--- a/hw/input/tsc2005.c
-+++ b/hw/arm/virt.c
++++ b/hw/input/tsc2005.c
-@@ -XXX,XX +XXX,XX @@ static void virt_set_acpi(Object *obj, Visitor *v, const char *name,
+@@ -XXX,XX +XXX,XX @@ void *tsc2005_init(qemu_irq pintdav)
-     visit_type_OnOffAuto(v, name, &vms->acpi, errp);
+  * from the touchscreen.  Assuming 12-bit precision was used during
- }
+  * tslib calibration.
+  */
-+static bool virt_get_ras(Object *obj, Error **errp)
+-void tsc2005_set_transform(void *opaque, MouseTransformInfo *info)
-+{
++void tsc2005_set_transform(void *opaque, const MouseTransformInfo *info)
 +    VirtMachineState *vms = VIRT_MACHINE(obj);
 +
 +    return vms->ras;
 +}
 +
 +static void virt_set_ras(Object *obj, bool value, Error **errp)
 +{
 +    VirtMachineState *vms = VIRT_MACHINE(obj);
 +
 +    vms->ras = value;
 +}
 +
  static char *virt_get_gic_version(Object *obj, Error **errp)
  {
-     VirtMachineState *vms = VIRT_MACHINE(obj);
+     TSC2005State *s = (TSC2005State *) opaque;
-@@ -XXX,XX +XXX,XX @@ static void virt_instance_init(Object *obj)
-                                     "Valid values are none and smmuv3",
+diff --git a/hw/input/tsc210x.c b/hw/input/tsc210x.c
-                                     NULL);
+index XXXXXXX..XXXXXXX 100644
+--- a/hw/input/tsc210x.c
-+    /* Default disallows RAS instantiation */
++++ b/hw/input/tsc210x.c
-+    vms->ras = false;
+@@ -XXX,XX +XXX,XX @@ I2SCodec *tsc210x_codec(uWireSlave *chip)
-+    object_property_add_bool(obj, "ras", virt_get_ras,
+  * from the touchscreen.  Assuming 12-bit precision was used during
-+                             virt_set_ras, NULL);
+  * tslib calibration.
-+    object_property_set_description(obj, "ras",
+  */
-+                                    "Set on/off to enable/disable reporting host memory errors "
+-void tsc210x_set_transform(uWireSlave *chip,
-+                                    "to a KVM guest using ACPI and guest external abort exceptions",
+-                MouseTransformInfo *info)
-+                                    NULL);
++void tsc210x_set_transform(uWireSlave *chip, const MouseTransformInfo *info)
-+
+ {
-     vms->irqmap = a15irqmap;
+     TSC210xState *s = (TSC210xState *) chip->opaque;
+ #if 0
      virt_flash_create(vms);
 --
-.20.1
+.25.1

-[PULL 13/45] target/arm: Create gen_gvec_{qrdmla,qrdmls}
+[PULL 25/34] hw/arm/nseries: Constify various read-only arrays
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <philmd@linaro.org>
-Provide a functional interface for the vector expansion.
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-This fits better with the existing set of helpers that
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-we provide for other operations.
+Message-id: 20221220142520.24094-3-philmd@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-13-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.h     |  5 ++++
+ hw/arm/nseries.c | 18 +++++++++---------
- target/arm/translate-a64.c | 34 ++----------------------
+file changed, 9 insertions(+), 9 deletions(-)
  target/arm/translate.c     | 54 +++++++++++++++++++-------------------
 files changed, 34 insertions(+), 59 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+diff --git a/hw/arm/nseries.c b/hw/arm/nseries.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/hw/arm/nseries.c
-+++ b/target/arm/translate.h
++++ b/hw/arm/nseries.c
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+@@ -XXX,XX +XXX,XX @@ static void n8x0_i2c_setup(struct n800_s *s)
  void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
                         is_q ? 16 : 8, vec_full_reg_size(s), data, fn);
  }
--/* Expand a 3-operand + env pointer operation using
+ /* Touchscreen and keypad controller */
-- * an out-of-line helper.
+-static MouseTransformInfo n800_pointercal = {
-- */
++static const MouseTransformInfo n800_pointercal = {
--static void gen_gvec_op3_env(DisasContext *s, bool is_q, int rd,
+     .x = 800,
--                             int rn, int rm, gen_helper_gvec_3_ptr *fn)
+     .y = 480,
--{
+     .a = { 14560, -68, -3455208, -39, -9621, 35152972, 65536 },
 -    tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
 -                       vec_full_reg_offset(s, rn),
 -                       vec_full_reg_offset(s, rm), cpu_env,
 -                       is_q ? 16 : 8, vec_full_reg_size(s), 0, fn);
 -}
 -
  /* Expand a 3-operand + fpstatus pointer + simd data value operation using
   * an out-of-line helper.
   */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
      switch (opcode) {
      case 0x0: /* SQRDMLAH (vector) */
 -        switch (size) {
 -        case 1:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlah_s16);
 -            break;
 -        case 2:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlah_s32);
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 +        gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqrdmlah_qc, size);
          return;
      case 0x1: /* SQRDMLSH (vector) */
 -        switch (size) {
 -        case 1:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlsh_s16);
 -            break;
 -        case 2:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlsh_s32);
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 +        gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqrdmlsh_qc, size);
          return;
      case 0x2: /* SDOT / UDOT */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static const uint8_t neon_2rm_sizes[] = {
      [NEON_2RM_VCVT_UF] = 0x4,
  };
--
+-static MouseTransformInfo n810_pointercal = {
--/* Expand v8.1 simd helper.  */
++static const MouseTransformInfo n810_pointercal = {
--static int do_v81_helper(DisasContext *s, gen_helper_gvec_3_ptr *fn,
+     .x = 800,
--                         int q, int rd, int rn, int rm)
+     .y = 480,
-+void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     .a = { 15041, 148, -4731056, 171, -10238, 35933380, 65536 },
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
+@@ -XXX,XX +XXX,XX @@ static void n810_key_event(void *opaque, int keycode)
  #define M    0
 -static int n810_keys[0x80] = {
 +static const int n810_keys[0x80] = {
      [0x01] = 16,    /* Q */
      [0x02] = 37,    /* K */
      [0x03] = 24,    /* O */
@@ -XXX,XX +XXX,XX @@ static void n8x0_usb_setup(struct n800_s *s)
  /* Setup done before the main bootloader starts by some early setup code
   * - used when we want to run the main bootloader in emulation.  This
   * isn't documented.  */
 -static uint32_t n800_pinout[104] = {
 +static const uint32_t n800_pinout[104] = {
 x080f00d8, 0x00d40808, 0x03080808, 0x080800d0,
 x00dc0808, 0x0b0f0f00, 0x080800b4, 0x00c00808,
 x08080808, 0x180800c4, 0x00b80000, 0x08080808,
@@ -XXX,XX +XXX,XX @@ static void n8x0_boot_init(void *opaque)
  #define OMAP_TAG_CBUS        0x4e03
  #define OMAP_TAG_EM_ASIC_BB5    0x4e04
 -static struct omap_gpiosw_info_s {
 +static const struct omap_gpiosw_info_s {
      const char *name;
      int line;
      int type;
@@ -XXX,XX +XXX,XX @@ static struct omap_gpiosw_info_s {
      { NULL }
  };
 -static struct omap_partition_info_s {
 +static const struct omap_partition_info_s {
      uint32_t offset;
      uint32_t size;
      int mask;
@@ -XXX,XX +XXX,XX @@ static struct omap_partition_info_s {
      { 0, 0, 0, NULL }
  };
 -static uint8_t n8x0_bd_addr[6] = { N8X0_BD_ADDR };
 +static const uint8_t n8x0_bd_addr[6] = { N8X0_BD_ADDR };
  static int n8x0_atag_setup(void *p, int model)
  {
--    if (dc_isar_feature(aa32_rdm, s)) {
+     uint8_t *b;
--        int opr_sz = (1 + q) * 8;
+     uint16_t *w;
--        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
+     uint32_t *l;
--                           vfp_reg_offset(1, rn),
+-    struct omap_gpiosw_info_s *gpiosw;
--                           vfp_reg_offset(1, rm), cpu_env,
+-    struct omap_partition_info_s *partition;
--                           opr_sz, opr_sz, 0, fn);
++    const struct omap_gpiosw_info_s *gpiosw;
--        return 0;
++    const struct omap_partition_info_s *partition;
--    }
+     const char *tag;
--    return 1;
-+    static gen_helper_gvec_3_ptr * const fns[2] = {
+     w = p;
 +        gen_helper_gvec_qrdmlah_s16, gen_helper_gvec_qrdmlah_s32
 +    };
 +    tcg_debug_assert(vece >= 1 && vece <= 2);
 +    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
 +                       opr_sz, max_sz, 0, fns[vece - 1]);
 +}
 +
 +void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static gen_helper_gvec_3_ptr * const fns[2] = {
 +        gen_helper_gvec_qrdmlsh_s16, gen_helper_gvec_qrdmlsh_s32
 +    };
 +    tcg_debug_assert(vece >= 1 && vece <= 2);
 +    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
 +                       opr_sz, max_sz, 0, fns[vece - 1]);
  }
  #define GEN_CMP0(NAME, COND)                                            \
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  break;  /* VPADD */
              }
              /* VQRDMLAH */
 -            switch (size) {
 -            case 1:
 -                return do_v81_helper(s, gen_helper_gvec_qrdmlah_s16,
 -                                     q, rd, rn, rm);
 -            case 2:
 -                return do_v81_helper(s, gen_helper_gvec_qrdmlah_s32,
 -                                     q, rd, rn, rm);
 +            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
 +                gen_gvec_sqrdmlah_qc(size, rd_ofs, rn_ofs, rm_ofs,
 +                                     vec_size, vec_size);
 +                return 0;
              }
              return 1;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  break;
              }
              /* VQRDMLSH */
 -            switch (size) {
 -            case 1:
 -                return do_v81_helper(s, gen_helper_gvec_qrdmlsh_s16,
 -                                     q, rd, rn, rm);
 -            case 2:
 -                return do_v81_helper(s, gen_helper_gvec_qrdmlsh_s32,
 -                                     q, rd, rn, rm);
 +            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
 +                gen_gvec_sqrdmlsh_qc(size, rd_ofs, rn_ofs, rm_ofs,
 +                                     vec_size, vec_size);
 +                return 0;
              }
              return 1;
 --
-.20.1
+.25.1

-[PULL 24/45] ACPI: Record the Generic Error Status Block address
+[PULL 26/34] hw/arm/nseries: Silent -Wmissing-field-initializers warning
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Philippe Mathieu-Daudé <philmd@linaro.org>
-Record the GHEB address via fw_cfg file, when recording
+Silent when compiling with -Wextra:
 a error to CPER, it will use this address to find out
 Generic Error Data Entries and write the error.
-In order to avoid migration failure, make hardware
+  ../hw/arm/nseries.c:1081:12: warning: missing field 'line' initializer [-Wmissing-field-initializers]
-error table address to a part of GED device instead
+      { NULL }
-of global variable, then this address will be migrated
+             ^
 to target QEMU.
-Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Message-id: 20221220142520.24094-4-philmd@linaro.org
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-7-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/generic_event_device.h |  2 ++
+ hw/arm/nseries.c | 10 ++++------
- include/hw/acpi/ghes.h                 |  6 ++++++
+file changed, 4 insertions(+), 6 deletions(-)
  hw/acpi/generic_event_device.c         | 19 +++++++++++++++++++
  hw/acpi/ghes.c                         | 14 ++++++++++++++
  hw/arm/virt-acpi-build.c               |  8 ++++++++
 files changed, 49 insertions(+)
-diff --git a/include/hw/acpi/generic_event_device.h b/include/hw/acpi/generic_event_device.h
+diff --git a/hw/arm/nseries.c b/hw/arm/nseries.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/generic_event_device.h
+--- a/hw/arm/nseries.c
-+++ b/include/hw/acpi/generic_event_device.h
++++ b/hw/arm/nseries.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static const struct omap_gpiosw_info_s {
+         "headphone", N8X0_HEADPHONE_GPIO,
- #include "hw/sysbus.h"
+         OMAP_GPIOSW_TYPE_CONNECTION | OMAP_GPIOSW_INVERTED,
- #include "hw/acpi/memory_hotplug.h"
+     },
-+#include "hw/acpi/ghes.h"
+-    { NULL }
++    { /* end of list */ }
- #define ACPI_POWER_BUTTON_DEVICE "PWRB"
+ }, n810_gpiosw_info[] = {
+     {
-@@ -XXX,XX +XXX,XX @@ typedef struct AcpiGedState {
+         "gps_reset", N810_GPS_RESET_GPIO,
-     GEDState ged_state;
+@@ -XXX,XX +XXX,XX @@ static const struct omap_gpiosw_info_s {
-     uint32_t ged_event_bitmap;
+         "slide", N810_SLIDE_GPIO,
-     qemu_irq irq;
+         OMAP_GPIOSW_TYPE_COVER | OMAP_GPIOSW_INVERTED,
-+    AcpiGhesState ghes_state;
+     },
- } AcpiGedState;
+-    { NULL }
++    { /* end of list */ }
  void build_ged_aml(Aml *table, const char* name, HotplugHandler *hotplug_dev,
 diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/hw/acpi/ghes.h
 +++ b/include/hw/acpi/ghes.h
@@ -XXX,XX +XXX,XX @@ enum {
      ACPI_HEST_SRC_ID_RESERVED,
  };
-+typedef struct AcpiGhesState {
+ static const struct omap_partition_info_s {
-+    uint64_t ghes_addr_le;
+@@ -XXX,XX +XXX,XX @@ static const struct omap_partition_info_s {
-+} AcpiGhesState;
+     { 0x00080000, 0x00200000, 0x0, "kernel" },
-+
+     { 0x00280000, 0x00200000, 0x3, "initfs" },
- void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
+     { 0x00480000, 0x0fb80000, 0x3, "rootfs" },
- void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
+-
-+void acpi_ghes_add_fw_cfg(AcpiGhesState *vms, FWCfgState *s,
+-    { 0, 0, 0, NULL }
-+                          GArray *hardware_errors);
++    { /* end of list */ }
- #endif
+ }, n810_part_info[] = {
-diff --git a/hw/acpi/generic_event_device.c b/hw/acpi/generic_event_device.c
+     { 0x00000000, 0x00020000, 0x3, "bootloader" },
-index XXXXXXX..XXXXXXX 100644
+     { 0x00020000, 0x00060000, 0x0, "config" },
---- a/hw/acpi/generic_event_device.c
+     { 0x00080000, 0x00220000, 0x0, "kernel" },
-+++ b/hw/acpi/generic_event_device.c
+     { 0x002a0000, 0x00400000, 0x0, "initfs" },
-@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_ged_state = {
+     { 0x006a0000, 0x0f960000, 0x0, "rootfs" },
-     }
+-
 -    { 0, 0, 0, NULL }
 +    { /* end of list */ }
  };
-+static bool ghes_needed(void *opaque)
+ static const uint8_t n8x0_bd_addr[6] = { N8X0_BD_ADDR };
 +{
 +    AcpiGedState *s = opaque;
 +    return s->ghes_state.ghes_addr_le;
 +}
 +
 +static const VMStateDescription vmstate_ghes_state = {
 +    .name = "acpi-ged/ghes",
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .needed = ghes_needed,
 +    .fields      = (VMStateField[]) {
 +        VMSTATE_STRUCT(ghes_state, AcpiGedState, 1,
 +                       vmstate_ghes_state, AcpiGhesState),
 +        VMSTATE_END_OF_LIST()
 +    }
 +};
 +
  static const VMStateDescription vmstate_acpi_ged = {
      .name = "acpi-ged",
      .version_id = 1,
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_acpi_ged = {
      },
      .subsections = (const VMStateDescription * []) {
          &vmstate_memhp_state,
 +        &vmstate_ghes_state,
          NULL
      }
  };
 diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/ghes.c
 +++ b/hw/acpi/ghes.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/acpi/ghes.h"
  #include "hw/acpi/aml-build.h"
  #include "qemu/error-report.h"
 +#include "hw/acpi/generic_event_device.h"
 +#include "hw/nvram/fw_cfg.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@ void acpi_build_hest(GArray *table_data, BIOSLinker *linker)
      build_header(linker, table_data, (void *)(table_data->data + hest_start),
          "HEST", table_data->len - hest_start, 1, NULL, NULL);
  }
 +
 +void acpi_ghes_add_fw_cfg(AcpiGhesState *ags, FWCfgState *s,
 +                          GArray *hardware_error)
 +{
 +    /* Create a read-only fw_cfg file for GHES */
 +    fw_cfg_add_file(s, ACPI_GHES_ERRORS_FW_CFG_FILE, hardware_error->data,
 +                    hardware_error->len);
 +
 +    /* Create a read-write fw_cfg file for Address */
 +    fw_cfg_add_file_callback(s, ACPI_GHES_DATA_ADDR_FW_CFG_FILE, NULL, NULL,
 +        NULL, &(ags->ghes_addr_le), sizeof(ags->ghes_addr_le), false);
 +}
 diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt-acpi-build.c
 +++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ void virt_acpi_setup(VirtMachineState *vms)
  {
      AcpiBuildTables tables;
      AcpiBuildState *build_state;
 +    AcpiGedState *acpi_ged_state;
      if (!vms->fw_cfg) {
          trace_virt_acpi_setup();
@@ -XXX,XX +XXX,XX @@ void virt_acpi_setup(VirtMachineState *vms)
      fw_cfg_add_file(vms->fw_cfg, ACPI_BUILD_TPMLOG_FILE, tables.tcpalog->data,
                      acpi_data_len(tables.tcpalog));
 +    if (vms->ras) {
 +        assert(vms->acpi_dev);
 +        acpi_ged_state = ACPI_GED(vms->acpi_dev);
 +        acpi_ghes_add_fw_cfg(&acpi_ged_state->ghes_state,
 +                             vms->fw_cfg, tables.hardware_errors);
 +    }
 +
      build_state->rsdp_mr = acpi_add_rom_blob(virt_acpi_build_update,
                                               build_state, tables.rsdp,
                                               ACPI_BUILD_RSDP_FILE, 0);
 --
-.20.1
+.25.1

-[PULL 23/45] ACPI: Build Hardware Error Source Table
+[PULL 27/34] target/arm: align exposed ID registers with Linux
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Zhuojia Shen <chaosdefinition@hotmail.com>
-This patch builds Hardware Error Source Table(HEST) via fw_cfg blobs.
+In CPUID registers exposed to userspace, some registers were missing
-Now it only supports ARMv8 SEA, a type of Generic Hardware Error
+and some fields were not exposed.  This patch aligns exposed ID
-Source version 2(GHESv2) error source. Afterwards, we can extend
+registers and their fields with what the upstream kernel currently
-the supported types if needed. For the CPER section, currently it
+exposes.
-is memory section because kernel mainly wants userspace to handle
-the memory errors.
+Specifically, the following new ID registers/fields are exposed to
+userspace:
-This patch follows the spec ACPI 6.2 to build the Hardware Error
-Source table. For more detailed information, please refer to
+ID_AA64PFR1_EL1.BT:       bits 3-0
-document: docs/specs/acpi_hest_ghes.rst
+ID_AA64PFR1_EL1.MTE:      bits 11-8
+ID_AA64PFR1_EL1.SME:      bits 27-24
-build_ghes_hw_error_notification() helper will help to add Hardware
-Error Notification to ACPI tables without using packed C structures
+ID_AA64ZFR0_EL1.SVEver:   bits 3-0
-and avoid endianness issues as API doesn't need explicit conversion.
+ID_AA64ZFR0_EL1.AES:      bits 7-4
+ID_AA64ZFR0_EL1.BitPerm:  bits 19-16
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+ID_AA64ZFR0_EL1.BF16:     bits 23-20
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+ID_AA64ZFR0_EL1.SHA3:     bits 35-32
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+ID_AA64ZFR0_EL1.SM4:      bits 43-40
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+ID_AA64ZFR0_EL1.I8MM:     bits 47-44
-Message-id: 20200512030609.19593-6-gengdongjiu@huawei.com
+ID_AA64ZFR0_EL1.F32MM:    bits 55-52
 ID_AA64ZFR0_EL1.F64MM:    bits 59-56
 ID_AA64SMFR0_EL1.F32F32:  bit 32
 ID_AA64SMFR0_EL1.B16F32:  bit 34
 ID_AA64SMFR0_EL1.F16F32:  bit 35
 ID_AA64SMFR0_EL1.I8I32:   bits 39-36
 ID_AA64SMFR0_EL1.F64F64:  bit 48
 ID_AA64SMFR0_EL1.I16I64:  bits 55-52
 ID_AA64SMFR0_EL1.FA64:    bit 63
 ID_AA64MMFR0_EL1.ECV:     bits 63-60
 ID_AA64MMFR1_EL1.AFP:     bits 47-44
 ID_AA64MMFR2_EL1.AT:      bits 35-32
 ID_AA64ISAR0_EL1.RNDR:    bits 63-60
 ID_AA64ISAR1_EL1.FRINTTS: bits 35-32
 ID_AA64ISAR1_EL1.BF16:    bits 47-44
 ID_AA64ISAR1_EL1.DGH:     bits 51-48
 ID_AA64ISAR1_EL1.I8MM:    bits 55-52
 ID_AA64ISAR2_EL1.WFxT:    bits 3-0
 ID_AA64ISAR2_EL1.RPRES:   bits 7-4
 ID_AA64ISAR2_EL1.GPA3:    bits 11-8
 ID_AA64ISAR2_EL1.APA3:    bits 15-12
 The code is also refactored to use symbolic names for ID register fields
 for better readability and maintainability.
 The test case in tests/tcg/aarch64/sysregs.c is also updated to match
 the intended behavior.
 Signed-off-by: Zhuojia Shen <chaosdefinition@hotmail.com>
 Message-id: DS7PR12MB6309FB585E10772928F14271ACE79@DS7PR12MB6309.namprd12.prod.outlook.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 [PMM: use Sn_n_Cn_Cn_n syntax to work with older assemblers
 that don't recognize id_aa64isar2_el1 and id_aa64mmfr2_el1]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/ghes.h   |  39 ++++++++++++
+ target/arm/helper.c               | 96 +++++++++++++++++++++++++------
- hw/acpi/ghes.c           | 126 +++++++++++++++++++++++++++++++++++++++
+ tests/tcg/aarch64/sysregs.c       | 24 ++++++--
- hw/arm/virt-acpi-build.c |   2 +
+ tests/tcg/aarch64/Makefile.target |  7 ++-
-files changed, 167 insertions(+)
+files changed, 103 insertions(+), 24 deletions(-)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/target/arm/helper.c
-+++ b/include/hw/acpi/ghes.h
++++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
  #ifdef CONFIG_USER_ONLY
          static const ARMCPRegUserSpaceInfo v8_user_idregs[] = {
              { .name = "ID_AA64PFR0_EL1",
 -              .exported_bits = 0x000f000f00ff0000,
 -              .fixed_bits    = 0x0000000000000011 },
 +              .exported_bits = R_ID_AA64PFR0_FP_MASK |
 +                               R_ID_AA64PFR0_ADVSIMD_MASK |
 +                               R_ID_AA64PFR0_SVE_MASK |
 +                               R_ID_AA64PFR0_DIT_MASK,
 +              .fixed_bits = (0x1u << R_ID_AA64PFR0_EL0_SHIFT) |
 +                            (0x1u << R_ID_AA64PFR0_EL1_SHIFT) },
              { .name = "ID_AA64PFR1_EL1",
 -              .exported_bits = 0x00000000000000f0 },
 +              .exported_bits = R_ID_AA64PFR1_BT_MASK |
 +                               R_ID_AA64PFR1_SSBS_MASK |
 +                               R_ID_AA64PFR1_MTE_MASK |
 +                               R_ID_AA64PFR1_SME_MASK },
              { .name = "ID_AA64PFR*_EL1_RESERVED",
 -              .is_glob = true                     },
 -            { .name = "ID_AA64ZFR0_EL1"           },
 +              .is_glob = true },
 +            { .name = "ID_AA64ZFR0_EL1",
 +              .exported_bits = R_ID_AA64ZFR0_SVEVER_MASK |
 +                               R_ID_AA64ZFR0_AES_MASK |
 +                               R_ID_AA64ZFR0_BITPERM_MASK |
 +                               R_ID_AA64ZFR0_BFLOAT16_MASK |
 +                               R_ID_AA64ZFR0_SHA3_MASK |
 +                               R_ID_AA64ZFR0_SM4_MASK |
 +                               R_ID_AA64ZFR0_I8MM_MASK |
 +                               R_ID_AA64ZFR0_F32MM_MASK |
 +                               R_ID_AA64ZFR0_F64MM_MASK },
 +            { .name = "ID_AA64SMFR0_EL1",
 +              .exported_bits = R_ID_AA64SMFR0_F32F32_MASK |
 +                               R_ID_AA64SMFR0_B16F32_MASK |
 +                               R_ID_AA64SMFR0_F16F32_MASK |
 +                               R_ID_AA64SMFR0_I8I32_MASK |
 +                               R_ID_AA64SMFR0_F64F64_MASK |
 +                               R_ID_AA64SMFR0_I16I64_MASK |
 +                               R_ID_AA64SMFR0_FA64_MASK },
              { .name = "ID_AA64MMFR0_EL1",
 -              .fixed_bits    = 0x00000000ff000000 },
 -            { .name = "ID_AA64MMFR1_EL1"          },
 +              .exported_bits = R_ID_AA64MMFR0_ECV_MASK,
 +              .fixed_bits = (0xfu << R_ID_AA64MMFR0_TGRAN64_SHIFT) |
 +                            (0xfu << R_ID_AA64MMFR0_TGRAN4_SHIFT) },
 +            { .name = "ID_AA64MMFR1_EL1",
 +              .exported_bits = R_ID_AA64MMFR1_AFP_MASK },
 +            { .name = "ID_AA64MMFR2_EL1",
 +              .exported_bits = R_ID_AA64MMFR2_AT_MASK },
              { .name = "ID_AA64MMFR*_EL1_RESERVED",
 -              .is_glob = true                     },
 +              .is_glob = true },
              { .name = "ID_AA64DFR0_EL1",
 -              .fixed_bits    = 0x0000000000000006 },
 -            { .name = "ID_AA64DFR1_EL1"           },
 +              .fixed_bits = (0x6u << R_ID_AA64DFR0_DEBUGVER_SHIFT) },
 +            { .name = "ID_AA64DFR1_EL1" },
              { .name = "ID_AA64DFR*_EL1_RESERVED",
 -              .is_glob = true                     },
 +              .is_glob = true },
              { .name = "ID_AA64AFR*",
 -              .is_glob = true                     },
 +              .is_glob = true },
              { .name = "ID_AA64ISAR0_EL1",
 -              .exported_bits = 0x00fffffff0fffff0 },
 +              .exported_bits = R_ID_AA64ISAR0_AES_MASK |
 +                               R_ID_AA64ISAR0_SHA1_MASK |
 +                               R_ID_AA64ISAR0_SHA2_MASK |
 +                               R_ID_AA64ISAR0_CRC32_MASK |
 +                               R_ID_AA64ISAR0_ATOMIC_MASK |
 +                               R_ID_AA64ISAR0_RDM_MASK |
 +                               R_ID_AA64ISAR0_SHA3_MASK |
 +                               R_ID_AA64ISAR0_SM3_MASK |
 +                               R_ID_AA64ISAR0_SM4_MASK |
 +                               R_ID_AA64ISAR0_DP_MASK |
 +                               R_ID_AA64ISAR0_FHM_MASK |
 +                               R_ID_AA64ISAR0_TS_MASK |
 +                               R_ID_AA64ISAR0_RNDR_MASK },
              { .name = "ID_AA64ISAR1_EL1",
 -              .exported_bits = 0x000000f0ffffffff },
 +              .exported_bits = R_ID_AA64ISAR1_DPB_MASK |
 +                               R_ID_AA64ISAR1_APA_MASK |
 +                               R_ID_AA64ISAR1_API_MASK |
 +                               R_ID_AA64ISAR1_JSCVT_MASK |
 +                               R_ID_AA64ISAR1_FCMA_MASK |
 +                               R_ID_AA64ISAR1_LRCPC_MASK |
 +                               R_ID_AA64ISAR1_GPA_MASK |
 +                               R_ID_AA64ISAR1_GPI_MASK |
 +                               R_ID_AA64ISAR1_FRINTTS_MASK |
 +                               R_ID_AA64ISAR1_SB_MASK |
 +                               R_ID_AA64ISAR1_BF16_MASK |
 +                               R_ID_AA64ISAR1_DGH_MASK |
 +                               R_ID_AA64ISAR1_I8MM_MASK },
 +            { .name = "ID_AA64ISAR2_EL1",
 +              .exported_bits = R_ID_AA64ISAR2_WFXT_MASK |
 +                               R_ID_AA64ISAR2_RPRES_MASK |
 +                               R_ID_AA64ISAR2_GPA3_MASK |
 +                               R_ID_AA64ISAR2_APA3_MASK },
              { .name = "ID_AA64ISAR*_EL1_RESERVED",
 -              .is_glob = true                     },
 +              .is_glob = true },
          };
          modify_arm_cp_regs(v8_idregs, v8_user_idregs);
  #endif
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
  #ifdef CONFIG_USER_ONLY
          static const ARMCPRegUserSpaceInfo id_v8_user_midr_cp_reginfo[] = {
              { .name = "MIDR_EL1",
 -              .exported_bits = 0x00000000ffffffff },
 -            { .name = "REVIDR_EL1"                },
 +              .exported_bits = R_MIDR_EL1_REVISION_MASK |
 +                               R_MIDR_EL1_PARTNUM_MASK |
 +                               R_MIDR_EL1_ARCHITECTURE_MASK |
 +                               R_MIDR_EL1_VARIANT_MASK |
 +                               R_MIDR_EL1_IMPLEMENTER_MASK },
 +            { .name = "REVIDR_EL1" },
          };
          modify_arm_cp_regs(id_v8_midr_cp_reginfo, id_v8_user_midr_cp_reginfo);
  #endif
 diff --git a/tests/tcg/aarch64/sysregs.c b/tests/tcg/aarch64/sysregs.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/tcg/aarch64/sysregs.c
 +++ b/tests/tcg/aarch64/sysregs.c
 @@ -XXX,XX +XXX,XX @@
+ #define HWCAP_CPUID (1 << 11)
- #include "hw/acpi/bios-linker-loader.h"
+ #endif
 +/*
-+ * Values for Hardware Error Notification Type field
++ * Older assemblers don't recognize newer system register names,
 + * but we can still access them by the Sn_n_Cn_Cn_n syntax.
 + */
-+enum AcpiGhesNotifyType {
++#define SYS_ID_AA64ISAR2_EL1 S3_0_C0_C6_2
-+    /* Polled */
++#define SYS_ID_AA64MMFR2_EL1 S3_0_C0_C7_2
 +    ACPI_GHES_NOTIFY_POLLED = 0,
 +    /* External Interrupt */
 +    ACPI_GHES_NOTIFY_EXTERNAL = 1,
 +    /* Local Interrupt */
 +    ACPI_GHES_NOTIFY_LOCAL = 2,
 +    /* SCI */
 +    ACPI_GHES_NOTIFY_SCI = 3,
 +    /* NMI */
 +    ACPI_GHES_NOTIFY_NMI = 4,
 +    /* CMCI, ACPI 5.0: 18.3.2.7, Table 18-290 */
 +    ACPI_GHES_NOTIFY_CMCI = 5,
 +    /* MCE, ACPI 5.0: 18.3.2.7, Table 18-290 */
 +    ACPI_GHES_NOTIFY_MCE = 6,
 +    /* GPIO-Signal, ACPI 6.0: 18.3.2.7, Table 18-332 */
 +    ACPI_GHES_NOTIFY_GPIO = 7,
 +    /* ARMv8 SEA, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_SEA = 8,
 +    /* ARMv8 SEI, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_SEI = 9,
 +    /* External Interrupt - GSIV, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_GSIV = 10,
 +    /* Software Delegated Exception, ACPI 6.2: 18.3.2.9, Table 18-383 */
 +    ACPI_GHES_NOTIFY_SDEI = 11,
 +    /* 12 and greater are reserved */
 +    ACPI_GHES_NOTIFY_RESERVED = 12
 +};
 +
-+enum {
+ int failed_bit_count;
-+    ACPI_HEST_SRC_ID_SEA = 0,
-+    /* future ids go here */
+ /* Read and print system register `id' value */
-+    ACPI_HEST_SRC_ID_RESERVED,
+@@ -XXX,XX +XXX,XX @@ int main(void)
-+};
+      * minimum valid fields - for the purposes of this check allowed
-+
+      * to have non-zero values.
- void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
+      */
-+void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
+-    get_cpu_reg_check_mask(id_aa64isar0_el1, _m(00ff,ffff,f0ff,fff0));
- #endif
+-    get_cpu_reg_check_mask(id_aa64isar1_el1, _m(0000,00f0,ffff,ffff));
-diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
++    get_cpu_reg_check_mask(id_aa64isar0_el1, _m(f0ff,ffff,f0ff,fff0));
 +    get_cpu_reg_check_mask(id_aa64isar1_el1, _m(00ff,f0ff,ffff,ffff));
 +    get_cpu_reg_check_mask(SYS_ID_AA64ISAR2_EL1, _m(0000,0000,0000,ffff));
      /* TGran4 & TGran64 as pegged to -1 */
 -    get_cpu_reg_check_mask(id_aa64mmfr0_el1, _m(0000,0000,ff00,0000));
 -    get_cpu_reg_check_zero(id_aa64mmfr1_el1);
 +    get_cpu_reg_check_mask(id_aa64mmfr0_el1, _m(f000,0000,ff00,0000));
 +    get_cpu_reg_check_mask(id_aa64mmfr1_el1, _m(0000,f000,0000,0000));
 +    get_cpu_reg_check_mask(SYS_ID_AA64MMFR2_EL1, _m(0000,000f,0000,0000));
      /* EL1/EL0 reported as AA64 only */
      get_cpu_reg_check_mask(id_aa64pfr0_el1,  _m(000f,000f,00ff,0011));
 -    get_cpu_reg_check_mask(id_aa64pfr1_el1,  _m(0000,0000,0000,00f0));
 +    get_cpu_reg_check_mask(id_aa64pfr1_el1,  _m(0000,0000,0f00,0fff));
      /* all hidden, DebugVer fixed to 0x6 (ARMv8 debug architecture) */
      get_cpu_reg_check_mask(id_aa64dfr0_el1,  _m(0000,0000,0000,0006));
      get_cpu_reg_check_zero(id_aa64dfr1_el1);
 -    get_cpu_reg_check_zero(id_aa64zfr0_el1);
 +    get_cpu_reg_check_mask(id_aa64zfr0_el1,  _m(0ff0,ff0f,00ff,00ff));
 +#ifdef HAS_ARMV9_SME
 +    get_cpu_reg_check_mask(id_aa64smfr0_el1, _m(80f1,00fd,0000,0000));
 +#endif
      get_cpu_reg_check_zero(id_aa64afr0_el1);
      get_cpu_reg_check_zero(id_aa64afr1_el1);
 diff --git a/tests/tcg/aarch64/Makefile.target b/tests/tcg/aarch64/Makefile.target
 index XXXXXXX..XXXXXXX 100644
---- a/hw/acpi/ghes.c
+--- a/tests/tcg/aarch64/Makefile.target
-+++ b/hw/acpi/ghes.c
++++ b/tests/tcg/aarch64/Makefile.target
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ config-cc.mak: Makefile
- #include "qemu/units.h"
+         $(call cc-option,-march=armv8.1-a+sve2,         CROSS_CC_HAS_SVE2); \
- #include "hw/acpi/ghes.h"
+         $(call cc-option,-march=armv8.3-a,              CROSS_CC_HAS_ARMV8_3); \
- #include "hw/acpi/aml-build.h"
+         $(call cc-option,-mbranch-protection=standard,  CROSS_CC_HAS_ARMV8_BTI); \
-+#include "qemu/error-report.h"
+-        $(call cc-option,-march=armv8.5-a+memtag,       CROSS_CC_HAS_ARMV8_MTE)) 3> config-cc.mak
++        $(call cc-option,-march=armv8.5-a+memtag,       CROSS_CC_HAS_ARMV8_MTE); \
- #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
++        $(call cc-option,-march=armv9-a+sme,            CROSS_CC_HAS_ARMV9_SME)) 3> config-cc.mak
- #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
+ -include config-cc.mak
-@@ -XXX,XX +XXX,XX @@
- /* Now only support ARMv8 SEA notification type error source */
+ # Pauth Tests
- #define ACPI_GHES_ERROR_SOURCE_COUNT        1
+@@ -XXX,XX +XXX,XX @@ endif
+ ifneq ($(CROSS_CC_HAS_SVE),)
-+/* Generic Hardware Error Source version 2 */
+ # System Registers Tests
-+#define ACPI_GHES_SOURCE_GENERIC_ERROR_V2   10
+ AARCH64_TESTS += sysregs
-+
++ifneq ($(CROSS_CC_HAS_ARMV9_SME),)
-+/* Address offset in Generic Address Structure(GAS) */
++sysregs: CFLAGS+=-march=armv9-a+sme -DHAS_ARMV9_SME
-+#define GAS_ADDR_OFFSET 4
++else
-+
+ sysregs: CFLAGS+=-march=armv8.1-a+sve
-+/*
++endif
-+ * Hardware Error Notification
-+ * ACPI 4.0: 17.3.2.7 Hardware Error Notification
+ # SVE ioctl test
-+ * Composes dummy Hardware Error Notification descriptor of specified type
+ AARCH64_TESTS += sve-ioctls
 + */
 +static void build_ghes_hw_error_notification(GArray *table, const uint8_t type)
 +{
 +    /* Type */
 +    build_append_int_noprefix(table, type, 1);
 +    /*
 +     * Length:
 +     * Total length of the structure in bytes
 +     */
 +    build_append_int_noprefix(table, 28, 1);
 +    /* Configuration Write Enable */
 +    build_append_int_noprefix(table, 0, 2);
 +    /* Poll Interval */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Vector */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Switch To Polling Threshold Value */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Switch To Polling Threshold Window */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Error Threshold Value */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Error Threshold Window */
 +    build_append_int_noprefix(table, 0, 4);
 +}
 +
  /*
   * Build table for the hardware error fw_cfg blob.
   * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
@@ -XXX,XX +XXX,XX @@ void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker)
      bios_linker_loader_write_pointer(linker, ACPI_GHES_DATA_ADDR_FW_CFG_FILE,
 , sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE, 0);
  }
 +
 +/* Build Generic Hardware Error Source version 2 (GHESv2) */
 +static void build_ghes_v2(GArray *table_data, int source_id, BIOSLinker *linker)
 +{
 +    uint64_t address_offset;
 +    /*
 +     * Type:
 +     * Generic Hardware Error Source version 2(GHESv2 - Type 10)
 +     */
 +    build_append_int_noprefix(table_data, ACPI_GHES_SOURCE_GENERIC_ERROR_V2, 2);
 +    /* Source Id */
 +    build_append_int_noprefix(table_data, source_id, 2);
 +    /* Related Source Id */
 +    build_append_int_noprefix(table_data, 0xffff, 2);
 +    /* Flags */
 +    build_append_int_noprefix(table_data, 0, 1);
 +    /* Enabled */
 +    build_append_int_noprefix(table_data, 1, 1);
 +
 +    /* Number of Records To Pre-allocate */
 +    build_append_int_noprefix(table_data, 1, 4);
 +    /* Max Sections Per Record */
 +    build_append_int_noprefix(table_data, 1, 4);
 +    /* Max Raw Data Length */
 +    build_append_int_noprefix(table_data, ACPI_GHES_MAX_RAW_DATA_LENGTH, 4);
 +
 +    address_offset = table_data->len;
 +    /* Error Status Address */
 +    build_append_gas(table_data, AML_AS_SYSTEM_MEMORY, 0x40, 0,
 +                     4 /* QWord access */, 0);
 +    bios_linker_loader_add_pointer(linker, ACPI_BUILD_TABLE_FILE,
 +        address_offset + GAS_ADDR_OFFSET, sizeof(uint64_t),
 +        ACPI_GHES_ERRORS_FW_CFG_FILE, source_id * sizeof(uint64_t));
 +
 +    switch (source_id) {
 +    case ACPI_HEST_SRC_ID_SEA:
 +        /*
 +         * Notification Structure
 +         * Now only enable ARMv8 SEA notification type
 +         */
 +        build_ghes_hw_error_notification(table_data, ACPI_GHES_NOTIFY_SEA);
 +        break;
 +    default:
 +        error_report("Not support this error source");
 +        abort();
 +    }
 +
 +    /* Error Status Block Length */
 +    build_append_int_noprefix(table_data, ACPI_GHES_MAX_RAW_DATA_LENGTH, 4);
 +
 +    /*
 +     * Read Ack Register
 +     * ACPI 6.1: 18.3.2.8 Generic Hardware Error Source
 +     * version 2 (GHESv2 - Type 10)
 +     */
 +    address_offset = table_data->len;
 +    build_append_gas(table_data, AML_AS_SYSTEM_MEMORY, 0x40, 0,
 +                     4 /* QWord access */, 0);
 +    bios_linker_loader_add_pointer(linker, ACPI_BUILD_TABLE_FILE,
 +        address_offset + GAS_ADDR_OFFSET,
 +        sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE,
 +        (ACPI_GHES_ERROR_SOURCE_COUNT + source_id) * sizeof(uint64_t));
 +
 +    /*
 +     * Read Ack Preserve field
 +     * We only provide the first bit in Read Ack Register to OSPM to write
 +     * while the other bits are preserved.
 +     */
 +    build_append_int_noprefix(table_data, ~0x1ULL, 8);
 +    /* Read Ack Write */
 +    build_append_int_noprefix(table_data, 0x1, 8);
 +}
 +
 +/* Build Hardware Error Source Table */
 +void acpi_build_hest(GArray *table_data, BIOSLinker *linker)
 +{
 +    uint64_t hest_start = table_data->len;
 +
 +    /* Hardware Error Source Table header*/
 +    acpi_data_push(table_data, sizeof(AcpiTableHeader));
 +
 +    /* Error Source Count */
 +    build_append_int_noprefix(table_data, ACPI_GHES_ERROR_SOURCE_COUNT, 4);
 +
 +    build_ghes_v2(table_data, ACPI_HEST_SRC_ID_SEA, linker);
 +
 +    build_header(linker, table_data, (void *)(table_data->data + hest_start),
 +        "HEST", table_data->len - hest_start, 1, NULL, NULL);
 +}
 diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt-acpi-build.c
 +++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
      if (vms->ras) {
          build_ghes_error_table(tables->hardware_errors, tables->linker);
 +        acpi_add_table(table_offsets, tables_blob);
 +        acpi_build_hest(tables_blob, tables->linker);
      }
      if (ms->numa_state->num_nodes > 0) {
 --
-.20.1
+.25.1

-[PULL 12/45] target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
+[PULL 28/34] hw/arm/smmu-common: Reduce smmu_inv_notifiers_mr() scope
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <philmd@linaro.org>
-These operations do not touch fp_status.
+This function is not used anywhere outside this file,
 so we can make the function "static void".
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-12-richard.henderson@linaro.org
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Message-id: 20221216214924.4711-2-philmd@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  4 ++--
+ include/hw/arm/smmu-common.h | 3 ---
- target/arm/translate-a64.c |  5 ++---
+ hw/arm/smmu-common.c         | 2 +-
- target/arm/translate.c     | 12 ++----------
+files changed, 1 insertion(+), 4 deletions(-)
  target/arm/vfp_helper.c    |  5 ++---
 files changed, 8 insertions(+), 18 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/arm/smmu-common.h b/include/hw/arm/smmu-common.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/arm/smmu-common.h
-+++ b/target/arm/helper.h
++++ b/include/hw/arm/smmu-common.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@ void smmu_iotlb_inv_iova(SMMUState *s, int asid, dma_addr_t iova,
- DEF_HELPER_FLAGS_2(rsqrte_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+ /* Unmap the range of all the notifiers registered to any IOMMU mr */
- DEF_HELPER_FLAGS_2(rsqrte_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+ void smmu_inv_notifiers_all(SMMUState *s);
- DEF_HELPER_FLAGS_2(rsqrte_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
--DEF_HELPER_2(recpe_u32, i32, i32, ptr)
+-/* Unmap the range of all the notifiers registered to @mr */
--DEF_HELPER_FLAGS_2(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32, ptr)
+-void smmu_inv_notifiers_mr(IOMMUMemoryRegion *mr);
-+DEF_HELPER_FLAGS_1(recpe_u32, TCG_CALL_NO_RWG, i32, i32)
+-
-+DEF_HELPER_FLAGS_1(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32)
+ #endif /* HW_ARM_SMMU_COMMON_H */
- DEF_HELPER_FLAGS_4(neon_tbl, TCG_CALL_NO_RWG, i32, i32, i32, ptr, i32)
+diff --git a/hw/arm/smmu-common.c b/hw/arm/smmu-common.c
  DEF_HELPER_3(shl_cc, i32, env, i32, i32)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/arm/smmu-common.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/arm/smmu-common.c
-@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
+@@ -XXX,XX +XXX,XX @@ static void smmu_unmap_notifier_range(IOMMUNotifier *n)
              switch (opcode) {
              case 0x3c: /* URECPE */
 -                gen_helper_recpe_u32(tcg_res, tcg_op, fpst);
 +                gen_helper_recpe_u32(tcg_res, tcg_op);
                  break;
              case 0x3d: /* FRECPE */
                  gen_helper_recpe_f32(tcg_res, tcg_op, fpst);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                  unallocated_encoding(s);
                  return;
              }
 -            need_fpstatus = true;
              break;
          case 0x1e: /* FRINT32Z */
          case 0x1f: /* FRINT64Z */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                      gen_helper_rints_exact(tcg_res, tcg_op, tcg_fpstatus);
                      break;
                  case 0x7c: /* URSQRTE */
 -                    gen_helper_rsqrte_u32(tcg_res, tcg_op, tcg_fpstatus);
 +                    gen_helper_rsqrte_u32(tcg_res, tcg_op);
                      break;
                  case 0x1e: /* FRINT32Z */
                  case 0x5e: /* FRINT32X */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                              break;
                          }
                          case NEON_2RM_VRECPE:
 -                        {
 -                            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                            gen_helper_recpe_u32(tmp, tmp, fpstatus);
 -                            tcg_temp_free_ptr(fpstatus);
 +                            gen_helper_recpe_u32(tmp, tmp);
                              break;
 -                        }
                          case NEON_2RM_VRSQRTE:
 -                        {
 -                            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                            gen_helper_rsqrte_u32(tmp, tmp, fpstatus);
 -                            tcg_temp_free_ptr(fpstatus);
 +                            gen_helper_rsqrte_u32(tmp, tmp);
                              break;
 -                        }
                          case NEON_2RM_VRECPE_F:
                          {
                              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrte_f64)(float64 input, void *fpstp)
      return make_float64(val);
  }
--uint32_t HELPER(recpe_u32)(uint32_t a, void *fpstp)
+ /* Unmap all notifiers attached to @mr */
-+uint32_t HELPER(recpe_u32)(uint32_t a)
+-inline void smmu_inv_notifiers_mr(IOMMUMemoryRegion *mr)
 +static void smmu_inv_notifiers_mr(IOMMUMemoryRegion *mr)
  {
--    /* float_status *s = fpstp; */
+     IOMMUNotifier *n;
      int input, estimate;
      if ((a & 0x80000000) == 0) {
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(recpe_u32)(uint32_t a, void *fpstp)
      return deposit32(0, (32 - 9), 9, estimate);
  }
 -uint32_t HELPER(rsqrte_u32)(uint32_t a, void *fpstp)
 +uint32_t HELPER(rsqrte_u32)(uint32_t a)
  {
      int estimate;
 --
-.20.1
+.25.1

-[PULL 15/45] target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
+[PULL 29/34] hw/arm/smmu-common: Avoid using inlined functions with external linkage
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <philmd@linaro.org>
-Must clear the tail for AdvSIMD when SVE is enabled.
+When using Clang ("Apple clang version 14.0.0 (clang-1400.0.29.202)")
 and building with -Wall we get:
-Fixes: ca40a6e6e39
+  hw/arm/smmu-common.c:173:33: warning: static function 'smmu_hash_remove_by_asid_iova' is used in an inline function with external linkage [-Wstatic-in-inline]
-Cc: qemu-stable@nongnu.org
+  hw/arm/smmu-common.h:170:1: note: use 'static' to give inline function 'smmu_iotlb_inv_iova' internal linkage
     void smmu_iotlb_inv_iova(SMMUState *s, int asid, dma_addr_t iova,
     ^
     static
 None of our code base require / use inlined functions with external
 linkage. Some places use internal inlining in the hot path. These
 two functions are certainly not in any hot path and don't justify
 any inlining, so these are likely oversights rather than intentional.
 Reported-by: Stefan Weil <sw@weilnetz.de>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Message-id: 20200513163245.17915-15-richard.henderson@linaro.org
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Message-id: 20221216214924.4711-3-philmd@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/vec_helper.c | 2 ++
+ hw/arm/smmu-common.c | 13 ++++++-------
-file changed, 2 insertions(+)
+file changed, 6 insertions(+), 7 deletions(-)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+diff --git a/hw/arm/smmu-common.c b/hw/arm/smmu-common.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/hw/arm/smmu-common.c
-+++ b/target/arm/vec_helper.c
++++ b/hw/arm/smmu-common.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+@@ -XXX,XX +XXX,XX @@ void smmu_iotlb_insert(SMMUState *bs, SMMUTransCfg *cfg, SMMUTLBEntry *new)
-             d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
+     g_hash_table_insert(bs->iotlb, key, new);
          }                                                                  \
      }                                                                      \
 +    clear_tail(d, oprsz, simd_maxsz(desc));                                \
  }
- DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
+-inline void smmu_iotlb_inv_all(SMMUState *s)
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
++void smmu_iotlb_inv_all(SMMUState *s)
-                                      mm, a[i + j], 0, stat);               \
+ {
-         }                                                                  \
+     trace_smmu_iotlb_inv_all();
-     }                                                                      \
+     g_hash_table_remove_all(s->iotlb);
-+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
+@@ -XXX,XX +XXX,XX @@ static gboolean smmu_hash_remove_by_asid_iova(gpointer key, gpointer value,
             ((entry->iova & ~info->mask) == info->iova);
  }
- DO_FMLA_IDX(gvec_fmla_idx_h, float16, H2)
+-inline void
 -smmu_iotlb_inv_iova(SMMUState *s, int asid, dma_addr_t iova,
 -                    uint8_t tg, uint64_t num_pages, uint8_t ttl)
 +void smmu_iotlb_inv_iova(SMMUState *s, int asid, dma_addr_t iova,
 +                         uint8_t tg, uint64_t num_pages, uint8_t ttl)
  {
      /* if tg is not set we use 4KB range invalidation */
      uint8_t granule = tg ? tg * 2 + 10 : 12;
@@ -XXX,XX +XXX,XX @@ smmu_iotlb_inv_iova(SMMUState *s, int asid, dma_addr_t iova,
                                  &info);
  }
 -inline void smmu_iotlb_inv_asid(SMMUState *s, uint16_t asid)
 +void smmu_iotlb_inv_asid(SMMUState *s, uint16_t asid)
  {
      trace_smmu_iotlb_inv_asid(asid);
      g_hash_table_foreach_remove(s->iotlb, smmu_hash_remove_by_asid, &asid);
@@ -XXX,XX +XXX,XX @@ error:
   *
   * return 0 on success
   */
 -inline int smmu_ptw(SMMUTransCfg *cfg, dma_addr_t iova, IOMMUAccessFlags perm,
 -                    SMMUTLBEntry *tlbe, SMMUPTWEventInfo *info)
 +int smmu_ptw(SMMUTransCfg *cfg, dma_addr_t iova, IOMMUAccessFlags perm,
 +             SMMUTLBEntry *tlbe, SMMUPTWEventInfo *info)
  {
      if (!cfg->aa64) {
          /*
 --
-.20.1
+.25.1

-[PULL 08/45] target/arm: Create gen_gvec_{mla,mls}
+[PULL 30/34] i.MX7D: Connect GPT timers to IRQ
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Christophe Dubois <jcd@tribudubois.net>
-Provide a functional interface for the vector expansion.
+So far the GPT timers were unable to raise IRQs to the processor.
 This fits better with the existing set of helpers that
 we provide for other operations.
+Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-8-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.h          |   7 +-
+ include/hw/arm/fsl-imx7.h |  5 +++++
- target/arm/translate-a64.c      |   4 +-
+ hw/arm/fsl-imx7.c         | 10 ++++++++++
- target/arm/translate-neon.inc.c |  16 +----
+files changed, 15 insertions(+)
  target/arm/translate.c          | 117 +++++++++++++++++---------------
 files changed, 71 insertions(+), 73 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+diff --git a/include/hw/arm/fsl-imx7.h b/include/hw/arm/fsl-imx7.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/include/hw/arm/fsl-imx7.h
-+++ b/target/arm/translate.h
++++ b/include/hw/arm/fsl-imx7.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_cle0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+@@ -XXX,XX +XXX,XX @@ enum FslIMX7IRQs {
- void gen_gvec_cge0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+     FSL_IMX7_USB2_IRQ     = 42,
-                    uint32_t opr_sz, uint32_t max_sz);
+     FSL_IMX7_USB3_IRQ     = 40,
--extern const GVecGen3 mla_op[4];
++    FSL_IMX7_GPT1_IRQ     = 55,
--extern const GVecGen3 mls_op[4];
++    FSL_IMX7_GPT2_IRQ     = 54,
-+void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++    FSL_IMX7_GPT3_IRQ     = 53,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
++    FSL_IMX7_GPT4_IRQ     = 52,
 +void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +
- extern const GVecGen3 cmtst_op[4];
+     FSL_IMX7_WDOG1_IRQ    = 78,
- extern const GVecGen3 sshl_op[4];
+     FSL_IMX7_WDOG2_IRQ    = 79,
- extern const GVecGen3 ushl_op[4];
+     FSL_IMX7_WDOG3_IRQ    = 10,
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/hw/arm/fsl-imx7.c b/hw/arm/fsl-imx7.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/arm/fsl-imx7.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/arm/fsl-imx7.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
-         return;
+             FSL_IMX7_GPT4_ADDR,
-     case 0x12: /* MLA, MLS */
+         };
-         if (u) {
--            gen_gvec_op3(s, is_q, rd, rn, rm, &mls_op[size]);
++        static const int FSL_IMX7_GPTn_IRQ[FSL_IMX7_NUM_GPTS] = {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mls, size);
++            FSL_IMX7_GPT1_IRQ,
-         } else {
++            FSL_IMX7_GPT2_IRQ,
--            gen_gvec_op3(s, is_q, rd, rn, rm, &mla_op[size]);
++            FSL_IMX7_GPT3_IRQ,
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mla, size);
++            FSL_IMX7_GPT4_IRQ,
-         }
++        };
-         return;
++
-     case 0x11:
+         s->gpt[i].ccm = IMX_CCM(&s->ccm);
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+         sysbus_realize(SYS_BUS_DEVICE(&s->gpt[i]), &error_abort);
-index XXXXXXX..XXXXXXX 100644
+         sysbus_mmio_map(SYS_BUS_DEVICE(&s->gpt[i]), 0, FSL_IMX7_GPTn_ADDR[i]);
---- a/target/arm/translate-neon.inc.c
++        sysbus_connect_irq(SYS_BUS_DEVICE(&s->gpt[i]), 0,
-+++ b/target/arm/translate-neon.inc.c
++                           qdev_get_gpio_in(DEVICE(&s->a7mpcore),
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMAX_U, tcg_gen_gvec_umax)
++                                            FSL_IMX7_GPTn_IRQ[i]));
- DO_3SAME_NO_SZ_3(VMIN_S, tcg_gen_gvec_smin)
+     }
- DO_3SAME_NO_SZ_3(VMIN_U, tcg_gen_gvec_umin)
- DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
+     for (i = 0; i < FSL_IMX7_NUM_GPIOS; i++) {
 +DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
 +DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
  #define DO_3SAME_CMP(INSN, COND)                                        \
      static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VMUL_p_3s);
  }
 -#define DO_3SAME_GVEC3_NO_SZ_3(INSN, OPARRAY)                           \
 -    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 -                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 -                                uint32_t oprsz, uint32_t maxsz)         \
 -    {                                                                   \
 -        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
 -                       oprsz, maxsz, &OPARRAY[vece]);                   \
 -    }                                                                   \
 -    DO_3SAME_NO_SZ_3(INSN, gen_##INSN##_3s)
 -
 -
 -DO_3SAME_GVEC3_NO_SZ_3(VMLA, mla_op)
 -DO_3SAME_GVEC3_NO_SZ_3(VMLS, mls_op)
 -
  #define DO_3SAME_GVEC3_SHIFT(INSN, OPARRAY)                             \
      static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
                                  uint32_t rn_ofs, uint32_t rm_ofs,       \
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_mls_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
  /* Note that while NEON does not support VMLA and VMLS as 64-bit ops,
   * these tables are shared with AArch64 which does support them.
   */
 +void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_mul_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fni4 = gen_mla8_i32,
 +          .fniv = gen_mla_vec,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni4 = gen_mla16_i32,
 +          .fniv = gen_mla_vec,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_mla32_i32,
 +          .fniv = gen_mla_vec,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_mla64_i64,
 +          .fniv = gen_mla_vec,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 -static const TCGOpcode vecop_list_mla[] = {
 -    INDEX_op_mul_vec, INDEX_op_add_vec, 0
 -};
 -
 -static const TCGOpcode vecop_list_mls[] = {
 -    INDEX_op_mul_vec, INDEX_op_sub_vec, 0
 -};
 -
 -const GVecGen3 mla_op[4] = {
 -    { .fni4 = gen_mla8_i32,
 -      .fniv = gen_mla_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mla,
 -      .vece = MO_8 },
 -    { .fni4 = gen_mla16_i32,
 -      .fniv = gen_mla_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mla,
 -      .vece = MO_16 },
 -    { .fni4 = gen_mla32_i32,
 -      .fniv = gen_mla_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mla,
 -      .vece = MO_32 },
 -    { .fni8 = gen_mla64_i64,
 -      .fniv = gen_mla_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mla,
 -      .vece = MO_64 },
 -};
 -
 -const GVecGen3 mls_op[4] = {
 -    { .fni4 = gen_mls8_i32,
 -      .fniv = gen_mls_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mls,
 -      .vece = MO_8 },
 -    { .fni4 = gen_mls16_i32,
 -      .fniv = gen_mls_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mls,
 -      .vece = MO_16 },
 -    { .fni4 = gen_mls32_i32,
 -      .fniv = gen_mls_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mls,
 -      .vece = MO_32 },
 -    { .fni8 = gen_mls64_i64,
 -      .fniv = gen_mls_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_mls,
 -      .vece = MO_64 },
 -};
 +void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_mul_vec, INDEX_op_sub_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fni4 = gen_mls8_i32,
 +          .fniv = gen_mls_vec,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni4 = gen_mls16_i32,
 +          .fniv = gen_mls_vec,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_mls32_i32,
 +          .fniv = gen_mls_vec,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_mls64_i64,
 +          .fniv = gen_mls_vec,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
  /* CMTST : test is "if (X & Y != 0)". */
  static void gen_cmtst_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
 --
-.20.1
+.25.1

-[PULL 39/45] target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
+[PULL 31/34] i.MX7D: Compute clock frequency for the fixed frequency clocks.
-Convert the Neon VADD, VSUB, VABD 3-reg-same insns to decodetree.
+From: Jean-Christophe Dubois <jcd@tribudubois.net>
 We already have gvec helpers for addition and subtraction, but must
 add one for fabd.
+CCM derived clocks will have to be added later.
+Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-12-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  3 ++-
+ hw/misc/imx7_ccm.c | 49 +++++++++++++++++++++++++++++++++++++---------
- target/arm/neon-dp.decode       |  8 ++++++++
+file changed, 40 insertions(+), 9 deletions(-)
  target/arm/neon_helper.c        |  7 -------
  target/arm/translate-neon.inc.c | 28 ++++++++++++++++++++++++++++
  target/arm/translate.c          | 10 +++-------
  target/arm/vec_helper.c         |  7 +++++++
 files changed, 48 insertions(+), 15 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/misc/imx7_ccm.c b/hw/misc/imx7_ccm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/misc/imx7_ccm.c
-+++ b/target/arm/helper.h
++++ b/hw/misc/imx7_ccm.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(neon_qneg_s16, TCG_CALL_NO_RWG, i32, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_2(neon_qneg_s32, TCG_CALL_NO_RWG, i32, env, i32)
+ #include "hw/misc/imx7_ccm.h"
- DEF_HELPER_FLAGS_2(neon_qneg_s64, TCG_CALL_NO_RWG, i64, env, i64)
+ #include "migration/vmstate.h"
--DEF_HELPER_3(neon_abd_f32, i32, i32, i32, ptr)
++#include "trace.h"
  DEF_HELPER_3(neon_ceq_f32, i32, i32, i32, ptr)
  DEF_HELPER_3(neon_cge_f32, i32, i32, i32, ptr)
  DEF_HELPER_3(neon_cgt_f32, i32, i32, i32, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 +
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
++#define CKIH_FREQ 24000000 /* 24MHz crystal input */
                     void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
 diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/neon-dp.decode
 +++ b/target/arm/neon-dp.decode
@@ -XXX,XX +XXX,XX @@
  @3same_q0        .... ... . . . size:2 .... .... .... . 0 . . .... \
                   &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
 +# For FP insns the high bit of 'size' is used as part of opcode decode
 +@3same_fp        .... ... . . . . size:1 .... .... .... . q:1 . . .... \
 +                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+ static void imx7_analog_reset(DeviceState *dev)
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
+ {
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
+     IMX7AnalogState *s = IMX7_ANALOG(dev);
-@@ -XXX,XX +XXX,XX @@ SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_imx7_ccm = {
-                  vm=%vm_dp vn=%vn_dp vd=%vd_dp
+ static uint32_t imx7_ccm_get_clock_frequency(IMXCCMState *dev, IMXClk clock)
+ {
- VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
+     /*
 -     * This function is "consumed" by GPT emulation code, however on
 -     * i.MX7 each GPT block can have their own clock root. This means
 -     * that this functions needs somehow to know requester's identity
 -     * and the way to pass it: be it via additional IMXClk constants
 -     * or by adding another argument to this method needs to be
 -     * figured out
 +     * This function is "consumed" by GPT emulation code. Some clocks
 +     * have fixed frequencies and we can provide requested frequency
 +     * easily. However for CCM provided clocks (like IPG) each GPT
 +     * timer can have its own clock root.
 +     * This means we need additionnal information when calling this
 +     * function to know the requester's identity.
       */
 -    qemu_log_mask(LOG_GUEST_ERROR, "[%s]%s: Not implemented\n",
 -                  TYPE_IMX7_CCM, __func__);
 -    return 0;
 +    uint32_t freq = 0;
 +
-+VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
++    switch (clock) {
-+VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
++    case CLK_NONE:
-+VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
++        break;
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
++    case CLK_32k:
-index XXXXXXX..XXXXXXX 100644
++        freq = CKIL_FREQ;
---- a/target/arm/neon_helper.c
++        break;
-+++ b/target/arm/neon_helper.c
++    case CLK_HIGH:
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_qneg_s64)(CPUARMState *env, uint64_t x)
++        freq = CKIH_FREQ;
- }
++        break;
++    case CLK_IPG:
- /* NEON Float helpers.  */
++    case CLK_IPG_HIGH:
--uint32_t HELPER(neon_abd_f32)(uint32_t a, uint32_t b, void *fpstp)
++        /*
--{
++         * For now we don't have a way to figure out the device this
--    float_status *fpst = fpstp;
++         * function is called for. Until then the IPG derived clocks
--    float32 f0 = make_float32(a);
++         * are left unimplemented.
--    float32 f1 = make_float32(b);
++         */
--    return float32_val(float32_abs(float32_sub(f0, f1, fpst)));
++        qemu_log_mask(LOG_GUEST_ERROR, "[%s]%s: Clock %d Not implemented\n",
--}
++                      TYPE_IMX7_CCM, __func__, clock);
++        break;
- /* Floating point comparisons produce an integer result.
++    default:
-  * Note that EQ doesn't signal InvalidOp for QNaNs but GE and GT do.
++        qemu_log_mask(LOG_GUEST_ERROR, "[%s]%s: unsupported clock %d\n",
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++                      TYPE_IMX7_CCM, __func__, clock);
-index XXXXXXX..XXXXXXX 100644
++        break;
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
  DO_3SAME_VQDMULH(VQDMULH, qdmulh)
  DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
 +
 +/*
 + * For all the functions using this macro, size == 1 means fp16,
 + * which is an architecture extension we don't implement yet.
 + */
 +#define DO_3S_FP_GVEC(INSN,FUNC)                                        \
 +    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        TCGv_ptr fpst = get_fpstatus_ptr(1);                            \
 +        tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpst,                \
 +                           oprsz, maxsz, 0, FUNC);                      \
 +        tcg_temp_free_ptr(fpst);                                        \
 +    }                                                                   \
 +    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a)     \
 +    {                                                                   \
 +        if (a->size != 0) {                                             \
 +            /* TODO fp16 support */                                     \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
++    trace_ccm_clock_freq(clock, freq);
 +
-+DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
++    return freq;
 +DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
 +DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          switch (op) {
          case NEON_3R_FLOAT_ARITH:
              pairwise = (u && size < 2); /* if VPADD (float) */
 +            if (!pairwise) {
 +                return 1; /* handled by decodetree */
 +            }
              break;
          case NEON_3R_FLOAT_MINMAX:
              pairwise = u; /* if VPMIN/VPMAX (float) */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
              switch ((u << 2) | size) {
 -            case 0: /* VADD */
              case 4: /* VPADD */
                  gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
                  break;
 -            case 2: /* VSUB */
 -                gen_helper_vfp_subs(tmp, tmp, tmp2, fpstatus);
 -                break;
 -            case 6: /* VABD */
 -                gen_helper_neon_abd_f32(tmp, tmp, tmp2, fpstatus);
 -                break;
              default:
                  abort();
              }
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static float64 float64_ftsmul(float64 op1, uint64_t op2, float_status *stat)
      return result;
  }
-+static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
+ static void imx7_ccm_class_init(ObjectClass *klass, void *data)
 +{
 +    return float32_abs(float32_sub(op1, op2, stat));
 +}
 +
  #define DO_3OP(NAME, FUNC, TYPE) \
  void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
  {                                                                          \
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_h, float16_ftsmul, float16)
  DO_3OP(gvec_ftsmul_s, float32_ftsmul, float32)
  DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
 +DO_3OP(gvec_fabd_s, float32_abd, float32)
 +
  #ifdef TARGET_AARCH64
  DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
 --
-.20.1
+.25.1

-[PULL 18/45] aspeed: Add support for the sonorapass-bmc board
+[PULL 32/34] i.MX6UL: Add a specific GPT timer instance for the i.MX6UL
-From: Patrick Williams <patrick@stwcx.xyz>
+From: Jean-Christophe Dubois <jcd@tribudubois.net>
-Sonora Pass is a 2 socket x86 motherboard designed by Facebook
+The i.MX6UL doesn't support CLK_HIGH ou CLK_HIGH_DIV clock source.
 and supported by OpenBMC.  Strapping configuration was obtained
 from hardware and i2c configuration is based on dts found at:
-https://github.com/facebook/openbmc-linux/blob/1633c87b8ba7c162095787c988979b748ba65dc8/arch/arm/boot/dts/aspeed-bmc-facebook-sonorapass.dts
+Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Booted a test image of http://github.com/facebook/openbmc to login
 prompt.
 Signed-off-by: Patrick Williams <patrick@stwcx.xyz>
 Reviewed-by: Amithash Prasad <amithash@fb.com>
 Reviewed-by: Cédric Le Goater <clg@kaod.org>
 [PMM: fixed block comment style nit]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/aspeed.c | 78 +++++++++++++++++++++++++++++++++++++++++++++++++
+ include/hw/timer/imx_gpt.h |  1 +
-file changed, 78 insertions(+)
+ hw/arm/fsl-imx6ul.c        |  2 +-
  hw/misc/imx6ul_ccm.c       |  6 ------
  hw/timer/imx_gpt.c         | 25 +++++++++++++++++++++++++
 files changed, 27 insertions(+), 7 deletions(-)
-diff --git a/hw/arm/aspeed.c b/hw/arm/aspeed.c
+diff --git a/include/hw/timer/imx_gpt.h b/include/hw/timer/imx_gpt.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/aspeed.c
+--- a/include/hw/timer/imx_gpt.h
-+++ b/hw/arm/aspeed.c
++++ b/include/hw/timer/imx_gpt.h
-@@ -XXX,XX +XXX,XX @@ struct AspeedBoardState {
+@@ -XXX,XX +XXX,XX @@
-         SCU_AST2500_HW_STRAP_ACPI_ENABLE |                              \
+ #define TYPE_IMX25_GPT "imx25.gpt"
-         SCU_HW_STRAP_SPI_MODE(SCU_HW_STRAP_SPI_MASTER))
+ #define TYPE_IMX31_GPT "imx31.gpt"
+ #define TYPE_IMX6_GPT "imx6.gpt"
-+/* Sonorapass hardware value: 0xF100D216 */
++#define TYPE_IMX6UL_GPT "imx6ul.gpt"
-+#define SONORAPASS_BMC_HW_STRAP1 (                                      \
+ #define TYPE_IMX7_GPT "imx7.gpt"
-+        SCU_AST2500_HW_STRAP_SPI_AUTOFETCH_ENABLE |                     \
-+        SCU_AST2500_HW_STRAP_GPIO_STRAP_ENABLE |                        \
+ #define TYPE_IMX_GPT TYPE_IMX25_GPT
-+        SCU_AST2500_HW_STRAP_UART_DEBUG |                               \
+diff --git a/hw/arm/fsl-imx6ul.c b/hw/arm/fsl-imx6ul.c
-+        SCU_AST2500_HW_STRAP_RESERVED28 |                               \
+index XXXXXXX..XXXXXXX 100644
-+        SCU_AST2500_HW_STRAP_DDR4_ENABLE |                              \
+--- a/hw/arm/fsl-imx6ul.c
-+        SCU_HW_STRAP_VGA_CLASS_CODE |                                   \
++++ b/hw/arm/fsl-imx6ul.c
-+        SCU_HW_STRAP_LPC_RESET_PIN |                                    \
+@@ -XXX,XX +XXX,XX @@ static void fsl_imx6ul_init(Object *obj)
-+        SCU_HW_STRAP_SPI_MODE(SCU_HW_STRAP_SPI_MASTER) |                \
+      */
-+        SCU_AST2500_HW_STRAP_SET_AXI_AHB_RATIO(AXI_AHB_RATIO_2_1) |     \
+     for (i = 0; i < FSL_IMX6UL_NUM_GPTS; i++) {
-+        SCU_HW_STRAP_VGA_BIOS_ROM |                                     \
+         snprintf(name, NAME_SIZE, "gpt%d", i);
-+        SCU_HW_STRAP_VGA_SIZE_SET(VGA_16M_DRAM) |                       \
+-        object_initialize_child(obj, name, &s->gpt[i], TYPE_IMX7_GPT);
-+        SCU_AST2500_HW_STRAP_RESERVED1)
++        object_initialize_child(obj, name, &s->gpt[i], TYPE_IMX6UL_GPT);
      }
      /*
 diff --git a/hw/misc/imx6ul_ccm.c b/hw/misc/imx6ul_ccm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/imx6ul_ccm.c
 +++ b/hw/misc/imx6ul_ccm.c
@@ -XXX,XX +XXX,XX @@ static uint32_t imx6ul_ccm_get_clock_frequency(IMXCCMState *dev, IMXClk clock)
      case CLK_32k:
          freq = CKIL_FREQ;
          break;
 -    case CLK_HIGH:
 -        freq = CKIH_FREQ;
 -        break;
 -    case CLK_HIGH_DIV:
 -        freq = CKIH_FREQ / 8;
 -        break;
      default:
          qemu_log_mask(LOG_GUEST_ERROR, "[%s]%s: unsupported clock %d\n",
                        TYPE_IMX6UL_CCM, __func__, clock);
 diff --git a/hw/timer/imx_gpt.c b/hw/timer/imx_gpt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/timer/imx_gpt.c
 +++ b/hw/timer/imx_gpt.c
@@ -XXX,XX +XXX,XX @@ static const IMXClk imx6_gpt_clocks[] = {
      CLK_HIGH,      /* 111 reference clock */
  };
 +static const IMXClk imx6ul_gpt_clocks[] = {
 +    CLK_NONE,      /* 000 No clock source */
 +    CLK_IPG,       /* 001 ipg_clk, 532MHz*/
 +    CLK_IPG_HIGH,  /* 010 ipg_clk_highfreq */
 +    CLK_EXT,       /* 011 External clock */
 +    CLK_32k,       /* 100 ipg_clk_32k */
 +    CLK_NONE,      /* 101 not defined */
 +    CLK_NONE,      /* 110 not defined */
 +    CLK_NONE,      /* 111 not defined */
 +};
 +
- /* Swift hardware value: 0xF11AD206 */
+ static const IMXClk imx7_gpt_clocks[] = {
- #define SWIFT_BMC_HW_STRAP1 (                                           \
+     CLK_NONE,      /* 000 No clock source */
-         AST2500_HW_STRAP1_DEFAULTS |                                    \
+     CLK_IPG,       /* 001 ipg_clk, 532MHz*/
-@@ -XXX,XX +XXX,XX @@ static void swift_bmc_i2c_init(AspeedBoardState *bmc)
+@@ -XXX,XX +XXX,XX @@ static void imx6_gpt_init(Object *obj)
-     i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 12), "tmp105", 0x4a);
+     s->clocks = imx6_gpt_clocks;
  }
-+static void sonorapass_bmc_i2c_init(AspeedBoardState *bmc)
++static void imx6ul_gpt_init(Object *obj)
 +{
-+    AspeedSoCState *soc = &bmc->soc;
++    IMXGPTState *s = IMX_GPT(obj);
 +
-+    /* bus 2 : */
++    s->clocks = imx6ul_gpt_clocks;
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 2), "tmp105", 0x48);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 2), "tmp105", 0x49);
 +    /* bus 2 : pca9546 @ 0x73 */
 +
 +    /* bus 3 : pca9548 @ 0x70 */
 +
 +    /* bus 4 : */
 +    uint8_t *eeprom4_54 = g_malloc0(8 * 1024);
 +    smbus_eeprom_init_one(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), 0x54,
 +                          eeprom4_54);
 +    /* PCA9539 @ 0x76, but PCA9552 is compatible */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), "pca9552", 0x76);
 +    /* PCA9539 @ 0x77, but PCA9552 is compatible */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), "pca9552", 0x77);
 +
 +    /* bus 6 : */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 6), "tmp105", 0x48);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 6), "tmp105", 0x49);
 +    /* bus 6 : pca9546 @ 0x73 */
 +
 +    /* bus 8 : */
 +    uint8_t *eeprom8_56 = g_malloc0(8 * 1024);
 +    smbus_eeprom_init_one(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), 0x56,
 +                          eeprom8_56);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), "pca9552", 0x60);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), "pca9552", 0x61);
 +    /* bus 8 : adc128d818 @ 0x1d */
 +    /* bus 8 : adc128d818 @ 0x1f */
 +
 +    /*
 +     * bus 13 : pca9548 @ 0x71
 +     *      - channel 3:
 +     *          - tmm421 @ 0x4c
 +     *          - tmp421 @ 0x4e
 +     *          - tmp421 @ 0x4f
 +     */
 +
 +}
 +
- static void witherspoon_bmc_i2c_init(AspeedBoardState *bmc)
+ static void imx7_gpt_init(Object *obj)
  {
-     AspeedSoCState *soc = &bmc->soc;
+     IMXGPTState *s = IMX_GPT(obj);
-@@ -XXX,XX +XXX,XX @@ static void aspeed_machine_romulus_class_init(ObjectClass *oc, void *data)
+@@ -XXX,XX +XXX,XX @@ static const TypeInfo imx6_gpt_info = {
-     mc->default_ram_size       = 512 * MiB;
+     .instance_init = imx6_gpt_init,
  };
-+static void aspeed_machine_sonorapass_class_init(ObjectClass *oc, void *data)
++static const TypeInfo imx6ul_gpt_info = {
-+{
++    .name = TYPE_IMX6UL_GPT,
-+    MachineClass *mc = MACHINE_CLASS(oc);
++    .parent = TYPE_IMX25_GPT,
-+    AspeedMachineClass *amc = ASPEED_MACHINE_CLASS(oc);
++    .instance_init = imx6ul_gpt_init,
 +
 +    mc->desc       = "OCP SonoraPass BMC (ARM1176)";
 +    amc->soc_name  = "ast2500-a1";
 +    amc->hw_strap1 = SONORAPASS_BMC_HW_STRAP1;
 +    amc->fmc_model = "mx66l1g45g";
 +    amc->spi_model = "mx66l1g45g";
 +    amc->num_cs    = 2;
 +    amc->i2c_init  = sonorapass_bmc_i2c_init;
 +    mc->default_ram_size       = 512 * MiB;
 +};
 +
- static void aspeed_machine_swift_class_init(ObjectClass *oc, void *data)
+ static const TypeInfo imx7_gpt_info = {
- {
+     .name = TYPE_IMX7_GPT,
-     MachineClass *mc = MACHINE_CLASS(oc);
+     .parent = TYPE_IMX25_GPT,
-@@ -XXX,XX +XXX,XX @@ static const TypeInfo aspeed_machine_types[] = {
+@@ -XXX,XX +XXX,XX @@ static void imx_gpt_register_types(void)
-         .name          = MACHINE_TYPE_NAME("swift-bmc"),
+     type_register_static(&imx25_gpt_info);
-         .parent        = TYPE_ASPEED_MACHINE,
+     type_register_static(&imx31_gpt_info);
-         .class_init    = aspeed_machine_swift_class_init,
+     type_register_static(&imx6_gpt_info);
-+    }, {
++    type_register_static(&imx6ul_gpt_info);
-+        .name          = MACHINE_TYPE_NAME("sonorapass-bmc"),
+     type_register_static(&imx7_gpt_info);
-+        .parent        = TYPE_ASPEED_MACHINE,
+ }
-+        .class_init    = aspeed_machine_sonorapass_class_init,
      }, {
          .name          = MACHINE_TYPE_NAME("witherspoon-bmc"),
          .parent        = TYPE_ASPEED_MACHINE,
 --
-.20.1
+.25.1

-[PULL 06/45] target/arm: Tidy handle_vec_simd_shri
+[PULL 33/34] i.MX7D: Connect IRQs to GPIO devices.
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Christophe Dubois <jcd@tribudubois.net>
-Now that we've converted all cases to gvec, there is quite a bit
+IRQs were not associated to the various GPIO devices inside i.MX7D.
-of dead code at the end of the function.  Remove it.
+This patch brings the i.MX7D on par with i.MX6.
-Sink the call to gen_gvec_fn2i to the end, loading a function
+Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
-pointer within the switch statement.
+Message-id: 20221226101418.415170-1-jcd@tribudubois.net
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-6-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 56 ++++++++++----------------------------
+ include/hw/arm/fsl-imx7.h | 15 +++++++++++++++
-file changed, 14 insertions(+), 42 deletions(-)
+ hw/arm/fsl-imx7.c         | 31 ++++++++++++++++++++++++++++++-
 files changed, 45 insertions(+), 1 deletion(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/include/hw/arm/fsl-imx7.h b/include/hw/arm/fsl-imx7.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/include/hw/arm/fsl-imx7.h
-+++ b/target/arm/translate-a64.c
++++ b/include/hw/arm/fsl-imx7.h
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
+@@ -XXX,XX +XXX,XX @@ enum FslIMX7IRQs {
-     int size = 32 - clz32(immh) - 1;
+     FSL_IMX7_GPT3_IRQ     = 53,
-     int immhb = immh << 3 | immb;
+     FSL_IMX7_GPT4_IRQ     = 52,
-     int shift = 2 * (8 << size) - immhb;
--    bool accumulate = false;
++    FSL_IMX7_GPIO1_LOW_IRQ  = 64,
--    int dsize = is_q ? 128 : 64;
++    FSL_IMX7_GPIO1_HIGH_IRQ = 65,
--    int esize = 8 << size;
++    FSL_IMX7_GPIO2_LOW_IRQ  = 66,
--    int elements = dsize/esize;
++    FSL_IMX7_GPIO2_HIGH_IRQ = 67,
--    MemOp memop = size | (is_u ? 0 : MO_SIGN);
++    FSL_IMX7_GPIO3_LOW_IRQ  = 68,
--    TCGv_i64 tcg_rn = new_tmp_a64(s);
++    FSL_IMX7_GPIO3_HIGH_IRQ = 69,
--    TCGv_i64 tcg_rd = new_tmp_a64(s);
++    FSL_IMX7_GPIO4_LOW_IRQ  = 70,
--    TCGv_i64 tcg_round;
++    FSL_IMX7_GPIO4_HIGH_IRQ = 71,
--    uint64_t round_const;
++    FSL_IMX7_GPIO5_LOW_IRQ  = 72,
--    int i;
++    FSL_IMX7_GPIO5_HIGH_IRQ = 73,
-+    GVecGen2iFn *gvec_fn;
++    FSL_IMX7_GPIO6_LOW_IRQ  = 74,
++    FSL_IMX7_GPIO6_HIGH_IRQ = 75,
-     if (extract32(immh, 3, 1) && !is_q) {
++    FSL_IMX7_GPIO7_LOW_IRQ  = 76,
-         unallocated_encoding(s);
++    FSL_IMX7_GPIO7_HIGH_IRQ = 77,
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
++
+     FSL_IMX7_WDOG1_IRQ    = 78,
-     switch (opcode) {
+     FSL_IMX7_WDOG2_IRQ    = 79,
-     case 0x02: /* SSRA / USRA (accumulate) */
+     FSL_IMX7_WDOG3_IRQ    = 10,
--        gen_gvec_fn2i(s, is_q, rd, rn, shift,
+diff --git a/hw/arm/fsl-imx7.c b/hw/arm/fsl-imx7.c
--                      is_u ? gen_gvec_usra : gen_gvec_ssra, size);
+index XXXXXXX..XXXXXXX 100644
--        return;
+--- a/hw/arm/fsl-imx7.c
-+        gvec_fn = is_u ? gen_gvec_usra : gen_gvec_ssra;
++++ b/hw/arm/fsl-imx7.c
-+        break;
+@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
+             FSL_IMX7_GPIO7_ADDR,
-     case 0x08: /* SRI */
+         };
--        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sri, size);
--        return;
++        static const int FSL_IMX7_GPIOn_LOW_IRQ[FSL_IMX7_NUM_GPIOS] = {
-+        gvec_fn = gen_gvec_sri;
++            FSL_IMX7_GPIO1_LOW_IRQ,
-+        break;
++            FSL_IMX7_GPIO2_LOW_IRQ,
++            FSL_IMX7_GPIO3_LOW_IRQ,
-     case 0x00: /* SSHR / USHR */
++            FSL_IMX7_GPIO4_LOW_IRQ,
-         if (is_u) {
++            FSL_IMX7_GPIO5_LOW_IRQ,
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
++            FSL_IMX7_GPIO6_LOW_IRQ,
-                 /* Shift count the same size as element size produces zero.  */
++            FSL_IMX7_GPIO7_LOW_IRQ,
-                 tcg_gen_gvec_dup_imm(size, vec_full_reg_offset(s, rd),
++        };
-                                      is_q ? 16 : 8, vec_full_reg_size(s), 0);
++
--            } else {
++        static const int FSL_IMX7_GPIOn_HIGH_IRQ[FSL_IMX7_NUM_GPIOS] = {
--                gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_shri, size);
++            FSL_IMX7_GPIO1_HIGH_IRQ,
-+                return;
++            FSL_IMX7_GPIO2_HIGH_IRQ,
-             }
++            FSL_IMX7_GPIO3_HIGH_IRQ,
-+            gvec_fn = tcg_gen_gvec_shri;
++            FSL_IMX7_GPIO4_HIGH_IRQ,
-         } else {
++            FSL_IMX7_GPIO5_HIGH_IRQ,
-             /* Shift count the same size as element size produces all sign.  */
++            FSL_IMX7_GPIO6_HIGH_IRQ,
-             if (shift == 8 << size) {
++            FSL_IMX7_GPIO7_HIGH_IRQ,
-                 shift -= 1;
++        };
-             }
++
--            gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_sari, size);
+         sysbus_realize(SYS_BUS_DEVICE(&s->gpio[i]), &error_abort);
-+            gvec_fn = tcg_gen_gvec_sari;
+-        sysbus_mmio_map(SYS_BUS_DEVICE(&s->gpio[i]), 0, FSL_IMX7_GPIOn_ADDR[i]);
-         }
++        sysbus_mmio_map(SYS_BUS_DEVICE(&s->gpio[i]), 0,
--        return;
++                        FSL_IMX7_GPIOn_ADDR[i]);
-+        break;
++
++        sysbus_connect_irq(SYS_BUS_DEVICE(&s->gpio[i]), 0,
-     case 0x04: /* SRSHR / URSHR (rounding) */
++                           qdev_get_gpio_in(DEVICE(&s->a7mpcore),
--        gen_gvec_fn2i(s, is_q, rd, rn, shift,
++                                            FSL_IMX7_GPIOn_LOW_IRQ[i]));
--                      is_u ? gen_gvec_urshr : gen_gvec_srshr, size);
++
--        return;
++        sysbus_connect_irq(SYS_BUS_DEVICE(&s->gpio[i]), 1,
-+        gvec_fn = is_u ? gen_gvec_urshr : gen_gvec_srshr;
++                           qdev_get_gpio_in(DEVICE(&s->a7mpcore),
-+        break;
++                                            FSL_IMX7_GPIOn_HIGH_IRQ[i]));
      case 0x06: /* SRSRA / URSRA (accum + rounding) */
 -        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 -                      is_u ? gen_gvec_ursra : gen_gvec_srsra, size);
 -        return;
 +        gvec_fn = is_u ? gen_gvec_ursra : gen_gvec_srsra;
 +        break;
      default:
          g_assert_not_reached();
      }
--    round_const = 1ULL << (shift - 1);
+     /*
 -    tcg_round = tcg_const_i64(round_const);
 -
 -    for (i = 0; i < elements; i++) {
 -        read_vec_element(s, tcg_rn, rn, i, memop);
 -        if (accumulate) {
 -            read_vec_element(s, tcg_rd, rd, i, memop);
 -        }
 -
 -        handle_shri_with_rndacc(tcg_rd, tcg_rn, tcg_round,
 -                                accumulate, is_u, size, shift);
 -
 -        write_vec_element(s, tcg_rd, rd, i, size);
 -    }
 -    tcg_temp_free_i64(tcg_round);
 -
 -    clear_vec_high(s, is_q, rd);
 +    gen_gvec_fn2i(s, is_q, rd, rn, shift, gvec_fn, size);
  }
  /* SHL/SLI - Vector shift left */
 --
-.20.1
+.25.1

-[PULL 04/45] target/arm: Create gen_gvec_{sri,sli}
+[PULL 34/34] hw/net: Fix read of uninitialized memory in imx_fec.
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Stephen Longfield <slongfield@google.com>
-The functions eliminate duplication of the special cases for
+Size is used at lines 1088/1188 for the loop, which reads the last 4
-this operation.  They match up with the GVecGen2iFn typedef.
+bytes from the crc_ptr so it does need to get increased, however it
 shouldn't be increased before the buffer is passed to CRC computation,
 or the crc32 function will access uninitialized memory.
-Add out-of-line helpers.  We got away with only having inline
+This was pointed out to me by clg@kaod.org during the code review of
-expanders because the neon vector size is only 16 bytes, and
+a similar patch to hw/net/ftgmac100.c
 we know that the inline expansion will always succeed.
 When we reuse this for SVE, tcg-gvec-op may decide to use an
 out-of-line helper due to longer vector lengths.
+Change-Id: Ib0464303b191af1e28abeb2f5105eb25aadb5e9b
+Signed-off-by: Stephen Longfield <slongfield@google.com>
+Reviewed-by: Patrick Venture <venture@google.com>
+Message-id: 20221221183202.3788132-1-slongfield@google.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  10 ++
+ hw/net/imx_fec.c | 8 ++++----
- target/arm/translate.h     |   7 +-
+file changed, 4 insertions(+), 4 deletions(-)
  target/arm/translate-a64.c |  20 +---
  target/arm/translate.c     | 186 +++++++++++++++++++++----------------
  target/arm/vec_helper.c    |  38 ++++++++
 files changed, 160 insertions(+), 101 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/net/imx_fec.c b/hw/net/imx_fec.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/net/imx_fec.c
-+++ b/target/arm/helper.h
++++ b/hw/net/imx_fec.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_ursra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static ssize_t imx_fec_receive(NetClientState *nc, const uint8_t *buf,
- DEF_HELPER_FLAGS_3(gvec_ursra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+         return 0;
  DEF_HELPER_FLAGS_3(gvec_ursra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sri_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sri_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sri_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sri_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_3(gvec_sli_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sli_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sli_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sli_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.h
 +++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ extern const GVecGen3 mls_op[4];
  extern const GVecGen3 cmtst_op[4];
  extern const GVecGen3 sshl_op[4];
  extern const GVecGen3 ushl_op[4];
 -extern const GVecGen2i sri_op[4];
 -extern const GVecGen2i sli_op[4];
  extern const GVecGen4 uqadd_op[4];
  extern const GVecGen4 sqadd_op[4];
  extern const GVecGen4 uqsub_op[4];
@@ -XXX,XX +XXX,XX @@ void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
  void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
                      int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op2(DisasContext *s, bool is_q, int rd,
                     is_q ? 16 : 8, vec_full_reg_size(s), gvec_op);
  }
 -/* Expand a 2-operand + immediate AdvSIMD vector operation using
 - * an op descriptor.
 - */
 -static void gen_gvec_op2i(DisasContext *s, bool is_q, int rd,
 -                          int rn, int64_t imm, const GVecGen2i *gvec_op)
 -{
 -    tcg_gen_gvec_2i(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
 -                    is_q ? 16 : 8, vec_full_reg_size(s), imm, gvec_op);
 -}
 -
  /* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
  static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
                           int rn, int rm, const GVecGen3 *gvec_op)
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
          gen_gvec_fn2i(s, is_q, rd, rn, shift,
                        is_u ? gen_gvec_usra : gen_gvec_ssra, size);
          return;
 +
      case 0x08: /* SRI */
 -        /* Shift count same as element size is valid but does nothing.  */
 -        if (shift == 8 << size) {
 -            goto done;
 -        }
 -        gen_gvec_op2i(s, is_q, rd, rn, shift, &sri_op[size]);
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sri, size);
          return;
      case 0x00: /* SSHR / USHR */
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
      }
-     tcg_temp_free_i64(tcg_round);
+-    /* 4 bytes for the CRC.  */
-- done:
+-    size += 4;
-     clear_vec_high(s, is_q, rd);
+     crc = cpu_to_be32(crc32(~0, buf, size));
- }
++    /* Increase size by 4, loop below reads the last 4 bytes from crc_ptr. */
++    size += 4;
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shli(DisasContext *s, bool is_q, bool insert,
+     crc_ptr = (uint8_t *) &crc;
      /* Huge frames are truncated.  */
@@ -XXX,XX +XXX,XX @@ static ssize_t imx_enet_receive(NetClientState *nc, const uint8_t *buf,
          return 0;
      }
-     if (insert) {
+-    /* 4 bytes for the CRC.  */
--        gen_gvec_op2i(s, is_q, rd, rn, shift, &sli_op[size]);
+-    size += 4;
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sli, size);
+     crc = cpu_to_be32(crc32(~0, buf, size));
-     } else {
++    /* Increase size by 4, loop below reads the last 4 bytes from crc_ptr. */
-         gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_shli, size);
++    size += 4;
-     }
+     crc_ptr = (uint8_t *) &crc;
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
+     if (shift16) {
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_shr64_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  static void gen_shr_ins_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
  {
 -    if (sh == 0) {
 -        tcg_gen_mov_vec(d, a);
 -    } else {
 -        TCGv_vec t = tcg_temp_new_vec_matching(d);
 -        TCGv_vec m = tcg_temp_new_vec_matching(d);
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec m = tcg_temp_new_vec_matching(d);
 -        tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK((8 << vece) - sh, sh));
 -        tcg_gen_shri_vec(vece, t, a, sh);
 -        tcg_gen_and_vec(vece, d, d, m);
 -        tcg_gen_or_vec(vece, d, d, t);
 +    tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK((8 << vece) - sh, sh));
 +    tcg_gen_shri_vec(vece, t, a, sh);
 +    tcg_gen_and_vec(vece, d, d, m);
 +    tcg_gen_or_vec(vece, d, d, t);
 -        tcg_temp_free_vec(t);
 -        tcg_temp_free_vec(m);
 -    }
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(m);
  }
 -static const TCGOpcode vecop_list_sri[] = { INDEX_op_shri_vec, 0 };
 +void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = { INDEX_op_shri_vec, 0 };
 +    const GVecGen2i ops[4] = {
 +        { .fni8 = gen_shr8_ins_i64,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_b,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_shr16_ins_i64,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_h,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_shr32_ins_i32,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_s,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_shr64_ins_i64,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 -const GVecGen2i sri_op[4] = {
 -    { .fni8 = gen_shr8_ins_i64,
 -      .fniv = gen_shr_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_8 },
 -    { .fni8 = gen_shr16_ins_i64,
 -      .fniv = gen_shr_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_16 },
 -    { .fni4 = gen_shr32_ins_i32,
 -      .fniv = gen_shr_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_32 },
 -    { .fni8 = gen_shr64_ins_i64,
 -      .fniv = gen_shr_ins_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_64 },
 -};
 +    /* tszimm encoding produces immediates in the range [1..esize]. */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    /* Shift of esize leaves destination unchanged. */
 +    if (shift < (8 << vece)) {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    } else {
 +        /* Nop, but we do need to clear the tail. */
 +        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
 +    }
 +}
  static void gen_shl8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
@@ -XXX,XX +XXX,XX @@ static void gen_shl64_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  static void gen_shl_ins_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
  {
 -    if (sh == 0) {
 -        tcg_gen_mov_vec(d, a);
 -    } else {
 -        TCGv_vec t = tcg_temp_new_vec_matching(d);
 -        TCGv_vec m = tcg_temp_new_vec_matching(d);
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec m = tcg_temp_new_vec_matching(d);
 -        tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK(0, sh));
 -        tcg_gen_shli_vec(vece, t, a, sh);
 -        tcg_gen_and_vec(vece, d, d, m);
 -        tcg_gen_or_vec(vece, d, d, t);
 +    tcg_gen_shli_vec(vece, t, a, sh);
 +    tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK(0, sh));
 +    tcg_gen_and_vec(vece, d, d, m);
 +    tcg_gen_or_vec(vece, d, d, t);
 -        tcg_temp_free_vec(t);
 -        tcg_temp_free_vec(m);
 -    }
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(m);
  }
 -static const TCGOpcode vecop_list_sli[] = { INDEX_op_shli_vec, 0 };
 +void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = { INDEX_op_shli_vec, 0 };
 +    const GVecGen2i ops[4] = {
 +        { .fni8 = gen_shl8_ins_i64,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_b,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_shl16_ins_i64,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_h,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_shl32_ins_i32,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_s,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_shl64_ins_i64,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 -const GVecGen2i sli_op[4] = {
 -    { .fni8 = gen_shl8_ins_i64,
 -      .fniv = gen_shl_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_8 },
 -    { .fni8 = gen_shl16_ins_i64,
 -      .fniv = gen_shl_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_16 },
 -    { .fni4 = gen_shl32_ins_i32,
 -      .fniv = gen_shl_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_32 },
 -    { .fni8 = gen_shl64_ins_i64,
 -      .fniv = gen_shl_ins_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_64 },
 -};
 +    /* tszimm encoding produces immediates in the range [0..esize-1]. */
 +    tcg_debug_assert(shift >= 0);
 +    tcg_debug_assert(shift < (8 << vece));
 +
 +    if (shift == 0) {
 +        tcg_gen_gvec_mov(vece, rd_ofs, rm_ofs, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
  static void gen_mla8_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
  {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                      }
                      /* Right shift comes here negative.  */
                      shift = -shift;
 -                    /* Shift out of range leaves destination unchanged.  */
 -                    if (shift < 8 << size) {
 -                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
 -                                        shift, &sri_op[size]);
 -                    }
 +                    gen_gvec_sri(size, rd_ofs, rm_ofs, shift,
 +                                 vec_size, vec_size);
                      return 0;
                  case 5: /* VSHL, VSLI */
                      if (u) { /* VSLI */
 -                        /* Shift out of range leaves destination unchanged.  */
 -                        if (shift < 8 << size) {
 -                            tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size,
 -                                            vec_size, shift, &sli_op[size]);
 -                        }
 +                        gen_gvec_sli(size, rd_ofs, rm_ofs, shift,
 +                                     vec_size, vec_size);
                      } else { /* VSHL */
                          /* Shifts larger than the element size are
                           * architecturally valid and results in zero.
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_RSRA(gvec_ursra_d, uint64_t)
  #undef DO_RSRA
 +#define DO_SRI(NAME, TYPE)                              \
 +void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
 +{                                                       \
 +    intptr_t i, oprsz = simd_oprsz(desc);               \
 +    int shift = simd_data(desc);                        \
 +    TYPE *d = vd, *n = vn;                              \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
 +        d[i] = deposit64(d[i], 0, sizeof(TYPE) * 8 - shift, n[i] >> shift); \
 +    }                                                   \
 +    clear_tail(d, oprsz, simd_maxsz(desc));             \
 +}
 +
 +DO_SRI(gvec_sri_b, uint8_t)
 +DO_SRI(gvec_sri_h, uint16_t)
 +DO_SRI(gvec_sri_s, uint32_t)
 +DO_SRI(gvec_sri_d, uint64_t)
 +
 +#undef DO_SRI
 +
 +#define DO_SLI(NAME, TYPE)                              \
 +void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
 +{                                                       \
 +    intptr_t i, oprsz = simd_oprsz(desc);               \
 +    int shift = simd_data(desc);                        \
 +    TYPE *d = vd, *n = vn;                              \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
 +        d[i] = deposit64(d[i], shift, sizeof(TYPE) * 8 - shift, n[i]); \
 +    }                                                   \
 +    clear_tail(d, oprsz, simd_maxsz(desc));             \
 +}
 +
 +DO_SLI(gvec_sli_b, uint8_t)
 +DO_SLI(gvec_sli_h, uint16_t)
 +DO_SLI(gvec_sli_s, uint32_t)
 +DO_SLI(gvec_sli_d, uint64_t)
 +
 +#undef DO_SLI
 +
  /*
   * Convert float16 to float32, raising no exceptions and
   * preserving exceptional values, including SNaN.
 --
-.20.1
+.25.1

-[PULL 11/45] target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-11-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |  13 +-
- target/arm/translate-a64.c      |  22 ++-
- target/arm/translate-neon.inc.c |  19 +--
- target/arm/translate.c          | 228 +++++++++++++++++---------------
-files changed, 147 insertions(+), 135 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen4 uqadd_op[4];
--extern const GVecGen4 sqadd_op[4];
--extern const GVecGen4 uqsub_op[4];
--extern const GVecGen4 sqsub_op[4];
- void gen_cmtst_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_ushl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_gvec_uqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_uqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
- void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-     switch (opcode) {
-     case 0x01: /* SQADD, UQADD */
--        tcg_gen_gvec_4(vec_full_reg_offset(s, rd),
--                       offsetof(CPUARMState, vfp.qc),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm),
--                       is_q ? 16 : 8, vec_full_reg_size(s),
--                       (u ? uqadd_op : sqadd_op) + size);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uqadd_qc, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqadd_qc, size);
-+        }
-         return;
-     case 0x05: /* SQSUB, UQSUB */
--        tcg_gen_gvec_4(vec_full_reg_offset(s, rd),
--                       offsetof(CPUARMState, vfp.qc),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm),
--                       is_q ? 16 : 8, vec_full_reg_size(s),
--                       (u ? uqsub_op : sqsub_op) + size);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uqsub_qc, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqsub_qc, size);
-+        }
-         return;
-     case 0x08: /* SSHL, USHL */
-         if (u) {
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME(VORN, tcg_gen_gvec_orc)
- DO_3SAME(VEOR, tcg_gen_gvec_xor)
- DO_3SAME(VSHL_S, gen_gvec_sshl)
- DO_3SAME(VSHL_U, gen_gvec_ushl)
-+DO_3SAME(VQADD_S, gen_gvec_sqadd_qc)
-+DO_3SAME(VQADD_U, gen_gvec_uqadd_qc)
-+DO_3SAME(VQSUB_S, gen_gvec_sqsub_qc)
-+DO_3SAME(VQSUB_U, gen_gvec_uqsub_qc)
- /* These insns are all gvec_bitsel but with the inputs in various orders. */
- #define DO_3SAME_BITSEL(INSN, O1, O2, O3)                               \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_CMP(VCGE_S, TCG_COND_GE)
- DO_3SAME_CMP(VCGE_U, TCG_COND_GEU)
- DO_3SAME_CMP(VCEQ, TCG_COND_EQ)
--#define DO_3SAME_GVEC4(INSN, OPARRAY)                                   \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),           \
--                       rn_ofs, rm_ofs, oprsz, maxsz, &OPARRAY[vece]);   \
--    }                                                                   \
--    DO_3SAME(INSN, gen_##INSN##_3s)
--
--DO_3SAME_GVEC4(VQADD_S, sqadd_op)
--DO_3SAME_GVEC4(VQADD_U, uqadd_op)
--DO_3SAME_GVEC4(VQSUB_S, sqsub_op)
--DO_3SAME_GVEC4(VQSUB_U, uqsub_op)
--
- static void gen_VMUL_p_3s(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                            uint32_t rm_ofs, uint32_t oprsz, uint32_t maxsz)
- {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_uqadd[] = {
--    INDEX_op_usadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
--};
--
--const GVecGen4 uqadd_op[4] = {
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_b,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_8 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_h,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_16 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_s,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_32 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_d,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_64 },
--};
-+void gen_gvec_uqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_usadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_b,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_h,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_s,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_d,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_sqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_sqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_sqadd[] = {
--    INDEX_op_ssadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
--};
--
--const GVecGen4 sqadd_op[4] = {
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_b,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_h,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_s,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_d,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_sqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_ssadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_uqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_uqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_uqsub[] = {
--    INDEX_op_ussub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen4 uqsub_op[4] = {
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_b,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_h,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_s,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_d,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_uqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_ussub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_sqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_sqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_sqsub[] = {
--    INDEX_op_sssub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen4 sqsub_op[4] = {
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_b,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_h,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_s,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_d,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sssub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- /* Translate a NEON data processing instruction.  Return nonzero if the
-    instruction is invalid.
---
-.20.1

-[PULL 29/45] target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
+Deleted patch
-Convert the Neon VQRDMLAH and VQRDMLSH insns in the 3-reg-same group
-to decodetree.  These don't use do_3same() because they want to
-operate on VFP double registers, whose offsets are different from the
-neon_reg_offset() calculations do_3same does.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-2-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  3 +++
- target/arm/translate-neon.inc.c | 15 +++++++++++++++
- target/arm/translate.c          | 14 ++------------
-files changed, 20 insertions(+), 12 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VMLS_3s          1111 001 1 0 . .. .... .... 1001 . . . 0 .... @3same
- VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
-+
-+VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
-+VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-     }
-     return do_3same(s, a, gen_VMUL_p_3s);
- }
-+
-+#define DO_VQRDMLAH(INSN, FUNC)                                         \
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
-+    {                                                                   \
-+        if (!dc_isar_feature(aa32_rdm, s)) {                            \
-+            return false;                                               \
-+        }                                                               \
-+        if (a->size != 1 && a->size != 2) {                             \
-+            return false;                                               \
-+        }                                                               \
-+        return do_3same(s, a, FUNC);                                    \
-+    }
-+
-+DO_VQRDMLAH(VQRDMLAH, gen_gvec_sqrdmlah_qc)
-+DO_VQRDMLAH(VQRDMLSH, gen_gvec_sqrdmlsh_qc)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             if (!u) {
-                 break;  /* VPADD */
-             }
--            /* VQRDMLAH */
--            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
--                gen_gvec_sqrdmlah_qc(size, rd_ofs, rn_ofs, rm_ofs,
--                                     vec_size, vec_size);
--                return 0;
--            }
-+            /* VQRDMLAH : handled by decodetree */
-             return 1;
-         case NEON_3R_VFM_VQRDMLSH:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 }
-                 break;
-             }
--            /* VQRDMLSH */
--            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
--                gen_gvec_sqrdmlsh_qc(size, rd_ofs, rn_ofs, rm_ofs,
--                                     vec_size, vec_size);
--                return 0;
--            }
-+            /* VQRDMLSH : handled by decodetree */
-             return 1;
-         case NEON_3R_VABD:
---
-.20.1

-[PULL 31/45] target/arm: Convert Neon 64-bit element 3-reg-same insns
+Deleted patch
-Convert the 64-bit element insns in the 3-reg-same group
-to decodetree. This covers VQSHL, VRSHL and VQRSHL where
-size==0b11.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-4-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       | 13 +++++++++++
- target/arm/translate-neon.inc.c | 24 +++++++++++++++++++++
- target/arm/translate.c          | 38 ++-------------------------------
-files changed, 39 insertions(+), 36 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VCGE_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 1 .... @3same
- VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same_rev
- VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
-+# Insns operating on 64-bit elements (size!=0b11 handled elsewhere)
-+# The _rev suffix indicates that Vn and Vm are reversed (as explained
-+# by the comment for the @3same_rev format).
-+@3same_64_rev    .... ... . . . 11 .... .... .... . q:1 . . .... \
-+                 &3same vm=%vn_dp vn=%vm_dp vd=%vd_dp size=3
-+
-+VQSHL_S64_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
-+VQSHL_U64_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
-+VRSHL_S64_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
-+VRSHL_U64_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
-+VQRSHL_S64_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
-+VQRSHL_U64_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
-+
- VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
- VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
- VMIN_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_SHA256SU1_3s(DisasContext *s, arg_SHA256SU1_3s *a)
-     return true;
- }
-+
-+#define DO_3SAME_64(INSN, FUNC)                                         \
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
-+                                uint32_t oprsz, uint32_t maxsz)         \
-+    {                                                                   \
-+        static const GVecGen3 op = { .fni8 = FUNC };                    \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &op);      \
-+    }                                                                   \
-+    DO_3SAME(INSN, gen_##INSN##_3s)
-+
-+#define DO_3SAME_64_ENV(INSN, FUNC)                                     \
-+    static void gen_##INSN##_elt(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m)    \
-+    {                                                                   \
-+        FUNC(d, cpu_env, n, m);                                         \
-+    }                                                                   \
-+    DO_3SAME_64(INSN, gen_##INSN##_elt)
-+
-+DO_3SAME_64(VRSHL_S64, gen_helper_neon_rshl_s64)
-+DO_3SAME_64(VRSHL_U64, gen_helper_neon_rshl_u64)
-+DO_3SAME_64_ENV(VQSHL_S64, gen_helper_neon_qshl_s64)
-+DO_3SAME_64_ENV(VQSHL_U64, gen_helper_neon_qshl_u64)
-+DO_3SAME_64_ENV(VQRSHL_S64, gen_helper_neon_qrshl_s64)
-+DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         }
-         if (size == 3) {
--            /* 64-bit element instructions. */
--            for (pass = 0; pass < (q ? 2 : 1); pass++) {
--                neon_load_reg64(cpu_V0, rn + pass);
--                neon_load_reg64(cpu_V1, rm + pass);
--                switch (op) {
--                case NEON_3R_VQSHL:
--                    if (u) {
--                        gen_helper_neon_qshl_u64(cpu_V0, cpu_env,
--                                                 cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_qshl_s64(cpu_V0, cpu_env,
--                                                 cpu_V1, cpu_V0);
--                    }
--                    break;
--                case NEON_3R_VRSHL:
--                    if (u) {
--                        gen_helper_neon_rshl_u64(cpu_V0, cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_rshl_s64(cpu_V0, cpu_V1, cpu_V0);
--                    }
--                    break;
--                case NEON_3R_VQRSHL:
--                    if (u) {
--                        gen_helper_neon_qrshl_u64(cpu_V0, cpu_env,
--                                                  cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_qrshl_s64(cpu_V0, cpu_env,
--                                                  cpu_V1, cpu_V0);
--                    }
--                    break;
--                default:
--                    abort();
--                }
--                neon_store_reg64(cpu_V0, rd + pass);
--            }
--            return 0;
-+            /* 64-bit element instructions: handled by decodetree */
-+            return 1;
-         }
-         pairwise = 0;
-         switch (op) {
---
-.20.1

-[PULL 32/45] target/arm: Convert Neon VHADD 3-reg-same insns
+Deleted patch
-Convert the Neon VHADD insns in the 3-reg-same group to decodetree.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-5-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  2 ++
- target/arm/translate-neon.inc.c | 24 ++++++++++++++++++++++++
- target/arm/translate.c          |  4 +---
-files changed, 27 insertions(+), 3 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@
- @3same           .... ... . . . size:2 .... .... .... . q:1 . . .... \
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
-+VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
- VQADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQSHL_S64, gen_helper_neon_qshl_s64)
- DO_3SAME_64_ENV(VQSHL_U64, gen_helper_neon_qshl_u64)
- DO_3SAME_64_ENV(VQRSHL_S64, gen_helper_neon_qrshl_s64)
- DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
-+
-+#define DO_3SAME_32(INSN, FUNC)                                         \
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
-+                                uint32_t oprsz, uint32_t maxsz)         \
-+    {                                                                   \
-+        static const GVecGen3 ops[4] = {                                \
-+            { .fni4 = gen_helper_neon_##FUNC##8 },                      \
-+            { .fni4 = gen_helper_neon_##FUNC##16 },                     \
-+            { .fni4 = gen_helper_neon_##FUNC##32 },                     \
-+            { 0 },                                                      \
-+        };                                                              \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece]); \
-+    }                                                                   \
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
-+    {                                                                   \
-+        if (a->size > 2) {                                              \
-+            return false;                                               \
-+        }                                                               \
-+        return do_3same(s, a, gen_##INSN##_3s);                         \
-+    }
-+
-+DO_3SAME_32(VHADD_S, hadd_s)
-+DO_3SAME_32(VHADD_U, hadd_u)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VML:
-         case NEON_3R_VSHL:
-         case NEON_3R_SHA:
-+        case NEON_3R_VHADD:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             tmp2 = neon_load_reg(rm, pass);
-         }
-         switch (op) {
--        case NEON_3R_VHADD:
--            GEN_NEON_INTEGER_OP(hadd);
--            break;
-         case NEON_3R_VRHADD:
-             GEN_NEON_INTEGER_OP(rhadd);
-             break;
---
-.20.1

-[PULL 34/45] target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
+Deleted patch
-Convert the Neon VRHADD and VHSUB 3-reg-same insns to decodetree.
-(These are all the other insns in 3-reg-same which were using
-GEN_NEON_INTEGER_OP() and which are not pairwise or
-reversed-operands.)
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-7-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       | 6 ++++++
- target/arm/translate-neon.inc.c | 4 ++++
- target/arm/translate.c          | 8 ++------
-files changed, 12 insertions(+), 6 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
- VQADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 1 .... @3same
-+VRHADD_S_3s      1111 001 0 0 . .. .... .... 0001 . . . 0 .... @3same
-+VRHADD_U_3s      1111 001 1 0 . .. .... .... 0001 . . . 0 .... @3same
-+
- @3same_logic     .... ... . . . .. .... .... .... . q:1 .. .... \
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp size=0
-@@ -XXX,XX +XXX,XX @@ VBSL_3s          1111 001 1 0 . 01 .... .... 0001 ... 1 .... @3same_logic
- VBIT_3s          1111 001 1 0 . 10 .... .... 0001 ... 1 .... @3same_logic
- VBIF_3s          1111 001 1 0 . 11 .... .... 0001 ... 1 .... @3same_logic
-+VHSUB_S_3s       1111 001 0 0 . .. .... .... 0010 . . . 0 .... @3same
-+VHSUB_U_3s       1111 001 1 0 . .. .... .... 0010 . . . 0 .... @3same
-+
- VQSUB_S_3s       1111 001 0 0 . .. .... .... 0010 . . . 1 .... @3same
- VQSUB_U_3s       1111 001 1 0 . .. .... .... 0010 . . . 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
- DO_3SAME_32(VHADD_S, hadd_s)
- DO_3SAME_32(VHADD_U, hadd_u)
-+DO_3SAME_32(VHSUB_S, hsub_s)
-+DO_3SAME_32(VHSUB_U, hsub_u)
-+DO_3SAME_32(VRHADD_S, rhadd_s)
-+DO_3SAME_32(VRHADD_U, rhadd_u)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VSHL:
-         case NEON_3R_SHA:
-         case NEON_3R_VHADD:
-+        case NEON_3R_VRHADD:
-+        case NEON_3R_VHSUB:
-         case NEON_3R_VABD:
-         case NEON_3R_VABA:
-             /* Already handled by decodetree */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             tmp2 = neon_load_reg(rm, pass);
-         }
-         switch (op) {
--        case NEON_3R_VRHADD:
--            GEN_NEON_INTEGER_OP(rhadd);
--            break;
--        case NEON_3R_VHSUB:
--            GEN_NEON_INTEGER_OP(hsub);
--            break;
-         case NEON_3R_VQSHL:
-             GEN_NEON_INTEGER_OP_ENV(qshl);
-             break;
---
-.20.1

-[PULL 37/45] target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
+Deleted patch
-Convert the Neon integer VPADD 3-reg-same insns to decodetree.  These
-are 'pairwise' operations.  (Note that VQRDMLAH, which shares the
-same primary opcode but has U=1, has already been converted.)
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-10-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  2 ++
- target/arm/translate-neon.inc.c |  2 ++
- target/arm/translate.c          | 19 +------------------
-files changed, 5 insertions(+), 18 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
- VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
- VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
-+VPADD_3s         1111 001 0 0 . .. .... .... 1011 . . . 1 .... @3same_q0
-+
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
- SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool do_3same_pair(DisasContext *s, arg_3same *a, NeonGenTwoOpFn *fn)
- #define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
- #define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
- #define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
-+#define gen_helper_neon_padd_u32  tcg_gen_add_i32
- DO_3SAME_PAIR(VPMAX_S, pmax_s)
- DO_3SAME_PAIR(VPMIN_S, pmin_s)
- DO_3SAME_PAIR(VPMAX_U, pmax_u)
- DO_3SAME_PAIR(VPMIN_U, pmin_u)
-+DO_3SAME_PAIR(VPADD, padd_u)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             return 1;
-         }
-         switch (op) {
--        case NEON_3R_VPADD_VQRDMLAH:
--            if (!u) {
--                break;  /* VPADD */
--            }
--            /* VQRDMLAH : handled by decodetree */
--            return 1;
--
-         case NEON_3R_VFM_VQRDMLSH:
-             if (!u) {
-                 /* VFM, VFMS */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VQRSHL:
-         case NEON_3R_VPMAX:
-         case NEON_3R_VPMIN:
-+        case NEON_3R_VPADD_VQRDMLAH:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         }
-         pairwise = 0;
-         switch (op) {
--        case NEON_3R_VPADD_VQRDMLAH:
--            pairwise = 1;
--            break;
-         case NEON_3R_FLOAT_ARITH:
-             pairwise = (u && size < 2); /* if VPADD (float) */
-             break;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 }
-             }
-             break;
--        case NEON_3R_VPADD_VQRDMLAH:
--            switch (size) {
--            case 0: gen_helper_neon_padd_u8(tmp, tmp, tmp2); break;
--            case 1: gen_helper_neon_padd_u16(tmp, tmp, tmp2); break;
--            case 2: tcg_gen_add_i32(tmp, tmp, tmp2); break;
--            default: abort();
--            }
--            break;
-         case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
-         {
-             TCGv_ptr fpstatus = get_fpstatus_ptr(1);
---
-.20.1

-[PULL 38/45] target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
+Deleted patch
-Convert the Neon VQDMULH and VQRDMULH 3-reg-same insns to
-decodetree. These are the last integer operations in the
--reg-same group.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-11-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  3 +++
- target/arm/translate-neon.inc.c | 24 ++++++++++++++++++++++++
- target/arm/translate.c          | 24 +-----------------------
-files changed, 28 insertions(+), 23 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
- VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
- VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
-+VQDMULH_3s       1111 001 0 0 . .. .... .... 1011 . . . 0 .... @3same
-+VQRDMULH_3s      1111 001 1 0 . .. .... .... 1011 . . . 0 .... @3same
-+
- VPADD_3s         1111 001 0 0 . .. .... .... 1011 . . . 1 .... @3same_q0
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPMIN_S, pmin_s)
- DO_3SAME_PAIR(VPMAX_U, pmax_u)
- DO_3SAME_PAIR(VPMIN_U, pmin_u)
- DO_3SAME_PAIR(VPADD, padd_u)
-+
-+#define DO_3SAME_VQDMULH(INSN, FUNC)                                    \
-+    WRAP_ENV_FN(gen_##INSN##_tramp16, gen_helper_neon_##FUNC##_s16);    \
-+    WRAP_ENV_FN(gen_##INSN##_tramp32, gen_helper_neon_##FUNC##_s32);    \
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
-+                                uint32_t oprsz, uint32_t maxsz)         \
-+    {                                                                   \
-+        static const GVecGen3 ops[2] = {                                \
-+            { .fni4 = gen_##INSN##_tramp16 },                           \
-+            { .fni4 = gen_##INSN##_tramp32 },                           \
-+        };                                                              \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece - 1]); \
-+    }                                                                   \
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
-+    {                                                                   \
-+        if (a->size != 1 && a->size != 2) {                             \
-+            return false;                                               \
-+        }                                                               \
-+        return do_3same(s, a, gen_##INSN##_3s);                         \
-+    }
-+
-+DO_3SAME_VQDMULH(VQDMULH, qdmulh)
-+DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VPMAX:
-         case NEON_3R_VPMIN:
-         case NEON_3R_VPADD_VQRDMLAH:
-+        case NEON_3R_VQDMULH_VQRDMULH:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             tmp2 = neon_load_reg(rm, pass);
-         }
-         switch (op) {
--        case NEON_3R_VQDMULH_VQRDMULH: /* Multiply high.  */
--            if (!u) { /* VQDMULH */
--                switch (size) {
--                case 1:
--                    gen_helper_neon_qdmulh_s16(tmp, cpu_env, tmp, tmp2);
--                    break;
--                case 2:
--                    gen_helper_neon_qdmulh_s32(tmp, cpu_env, tmp, tmp2);
--                    break;
--                default: abort();
--                }
--            } else { /* VQRDMULH */
--                switch (size) {
--                case 1:
--                    gen_helper_neon_qrdmulh_s16(tmp, cpu_env, tmp, tmp2);
--                    break;
--                case 2:
--                    gen_helper_neon_qrdmulh_s32(tmp, cpu_env, tmp, tmp2);
--                    break;
--                default: abort();
--                }
--            }
--            break;
-         case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
-         {
-             TCGv_ptr fpstatus = get_fpstatus_ptr(1);
---
-.20.1

-[PULL 40/45] target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
+Deleted patch
-Convert the Neon float VPMIN, VPMAX and VPADD 3-reg-same insns to
-decodetree. These are the only remaining 'pairwise' operations,
-so we can delete the pairwise-specific bits of the old decoder's
-for-each-element loop now.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-13-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  5 +++
- target/arm/translate-neon.inc.c | 63 +++++++++++++++++++++++++++++++++
- target/arm/translate.c          | 63 +++++----------------------------
-files changed, 76 insertions(+), 55 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@
- # For FP insns the high bit of 'size' is used as part of opcode decode
- @3same_fp        .... ... . . . . size:1 .... .... .... . q:1 . . .... \
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+@3same_fp_q0     .... ... . . . . size:1 .... .... .... . 0 . . .... \
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
-@@ -XXX,XX +XXX,XX @@ VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
- VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
- VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
-+VPADD_fp_3s      1111 001 1 0 . 0 . .... .... 1101 ... 0 .... @3same_fp_q0
- VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
-+VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
-+VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
- DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
- DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
- DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
-+
-+static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
-+{
-+    /* FP operations handled pairwise 32 bits at a time */
-+    TCGv_i32 tmp, tmp2, tmp3;
-+    TCGv_ptr fpstatus;
-+
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-+        return false;
-+    }
-+
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    assert(a->q == 0); /* enforced by decode patterns */
-+
-+    /*
-+     * Note that we have to be careful not to clobber the source operands
-+     * in the "vm == vd" case by storing the result of the first pass too
-+     * early. Since Q is 0 there are always just two passes, so instead
-+     * of a complicated loop over each pass we just unroll.
-+     */
-+    fpstatus = get_fpstatus_ptr(1);
-+    tmp = neon_load_reg(a->vn, 0);
-+    tmp2 = neon_load_reg(a->vn, 1);
-+    fn(tmp, tmp, tmp2, fpstatus);
-+    tcg_temp_free_i32(tmp2);
-+
-+    tmp3 = neon_load_reg(a->vm, 0);
-+    tmp2 = neon_load_reg(a->vm, 1);
-+    fn(tmp3, tmp3, tmp2, fpstatus);
-+    tcg_temp_free_i32(tmp2);
-+    tcg_temp_free_ptr(fpstatus);
-+
-+    neon_store_reg(a->vd, 0, tmp);
-+    neon_store_reg(a->vd, 1, tmp3);
-+    return true;
-+}
-+
-+/*
-+ * For all the functions using this macro, size == 1 means fp16,
-+ * which is an architecture extension we don't implement yet.
-+ */
-+#define DO_3S_FP_PAIR(INSN,FUNC)                                    \
-+    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
-+    {                                                               \
-+        if (a->size != 0) {                                         \
-+            /* TODO fp16 support */                                 \
-+            return false;                                           \
-+        }                                                           \
-+        return do_3same_fp_pair(s, a, FUNC);                        \
-+    }
-+
-+DO_3S_FP_PAIR(VPADD, gen_helper_vfp_adds)
-+DO_3S_FP_PAIR(VPMAX, gen_helper_vfp_maxs)
-+DO_3S_FP_PAIR(VPMIN, gen_helper_vfp_mins)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-     int shift;
-     int pass;
-     int count;
--    int pairwise;
-     int u;
-     int vec_size;
-     uint32_t imm;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VPMIN:
-         case NEON_3R_VPADD_VQRDMLAH:
-         case NEON_3R_VQDMULH_VQRDMULH:
-+        case NEON_3R_FLOAT_ARITH:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             /* 64-bit element instructions: handled by decodetree */
-             return 1;
-         }
--        pairwise = 0;
-         switch (op) {
--        case NEON_3R_FLOAT_ARITH:
--            pairwise = (u && size < 2); /* if VPADD (float) */
--            if (!pairwise) {
--                return 1; /* handled by decodetree */
--            }
--            break;
-         case NEON_3R_FLOAT_MINMAX:
--            pairwise = u; /* if VPMIN/VPMAX (float) */
-+            if (u) {
-+                return 1; /* VPMIN/VPMAX handled by decodetree */
-+            }
-             break;
-         case NEON_3R_FLOAT_CMP:
-             if (!u && size) {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             break;
-         }
--        if (pairwise && q) {
--            /* All the pairwise insns UNDEF if Q is set */
--            return 1;
--        }
--
-         for (pass = 0; pass < (q ? 4 : 2); pass++) {
--        if (pairwise) {
--            /* Pairwise.  */
--            if (pass < 1) {
--                tmp = neon_load_reg(rn, 0);
--                tmp2 = neon_load_reg(rn, 1);
--            } else {
--                tmp = neon_load_reg(rm, 0);
--                tmp2 = neon_load_reg(rm, 1);
--            }
--        } else {
--            /* Elementwise.  */
--            tmp = neon_load_reg(rn, pass);
--            tmp2 = neon_load_reg(rm, pass);
--        }
-+        /* Elementwise.  */
-+        tmp = neon_load_reg(rn, pass);
-+        tmp2 = neon_load_reg(rm, pass);
-         switch (op) {
--        case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
--        {
--            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
--            switch ((u << 2) | size) {
--            case 4: /* VPADD */
--                gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
--                break;
--            default:
--                abort();
--            }
--            tcg_temp_free_ptr(fpstatus);
--            break;
--        }
-         case NEON_3R_FLOAT_MULTIPLY:
-         {
-             TCGv_ptr fpstatus = get_fpstatus_ptr(1);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         }
-         tcg_temp_free_i32(tmp2);
--        /* Save the result.  For elementwise operations we can put it
--           straight into the destination register.  For pairwise operations
--           we have to be careful to avoid clobbering the source operands.  */
--        if (pairwise && rd == rm) {
--            neon_store_scratch(pass, tmp);
--        } else {
--            neon_store_reg(rd, pass, tmp);
--        }
-+        neon_store_reg(rd, pass, tmp);
-         } /* for pass */
--        if (pairwise && rd == rm) {
--            for (pass = 0; pass < (q ? 4 : 2); pass++) {
--                tmp = neon_load_scratch(pass);
--                neon_store_reg(rd, pass, tmp);
--            }
--        }
-         /* End of 3 register same size operations.  */
-     } else if (insn & (1 << 4)) {
-         if ((insn & 0x00380080) != 0) {
---
-.20.1

-[PULL 41/45] target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
+Deleted patch
-Convert the Neon integer VMUL, VMLA, and VMLS 3-reg-same inssn to
-decodetree.
-We don't have a gvec helper for multiply-accumulate, so VMLA and VMLS
-need a loop function do_3same_fp().  This takes a reads_vd parameter
-to do_3same_fp() which tells it to load the old value into vd before
-calling the callback function, in the same way that the do_vfp_3op_sp()
-and do_vfp_3op_dp() functions in translate-vfp.inc.c work. (The
-only uses in this patch pass reads_vd == true, but later commits
-will use reads_vd == false.)
-This conversion fixes in passing an underdecoding for VMUL
-(originally reported by Fredrik Strupe <fredrik@strupe.net>): bit 1
-of the 'size' field must be 0.  The old decoder didn't enforce this,
-but the decodetree pattern does.
-The gen_VMLA_fp_reg() function performs the addition operation
-with the operands in the opposite order to the old decoder:
-since Neon sets 'default NaN mode' float32_add operations are
-commutative so there is no behaviour difference, but putting
-them this way around matches the Arm ARM pseudocode and the
-required operation order for the subtraction in gen_VMLS_fp_reg().
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-14-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  3 ++
- target/arm/translate-neon.inc.c | 81 +++++++++++++++++++++++++++++++++
- target/arm/translate.c          | 17 +------
-files changed, 85 insertions(+), 16 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
- VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
- VPADD_fp_3s      1111 001 1 0 . 0 . .... .... 1101 ... 0 .... @3same_fp_q0
- VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
-+VMLA_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
-+VMLS_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 1 .... @3same_fp
-+VMUL_fp_3s       1111 001 1 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
- DO_3SAME_VQDMULH(VQDMULH, qdmulh)
- DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
-+static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
-+                        bool reads_vd)
-+{
-+    /*
-+     * FP operations handled elementwise 32 bits at a time.
-+     * If reads_vd is true then the old value of Vd will be
-+     * loaded before calling the callback function. This is
-+     * used for multiply-accumulate type operations.
-+     */
-+    TCGv_i32 tmp, tmp2;
-+    int pass;
-+
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-+        return false;
-+    }
-+
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
-+        return false;
-+    }
-+
-+    if ((a->vn | a->vm | a->vd) & a->q) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    TCGv_ptr fpstatus = get_fpstatus_ptr(1);
-+    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
-+        tmp = neon_load_reg(a->vn, pass);
-+        tmp2 = neon_load_reg(a->vm, pass);
-+        if (reads_vd) {
-+            TCGv_i32 tmp_rd = neon_load_reg(a->vd, pass);
-+            fn(tmp_rd, tmp, tmp2, fpstatus);
-+            neon_store_reg(a->vd, pass, tmp_rd);
-+            tcg_temp_free_i32(tmp);
-+        } else {
-+            fn(tmp, tmp, tmp2, fpstatus);
-+            neon_store_reg(a->vd, pass, tmp);
-+        }
-+        tcg_temp_free_i32(tmp2);
-+    }
-+    tcg_temp_free_ptr(fpstatus);
-+    return true;
-+}
-+
- /*
-  * For all the functions using this macro, size == 1 means fp16,
-  * which is an architecture extension we don't implement yet.
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
- DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
- DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
- DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
-+DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
-+
-+/*
-+ * For all the functions using this macro, size == 1 means fp16,
-+ * which is an architecture extension we don't implement yet.
-+ */
-+#define DO_3S_FP(INSN,FUNC,READS_VD)                                \
-+    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
-+    {                                                               \
-+        if (a->size != 0) {                                         \
-+            /* TODO fp16 support */                                 \
-+            return false;                                           \
-+        }                                                           \
-+        return do_3same_fp(s, a, FUNC, READS_VD);                   \
-+    }
-+
-+static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-+                            TCGv_ptr fpstatus)
-+{
-+    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
-+    gen_helper_vfp_adds(vd, vd, vn, fpstatus);
-+}
-+
-+static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-+                            TCGv_ptr fpstatus)
-+{
-+    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
-+    gen_helper_vfp_subs(vd, vd, vn, fpstatus);
-+}
-+
-+DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
-+DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
- static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
- {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VPADD_VQRDMLAH:
-         case NEON_3R_VQDMULH_VQRDMULH:
-         case NEON_3R_FLOAT_ARITH:
-+        case NEON_3R_FLOAT_MULTIPLY:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         tmp = neon_load_reg(rn, pass);
-         tmp2 = neon_load_reg(rm, pass);
-         switch (op) {
--        case NEON_3R_FLOAT_MULTIPLY:
--        {
--            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
--            gen_helper_vfp_muls(tmp, tmp, tmp2, fpstatus);
--            if (!u) {
--                tcg_temp_free_i32(tmp2);
--                tmp2 = neon_load_reg(rd, pass);
--                if (size == 0) {
--                    gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
--                } else {
--                    gen_helper_vfp_subs(tmp, tmp2, tmp, fpstatus);
--                }
--            }
--            tcg_temp_free_ptr(fpstatus);
--            break;
--        }
-         case NEON_3R_FLOAT_CMP:
-         {
-             TCGv_ptr fpstatus = get_fpstatus_ptr(1);
---
-.20.1

-[PULL 43/45] target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
+Deleted patch
-The usual location for the env argument in the argument list of a TCG helper
-is immediately after the return-value argument. recps_f32 and rsqrts_f32
-differ in that they put it at the end.
-Move the env argument to its usual place; this will allow us to
-more easily use these helper functions with the gvec APIs.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-16-peter.maydell@linaro.org
----
- target/arm/helper.h     | 4 ++--
- target/arm/translate.c  | 4 ++--
- target/arm/vfp_helper.c | 4 ++--
-files changed, 6 insertions(+), 6 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, ptr, i32)
- DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
- DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
--DEF_HELPER_3(recps_f32, f32, f32, f32, env)
--DEF_HELPER_3(rsqrts_f32, f32, f32, f32, env)
-+DEF_HELPER_3(recps_f32, f32, env, f32, f32)
-+DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
- DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
- DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
- DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 tcg_temp_free_ptr(fpstatus);
-             } else {
-                 if (size == 0) {
--                    gen_helper_recps_f32(tmp, tmp, tmp2, cpu_env);
-+                    gen_helper_recps_f32(tmp, cpu_env, tmp, tmp2);
-                 } else {
--                    gen_helper_rsqrts_f32(tmp, tmp, tmp2, cpu_env);
-+                    gen_helper_rsqrts_f32(tmp, cpu_env, tmp, tmp2);
-               }
-             }
-             break;
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp_helper.c
-+++ b/target/arm/vfp_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
- #define float32_three make_float32(0x40400000)
- #define float32_one_point_five make_float32(0x3fc00000)
--float32 HELPER(recps_f32)(float32 a, float32 b, CPUARMState *env)
-+float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
- {
-     float_status *s = &env->vfp.standard_fp_status;
-     if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
-@@ -XXX,XX +XXX,XX @@ float32 HELPER(recps_f32)(float32 a, float32 b, CPUARMState *env)
-     return float32_sub(float32_two, float32_mul(a, b, s), s);
- }
--float32 HELPER(rsqrts_f32)(float32 a, float32 b, CPUARMState *env)
-+float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
- {
-     float_status *s = &env->vfp.standard_fp_status;
-     float32 product;
---
-.20.1

-[PULL 44/45] target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
+Deleted patch
-Convert the Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS 3-reg-same
-insns to decodetree. (These are all the remaining non-accumulation
-instructions in this group.)
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-17-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  6 +++
- target/arm/translate-neon.inc.c | 70 +++++++++++++++++++++++++++++++++
- target/arm/translate.c          | 42 +-------------------
-files changed, 78 insertions(+), 40 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VCGE_fp_3s       1111 001 1 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
- VACGE_fp_3s      1111 001 1 0 . 0 . .... .... 1110 ... 1 .... @3same_fp
- VCGT_fp_3s       1111 001 1 0 . 1 . .... .... 1110 ... 0 .... @3same_fp
- VACGT_fp_3s      1111 001 1 0 . 1 . .... .... 1110 ... 1 .... @3same_fp
-+VMAX_fp_3s       1111 001 0 0 . 0 . .... .... 1111 ... 0 .... @3same_fp
-+VMIN_fp_3s       1111 001 0 0 . 1 . .... .... 1111 ... 0 .... @3same_fp
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
-+VRECPS_fp_3s     1111 001 0 0 . 0 . .... .... 1111 ... 1 .... @3same_fp
-+VRSQRTS_fp_3s    1111 001 0 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
-+VMAXNM_fp_3s     1111 001 1 0 . 0 . .... .... 1111 ... 1 .... @3same_fp
-+VMINNM_fp_3s     1111 001 1 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
- DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
- DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
- DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
-+DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
-+DO_3S_FP(VMIN, gen_helper_vfp_mins, false)
- static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-                             TCGv_ptr fpstatus)
-@@ -XXX,XX +XXX,XX @@ static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
- DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
- DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
-+static bool trans_VMAXNM_fp_3s(DisasContext *s, arg_3same *a)
-+{
-+    if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
-+        return false;
-+    }
-+
-+    if (a->size != 0) {
-+        /* TODO fp16 support */
-+        return false;
-+    }
-+
-+    return do_3same_fp(s, a, gen_helper_vfp_maxnums, false);
-+}
-+
-+static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
-+{
-+    if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
-+        return false;
-+    }
-+
-+    if (a->size != 0) {
-+        /* TODO fp16 support */
-+        return false;
-+    }
-+
-+    return do_3same_fp(s, a, gen_helper_vfp_minnums, false);
-+}
-+
-+WRAP_ENV_FN(gen_VRECPS_tramp, gen_helper_recps_f32)
-+
-+static void gen_VRECPS_fp_3s(unsigned vece, uint32_t rd_ofs,
-+                             uint32_t rn_ofs, uint32_t rm_ofs,
-+                             uint32_t oprsz, uint32_t maxsz)
-+{
-+    static const GVecGen3 ops = { .fni4 = gen_VRECPS_tramp };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
-+}
-+
-+static bool trans_VRECPS_fp_3s(DisasContext *s, arg_3same *a)
-+{
-+    if (a->size != 0) {
-+        /* TODO fp16 support */
-+        return false;
-+    }
-+
-+    return do_3same(s, a, gen_VRECPS_fp_3s);
-+}
-+
-+WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
-+
-+static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
-+                              uint32_t rn_ofs, uint32_t rm_ofs,
-+                              uint32_t oprsz, uint32_t maxsz)
-+{
-+    static const GVecGen3 ops = { .fni4 = gen_VRSQRTS_tramp };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
-+}
-+
-+static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
-+{
-+    if (a->size != 0) {
-+        /* TODO fp16 support */
-+        return false;
-+    }
-+
-+    return do_3same(s, a, gen_VRSQRTS_fp_3s);
-+}
-+
- static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
- {
-     /* FP operations handled pairwise 32 bits at a time */
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_FLOAT_MULTIPLY:
-         case NEON_3R_FLOAT_CMP:
-         case NEON_3R_FLOAT_ACMP:
-+        case NEON_3R_FLOAT_MINMAX:
-+        case NEON_3R_FLOAT_MISC:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             return 1;
-         }
-         switch (op) {
--        case NEON_3R_FLOAT_MINMAX:
--            if (u) {
--                return 1; /* VPMIN/VPMAX handled by decodetree */
--            }
--            break;
--        case NEON_3R_FLOAT_MISC:
--            /* VMAXNM/VMINNM in ARMv8 */
--            if (u && !arm_dc_feature(s, ARM_FEATURE_V8)) {
--                return 1;
--            }
--            break;
-         case NEON_3R_VFM_VQRDMLSH:
-             if (!dc_isar_feature(aa32_simdfmac, s)) {
-                 return 1;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         tmp = neon_load_reg(rn, pass);
-         tmp2 = neon_load_reg(rm, pass);
-         switch (op) {
--        case NEON_3R_FLOAT_MINMAX:
--        {
--            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
--            if (size == 0) {
--                gen_helper_vfp_maxs(tmp, tmp, tmp2, fpstatus);
--            } else {
--                gen_helper_vfp_mins(tmp, tmp, tmp2, fpstatus);
--            }
--            tcg_temp_free_ptr(fpstatus);
--            break;
--        }
--        case NEON_3R_FLOAT_MISC:
--            if (u) {
--                /* VMAXNM/VMINNM */
--                TCGv_ptr fpstatus = get_fpstatus_ptr(1);
--                if (size == 0) {
--                    gen_helper_vfp_maxnums(tmp, tmp, tmp2, fpstatus);
--                } else {
--                    gen_helper_vfp_minnums(tmp, tmp, tmp2, fpstatus);
--                }
--                tcg_temp_free_ptr(fpstatus);
--            } else {
--                if (size == 0) {
--                    gen_helper_recps_f32(tmp, cpu_env, tmp, tmp2);
--                } else {
--                    gen_helper_rsqrts_f32(tmp, cpu_env, tmp, tmp2);
--              }
--            }
--            break;
-         case NEON_3R_VFM_VQRDMLSH:
-         {
-             /* VFMA, VFMS: fused multiply-add */
---
-.20.1

Mostly this is patches from me and RTH cleaning up and doing
more decodetree conversion for AArch32 Neon. The major new feature
is Dongjiu Geng's patchset to report host memory errors to KVM guests;
also a new aspeed board from Patrick Williams.

thanks
-- PMM

The following changes since commit 035b448b84f3557206abc44d786c5d3db2638f7d:

Merge remote-tracking branch 'remotes/gkurz/tags/9p-next-2020-05-14' into staging (2020-05-14 10:58:30 +0100)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200514

for you to fetch changes up to e95485f85657be21135c17a9226e297c21e73360:

target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree (2020-05-14 15:03:09 +0100)

----------------------------------------------------------------
target-arm queue:
 * target/arm: Use correct GDB XML for M-profile cores
 * target/arm: Code cleanup to use gvec APIs better
 * aspeed: Add support for the sonorapass-bmc board
 * target/arm: Support reporting KVM host memory errors
   to the guest via ACPI notifications
 * target/arm: Finish conversion of Neon 3-reg-same insns to decodetree

----------------------------------------------------------------
Dongjiu Geng (10):
      acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
      hw/arm/virt: Introduce a RAS machine option
      docs: APEI GHES generation and CPER record description
      ACPI: Build related register address fields via hardware error fw_cfg blob
      ACPI: Build Hardware Error Source Table
      ACPI: Record the Generic Error Status Block address
      KVM: Move hwpoison page related functions into kvm-all.c
      ACPI: Record Generic Error Status Block(GESB) table
      target-arm: kvm64: handle SIGBUS signal from kernel or KVM
      MAINTAINERS: Add ACPI/HEST/GHES entries

Patrick Williams (1):
      aspeed: Add support for the sonorapass-bmc board

Peter Maydell (18):
      target/arm: Use correct GDB XML for M-profile cores
      target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
      target/arm: Convert Neon 3-reg-same SHA to decodetree
      target/arm: Convert Neon 64-bit element 3-reg-same insns
      target/arm: Convert Neon VHADD 3-reg-same insns
      target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
      target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
      target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
      target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
      target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
      target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
      target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
      target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
      target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
      target/arm: Convert Neon 3-reg-same compare insns to decodetree
      target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
      target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
      target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree

Richard Henderson (16):
      target/arm: Create gen_gvec_[us]sra
      target/arm: Create gen_gvec_{u,s}{rshr,rsra}
      target/arm: Create gen_gvec_{sri,sli}
      target/arm: Remove unnecessary range check for VSHL
      target/arm: Tidy handle_vec_simd_shri
      target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
      target/arm: Create gen_gvec_{mla,mls}
      target/arm: Swap argument order for VSHL during decode
      target/arm: Create gen_gvec_{cmtst,ushl,sshl}
      target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
      target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
      target/arm: Create gen_gvec_{qrdmla,qrdmls}
      target/arm: Pass pointer to qc to qrdmla/qrdmls
      target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
      target/arm: Vectorize SABD/UABD
      target/arm: Vectorize SABA/UABA

GDB's remote protocol requires M-profile cores to use the feature
name 'org.gnu.gdb.arm.m-profile' instead of the 'org.gnu.gdb.arm.core'
feature used for A- and R-profile cores. We weren't doing this, which
meant GDB treated our M-profile cores like A-profile ones. This mostly
doesn't matter, but for instance means that it doesn't correctly
handle backtraces where an M-profile exception frame is involved.

Ship a copy of GDB's arm-m-profile.xml and use it on the M-profile
cores.  The integer registers have the same offsets as the
arm-core.xml, but register 25 is the M-profile XPSR rather than the
A-profile CPSR, so we need to update arm_cpu_gdb_read_register() and
arm_cpu_gdb_write_register() to handle XSPR reads and writes.

Fixes: https://bugs.launchpad.net/qemu/+bug/1877136
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200507134755.13997-1-peter.maydell@linaro.org
---
 configure                 |  4 ++--
 target/arm/cpu_tcg.c      |  1 +
 target/arm/gdbstub.c      | 22 ++++++++++++++++++----
 gdb-xml/arm-m-profile.xml | 27 +++++++++++++++++++++++++++
 4 files changed, 48 insertions(+), 6 deletions(-)
 create mode 100644 gdb-xml/arm-m-profile.xml

diff --git a/configure b/configure
index XXXXXXX..XXXXXXX 100755
--- a/configure
+++ b/configure
@@ -XXX,XX +XXX,XX @@ case "$target_name" in
     TARGET_SYSTBL_ABI=common,oabi
     bflt="yes"
     mttcg="yes"
-    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
+    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
   ;;
   aarch64|aarch64_be)
     TARGET_ARCH=aarch64
     TARGET_BASE_ARCH=arm
     bflt="yes"
     mttcg="yes"
-    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
+    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
   ;;
   cris)
   ;;
diff --git a/target/arm/cpu_tcg.c b/target/arm/cpu_tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu_tcg.c
+++ b/target/arm/cpu_tcg.c
@@ -XXX,XX +XXX,XX @@ static void arm_v7m_class_init(ObjectClass *oc, void *data)
 #endif
 
     cc->cpu_exec_interrupt = arm_v7m_cpu_exec_interrupt;
+    cc->gdb_core_xml_file = "arm-m-profile.xml";
 }
 
 static const ARMCPUInfo arm_tcg_cpus[] = {
diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/gdbstub.c
+++ b/target/arm/gdbstub.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_read_register(CPUState *cs, GByteArray *mem_buf, int n)
         }
         return gdb_get_reg32(mem_buf, 0);
     case 25:
-        /* CPSR */
-        return gdb_get_reg32(mem_buf, cpsr_read(env));
+        /* CPSR, or XPSR for M-profile */
+        if (arm_feature(env, ARM_FEATURE_M)) {
+            return gdb_get_reg32(mem_buf, xpsr_read(env));
+        } else {
+            return gdb_get_reg32(mem_buf, cpsr_read(env));
+        }
     }
     /* Unknown register.  */
     return 0;
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
         }
         return 4;
     case 25:
-        /* CPSR */
-        cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
+        /* CPSR, or XPSR for M-profile */
+        if (arm_feature(env, ARM_FEATURE_M)) {
+            /*
+             * Don't allow writing to XPSR.Exception as it can cause
+             * a transition into or out of handler mode (it's not
+             * writeable via the MSR insn so this is a reasonable
+             * restriction). Other fields are safe to update.
+             */
+            xpsr_write(env, tmp, ~XPSR_EXCP);
+        } else {
+            cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
+        }
         return 4;
     }
     /* Unknown register.  */
diff --git a/gdb-xml/arm-m-profile.xml b/gdb-xml/arm-m-profile.xml
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/gdb-xml/arm-m-profile.xml
@@ -XXX,XX +XXX,XX @@
+<?xml version="1.0"?>
+
+
+<!DOCTYPE feature SYSTEM "gdb-target.dtd">
+<feature name="org.gnu.gdb.arm.m-profile">
+  <reg name="r0" bitsize="32"/>
+  <reg name="r1" bitsize="32"/>
+  <reg name="r2" bitsize="32"/>
+  <reg name="r3" bitsize="32"/>
+  <reg name="r4" bitsize="32"/>
+  <reg name="r5" bitsize="32"/>
+  <reg name="r6" bitsize="32"/>
+  <reg name="r7" bitsize="32"/>
+  <reg name="r8" bitsize="32"/>
+  <reg name="r9" bitsize="32"/>
+  <reg name="r10" bitsize="32"/>
+  <reg name="r11" bitsize="32"/>
+  <reg name="r12" bitsize="32"/>
+  <reg name="sp" bitsize="32" type="data_ptr"/>
+  <reg name="lr" bitsize="32"/>
+  <reg name="pc" bitsize="32" type="code_ptr"/>
+  <reg name="xpsr" bitsize="32" regnum="25"/>
+</feature>
-- 
2.20.1