Series comparison

-[PULL 00/45] target-arm queue
+[PULL 00/31] target-arm queue
-Mostly this is patches from me and RTH cleaning up and doing
+First arm pullreq for 7.1. The bulk of this is the qemu_split_irq
-more decodetree conversion for AArch32 Neon. The major new feature
+removal.
-is Dongjiu Geng's patchset to report host memory errors to KVM guests;
-also a new aspeed board from Patrick Williams.
+I have enough stuff in my to-review queue that I expect to do another
 pullreq early next week, but 31 patches is enough to not hang on to.
 thanks
 -- PMM
-The following changes since commit 035b448b84f3557206abc44d786c5d3db2638f7d:
+The following changes since commit 9c125d17e9402c232c46610802e5931b3639d77b:
-  Merge remote-tracking branch 'remotes/gkurz/tags/9p-next-2020-05-14' into staging (2020-05-14 10:58:30 +0100)
+  Merge tag 'pull-tcg-20220420' of https://gitlab.com/rth7680/qemu into staging (2022-04-20 16:43:11 -0700)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200514
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20220421
-for you to fetch changes up to e95485f85657be21135c17a9226e297c21e73360:
+for you to fetch changes up to 5b415dd61bdbf61fb4be0e9f1a7172b8bce682c6:
-  target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree (2020-05-14 15:03:09 +0100)
+  hw/arm: Use bit fields for NPCM7XX PWRON STRAPs (2022-04-21 11:37:05 +0100)
 ----------------------------------------------------------------
 target-arm queue:
- * target/arm: Use correct GDB XML for M-profile cores
+ * hw/arm/virt: Check for attempt to use TrustZone with KVM or HVF
- * target/arm: Code cleanup to use gvec APIs better
+ * versal: Add the Cortex-R5s in the Real-Time Processing Unit (RPU) subsystem
- * aspeed: Add support for the sonorapass-bmc board
+ * versal: model enough of the Clock/Reset Low-power domain (CRL) to allow control of the Cortex-R5s
- * target/arm: Support reporting KVM host memory errors
+ * xlnx-zynqmp: Connect 4 TTC timers
-   to the guest via ACPI notifications
+ * exynos4210: Refactor GIC/combiner code to stop using qemu_split_irq
- * target/arm: Finish conversion of Neon 3-reg-same insns to decodetree
+ * realview: replace 'qemu_split_irq' with 'TYPE_SPLIT_IRQ'
  * stellaris: replace 'qemu_split_irq' with 'TYPE_SPLIT_IRQ'
  * hw/core/irq: remove unused 'qemu_irq_split' function
  * npcm7xx: use symbolic constants for PWRON STRAP bit fields
  * virt: document impact of gic-version on max CPUs
 ----------------------------------------------------------------
-Dongjiu Geng (10):
+Edgar E. Iglesias (6):
-      acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
+      timer: cadence_ttc: Break out header file to allow embedding
-      hw/arm/virt: Introduce a RAS machine option
+      hw/arm/xlnx-zynqmp: Connect 4 TTC timers
-      docs: APEI GHES generation and CPER record description
+      hw/arm: versal: Create an APU CPU Cluster
-      ACPI: Build related register address fields via hardware error fw_cfg blob
+      hw/arm: versal: Add the Cortex-R5Fs
-      ACPI: Build Hardware Error Source Table
+      hw/misc: Add a model of the Xilinx Versal CRL
-      ACPI: Record the Generic Error Status Block address
+      hw/arm: versal: Connect the CRL
       KVM: Move hwpoison page related functions into kvm-all.c
       ACPI: Record Generic Error Status Block(GESB) table
       target-arm: kvm64: handle SIGBUS signal from kernel or KVM
       MAINTAINERS: Add ACPI/HEST/GHES entries
-Patrick Williams (1):
+Hao Wu (2):
-      aspeed: Add support for the sonorapass-bmc board
+      hw/misc: Add PWRON STRAP bit fields in GCR module
       hw/arm: Use bit fields for NPCM7XX PWRON STRAPs
-Peter Maydell (18):
+Heinrich Schuchardt (1):
-      target/arm: Use correct GDB XML for M-profile cores
+      hw/arm/virt: impact of gic-version on max CPUs
       target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
       target/arm: Convert Neon 3-reg-same SHA to decodetree
       target/arm: Convert Neon 64-bit element 3-reg-same insns
       target/arm: Convert Neon VHADD 3-reg-same insns
       target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
       target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
       target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
       target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
       target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
       target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
       target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
       target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
       target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
       target/arm: Convert Neon 3-reg-same compare insns to decodetree
       target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
       target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
       target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree
-Richard Henderson (16):
+Peter Maydell (19):
-      target/arm: Create gen_gvec_[us]sra
+      hw/arm/virt: Check for attempt to use TrustZone with KVM or HVF
-      target/arm: Create gen_gvec_{u,s}{rshr,rsra}
+      hw/arm/exynos4210: Use TYPE_OR_IRQ instead of custom OR-gate device
-      target/arm: Create gen_gvec_{sri,sli}
+      hw/intc/exynos4210_gic: Remove unused TYPE_EXYNOS4210_IRQ_GATE
-      target/arm: Remove unnecessary range check for VSHL
+      hw/arm/exynos4210: Put a9mpcore device into state struct
-      target/arm: Tidy handle_vec_simd_shri
+      hw/arm/exynos4210: Drop int_gic_irq[] from Exynos4210Irq struct
-      target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
+      hw/arm/exynos4210: Coalesce board_irqs and irq_table
-      target/arm: Create gen_gvec_{mla,mls}
+      hw/arm/exynos4210: Fix code style nit in combiner_grp_to_gic_id[]
-      target/arm: Swap argument order for VSHL during decode
+      hw/arm/exynos4210: Move exynos4210_init_board_irqs() into exynos4210.c
-      target/arm: Create gen_gvec_{cmtst,ushl,sshl}
+      hw/arm/exynos4210: Put external GIC into state struct
-      target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
+      hw/arm/exynos4210: Drop ext_gic_irq[] from Exynos4210Irq struct
-      target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
+      hw/arm/exynos4210: Move exynos4210_combiner_get_gpioin() into exynos4210.c
-      target/arm: Create gen_gvec_{qrdmla,qrdmls}
+      hw/arm/exynos4210: Delete unused macro definitions
-      target/arm: Pass pointer to qc to qrdmla/qrdmls
+      hw/arm/exynos4210: Use TYPE_SPLIT_IRQ in exynos4210_init_board_irqs()
-      target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
+      hw/arm/exynos4210: Fill in irq_table[] for internal-combiner-only IRQ lines
-      target/arm: Vectorize SABD/UABD
+      hw/arm/exynos4210: Connect MCT_G0 and MCT_G1 to both combiners
-      target/arm: Vectorize SABA/UABA
+      hw/arm/exynos4210: Don't connect multiple lines to external GIC inputs
       hw/arm/exynos4210: Fold combiner splits into exynos4210_init_board_irqs()
       hw/arm/exynos4210: Put combiners into state struct
       hw/arm/exynos4210: Drop Exynos4210Irq struct
- docs/specs/acpi_hest_ghes.rst          |  110 ++
+Zongyuan Li (3):
- docs/specs/index.rst                   |    1 +
+      hw/arm/realview: replace 'qemu_split_irq' with 'TYPE_SPLIT_IRQ'
- configure                              |    4 +-
+      hw/arm/stellaris: replace 'qemu_split_irq' with 'TYPE_SPLIT_IRQ'
- default-configs/arm-softmmu.mak        |    1 +
+      hw/core/irq: remove unused 'qemu_irq_split' function
  include/hw/acpi/aml-build.h            |    1 +
  include/hw/acpi/generic_event_device.h |    2 +
  include/hw/acpi/ghes.h                 |   74 +
  include/hw/arm/virt.h                  |    1 +
  include/qemu/uuid.h                    |   27 +
  include/sysemu/kvm.h                   |    3 +-
  include/sysemu/kvm_int.h               |   12 +
  target/arm/cpu.h                       |    4 +
  target/arm/helper.h                    |   78 +-
  target/arm/internals.h                 |    5 +-
  target/arm/translate.h                 |   84 +-
  target/i386/cpu.h                      |    2 +
  target/arm/neon-dp.decode              |  119 +-
  accel/kvm/kvm-all.c                    |   36 +
  hw/acpi/aml-build.c                    |    2 +
  hw/acpi/generic_event_device.c         |   19 +
  hw/acpi/ghes.c                         |  448 ++++++
  hw/acpi/nvdimm.c                       |   10 +-
  hw/arm/aspeed.c                        |   78 ++
  hw/arm/virt-acpi-build.c               |   15 +
  hw/arm/virt.c                          |   23 +
  target/arm/cpu_tcg.c                   |    1 +
  target/arm/gdbstub.c                   |   22 +-
  target/arm/helper.c                    |    2 +-
  target/arm/kvm64.c                     |   77 ++
  target/arm/neon_helper.c               |   17 -
  target/arm/tlb_helper.c                |    2 +-
  target/arm/translate-a64.c             |  210 +--
  target/arm/translate-neon.inc.c        |  682 +++++++++-
  target/arm/translate.c                 | 2349 +++++++++++++++++---------------
  target/arm/vec_helper.c                |  240 +++-
  target/arm/vfp_helper.c                |    9 +-
  target/i386/kvm.c                      |   36 -
  MAINTAINERS                            |    9 +
  gdb-xml/arm-m-profile.xml              |   27 +
  hw/acpi/Kconfig                        |    4 +
  hw/acpi/Makefile.objs                  |    1 +
 files changed, 3402 insertions(+), 1445 deletions(-)
  create mode 100644 docs/specs/acpi_hest_ghes.rst
  create mode 100644 include/hw/acpi/ghes.h
  create mode 100644 hw/acpi/ghes.c
  create mode 100644 gdb-xml/arm-m-profile.xml
+ docs/system/arm/virt.rst              |   4 +-
+ include/hw/arm/exynos4210.h           |  50 ++--
+ include/hw/arm/xlnx-versal.h          |  16 ++
+ include/hw/arm/xlnx-zynqmp.h          |   4 +
+ include/hw/intc/exynos4210_combiner.h |  57 +++++
+ include/hw/intc/exynos4210_gic.h      |  43 ++++
+ include/hw/irq.h                      |   5 -
+ include/hw/misc/npcm7xx_gcr.h         |  30 +++
+ include/hw/misc/xlnx-versal-crl.h     | 235 +++++++++++++++++++
+ include/hw/timer/cadence_ttc.h        |  54 +++++
+ hw/arm/exynos4210.c                   | 430 ++++++++++++++++++++++++++++++----
+ hw/arm/npcm7xx_boards.c               |  24 +-
+ hw/arm/realview.c                     |  33 ++-
+ hw/arm/stellaris.c                    |  15 +-
+ hw/arm/virt.c                         |   7 +
+ hw/arm/xlnx-versal-virt.c             |   6 +-
+ hw/arm/xlnx-versal.c                  |  99 +++++++-
+ hw/arm/xlnx-zynqmp.c                  |  22 ++
+ hw/core/irq.c                         |  15 --
+ hw/intc/exynos4210_combiner.c         | 108 +--------
+ hw/intc/exynos4210_gic.c              | 344 +--------------------------
+ hw/misc/xlnx-versal-crl.c             | 421 +++++++++++++++++++++++++++++++++
+ hw/timer/cadence_ttc.c                |  32 +--
+ MAINTAINERS                           |   2 +-
+ hw/misc/meson.build                   |   1 +
+files changed, 1457 insertions(+), 600 deletions(-)
+ create mode 100644 include/hw/intc/exynos4210_combiner.h
+ create mode 100644 include/hw/intc/exynos4210_gic.h
+ create mode 100644 include/hw/misc/xlnx-versal-crl.h
+ create mode 100644 include/hw/timer/cadence_ttc.h
+ create mode 100644 hw/misc/xlnx-versal-crl.c

-[PULL 01/45] target/arm: Use correct GDB XML for M-profile cores
+Deleted patch
-GDB's remote protocol requires M-profile cores to use the feature
-name 'org.gnu.gdb.arm.m-profile' instead of the 'org.gnu.gdb.arm.core'
-feature used for A- and R-profile cores. We weren't doing this, which
-meant GDB treated our M-profile cores like A-profile ones. This mostly
-doesn't matter, but for instance means that it doesn't correctly
-handle backtraces where an M-profile exception frame is involved.
-Ship a copy of GDB's arm-m-profile.xml and use it on the M-profile
-cores.  The integer registers have the same offsets as the
-arm-core.xml, but register 25 is the M-profile XPSR rather than the
-A-profile CPSR, so we need to update arm_cpu_gdb_read_register() and
-arm_cpu_gdb_write_register() to handle XSPR reads and writes.
-Fixes: https://bugs.launchpad.net/qemu/+bug/1877136
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200507134755.13997-1-peter.maydell@linaro.org
----
- configure                 |  4 ++--
- target/arm/cpu_tcg.c      |  1 +
- target/arm/gdbstub.c      | 22 ++++++++++++++++++----
- gdb-xml/arm-m-profile.xml | 27 +++++++++++++++++++++++++++
-files changed, 48 insertions(+), 6 deletions(-)
- create mode 100644 gdb-xml/arm-m-profile.xml
-diff --git a/configure b/configure
-index XXXXXXX..XXXXXXX 100755
---- a/configure
-+++ b/configure
-@@ -XXX,XX +XXX,XX @@ case "$target_name" in
-     TARGET_SYSTBL_ABI=common,oabi
-     bflt="yes"
-     mttcg="yes"
--    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
-+    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
-   ;;
-   aarch64|aarch64_be)
-     TARGET_ARCH=aarch64
-     TARGET_BASE_ARCH=arm
-     bflt="yes"
-     mttcg="yes"
--    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
-+    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
-   ;;
-   cris)
-   ;;
-diff --git a/target/arm/cpu_tcg.c b/target/arm/cpu_tcg.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu_tcg.c
-+++ b/target/arm/cpu_tcg.c
-@@ -XXX,XX +XXX,XX @@ static void arm_v7m_class_init(ObjectClass *oc, void *data)
- #endif
-     cc->cpu_exec_interrupt = arm_v7m_cpu_exec_interrupt;
-+    cc->gdb_core_xml_file = "arm-m-profile.xml";
- }
- static const ARMCPUInfo arm_tcg_cpus[] = {
-diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/gdbstub.c
-+++ b/target/arm/gdbstub.c
-@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_read_register(CPUState *cs, GByteArray *mem_buf, int n)
-         }
-         return gdb_get_reg32(mem_buf, 0);
-     case 25:
--        /* CPSR */
--        return gdb_get_reg32(mem_buf, cpsr_read(env));
-+        /* CPSR, or XPSR for M-profile */
-+        if (arm_feature(env, ARM_FEATURE_M)) {
-+            return gdb_get_reg32(mem_buf, xpsr_read(env));
-+        } else {
-+            return gdb_get_reg32(mem_buf, cpsr_read(env));
-+        }
-     }
-     /* Unknown register.  */
-     return 0;
-@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
-         }
-         return 4;
-     case 25:
--        /* CPSR */
--        cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
-+        /* CPSR, or XPSR for M-profile */
-+        if (arm_feature(env, ARM_FEATURE_M)) {
-+            /*
-+             * Don't allow writing to XPSR.Exception as it can cause
-+             * a transition into or out of handler mode (it's not
-+             * writeable via the MSR insn so this is a reasonable
-+             * restriction). Other fields are safe to update.
-+             */
-+            xpsr_write(env, tmp, ~XPSR_EXCP);
-+        } else {
-+            cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
-+        }
-         return 4;
-     }
-     /* Unknown register.  */
-diff --git a/gdb-xml/arm-m-profile.xml b/gdb-xml/arm-m-profile.xml
-new file mode 100644
-index XXXXXXX..XXXXXXX
---- /dev/null
-+++ b/gdb-xml/arm-m-profile.xml
-@@ -XXX,XX +XXX,XX @@
-+<?xml version="1.0"?>
-+<!-- Copyright (C) 2010-2020 Free Software Foundation, Inc.
-+
-+     Copying and distribution of this file, with or without modification,
-+     are permitted in any medium without royalty provided the copyright
-+     notice and this notice are preserved.  -->
-+
-+<!DOCTYPE feature SYSTEM "gdb-target.dtd">
-+<feature name="org.gnu.gdb.arm.m-profile">
-+  <reg name="r0" bitsize="32"/>
-+  <reg name="r1" bitsize="32"/>
-+  <reg name="r2" bitsize="32"/>
-+  <reg name="r3" bitsize="32"/>
-+  <reg name="r4" bitsize="32"/>
-+  <reg name="r5" bitsize="32"/>
-+  <reg name="r6" bitsize="32"/>
-+  <reg name="r7" bitsize="32"/>
-+  <reg name="r8" bitsize="32"/>
-+  <reg name="r9" bitsize="32"/>
-+  <reg name="r10" bitsize="32"/>
-+  <reg name="r11" bitsize="32"/>
-+  <reg name="r12" bitsize="32"/>
-+  <reg name="sp" bitsize="32" type="data_ptr"/>
-+  <reg name="lr" bitsize="32"/>
-+  <reg name="pc" bitsize="32" type="code_ptr"/>
-+  <reg name="xpsr" bitsize="32" regnum="25"/>
-+</feature>
---
-.20.1

-[PULL 02/45] target/arm: Create gen_gvec_[us]sra
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-The functions eliminate duplication of the special cases for
-this operation.  They match up with the GVecGen2iFn typedef.
-Add out-of-line helpers.  We got away with only having inline
-expanders because the neon vector size is only 16 bytes, and
-we know that the inline expansion will always succeed.
-When we reuse this for SVE, tcg-gvec-op may decide to use an
-out-of-line helper due to longer vector lengths.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-2-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  10 +++
- target/arm/translate.h     |   7 +-
- target/arm/translate-a64.c |  15 +---
- target/arm/translate.c     | 161 ++++++++++++++++++++++---------------
- target/arm/vec_helper.c    |  25 ++++++
-files changed, 139 insertions(+), 79 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(neon_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_3(gvec_usra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_usra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_usra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_usra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
- #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ extern const GVecGen3 mls_op[4];
- extern const GVecGen3 cmtst_op[4];
- extern const GVecGen3 sshl_op[4];
- extern const GVecGen3 ushl_op[4];
--extern const GVecGen2i ssra_op[4];
--extern const GVecGen2i usra_op[4];
- extern const GVecGen2i sri_op[4];
- extern const GVecGen2i sli_op[4];
- extern const GVecGen4 uqadd_op[4];
-@@ -XXX,XX +XXX,XX @@ void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
-     switch (opcode) {
-     case 0x02: /* SSRA / USRA (accumulate) */
--        if (is_u) {
--            /* Shift count same as element size produces zero to add.  */
--            if (shift == 8 << size) {
--                goto done;
--            }
--            gen_gvec_op2i(s, is_q, rd, rn, shift, &usra_op[size]);
--        } else {
--            /* Shift count same as element size produces all sign to add.  */
--            if (shift == 8 << size) {
--                shift -= 1;
--            }
--            gen_gvec_op2i(s, is_q, rd, rn, shift, &ssra_op[size]);
--        }
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift,
-+                      is_u ? gen_gvec_usra : gen_gvec_ssra, size);
-         return;
-     case 0x08: /* SRI */
-         /* Shift count same as element size is valid but does nothing.  */
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_ssra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
-     tcg_gen_add_vec(vece, d, d, a);
- }
--static const TCGOpcode vecop_list_ssra[] = {
--    INDEX_op_sari_vec, INDEX_op_add_vec, 0
--};
-+void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sari_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen2i ops[4] = {
-+        { .fni8 = gen_ssra8_i64,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni8 = gen_ssra16_i64,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_ssra32_i32,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_ssra64_i64,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_b,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_64 },
-+    };
--const GVecGen2i ssra_op[4] = {
--    { .fni8 = gen_ssra8_i64,
--      .fniv = gen_ssra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_ssra,
--      .vece = MO_8 },
--    { .fni8 = gen_ssra16_i64,
--      .fniv = gen_ssra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_ssra,
--      .vece = MO_16 },
--    { .fni4 = gen_ssra32_i32,
--      .fniv = gen_ssra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_ssra,
--      .vece = MO_32 },
--    { .fni8 = gen_ssra64_i64,
--      .fniv = gen_ssra_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .opt_opc = vecop_list_ssra,
--      .load_dest = true,
--      .vece = MO_64 },
--};
-+    /* tszimm encoding produces immediates in the range [1..esize]. */
-+    tcg_debug_assert(shift > 0);
-+    tcg_debug_assert(shift <= (8 << vece));
-+
-+    /*
-+     * Shifts larger than the element size are architecturally valid.
-+     * Signed results in all sign bits.
-+     */
-+    shift = MIN(shift, (8 << vece) - 1);
-+    tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+}
- static void gen_usra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_usra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
-     tcg_gen_add_vec(vece, d, d, a);
- }
--static const TCGOpcode vecop_list_usra[] = {
--    INDEX_op_shri_vec, INDEX_op_add_vec, 0
--};
-+void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_shri_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen2i ops[4] = {
-+        { .fni8 = gen_usra8_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8, },
-+        { .fni8 = gen_usra16_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16, },
-+        { .fni4 = gen_usra32_i32,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32, },
-+        { .fni8 = gen_usra64_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64, },
-+    };
--const GVecGen2i usra_op[4] = {
--    { .fni8 = gen_usra8_i64,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_8, },
--    { .fni8 = gen_usra16_i64,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_16, },
--    { .fni4 = gen_usra32_i32,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_32, },
--    { .fni8 = gen_usra64_i64,
--      .fniv = gen_usra_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_64, },
--};
-+    /* tszimm encoding produces immediates in the range [1..esize]. */
-+    tcg_debug_assert(shift > 0);
-+    tcg_debug_assert(shift <= (8 << vece));
-+
-+    /*
-+     * Shifts larger than the element size are architecturally valid.
-+     * Unsigned results in all zeros as input to accumulate: nop.
-+     */
-+    if (shift < (8 << vece)) {
-+        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+    } else {
-+        /* Nop, but we do need to clear the tail. */
-+        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
-+    }
-+}
- static void gen_shr8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 case 1:  /* VSRA */
-                     /* Right shift comes here negative.  */
-                     shift = -shift;
--                    /* Shifts larger than the element size are architecturally
--                     * valid.  Unsigned results in all zeros; signed results
--                     * in all sign bits.
--                     */
--                    if (!u) {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        MIN(shift, (8 << size) - 1),
--                                        &ssra_op[size]);
--                    } else if (shift >= 8 << size) {
--                        /* rd += 0 */
-+                    if (u) {
-+                        gen_gvec_usra(size, rd_ofs, rm_ofs, shift,
-+                                      vec_size, vec_size);
-                     } else {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        shift, &usra_op[size]);
-+                        gen_gvec_ssra(size, rd_ofs, rm_ofs, shift,
-+                                      vec_size, vec_size);
-                     }
-                     return 0;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_sqsub_d)(void *vd, void *vq, void *vn,
-     clear_tail(d, oprsz, simd_maxsz(desc));
- }
-+
-+#define DO_SRA(NAME, TYPE)                              \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        d[i] += n[i] >> shift;                          \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_SRA(gvec_ssra_b, int8_t)
-+DO_SRA(gvec_ssra_h, int16_t)
-+DO_SRA(gvec_ssra_s, int32_t)
-+DO_SRA(gvec_ssra_d, int64_t)
-+
-+DO_SRA(gvec_usra_b, uint8_t)
-+DO_SRA(gvec_usra_h, uint16_t)
-+DO_SRA(gvec_usra_s, uint32_t)
-+DO_SRA(gvec_usra_d, uint64_t)
-+
-+#undef DO_SRA
-+
- /*
-  * Convert float16 to float32, raising no exceptions and
-  * preserving exceptional values, including SNaN.
---
-.20.1

-[PULL 20/45] hw/arm/virt: Introduce a RAS machine option
+[PULL 01/31] hw/arm/virt: Check for attempt to use TrustZone with KVM or HVF
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+It's not possible to provide the guest with the Security extensions
 (TrustZone) when using KVM or HVF, because the hardware
 virtualization extensions don't permit running EL3 guest code.
 However, we weren't checking for this combination, with the result
 that QEMU would assert if you tried it:
-RAS Virtualization feature is not supported now, so
+$ qemu-system-aarch64 -enable-kvm -machine virt,secure=on -cpu host -display none
-add a RAS machine option and disable it by default.
+Unexpected error in object_property_find_err() at ../../qom/object.c:1304:
 qemu-system-aarch64: Property 'host-arm-cpu.secure-memory' not found
 Aborted
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Check for this combination of options and report an error, in the
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+same way we already do for attempts to give a KVM or HVF guest the
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+Virtualization or MTE extensions. Now we will report:
-Reviewed-by: Jonathan Cameron <Jonathan.Cameron@huawei.com>
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+qemu-system-aarch64: mach-virt: KVM does not support providing Security extensions (TrustZone) to the guest CPU
-Message-id: 20200512030609.19593-3-gengdongjiu@huawei.com
 Resolves: https://gitlab.com/qemu-project/qemu/-/issues/961
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20220404155301.566542-1-peter.maydell@linaro.org
 ---
- include/hw/arm/virt.h |  1 +
+ hw/arm/virt.c | 7 +++++++
- hw/arm/virt.c         | 23 +++++++++++++++++++++++
+file changed, 7 insertions(+)
 files changed, 24 insertions(+)
-diff --git a/include/hw/arm/virt.h b/include/hw/arm/virt.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/virt.h
-+++ b/include/hw/arm/virt.h
-@@ -XXX,XX +XXX,XX @@ typedef struct {
-     bool highmem_ecam;
-     bool its;
-     bool virt;
-+    bool ras;
-     OnOffAuto acpi;
-     VirtGICType gic_version;
-     VirtIOMMUType iommu;
 diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt.c
 +++ b/hw/arm/virt.c
-@@ -XXX,XX +XXX,XX @@ static void virt_set_acpi(Object *obj, Visitor *v, const char *name,
+@@ -XXX,XX +XXX,XX @@ static void machvirt_init(MachineState *machine)
-     visit_type_OnOffAuto(v, name, &vms->acpi, errp);
+         exit(1);
- }
+     }
-+static bool virt_get_ras(Object *obj, Error **errp)
++    if (vms->secure && (kvm_enabled() || hvf_enabled())) {
-+{
++        error_report("mach-virt: %s does not support providing "
-+    VirtMachineState *vms = VIRT_MACHINE(obj);
++                     "Security extensions (TrustZone) to the guest CPU",
 +                     kvm_enabled() ? "KVM" : "HVF");
 +        exit(1);
 +    }
 +
-+    return vms->ras;
+     if (vms->virt && (kvm_enabled() || hvf_enabled())) {
-+}
+         error_report("mach-virt: %s does not support providing "
-+
+                      "Virtualization extensions to the guest CPU",
 +static void virt_set_ras(Object *obj, bool value, Error **errp)
 +{
 +    VirtMachineState *vms = VIRT_MACHINE(obj);
 +
 +    vms->ras = value;
 +}
 +
  static char *virt_get_gic_version(Object *obj, Error **errp)
  {
      VirtMachineState *vms = VIRT_MACHINE(obj);
@@ -XXX,XX +XXX,XX @@ static void virt_instance_init(Object *obj)
                                      "Valid values are none and smmuv3",
                                      NULL);
 +    /* Default disallows RAS instantiation */
 +    vms->ras = false;
 +    object_property_add_bool(obj, "ras", virt_get_ras,
 +                             virt_set_ras, NULL);
 +    object_property_set_description(obj, "ras",
 +                                    "Set on/off to enable/disable reporting host memory errors "
 +                                    "to a KVM guest using ACPI and guest external abort exceptions",
 +                                    NULL);
 +
      vms->irqmap = a15irqmap;
      virt_flash_create(vms);
 --
-.20.1
+.25.1

-[PULL 21/45] docs: APEI GHES generation and CPER record description
+[PULL 02/31] timer: cadence_ttc: Break out header file to allow embedding
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: "Edgar E. Iglesias" <edgar.iglesias@amd.com>
-Add APEI/GHES detailed design document
+Break out header file to allow embedding of the the TTC.
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Signed-off-by: Edgar E. Iglesias <edgar.iglesias@amd.com>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+Reviewed-by: Luc Michel <luc@lmichel.fr>
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+Reviewed-by: Francisco Iglesias <frasse.iglesias@gmail.com>
-Message-id: 20200512030609.19593-4-gengdongjiu@huawei.com
+Message-id: 20220331222017.2914409-2-edgar.iglesias@gmail.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- docs/specs/acpi_hest_ghes.rst | 110 ++++++++++++++++++++++++++++++++++
+ include/hw/timer/cadence_ttc.h | 54 ++++++++++++++++++++++++++++++++++
- docs/specs/index.rst          |   1 +
+ hw/timer/cadence_ttc.c         | 32 ++------------------
-files changed, 111 insertions(+)
+files changed, 56 insertions(+), 30 deletions(-)
- create mode 100644 docs/specs/acpi_hest_ghes.rst
+ create mode 100644 include/hw/timer/cadence_ttc.h
-diff --git a/docs/specs/acpi_hest_ghes.rst b/docs/specs/acpi_hest_ghes.rst
+diff --git a/include/hw/timer/cadence_ttc.h b/include/hw/timer/cadence_ttc.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/docs/specs/acpi_hest_ghes.rst
++++ b/include/hw/timer/cadence_ttc.h
 @@ -XXX,XX +XXX,XX @@
-+APEI tables generating and CPER record
++/*
-+======================================
++ * Xilinx Zynq cadence TTC model
 + *
 + * Copyright (c) 2011 Xilinx Inc.
 + * Copyright (c) 2012 Peter A.G. Crosthwaite (peter.crosthwaite@petalogix.com)
 + * Copyright (c) 2012 PetaLogix Pty Ltd.
 + * Written By Haibing Ma
 + *            M. Habib
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License
 + * as published by the Free Software Foundation; either version
 + * 2 of the License, or (at your option) any later version.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +#ifndef HW_TIMER_CADENCE_TTC_H
 +#define HW_TIMER_CADENCE_TTC_H
 +
-+..
++#include "hw/sysbus.h"
-+   Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
++#include "qemu/timer.h"
 +
-+   This work is licensed under the terms of the GNU GPL, version 2 or later.
++typedef struct {
-+   See the COPYING file in the top-level directory.
++    QEMUTimer *timer;
 +    int freq;
 +
-+Design Details
++    uint32_t reg_clock;
-+--------------
++    uint32_t reg_count;
 +    uint32_t reg_value;
 +    uint16_t reg_interval;
 +    uint16_t reg_match[3];
 +    uint32_t reg_intr;
 +    uint32_t reg_intr_en;
 +    uint32_t reg_event_ctrl;
 +    uint32_t reg_event;
 +
-+::
++    uint64_t cpu_time;
 +    unsigned int cpu_time_valid;
 +
-+         etc/acpi/tables                           etc/hardware_errors
++    qemu_irq irq;
-+      ====================                   ===============================
++} CadenceTimerState;
 +  + +--------------------------+            +----------------------------+
 +  | | HEST                     | +--------->|    error_block_address1    |------+
 +  | +--------------------------+ |          +----------------------------+      |
 +  | | GHES1                    | | +------->|    error_block_address2    |------+-+
 +  | +--------------------------+ | |        +----------------------------+      | |
 +  | | .................        | | |        |      ..............        |      | |
 +  | | error_status_address-----+-+ |        -----------------------------+      | |
 +  | | .................        |   |   +--->|    error_block_addressN    |------+-+---+
 +  | | read_ack_register--------+-+ |   |    +----------------------------+      | |   |
 +  | | read_ack_preserve        | +-+---+--->|     read_ack_register1     |      | |   |
 +  | | read_ack_write           |   |   |    +----------------------------+      | |   |
 +  + +--------------------------+   | +-+--->|     read_ack_register2     |      | |   |
 +  | | GHES2                    |   | | |    +----------------------------+      | |   |
 +  + +--------------------------+   | | |    |       .............        |      | |   |
 +  | | .................        |   | | |    +----------------------------+      | |   |
 +  | | error_status_address-----+---+ | | +->|     read_ack_registerN     |      | |   |
 +  | | .................        |     | | |  +----------------------------+      | |   |
 +  | | read_ack_register--------+-----+ | |  |Generic Error Status Block 1|<-----+ |   |
 +  | | read_ack_preserve        |       | |  |-+------------------------+-+        |   |
 +  | | read_ack_write           |       | |  | |          CPER          | |        |   |
 +  + +--------------------------|       | |  | |          CPER          | |        |   |
 +  | | ...............          |       | |  | |          ....          | |        |   |
 +  + +--------------------------+       | |  | |          CPER          | |        |   |
 +  | | GHESN                    |       | |  |-+------------------------+-|        |   |
 +  + +--------------------------+       | |  |Generic Error Status Block 2|<-------+   |
 +  | | .................        |       | |  |-+------------------------+-+            |
 +  | | error_status_address-----+-------+ |  | |           CPER         | |            |
 +  | | .................        |         |  | |           CPER         | |            |
 +  | | read_ack_register--------+---------+  | |           ....         | |            |
 +  | | read_ack_preserve        |            | |           CPER         | |            |
 +  | | read_ack_write           |            +-+------------------------+-+            |
 +  + +--------------------------+            |         ..........         |            |
 +                                            |----------------------------+            |
 +                                            |Generic Error Status Block N |<----------+
 +                                            |-+-------------------------+-+
 +                                            | |          CPER           | |
 +                                            | |          CPER           | |
 +                                            | |          ....           | |
 +                                            | |          CPER           | |
 +                                            +-+-------------------------+-+
 +
++#define TYPE_CADENCE_TTC "cadence_ttc"
++OBJECT_DECLARE_SIMPLE_TYPE(CadenceTTCState, CADENCE_TTC)
 +
-+(1) QEMU generates the ACPI HEST table. This table goes in the current
++struct CadenceTTCState {
-+    "etc/acpi/tables" fw_cfg blob. Each error source has different
++    SysBusDevice parent_obj;
 +    notification types.
 +
-+(2) A new fw_cfg blob called "etc/hardware_errors" is introduced. QEMU
++    MemoryRegion iomem;
-+    also needs to populate this blob. The "etc/hardware_errors" fw_cfg blob
++    CadenceTimerState timer[3];
-+    contains an address registers table and an Error Status Data Block table.
++};
 +
-+(3) The address registers table contains N Error Block Address entries
++#endif
-+    and N Read Ack Register entries. The size for each entry is 8-byte.
+diff --git a/hw/timer/cadence_ttc.c b/hw/timer/cadence_ttc.c
-+    The Error Status Data Block table contains N Error Status Data Block
+index XXXXXXX..XXXXXXX 100644
-+    entries. The size for each entry is 4096(0x1000) bytes. The total size
+--- a/hw/timer/cadence_ttc.c
-+    for the "etc/hardware_errors" fw_cfg blob is (N * 8 * 2 + N * 4096) bytes.
++++ b/hw/timer/cadence_ttc.c
-+    N is the number of the kinds of hardware error sources.
+@@ -XXX,XX +XXX,XX @@
  #include "qemu/timer.h"
  #include "qom/object.h"
 +#include "hw/timer/cadence_ttc.h"
 +
-+(4) QEMU generates the ACPI linker/loader script for the firmware. The
+ #ifdef CADENCE_TTC_ERR_DEBUG
-+    firmware pre-allocates memory for "etc/acpi/tables", "etc/hardware_errors"
+ #define DB_PRINT(...) do { \
-+    and copies blob contents there.
+     fprintf(stderr,  ": %s: ", __func__); \
-+
+@@ -XXX,XX +XXX,XX @@
-+(5) QEMU generates N ADD_POINTER commands, which patch addresses in the
+ #define CLOCK_CTRL_PS_EN    0x00000001
-+    "error_status_address" fields of the HEST table with a pointer to the
+ #define CLOCK_CTRL_PS_V     0x0000001e
-+    corresponding "address registers" in the "etc/hardware_errors" blob.
-+
+-typedef struct {
-+(6) QEMU generates N ADD_POINTER commands, which patch addresses in the
+-    QEMUTimer *timer;
-+    "read_ack_register" fields of the HEST table with a pointer to the
+-    int freq;
-+    corresponding "read_ack_register" within the "etc/hardware_errors" blob.
+-
-+
+-    uint32_t reg_clock;
-+(7) QEMU generates N ADD_POINTER commands for the firmware, which patch
+-    uint32_t reg_count;
-+    addresses in the "error_block_address" fields with a pointer to the
+-    uint32_t reg_value;
-+    respective "Error Status Data Block" in the "etc/hardware_errors" blob.
+-    uint16_t reg_interval;
-+
+-    uint16_t reg_match[3];
-+(8) QEMU defines a third and write-only fw_cfg blob which is called
+-    uint32_t reg_intr;
-+    "etc/hardware_errors_addr". Through that blob, the firmware can send back
+-    uint32_t reg_intr_en;
-+    the guest-side allocation addresses to QEMU. The "etc/hardware_errors_addr"
+-    uint32_t reg_event_ctrl;
-+    blob contains a 8-byte entry. QEMU generates a single WRITE_POINTER command
+-    uint32_t reg_event;
-+    for the firmware. The firmware will write back the start address of
+-
-+    "etc/hardware_errors" blob to the fw_cfg file "etc/hardware_errors_addr".
+-    uint64_t cpu_time;
-+
+-    unsigned int cpu_time_valid;
-+(9) When QEMU gets a SIGBUS from the kernel, QEMU writes CPER into corresponding
+-
-+    "Error Status Data Block", guest memory, and then injects platform specific
+-    qemu_irq irq;
-+    interrupt (in case of arm/virt machine it's Synchronous External Abort) as a
+-} CadenceTimerState;
-+    notification which is necessary for notifying the guest.
+-
-+
+-#define TYPE_CADENCE_TTC "cadence_ttc"
-+(10) This notification (in virtual hardware) will be handled by the guest
+-OBJECT_DECLARE_SIMPLE_TYPE(CadenceTTCState, CADENCE_TTC)
-+     kernel, on receiving notification, guest APEI driver could read the CPER error
+-
-+     and take appropriate action.
+-struct CadenceTTCState {
-+
+-    SysBusDevice parent_obj;
-+(11) kvm_arch_on_sigbus_vcpu() uses source_id as index in "etc/hardware_errors" to
+-
-+     find out "Error Status Data Block" entry corresponding to error source. So supported
+-    MemoryRegion iomem;
-+     source_id values should be assigned here and not be changed afterwards to make sure
+-    CadenceTimerState timer[3];
-+     that guest will write error into expected "Error Status Data Block" even if guest was
+-};
-+     migrated to a newer QEMU.
+-
-diff --git a/docs/specs/index.rst b/docs/specs/index.rst
+ static void cadence_timer_update(CadenceTimerState *s)
-index XXXXXXX..XXXXXXX 100644
+ {
---- a/docs/specs/index.rst
+     qemu_set_irq(s->irq, !!(s->reg_intr & s->reg_intr_en));
 +++ b/docs/specs/index.rst
@@ -XXX,XX +XXX,XX @@ Contents:
     ppc-spapr-xive
     acpi_hw_reduced_hotplug
     tpm
 +   acpi_hest_ghes
 --
-.20.1
+.25.1

-[PULL 27/45] target-arm: kvm64: handle SIGBUS signal from kernel or KVM
+[PULL 03/31] hw/arm/xlnx-zynqmp: Connect 4 TTC timers
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: "Edgar E. Iglesias" <edgar.iglesias@amd.com>
-Add a SIGBUS signal handler. In this handler, it checks the SIGBUS type,
+Connect the 4 TTC timers on the ZynqMP.
 translates the host VA delivered by host to guest PA, then fills this PA
 to guest APEI GHES memory, then notifies guest according to the SIGBUS
 type.
-When guest accesses the poisoned memory, it will generate a Synchronous
+Signed-off-by: Edgar E. Iglesias <edgar.iglesias@amd.com>
-External Abort(SEA). Then host kernel gets an APEI notification and calls
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-memory_failure() to unmapped the affected page in stage 2, finally
+Reviewed-by: Luc Michel <luc@lmichel.fr>
-returns to guest.
+Reviewed-by: Francisco Iglesias <frasse.iglesias@gmail.com>
+Message-id: 20220331222017.2914409-3-edgar.iglesias@gmail.com
 Guest continues to access the PG_hwpoison page, it will trap to KVM as
 stage2 fault, then a SIGBUS_MCEERR_AR synchronous signal is delivered to
 Qemu, Qemu records this error address into guest APEI GHES memory and
 notifes guest using Synchronous-External-Abort(SEA).
 In order to inject a vSEA, we introduce the kvm_inject_arm_sea() function
 in which we can setup the type of exception and the syndrome information.
 When switching to guest, the target vcpu will jump to the synchronous
 external abort vector table entry.
 The ESR_ELx.DFSC is set to synchronous external abort(0x10), and the
 ESR_ELx.FnV is set to not valid(0x1), which will tell guest that FAR is
 not valid and hold an UNKNOWN value. These values will be set to KVM
 register structures through KVM_SET_ONE_REG IOCTL.
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Message-id: 20200512030609.19593-10-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/sysemu/kvm.h    |  3 +-
+ include/hw/arm/xlnx-zynqmp.h |  4 ++++
- target/arm/cpu.h        |  4 +++
+ hw/arm/xlnx-zynqmp.c         | 22 ++++++++++++++++++++++
- target/arm/internals.h  |  5 +--
+files changed, 26 insertions(+)
  target/i386/cpu.h       |  2 ++
  target/arm/helper.c     |  2 +-
  target/arm/kvm64.c      | 77 +++++++++++++++++++++++++++++++++++++++++
  target/arm/tlb_helper.c |  2 +-
 files changed, 89 insertions(+), 6 deletions(-)
-diff --git a/include/sysemu/kvm.h b/include/sysemu/kvm.h
+diff --git a/include/hw/arm/xlnx-zynqmp.h b/include/hw/arm/xlnx-zynqmp.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/kvm.h
+--- a/include/hw/arm/xlnx-zynqmp.h
-+++ b/include/sysemu/kvm.h
++++ b/include/hw/arm/xlnx-zynqmp.h
-@@ -XXX,XX +XXX,XX @@ bool kvm_vcpu_id_is_valid(int vcpu_id);
+@@ -XXX,XX +XXX,XX @@
- /* Returns VCPU ID to be used on KVM_CREATE_VCPU ioctl() */
+ #include "hw/or-irq.h"
- unsigned long kvm_arch_vcpu_id(CPUState *cpu);
+ #include "hw/misc/xlnx-zynqmp-apu-ctrl.h"
+ #include "hw/misc/xlnx-zynqmp-crf.h"
--#ifdef TARGET_I386
++#include "hw/timer/cadence_ttc.h"
--#define KVM_HAVE_MCE_INJECTION 1
-+#ifdef KVM_HAVE_MCE_INJECTION
+ #define TYPE_XLNX_ZYNQMP "xlnx-zynqmp"
- void kvm_arch_on_sigbus_vcpu(CPUState *cpu, int code, void *addr);
+ OBJECT_DECLARE_SIMPLE_TYPE(XlnxZynqMPState, XLNX_ZYNQMP)
- #endif
+@@ -XXX,XX +XXX,XX @@ OBJECT_DECLARE_SIMPLE_TYPE(XlnxZynqMPState, XLNX_ZYNQMP)
+ #define XLNX_ZYNQMP_MAX_RAM_SIZE (XLNX_ZYNQMP_MAX_LOW_RAM_SIZE + \
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+                                   XLNX_ZYNQMP_MAX_HIGH_RAM_SIZE)
 +#define XLNX_ZYNQMP_NUM_TTC 4
 +
  /*
   * Unimplemented mmio regions needed to boot some images.
   */
@@ -XXX,XX +XXX,XX @@ struct XlnxZynqMPState {
      qemu_or_irq qspi_irq_orgate;
      XlnxZynqMPAPUCtrl apu_ctrl;
      XlnxZynqMPCRF crf;
 +    CadenceTTCState ttc[XLNX_ZYNQMP_NUM_TTC];
      char *boot_cpu;
      ARMCPU *boot_cpu_ptr;
 diff --git a/hw/arm/xlnx-zynqmp.c b/hw/arm/xlnx-zynqmp.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/hw/arm/xlnx-zynqmp.c
-+++ b/target/arm/cpu.h
++++ b/hw/arm/xlnx-zynqmp.c
 @@ -XXX,XX +XXX,XX @@
- /* ARM processors have a weak memory model */
+ #define APU_ADDR            0xfd5c0000
- #define TCG_GUEST_DEFAULT_MO      (0)
+ #define APU_IRQ             153
-+#ifdef TARGET_AARCH64
++#define TTC0_ADDR           0xFF110000
-+#define KVM_HAVE_MCE_INJECTION 1
++#define TTC0_IRQ            36
 +#endif
 +
- #define EXCP_UDEF            1   /* undefined instruction */
+ #define IPI_ADDR            0xFF300000
- #define EXCP_SWI             2   /* software interrupt */
+ #define IPI_IRQ             64
- #define EXCP_PREFETCH_ABORT  3
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+@@ -XXX,XX +XXX,XX @@ static void xlnx_zynqmp_create_crf(XlnxZynqMPState *s, qemu_irq *gic)
-index XXXXXXX..XXXXXXX 100644
+     sysbus_connect_irq(sbd, 0, gic[CRF_IRQ]);
 --- a/target/arm/internals.h
 +++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline uint32_t syn_insn_abort(int same_el, int ea, int s1ptw, int fsc)
          | ARM_EL_IL | (ea << 9) | (s1ptw << 7) | fsc;
  }
--static inline uint32_t syn_data_abort_no_iss(int same_el,
++static void xlnx_zynqmp_create_ttc(XlnxZynqMPState *s, qemu_irq *gic)
-+static inline uint32_t syn_data_abort_no_iss(int same_el, int fnv,
++{
-                                              int ea, int cm, int s1ptw,
++    SysBusDevice *sbd;
-                                              int wnr, int fsc)
++    int i, irq;
  {
      return (EC_DATAABORT << ARM_EL_EC_SHIFT) | (same_el << ARM_EL_EC_SHIFT)
             | ARM_EL_IL
 -           | (ea << 9) | (cm << 8) | (s1ptw << 7) | (wnr << 6) | fsc;
 +           | (fnv << 10) | (ea << 9) | (cm << 8) | (s1ptw << 7)
 +           | (wnr << 6) | fsc;
  }
  static inline uint32_t syn_data_abort_with_iss(int same_el,
 diff --git a/target/i386/cpu.h b/target/i386/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/cpu.h
 +++ b/target/i386/cpu.h
@@ -XXX,XX +XXX,XX @@
  /* The x86 has a strong memory model with some store-after-load re-ordering */
  #define TCG_GUEST_DEFAULT_MO      (TCG_MO_ALL & ~TCG_MO_ST_LD)
 +#define KVM_HAVE_MCE_INJECTION 1
 +
- /* Maximum instruction code size */
++    for (i = 0; i < XLNX_ZYNQMP_NUM_TTC; i++) {
- #define TARGET_MAX_INSN_SIZE 16
++        object_initialize_child(OBJECT(s), "ttc[*]", &s->ttc[i],
++                                TYPE_CADENCE_TTC);
-diff --git a/target/arm/helper.c b/target/arm/helper.c
++        sbd = SYS_BUS_DEVICE(&s->ttc[i]);
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
               * Report exception with ESR indicating a fault due to a
               * translation table walk for a cache maintenance instruction.
               */
 -            syn = syn_data_abort_no_iss(current_el == target_el,
 +            syn = syn_data_abort_no_iss(current_el == target_el, 0,
                                          fi.ea, 1, fi.s1ptw, 1, fsc);
              env->exception.vaddress = value;
              env->exception.fsr = fsr;
 diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/kvm64.c
 +++ b/target/arm/kvm64.c
@@ -XXX,XX +XXX,XX @@
  #include "sysemu/kvm_int.h"
  #include "kvm_arm.h"
  #include "internals.h"
 +#include "hw/acpi/acpi.h"
 +#include "hw/acpi/ghes.h"
 +#include "hw/arm/virt.h"
  static bool have_guest_debug;
@@ -XXX,XX +XXX,XX @@ int kvm_arm_cpreg_level(uint64_t regidx)
      return KVM_PUT_RUNTIME_STATE;
  }
 +/* Callers must hold the iothread mutex lock */
 +static void kvm_inject_arm_sea(CPUState *c)
 +{
 +    ARMCPU *cpu = ARM_CPU(c);
 +    CPUARMState *env = &cpu->env;
 +    CPUClass *cc = CPU_GET_CLASS(c);
 +    uint32_t esr;
 +    bool same_el;
 +
-+    c->exception_index = EXCP_DATA_ABORT;
++        sysbus_realize(sbd, &error_fatal);
-+    env->exception.target_el = 1;
++        sysbus_mmio_map(sbd, 0, TTC0_ADDR + i * 0x10000);
-+
++        for (irq = 0; irq < 3; irq++) {
-+    /*
++            sysbus_connect_irq(sbd, irq, gic[TTC0_IRQ + i * 3 + irq]);
 +     * Set the DFSC to synchronous external abort and set FnV to not valid,
 +     * this will tell guest the FAR_ELx is UNKNOWN for this abort.
 +     */
 +    same_el = arm_current_el(env) == env->exception.target_el;
 +    esr = syn_data_abort_no_iss(same_el, 1, 0, 0, 0, 0, 0x10);
 +
 +    env->exception.syndrome = esr;
 +
 +    cc->do_interrupt(c);
 +}
 +
  #define AARCH64_CORE_REG(x)   (KVM_REG_ARM64 | KVM_REG_SIZE_U64 | \
                   KVM_REG_ARM_CORE | KVM_REG_ARM_CORE_REG(x))
@@ -XXX,XX +XXX,XX @@ int kvm_arch_get_registers(CPUState *cs)
      return ret;
  }
 +void kvm_arch_on_sigbus_vcpu(CPUState *c, int code, void *addr)
 +{
 +    ram_addr_t ram_addr;
 +    hwaddr paddr;
 +    Object *obj = qdev_get_machine();
 +    VirtMachineState *vms = VIRT_MACHINE(obj);
 +    bool acpi_enabled = virt_is_acpi_enabled(vms);
 +
 +    assert(code == BUS_MCEERR_AR || code == BUS_MCEERR_AO);
 +
 +    if (acpi_enabled && addr &&
 +            object_property_get_bool(obj, "ras", NULL)) {
 +        ram_addr = qemu_ram_addr_from_host(addr);
 +        if (ram_addr != RAM_ADDR_INVALID &&
 +            kvm_physical_memory_addr_from_host(c->kvm_state, addr, &paddr)) {
 +            kvm_hwpoison_page_add(ram_addr);
 +            /*
 +             * If this is a BUS_MCEERR_AR, we know we have been called
 +             * synchronously from the vCPU thread, so we can easily
 +             * synchronize the state and inject an error.
 +             *
 +             * TODO: we currently don't tell the guest at all about
 +             * BUS_MCEERR_AO. In that case we might either be being
 +             * called synchronously from the vCPU thread, or a bit
 +             * later from the main thread, so doing the injection of
 +             * the error would be more complicated.
 +             */
 +            if (code == BUS_MCEERR_AR) {
 +                kvm_cpu_synchronize_state(c);
 +                if (!acpi_ghes_record_errors(ACPI_HEST_SRC_ID_SEA, paddr)) {
 +                    kvm_inject_arm_sea(c);
 +                } else {
 +                    error_report("failed to record the error");
 +                    abort();
 +                }
 +            }
 +            return;
 +        }
-+        if (code == BUS_MCEERR_AO) {
-+            error_report("Hardware memory error at addr %p for memory used by "
-+                "QEMU itself instead of guest system!", addr);
-+        }
-+    }
-+
-+    if (code == BUS_MCEERR_AR) {
-+        error_report("Hardware memory error!");
-+        exit(1);
 +    }
 +}
 +
- /* C6.6.29 BRK instruction */
+ static void xlnx_zynqmp_create_unimp_mmio(XlnxZynqMPState *s)
- static const uint32_t brk_insn = 0xd4200000;
+ {
+     static const struct UnimpInfo {
-diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
+@@ -XXX,XX +XXX,XX @@ static void xlnx_zynqmp_realize(DeviceState *dev, Error **errp)
-index XXXXXXX..XXXXXXX 100644
+     xlnx_zynqmp_create_efuse(s, gic_spi);
---- a/target/arm/tlb_helper.c
+     xlnx_zynqmp_create_apu_ctrl(s, gic_spi);
-+++ b/target/arm/tlb_helper.c
+     xlnx_zynqmp_create_crf(s, gic_spi);
-@@ -XXX,XX +XXX,XX @@ static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
++    xlnx_zynqmp_create_ttc(s, gic_spi);
-      * ISV field.
+     xlnx_zynqmp_create_unimp_mmio(s);
-      */
-     if (!(template_syn & ARM_EL_ISV) || target_el != 2 || s1ptw) {
+     for (i = 0; i < XLNX_ZYNQMP_NUM_GDMA_CH; i++) {
 -        syn = syn_data_abort_no_iss(same_el,
 +        syn = syn_data_abort_no_iss(same_el, 0,
                                      ea, 0, s1ptw, is_write, fsc);
      } else {
          /*
 --
-.20.1
+.25.1

-[PULL 18/45] aspeed: Add support for the sonorapass-bmc board
+[PULL 04/31] hw/arm: versal: Create an APU CPU Cluster
-From: Patrick Williams <patrick@stwcx.xyz>
+From: "Edgar E. Iglesias" <edgar.iglesias@amd.com>
-Sonora Pass is a 2 socket x86 motherboard designed by Facebook
+Create an APU CPU Cluster. This is in preparation to add the RPU.
 and supported by OpenBMC.  Strapping configuration was obtained
 from hardware and i2c configuration is based on dts found at:
-https://github.com/facebook/openbmc-linux/blob/1633c87b8ba7c162095787c988979b748ba65dc8/arch/arm/boot/dts/aspeed-bmc-facebook-sonorapass.dts
+Signed-off-by: Edgar E. Iglesias <edgar.iglesias@amd.com>
+Reviewed-by: Francisco Iglesias <francisco.iglesias@amd.com>
-Booted a test image of http://github.com/facebook/openbmc to login
+Message-id: 20220406174303.2022038-2-edgar.iglesias@xilinx.com
 prompt.
 Signed-off-by: Patrick Williams <patrick@stwcx.xyz>
 Reviewed-by: Amithash Prasad <amithash@fb.com>
 Reviewed-by: Cédric Le Goater <clg@kaod.org>
 [PMM: fixed block comment style nit]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/aspeed.c | 78 +++++++++++++++++++++++++++++++++++++++++++++++++
+ include/hw/arm/xlnx-versal.h | 2 ++
-file changed, 78 insertions(+)
+ hw/arm/xlnx-versal.c         | 9 ++++++++-
 files changed, 10 insertions(+), 1 deletion(-)
-diff --git a/hw/arm/aspeed.c b/hw/arm/aspeed.c
+diff --git a/include/hw/arm/xlnx-versal.h b/include/hw/arm/xlnx-versal.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/aspeed.c
+--- a/include/hw/arm/xlnx-versal.h
-+++ b/hw/arm/aspeed.c
++++ b/include/hw/arm/xlnx-versal.h
-@@ -XXX,XX +XXX,XX @@ struct AspeedBoardState {
+@@ -XXX,XX +XXX,XX @@
-         SCU_AST2500_HW_STRAP_ACPI_ENABLE |                              \
-         SCU_HW_STRAP_SPI_MODE(SCU_HW_STRAP_SPI_MASTER))
+ #include "hw/sysbus.h"
+ #include "hw/arm/boot.h"
-+/* Sonorapass hardware value: 0xF100D216 */
++#include "hw/cpu/cluster.h"
-+#define SONORAPASS_BMC_HW_STRAP1 (                                      \
+ #include "hw/or-irq.h"
-+        SCU_AST2500_HW_STRAP_SPI_AUTOFETCH_ENABLE |                     \
+ #include "hw/sd/sdhci.h"
-+        SCU_AST2500_HW_STRAP_GPIO_STRAP_ENABLE |                        \
+ #include "hw/intc/arm_gicv3.h"
-+        SCU_AST2500_HW_STRAP_UART_DEBUG |                               \
+@@ -XXX,XX +XXX,XX @@ struct Versal {
-+        SCU_AST2500_HW_STRAP_RESERVED28 |                               \
+     struct {
-+        SCU_AST2500_HW_STRAP_DDR4_ENABLE |                              \
+         struct {
-+        SCU_HW_STRAP_VGA_CLASS_CODE |                                   \
+             MemoryRegion mr;
-+        SCU_HW_STRAP_LPC_RESET_PIN |                                    \
++            CPUClusterState cluster;
-+        SCU_HW_STRAP_SPI_MODE(SCU_HW_STRAP_SPI_MASTER) |                \
+             ARMCPU cpu[XLNX_VERSAL_NR_ACPUS];
-+        SCU_AST2500_HW_STRAP_SET_AXI_AHB_RATIO(AXI_AHB_RATIO_2_1) |     \
+             GICv3State gic;
-+        SCU_HW_STRAP_VGA_BIOS_ROM |                                     \
+         } apu;
-+        SCU_HW_STRAP_VGA_SIZE_SET(VGA_16M_DRAM) |                       \
+diff --git a/hw/arm/xlnx-versal.c b/hw/arm/xlnx-versal.c
-+        SCU_AST2500_HW_STRAP_RESERVED1)
+index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/xlnx-versal.c
 +++ b/hw/arm/xlnx-versal.c
@@ -XXX,XX +XXX,XX @@ static void versal_create_apu_cpus(Versal *s)
  {
      int i;
 +    object_initialize_child(OBJECT(s), "apu-cluster", &s->fpd.apu.cluster,
 +                            TYPE_CPU_CLUSTER);
 +    qdev_prop_set_uint32(DEVICE(&s->fpd.apu.cluster), "cluster-id", 0);
 +
- /* Swift hardware value: 0xF11AD206 */
+     for (i = 0; i < ARRAY_SIZE(s->fpd.apu.cpu); i++) {
- #define SWIFT_BMC_HW_STRAP1 (                                           \
+         Object *obj;
-         AST2500_HW_STRAP1_DEFAULTS |                                    \
-@@ -XXX,XX +XXX,XX @@ static void swift_bmc_i2c_init(AspeedBoardState *bmc)
+-        object_initialize_child(OBJECT(s), "apu-cpu[*]", &s->fpd.apu.cpu[i],
-     i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 12), "tmp105", 0x4a);
++        object_initialize_child(OBJECT(&s->fpd.apu.cluster),
 +                                "apu-cpu[*]", &s->fpd.apu.cpu[i],
                                  XLNX_VERSAL_ACPU_TYPE);
          obj = OBJECT(&s->fpd.apu.cpu[i]);
          if (i) {
@@ -XXX,XX +XXX,XX @@ static void versal_create_apu_cpus(Versal *s)
                                   &error_abort);
          qdev_realize(DEVICE(obj), NULL, &error_fatal);
      }
 +
 +    qdev_realize(DEVICE(&s->fpd.apu.cluster), NULL, &error_fatal);
  }
-+static void sonorapass_bmc_i2c_init(AspeedBoardState *bmc)
+ static void versal_create_apu_gic(Versal *s, qemu_irq *pic)
 +{
 +    AspeedSoCState *soc = &bmc->soc;
 +
 +    /* bus 2 : */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 2), "tmp105", 0x48);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 2), "tmp105", 0x49);
 +    /* bus 2 : pca9546 @ 0x73 */
 +
 +    /* bus 3 : pca9548 @ 0x70 */
 +
 +    /* bus 4 : */
 +    uint8_t *eeprom4_54 = g_malloc0(8 * 1024);
 +    smbus_eeprom_init_one(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), 0x54,
 +                          eeprom4_54);
 +    /* PCA9539 @ 0x76, but PCA9552 is compatible */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), "pca9552", 0x76);
 +    /* PCA9539 @ 0x77, but PCA9552 is compatible */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), "pca9552", 0x77);
 +
 +    /* bus 6 : */
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 6), "tmp105", 0x48);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 6), "tmp105", 0x49);
 +    /* bus 6 : pca9546 @ 0x73 */
 +
 +    /* bus 8 : */
 +    uint8_t *eeprom8_56 = g_malloc0(8 * 1024);
 +    smbus_eeprom_init_one(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), 0x56,
 +                          eeprom8_56);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), "pca9552", 0x60);
 +    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), "pca9552", 0x61);
 +    /* bus 8 : adc128d818 @ 0x1d */
 +    /* bus 8 : adc128d818 @ 0x1f */
 +
 +    /*
 +     * bus 13 : pca9548 @ 0x71
 +     *      - channel 3:
 +     *          - tmm421 @ 0x4c
 +     *          - tmp421 @ 0x4e
 +     *          - tmp421 @ 0x4f
 +     */
 +
 +}
 +
  static void witherspoon_bmc_i2c_init(AspeedBoardState *bmc)
  {
      AspeedSoCState *soc = &bmc->soc;
@@ -XXX,XX +XXX,XX @@ static void aspeed_machine_romulus_class_init(ObjectClass *oc, void *data)
      mc->default_ram_size       = 512 * MiB;
  };
 +static void aspeed_machine_sonorapass_class_init(ObjectClass *oc, void *data)
 +{
 +    MachineClass *mc = MACHINE_CLASS(oc);
 +    AspeedMachineClass *amc = ASPEED_MACHINE_CLASS(oc);
 +
 +    mc->desc       = "OCP SonoraPass BMC (ARM1176)";
 +    amc->soc_name  = "ast2500-a1";
 +    amc->hw_strap1 = SONORAPASS_BMC_HW_STRAP1;
 +    amc->fmc_model = "mx66l1g45g";
 +    amc->spi_model = "mx66l1g45g";
 +    amc->num_cs    = 2;
 +    amc->i2c_init  = sonorapass_bmc_i2c_init;
 +    mc->default_ram_size       = 512 * MiB;
 +};
 +
  static void aspeed_machine_swift_class_init(ObjectClass *oc, void *data)
  {
      MachineClass *mc = MACHINE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static const TypeInfo aspeed_machine_types[] = {
          .name          = MACHINE_TYPE_NAME("swift-bmc"),
          .parent        = TYPE_ASPEED_MACHINE,
          .class_init    = aspeed_machine_swift_class_init,
 +    }, {
 +        .name          = MACHINE_TYPE_NAME("sonorapass-bmc"),
 +        .parent        = TYPE_ASPEED_MACHINE,
 +        .class_init    = aspeed_machine_sonorapass_class_init,
      }, {
          .name          = MACHINE_TYPE_NAME("witherspoon-bmc"),
          .parent        = TYPE_ASPEED_MACHINE,
 --
-.20.1
+.25.1

-[PULL 14/45] target/arm: Pass pointer to qc to qrdmla/qrdmls
+[PULL 05/31] hw/arm: versal: Add the Cortex-R5Fs
-From: Richard Henderson <richard.henderson@linaro.org>
+From: "Edgar E. Iglesias" <edgar.iglesias@amd.com>
-Pass a pointer directly to env->vfp.qc[0], rather than env.
+Add the Cortex-R5Fs of the Versal RPU (Real-time Processing Unit)
-This will allow SVE2, which does not modify QC, to pass a
+subsystem.
 pointer to dummy storage.
-Change the return type of inl_qrdml.h_s16 to match the
+Signed-off-by: Edgar E. Iglesias <edgar.iglesias@amd.com>
-sense of the operation: signed.
+Reviewed-by: Francisco Iglesias <francisco.iglesias@amd.com>
+Message-id: 20220406174303.2022038-3-edgar.iglesias@xilinx.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-14-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.c  | 18 ++++++++---
+ include/hw/arm/xlnx-versal.h | 10 ++++++++++
- target/arm/vec_helper.c | 70 +++++++++++++++++++++++------------------
+ hw/arm/xlnx-versal-virt.c    |  6 +++---
-files changed, 54 insertions(+), 34 deletions(-)
+ hw/arm/xlnx-versal.c         | 36 ++++++++++++++++++++++++++++++++++++
 files changed, 49 insertions(+), 3 deletions(-)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+diff --git a/include/hw/arm/xlnx-versal.h b/include/hw/arm/xlnx-versal.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/include/hw/arm/xlnx-versal.h
-+++ b/target/arm/translate.c
++++ b/include/hw/arm/xlnx-versal.h
-@@ -XXX,XX +XXX,XX @@ static const uint8_t neon_2rm_sizes[] = {
+@@ -XXX,XX +XXX,XX @@
-     [NEON_2RM_VCVT_UF] = 0x4,
+ OBJECT_DECLARE_SIMPLE_TYPE(Versal, XLNX_VERSAL)
- };
+ #define XLNX_VERSAL_NR_ACPUS   2
-+static void gen_gvec_fn3_qc(uint32_t rd_ofs, uint32_t rn_ofs, uint32_t rm_ofs,
++#define XLNX_VERSAL_NR_RCPUS   2
-+                            uint32_t opr_sz, uint32_t max_sz,
+ #define XLNX_VERSAL_NR_UARTS   2
-+                            gen_helper_gvec_3_ptr *fn)
+ #define XLNX_VERSAL_NR_GEMS    2
  #define XLNX_VERSAL_NR_ADMAS   8
@@ -XXX,XX +XXX,XX @@ struct Versal {
              VersalUsb2 usb;
          } iou;
 +        /* Real-time Processing Unit.  */
 +        struct {
 +            MemoryRegion mr;
 +            MemoryRegion mr_ps_alias;
 +
 +            CPUClusterState cluster;
 +            ARMCPU cpu[XLNX_VERSAL_NR_RCPUS];
 +        } rpu;
 +
          struct {
              qemu_or_irq irq_orgate;
              XlnxXramCtrl ctrl[XLNX_VERSAL_NR_XRAM];
 diff --git a/hw/arm/xlnx-versal-virt.c b/hw/arm/xlnx-versal-virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/xlnx-versal-virt.c
 +++ b/hw/arm/xlnx-versal-virt.c
@@ -XXX,XX +XXX,XX @@ static void versal_virt_machine_class_init(ObjectClass *oc, void *data)
      mc->desc = "Xilinx Versal Virtual development board";
      mc->init = versal_virt_init;
 -    mc->min_cpus = XLNX_VERSAL_NR_ACPUS;
 -    mc->max_cpus = XLNX_VERSAL_NR_ACPUS;
 -    mc->default_cpus = XLNX_VERSAL_NR_ACPUS;
 +    mc->min_cpus = XLNX_VERSAL_NR_ACPUS + XLNX_VERSAL_NR_RCPUS;
 +    mc->max_cpus = XLNX_VERSAL_NR_ACPUS + XLNX_VERSAL_NR_RCPUS;
 +    mc->default_cpus = XLNX_VERSAL_NR_ACPUS + XLNX_VERSAL_NR_RCPUS;
      mc->no_cdrom = true;
      mc->default_ram_id = "ddr";
  }
 diff --git a/hw/arm/xlnx-versal.c b/hw/arm/xlnx-versal.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/xlnx-versal.c
 +++ b/hw/arm/xlnx-versal.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/sysbus.h"
  #define XLNX_VERSAL_ACPU_TYPE ARM_CPU_TYPE_NAME("cortex-a72")
 +#define XLNX_VERSAL_RCPU_TYPE ARM_CPU_TYPE_NAME("cortex-r5f")
  #define GEM_REVISION        0x40070106
  #define VERSAL_NUM_PMC_APB_IRQS 3
@@ -XXX,XX +XXX,XX @@ static void versal_create_apu_gic(Versal *s, qemu_irq *pic)
      }
  }
 +static void versal_create_rpu_cpus(Versal *s)
 +{
-+    TCGv_ptr qc_ptr = tcg_temp_new_ptr();
++    int i;
 +
-+    tcg_gen_addi_ptr(qc_ptr, cpu_env, offsetof(CPUARMState, vfp.qc));
++    object_initialize_child(OBJECT(s), "rpu-cluster", &s->lpd.rpu.cluster,
-+    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, qc_ptr,
++                            TYPE_CPU_CLUSTER);
-+                       opr_sz, max_sz, 0, fn);
++    qdev_prop_set_uint32(DEVICE(&s->lpd.rpu.cluster), "cluster-id", 1);
-+    tcg_temp_free_ptr(qc_ptr);
++
 +    for (i = 0; i < ARRAY_SIZE(s->lpd.rpu.cpu); i++) {
 +        Object *obj;
 +
 +        object_initialize_child(OBJECT(&s->lpd.rpu.cluster),
 +                                "rpu-cpu[*]", &s->lpd.rpu.cpu[i],
 +                                XLNX_VERSAL_RCPU_TYPE);
 +        obj = OBJECT(&s->lpd.rpu.cpu[i]);
 +        object_property_set_bool(obj, "start-powered-off", true,
 +                                 &error_abort);
 +
 +        object_property_set_int(obj, "mp-affinity", 0x100 | i, &error_abort);
 +        object_property_set_int(obj, "core-count", ARRAY_SIZE(s->lpd.rpu.cpu),
 +                                &error_abort);
 +        object_property_set_link(obj, "memory", OBJECT(&s->lpd.rpu.mr),
 +                                 &error_abort);
 +        qdev_realize(DEVICE(obj), NULL, &error_fatal);
 +    }
 +
 +    qdev_realize(DEVICE(&s->lpd.rpu.cluster), NULL, &error_fatal);
 +}
 +
- void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ static void versal_create_uarts(Versal *s, qemu_irq *pic)
                            uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
  {
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     int i;
-         gen_helper_gvec_qrdmlah_s16, gen_helper_gvec_qrdmlah_s32
+@@ -XXX,XX +XXX,XX @@ static void versal_realize(DeviceState *dev, Error **errp)
-     };
-     tcg_debug_assert(vece >= 1 && vece <= 2);
+     versal_create_apu_cpus(s);
--    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
+     versal_create_apu_gic(s, pic);
--                       opr_sz, max_sz, 0, fns[vece - 1]);
++    versal_create_rpu_cpus(s);
-+    gen_gvec_fn3_qc(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, fns[vece - 1]);
+     versal_create_uarts(s, pic);
      versal_create_usbs(s, pic);
      versal_create_gems(s, pic);
@@ -XXX,XX +XXX,XX @@ static void versal_realize(DeviceState *dev, Error **errp)
      memory_region_add_subregion_overlap(&s->mr_ps, MM_OCM, &s->lpd.mr_ocm, 0);
      memory_region_add_subregion_overlap(&s->fpd.apu.mr, 0, &s->mr_ps, 0);
 +    memory_region_add_subregion_overlap(&s->lpd.rpu.mr, 0,
 +                                        &s->lpd.rpu.mr_ps_alias, 0);
  }
- void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ static void versal_init(Object *obj)
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+@@ -XXX,XX +XXX,XX @@ static void versal_init(Object *obj)
-         gen_helper_gvec_qrdmlsh_s16, gen_helper_gvec_qrdmlsh_s32
+     Versal *s = XLNX_VERSAL(obj);
-     };
-     tcg_debug_assert(vece >= 1 && vece <= 2);
+     memory_region_init(&s->fpd.apu.mr, obj, "mr-apu", UINT64_MAX);
--    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
++    memory_region_init(&s->lpd.rpu.mr, obj, "mr-rpu", UINT64_MAX);
--                       opr_sz, max_sz, 0, fns[vece - 1]);
+     memory_region_init(&s->mr_ps, obj, "mr-ps-switch", UINT64_MAX);
-+    gen_gvec_fn3_qc(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, fns[vece - 1]);
++    memory_region_init_alias(&s->lpd.rpu.mr_ps_alias, OBJECT(s),
 +                             "mr-rpu-ps-alias", &s->mr_ps, 0, UINT64_MAX);
  }
- #define GEN_CMP0(NAME, COND)                                            \
+ static Property versal_properties[] = {
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@
  #define H4(x)  (x)
  #endif
 -#define SET_QC() env->vfp.qc[0] = 1
 -
  static void clear_tail(void *vd, uintptr_t opr_sz, uintptr_t max_sz)
  {
      uint64_t *d = vd + opr_sz;
@@ -XXX,XX +XXX,XX @@ static void clear_tail(void *vd, uintptr_t opr_sz, uintptr_t max_sz)
  }
  /* Signed saturating rounding doubling multiply-accumulate high half, 16-bit */
 -static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
 -                                int16_t src2, int16_t src3)
 +static int16_t inl_qrdmlah_s16(int16_t src1, int16_t src2,
 +                               int16_t src3, uint32_t *sat)
  {
      /* Simplify:
       * = ((a3 << 16) + ((e1 * e2) << 1) + (1 << 15)) >> 16
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
      ret = ((int32_t)src3 << 15) + ret + (1 << 14);
      ret >>= 15;
      if (ret != (int16_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? -0x8000 : 0x7fff);
      }
      return ret;
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
  uint32_t HELPER(neon_qrdmlah_s16)(CPUARMState *env, uint32_t src1,
                                    uint32_t src2, uint32_t src3)
  {
 -    uint16_t e1 = inl_qrdmlah_s16(env, src1, src2, src3);
 -    uint16_t e2 = inl_qrdmlah_s16(env, src1 >> 16, src2 >> 16, src3 >> 16);
 +    uint32_t *sat = &env->vfp.qc[0];
 +    uint16_t e1 = inl_qrdmlah_s16(src1, src2, src3, sat);
 +    uint16_t e2 = inl_qrdmlah_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
      return deposit32(e1, 16, 16, e2);
  }
  void HELPER(gvec_qrdmlah_s16)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int16_t *d = vd;
      int16_t *n = vn;
      int16_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 2; ++i) {
 -        d[i] = inl_qrdmlah_s16(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlah_s16(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
  /* Signed saturating rounding doubling multiply-subtract high half, 16-bit */
 -static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
 -                                int16_t src2, int16_t src3)
 +static int16_t inl_qrdmlsh_s16(int16_t src1, int16_t src2,
 +                               int16_t src3, uint32_t *sat)
  {
      /* Similarly, using subtraction:
       * = ((a3 << 16) - ((e1 * e2) << 1) + (1 << 15)) >> 16
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
      ret = ((int32_t)src3 << 15) - ret + (1 << 14);
      ret >>= 15;
      if (ret != (int16_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? -0x8000 : 0x7fff);
      }
      return ret;
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
  uint32_t HELPER(neon_qrdmlsh_s16)(CPUARMState *env, uint32_t src1,
                                    uint32_t src2, uint32_t src3)
  {
 -    uint16_t e1 = inl_qrdmlsh_s16(env, src1, src2, src3);
 -    uint16_t e2 = inl_qrdmlsh_s16(env, src1 >> 16, src2 >> 16, src3 >> 16);
 +    uint32_t *sat = &env->vfp.qc[0];
 +    uint16_t e1 = inl_qrdmlsh_s16(src1, src2, src3, sat);
 +    uint16_t e2 = inl_qrdmlsh_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
      return deposit32(e1, 16, 16, e2);
  }
  void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int16_t *d = vd;
      int16_t *n = vn;
      int16_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 2; ++i) {
 -        d[i] = inl_qrdmlsh_s16(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlsh_s16(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
  /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
 -uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
 -                                  int32_t src2, int32_t src3)
 +static int32_t inl_qrdmlah_s32(int32_t src1, int32_t src2,
 +                               int32_t src3, uint32_t *sat)
  {
      /* Simplify similarly to int_qrdmlah_s16 above.  */
      int64_t ret = (int64_t)src1 * src2;
      ret = ((int64_t)src3 << 31) + ret + (1 << 30);
      ret >>= 31;
      if (ret != (int32_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? INT32_MIN : INT32_MAX);
      }
      return ret;
  }
 +uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
 +                                  int32_t src2, int32_t src3)
 +{
 +    uint32_t *sat = &env->vfp.qc[0];
 +    return inl_qrdmlah_s32(src1, src2, src3, sat);
 +}
 +
  void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int32_t *d = vd;
      int32_t *n = vn;
      int32_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 4; ++i) {
 -        d[i] = helper_neon_qrdmlah_s32(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlah_s32(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
  /* Signed saturating rounding doubling multiply-subtract high half, 32-bit */
 -uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
 -                                  int32_t src2, int32_t src3)
 +static int32_t inl_qrdmlsh_s32(int32_t src1, int32_t src2,
 +                               int32_t src3, uint32_t *sat)
  {
      /* Simplify similarly to int_qrdmlsh_s16 above.  */
      int64_t ret = (int64_t)src1 * src2;
      ret = ((int64_t)src3 << 31) - ret + (1 << 30);
      ret >>= 31;
      if (ret != (int32_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? INT32_MIN : INT32_MAX);
      }
      return ret;
  }
 +uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
 +                                  int32_t src2, int32_t src3)
 +{
 +    uint32_t *sat = &env->vfp.qc[0];
 +    return inl_qrdmlsh_s32(src1, src2, src3, sat);
 +}
 +
  void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int32_t *d = vd;
      int32_t *n = vn;
      int32_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 4; ++i) {
 -        d[i] = helper_neon_qrdmlsh_s32(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlsh_s32(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
 --
-.20.1
+.25.1

-[PULL 22/45] ACPI: Build related register address fields via hardware error fw_cfg blob
+[PULL 06/31] hw/misc: Add a model of the Xilinx Versal CRL
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: "Edgar E. Iglesias" <edgar.iglesias@amd.com>
-This patch builds error_block_address and read_ack_register fields
+Add a model of the Xilinx Versal CRL.
 in hardware errors table , the error_block_address points to Generic
 Error Status Block(GESB) via bios_linker. The max size for one GESB
 is 1kb, For more detailed information, please refer to
 document: docs/specs/acpi_hest_ghes.rst
-Now we only support one Error source, if necessary, we can extend to
+Signed-off-by: Edgar E. Iglesias <edgar.iglesias@amd.com>
-support more.
+Reviewed-by: Frederic Konrad <fkonrad@amd.com>
+Reviewed-by: Francisco Iglesias <francisco.iglesias@amd.com>
-Suggested-by: Laszlo Ersek <lersek@redhat.com>
+Message-id: 20220406174303.2022038-4-edgar.iglesias@xilinx.com
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Jonathan Cameron <Jonathan.Cameron@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-5-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- default-configs/arm-softmmu.mak |  1 +
+ include/hw/misc/xlnx-versal-crl.h | 235 +++++++++++++++++
- include/hw/acpi/aml-build.h     |  1 +
+ hw/misc/xlnx-versal-crl.c         | 421 ++++++++++++++++++++++++++++++
- include/hw/acpi/ghes.h          | 28 +++++++++++
+ hw/misc/meson.build               |   1 +
- hw/acpi/aml-build.c             |  2 +
+files changed, 657 insertions(+)
- hw/acpi/ghes.c                  | 89 +++++++++++++++++++++++++++++++++
+ create mode 100644 include/hw/misc/xlnx-versal-crl.h
- hw/arm/virt-acpi-build.c        |  5 ++
+ create mode 100644 hw/misc/xlnx-versal-crl.c
  hw/acpi/Kconfig                 |  4 ++
  hw/acpi/Makefile.objs           |  1 +
 files changed, 131 insertions(+)
  create mode 100644 include/hw/acpi/ghes.h
  create mode 100644 hw/acpi/ghes.c
-diff --git a/default-configs/arm-softmmu.mak b/default-configs/arm-softmmu.mak
+diff --git a/include/hw/misc/xlnx-versal-crl.h b/include/hw/misc/xlnx-versal-crl.h
 index XXXXXXX..XXXXXXX 100644
 --- a/default-configs/arm-softmmu.mak
 +++ b/default-configs/arm-softmmu.mak
@@ -XXX,XX +XXX,XX @@ CONFIG_FSL_IMX7=y
  CONFIG_FSL_IMX6UL=y
  CONFIG_SEMIHOSTING=y
  CONFIG_ALLWINNER_H3=y
 +CONFIG_ACPI_APEI=y
 diff --git a/include/hw/acpi/aml-build.h b/include/hw/acpi/aml-build.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/hw/acpi/aml-build.h
 +++ b/include/hw/acpi/aml-build.h
@@ -XXX,XX +XXX,XX @@ struct AcpiBuildTables {
      GArray *rsdp;
      GArray *tcpalog;
      GArray *vmgenid;
 +    GArray *hardware_errors;
      BIOSLinker *linker;
  } AcpiBuildTables;
 diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/include/hw/acpi/ghes.h
++++ b/include/hw/misc/xlnx-versal-crl.h
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * Support for generating APEI tables and recording CPER for Guests
++ * QEMU model of the Clock-Reset-LPD (CRL).
 + *
-+ * Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
++ * Copyright (c) 2022 Xilinx Inc.
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + *
-+ * Author: Dongjiu Geng <gengdongjiu@huawei.com>
++ * Written by Edgar E. Iglesias <edgar.iglesias@xilinx.com>
 + *
 + * This program is free software; you can redistribute it and/or modify
 + * it under the terms of the GNU General Public License as published by
 + * the Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 +
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 +
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
-+
++#ifndef HW_MISC_XLNX_VERSAL_CRL_H
-+#ifndef ACPI_GHES_H
++#define HW_MISC_XLNX_VERSAL_CRL_H
-+#define ACPI_GHES_H
++
-+
++#include "hw/sysbus.h"
-+#include "hw/acpi/bios-linker-loader.h"
++#include "hw/register.h"
-+
++#include "target/arm/cpu.h"
-+void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
++
 +#define TYPE_XLNX_VERSAL_CRL "xlnx,versal-crl"
 +OBJECT_DECLARE_SIMPLE_TYPE(XlnxVersalCRL, XLNX_VERSAL_CRL)
 +
 +REG32(ERR_CTRL, 0x0)
 +    FIELD(ERR_CTRL, SLVERR_ENABLE, 0, 1)
 +REG32(IR_STATUS, 0x4)
 +    FIELD(IR_STATUS, ADDR_DECODE_ERR, 0, 1)
 +REG32(IR_MASK, 0x8)
 +    FIELD(IR_MASK, ADDR_DECODE_ERR, 0, 1)
 +REG32(IR_ENABLE, 0xc)
 +    FIELD(IR_ENABLE, ADDR_DECODE_ERR, 0, 1)
 +REG32(IR_DISABLE, 0x10)
 +    FIELD(IR_DISABLE, ADDR_DECODE_ERR, 0, 1)
 +REG32(WPROT, 0x1c)
 +    FIELD(WPROT, ACTIVE, 0, 1)
 +REG32(PLL_CLK_OTHER_DMN, 0x20)
 +    FIELD(PLL_CLK_OTHER_DMN, APLL_BYPASS, 0, 1)
 +REG32(RPLL_CTRL, 0x40)
 +    FIELD(RPLL_CTRL, POST_SRC, 24, 3)
 +    FIELD(RPLL_CTRL, PRE_SRC, 20, 3)
 +    FIELD(RPLL_CTRL, CLKOUTDIV, 16, 2)
 +    FIELD(RPLL_CTRL, FBDIV, 8, 8)
 +    FIELD(RPLL_CTRL, BYPASS, 3, 1)
 +    FIELD(RPLL_CTRL, RESET, 0, 1)
 +REG32(RPLL_CFG, 0x44)
 +    FIELD(RPLL_CFG, LOCK_DLY, 25, 7)
 +    FIELD(RPLL_CFG, LOCK_CNT, 13, 10)
 +    FIELD(RPLL_CFG, LFHF, 10, 2)
 +    FIELD(RPLL_CFG, CP, 5, 4)
 +    FIELD(RPLL_CFG, RES, 0, 4)
 +REG32(RPLL_FRAC_CFG, 0x48)
 +    FIELD(RPLL_FRAC_CFG, ENABLED, 31, 1)
 +    FIELD(RPLL_FRAC_CFG, SEED, 22, 3)
 +    FIELD(RPLL_FRAC_CFG, ALGRTHM, 19, 1)
 +    FIELD(RPLL_FRAC_CFG, ORDER, 18, 1)
 +    FIELD(RPLL_FRAC_CFG, DATA, 0, 16)
 +REG32(PLL_STATUS, 0x50)
 +    FIELD(PLL_STATUS, RPLL_STABLE, 2, 1)
 +    FIELD(PLL_STATUS, RPLL_LOCK, 0, 1)
 +REG32(RPLL_TO_XPD_CTRL, 0x100)
 +    FIELD(RPLL_TO_XPD_CTRL, CLKACT, 25, 1)
 +    FIELD(RPLL_TO_XPD_CTRL, DIVISOR0, 8, 10)
 +REG32(LPD_TOP_SWITCH_CTRL, 0x104)
 +    FIELD(LPD_TOP_SWITCH_CTRL, CLKACT_ADMA, 26, 1)
 +    FIELD(LPD_TOP_SWITCH_CTRL, CLKACT, 25, 1)
 +    FIELD(LPD_TOP_SWITCH_CTRL, DIVISOR0, 8, 10)
 +    FIELD(LPD_TOP_SWITCH_CTRL, SRCSEL, 0, 3)
 +REG32(LPD_LSBUS_CTRL, 0x108)
 +    FIELD(LPD_LSBUS_CTRL, CLKACT, 25, 1)
 +    FIELD(LPD_LSBUS_CTRL, DIVISOR0, 8, 10)
 +    FIELD(LPD_LSBUS_CTRL, SRCSEL, 0, 3)
 +REG32(CPU_R5_CTRL, 0x10c)
 +    FIELD(CPU_R5_CTRL, CLKACT_OCM2, 28, 1)
 +    FIELD(CPU_R5_CTRL, CLKACT_OCM, 27, 1)
 +    FIELD(CPU_R5_CTRL, CLKACT_CORE, 26, 1)
 +    FIELD(CPU_R5_CTRL, CLKACT, 25, 1)
 +    FIELD(CPU_R5_CTRL, DIVISOR0, 8, 10)
 +    FIELD(CPU_R5_CTRL, SRCSEL, 0, 3)
 +REG32(IOU_SWITCH_CTRL, 0x114)
 +    FIELD(IOU_SWITCH_CTRL, CLKACT, 25, 1)
 +    FIELD(IOU_SWITCH_CTRL, DIVISOR0, 8, 10)
 +    FIELD(IOU_SWITCH_CTRL, SRCSEL, 0, 3)
 +REG32(GEM0_REF_CTRL, 0x118)
 +    FIELD(GEM0_REF_CTRL, CLKACT_RX, 27, 1)
 +    FIELD(GEM0_REF_CTRL, CLKACT_TX, 26, 1)
 +    FIELD(GEM0_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(GEM0_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(GEM0_REF_CTRL, SRCSEL, 0, 3)
 +REG32(GEM1_REF_CTRL, 0x11c)
 +    FIELD(GEM1_REF_CTRL, CLKACT_RX, 27, 1)
 +    FIELD(GEM1_REF_CTRL, CLKACT_TX, 26, 1)
 +    FIELD(GEM1_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(GEM1_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(GEM1_REF_CTRL, SRCSEL, 0, 3)
 +REG32(GEM_TSU_REF_CTRL, 0x120)
 +    FIELD(GEM_TSU_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(GEM_TSU_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(GEM_TSU_REF_CTRL, SRCSEL, 0, 3)
 +REG32(USB0_BUS_REF_CTRL, 0x124)
 +    FIELD(USB0_BUS_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(USB0_BUS_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(USB0_BUS_REF_CTRL, SRCSEL, 0, 3)
 +REG32(UART0_REF_CTRL, 0x128)
 +    FIELD(UART0_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(UART0_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(UART0_REF_CTRL, SRCSEL, 0, 3)
 +REG32(UART1_REF_CTRL, 0x12c)
 +    FIELD(UART1_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(UART1_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(UART1_REF_CTRL, SRCSEL, 0, 3)
 +REG32(SPI0_REF_CTRL, 0x130)
 +    FIELD(SPI0_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(SPI0_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(SPI0_REF_CTRL, SRCSEL, 0, 3)
 +REG32(SPI1_REF_CTRL, 0x134)
 +    FIELD(SPI1_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(SPI1_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(SPI1_REF_CTRL, SRCSEL, 0, 3)
 +REG32(CAN0_REF_CTRL, 0x138)
 +    FIELD(CAN0_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(CAN0_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(CAN0_REF_CTRL, SRCSEL, 0, 3)
 +REG32(CAN1_REF_CTRL, 0x13c)
 +    FIELD(CAN1_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(CAN1_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(CAN1_REF_CTRL, SRCSEL, 0, 3)
 +REG32(I2C0_REF_CTRL, 0x140)
 +    FIELD(I2C0_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(I2C0_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(I2C0_REF_CTRL, SRCSEL, 0, 3)
 +REG32(I2C1_REF_CTRL, 0x144)
 +    FIELD(I2C1_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(I2C1_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(I2C1_REF_CTRL, SRCSEL, 0, 3)
 +REG32(DBG_LPD_CTRL, 0x148)
 +    FIELD(DBG_LPD_CTRL, CLKACT, 25, 1)
 +    FIELD(DBG_LPD_CTRL, DIVISOR0, 8, 10)
 +    FIELD(DBG_LPD_CTRL, SRCSEL, 0, 3)
 +REG32(TIMESTAMP_REF_CTRL, 0x14c)
 +    FIELD(TIMESTAMP_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(TIMESTAMP_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(TIMESTAMP_REF_CTRL, SRCSEL, 0, 3)
 +REG32(CRL_SAFETY_CHK, 0x150)
 +REG32(PSM_REF_CTRL, 0x154)
 +    FIELD(PSM_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(PSM_REF_CTRL, SRCSEL, 0, 3)
 +REG32(DBG_TSTMP_CTRL, 0x158)
 +    FIELD(DBG_TSTMP_CTRL, CLKACT, 25, 1)
 +    FIELD(DBG_TSTMP_CTRL, DIVISOR0, 8, 10)
 +    FIELD(DBG_TSTMP_CTRL, SRCSEL, 0, 3)
 +REG32(CPM_TOPSW_REF_CTRL, 0x15c)
 +    FIELD(CPM_TOPSW_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(CPM_TOPSW_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(CPM_TOPSW_REF_CTRL, SRCSEL, 0, 3)
 +REG32(USB3_DUAL_REF_CTRL, 0x160)
 +    FIELD(USB3_DUAL_REF_CTRL, CLKACT, 25, 1)
 +    FIELD(USB3_DUAL_REF_CTRL, DIVISOR0, 8, 10)
 +    FIELD(USB3_DUAL_REF_CTRL, SRCSEL, 0, 3)
 +REG32(RST_CPU_R5, 0x300)
 +    FIELD(RST_CPU_R5, RESET_PGE, 4, 1)
 +    FIELD(RST_CPU_R5, RESET_AMBA, 2, 1)
 +    FIELD(RST_CPU_R5, RESET_CPU1, 1, 1)
 +    FIELD(RST_CPU_R5, RESET_CPU0, 0, 1)
 +REG32(RST_ADMA, 0x304)
 +    FIELD(RST_ADMA, RESET, 0, 1)
 +REG32(RST_GEM0, 0x308)
 +    FIELD(RST_GEM0, RESET, 0, 1)
 +REG32(RST_GEM1, 0x30c)
 +    FIELD(RST_GEM1, RESET, 0, 1)
 +REG32(RST_SPARE, 0x310)
 +    FIELD(RST_SPARE, RESET, 0, 1)
 +REG32(RST_USB0, 0x314)
 +    FIELD(RST_USB0, RESET, 0, 1)
 +REG32(RST_UART0, 0x318)
 +    FIELD(RST_UART0, RESET, 0, 1)
 +REG32(RST_UART1, 0x31c)
 +    FIELD(RST_UART1, RESET, 0, 1)
 +REG32(RST_SPI0, 0x320)
 +    FIELD(RST_SPI0, RESET, 0, 1)
 +REG32(RST_SPI1, 0x324)
 +    FIELD(RST_SPI1, RESET, 0, 1)
 +REG32(RST_CAN0, 0x328)
 +    FIELD(RST_CAN0, RESET, 0, 1)
 +REG32(RST_CAN1, 0x32c)
 +    FIELD(RST_CAN1, RESET, 0, 1)
 +REG32(RST_I2C0, 0x330)
 +    FIELD(RST_I2C0, RESET, 0, 1)
 +REG32(RST_I2C1, 0x334)
 +    FIELD(RST_I2C1, RESET, 0, 1)
 +REG32(RST_DBG_LPD, 0x338)
 +    FIELD(RST_DBG_LPD, RPU_DBG1_RESET, 5, 1)
 +    FIELD(RST_DBG_LPD, RPU_DBG0_RESET, 4, 1)
 +    FIELD(RST_DBG_LPD, RESET_HSDP, 1, 1)
 +    FIELD(RST_DBG_LPD, RESET, 0, 1)
 +REG32(RST_GPIO, 0x33c)
 +    FIELD(RST_GPIO, RESET, 0, 1)
 +REG32(RST_TTC, 0x344)
 +    FIELD(RST_TTC, TTC3_RESET, 3, 1)
 +    FIELD(RST_TTC, TTC2_RESET, 2, 1)
 +    FIELD(RST_TTC, TTC1_RESET, 1, 1)
 +    FIELD(RST_TTC, TTC0_RESET, 0, 1)
 +REG32(RST_TIMESTAMP, 0x348)
 +    FIELD(RST_TIMESTAMP, RESET, 0, 1)
 +REG32(RST_SWDT, 0x34c)
 +    FIELD(RST_SWDT, RESET, 0, 1)
 +REG32(RST_OCM, 0x350)
 +    FIELD(RST_OCM, RESET, 0, 1)
 +REG32(RST_IPI, 0x354)
 +    FIELD(RST_IPI, RESET, 0, 1)
 +REG32(RST_SYSMON, 0x358)
 +    FIELD(RST_SYSMON, SEQ_RST, 1, 1)
 +    FIELD(RST_SYSMON, CFG_RST, 0, 1)
 +REG32(RST_FPD, 0x360)
 +    FIELD(RST_FPD, SRST, 1, 1)
 +    FIELD(RST_FPD, POR, 0, 1)
 +REG32(PSM_RST_MODE, 0x370)
 +    FIELD(PSM_RST_MODE, WAKEUP, 2, 1)
 +    FIELD(PSM_RST_MODE, RST_MODE, 0, 2)
 +
 +#define CRL_R_MAX (R_PSM_RST_MODE + 1)
 +
 +#define RPU_MAX_CPU 2
 +
 +struct XlnxVersalCRL {
 +    SysBusDevice parent_obj;
 +    qemu_irq irq;
 +
 +    struct {
 +        ARMCPU *cpu_r5[RPU_MAX_CPU];
 +        DeviceState *adma[8];
 +        DeviceState *uart[2];
 +        DeviceState *gem[2];
 +        DeviceState *usb;
 +    } cfg;
 +
 +    RegisterInfoArray *reg_array;
 +    uint32_t regs[CRL_R_MAX];
 +    RegisterInfo regs_info[CRL_R_MAX];
 +};
 +#endif
-diff --git a/hw/acpi/aml-build.c b/hw/acpi/aml-build.c
+diff --git a/hw/misc/xlnx-versal-crl.c b/hw/misc/xlnx-versal-crl.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/aml-build.c
 +++ b/hw/acpi/aml-build.c
@@ -XXX,XX +XXX,XX @@ void acpi_build_tables_init(AcpiBuildTables *tables)
      tables->table_data = g_array_new(false, true /* clear */, 1);
      tables->tcpalog = g_array_new(false, true /* clear */, 1);
      tables->vmgenid = g_array_new(false, true /* clear */, 1);
 +    tables->hardware_errors = g_array_new(false, true /* clear */, 1);
      tables->linker = bios_linker_loader_init();
  }
@@ -XXX,XX +XXX,XX @@ void acpi_build_tables_cleanup(AcpiBuildTables *tables, bool mfre)
      g_array_free(tables->table_data, true);
      g_array_free(tables->tcpalog, mfre);
      g_array_free(tables->vmgenid, mfre);
 +    g_array_free(tables->hardware_errors, mfre);
  }
  /*
 diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/hw/acpi/ghes.c
++++ b/hw/misc/xlnx-versal-crl.c
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * Support for generating APEI tables and recording CPER for Guests
++ * QEMU model of the Clock-Reset-LPD (CRL).
 + *
-+ * Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
++ * Copyright (c) 2022 Advanced Micro Devices, Inc.
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + *
-+ * Author: Dongjiu Geng <gengdongjiu@huawei.com>
++ * Written by Edgar E. Iglesias <edgar.iglesias@amd.com>
 + *
 + * This program is free software; you can redistribute it and/or modify
 + * it under the terms of the GNU General Public License as published by
 + * the Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 +
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 +
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
-+#include "qemu/units.h"
++#include "qapi/error.h"
-+#include "hw/acpi/ghes.h"
++#include "qemu/log.h"
-+#include "hw/acpi/aml-build.h"
++#include "qemu/bitops.h"
-+
++#include "migration/vmstate.h"
-+#define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
++#include "hw/qdev-properties.h"
-+#define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
++#include "hw/sysbus.h"
-+
++#include "hw/irq.h"
-+/* The max size in bytes for one error block */
++#include "hw/register.h"
-+#define ACPI_GHES_MAX_RAW_DATA_LENGTH   (1 * KiB)
++#include "hw/resettable.h"
 +
-+/* Now only support ARMv8 SEA notification type error source */
++#include "target/arm/arm-powerctl.h"
-+#define ACPI_GHES_ERROR_SOURCE_COUNT        1
++#include "hw/misc/xlnx-versal-crl.h"
 +
-+/*
++#ifndef XLNX_VERSAL_CRL_ERR_DEBUG
-+ * Build table for the hardware error fw_cfg blob.
++#define XLNX_VERSAL_CRL_ERR_DEBUG 0
-+ * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
++#endif
-+ * See docs/specs/acpi_hest_ghes.rst for blobs format.
++
-+ */
++static void crl_update_irq(XlnxVersalCRL *s)
-+void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker)
++{
-+{
++    bool pending = s->regs[R_IR_STATUS] & ~s->regs[R_IR_MASK];
-+    int i, error_status_block_offset;
++    qemu_set_irq(s->irq, pending);
-+
++}
-+    /* Build error_block_address */
++
-+    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
++static void crl_status_postw(RegisterInfo *reg, uint64_t val64)
-+        build_append_int_noprefix(hardware_errors, 0, sizeof(uint64_t));
++{
-+    }
++    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
-+
++    crl_update_irq(s);
-+    /* Build read_ack_register */
++}
-+    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
++
-+        /*
++static uint64_t crl_enable_prew(RegisterInfo *reg, uint64_t val64)
-+         * Initialize the value of read_ack_register to 1, so GHES can be
++{
-+         * writeable after (re)boot.
++    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
-+         * ACPI 6.2: 18.3.2.8 Generic Hardware Error Source version 2
++    uint32_t val = val64;
-+         * (GHESv2 - Type 10)
++
-+         */
++    s->regs[R_IR_MASK] &= ~val;
-+        build_append_int_noprefix(hardware_errors, 1, sizeof(uint64_t));
++    crl_update_irq(s);
-+    }
++    return 0;
-+
++}
-+    /* Generic Error Status Block offset in the hardware error fw_cfg blob */
++
-+    error_status_block_offset = hardware_errors->len;
++static uint64_t crl_disable_prew(RegisterInfo *reg, uint64_t val64)
-+
++{
-+    /* Reserve space for Error Status Data Block */
++    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
-+    acpi_data_push(hardware_errors,
++    uint32_t val = val64;
-+        ACPI_GHES_MAX_RAW_DATA_LENGTH * ACPI_GHES_ERROR_SOURCE_COUNT);
++
-+
++    s->regs[R_IR_MASK] |= val;
-+    /* Tell guest firmware to place hardware_errors blob into RAM */
++    crl_update_irq(s);
-+    bios_linker_loader_alloc(linker, ACPI_GHES_ERRORS_FW_CFG_FILE,
++    return 0;
-+                             hardware_errors, sizeof(uint64_t), false);
++}
 +
-+    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
++static void crl_reset_dev(XlnxVersalCRL *s, DeviceState *dev,
-+        /*
++                          bool rst_old, bool rst_new)
-+         * Tell firmware to patch error_block_address entries to point to
++{
-+         * corresponding "Generic Error Status Block"
++    device_cold_reset(dev);
-+         */
++}
-+        bios_linker_loader_add_pointer(linker,
++
-+            ACPI_GHES_ERRORS_FW_CFG_FILE, sizeof(uint64_t) * i,
++static void crl_reset_cpu(XlnxVersalCRL *s, ARMCPU *armcpu,
-+            sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE,
++                          bool rst_old, bool rst_new)
-+            error_status_block_offset + i * ACPI_GHES_MAX_RAW_DATA_LENGTH);
++{
-+    }
++    if (rst_new) {
-+
++        arm_set_cpu_off(armcpu->mp_affinity);
-+    /*
++    } else {
-+     * tell firmware to write hardware_errors GPA into
++        arm_set_cpu_on_and_reset(armcpu->mp_affinity);
-+     * hardware_errors_addr fw_cfg, once the former has been initialized.
++    }
-+     */
++}
-+    bios_linker_loader_write_pointer(linker, ACPI_GHES_DATA_ADDR_FW_CFG_FILE,
++
-+        0, sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE, 0);
++#define REGFIELD_RESET(type, s, reg, f, new_val, dev) {     \
-+}
++    bool old_f = ARRAY_FIELD_EX32((s)->regs, reg, f);       \
-diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
++    bool new_f = FIELD_EX32(new_val, reg, f);               \
 +                                                            \
 +    /* Detect edges.  */                                    \
 +    if (dev && old_f != new_f) {                            \
 +        crl_reset_ ## type(s, dev, old_f, new_f);           \
 +    }                                                       \
 +}
 +
 +static uint64_t crl_rst_r5_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +
 +    REGFIELD_RESET(cpu, s, RST_CPU_R5, RESET_CPU0, val64, s->cfg.cpu_r5[0]);
 +    REGFIELD_RESET(cpu, s, RST_CPU_R5, RESET_CPU1, val64, s->cfg.cpu_r5[1]);
 +    return val64;
 +}
 +
 +static uint64_t crl_rst_adma_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +    int i;
 +
 +    /* A single register fans out to all ADMA reset inputs.  */
 +    for (i = 0; i < ARRAY_SIZE(s->cfg.adma); i++) {
 +        REGFIELD_RESET(dev, s, RST_ADMA, RESET, val64, s->cfg.adma[i]);
 +    }
 +    return val64;
 +}
 +
 +static uint64_t crl_rst_uart0_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +
 +    REGFIELD_RESET(dev, s, RST_UART0, RESET, val64, s->cfg.uart[0]);
 +    return val64;
 +}
 +
 +static uint64_t crl_rst_uart1_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +
 +    REGFIELD_RESET(dev, s, RST_UART1, RESET, val64, s->cfg.uart[1]);
 +    return val64;
 +}
 +
 +static uint64_t crl_rst_gem0_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +
 +    REGFIELD_RESET(dev, s, RST_GEM0, RESET, val64, s->cfg.gem[0]);
 +    return val64;
 +}
 +
 +static uint64_t crl_rst_gem1_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +
 +    REGFIELD_RESET(dev, s, RST_GEM1, RESET, val64, s->cfg.gem[1]);
 +    return val64;
 +}
 +
 +static uint64_t crl_rst_usb_prew(RegisterInfo *reg, uint64_t val64)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(reg->opaque);
 +
 +    REGFIELD_RESET(dev, s, RST_USB0, RESET, val64, s->cfg.usb);
 +    return val64;
 +}
 +
 +static const RegisterAccessInfo crl_regs_info[] = {
 +    {   .name = "ERR_CTRL",  .addr = A_ERR_CTRL,
 +    },{ .name = "IR_STATUS",  .addr = A_IR_STATUS,
 +        .w1c = 0x1,
 +        .post_write = crl_status_postw,
 +    },{ .name = "IR_MASK",  .addr = A_IR_MASK,
 +        .reset = 0x1,
 +        .ro = 0x1,
 +    },{ .name = "IR_ENABLE",  .addr = A_IR_ENABLE,
 +        .pre_write = crl_enable_prew,
 +    },{ .name = "IR_DISABLE",  .addr = A_IR_DISABLE,
 +        .pre_write = crl_disable_prew,
 +    },{ .name = "WPROT",  .addr = A_WPROT,
 +    },{ .name = "PLL_CLK_OTHER_DMN",  .addr = A_PLL_CLK_OTHER_DMN,
 +        .reset = 0x1,
 +        .rsvd = 0xe,
 +    },{ .name = "RPLL_CTRL",  .addr = A_RPLL_CTRL,
 +        .reset = 0x24809,
 +        .rsvd = 0xf88c00f6,
 +    },{ .name = "RPLL_CFG",  .addr = A_RPLL_CFG,
 +        .reset = 0x2000000,
 +        .rsvd = 0x1801210,
 +    },{ .name = "RPLL_FRAC_CFG",  .addr = A_RPLL_FRAC_CFG,
 +        .rsvd = 0x7e330000,
 +    },{ .name = "PLL_STATUS",  .addr = A_PLL_STATUS,
 +        .reset = R_PLL_STATUS_RPLL_STABLE_MASK |
 +                 R_PLL_STATUS_RPLL_LOCK_MASK,
 +        .rsvd = 0xfa,
 +        .ro = 0x5,
 +    },{ .name = "RPLL_TO_XPD_CTRL",  .addr = A_RPLL_TO_XPD_CTRL,
 +        .reset = 0x2000100,
 +        .rsvd = 0xfdfc00ff,
 +    },{ .name = "LPD_TOP_SWITCH_CTRL",  .addr = A_LPD_TOP_SWITCH_CTRL,
 +        .reset = 0x6000300,
 +        .rsvd = 0xf9fc00f8,
 +    },{ .name = "LPD_LSBUS_CTRL",  .addr = A_LPD_LSBUS_CTRL,
 +        .reset = 0x2000800,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "CPU_R5_CTRL",  .addr = A_CPU_R5_CTRL,
 +        .reset = 0xe000300,
 +        .rsvd = 0xe1fc00f8,
 +    },{ .name = "IOU_SWITCH_CTRL",  .addr = A_IOU_SWITCH_CTRL,
 +        .reset = 0x2000500,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "GEM0_REF_CTRL",  .addr = A_GEM0_REF_CTRL,
 +        .reset = 0xe000a00,
 +        .rsvd = 0xf1fc00f8,
 +    },{ .name = "GEM1_REF_CTRL",  .addr = A_GEM1_REF_CTRL,
 +        .reset = 0xe000a00,
 +        .rsvd = 0xf1fc00f8,
 +    },{ .name = "GEM_TSU_REF_CTRL",  .addr = A_GEM_TSU_REF_CTRL,
 +        .reset = 0x300,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "USB0_BUS_REF_CTRL",  .addr = A_USB0_BUS_REF_CTRL,
 +        .reset = 0x2001900,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "UART0_REF_CTRL",  .addr = A_UART0_REF_CTRL,
 +        .reset = 0xc00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "UART1_REF_CTRL",  .addr = A_UART1_REF_CTRL,
 +        .reset = 0xc00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "SPI0_REF_CTRL",  .addr = A_SPI0_REF_CTRL,
 +        .reset = 0x600,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "SPI1_REF_CTRL",  .addr = A_SPI1_REF_CTRL,
 +        .reset = 0x600,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "CAN0_REF_CTRL",  .addr = A_CAN0_REF_CTRL,
 +        .reset = 0xc00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "CAN1_REF_CTRL",  .addr = A_CAN1_REF_CTRL,
 +        .reset = 0xc00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "I2C0_REF_CTRL",  .addr = A_I2C0_REF_CTRL,
 +        .reset = 0xc00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "I2C1_REF_CTRL",  .addr = A_I2C1_REF_CTRL,
 +        .reset = 0xc00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "DBG_LPD_CTRL",  .addr = A_DBG_LPD_CTRL,
 +        .reset = 0x300,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "TIMESTAMP_REF_CTRL",  .addr = A_TIMESTAMP_REF_CTRL,
 +        .reset = 0x2000c00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "CRL_SAFETY_CHK",  .addr = A_CRL_SAFETY_CHK,
 +    },{ .name = "PSM_REF_CTRL",  .addr = A_PSM_REF_CTRL,
 +        .reset = 0xf04,
 +        .rsvd = 0xfffc00f8,
 +    },{ .name = "DBG_TSTMP_CTRL",  .addr = A_DBG_TSTMP_CTRL,
 +        .reset = 0x300,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "CPM_TOPSW_REF_CTRL",  .addr = A_CPM_TOPSW_REF_CTRL,
 +        .reset = 0x300,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "USB3_DUAL_REF_CTRL",  .addr = A_USB3_DUAL_REF_CTRL,
 +        .reset = 0x3c00,
 +        .rsvd = 0xfdfc00f8,
 +    },{ .name = "RST_CPU_R5",  .addr = A_RST_CPU_R5,
 +        .reset = 0x17,
 +        .rsvd = 0x8,
 +        .pre_write = crl_rst_r5_prew,
 +    },{ .name = "RST_ADMA",  .addr = A_RST_ADMA,
 +        .reset = 0x1,
 +        .pre_write = crl_rst_adma_prew,
 +    },{ .name = "RST_GEM0",  .addr = A_RST_GEM0,
 +        .reset = 0x1,
 +        .pre_write = crl_rst_gem0_prew,
 +    },{ .name = "RST_GEM1",  .addr = A_RST_GEM1,
 +        .reset = 0x1,
 +        .pre_write = crl_rst_gem1_prew,
 +    },{ .name = "RST_SPARE",  .addr = A_RST_SPARE,
 +        .reset = 0x1,
 +    },{ .name = "RST_USB0",  .addr = A_RST_USB0,
 +        .reset = 0x1,
 +        .pre_write = crl_rst_usb_prew,
 +    },{ .name = "RST_UART0",  .addr = A_RST_UART0,
 +        .reset = 0x1,
 +        .pre_write = crl_rst_uart0_prew,
 +    },{ .name = "RST_UART1",  .addr = A_RST_UART1,
 +        .reset = 0x1,
 +        .pre_write = crl_rst_uart1_prew,
 +    },{ .name = "RST_SPI0",  .addr = A_RST_SPI0,
 +        .reset = 0x1,
 +    },{ .name = "RST_SPI1",  .addr = A_RST_SPI1,
 +        .reset = 0x1,
 +    },{ .name = "RST_CAN0",  .addr = A_RST_CAN0,
 +        .reset = 0x1,
 +    },{ .name = "RST_CAN1",  .addr = A_RST_CAN1,
 +        .reset = 0x1,
 +    },{ .name = "RST_I2C0",  .addr = A_RST_I2C0,
 +        .reset = 0x1,
 +    },{ .name = "RST_I2C1",  .addr = A_RST_I2C1,
 +        .reset = 0x1,
 +    },{ .name = "RST_DBG_LPD",  .addr = A_RST_DBG_LPD,
 +        .reset = 0x33,
 +        .rsvd = 0xcc,
 +    },{ .name = "RST_GPIO",  .addr = A_RST_GPIO,
 +        .reset = 0x1,
 +    },{ .name = "RST_TTC",  .addr = A_RST_TTC,
 +        .reset = 0xf,
 +    },{ .name = "RST_TIMESTAMP",  .addr = A_RST_TIMESTAMP,
 +        .reset = 0x1,
 +    },{ .name = "RST_SWDT",  .addr = A_RST_SWDT,
 +        .reset = 0x1,
 +    },{ .name = "RST_OCM",  .addr = A_RST_OCM,
 +    },{ .name = "RST_IPI",  .addr = A_RST_IPI,
 +    },{ .name = "RST_FPD",  .addr = A_RST_FPD,
 +        .reset = 0x3,
 +    },{ .name = "PSM_RST_MODE",  .addr = A_PSM_RST_MODE,
 +        .reset = 0x1,
 +        .rsvd = 0xf8,
 +    }
 +};
 +
 +static void crl_reset_enter(Object *obj, ResetType type)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(obj);
 +    unsigned int i;
 +
 +    for (i = 0; i < ARRAY_SIZE(s->regs_info); ++i) {
 +        register_reset(&s->regs_info[i]);
 +    }
 +}
 +
 +static void crl_reset_hold(Object *obj)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(obj);
 +
 +    crl_update_irq(s);
 +}
 +
 +static const MemoryRegionOps crl_ops = {
 +    .read = register_read_memory,
 +    .write = register_write_memory,
 +    .endianness = DEVICE_LITTLE_ENDIAN,
 +    .valid = {
 +        .min_access_size = 4,
 +        .max_access_size = 4,
 +    },
 +};
 +
 +static void crl_init(Object *obj)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(obj);
 +    SysBusDevice *sbd = SYS_BUS_DEVICE(obj);
 +    int i;
 +
 +    s->reg_array =
 +        register_init_block32(DEVICE(obj), crl_regs_info,
 +                              ARRAY_SIZE(crl_regs_info),
 +                              s->regs_info, s->regs,
 +                              &crl_ops,
 +                              XLNX_VERSAL_CRL_ERR_DEBUG,
 +                              CRL_R_MAX * 4);
 +    sysbus_init_mmio(sbd, &s->reg_array->mem);
 +    sysbus_init_irq(sbd, &s->irq);
 +
 +    for (i = 0; i < ARRAY_SIZE(s->cfg.cpu_r5); ++i) {
 +        object_property_add_link(obj, "cpu_r5[*]", TYPE_ARM_CPU,
 +                                 (Object **)&s->cfg.cpu_r5[i],
 +                                 qdev_prop_allow_set_link_before_realize,
 +                                 OBJ_PROP_LINK_STRONG);
 +    }
 +
 +    for (i = 0; i < ARRAY_SIZE(s->cfg.adma); ++i) {
 +        object_property_add_link(obj, "adma[*]", TYPE_DEVICE,
 +                                 (Object **)&s->cfg.adma[i],
 +                                 qdev_prop_allow_set_link_before_realize,
 +                                 OBJ_PROP_LINK_STRONG);
 +    }
 +
 +    for (i = 0; i < ARRAY_SIZE(s->cfg.uart); ++i) {
 +        object_property_add_link(obj, "uart[*]", TYPE_DEVICE,
 +                                 (Object **)&s->cfg.uart[i],
 +                                 qdev_prop_allow_set_link_before_realize,
 +                                 OBJ_PROP_LINK_STRONG);
 +    }
 +
 +    for (i = 0; i < ARRAY_SIZE(s->cfg.gem); ++i) {
 +        object_property_add_link(obj, "gem[*]", TYPE_DEVICE,
 +                                 (Object **)&s->cfg.gem[i],
 +                                 qdev_prop_allow_set_link_before_realize,
 +                                 OBJ_PROP_LINK_STRONG);
 +    }
 +
 +    object_property_add_link(obj, "usb", TYPE_DEVICE,
 +                             (Object **)&s->cfg.gem[i],
 +                             qdev_prop_allow_set_link_before_realize,
 +                             OBJ_PROP_LINK_STRONG);
 +}
 +
 +static void crl_finalize(Object *obj)
 +{
 +    XlnxVersalCRL *s = XLNX_VERSAL_CRL(obj);
 +    register_finalize_block(s->reg_array);
 +}
 +
 +static const VMStateDescription vmstate_crl = {
 +    .name = TYPE_XLNX_VERSAL_CRL,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_UINT32_ARRAY(regs, XlnxVersalCRL, CRL_R_MAX),
 +        VMSTATE_END_OF_LIST(),
 +    }
 +};
 +
 +static void crl_class_init(ObjectClass *klass, void *data)
 +{
 +    ResettableClass *rc = RESETTABLE_CLASS(klass);
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    dc->vmsd = &vmstate_crl;
 +
 +    rc->phases.enter = crl_reset_enter;
 +    rc->phases.hold = crl_reset_hold;
 +}
 +
 +static const TypeInfo crl_info = {
 +    .name          = TYPE_XLNX_VERSAL_CRL,
 +    .parent        = TYPE_SYS_BUS_DEVICE,
 +    .instance_size = sizeof(XlnxVersalCRL),
 +    .class_init    = crl_class_init,
 +    .instance_init = crl_init,
 +    .instance_finalize = crl_finalize,
 +};
 +
 +static void crl_register_types(void)
 +{
 +    type_register_static(&crl_info);
 +}
 +
 +type_init(crl_register_types)
 diff --git a/hw/misc/meson.build b/hw/misc/meson.build
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/virt-acpi-build.c
+--- a/hw/misc/meson.build
-+++ b/hw/arm/virt-acpi-build.c
++++ b/hw/misc/meson.build
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_SLAVIO', if_true: files('slavio_misc.c'))
- #include "sysemu/reset.h"
+ softmmu_ss.add(when: 'CONFIG_ZYNQ', if_true: files('zynq_slcr.c'))
- #include "kvm_arm.h"
+ specific_ss.add(when: 'CONFIG_XLNX_ZYNQMP_ARM', if_true: files('xlnx-zynqmp-crf.c'))
- #include "migration/vmstate.h"
+ specific_ss.add(when: 'CONFIG_XLNX_ZYNQMP_ARM', if_true: files('xlnx-zynqmp-apu-ctrl.c'))
-+#include "hw/acpi/ghes.h"
++specific_ss.add(when: 'CONFIG_XLNX_VERSAL', if_true: files('xlnx-versal-crl.c'))
+ softmmu_ss.add(when: 'CONFIG_XLNX_VERSAL', if_true: files(
- #define ARM_SPI_BASE 32
+   'xlnx-versal-xramc.c',
+   'xlnx-versal-pmc-iou-slcr.c',
@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
      acpi_add_table(table_offsets, tables_blob);
      build_spcr(tables_blob, tables->linker, vms);
 +    if (vms->ras) {
 +        build_ghes_error_table(tables->hardware_errors, tables->linker);
 +    }
 +
      if (ms->numa_state->num_nodes > 0) {
          acpi_add_table(table_offsets, tables_blob);
          build_srat(tables_blob, tables->linker, vms);
 diff --git a/hw/acpi/Kconfig b/hw/acpi/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/Kconfig
 +++ b/hw/acpi/Kconfig
@@ -XXX,XX +XXX,XX @@ config ACPI_HMAT
      bool
      depends on ACPI
 +config ACPI_APEI
 +    bool
 +    depends on ACPI
 +
  config ACPI_PCI
      bool
      depends on ACPI && PCI
 diff --git a/hw/acpi/Makefile.objs b/hw/acpi/Makefile.objs
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/Makefile.objs
 +++ b/hw/acpi/Makefile.objs
@@ -XXX,XX +XXX,XX @@ common-obj-$(CONFIG_ACPI_NVDIMM) += nvdimm.o
  common-obj-$(CONFIG_ACPI_VMGENID) += vmgenid.o
  common-obj-$(CONFIG_ACPI_HW_REDUCED) += generic_event_device.o
  common-obj-$(CONFIG_ACPI_HMAT) += hmat.o
 +common-obj-$(CONFIG_ACPI_APEI) += ghes.o
  common-obj-$(call lnot,$(CONFIG_ACPI_X86)) += acpi-stub.o
  common-obj-$(call lnot,$(CONFIG_PC)) += acpi-x86-stub.o
 --
-.20.1
+.25.1

-[PULL 41/45] target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
+[PULL 07/31] hw/arm: versal: Connect the CRL
-Convert the Neon integer VMUL, VMLA, and VMLS 3-reg-same inssn to
+From: "Edgar E. Iglesias" <edgar.iglesias@amd.com>
 decodetree.
-We don't have a gvec helper for multiply-accumulate, so VMLA and VMLS
+Connect the CRL (Clock Reset LPD) to the Versal SoC.
 need a loop function do_3same_fp().  This takes a reads_vd parameter
 to do_3same_fp() which tells it to load the old value into vd before
 calling the callback function, in the same way that the do_vfp_3op_sp()
 and do_vfp_3op_dp() functions in translate-vfp.inc.c work. (The
 only uses in this patch pass reads_vd == true, but later commits
 will use reads_vd == false.)
-This conversion fixes in passing an underdecoding for VMUL
+Signed-off-by: Edgar E. Iglesias <edgar.iglesias@amd.com>
-(originally reported by Fredrik Strupe <fredrik@strupe.net>): bit 1
+Reviewed-by: Frederic Konrad <fkonrad@amd.com>
-of the 'size' field must be 0.  The old decoder didn't enforce this,
+Reviewed-by: Francisco Iglesias <francisco.iglesias@amd.com>
-but the decodetree pattern does.
+Message-id: 20220406174303.2022038-5-edgar.iglesias@xilinx.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  include/hw/arm/xlnx-versal.h |  4 +++
  hw/arm/xlnx-versal.c         | 54 ++++++++++++++++++++++++++++++++++--
 files changed, 56 insertions(+), 2 deletions(-)
-The gen_VMLA_fp_reg() function performs the addition operation
+diff --git a/include/hw/arm/xlnx-versal.h b/include/hw/arm/xlnx-versal.h
 with the operands in the opposite order to the old decoder:
 since Neon sets 'default NaN mode' float32_add operations are
 commutative so there is no behaviour difference, but putting
 them this way around matches the Arm ARM pseudocode and the
 required operation order for the subtraction in gen_VMLS_fp_reg().
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200512163904.10918-14-peter.maydell@linaro.org
 ---
  target/arm/neon-dp.decode       |  3 ++
  target/arm/translate-neon.inc.c | 81 +++++++++++++++++++++++++++++++++
  target/arm/translate.c          | 17 +------
 files changed, 85 insertions(+), 16 deletions(-)
 diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/xlnx-versal.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/xlnx-versal.h
-@@ -XXX,XX +XXX,XX @@ VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@
- VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+ #include "hw/nvram/xlnx-versal-efuse.h"
- VPADD_fp_3s      1111 001 1 0 . 0 . .... .... 1101 ... 0 .... @3same_fp_q0
+ #include "hw/ssi/xlnx-versal-ospi.h"
- VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+ #include "hw/dma/xlnx_csu_dma.h"
-+VMLA_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
++#include "hw/misc/xlnx-versal-crl.h"
-+VMLS_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 1 .... @3same_fp
+ #include "hw/misc/xlnx-versal-pmc-iou-slcr.h"
-+VMUL_fp_3s       1111 001 1 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
+ #define TYPE_XLNX_VERSAL "xlnx-versal"
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
+@@ -XXX,XX +XXX,XX @@ struct Versal {
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+             qemu_or_irq irq_orgate;
              XlnxXramCtrl ctrl[XLNX_VERSAL_NR_XRAM];
          } xram;
 +
 +        XlnxVersalCRL crl;
      } lpd;
      /* The Platform Management Controller subsystem.  */
@@ -XXX,XX +XXX,XX @@ struct Versal {
  #define VERSAL_TIMER_NS_EL1_IRQ     14
  #define VERSAL_TIMER_NS_EL2_IRQ     10
 +#define VERSAL_CRL_IRQ             10
  #define VERSAL_UART0_IRQ_0         18
  #define VERSAL_UART1_IRQ_0         19
  #define VERSAL_USB0_IRQ_0          22
 diff --git a/hw/arm/xlnx-versal.c b/hw/arm/xlnx-versal.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/hw/arm/xlnx-versal.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/hw/arm/xlnx-versal.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
+@@ -XXX,XX +XXX,XX @@ static void versal_create_ospi(Versal *s, qemu_irq *pic)
- DO_3SAME_VQDMULH(VQDMULH, qdmulh)
+     qdev_connect_gpio_out(orgate, 0, pic[VERSAL_OSPI_IRQ]);
- DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
+ }
-+static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
++static void versal_create_crl(Versal *s, qemu_irq *pic)
 +                        bool reads_vd)
 +{
-+    /*
++    SysBusDevice *sbd;
-+     * FP operations handled elementwise 32 bits at a time.
++    int i;
 +     * If reads_vd is true then the old value of Vd will be
 +     * loaded before calling the callback function. This is
 +     * used for multiply-accumulate type operations.
 +     */
 +    TCGv_i32 tmp, tmp2;
 +    int pass;
 +
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
++    object_initialize_child(OBJECT(s), "crl", &s->lpd.crl,
-+        return false;
++                            TYPE_XLNX_VERSAL_CRL);
 +    sbd = SYS_BUS_DEVICE(&s->lpd.crl);
 +
 +    for (i = 0; i < ARRAY_SIZE(s->lpd.rpu.cpu); i++) {
 +        g_autofree gchar *name = g_strdup_printf("cpu_r5[%d]", i);
 +
 +        object_property_set_link(OBJECT(&s->lpd.crl),
 +                                 name, OBJECT(&s->lpd.rpu.cpu[i]),
 +                                 &error_abort);
 +    }
 +
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
++    for (i = 0; i < ARRAY_SIZE(s->lpd.iou.gem); i++) {
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
++        g_autofree gchar *name = g_strdup_printf("gem[%d]", i);
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
++
-+        return false;
++        object_property_set_link(OBJECT(&s->lpd.crl),
 +                                 name, OBJECT(&s->lpd.iou.gem[i]),
 +                                 &error_abort);
 +    }
 +
-+    if ((a->vn | a->vm | a->vd) & a->q) {
++    for (i = 0; i < ARRAY_SIZE(s->lpd.iou.adma); i++) {
-+        return false;
++        g_autofree gchar *name = g_strdup_printf("adma[%d]", i);
 +
 +        object_property_set_link(OBJECT(&s->lpd.crl),
 +                                 name, OBJECT(&s->lpd.iou.adma[i]),
 +                                 &error_abort);
 +    }
 +
-+    if (!vfp_access_check(s)) {
++    for (i = 0; i < ARRAY_SIZE(s->lpd.iou.uart); i++) {
-+        return true;
++        g_autofree gchar *name = g_strdup_printf("uart[%d]", i);
 +
 +        object_property_set_link(OBJECT(&s->lpd.crl),
 +                                 name, OBJECT(&s->lpd.iou.uart[i]),
 +                                 &error_abort);
 +    }
 +
-+    TCGv_ptr fpstatus = get_fpstatus_ptr(1);
++    object_property_set_link(OBJECT(&s->lpd.crl),
-+    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
++                             "usb", OBJECT(&s->lpd.iou.usb),
-+        tmp = neon_load_reg(a->vn, pass);
++                             &error_abort);
-+        tmp2 = neon_load_reg(a->vm, pass);
++
-+        if (reads_vd) {
++    sysbus_realize(sbd, &error_fatal);
-+            TCGv_i32 tmp_rd = neon_load_reg(a->vd, pass);
++    memory_region_add_subregion(&s->mr_ps, MM_CRL,
-+            fn(tmp_rd, tmp, tmp2, fpstatus);
++                                sysbus_mmio_get_region(sbd, 0));
-+            neon_store_reg(a->vd, pass, tmp_rd);
++    sysbus_connect_irq(sbd, 0, pic[VERSAL_CRL_IRQ]);
 +            tcg_temp_free_i32(tmp);
 +        } else {
 +            fn(tmp, tmp, tmp2, fpstatus);
 +            neon_store_reg(a->vd, pass, tmp);
 +        }
 +        tcg_temp_free_i32(tmp2);
 +    }
 +    tcg_temp_free_ptr(fpstatus);
 +    return true;
 +}
 +
- /*
+ /* This takes the board allocated linear DDR memory and creates aliases
-  * For all the functions using this macro, size == 1 means fp16,
+  * for each split DDR range/aperture on the Versal address map.
-  * which is an architecture extension we don't implement yet.
+  */
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
+@@ -XXX,XX +XXX,XX @@ static void versal_unimp(Versal *s)
- DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
- DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
+     versal_unimp_area(s, "psm", &s->mr_ps,
- DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
+                         MM_PSM_START, MM_PSM_END - MM_PSM_START);
-+DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
+-    versal_unimp_area(s, "crl", &s->mr_ps,
-+
+-                        MM_CRL, MM_CRL_SIZE);
-+/*
+     versal_unimp_area(s, "crf", &s->mr_ps,
-+ * For all the functions using this macro, size == 1 means fp16,
+                         MM_FPD_CRF, MM_FPD_CRF_SIZE);
-+ * which is an architecture extension we don't implement yet.
+     versal_unimp_area(s, "apu", &s->mr_ps,
-+ */
+@@ -XXX,XX +XXX,XX @@ static void versal_realize(DeviceState *dev, Error **errp)
-+#define DO_3S_FP(INSN,FUNC,READS_VD)                                \
+     versal_create_efuse(s, pic);
-+    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
+     versal_create_pmc_iou_slcr(s, pic);
-+    {                                                               \
+     versal_create_ospi(s, pic);
-+        if (a->size != 0) {                                         \
++    versal_create_crl(s, pic);
-+            /* TODO fp16 support */                                 \
+     versal_map_ddr(s);
-+            return false;                                           \
+     versal_unimp(s);
-+        }                                                           \
 +        return do_3same_fp(s, a, FUNC, READS_VD);                   \
 +    }
 +
 +static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
 +    gen_helper_vfp_adds(vd, vd, vn, fpstatus);
 +}
 +
 +static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
 +    gen_helper_vfp_subs(vd, vd, vn, fpstatus);
 +}
 +
 +DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
 +DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VPADD_VQRDMLAH:
          case NEON_3R_VQDMULH_VQRDMULH:
          case NEON_3R_FLOAT_ARITH:
 +        case NEON_3R_FLOAT_MULTIPLY:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_MULTIPLY:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            gen_helper_vfp_muls(tmp, tmp, tmp2, fpstatus);
 -            if (!u) {
 -                tcg_temp_free_i32(tmp2);
 -                tmp2 = neon_load_reg(rd, pass);
 -                if (size == 0) {
 -                    gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_vfp_subs(tmp, tmp2, tmp, fpstatus);
 -                }
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
          case NEON_3R_FLOAT_CMP:
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
-.20.1
+.25.1

-[PULL 45/45] target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree
+[PULL 08/31] hw/arm/exynos4210: Use TYPE_OR_IRQ instead of custom OR-gate device
-Convert the Neon floating point VFMA and VFMS insn to decodetree.
+The Exynos4210 SoC device currently uses a custom device
-These are the last insns in the 3-reg-same group so we can
+"exynos4210.irq_gate" to model the OR gate that feeds each CPU's IRQ
-remove all the support/loop code from the old decoder.
+line.  We have a standard TYPE_OR_IRQ device for this now, so use
 that instead.
 (This is a migration compatibility break, but that is OK for this
 machine type.)
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-18-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-2-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |   3 +
+ include/hw/arm/exynos4210.h |  1 +
- target/arm/translate-neon.inc.c |  41 ++++++++
+ hw/arm/exynos4210.c         | 31 ++++++++++++++++---------------
- target/arm/translate.c          | 176 +-------------------------------
+files changed, 17 insertions(+), 15 deletions(-)
 files changed, 46 insertions(+), 174 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ SHA256H2_3s      1111 001 1 0 . 01 .... .... 1100 . 1 . 0 .... \
+@@ -XXX,XX +XXX,XX @@ struct Exynos4210State {
- SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
+     MemoryRegion bootreg_mem;
-                  vm=%vm_dp vn=%vn_dp vd=%vd_dp
+     I2CBus *i2c_if[EXYNOS4210_I2C_NUMBER];
+     qemu_or_irq pl330_irq_orgate[EXYNOS4210_NUM_DMA];
-+VFMA_fp_3s       1111 001 0 0 . 0 . .... .... 1100 ... 1 .... @3same_fp
++    qemu_or_irq cpu_irq_orgate[EXYNOS4210_NCPUS];
-+VFMS_fp_3s       1111 001 0 0 . 1 . .... .... 1100 ... 1 .... @3same_fp
+ };
  #define TYPE_EXYNOS4210_SOC "exynos4210"
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/exynos4210.c
 +++ b/hw/arm/exynos4210.c
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
  {
      Exynos4210State *s = EXYNOS4210_SOC(socdev);
      MemoryRegion *system_mem = get_system_memory();
 -    qemu_irq gate_irq[EXYNOS4210_NCPUS][EXYNOS4210_IRQ_GATE_NINPUTS];
      SysBusDevice *busdev;
      DeviceState *dev, *uart[4], *pl330[3];
      int i, n;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
      /* IRQ Gate */
      for (i = 0; i < EXYNOS4210_NCPUS; i++) {
 -        dev = qdev_new("exynos4210.irq_gate");
 -        qdev_prop_set_uint32(dev, "n_in", EXYNOS4210_IRQ_GATE_NINPUTS);
 -        sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
 -        /* Get IRQ Gate input in gate_irq */
 -        for (n = 0; n < EXYNOS4210_IRQ_GATE_NINPUTS; n++) {
 -            gate_irq[i][n] = qdev_get_gpio_in(dev, n);
 -        }
 -        busdev = SYS_BUS_DEVICE(dev);
 -
 -        /* Connect IRQ Gate output to CPU's IRQ line */
 -        sysbus_connect_irq(busdev, 0,
 -                           qdev_get_gpio_in(DEVICE(s->cpu[i]), ARM_CPU_IRQ));
 +        DeviceState *orgate = DEVICE(&s->cpu_irq_orgate[i]);
 +        object_property_set_int(OBJECT(orgate), "num-lines",
 +                                EXYNOS4210_IRQ_GATE_NINPUTS,
 +                                &error_abort);
 +        qdev_realize(orgate, NULL, &error_abort);
 +        qdev_connect_gpio_out(orgate, 0,
 +                              qdev_get_gpio_in(DEVICE(s->cpu[i]), ARM_CPU_IRQ));
      }
      /* Private memory region and Internal GIC */
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
      sysbus_realize_and_unref(busdev, &error_fatal);
      sysbus_mmio_map(busdev, 0, EXYNOS4210_SMP_PRIVATE_BASE_ADDR);
      for (n = 0; n < EXYNOS4210_NCPUS; n++) {
 -        sysbus_connect_irq(busdev, n, gate_irq[n][0]);
 +        sysbus_connect_irq(busdev, n,
 +                           qdev_get_gpio_in(DEVICE(&s->cpu_irq_orgate[n]), 0));
      }
      for (n = 0; n < EXYNOS4210_INT_GIC_NIRQ; n++) {
          s->irqs.int_gic_irq[n] = qdev_get_gpio_in(dev, n);
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
      /* Map Distributer interface */
      sysbus_mmio_map(busdev, 1, EXYNOS4210_EXT_GIC_DIST_BASE_ADDR);
      for (n = 0; n < EXYNOS4210_NCPUS; n++) {
 -        sysbus_connect_irq(busdev, n, gate_irq[n][1]);
 +        sysbus_connect_irq(busdev, n,
 +                           qdev_get_gpio_in(DEVICE(&s->cpu_irq_orgate[n]), 1));
      }
      for (n = 0; n < EXYNOS4210_EXT_GIC_NIRQ; n++) {
          s->irqs.ext_gic_irq[n] = qdev_get_gpio_in(dev, n);
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init(Object *obj)
          object_initialize_child(obj, name, orgate, TYPE_OR_IRQ);
          g_free(name);
      }
 +
- VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
++    for (i = 0; i < ARRAY_SIZE(s->cpu_irq_orgate); i++) {
++        g_autofree char *name = g_strdup_printf("cpu-irq-orgate%d", i);
- VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
++        object_initialize_child(obj, name, &s->cpu_irq_orgate[i], TYPE_OR_IRQ);
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++    }
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VRSQRTS_fp_3s);
  }
-+static void gen_VFMA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
+ static void exynos4210_class_init(ObjectClass *klass, void *data)
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 +}
 +
 +static bool trans_VFMA_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!dc_isar_feature(aa32_simdfmac, s)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_VFMA_fp_3s, true);
 +}
 +
 +static void gen_VFMS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_negs(vn, vn);
 +    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 +}
 +
 +static bool trans_VFMS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!dc_isar_feature(aa32_simdfmac, s)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_VFMS_fp_3s, true);
 +}
 +
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
      /* FP operations handled pairwise 32 bits at a time */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_neon_narrow_op(int op, int u, int size,
      }
  }
 -/* Symbolic constants for op fields for Neon 3-register same-length.
 - * The values correspond to bits [11:8,4]; see the ARM ARM DDI0406B
 - * table A7-9.
 - */
 -#define NEON_3R_VHADD 0
 -#define NEON_3R_VQADD 1
 -#define NEON_3R_VRHADD 2
 -#define NEON_3R_LOGIC 3 /* VAND,VBIC,VORR,VMOV,VORN,VEOR,VBIF,VBIT,VBSL */
 -#define NEON_3R_VHSUB 4
 -#define NEON_3R_VQSUB 5
 -#define NEON_3R_VCGT 6
 -#define NEON_3R_VCGE 7
 -#define NEON_3R_VSHL 8
 -#define NEON_3R_VQSHL 9
 -#define NEON_3R_VRSHL 10
 -#define NEON_3R_VQRSHL 11
 -#define NEON_3R_VMAX 12
 -#define NEON_3R_VMIN 13
 -#define NEON_3R_VABD 14
 -#define NEON_3R_VABA 15
 -#define NEON_3R_VADD_VSUB 16
 -#define NEON_3R_VTST_VCEQ 17
 -#define NEON_3R_VML 18 /* VMLA, VMLS */
 -#define NEON_3R_VMUL 19
 -#define NEON_3R_VPMAX 20
 -#define NEON_3R_VPMIN 21
 -#define NEON_3R_VQDMULH_VQRDMULH 22
 -#define NEON_3R_VPADD_VQRDMLAH 23
 -#define NEON_3R_SHA 24 /* SHA1C,SHA1P,SHA1M,SHA1SU0,SHA256H{2},SHA256SU1 */
 -#define NEON_3R_VFM_VQRDMLSH 25 /* VFMA, VFMS, VQRDMLSH */
 -#define NEON_3R_FLOAT_ARITH 26 /* float VADD, VSUB, VPADD, VABD */
 -#define NEON_3R_FLOAT_MULTIPLY 27 /* float VMLA, VMLS, VMUL */
 -#define NEON_3R_FLOAT_CMP 28 /* float VCEQ, VCGE, VCGT */
 -#define NEON_3R_FLOAT_ACMP 29 /* float VACGE, VACGT, VACLE, VACLT */
 -#define NEON_3R_FLOAT_MINMAX 30 /* float VMIN, VMAX */
 -#define NEON_3R_FLOAT_MISC 31 /* float VRECPS, VRSQRTS, VMAXNM/MINNM */
 -
 -static const uint8_t neon_3r_sizes[] = {
 -    [NEON_3R_VHADD] = 0x7,
 -    [NEON_3R_VQADD] = 0xf,
 -    [NEON_3R_VRHADD] = 0x7,
 -    [NEON_3R_LOGIC] = 0xf, /* size field encodes op type */
 -    [NEON_3R_VHSUB] = 0x7,
 -    [NEON_3R_VQSUB] = 0xf,
 -    [NEON_3R_VCGT] = 0x7,
 -    [NEON_3R_VCGE] = 0x7,
 -    [NEON_3R_VSHL] = 0xf,
 -    [NEON_3R_VQSHL] = 0xf,
 -    [NEON_3R_VRSHL] = 0xf,
 -    [NEON_3R_VQRSHL] = 0xf,
 -    [NEON_3R_VMAX] = 0x7,
 -    [NEON_3R_VMIN] = 0x7,
 -    [NEON_3R_VABD] = 0x7,
 -    [NEON_3R_VABA] = 0x7,
 -    [NEON_3R_VADD_VSUB] = 0xf,
 -    [NEON_3R_VTST_VCEQ] = 0x7,
 -    [NEON_3R_VML] = 0x7,
 -    [NEON_3R_VMUL] = 0x7,
 -    [NEON_3R_VPMAX] = 0x7,
 -    [NEON_3R_VPMIN] = 0x7,
 -    [NEON_3R_VQDMULH_VQRDMULH] = 0x6,
 -    [NEON_3R_VPADD_VQRDMLAH] = 0x7,
 -    [NEON_3R_SHA] = 0xf, /* size field encodes op type */
 -    [NEON_3R_VFM_VQRDMLSH] = 0x7, /* For VFM, size bit 1 encodes op */
 -    [NEON_3R_FLOAT_ARITH] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_MULTIPLY] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_CMP] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_ACMP] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_MINMAX] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_MISC] = 0x5, /* size bit 1 encodes op */
 -};
 -
  /* Symbolic constants for op fields for Neon 2-register miscellaneous.
   * The values correspond to bits [17:16,10:7]; see the ARM ARM DDI0406B
   * table A7-13.
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
      rm_ofs = neon_reg_offset(rm, 0);
      if ((insn & (1 << 23)) == 0) {
 -        /* Three register same length.  */
 -        op = ((insn >> 7) & 0x1e) | ((insn >> 4) & 1);
 -        /* Catch invalid op and bad size combinations: UNDEF */
 -        if ((neon_3r_sizes[op] & (1 << size)) == 0) {
 -            return 1;
 -        }
 -        /* All insns of this form UNDEF for either this condition or the
 -         * superset of cases "Q==1"; we catch the latter later.
 -         */
 -        if (q && ((rd | rn | rm) & 1)) {
 -            return 1;
 -        }
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -            if (!u) {
 -                /* VFM, VFMS */
 -                if (size == 1) {
 -                    return 1;
 -                }
 -                break;
 -            }
 -            /* VQRDMLSH : handled by decodetree */
 -            return 1;
 -
 -        case NEON_3R_VADD_VSUB:
 -        case NEON_3R_LOGIC:
 -        case NEON_3R_VMAX:
 -        case NEON_3R_VMIN:
 -        case NEON_3R_VTST_VCEQ:
 -        case NEON_3R_VCGT:
 -        case NEON_3R_VCGE:
 -        case NEON_3R_VQADD:
 -        case NEON_3R_VQSUB:
 -        case NEON_3R_VMUL:
 -        case NEON_3R_VML:
 -        case NEON_3R_VSHL:
 -        case NEON_3R_SHA:
 -        case NEON_3R_VHADD:
 -        case NEON_3R_VRHADD:
 -        case NEON_3R_VHSUB:
 -        case NEON_3R_VABD:
 -        case NEON_3R_VABA:
 -        case NEON_3R_VQSHL:
 -        case NEON_3R_VRSHL:
 -        case NEON_3R_VQRSHL:
 -        case NEON_3R_VPMAX:
 -        case NEON_3R_VPMIN:
 -        case NEON_3R_VPADD_VQRDMLAH:
 -        case NEON_3R_VQDMULH_VQRDMULH:
 -        case NEON_3R_FLOAT_ARITH:
 -        case NEON_3R_FLOAT_MULTIPLY:
 -        case NEON_3R_FLOAT_CMP:
 -        case NEON_3R_FLOAT_ACMP:
 -        case NEON_3R_FLOAT_MINMAX:
 -        case NEON_3R_FLOAT_MISC:
 -            /* Already handled by decodetree */
 -            return 1;
 -        }
 -
 -        if (size == 3) {
 -            /* 64-bit element instructions: handled by decodetree */
 -            return 1;
 -        }
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -            if (!dc_isar_feature(aa32_simdfmac, s)) {
 -                return 1;
 -            }
 -            break;
 -        default:
 -            break;
 -        }
 -
 -        for (pass = 0; pass < (q ? 4 : 2); pass++) {
 -
 -        /* Elementwise.  */
 -        tmp = neon_load_reg(rn, pass);
 -        tmp2 = neon_load_reg(rm, pass);
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -        {
 -            /* VFMA, VFMS: fused multiply-add */
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            TCGv_i32 tmp3 = neon_load_reg(rd, pass);
 -            if (size) {
 -                /* VFMS */
 -                gen_helper_vfp_negs(tmp, tmp);
 -            }
 -            gen_helper_vfp_muladds(tmp, tmp, tmp2, tmp3, fpstatus);
 -            tcg_temp_free_i32(tmp3);
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        default:
 -            abort();
 -        }
 -        tcg_temp_free_i32(tmp2);
 -
 -        neon_store_reg(rd, pass, tmp);
 -
 -        } /* for pass */
 -        /* End of 3 register same size operations.  */
 +        /* Three register same length: handled by decodetree */
 +        return 1;
      } else if (insn & (1 << 4)) {
          if ((insn & 0x00380080) != 0) {
              /* Two registers and shift.  */
 --
-.20.1
+.25.1

-[PULL 07/45] target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
+[PULL 09/31] hw/intc/exynos4210_gic: Remove unused TYPE_EXYNOS4210_IRQ_GATE
-From: Richard Henderson <richard.henderson@linaro.org>
+Now we have removed the only use of TYPE_EXYNOS4210_IRQ_GATE we can
 delete the device entirely.
-Provide a functional interface for the vector expansion.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-This fits better with the existing set of helpers that
+Reviewed-by: Francisco Iglesias <frasse.iglesias@gmail.com>
-we provide for other operations.
+Message-id: 20220404154658.565020-3-peter.maydell@linaro.org
 ---
  hw/intc/exynos4210_gic.c | 107 ---------------------------------------
 file changed, 107 deletions(-)
-Macro-ize the 5 nearly identical comparisons.
+diff --git a/hw/intc/exynos4210_gic.c b/hw/intc/exynos4210_gic.c
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-7-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/translate.h     |  16 ++-
  target/arm/translate-a64.c |  22 ++--
  target/arm/translate.c     | 254 ++++++++-----------------------------
 files changed, 74 insertions(+), 218 deletions(-)
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/hw/intc/exynos4210_gic.c
-+++ b/target/arm/translate.h
++++ b/hw/intc/exynos4210_gic.c
-@@ -XXX,XX +XXX,XX @@ static inline void gen_swstep_exception(DisasContext *s, int isv, int ex)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_gic_register_types(void)
  uint64_t vfp_expand_imm(int size, uint8_t imm8);
  /* Vector operations shared between ARM and AArch64.  */
 -extern const GVecGen2 ceq0_op[4];
 -extern const GVecGen2 clt0_op[4];
 -extern const GVecGen2 cgt0_op[4];
 -extern const GVecGen2 cle0_op[4];
 -extern const GVecGen2 cge0_op[4];
 +void gen_gvec_ceq0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_clt0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cgt0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cle0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cge0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +
  extern const GVecGen3 mla_op[4];
  extern const GVecGen3 mls_op[4];
  extern const GVecGen3 cmtst_op[4];
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn4(DisasContext *s, bool is_q, int rd, int rn, int rm,
              is_q ? 16 : 8, vec_full_reg_size(s));
  }
--/* Expand a 2-operand AdvSIMD vector operation using an op descriptor. */
+ type_init(exynos4210_gic_register_types)
--static void gen_gvec_op2(DisasContext *s, bool is_q, int rd,
+-
--                         int rn, const GVecGen2 *gvec_op)
+-/* IRQ OR Gate struct.
 - *
 - * This device models an OR gate. There are n_in input qdev gpio lines and one
 - * output sysbus IRQ line. The output IRQ level is formed as OR between all
 - * gpio inputs.
 - */
 -
 -#define TYPE_EXYNOS4210_IRQ_GATE "exynos4210.irq_gate"
 -OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210IRQGateState, EXYNOS4210_IRQ_GATE)
 -
 -struct Exynos4210IRQGateState {
 -    SysBusDevice parent_obj;
 -
 -    uint32_t n_in;      /* inputs amount */
 -    uint32_t *level;    /* input levels */
 -    qemu_irq out;       /* output IRQ */
 -};
 -
 -static Property exynos4210_irq_gate_properties[] = {
 -    DEFINE_PROP_UINT32("n_in", Exynos4210IRQGateState, n_in, 1),
 -    DEFINE_PROP_END_OF_LIST(),
 -};
 -
 -static const VMStateDescription vmstate_exynos4210_irq_gate = {
 -    .name = "exynos4210.irq_gate",
 -    .version_id = 2,
 -    .minimum_version_id = 2,
 -    .fields = (VMStateField[]) {
 -        VMSTATE_VBUFFER_UINT32(level, Exynos4210IRQGateState, 1, NULL, n_in),
 -        VMSTATE_END_OF_LIST()
 -    }
 -};
 -
 -/* Process a change in IRQ input. */
 -static void exynos4210_irq_gate_handler(void *opaque, int irq, int level)
 -{
--    tcg_gen_gvec_2(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
+-    Exynos4210IRQGateState *s = (Exynos4210IRQGateState *)opaque;
--                   is_q ? 16 : 8, vec_full_reg_size(s), gvec_op);
+-    uint32_t i;
 -
 -    assert(irq < s->n_in);
 -
 -    s->level[irq] = level;
 -
 -    for (i = 0; i < s->n_in; i++) {
 -        if (s->level[i] >= 1) {
 -            qemu_irq_raise(s->out);
 -            return;
 -        }
 -    }
 -
 -    qemu_irq_lower(s->out);
 -}
 -
- /* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
+-static void exynos4210_irq_gate_reset(DeviceState *d)
  static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
                           int rn, int rm, const GVecGen3 *gvec_op)
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          }
          break;
      case 0x8: /* CMGT, CMGE */
 -        gen_gvec_op2(s, is_q, rd, rn, u ? &cge0_op[size] : &cgt0_op[size]);
 +        if (u) {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
 +        } else {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cgt0, size);
 +        }
          return;
      case 0x9: /* CMEQ, CMLE */
 -        gen_gvec_op2(s, is_q, rd, rn, u ? &cle0_op[size] : &ceq0_op[size]);
 +        if (u) {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cle0, size);
 +        } else {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_ceq0, size);
 +        }
          return;
      case 0xa: /* CMLT */
 -        gen_gvec_op2(s, is_q, rd, rn, &clt0_op[size]);
 +        gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
          return;
      case 0xb:
          if (u) { /* ABS, NEG */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int do_v81_helper(DisasContext *s, gen_helper_gvec_3_ptr *fn,
      return 1;
  }
 -static void gen_ceq0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
--    tcg_gen_setcondi_i32(TCG_COND_EQ, d, a, 0);
+-    Exynos4210IRQGateState *s = EXYNOS4210_IRQ_GATE(d);
--    tcg_gen_neg_i32(d, d);
+-
 -    memset(s->level, 0, s->n_in * sizeof(*s->level));
 -}
 -
--static void gen_ceq0_i64(TCGv_i64 d, TCGv_i64 a)
+-/*
 - * IRQ Gate initialization.
 - */
 -static void exynos4210_irq_gate_init(Object *obj)
 -{
--    tcg_gen_setcondi_i64(TCG_COND_EQ, d, a, 0);
+-    Exynos4210IRQGateState *s = EXYNOS4210_IRQ_GATE(obj);
--    tcg_gen_neg_i64(d, d);
+-    SysBusDevice *sbd = SYS_BUS_DEVICE(obj);
 -
 -    sysbus_init_irq(sbd, &s->out);
 -}
 -
--static void gen_ceq0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
+-static void exynos4210_irq_gate_realize(DeviceState *dev, Error **errp)
 -{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
+-    Exynos4210IRQGateState *s = EXYNOS4210_IRQ_GATE(dev);
--    tcg_gen_cmp_vec(TCG_COND_EQ, vece, d, a, zero);
+-
--    tcg_temp_free_vec(zero);
+-    /* Allocate general purpose input signals and connect a handler to each of
--}
+-     * them */
-+#define GEN_CMP0(NAME, COND)                                            \
+-    qdev_init_gpio_in(dev, exynos4210_irq_gate_handler, s->n_in);
-+    static void gen_##NAME##0_i32(TCGv_i32 d, TCGv_i32 a)               \
+-
-+    {                                                                   \
+-    s->level = g_malloc0(s->n_in * sizeof(*s->level));
 +        tcg_gen_setcondi_i32(COND, d, a, 0);                            \
 +        tcg_gen_neg_i32(d, d);                                          \
 +    }                                                                   \
 +    static void gen_##NAME##0_i64(TCGv_i64 d, TCGv_i64 a)               \
 +    {                                                                   \
 +        tcg_gen_setcondi_i64(COND, d, a, 0);                            \
 +        tcg_gen_neg_i64(d, d);                                          \
 +    }                                                                   \
 +    static void gen_##NAME##0_vec(unsigned vece, TCGv_vec d, TCGv_vec a) \
 +    {                                                                   \
 +        TCGv_vec zero = tcg_const_zeros_vec_matching(d);                \
 +        tcg_gen_cmp_vec(COND, vece, d, a, zero);                        \
 +        tcg_temp_free_vec(zero);                                        \
 +    }                                                                   \
 +    void gen_gvec_##NAME##0(unsigned vece, uint32_t d, uint32_t m,      \
 +                            uint32_t opr_sz, uint32_t max_sz)           \
 +    {                                                                   \
 +        const GVecGen2 op[4] = {                                        \
 +            { .fno = gen_helper_gvec_##NAME##0_b,                       \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .vece = MO_8 },                                           \
 +            { .fno = gen_helper_gvec_##NAME##0_h,                       \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .vece = MO_16 },                                          \
 +            { .fni4 = gen_##NAME##0_i32,                                \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .vece = MO_32 },                                          \
 +            { .fni8 = gen_##NAME##0_i64,                                \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .prefer_i64 = TCG_TARGET_REG_BITS == 64,                  \
 +              .vece = MO_64 },                                          \
 +        };                                                              \
 +        tcg_gen_gvec_2(d, m, opr_sz, max_sz, &op[vece]);                \
 +    }
  static const TCGOpcode vecop_list_cmp[] = {
      INDEX_op_cmp_vec, 0
  };
 -const GVecGen2 ceq0_op[4] = {
 -    { .fno = gen_helper_gvec_ceq0_b,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_ceq0_h,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_ceq0_i32,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_ceq0_i64,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 +GEN_CMP0(ceq, TCG_COND_EQ)
 +GEN_CMP0(cle, TCG_COND_LE)
 +GEN_CMP0(cge, TCG_COND_GE)
 +GEN_CMP0(clt, TCG_COND_LT)
 +GEN_CMP0(cgt, TCG_COND_GT)
 -static void gen_cle0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_LE, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
--static void gen_cle0_i64(TCGv_i64 d, TCGv_i64 a)
+-static void exynos4210_irq_gate_class_init(ObjectClass *klass, void *data)
 -{
--    tcg_gen_setcondi_i64(TCG_COND_LE, d, a, 0);
+-    DeviceClass *dc = DEVICE_CLASS(klass);
--    tcg_gen_neg_i64(d, d);
+-
 -    dc->reset = exynos4210_irq_gate_reset;
 -    dc->vmsd = &vmstate_exynos4210_irq_gate;
 -    device_class_set_props(dc, exynos4210_irq_gate_properties);
 -    dc->realize = exynos4210_irq_gate_realize;
 -}
 -
--static void gen_cle0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
+-static const TypeInfo exynos4210_irq_gate_info = {
 -    .name          = TYPE_EXYNOS4210_IRQ_GATE,
 -    .parent        = TYPE_SYS_BUS_DEVICE,
 -    .instance_size = sizeof(Exynos4210IRQGateState),
 -    .instance_init = exynos4210_irq_gate_init,
 -    .class_init    = exynos4210_irq_gate_class_init,
 -};
 -
 -static void exynos4210_irq_gate_register_types(void)
 -{
--    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
+-    type_register_static(&exynos4210_irq_gate_info);
 -    tcg_gen_cmp_vec(TCG_COND_LE, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
--const GVecGen2 cle0_op[4] = {
+-type_init(exynos4210_irq_gate_register_types)
 -    { .fno = gen_helper_gvec_cle0_b,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_cle0_h,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cle0_i32,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cle0_i64,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 -
 -static void gen_cge0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_GE, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_cge0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_GE, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_cge0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_GE, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 cge0_op[4] = {
 -    { .fno = gen_helper_gvec_cge0_b,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_cge0_h,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cge0_i32,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cge0_i64,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 -
 -static void gen_clt0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_LT, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_clt0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_LT, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_clt0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_LT, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 clt0_op[4] = {
 -    { .fno = gen_helper_gvec_clt0_b,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_clt0_h,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_clt0_i32,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_clt0_i64,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 -
 -static void gen_cgt0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_GT, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_cgt0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_GT, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_cgt0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_GT, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 cgt0_op[4] = {
 -    { .fno = gen_helper_gvec_cgt0_b,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_cgt0_h,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cgt0_i32,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cgt0_i64,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 +#undef GEN_CMP0
  static void gen_ssra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                      break;
                  case NEON_2RM_VCEQ0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &ceq0_op[size]);
 +                    gen_gvec_ceq0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCGT0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &cgt0_op[size]);
 +                    gen_gvec_cgt0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCLE0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &cle0_op[size]);
 +                    gen_gvec_cle0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCGE0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &cge0_op[size]);
 +                    gen_gvec_cge0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCLT0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &clt0_op[size]);
 +                    gen_gvec_clt0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  default:
 --
-.20.1
+.25.1

-[PULL 42/45] target/arm: Convert Neon 3-reg-same compare insns to decodetree
+[PULL 10/31] hw/arm/exynos4210: Put a9mpcore device into state struct
-Convert the Neon integer 3-reg-same compare insns VCGE, VCGT,
+The exynos4210 SoC mostly creates its child devices as if it were
-VCEQ, VACGE and VACGT to decodetree.
+board code.  This includes the a9mpcore object.  Switch that to a
 new-style "embedded in the state struct" creation, because in the
 next commit we're going to want to refer to the object again further
 down in the exynos4210_realize() function.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-15-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-4-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  5 +++++
+ include/hw/arm/exynos4210.h |  2 ++
- target/arm/translate-neon.inc.c |  6 +++++
+ hw/arm/exynos4210.c         | 11 ++++++-----
- target/arm/translate.c          | 39 ++-------------------------------
+files changed, 8 insertions(+), 5 deletions(-)
 files changed, 13 insertions(+), 37 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@
- VMLA_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
- VMLS_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 1 .... @3same_fp
+ #include "hw/or-irq.h"
- VMUL_fp_3s       1111 001 1 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
+ #include "hw/sysbus.h"
-+VCEQ_fp_3s       1111 001 0 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
++#include "hw/cpu/a9mpcore.h"
-+VCGE_fp_3s       1111 001 1 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
+ #include "target/arm/cpu-qom.h"
-+VACGE_fp_3s      1111 001 1 0 . 0 . .... .... 1110 ... 1 .... @3same_fp
+ #include "qom/object.h"
-+VCGT_fp_3s       1111 001 1 0 . 1 . .... .... 1110 ... 0 .... @3same_fp
-+VACGT_fp_3s      1111 001 1 0 . 1 . .... .... 1110 ... 1 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@ struct Exynos4210State {
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
+     I2CBus *i2c_if[EXYNOS4210_I2C_NUMBER];
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
+     qemu_or_irq pl330_irq_orgate[EXYNOS4210_NUM_DMA];
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+     qemu_or_irq cpu_irq_orgate[EXYNOS4210_NCPUS];
 +    A9MPPrivState a9mpcore;
  };
  #define TYPE_EXYNOS4210_SOC "exynos4210"
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
          return do_3same_fp(s, a, FUNC, READS_VD);                   \
      }
-+DO_3S_FP(VCEQ, gen_helper_neon_ceq_f32, false)
+     /* Private memory region and Internal GIC */
-+DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
+-    dev = qdev_new(TYPE_A9MPCORE_PRIV);
-+DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
+-    qdev_prop_set_uint32(dev, "num-cpu", EXYNOS4210_NCPUS);
-+DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
+-    busdev = SYS_BUS_DEVICE(dev);
-+DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
+-    sysbus_realize_and_unref(busdev, &error_fatal);
 +    qdev_prop_set_uint32(DEVICE(&s->a9mpcore), "num-cpu", EXYNOS4210_NCPUS);
 +    busdev = SYS_BUS_DEVICE(&s->a9mpcore);
 +    sysbus_realize(busdev, &error_fatal);
      sysbus_mmio_map(busdev, 0, EXYNOS4210_SMP_PRIVATE_BASE_ADDR);
      for (n = 0; n < EXYNOS4210_NCPUS; n++) {
          sysbus_connect_irq(busdev, n,
                             qdev_get_gpio_in(DEVICE(&s->cpu_irq_orgate[n]), 0));
      }
      for (n = 0; n < EXYNOS4210_INT_GIC_NIRQ; n++) {
 -        s->irqs.int_gic_irq[n] = qdev_get_gpio_in(dev, n);
 +        s->irqs.int_gic_irq[n] = qdev_get_gpio_in(DEVICE(&s->a9mpcore), n);
      }
      /* Cache controller */
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init(Object *obj)
          g_autofree char *name = g_strdup_printf("cpu-irq-orgate%d", i);
          object_initialize_child(obj, name, &s->cpu_irq_orgate[i], TYPE_OR_IRQ);
      }
 +
- static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
++    object_initialize_child(obj, "a9mpcore", &s->a9mpcore, TYPE_A9MPCORE_PRIV);
-                             TCGv_ptr fpstatus)
+ }
- {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+ static void exynos4210_class_init(ObjectClass *klass, void *data)
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQDMULH_VQRDMULH:
          case NEON_3R_FLOAT_ARITH:
          case NEON_3R_FLOAT_MULTIPLY:
 +        case NEON_3R_FLOAT_CMP:
 +        case NEON_3R_FLOAT_ACMP:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  return 1; /* VPMIN/VPMAX handled by decodetree */
              }
              break;
 -        case NEON_3R_FLOAT_CMP:
 -            if (!u && size) {
 -                /* no encoding for U=0 C=1x */
 -                return 1;
 -            }
 -            break;
 -        case NEON_3R_FLOAT_ACMP:
 -            if (!u) {
 -                return 1;
 -            }
 -            break;
          case NEON_3R_FLOAT_MISC:
              /* VMAXNM/VMINNM in ARMv8 */
              if (u && !arm_dc_feature(s, ARM_FEATURE_V8)) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_CMP:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (!u) {
 -                gen_helper_neon_ceq_f32(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                if (size == 0) {
 -                    gen_helper_neon_cge_f32(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_neon_cgt_f32(tmp, tmp, tmp2, fpstatus);
 -                }
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        case NEON_3R_FLOAT_ACMP:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (size == 0) {
 -                gen_helper_neon_acge_f32(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                gen_helper_neon_acgt_f32(tmp, tmp, tmp2, fpstatus);
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
          case NEON_3R_FLOAT_MINMAX:
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
-.20.1
+.25.1

-[PULL 44/45] target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
+[PULL 11/31] hw/arm/exynos4210: Drop int_gic_irq[] from Exynos4210Irq struct
-Convert the Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS 3-reg-same
+The only time we use the int_gic_irq[] array in the Exynos4210Irq
-insns to decodetree. (These are all the remaining non-accumulation
+struct is in the exynos4210_realize() function: we initialize it with
-instructions in this group.)
+the GPIO inputs of the a9mpcore device, and then a bit later on we
 connect those to the outputs of the internal combiner.  Now that the
 a9mpcore object is easily accessible as s->a9mpcore we can make the
 connection directly from one device to the other without going via
 this array.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-17-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-5-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  6 +++
+ include/hw/arm/exynos4210.h | 1 -
- target/arm/translate-neon.inc.c | 70 +++++++++++++++++++++++++++++++++
+ hw/arm/exynos4210.c         | 6 ++----
- target/arm/translate.c          | 42 +-------------------
+files changed, 2 insertions(+), 5 deletions(-)
 files changed, 78 insertions(+), 40 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ VCGE_fp_3s       1111 001 1 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@
- VACGE_fp_3s      1111 001 1 0 . 0 . .... .... 1110 ... 1 .... @3same_fp
+ typedef struct Exynos4210Irq {
- VCGT_fp_3s       1111 001 1 0 . 1 . .... .... 1110 ... 0 .... @3same_fp
+     qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
- VACGT_fp_3s      1111 001 1 0 . 1 . .... .... 1110 ... 1 .... @3same_fp
+     qemu_irq ext_combiner_irq[EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ];
-+VMAX_fp_3s       1111 001 0 0 . 0 . .... .... 1111 ... 0 .... @3same_fp
+-    qemu_irq int_gic_irq[EXYNOS4210_INT_GIC_NIRQ];
-+VMIN_fp_3s       1111 001 0 0 . 1 . .... .... 1111 ... 0 .... @3same_fp
+     qemu_irq ext_gic_irq[EXYNOS4210_EXT_GIC_NIRQ];
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
+     qemu_irq board_irqs[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
+ } Exynos4210Irq;
-+VRECPS_fp_3s     1111 001 0 0 . 0 . .... .... 1111 ... 1 .... @3same_fp
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 +VRSQRTS_fp_3s    1111 001 0 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
 +VMAXNM_fp_3s     1111 001 1 0 . 0 . .... .... 1111 ... 1 .... @3same_fp
 +VMINNM_fp_3s     1111 001 1 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
- DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
+         sysbus_connect_irq(busdev, n,
- DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
+                            qdev_get_gpio_in(DEVICE(&s->cpu_irq_orgate[n]), 0));
- DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
+     }
-+DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
+-    for (n = 0; n < EXYNOS4210_INT_GIC_NIRQ; n++) {
-+DO_3S_FP(VMIN, gen_helper_vfp_mins, false)
+-        s->irqs.int_gic_irq[n] = qdev_get_gpio_in(DEVICE(&s->a9mpcore), n);
+-    }
- static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-                             TCGv_ptr fpstatus)
+     /* Cache controller */
-@@ -XXX,XX +XXX,XX @@ static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
+     sysbus_create_simple("l2x0", EXYNOS4210_L2X0_BASE_ADDR, NULL);
- DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
- DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
+     busdev = SYS_BUS_DEVICE(dev);
+     sysbus_realize_and_unref(busdev, &error_fatal);
-+static bool trans_VMAXNM_fp_3s(DisasContext *s, arg_3same *a)
+     for (n = 0; n < EXYNOS4210_MAX_INT_COMBINER_OUT_IRQ; n++) {
-+{
+-        sysbus_connect_irq(busdev, n, s->irqs.int_gic_irq[n]);
-+    if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
++        sysbus_connect_irq(busdev, n,
-+        return false;
++                           qdev_get_gpio_in(DEVICE(&s->a9mpcore), n));
-+    }
+     }
-+
+     exynos4210_combiner_get_gpioin(&s->irqs, dev, 0);
-+    if (a->size != 0) {
+     sysbus_mmio_map(busdev, 0, EXYNOS4210_INT_COMBINER_BASE_ADDR);
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_helper_vfp_maxnums, false);
 +}
 +
 +static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_helper_vfp_minnums, false);
 +}
 +
 +WRAP_ENV_FN(gen_VRECPS_tramp, gen_helper_recps_f32)
 +
 +static void gen_VRECPS_fp_3s(unsigned vece, uint32_t rd_ofs,
 +                             uint32_t rn_ofs, uint32_t rm_ofs,
 +                             uint32_t oprsz, uint32_t maxsz)
 +{
 +    static const GVecGen3 ops = { .fni4 = gen_VRECPS_tramp };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
 +}
 +
 +static bool trans_VRECPS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same(s, a, gen_VRECPS_fp_3s);
 +}
 +
 +WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
 +
 +static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
 +                              uint32_t rn_ofs, uint32_t rm_ofs,
 +                              uint32_t oprsz, uint32_t maxsz)
 +{
 +    static const GVecGen3 ops = { .fni4 = gen_VRSQRTS_tramp };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
 +}
 +
 +static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same(s, a, gen_VRSQRTS_fp_3s);
 +}
 +
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
      /* FP operations handled pairwise 32 bits at a time */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_FLOAT_MULTIPLY:
          case NEON_3R_FLOAT_CMP:
          case NEON_3R_FLOAT_ACMP:
 +        case NEON_3R_FLOAT_MINMAX:
 +        case NEON_3R_FLOAT_MISC:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              return 1;
          }
          switch (op) {
 -        case NEON_3R_FLOAT_MINMAX:
 -            if (u) {
 -                return 1; /* VPMIN/VPMAX handled by decodetree */
 -            }
 -            break;
 -        case NEON_3R_FLOAT_MISC:
 -            /* VMAXNM/VMINNM in ARMv8 */
 -            if (u && !arm_dc_feature(s, ARM_FEATURE_V8)) {
 -                return 1;
 -            }
 -            break;
          case NEON_3R_VFM_VQRDMLSH:
              if (!dc_isar_feature(aa32_simdfmac, s)) {
                  return 1;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_MINMAX:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (size == 0) {
 -                gen_helper_vfp_maxs(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                gen_helper_vfp_mins(tmp, tmp, tmp2, fpstatus);
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        case NEON_3R_FLOAT_MISC:
 -            if (u) {
 -                /* VMAXNM/VMINNM */
 -                TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                if (size == 0) {
 -                    gen_helper_vfp_maxnums(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_vfp_minnums(tmp, tmp, tmp2, fpstatus);
 -                }
 -                tcg_temp_free_ptr(fpstatus);
 -            } else {
 -                if (size == 0) {
 -                    gen_helper_recps_f32(tmp, cpu_env, tmp, tmp2);
 -                } else {
 -                    gen_helper_rsqrts_f32(tmp, cpu_env, tmp, tmp2);
 -              }
 -            }
 -            break;
          case NEON_3R_VFM_VQRDMLSH:
          {
              /* VFMA, VFMS: fused multiply-add */
 --
-.20.1
+.25.1

-[PULL 35/45] target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
+[PULL 12/31] hw/arm/exynos4210: Coalesce board_irqs and irq_table
-Convert the VQSHL, VRSHL and VQRSHL insns in the 3-reg-same
+The exynos4210 code currently has two very similar arrays of IRQs:
-group to decodetree. We have already implemented the size==0b11
-case of these insns; this commit handles the remaining sizes.
+ * board_irqs is a field of the Exynos4210Irq struct which is filled
    in by exynos4210_init_board_irqs() with the appropriate qemu_irqs
    for each IRQ the board/SoC can assert
  * irq_table is a set of qemu_irqs pointed to from the
    Exynos4210State struct.  It's allocated in exynos4210_init_irq,
    and the only behaviour these irqs have is that they pass on the
    level to the equivalent board_irqs[] irq
 The extra indirection through irq_table is unnecessary, so coalesce
 these into a single irq_table[] array as a direct field in
 Exynos4210State which exynos4210_init_board_irqs() fills in.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-8-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-6-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       | 30 ++++++++++++++++++-----
+ include/hw/arm/exynos4210.h |  8 ++------
- target/arm/translate-neon.inc.c | 43 +++++++++++++++++++++++++++++++++
+ hw/arm/exynos4210.c         |  6 +-----
- target/arm/translate.c          | 22 +++--------------
+ hw/intc/exynos4210_gic.c    | 32 ++++++++------------------------
-files changed, 70 insertions(+), 25 deletions(-)
+files changed, 11 insertions(+), 35 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
+@@ -XXX,XX +XXX,XX @@ typedef struct Exynos4210Irq {
- @3same_64_rev    .... ... . . . 11 .... .... .... . q:1 . . .... \
+     qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
-                  &3same vm=%vn_dp vn=%vm_dp vd=%vd_dp size=3
+     qemu_irq ext_combiner_irq[EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ];
+     qemu_irq ext_gic_irq[EXYNOS4210_EXT_GIC_NIRQ];
--VQSHL_S64_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+-    qemu_irq board_irqs[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
--VQSHL_U64_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+ } Exynos4210Irq;
--VRSHL_S64_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
--VRSHL_U64_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
+ struct Exynos4210State {
--VQRSHL_S64_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
+@@ -XXX,XX +XXX,XX @@ struct Exynos4210State {
--VQRSHL_U64_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
+     /*< public >*/
-+{
+     ARMCPU *cpu[EXYNOS4210_NCPUS];
-+  VQSHL_S64_3s   1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+     Exynos4210Irq irqs;
-+  VQSHL_S_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_rev
+-    qemu_irq *irq_table;
-+}
++    qemu_irq irq_table[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
-+{
-+  VQSHL_U64_3s   1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+     MemoryRegion chipid_mem;
-+  VQSHL_U_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_rev
+     MemoryRegion iram_mem;
-+}
+@@ -XXX,XX +XXX,XX @@ OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210State, EXYNOS4210_SOC)
-+{
+ void exynos4210_write_secondary(ARMCPU *cpu,
-+  VRSHL_S64_3s   1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
+         const struct arm_boot_info *info);
-+  VRSHL_S_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_rev
-+}
+-/* Initialize exynos4210 IRQ subsystem stub */
-+{
+-qemu_irq *exynos4210_init_irq(Exynos4210Irq *env);
-+  VRSHL_U64_3s   1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
+-
-+  VRSHL_U_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_rev
+ /* Initialize board IRQs.
-+}
+  * These IRQs contain splitted Int/External Combiner and External Gic IRQs */
-+{
+-void exynos4210_init_board_irqs(Exynos4210Irq *s);
-+  VQRSHL_S64_3s  1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
++void exynos4210_init_board_irqs(Exynos4210State *s);
-+  VQRSHL_S_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_rev
-+}
+ /* Get IRQ number from exynos4210 IRQ subsystem stub.
-+{
+  * To identify IRQ source use internal combiner group and bit number
-+  VQRSHL_U64_3s  1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 +  VQRSHL_U_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_rev
 +}
  VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
  VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
-         return do_3same(s, a, gen_##INSN##_3s);                         \
+         qdev_realize(DEVICE(cpuobj), NULL, &error_fatal);
      }
-+/*
+-    /*** IRQs ***/
-+ * Some helper functions need to be passed the cpu_env. In order
+-
-+ * to use those with the gvec APIs like tcg_gen_gvec_3() we need
+-    s->irq_table = exynos4210_init_irq(&s->irqs);
-+ * to create wrapper functions whose prototype is a NeonGenTwoOpFn()
+-
-+ * and which call a NeonGenTwoOpEnvFn().
+     /* IRQ Gate */
-+ */
+     for (i = 0; i < EXYNOS4210_NCPUS; i++) {
-+#define WRAP_ENV_FN(WRAPNAME, FUNC)                                     \
+         DeviceState *orgate = DEVICE(&s->cpu_irq_orgate[i]);
-+    static void WRAPNAME(TCGv_i32 d, TCGv_i32 n, TCGv_i32 m)            \
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
-+    {                                                                   \
+     sysbus_mmio_map(busdev, 0, EXYNOS4210_EXT_COMBINER_BASE_ADDR);
-+        FUNC(d, cpu_env, n, m);                                         \
-+    }
+     /* Initialize board IRQs. */
-+
+-    exynos4210_init_board_irqs(&s->irqs);
-+#define DO_3SAME_32_ENV(INSN, FUNC)                                     \
++    exynos4210_init_board_irqs(s);
-+    WRAP_ENV_FN(gen_##INSN##_tramp8, gen_helper_neon_##FUNC##8);        \
-+    WRAP_ENV_FN(gen_##INSN##_tramp16, gen_helper_neon_##FUNC##16);      \
+     /*** Memory ***/
-+    WRAP_ENV_FN(gen_##INSN##_tramp32, gen_helper_neon_##FUNC##32);      \
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
+diff --git a/hw/intc/exynos4210_gic.c b/hw/intc/exynos4210_gic.c
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        static const GVecGen3 ops[4] = {                                \
 +            { .fni4 = gen_##INSN##_tramp8 },                            \
 +            { .fni4 = gen_##INSN##_tramp16 },                           \
 +            { .fni4 = gen_##INSN##_tramp32 },                           \
 +            { 0 },                                                      \
 +        };                                                              \
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece]); \
 +    }                                                                   \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        if (a->size > 2) {                                              \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
  DO_3SAME_32(VHADD_S, hadd_s)
  DO_3SAME_32(VHADD_U, hadd_u)
  DO_3SAME_32(VHSUB_S, hsub_s)
  DO_3SAME_32(VHSUB_U, hsub_u)
  DO_3SAME_32(VRHADD_S, rhadd_s)
  DO_3SAME_32(VRHADD_U, rhadd_u)
 +DO_3SAME_32(VRSHL_S, rshl_s)
 +DO_3SAME_32(VRSHL_U, rshl_u)
 +
 +DO_3SAME_32_ENV(VQSHL_S, qshl_s)
 +DO_3SAME_32_ENV(VQSHL_U, qshl_u)
 +DO_3SAME_32_ENV(VQRSHL_S, qrshl_s)
 +DO_3SAME_32_ENV(VQRSHL_U, qrshl_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/hw/intc/exynos4210_gic.c
-+++ b/target/arm/translate.c
++++ b/hw/intc/exynos4210_gic.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ combiner_grp_to_gic_id[64-EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
-         case NEON_3R_VHSUB:
+ #define EXYNOS4210_GIC_CPU_REGION_SIZE  0x100
-         case NEON_3R_VABD:
+ #define EXYNOS4210_GIC_DIST_REGION_SIZE 0x1000
-         case NEON_3R_VABA:
-+        case NEON_3R_VQSHL:
+-static void exynos4210_irq_handler(void *opaque, int irq, int level)
-+        case NEON_3R_VRSHL:
+-{
-+        case NEON_3R_VQRSHL:
+-    Exynos4210Irq *s = (Exynos4210Irq *)opaque;
-             /* Already handled by decodetree */
+-
-             return 1;
+-    /* Bypass */
 -    qemu_set_irq(s->board_irqs[irq], level);
 -}
 -
 -/*
 - * Initialize exynos4210 IRQ subsystem stub.
 - */
 -qemu_irq *exynos4210_init_irq(Exynos4210Irq *s)
 -{
 -    return qemu_allocate_irqs(exynos4210_irq_handler, s,
 -            EXYNOS4210_MAX_INT_COMBINER_IN_IRQ);
 -}
 -
  /*
   * Initialize board IRQs.
   * These IRQs contain splitted Int/External Combiner and External Gic IRQs.
   */
 -void exynos4210_init_board_irqs(Exynos4210Irq *s)
 +void exynos4210_init_board_irqs(Exynos4210State *s)
  {
      uint32_t grp, bit, irq_id, n;
 +    Exynos4210Irq *is = &s->irqs;
      for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
          irq_id = 0;
@@ -XXX,XX +XXX,XX @@ void exynos4210_init_board_irqs(Exynos4210Irq *s)
              irq_id = EXT_GIC_ID_MCT_G1;
          }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+         if (irq_id) {
 -            s->board_irqs[n] = qemu_irq_split(s->int_combiner_irq[n],
 -                    s->ext_gic_irq[irq_id-32]);
 +            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 +                    is->ext_gic_irq[irq_id - 32]);
          } else {
 -            s->board_irqs[n] = qemu_irq_split(s->int_combiner_irq[n],
 -                    s->ext_combiner_irq[n]);
 +            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 +                    is->ext_combiner_irq[n]);
          }
-         pairwise = 0;
+     }
-         switch (op) {
+     for (; n < EXYNOS4210_MAX_INT_COMBINER_IN_IRQ; n++) {
--        case NEON_3R_VQSHL:
+@@ -XXX,XX +XXX,XX @@ void exynos4210_init_board_irqs(Exynos4210Irq *s)
--        case NEON_3R_VRSHL:
+                      EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][bit];
--        case NEON_3R_VQRSHL:
--            {
+         if (irq_id) {
--                int rtmp;
+-            s->board_irqs[n] = qemu_irq_split(s->int_combiner_irq[n],
--                /* Shift instruction operands are reversed.  */
+-                    s->ext_gic_irq[irq_id-32]);
--                rtmp = rn;
++            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
--                rn = rm;
++                    is->ext_gic_irq[irq_id - 32]);
 -                rm = rtmp;
 -            }
 -            break;
          case NEON_3R_VPADD_VQRDMLAH:
          case NEON_3R_VPMAX:
          case NEON_3R_VPMIN:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
-         switch (op) {
+     }
--        case NEON_3R_VQSHL:
+ }
 -            GEN_NEON_INTEGER_OP_ENV(qshl);
 -            break;
 -        case NEON_3R_VRSHL:
 -            GEN_NEON_INTEGER_OP(rshl);
 -            break;
 -        case NEON_3R_VQRSHL:
 -            GEN_NEON_INTEGER_OP_ENV(qrshl);
              break;
          case NEON_3R_VPMAX:
              GEN_NEON_INTEGER_OP(pmax);
 --
-.20.1
+.25.1

-[PULL 38/45] target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
+[PULL 13/31] hw/arm/exynos4210: Fix code style nit in combiner_grp_to_gic_id[]
-Convert the Neon VQDMULH and VQRDMULH 3-reg-same insns to
+Fix a missing set of spaces around '-' in the definition of
-decodetree. These are the last integer operations in the
+combiner_grp_to_gic_id[]. We're about to move this code, so
--reg-same group.
+fix the style issue first to keep checkpatch happy with the
 code-motion patch.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-11-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-7-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  3 +++
+ hw/intc/exynos4210_gic.c | 2 +-
- target/arm/translate-neon.inc.c | 24 ++++++++++++++++++++++++
+file changed, 1 insertion(+), 1 deletion(-)
  target/arm/translate.c          | 24 +-----------------------
 files changed, 28 insertions(+), 23 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/intc/exynos4210_gic.c b/hw/intc/exynos4210_gic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/intc/exynos4210_gic.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/intc/exynos4210_gic.c
-@@ -XXX,XX +XXX,XX @@ VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
+@@ -XXX,XX +XXX,XX @@ enum ExtInt {
- VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+  */
- VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+ static const uint32_t
-+VQDMULH_3s       1111 001 0 0 . .. .... .... 1011 . . . 0 .... @3same
+-combiner_grp_to_gic_id[64-EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
-+VQRDMULH_3s      1111 001 1 0 . .. .... .... 1011 . . . 0 .... @3same
++combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
-+
+     /* int combiner groups 16-19 */
- VPADD_3s         1111 001 0 0 . .. .... .... 1011 . . . 1 .... @3same_q0
+     { }, { }, { }, { },
+     /* int combiner group 20 */
  VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPMIN_S, pmin_s)
  DO_3SAME_PAIR(VPMAX_U, pmax_u)
  DO_3SAME_PAIR(VPMIN_U, pmin_u)
  DO_3SAME_PAIR(VPADD, padd_u)
 +
 +#define DO_3SAME_VQDMULH(INSN, FUNC)                                    \
 +    WRAP_ENV_FN(gen_##INSN##_tramp16, gen_helper_neon_##FUNC##_s16);    \
 +    WRAP_ENV_FN(gen_##INSN##_tramp32, gen_helper_neon_##FUNC##_s32);    \
 +    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        static const GVecGen3 ops[2] = {                                \
 +            { .fni4 = gen_##INSN##_tramp16 },                           \
 +            { .fni4 = gen_##INSN##_tramp32 },                           \
 +        };                                                              \
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece - 1]); \
 +    }                                                                   \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        if (a->size != 1 && a->size != 2) {                             \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
 +DO_3SAME_VQDMULH(VQDMULH, qdmulh)
 +DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VPMAX:
          case NEON_3R_VPMIN:
          case NEON_3R_VPADD_VQRDMLAH:
 +        case NEON_3R_VQDMULH_VQRDMULH:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
          switch (op) {
 -        case NEON_3R_VQDMULH_VQRDMULH: /* Multiply high.  */
 -            if (!u) { /* VQDMULH */
 -                switch (size) {
 -                case 1:
 -                    gen_helper_neon_qdmulh_s16(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                case 2:
 -                    gen_helper_neon_qdmulh_s32(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                default: abort();
 -                }
 -            } else { /* VQRDMULH */
 -                switch (size) {
 -                case 1:
 -                    gen_helper_neon_qrdmulh_s16(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                case 2:
 -                    gen_helper_neon_qrdmulh_s32(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                default: abort();
 -                }
 -            }
 -            break;
          case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
-.20.1
+.25.1

-[PULL 25/45] KVM: Move hwpoison page related functions into kvm-all.c
+[PULL 14/31] hw/arm/exynos4210: Move exynos4210_init_board_irqs() into exynos4210.c
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+The function exynos4210_init_board_irqs() currently lives in
 exynos4210_gic.c, but it isn't really part of the exynos4210.gic
 device -- it is a function that implements (some of) the wiring up of
 interrupts between the SoC's GIC and combiner components.  This means
 it fits better in exynos4210.c, which is the SoC-level code.  Move it
 there. Similarly, exynos4210_git_irq() is used almost only in the
 SoC-level code, so move it too.
-kvm_hwpoison_page_add() and kvm_unpoison_all() will both
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-be used by X86 and ARM platforms, so moving them into
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-"accel/kvm/kvm-all.c" to avoid duplicate code.
+Message-id: 20220404154658.565020-8-peter.maydell@linaro.org
 ---
  include/hw/arm/exynos4210.h |   4 -
  hw/arm/exynos4210.c         | 202 +++++++++++++++++++++++++++++++++++
  hw/intc/exynos4210_gic.c    | 204 ------------------------------------
 files changed, 202 insertions(+), 208 deletions(-)
-For architectures that don't use the poison-list functionality
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 the reset handler will harmlessly do nothing, so let's register
 the kvm_unpoison_all() function in the generic kvm_init() function.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
 Message-id: 20200512030609.19593-8-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  include/sysemu/kvm_int.h | 12 ++++++++++++
  accel/kvm/kvm-all.c      | 36 ++++++++++++++++++++++++++++++++++++
  target/i386/kvm.c        | 36 ------------------------------------
 files changed, 48 insertions(+), 36 deletions(-)
 diff --git a/include/sysemu/kvm_int.h b/include/sysemu/kvm_int.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/kvm_int.h
+--- a/include/hw/arm/exynos4210.h
-+++ b/include/sysemu/kvm_int.h
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ void kvm_memory_listener_register(KVMState *s, KVMMemoryListener *kml,
+@@ -XXX,XX +XXX,XX @@ OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210State, EXYNOS4210_SOC)
-                                   AddressSpace *as, int as_id);
+ void exynos4210_write_secondary(ARMCPU *cpu,
+         const struct arm_boot_info *info);
- void kvm_set_max_memslot_size(hwaddr max_slot_size);
-+
+-/* Initialize board IRQs.
-+/**
+- * These IRQs contain splitted Int/External Combiner and External Gic IRQs */
-+ * kvm_hwpoison_page_add:
+-void exynos4210_init_board_irqs(Exynos4210State *s);
-+ *
+-
-+ * Parameters:
+ /* Get IRQ number from exynos4210 IRQ subsystem stub.
-+ *  @ram_addr: the address in the RAM for the poisoned page
+  * To identify IRQ source use internal combiner group and bit number
-+ *
+  *  grp - group number
-+ * Add a poisoned page to the list
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
-+ *
+index XXXXXXX..XXXXXXX 100644
-+ * Return: None.
+--- a/hw/arm/exynos4210.c
 +++ b/hw/arm/exynos4210.c
@@ -XXX,XX +XXX,XX @@
  #define EXYNOS4210_PL330_BASE1_ADDR         0x12690000
  #define EXYNOS4210_PL330_BASE2_ADDR         0x12850000
 +enum ExtGicId {
 +    EXT_GIC_ID_MDMA_LCD0 = 66,
 +    EXT_GIC_ID_PDMA0,
 +    EXT_GIC_ID_PDMA1,
 +    EXT_GIC_ID_TIMER0,
 +    EXT_GIC_ID_TIMER1,
 +    EXT_GIC_ID_TIMER2,
 +    EXT_GIC_ID_TIMER3,
 +    EXT_GIC_ID_TIMER4,
 +    EXT_GIC_ID_MCT_L0,
 +    EXT_GIC_ID_WDT,
 +    EXT_GIC_ID_RTC_ALARM,
 +    EXT_GIC_ID_RTC_TIC,
 +    EXT_GIC_ID_GPIO_XB,
 +    EXT_GIC_ID_GPIO_XA,
 +    EXT_GIC_ID_MCT_L1,
 +    EXT_GIC_ID_IEM_APC,
 +    EXT_GIC_ID_IEM_IEC,
 +    EXT_GIC_ID_NFC,
 +    EXT_GIC_ID_UART0,
 +    EXT_GIC_ID_UART1,
 +    EXT_GIC_ID_UART2,
 +    EXT_GIC_ID_UART3,
 +    EXT_GIC_ID_UART4,
 +    EXT_GIC_ID_MCT_G0,
 +    EXT_GIC_ID_I2C0,
 +    EXT_GIC_ID_I2C1,
 +    EXT_GIC_ID_I2C2,
 +    EXT_GIC_ID_I2C3,
 +    EXT_GIC_ID_I2C4,
 +    EXT_GIC_ID_I2C5,
 +    EXT_GIC_ID_I2C6,
 +    EXT_GIC_ID_I2C7,
 +    EXT_GIC_ID_SPI0,
 +    EXT_GIC_ID_SPI1,
 +    EXT_GIC_ID_SPI2,
 +    EXT_GIC_ID_MCT_G1,
 +    EXT_GIC_ID_USB_HOST,
 +    EXT_GIC_ID_USB_DEVICE,
 +    EXT_GIC_ID_MODEMIF,
 +    EXT_GIC_ID_HSMMC0,
 +    EXT_GIC_ID_HSMMC1,
 +    EXT_GIC_ID_HSMMC2,
 +    EXT_GIC_ID_HSMMC3,
 +    EXT_GIC_ID_SDMMC,
 +    EXT_GIC_ID_MIPI_CSI_4LANE,
 +    EXT_GIC_ID_MIPI_DSI_4LANE,
 +    EXT_GIC_ID_MIPI_CSI_2LANE,
 +    EXT_GIC_ID_MIPI_DSI_2LANE,
 +    EXT_GIC_ID_ONENAND_AUDI,
 +    EXT_GIC_ID_ROTATOR,
 +    EXT_GIC_ID_FIMC0,
 +    EXT_GIC_ID_FIMC1,
 +    EXT_GIC_ID_FIMC2,
 +    EXT_GIC_ID_FIMC3,
 +    EXT_GIC_ID_JPEG,
 +    EXT_GIC_ID_2D,
 +    EXT_GIC_ID_PCIe,
 +    EXT_GIC_ID_MIXER,
 +    EXT_GIC_ID_HDMI,
 +    EXT_GIC_ID_HDMI_I2C,
 +    EXT_GIC_ID_MFC,
 +    EXT_GIC_ID_TVENC,
 +};
 +
 +enum ExtInt {
 +    EXT_GIC_ID_EXTINT0 = 48,
 +    EXT_GIC_ID_EXTINT1,
 +    EXT_GIC_ID_EXTINT2,
 +    EXT_GIC_ID_EXTINT3,
 +    EXT_GIC_ID_EXTINT4,
 +    EXT_GIC_ID_EXTINT5,
 +    EXT_GIC_ID_EXTINT6,
 +    EXT_GIC_ID_EXTINT7,
 +    EXT_GIC_ID_EXTINT8,
 +    EXT_GIC_ID_EXTINT9,
 +    EXT_GIC_ID_EXTINT10,
 +    EXT_GIC_ID_EXTINT11,
 +    EXT_GIC_ID_EXTINT12,
 +    EXT_GIC_ID_EXTINT13,
 +    EXT_GIC_ID_EXTINT14,
 +    EXT_GIC_ID_EXTINT15
 +};
 +
 +/*
 + * External GIC sources which are not from External Interrupt Combiner or
 + * External Interrupts are starting from EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ,
 + * which is INTG16 in Internal Interrupt Combiner.
 + */
-+void kvm_hwpoison_page_add(ram_addr_t ram_addr);
++
- #endif
++static const uint32_t
-diff --git a/accel/kvm/kvm-all.c b/accel/kvm/kvm-all.c
++combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
-index XXXXXXX..XXXXXXX 100644
++    /* int combiner groups 16-19 */
---- a/accel/kvm/kvm-all.c
++    { }, { }, { }, { },
-+++ b/accel/kvm/kvm-all.c
++    /* int combiner group 20 */
-@@ -XXX,XX +XXX,XX @@
++    { 0, EXT_GIC_ID_MDMA_LCD0 },
- #include "qapi/visitor.h"
++    /* int combiner group 21 */
- #include "qapi/qapi-types-common.h"
++    { EXT_GIC_ID_PDMA0, EXT_GIC_ID_PDMA1 },
- #include "qapi/qapi-visit-common.h"
++    /* int combiner group 22 */
-+#include "sysemu/reset.h"
++    { EXT_GIC_ID_TIMER0, EXT_GIC_ID_TIMER1, EXT_GIC_ID_TIMER2,
++            EXT_GIC_ID_TIMER3, EXT_GIC_ID_TIMER4 },
- #include "hw/boards.h"
++    /* int combiner group 23 */
++    { EXT_GIC_ID_RTC_ALARM, EXT_GIC_ID_RTC_TIC },
-@@ -XXX,XX +XXX,XX @@ int kvm_vm_check_extension(KVMState *s, unsigned int extension)
++    /* int combiner group 24 */
-     return ret;
++    { EXT_GIC_ID_GPIO_XB, EXT_GIC_ID_GPIO_XA },
- }
++    /* int combiner group 25 */
++    { EXT_GIC_ID_IEM_APC, EXT_GIC_ID_IEM_IEC },
-+typedef struct HWPoisonPage {
++    /* int combiner group 26 */
-+    ram_addr_t ram_addr;
++    { EXT_GIC_ID_UART0, EXT_GIC_ID_UART1, EXT_GIC_ID_UART2, EXT_GIC_ID_UART3,
-+    QLIST_ENTRY(HWPoisonPage) list;
++            EXT_GIC_ID_UART4 },
-+} HWPoisonPage;
++    /* int combiner group 27 */
-+
++    { EXT_GIC_ID_I2C0, EXT_GIC_ID_I2C1, EXT_GIC_ID_I2C2, EXT_GIC_ID_I2C3,
-+static QLIST_HEAD(, HWPoisonPage) hwpoison_page_list =
++            EXT_GIC_ID_I2C4, EXT_GIC_ID_I2C5, EXT_GIC_ID_I2C6,
-+    QLIST_HEAD_INITIALIZER(hwpoison_page_list);
++            EXT_GIC_ID_I2C7 },
-+
++    /* int combiner group 28 */
-+static void kvm_unpoison_all(void *param)
++    { EXT_GIC_ID_SPI0, EXT_GIC_ID_SPI1, EXT_GIC_ID_SPI2 , EXT_GIC_ID_USB_HOST},
 +    /* int combiner group 29 */
 +    { EXT_GIC_ID_HSMMC0, EXT_GIC_ID_HSMMC1, EXT_GIC_ID_HSMMC2,
 +     EXT_GIC_ID_HSMMC3, EXT_GIC_ID_SDMMC },
 +    /* int combiner group 30 */
 +    { EXT_GIC_ID_MIPI_CSI_4LANE, EXT_GIC_ID_MIPI_CSI_2LANE },
 +    /* int combiner group 31 */
 +    { EXT_GIC_ID_MIPI_DSI_4LANE, EXT_GIC_ID_MIPI_DSI_2LANE },
 +    /* int combiner group 32 */
 +    { EXT_GIC_ID_FIMC0, EXT_GIC_ID_FIMC1 },
 +    /* int combiner group 33 */
 +    { EXT_GIC_ID_FIMC2, EXT_GIC_ID_FIMC3 },
 +    /* int combiner group 34 */
 +    { EXT_GIC_ID_ONENAND_AUDI, EXT_GIC_ID_NFC },
 +    /* int combiner group 35 */
 +    { 0, 0, 0, EXT_GIC_ID_MCT_L1, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
 +    /* int combiner group 36 */
 +    { EXT_GIC_ID_MIXER },
 +    /* int combiner group 37 */
 +    { EXT_GIC_ID_EXTINT4, EXT_GIC_ID_EXTINT5, EXT_GIC_ID_EXTINT6,
 +     EXT_GIC_ID_EXTINT7 },
 +    /* groups 38-50 */
 +    { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { },
 +    /* int combiner group 51 */
 +    { EXT_GIC_ID_MCT_L0, 0, 0, 0, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
 +    /* group 52 */
 +    { },
 +    /* int combiner group 53 */
 +    { EXT_GIC_ID_WDT, 0, 0, 0, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
 +    /* groups 54-63 */
 +    { }, { }, { }, { }, { }, { }, { }, { }, { }, { }
 +};
 +
 +/*
 + * Initialize board IRQs.
 + * These IRQs contain splitted Int/External Combiner and External Gic IRQs.
 + */
 +static void exynos4210_init_board_irqs(Exynos4210State *s)
 +{
-+    HWPoisonPage *page, *next_page;
++    uint32_t grp, bit, irq_id, n;
-+
++    Exynos4210Irq *is = &s->irqs;
-+    QLIST_FOREACH_SAFE(page, &hwpoison_page_list, list, next_page) {
++
-+        QLIST_REMOVE(page, list);
++    for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
-+        qemu_ram_remap(page->ram_addr, TARGET_PAGE_SIZE);
++        irq_id = 0;
-+        g_free(page);
++        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 4) ||
 +                n == EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 4)) {
 +            /* MCT_G0 is passed to External GIC */
 +            irq_id = EXT_GIC_ID_MCT_G0;
 +        }
 +        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 5) ||
 +                n == EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 5)) {
 +            /* MCT_G1 is passed to External and GIC */
 +            irq_id = EXT_GIC_ID_MCT_G1;
 +        }
 +        if (irq_id) {
 +            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 +                    is->ext_gic_irq[irq_id - 32]);
 +        } else {
 +            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 +                    is->ext_combiner_irq[n]);
 +        }
 +    }
 +    for (; n < EXYNOS4210_MAX_INT_COMBINER_IN_IRQ; n++) {
 +        /* these IDs are passed to Internal Combiner and External GIC */
 +        grp = EXYNOS4210_COMBINER_GET_GRP_NUM(n);
 +        bit = EXYNOS4210_COMBINER_GET_BIT_NUM(n);
 +        irq_id = combiner_grp_to_gic_id[grp -
 +                     EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][bit];
 +
 +        if (irq_id) {
 +            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 +                    is->ext_gic_irq[irq_id - 32]);
 +        }
 +    }
 +}
 +
-+void kvm_hwpoison_page_add(ram_addr_t ram_addr)
++/*
 + * Get IRQ number from exynos4210 IRQ subsystem stub.
 + * To identify IRQ source use internal combiner group and bit number
 + *  grp - group number
 + *  bit - bit number inside group
 + */
 +uint32_t exynos4210_get_irq(uint32_t grp, uint32_t bit)
 +{
-+    HWPoisonPage *page;
++    return EXYNOS4210_COMBINER_GET_IRQ_NUM(grp, bit);
 +
 +    QLIST_FOREACH(page, &hwpoison_page_list, list) {
 +        if (page->ram_addr == ram_addr) {
 +            return;
 +        }
 +    }
 +    page = g_new(HWPoisonPage, 1);
 +    page->ram_addr = ram_addr;
 +    QLIST_INSERT_HEAD(&hwpoison_page_list, page, list);
 +}
 +
- static uint32_t adjust_ioeventfd_endianness(uint32_t val, uint32_t size)
+ static uint8_t chipid_and_omr[] = { 0x11, 0x02, 0x21, 0x43,
- {
+x09, 0x00, 0x00, 0x00 };
- #if defined(HOST_WORDS_BIGENDIAN) != defined(TARGET_WORDS_BIGENDIAN)
-@@ -XXX,XX +XXX,XX @@ static int kvm_init(MachineState *ms)
+diff --git a/hw/intc/exynos4210_gic.c b/hw/intc/exynos4210_gic.c
          s->kernel_irqchip_split = mc->default_kernel_irqchip_split ? ON_OFF_AUTO_ON : ON_OFF_AUTO_OFF;
      }
 +    qemu_register_reset(kvm_unpoison_all, NULL);
 +
      if (s->kernel_irqchip_allowed) {
          kvm_irqchip_create(s);
      }
 diff --git a/target/i386/kvm.c b/target/i386/kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/i386/kvm.c
+--- a/hw/intc/exynos4210_gic.c
-+++ b/target/i386/kvm.c
++++ b/hw/intc/exynos4210_gic.c
 @@ -XXX,XX +XXX,XX @@
- #include "sysemu/sysemu.h"
+ #include "hw/arm/exynos4210.h"
- #include "sysemu/hw_accel.h"
+ #include "qom/object.h"
- #include "sysemu/kvm_int.h"
--#include "sysemu/reset.h"
+-enum ExtGicId {
- #include "sysemu/runstate.h"
+-    EXT_GIC_ID_MDMA_LCD0 = 66,
- #include "kvm_i386.h"
+-    EXT_GIC_ID_PDMA0,
- #include "hyperv.h"
+-    EXT_GIC_ID_PDMA1,
-@@ -XXX,XX +XXX,XX @@ uint64_t kvm_arch_get_supported_msr_feature(KVMState *s, uint32_t index)
+-    EXT_GIC_ID_TIMER0,
-     }
+-    EXT_GIC_ID_TIMER1,
- }
+-    EXT_GIC_ID_TIMER2,
+-    EXT_GIC_ID_TIMER3,
--
+-    EXT_GIC_ID_TIMER4,
--typedef struct HWPoisonPage {
+-    EXT_GIC_ID_MCT_L0,
--    ram_addr_t ram_addr;
+-    EXT_GIC_ID_WDT,
--    QLIST_ENTRY(HWPoisonPage) list;
+-    EXT_GIC_ID_RTC_ALARM,
--} HWPoisonPage;
+-    EXT_GIC_ID_RTC_TIC,
--
+-    EXT_GIC_ID_GPIO_XB,
--static QLIST_HEAD(, HWPoisonPage) hwpoison_page_list =
+-    EXT_GIC_ID_GPIO_XA,
--    QLIST_HEAD_INITIALIZER(hwpoison_page_list);
+-    EXT_GIC_ID_MCT_L1,
--
+-    EXT_GIC_ID_IEM_APC,
--static void kvm_unpoison_all(void *param)
+-    EXT_GIC_ID_IEM_IEC,
 -    EXT_GIC_ID_NFC,
 -    EXT_GIC_ID_UART0,
 -    EXT_GIC_ID_UART1,
 -    EXT_GIC_ID_UART2,
 -    EXT_GIC_ID_UART3,
 -    EXT_GIC_ID_UART4,
 -    EXT_GIC_ID_MCT_G0,
 -    EXT_GIC_ID_I2C0,
 -    EXT_GIC_ID_I2C1,
 -    EXT_GIC_ID_I2C2,
 -    EXT_GIC_ID_I2C3,
 -    EXT_GIC_ID_I2C4,
 -    EXT_GIC_ID_I2C5,
 -    EXT_GIC_ID_I2C6,
 -    EXT_GIC_ID_I2C7,
 -    EXT_GIC_ID_SPI0,
 -    EXT_GIC_ID_SPI1,
 -    EXT_GIC_ID_SPI2,
 -    EXT_GIC_ID_MCT_G1,
 -    EXT_GIC_ID_USB_HOST,
 -    EXT_GIC_ID_USB_DEVICE,
 -    EXT_GIC_ID_MODEMIF,
 -    EXT_GIC_ID_HSMMC0,
 -    EXT_GIC_ID_HSMMC1,
 -    EXT_GIC_ID_HSMMC2,
 -    EXT_GIC_ID_HSMMC3,
 -    EXT_GIC_ID_SDMMC,
 -    EXT_GIC_ID_MIPI_CSI_4LANE,
 -    EXT_GIC_ID_MIPI_DSI_4LANE,
 -    EXT_GIC_ID_MIPI_CSI_2LANE,
 -    EXT_GIC_ID_MIPI_DSI_2LANE,
 -    EXT_GIC_ID_ONENAND_AUDI,
 -    EXT_GIC_ID_ROTATOR,
 -    EXT_GIC_ID_FIMC0,
 -    EXT_GIC_ID_FIMC1,
 -    EXT_GIC_ID_FIMC2,
 -    EXT_GIC_ID_FIMC3,
 -    EXT_GIC_ID_JPEG,
 -    EXT_GIC_ID_2D,
 -    EXT_GIC_ID_PCIe,
 -    EXT_GIC_ID_MIXER,
 -    EXT_GIC_ID_HDMI,
 -    EXT_GIC_ID_HDMI_I2C,
 -    EXT_GIC_ID_MFC,
 -    EXT_GIC_ID_TVENC,
 -};
 -
 -enum ExtInt {
 -    EXT_GIC_ID_EXTINT0 = 48,
 -    EXT_GIC_ID_EXTINT1,
 -    EXT_GIC_ID_EXTINT2,
 -    EXT_GIC_ID_EXTINT3,
 -    EXT_GIC_ID_EXTINT4,
 -    EXT_GIC_ID_EXTINT5,
 -    EXT_GIC_ID_EXTINT6,
 -    EXT_GIC_ID_EXTINT7,
 -    EXT_GIC_ID_EXTINT8,
 -    EXT_GIC_ID_EXTINT9,
 -    EXT_GIC_ID_EXTINT10,
 -    EXT_GIC_ID_EXTINT11,
 -    EXT_GIC_ID_EXTINT12,
 -    EXT_GIC_ID_EXTINT13,
 -    EXT_GIC_ID_EXTINT14,
 -    EXT_GIC_ID_EXTINT15
 -};
 -
 -/*
 - * External GIC sources which are not from External Interrupt Combiner or
 - * External Interrupts are starting from EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ,
 - * which is INTG16 in Internal Interrupt Combiner.
 - */
 -
 -static const uint32_t
 -combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
 -    /* int combiner groups 16-19 */
 -    { }, { }, { }, { },
 -    /* int combiner group 20 */
 -    { 0, EXT_GIC_ID_MDMA_LCD0 },
 -    /* int combiner group 21 */
 -    { EXT_GIC_ID_PDMA0, EXT_GIC_ID_PDMA1 },
 -    /* int combiner group 22 */
 -    { EXT_GIC_ID_TIMER0, EXT_GIC_ID_TIMER1, EXT_GIC_ID_TIMER2,
 -            EXT_GIC_ID_TIMER3, EXT_GIC_ID_TIMER4 },
 -    /* int combiner group 23 */
 -    { EXT_GIC_ID_RTC_ALARM, EXT_GIC_ID_RTC_TIC },
 -    /* int combiner group 24 */
 -    { EXT_GIC_ID_GPIO_XB, EXT_GIC_ID_GPIO_XA },
 -    /* int combiner group 25 */
 -    { EXT_GIC_ID_IEM_APC, EXT_GIC_ID_IEM_IEC },
 -    /* int combiner group 26 */
 -    { EXT_GIC_ID_UART0, EXT_GIC_ID_UART1, EXT_GIC_ID_UART2, EXT_GIC_ID_UART3,
 -            EXT_GIC_ID_UART4 },
 -    /* int combiner group 27 */
 -    { EXT_GIC_ID_I2C0, EXT_GIC_ID_I2C1, EXT_GIC_ID_I2C2, EXT_GIC_ID_I2C3,
 -            EXT_GIC_ID_I2C4, EXT_GIC_ID_I2C5, EXT_GIC_ID_I2C6,
 -            EXT_GIC_ID_I2C7 },
 -    /* int combiner group 28 */
 -    { EXT_GIC_ID_SPI0, EXT_GIC_ID_SPI1, EXT_GIC_ID_SPI2 , EXT_GIC_ID_USB_HOST},
 -    /* int combiner group 29 */
 -    { EXT_GIC_ID_HSMMC0, EXT_GIC_ID_HSMMC1, EXT_GIC_ID_HSMMC2,
 -     EXT_GIC_ID_HSMMC3, EXT_GIC_ID_SDMMC },
 -    /* int combiner group 30 */
 -    { EXT_GIC_ID_MIPI_CSI_4LANE, EXT_GIC_ID_MIPI_CSI_2LANE },
 -    /* int combiner group 31 */
 -    { EXT_GIC_ID_MIPI_DSI_4LANE, EXT_GIC_ID_MIPI_DSI_2LANE },
 -    /* int combiner group 32 */
 -    { EXT_GIC_ID_FIMC0, EXT_GIC_ID_FIMC1 },
 -    /* int combiner group 33 */
 -    { EXT_GIC_ID_FIMC2, EXT_GIC_ID_FIMC3 },
 -    /* int combiner group 34 */
 -    { EXT_GIC_ID_ONENAND_AUDI, EXT_GIC_ID_NFC },
 -    /* int combiner group 35 */
 -    { 0, 0, 0, EXT_GIC_ID_MCT_L1, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
 -    /* int combiner group 36 */
 -    { EXT_GIC_ID_MIXER },
 -    /* int combiner group 37 */
 -    { EXT_GIC_ID_EXTINT4, EXT_GIC_ID_EXTINT5, EXT_GIC_ID_EXTINT6,
 -     EXT_GIC_ID_EXTINT7 },
 -    /* groups 38-50 */
 -    { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { },
 -    /* int combiner group 51 */
 -    { EXT_GIC_ID_MCT_L0, 0, 0, 0, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
 -    /* group 52 */
 -    { },
 -    /* int combiner group 53 */
 -    { EXT_GIC_ID_WDT, 0, 0, 0, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
 -    /* groups 54-63 */
 -    { }, { }, { }, { }, { }, { }, { }, { }, { }, { }
 -};
 -
  #define EXYNOS4210_GIC_NIRQ 160
  #define EXYNOS4210_EXT_GIC_CPU_REGION_SIZE     0x10000
@@ -XXX,XX +XXX,XX @@ combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
  #define EXYNOS4210_GIC_CPU_REGION_SIZE  0x100
  #define EXYNOS4210_GIC_DIST_REGION_SIZE 0x1000
 -/*
 - * Initialize board IRQs.
 - * These IRQs contain splitted Int/External Combiner and External Gic IRQs.
 - */
 -void exynos4210_init_board_irqs(Exynos4210State *s)
 -{
--    HWPoisonPage *page, *next_page;
+-    uint32_t grp, bit, irq_id, n;
--
+-    Exynos4210Irq *is = &s->irqs;
--    QLIST_FOREACH_SAFE(page, &hwpoison_page_list, list, next_page) {
+-
--        QLIST_REMOVE(page, list);
+-    for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
--        qemu_ram_remap(page->ram_addr, TARGET_PAGE_SIZE);
+-        irq_id = 0;
--        g_free(page);
+-        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 4) ||
 -                n == EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 4)) {
 -            /* MCT_G0 is passed to External GIC */
 -            irq_id = EXT_GIC_ID_MCT_G0;
 -        }
 -        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 5) ||
 -                n == EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 5)) {
 -            /* MCT_G1 is passed to External and GIC */
 -            irq_id = EXT_GIC_ID_MCT_G1;
 -        }
 -        if (irq_id) {
 -            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 -                    is->ext_gic_irq[irq_id - 32]);
 -        } else {
 -            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 -                    is->ext_combiner_irq[n]);
 -        }
 -    }
 -    for (; n < EXYNOS4210_MAX_INT_COMBINER_IN_IRQ; n++) {
 -        /* these IDs are passed to Internal Combiner and External GIC */
 -        grp = EXYNOS4210_COMBINER_GET_GRP_NUM(n);
 -        bit = EXYNOS4210_COMBINER_GET_BIT_NUM(n);
 -        irq_id = combiner_grp_to_gic_id[grp -
 -                     EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][bit];
 -
 -        if (irq_id) {
 -            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 -                    is->ext_gic_irq[irq_id - 32]);
 -        }
 -    }
 -}
 -
--static void kvm_hwpoison_page_add(ram_addr_t ram_addr)
+-/*
 - * Get IRQ number from exynos4210 IRQ subsystem stub.
 - * To identify IRQ source use internal combiner group and bit number
 - *  grp - group number
 - *  bit - bit number inside group
 - */
 -uint32_t exynos4210_get_irq(uint32_t grp, uint32_t bit)
 -{
--    HWPoisonPage *page;
+-    return EXYNOS4210_COMBINER_GET_IRQ_NUM(grp, bit);
 -
 -    QLIST_FOREACH(page, &hwpoison_page_list, list) {
 -        if (page->ram_addr == ram_addr) {
 -            return;
 -        }
 -    }
 -    page = g_new(HWPoisonPage, 1);
 -    page->ram_addr = ram_addr;
 -    QLIST_INSERT_HEAD(&hwpoison_page_list, page, list);
 -}
 -
- static int kvm_get_mce_cap_supported(KVMState *s, uint64_t *mce_cap,
+-/********* GIC part *********/
-                                      int *max_banks)
+-
- {
+ #define TYPE_EXYNOS4210_GIC "exynos4210.gic"
-@@ -XXX,XX +XXX,XX @@ int kvm_arch_init(MachineState *ms, KVMState *s)
+ OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210GicState, EXYNOS4210_GIC)
-         fprintf(stderr, "e820_add_entry() table is full\n");
          return ret;
      }
 -    qemu_register_reset(kvm_unpoison_all, NULL);
      shadow_mem = object_property_get_int(OBJECT(s), "kvm-shadow-mem", &error_abort);
      if (shadow_mem != -1) {
 --
-.20.1
+.25.1

-[PULL 28/45] MAINTAINERS: Add ACPI/HEST/GHES entries
+[PULL 15/31] hw/arm/exynos4210: Put external GIC into state struct
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+Switch the creation of the external GIC to the new-style "embedded in
 state struct" approach, so we can easily refer to the object
 elsewhere during realize.
-I and Xiang are willing to review the APEI-related patches and
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-volunteer as the reviewers for the HEST/GHES part.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20220404154658.565020-9-peter.maydell@linaro.org
 ---
  include/hw/arm/exynos4210.h      |  2 ++
  include/hw/intc/exynos4210_gic.h | 43 ++++++++++++++++++++++++++++++++
  hw/arm/exynos4210.c              | 10 ++++----
  hw/intc/exynos4210_gic.c         | 17 ++-----------
  MAINTAINERS                      |  2 +-
 files changed, 53 insertions(+), 21 deletions(-)
  create mode 100644 include/hw/intc/exynos4210_gic.h
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+index XXXXXXX..XXXXXXX 100644
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+--- a/include/hw/arm/exynos4210.h
-Acked-by: Michael S. Tsirkin <mst@redhat.com>
++++ b/include/hw/arm/exynos4210.h
-Message-id: 20200512030609.19593-11-gengdongjiu@huawei.com
+@@ -XXX,XX +XXX,XX @@
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+ #include "hw/or-irq.h"
----
+ #include "hw/sysbus.h"
- MAINTAINERS | 9 +++++++++
+ #include "hw/cpu/a9mpcore.h"
-file changed, 9 insertions(+)
++#include "hw/intc/exynos4210_gic.h"
+ #include "target/arm/cpu-qom.h"
  #include "qom/object.h"
@@ -XXX,XX +XXX,XX @@ struct Exynos4210State {
      qemu_or_irq pl330_irq_orgate[EXYNOS4210_NUM_DMA];
      qemu_or_irq cpu_irq_orgate[EXYNOS4210_NCPUS];
      A9MPPrivState a9mpcore;
 +    Exynos4210GicState ext_gic;
  };
  #define TYPE_EXYNOS4210_SOC "exynos4210"
 diff --git a/include/hw/intc/exynos4210_gic.h b/include/hw/intc/exynos4210_gic.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/include/hw/intc/exynos4210_gic.h
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Samsung exynos4210 GIC implementation. Based on hw/arm_gic.c
 + *
 + * Copyright (c) 2000 - 2011 Samsung Electronics Co., Ltd.
 + * All rights reserved.
 + *
 + * Evgeny Voevodin <e.voevodin@samsung.com>
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or (at your
 + * option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
 + * See the GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +#ifndef HW_INTC_EXYNOS4210_GIC_H
 +#define HW_INTC_EXYNOS4210_GIC_H
 +
 +#include "hw/sysbus.h"
 +
 +#define TYPE_EXYNOS4210_GIC "exynos4210.gic"
 +OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210GicState, EXYNOS4210_GIC)
 +
 +#define EXYNOS4210_GIC_NCPUS 2
 +
 +struct Exynos4210GicState {
 +    SysBusDevice parent_obj;
 +
 +    MemoryRegion cpu_container;
 +    MemoryRegion dist_container;
 +    MemoryRegion cpu_alias[EXYNOS4210_GIC_NCPUS];
 +    MemoryRegion dist_alias[EXYNOS4210_GIC_NCPUS];
 +    uint32_t num_cpu;
 +    DeviceState *gic;
 +};
 +
 +#endif
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/exynos4210.c
 +++ b/hw/arm/exynos4210.c
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
      sysbus_create_simple("l2x0", EXYNOS4210_L2X0_BASE_ADDR, NULL);
      /* External GIC */
 -    dev = qdev_new("exynos4210.gic");
 -    qdev_prop_set_uint32(dev, "num-cpu", EXYNOS4210_NCPUS);
 -    busdev = SYS_BUS_DEVICE(dev);
 -    sysbus_realize_and_unref(busdev, &error_fatal);
 +    qdev_prop_set_uint32(DEVICE(&s->ext_gic), "num-cpu", EXYNOS4210_NCPUS);
 +    busdev = SYS_BUS_DEVICE(&s->ext_gic);
 +    sysbus_realize(busdev, &error_fatal);
      /* Map CPU interface */
      sysbus_mmio_map(busdev, 0, EXYNOS4210_EXT_GIC_CPU_BASE_ADDR);
      /* Map Distributer interface */
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
                             qdev_get_gpio_in(DEVICE(&s->cpu_irq_orgate[n]), 1));
      }
      for (n = 0; n < EXYNOS4210_EXT_GIC_NIRQ; n++) {
 -        s->irqs.ext_gic_irq[n] = qdev_get_gpio_in(dev, n);
 +        s->irqs.ext_gic_irq[n] = qdev_get_gpio_in(DEVICE(&s->ext_gic), n);
      }
      /* Internal Interrupt Combiner */
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init(Object *obj)
      }
      object_initialize_child(obj, "a9mpcore", &s->a9mpcore, TYPE_A9MPCORE_PRIV);
 +    object_initialize_child(obj, "ext-gic", &s->ext_gic, TYPE_EXYNOS4210_GIC);
  }
  static void exynos4210_class_init(ObjectClass *klass, void *data)
 diff --git a/hw/intc/exynos4210_gic.c b/hw/intc/exynos4210_gic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/exynos4210_gic.c
 +++ b/hw/intc/exynos4210_gic.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/module.h"
  #include "hw/irq.h"
  #include "hw/qdev-properties.h"
 +#include "hw/intc/exynos4210_gic.h"
  #include "hw/arm/exynos4210.h"
  #include "qom/object.h"
@@ -XXX,XX +XXX,XX @@
  #define EXYNOS4210_GIC_CPU_REGION_SIZE  0x100
  #define EXYNOS4210_GIC_DIST_REGION_SIZE 0x1000
 -#define TYPE_EXYNOS4210_GIC "exynos4210.gic"
 -OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210GicState, EXYNOS4210_GIC)
 -
 -struct Exynos4210GicState {
 -    SysBusDevice parent_obj;
 -
 -    MemoryRegion cpu_container;
 -    MemoryRegion dist_container;
 -    MemoryRegion cpu_alias[EXYNOS4210_NCPUS];
 -    MemoryRegion dist_alias[EXYNOS4210_NCPUS];
 -    uint32_t num_cpu;
 -    DeviceState *gic;
 -};
 -
  static void exynos4210_gic_set_irq(void *opaque, int irq, int level)
  {
      Exynos4210GicState *s = (Exynos4210GicState *)opaque;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_gic_realize(DeviceState *dev, Error **errp)
       * enough room for the cpu numbers.  gcc 9.2.1 on 32-bit x86
       * doesn't figure this out, otherwise and gives spurious warnings.
       */
 -    assert(n <= EXYNOS4210_NCPUS);
 +    assert(n <= EXYNOS4210_GIC_NCPUS);
      for (i = 0; i < n; i++) {
          /* Map CPU interface per SMP Core */
          sprintf(cpu_alias_name, "%s%x", cpu_prefix, i);
 diff --git a/MAINTAINERS b/MAINTAINERS
 index XXXXXXX..XXXXXXX 100644
 --- a/MAINTAINERS
 +++ b/MAINTAINERS
-@@ -XXX,XX +XXX,XX @@ F: tests/qtest/bios-tables-test.c
+@@ -XXX,XX +XXX,XX @@ M: Peter Maydell <peter.maydell@linaro.org>
- F: tests/qtest/acpi-utils.[hc]
+ L: qemu-arm@nongnu.org
- F: tests/data/acpi/
+ S: Odd Fixes
+ F: hw/*/exynos*
-+ACPI/HEST/GHES
+-F: include/hw/arm/exynos4210.h
-+R: Dongjiu Geng <gengdongjiu@huawei.com>
++F: include/hw/*/exynos*
-+R: Xiang Zheng <zhengxiang9@huawei.com>
-+L: qemu-arm@nongnu.org
+ Calxeda Highbank
-+S: Maintained
+ M: Rob Herring <robh@kernel.org>
 +F: hw/acpi/ghes.c
 +F: include/hw/acpi/ghes.h
 +F: docs/specs/acpi_hest_ghes.rst
 +
  ppc4xx
  M: David Gibson <david@gibson.dropbear.id.au>
  L: qemu-ppc@nongnu.org
 --
-.20.1
+.25.1

-[PULL 36/45] target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
+[PULL 16/31] hw/arm/exynos4210: Drop ext_gic_irq[] from Exynos4210Irq struct
-Convert the Neon integer VPMAX and VPMIN 3-reg-same insns to
+The only time we use the ext_gic_irq[] array in the Exynos4210Irq
-decodetree. These are 'pairwise' operations.
+struct is during realize of the SoC -- we initialize it with the
 input IRQs of the external GIC device, and then connect those to
 outputs of other devices further on in realize (including in the
 exynos4210_init_board_irqs() function).  Now that the ext_gic object
 is easily accessible as s->ext_gic we can make the connections
 directly from one device to the other without going via this array.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-9-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-10-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  9 +++++
+ include/hw/arm/exynos4210.h |  1 -
- target/arm/translate-neon.inc.c | 71 +++++++++++++++++++++++++++++++++
+ hw/arm/exynos4210.c         | 12 ++++++------
- target/arm/translate.c          | 17 +-------
+files changed, 6 insertions(+), 7 deletions(-)
 files changed, 82 insertions(+), 15 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
 @@ -XXX,XX +XXX,XX @@
- @3same           .... ... . . . size:2 .... .... .... . q:1 . . .... \
+ typedef struct Exynos4210Irq {
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
+     qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
+     qemu_irq ext_combiner_irq[EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ];
-+@3same_q0        .... ... . . . size:2 .... .... .... . 0 . . .... \
+-    qemu_irq ext_gic_irq[EXYNOS4210_EXT_GIC_NIRQ];
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
+ } Exynos4210Irq;
-+
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+ struct Exynos4210State {
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
  VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
@@ -XXX,XX +XXX,XX @@ VMLS_3s          1111 001 1 0 . .. .... .... 1001 . . . 0 .... @3same
  VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
  VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
 +VPMAX_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 0 .... @3same_q0
 +VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
 +
 +VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
 +VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
 +
  VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
  SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_32_ENV(VQSHL_S, qshl_s)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
- DO_3SAME_32_ENV(VQSHL_U, qshl_u)
+ {
- DO_3SAME_32_ENV(VQRSHL_S, qrshl_s)
+     uint32_t grp, bit, irq_id, n;
- DO_3SAME_32_ENV(VQRSHL_U, qrshl_u)
+     Exynos4210Irq *is = &s->irqs;
-+
++    DeviceState *extgicdev = DEVICE(&s->ext_gic);
-+static bool do_3same_pair(DisasContext *s, arg_3same *a, NeonGenTwoOpFn *fn)
-+{
+     for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
-+    /* Operations handled pairwise 32 bits at a time */
+         irq_id = 0;
-+    TCGv_i32 tmp, tmp2, tmp3;
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
-+
+         }
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
+         if (irq_id) {
-+        return false;
+             s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
-+    }
+-                    is->ext_gic_irq[irq_id - 32]);
-+
++                                             qdev_get_gpio_in(extgicdev,
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
++                                                              irq_id - 32));
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+         } else {
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
+             s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
-+        return false;
+                     is->ext_combiner_irq[n]);
-+    }
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
-+
-+    if (a->size == 3) {
+         if (irq_id) {
-+        return false;
+             s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
-+    }
+-                    is->ext_gic_irq[irq_id - 32]);
-+
++                                             qdev_get_gpio_in(extgicdev,
-+    if (!vfp_access_check(s)) {
++                                                              irq_id - 32));
-+        return true;
+         }
 +    }
 +
 +    assert(a->q == 0); /* enforced by decode patterns */
 +
 +    /*
 +     * Note that we have to be careful not to clobber the source operands
 +     * in the "vm == vd" case by storing the result of the first pass too
 +     * early. Since Q is 0 there are always just two passes, so instead
 +     * of a complicated loop over each pass we just unroll.
 +     */
 +    tmp = neon_load_reg(a->vn, 0);
 +    tmp2 = neon_load_reg(a->vn, 1);
 +    fn(tmp, tmp, tmp2);
 +    tcg_temp_free_i32(tmp2);
 +
 +    tmp3 = neon_load_reg(a->vm, 0);
 +    tmp2 = neon_load_reg(a->vm, 1);
 +    fn(tmp3, tmp3, tmp2);
 +    tcg_temp_free_i32(tmp2);
 +
 +    neon_store_reg(a->vd, 0, tmp);
 +    neon_store_reg(a->vd, 1, tmp3);
 +    return true;
 +}
 +
 +#define DO_3SAME_PAIR(INSN, func)                                       \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        static NeonGenTwoOpFn * const fns[] = {                         \
 +            gen_helper_neon_##func##8,                                  \
 +            gen_helper_neon_##func##16,                                 \
 +            gen_helper_neon_##func##32,                                 \
 +        };                                                              \
 +        if (a->size > 2) {                                              \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same_pair(s, a, fns[a->size]);                       \
 +    }
 +
 +/* 32-bit pairwise ops end up the same as the elementwise versions.  */
 +#define gen_helper_neon_pmax_s32  tcg_gen_smax_i32
 +#define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
 +#define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
 +#define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
 +
 +DO_3SAME_PAIR(VPMAX_S, pmax_s)
 +DO_3SAME_PAIR(VPMIN_S, pmin_s)
 +DO_3SAME_PAIR(VPMAX_U, pmax_u)
 +DO_3SAME_PAIR(VPMIN_U, pmin_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline void gen_neon_rsb(int size, TCGv_i32 t0, TCGv_i32 t1)
      }
  }
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
--/* 32-bit pairwise ops end up the same as the elementwise versions.  */
+         sysbus_connect_irq(busdev, n,
--#define gen_helper_neon_pmax_s32  tcg_gen_smax_i32
+                            qdev_get_gpio_in(DEVICE(&s->cpu_irq_orgate[n]), 1));
--#define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
+     }
--#define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
+-    for (n = 0; n < EXYNOS4210_EXT_GIC_NIRQ; n++) {
--#define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
+-        s->irqs.ext_gic_irq[n] = qdev_get_gpio_in(DEVICE(&s->ext_gic), n);
--
+-    }
- #define GEN_NEON_INTEGER_OP_ENV(name) do { \
-     switch ((size << 1) | u) { \
+     /* Internal Interrupt Combiner */
-     case 0: \
+     dev = qdev_new("exynos4210.combiner");
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
-         case NEON_3R_VQSHL:
+     busdev = SYS_BUS_DEVICE(dev);
-         case NEON_3R_VRSHL:
+     sysbus_realize_and_unref(busdev, &error_fatal);
-         case NEON_3R_VQRSHL:
+     for (n = 0; n < EXYNOS4210_MAX_INT_COMBINER_OUT_IRQ; n++) {
-+        case NEON_3R_VPMAX:
+-        sysbus_connect_irq(busdev, n, s->irqs.ext_gic_irq[n]);
-+        case NEON_3R_VPMIN:
++        sysbus_connect_irq(busdev, n, qdev_get_gpio_in(DEVICE(&s->ext_gic), n));
-             /* Already handled by decodetree */
+     }
-             return 1;
+     exynos4210_combiner_get_gpioin(&s->irqs, dev, 1);
-         }
+     sysbus_mmio_map(busdev, 0, EXYNOS4210_EXT_COMBINER_BASE_ADDR);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          pairwise = 0;
          switch (op) {
          case NEON_3R_VPADD_VQRDMLAH:
 -        case NEON_3R_VPMAX:
 -        case NEON_3R_VPMIN:
              pairwise = 1;
              break;
          case NEON_3R_FLOAT_ARITH:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
          switch (op) {
 -            break;
 -        case NEON_3R_VPMAX:
 -            GEN_NEON_INTEGER_OP(pmax);
 -            break;
 -        case NEON_3R_VPMIN:
 -            GEN_NEON_INTEGER_OP(pmin);
 -            break;
          case NEON_3R_VQDMULH_VQRDMULH: /* Multiply high.  */
              if (!u) { /* VQDMULH */
                  switch (size) {
 --
-.20.1
+.25.1

-[PULL 03/45] target/arm: Create gen_gvec_{u,s}{rshr,rsra}
+[PULL 17/31] hw/arm/exynos4210: Move exynos4210_combiner_get_gpioin() into exynos4210.c
-From: Richard Henderson <richard.henderson@linaro.org>
+The function exynos4210_combiner_get_gpioin() currently lives in
 exynos4210_combiner.c, but it isn't really part of the combiner
 device itself -- it is a function that implements the wiring up of
 some interrupt sources to multiple combiner inputs.  Move it to live
 with the other SoC-level code in exynos4210.c, along with a few
 macros previously defined in exynos4210.h which are now used only
 in exynos4210.c.
-Create vectorized versions of handle_shri_with_rndacc
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-for shift+round and shift+round+accumulate.  Add out-of-line
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-helpers in preparation for longer vector lengths from SVE.
+Message-id: 20220404154658.565020-11-peter.maydell@linaro.org
 ---
  include/hw/arm/exynos4210.h   | 11 -----
  hw/arm/exynos4210.c           | 82 +++++++++++++++++++++++++++++++++++
  hw/intc/exynos4210_combiner.c | 77 --------------------------------
 files changed, 82 insertions(+), 88 deletions(-)
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-3-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/helper.h        |  20 ++
  target/arm/translate.h     |   9 +
  target/arm/translate-a64.c |  11 +-
  target/arm/translate.c     | 463 +++++++++++++++++++++++++++++++++++--
  target/arm/vec_helper.c    |  50 ++++
 files changed, 527 insertions(+), 26 deletions(-)
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/helper.h
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_usra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_3(gvec_usra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ #define EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ   \
- DEF_HELPER_FLAGS_3(gvec_usra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+     (EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ * 8)
-+DEF_HELPER_FLAGS_3(gvec_srshr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-#define EXYNOS4210_COMBINER_GET_IRQ_NUM(grp, bit)  ((grp)*8 + (bit))
-+DEF_HELPER_FLAGS_3(gvec_srshr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-#define EXYNOS4210_COMBINER_GET_GRP_NUM(irq)       ((irq) / 8)
-+DEF_HELPER_FLAGS_3(gvec_srshr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-#define EXYNOS4210_COMBINER_GET_BIT_NUM(irq) \
-+DEF_HELPER_FLAGS_3(gvec_srshr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-    ((irq) - 8 * EXYNOS4210_COMBINER_GET_GRP_NUM(irq))
-+
+-
-+DEF_HELPER_FLAGS_3(gvec_urshr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ /* IRQs number for external and internal GIC */
-+DEF_HELPER_FLAGS_3(gvec_urshr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ #define EXYNOS4210_EXT_GIC_NIRQ     (160-32)
-+DEF_HELPER_FLAGS_3(gvec_urshr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ #define EXYNOS4210_INT_GIC_NIRQ     64
-+DEF_HELPER_FLAGS_3(gvec_urshr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ void exynos4210_write_secondary(ARMCPU *cpu,
-+
+  *  bit - bit number inside group */
-+DEF_HELPER_FLAGS_3(gvec_srsra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ uint32_t exynos4210_get_irq(uint32_t grp, uint32_t bit);
-+DEF_HELPER_FLAGS_3(gvec_srsra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srsra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-/*
-+DEF_HELPER_FLAGS_3(gvec_srsra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+- * Get Combiner input GPIO into irqs structure
-+
+- */
-+DEF_HELPER_FLAGS_3(gvec_ursra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-void exynos4210_combiner_get_gpioin(Exynos4210Irq *irqs, DeviceState *dev,
-+DEF_HELPER_FLAGS_3(gvec_ursra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-        int ext);
-+DEF_HELPER_FLAGS_3(gvec_ursra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-
-+DEF_HELPER_FLAGS_3(gvec_ursra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ /*
-+
+  * exynos4210 UART
- #ifdef TARGET_AARCH64
+  */
- #include "helper-a64.h"
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate.h
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+@@ -XXX,XX +XXX,XX @@ combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
- void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+     { }, { }, { }, { }, { }, { }, { }, { }, { }, { }
-                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
+ };
-+void gen_gvec_srshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
++#define EXYNOS4210_COMBINER_GET_IRQ_NUM(grp, bit)  ((grp) * 8 + (bit))
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
++#define EXYNOS4210_COMBINER_GET_GRP_NUM(irq)       ((irq) / 8)
-+void gen_gvec_urshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
++#define EXYNOS4210_COMBINER_GET_BIT_NUM(irq) \
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
++    ((irq) - 8 * EXYNOS4210_COMBINER_GET_GRP_NUM(irq))
 +void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
+  * Initialize board IRQs.
-  */
+  * These IRQs contain splitted Int/External Combiner and External Gic IRQs.
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ uint32_t exynos4210_get_irq(uint32_t grp, uint32_t bit)
-index XXXXXXX..XXXXXXX 100644
+     return EXYNOS4210_COMBINER_GET_IRQ_NUM(grp, bit);
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
          return;
      case 0x04: /* SRSHR / URSHR (rounding) */
 -        break;
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 +                      is_u ? gen_gvec_urshr : gen_gvec_srshr, size);
 +        return;
 +
      case 0x06: /* SRSRA / URSRA (accum + rounding) */
 -        accumulate = true;
 -        break;
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 +                      is_u ? gen_gvec_ursra : gen_gvec_srsra, size);
 +        return;
 +
      default:
          g_assert_not_reached();
      }
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
      }
  }
 +/*
-+ * Shift one less than the requested amount, and the low bit is
++ * Get Combiner input GPIO into irqs structure
 + * the rounding bit.  For the 8 and 16-bit operations, because we
 + * mask the low bit, we can perform a normal integer shift instead
 + * of a vector shift.
 + */
-+static void gen_srshr8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
++static void exynos4210_combiner_get_gpioin(Exynos4210Irq *irqs,
 +                                           DeviceState *dev, int ext)
 +{
-+    TCGv_i64 t = tcg_temp_new_i64();
++    int n;
-+
++    int bit;
-+    tcg_gen_shri_i64(t, a, sh - 1);
++    int max;
-+    tcg_gen_andi_i64(t, t, dup_const(MO_8, 1));
++    qemu_irq *irq;
-+    tcg_gen_vec_sar8i_i64(d, a, sh);
++
-+    tcg_gen_vec_add8_i64(d, d, t);
++    max = ext ? EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ :
-+    tcg_temp_free_i64(t);
++        EXYNOS4210_MAX_INT_COMBINER_IN_IRQ;
-+}
++    irq = ext ? irqs->ext_combiner_irq : irqs->int_combiner_irq;
 +
-+static void gen_srshr16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
++    /*
-+{
++     * Some IRQs of Int/External Combiner are going to two Combiners groups,
-+    TCGv_i64 t = tcg_temp_new_i64();
++     * so let split them.
-+
++     */
-+    tcg_gen_shri_i64(t, a, sh - 1);
++    for (n = 0; n < max; n++) {
-+    tcg_gen_andi_i64(t, t, dup_const(MO_16, 1));
++
-+    tcg_gen_vec_sar16i_i64(d, a, sh);
++        bit = EXYNOS4210_COMBINER_GET_BIT_NUM(n);
-+    tcg_gen_vec_add16_i64(d, d, t);
++
-+    tcg_temp_free_i64(t);
++        switch (n) {
-+}
++        /* MDNIE_LCD1 INTG1 */
-+
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 0) ...
-+static void gen_srshr32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
++             EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 3):
-+{
++            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+    TCGv_i32 t = tcg_temp_new_i32();
++                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(0, bit + 4)]);
-+
++            continue;
-+    tcg_gen_extract_i32(t, a, sh - 1, 1);
++
-+    tcg_gen_sari_i32(d, a, sh);
++        /* TMU INTG3 */
-+    tcg_gen_add_i32(d, d, t);
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(3, 4):
-+    tcg_temp_free_i32(t);
++            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+}
++                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(2, bit)]);
-+
++            continue;
-+static void gen_srshr64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
++
-+{
++        /* LCD1 INTG12 */
-+    TCGv_i64 t = tcg_temp_new_i64();
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 0) ...
-+
++             EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 3):
-+    tcg_gen_extract_i64(t, a, sh - 1, 1);
++            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+    tcg_gen_sari_i64(d, a, sh);
++                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(11, bit + 4)]);
-+    tcg_gen_add_i64(d, d, t);
++            continue;
-+    tcg_temp_free_i64(t);
++
-+}
++        /* Multi-Core Timer INTG12 */
-+
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 4) ...
-+static void gen_srshr_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
++             EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 8):
-+{
++               irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
++                       irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+    TCGv_vec ones = tcg_temp_new_vec_matching(d);
++            continue;
 +
-+    tcg_gen_shri_vec(vece, t, a, sh - 1);
++        /* Multi-Core Timer INTG35 */
-+    tcg_gen_dupi_vec(vece, ones, 1);
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(35, 4) ...
-+    tcg_gen_and_vec(vece, t, t, ones);
++             EXYNOS4210_COMBINER_GET_IRQ_NUM(35, 8):
-+    tcg_gen_sari_vec(vece, d, a, sh);
++            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+    tcg_gen_add_vec(vece, d, d, t);
++                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+
++            continue;
-+    tcg_temp_free_vec(t);
++
-+    tcg_temp_free_vec(ones);
++        /* Multi-Core Timer INTG51 */
-+}
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(51, 4) ...
-+
++             EXYNOS4210_COMBINER_GET_IRQ_NUM(51, 8):
-+void gen_gvec_srshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
++            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
++                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+{
++            continue;
-+    static const TCGOpcode vecop_list[] = {
++
-+        INDEX_op_shri_vec, INDEX_op_sari_vec, INDEX_op_add_vec, 0
++        /* Multi-Core Timer INTG53 */
-+    };
++        case EXYNOS4210_COMBINER_GET_IRQ_NUM(53, 4) ...
-+    static const GVecGen2i ops[4] = {
++             EXYNOS4210_COMBINER_GET_IRQ_NUM(53, 8):
-+        { .fni8 = gen_srshr8_i64,
++            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+          .fniv = gen_srshr_vec,
++                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+          .fno = gen_helper_gvec_srshr_b,
++            continue;
-+          .opt_opc = vecop_list,
++        }
-+          .vece = MO_8 },
++
-+        { .fni8 = gen_srshr16_i64,
++        irq[n] = qdev_get_gpio_in(dev, n);
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_srshr32_i32,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_srshr64_i64,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    if (shift == (8 << vece)) {
 +        /*
 +         * Shifts larger than the element size are architecturally valid.
 +         * Signed results in all sign bits.  With rounding, this produces
 +         *   (-1 + 1) >> 1 == 0, or (0 + 1) >> 1 == 0.
 +         * I.e. always zero.
 +         */
 +        tcg_gen_gvec_dup_imm(vece, rd_ofs, opr_sz, max_sz, 0);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
-+static void gen_srsra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
+ static uint8_t chipid_and_omr[] = { 0x11, 0x02, 0x21, 0x43,
-+{
+x09, 0x00, 0x00, 0x00 };
-+    TCGv_i64 t = tcg_temp_new_i64();
-+
+diff --git a/hw/intc/exynos4210_combiner.c b/hw/intc/exynos4210_combiner.c
-+    gen_srshr8_i64(t, a, sh);
+index XXXXXXX..XXXXXXX 100644
-+    tcg_gen_vec_add8_i64(d, d, t);
+--- a/hw/intc/exynos4210_combiner.c
-+    tcg_temp_free_i64(t);
++++ b/hw/intc/exynos4210_combiner.c
-+}
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_exynos4210_combiner = {
-+
+     }
-+static void gen_srsra16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
+ };
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
+-/*
-+
+- * Get Combiner input GPIO into irqs structure
-+    gen_srshr16_i64(t, a, sh);
+- */
-+    tcg_gen_vec_add16_i64(d, d, t);
+-void exynos4210_combiner_get_gpioin(Exynos4210Irq *irqs, DeviceState *dev,
-+    tcg_temp_free_i64(t);
+-        int ext)
-+}
+-{
-+
+-    int n;
-+static void gen_srsra32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
+-    int bit;
-+{
+-    int max;
-+    TCGv_i32 t = tcg_temp_new_i32();
+-    qemu_irq *irq;
-+
+-
-+    gen_srshr32_i32(t, a, sh);
+-    max = ext ? EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ :
-+    tcg_gen_add_i32(d, d, t);
+-        EXYNOS4210_MAX_INT_COMBINER_IN_IRQ;
-+    tcg_temp_free_i32(t);
+-    irq = ext ? irqs->ext_combiner_irq : irqs->int_combiner_irq;
-+}
+-
-+
+-    /*
-+static void gen_srsra64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
+-     * Some IRQs of Int/External Combiner are going to two Combiners groups,
-+{
+-     * so let split them.
-+    TCGv_i64 t = tcg_temp_new_i64();
+-     */
-+
+-    for (n = 0; n < max; n++) {
-+    gen_srshr64_i64(t, a, sh);
+-
-+    tcg_gen_add_i64(d, d, t);
+-        bit = EXYNOS4210_COMBINER_GET_BIT_NUM(n);
-+    tcg_temp_free_i64(t);
+-
-+}
+-        switch (n) {
-+
+-        /* MDNIE_LCD1 INTG1 */
-+static void gen_srsra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 0) ...
-+{
+-             EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 3):
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
+-            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+
+-                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(0, bit + 4)]);
-+    gen_srshr_vec(vece, t, a, sh);
+-            continue;
-+    tcg_gen_add_vec(vece, d, d, t);
+-
-+    tcg_temp_free_vec(t);
+-        /* TMU INTG3 */
-+}
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(3, 4):
-+
+-            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+-                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(2, bit)]);
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
+-            continue;
-+{
+-
-+    static const TCGOpcode vecop_list[] = {
+-        /* LCD1 INTG12 */
-+        INDEX_op_shri_vec, INDEX_op_sari_vec, INDEX_op_add_vec, 0
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 0) ...
-+    };
+-             EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 3):
-+    static const GVecGen2i ops[4] = {
+-            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+        { .fni8 = gen_srsra8_i64,
+-                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(11, bit + 4)]);
-+          .fniv = gen_srsra_vec,
+-            continue;
-+          .fno = gen_helper_gvec_srsra_b,
+-
-+          .opt_opc = vecop_list,
+-        /* Multi-Core Timer INTG12 */
-+          .load_dest = true,
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 4) ...
-+          .vece = MO_8 },
+-             EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 8):
-+        { .fni8 = gen_srsra16_i64,
+-               irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+          .fniv = gen_srsra_vec,
+-                       irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+          .fno = gen_helper_gvec_srsra_h,
+-            continue;
-+          .opt_opc = vecop_list,
+-
-+          .load_dest = true,
+-        /* Multi-Core Timer INTG35 */
-+          .vece = MO_16 },
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(35, 4) ...
-+        { .fni4 = gen_srsra32_i32,
+-             EXYNOS4210_COMBINER_GET_IRQ_NUM(35, 8):
-+          .fniv = gen_srsra_vec,
+-            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+          .fno = gen_helper_gvec_srsra_s,
+-                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+          .opt_opc = vecop_list,
+-            continue;
-+          .load_dest = true,
+-
-+          .vece = MO_32 },
+-        /* Multi-Core Timer INTG51 */
-+        { .fni8 = gen_srsra64_i64,
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(51, 4) ...
-+          .fniv = gen_srsra_vec,
+-             EXYNOS4210_COMBINER_GET_IRQ_NUM(51, 8):
-+          .fno = gen_helper_gvec_srsra_d,
+-            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
+-                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+          .opt_opc = vecop_list,
+-            continue;
-+          .load_dest = true,
+-
-+          .vece = MO_64 },
+-        /* Multi-Core Timer INTG53 */
-+    };
+-        case EXYNOS4210_COMBINER_GET_IRQ_NUM(53, 4) ...
-+
+-             EXYNOS4210_COMBINER_GET_IRQ_NUM(53, 8):
-+    /* tszimm encoding produces immediates in the range [1..esize] */
+-            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
-+    tcg_debug_assert(shift > 0);
+-                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
-+    tcg_debug_assert(shift <= (8 << vece));
+-            continue;
-+
+-        }
-+    /*
+-
-+     * Shifts larger than the element size are architecturally valid.
+-        irq[n] = qdev_get_gpio_in(dev, n);
-+     * Signed results in all sign bits.  With rounding, this produces
+-    }
-+     *   (-1 + 1) >> 1 == 0, or (0 + 1) >> 1 == 0.
+-}
-+     * I.e. always zero.  With accumulation, this leaves D unchanged.
+-
-+     */
+ static uint64_t
-+    if (shift == (8 << vece)) {
+ exynos4210_combiner_read(void *opaque, hwaddr offset, unsigned size)
 +        /* Nop, but we do need to clear the tail. */
 +        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_urshr8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_8, 1));
 +    tcg_gen_vec_shr8i_i64(d, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_16, 1));
 +    tcg_gen_vec_shr16i_i64(d, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    tcg_gen_extract_i32(t, a, sh - 1, 1);
 +    tcg_gen_shri_i32(d, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_urshr64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_extract_i64(t, a, sh - 1, 1);
 +    tcg_gen_shri_i64(d, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t shift)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec ones = tcg_temp_new_vec_matching(d);
 +
 +    tcg_gen_shri_vec(vece, t, a, shift - 1);
 +    tcg_gen_dupi_vec(vece, ones, 1);
 +    tcg_gen_and_vec(vece, t, t, ones);
 +    tcg_gen_shri_vec(vece, d, a, shift);
 +    tcg_gen_add_vec(vece, d, d, t);
 +
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(ones);
 +}
 +
 +void gen_gvec_urshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_urshr8_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_urshr16_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_urshr32_i32,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_urshr64_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    if (shift == (8 << vece)) {
 +        /*
 +         * Shifts larger than the element size are architecturally valid.
 +         * Unsigned results in zero.  With rounding, this produces a
 +         * copy of the most significant bit.
 +         */
 +        tcg_gen_gvec_shri(vece, rd_ofs, rm_ofs, shift - 1, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_ursra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 8) {
 +        tcg_gen_vec_shr8i_i64(t, a, 7);
 +    } else {
 +        gen_urshr8_i64(t, a, sh);
 +    }
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 16) {
 +        tcg_gen_vec_shr16i_i64(t, a, 15);
 +    } else {
 +        gen_urshr16_i64(t, a, sh);
 +    }
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    if (sh == 32) {
 +        tcg_gen_shri_i32(t, a, 31);
 +    } else {
 +        gen_urshr32_i32(t, a, sh);
 +    }
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_ursra64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 64) {
 +        tcg_gen_shri_i64(t, a, 63);
 +    } else {
 +        gen_urshr64_i64(t, a, sh);
 +    }
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    if (sh == (8 << vece)) {
 +        tcg_gen_shri_vec(vece, t, a, sh - 1);
 +    } else {
 +        gen_urshr_vec(vece, t, a, sh);
 +    }
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_ursra8_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fni8 = gen_ursra16_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_ursra32_i32,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_ursra64_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +}
 +
  static void gen_shr8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
-     uint64_t mask = dup_const(MO_8, 0xff >> shift);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                     }
-                     return 0;
-+                case 2: /* VRSHR */
-+                    /* Right shift comes here negative.  */
-+                    shift = -shift;
-+                    if (u) {
-+                        gen_gvec_urshr(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    } else {
-+                        gen_gvec_srshr(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    }
-+                    return 0;
-+
-+                case 3: /* VRSRA */
-+                    /* Right shift comes here negative.  */
-+                    shift = -shift;
-+                    if (u) {
-+                        gen_gvec_ursra(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    } else {
-+                        gen_gvec_srsra(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    }
-+                    return 0;
-+
-                 case 4: /* VSRI */
-                     if (!u) {
-                         return 1;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         neon_load_reg64(cpu_V0, rm + pass);
-                         tcg_gen_movi_i64(cpu_V1, imm);
-                         switch (op) {
--                        case 2: /* VRSHR */
--                        case 3: /* VRSRA */
--                            if (u)
--                                gen_helper_neon_rshl_u64(cpu_V0, cpu_V0, cpu_V1);
--                            else
--                                gen_helper_neon_rshl_s64(cpu_V0, cpu_V0, cpu_V1);
--                            break;
-                         case 6: /* VQSHLU */
-                             gen_helper_neon_qshlu_s64(cpu_V0, cpu_env,
-                                                       cpu_V0, cpu_V1);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         default:
-                             g_assert_not_reached();
-                         }
--                        if (op == 3) {
--                            /* Accumulate.  */
--                            neon_load_reg64(cpu_V1, rd + pass);
--                            tcg_gen_add_i64(cpu_V0, cpu_V0, cpu_V1);
--                        }
-                         neon_store_reg64(cpu_V0, rd + pass);
-                     } else { /* size < 3 */
-                         /* Operands in T0 and T1.  */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         tmp2 = tcg_temp_new_i32();
-                         tcg_gen_movi_i32(tmp2, imm);
-                         switch (op) {
--                        case 2: /* VRSHR */
--                        case 3: /* VRSRA */
--                            GEN_NEON_INTEGER_OP(rshl);
--                            break;
-                         case 6: /* VQSHLU */
-                             switch (size) {
-                             case 0:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                             g_assert_not_reached();
-                         }
-                         tcg_temp_free_i32(tmp2);
--
--                        if (op == 3) {
--                            /* Accumulate.  */
--                            tmp2 = neon_load_reg(rd, pass);
--                            gen_neon_add(size, tmp, tmp2);
--                            tcg_temp_free_i32(tmp2);
--                        }
-                         neon_store_reg(rd, pass, tmp);
-                     }
-                 } /* for pass */
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_SRA(gvec_usra_d, uint64_t)
- #undef DO_SRA
-+#define DO_RSHR(NAME, TYPE)                             \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        TYPE tmp = n[i] >> (shift - 1);                 \
-+        d[i] = (tmp >> 1) + (tmp & 1);                  \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_RSHR(gvec_srshr_b, int8_t)
-+DO_RSHR(gvec_srshr_h, int16_t)
-+DO_RSHR(gvec_srshr_s, int32_t)
-+DO_RSHR(gvec_srshr_d, int64_t)
-+
-+DO_RSHR(gvec_urshr_b, uint8_t)
-+DO_RSHR(gvec_urshr_h, uint16_t)
-+DO_RSHR(gvec_urshr_s, uint32_t)
-+DO_RSHR(gvec_urshr_d, uint64_t)
-+
-+#undef DO_RSHR
-+
-+#define DO_RSRA(NAME, TYPE)                             \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        TYPE tmp = n[i] >> (shift - 1);                 \
-+        d[i] += (tmp >> 1) + (tmp & 1);                 \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_RSRA(gvec_srsra_b, int8_t)
-+DO_RSRA(gvec_srsra_h, int16_t)
-+DO_RSRA(gvec_srsra_s, int32_t)
-+DO_RSRA(gvec_srsra_d, int64_t)
-+
-+DO_RSRA(gvec_ursra_b, uint8_t)
-+DO_RSRA(gvec_ursra_h, uint16_t)
-+DO_RSRA(gvec_ursra_s, uint32_t)
-+DO_RSRA(gvec_ursra_d, uint64_t)
-+
-+#undef DO_RSRA
-+
- /*
-  * Convert float16 to float32, raising no exceptions and
-  * preserving exceptional values, including SNaN.
 --
-.20.1
+.25.1

-[PULL 37/45] target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
+[PULL 18/31] hw/arm/exynos4210: Delete unused macro definitions
-Convert the Neon integer VPADD 3-reg-same insns to decodetree.  These
+Delete a couple of #defines which are never used.
 are 'pairwise' operations.  (Note that VQRDMLAH, which shares the
 same primary opcode but has U=1, has already been converted.)
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-10-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-12-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  2 ++
+ include/hw/arm/exynos4210.h | 4 ----
- target/arm/translate-neon.inc.c |  2 ++
+file changed, 4 deletions(-)
  target/arm/translate.c          | 19 +------------------
 files changed, 5 insertions(+), 18 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
+@@ -XXX,XX +XXX,XX @@
- VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+ #define EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ   \
- VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+     (EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ * 8)
-+VPADD_3s         1111 001 0 0 . .. .... .... 1011 . . . 1 .... @3same_q0
+-/* IRQs number for external and internal GIC */
-+
+-#define EXYNOS4210_EXT_GIC_NIRQ     (160-32)
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
+-#define EXYNOS4210_INT_GIC_NIRQ     64
  SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ static bool do_3same_pair(DisasContext *s, arg_3same *a, NeonGenTwoOpFn *fn)
  #define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
  #define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
  #define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
 +#define gen_helper_neon_padd_u32  tcg_gen_add_i32
  DO_3SAME_PAIR(VPMAX_S, pmax_s)
  DO_3SAME_PAIR(VPMIN_S, pmin_s)
  DO_3SAME_PAIR(VPMAX_U, pmax_u)
  DO_3SAME_PAIR(VPMIN_U, pmin_u)
 +DO_3SAME_PAIR(VPADD, padd_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              return 1;
          }
          switch (op) {
 -        case NEON_3R_VPADD_VQRDMLAH:
 -            if (!u) {
 -                break;  /* VPADD */
 -            }
 -            /* VQRDMLAH : handled by decodetree */
 -            return 1;
 -
-         case NEON_3R_VFM_VQRDMLSH:
+ #define EXYNOS4210_I2C_NUMBER               9
-             if (!u) {
-                 /* VFM, VFMS */
+ #define EXYNOS4210_NUM_DMA      3
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQRSHL:
          case NEON_3R_VPMAX:
          case NEON_3R_VPMIN:
 +        case NEON_3R_VPADD_VQRDMLAH:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          }
          pairwise = 0;
          switch (op) {
 -        case NEON_3R_VPADD_VQRDMLAH:
 -            pairwise = 1;
 -            break;
          case NEON_3R_FLOAT_ARITH:
              pairwise = (u && size < 2); /* if VPADD (float) */
              break;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  }
              }
              break;
 -        case NEON_3R_VPADD_VQRDMLAH:
 -            switch (size) {
 -            case 0: gen_helper_neon_padd_u8(tmp, tmp, tmp2); break;
 -            case 1: gen_helper_neon_padd_u16(tmp, tmp, tmp2); break;
 -            case 2: tcg_gen_add_i32(tmp, tmp, tmp2); break;
 -            default: abort();
 -            }
 -            break;
          case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
-.20.1
+.25.1

-[PULL 39/45] target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
+[PULL 19/31] hw/arm/exynos4210: Use TYPE_SPLIT_IRQ in exynos4210_init_board_irqs()
-Convert the Neon VADD, VSUB, VABD 3-reg-same insns to decodetree.
+In exynos4210_init_board_irqs(), use the TYPE_SPLIT_IRQ device
-We already have gvec helpers for addition and subtraction, but must
+instead of qemu_irq_split().
 add one for fabd.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-12-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-13-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  3 ++-
+ include/hw/arm/exynos4210.h |  9 ++++++++
- target/arm/neon-dp.decode       |  8 ++++++++
+ hw/arm/exynos4210.c         | 41 +++++++++++++++++++++++++++++--------
- target/arm/neon_helper.c        |  7 -------
+files changed, 42 insertions(+), 8 deletions(-)
  target/arm/translate-neon.inc.c | 28 ++++++++++++++++++++++++++++
  target/arm/translate.c          | 10 +++-------
  target/arm/vec_helper.c         |  7 +++++++
 files changed, 48 insertions(+), 15 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/helper.h
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(neon_qneg_s16, TCG_CALL_NO_RWG, i32, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_2(neon_qneg_s32, TCG_CALL_NO_RWG, i32, env, i32)
+ #include "hw/sysbus.h"
- DEF_HELPER_FLAGS_2(neon_qneg_s64, TCG_CALL_NO_RWG, i64, env, i64)
+ #include "hw/cpu/a9mpcore.h"
+ #include "hw/intc/exynos4210_gic.h"
--DEF_HELPER_3(neon_abd_f32, i32, i32, i32, ptr)
++#include "hw/core/split-irq.h"
- DEF_HELPER_3(neon_ceq_f32, i32, i32, i32, ptr)
+ #include "target/arm/cpu-qom.h"
- DEF_HELPER_3(neon_cge_f32, i32, i32, i32, ptr)
+ #include "qom/object.h"
- DEF_HELPER_3(neon_cgt_f32, i32, i32, i32, ptr)
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ #define EXYNOS4210_NUM_DMA      3
-+DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++/*
 + * We need one splitter for every external combiner input, plus
 + * one for every non-zero entry in combiner_grp_to_gic_id[].
 + * We'll assert in exynos4210_init_board_irqs() if this is wrong.
 + */
 +#define EXYNOS4210_NUM_SPLITTERS (EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ + 60)
 +
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
+ typedef struct Exynos4210Irq {
-                    void, ptr, ptr, ptr, ptr, i32)
+     qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
+     qemu_irq ext_combiner_irq[EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ];
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+@@ -XXX,XX +XXX,XX @@ struct Exynos4210State {
      qemu_or_irq cpu_irq_orgate[EXYNOS4210_NCPUS];
      A9MPPrivState a9mpcore;
      Exynos4210GicState ext_gic;
 +    SplitIRQ splitter[EXYNOS4210_NUM_SPLITTERS];
  };
  #define TYPE_EXYNOS4210_SOC "exynos4210"
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
- @3same_q0        .... ... . . . size:2 .... .... .... . 0 . . .... \
+     uint32_t grp, bit, irq_id, n;
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
+     Exynos4210Irq *is = &s->irqs;
+     DeviceState *extgicdev = DEVICE(&s->ext_gic);
-+# For FP insns the high bit of 'size' is used as part of opcode decode
++    int splitcount = 0;
-+@3same_fp        .... ... . . . . size:1 .... .... .... . q:1 . . .... \
++    DeviceState *splitter;
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
      for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
          irq_id = 0;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
              /* MCT_G1 is passed to External and GIC */
              irq_id = EXT_GIC_ID_MCT_G1;
          }
 +
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
++        assert(splitcount < EXYNOS4210_NUM_SPLITTERS);
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
++        splitter = DEVICE(&s->splitter[splitcount]);
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
++        qdev_prop_set_uint16(splitter, "num-lines", 2);
-@@ -XXX,XX +XXX,XX @@ SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
++        qdev_realize(splitter, NULL, &error_abort);
-                  vm=%vm_dp vn=%vn_dp vd=%vd_dp
++        splitcount++;
++        s->irq_table[n] = qdev_get_gpio_in(splitter, 0);
- VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
++        qdev_connect_gpio_out(splitter, 0, is->int_combiner_irq[n]);
-+
+         if (irq_id) {
-+VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
+-            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
-+VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+-                                             qdev_get_gpio_in(extgicdev,
-+VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+-                                                              irq_id - 32));
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
++            qdev_connect_gpio_out(splitter, 1,
-index XXXXXXX..XXXXXXX 100644
++                                  qdev_get_gpio_in(extgicdev, irq_id - 32));
---- a/target/arm/neon_helper.c
+         } else {
-+++ b/target/arm/neon_helper.c
+-            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_qneg_s64)(CPUARMState *env, uint64_t x)
+-                    is->ext_combiner_irq[n]);
 +            qdev_connect_gpio_out(splitter, 1, is->ext_combiner_irq[n]);
          }
      }
      for (; n < EXYNOS4210_MAX_INT_COMBINER_IN_IRQ; n++) {
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
                       EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][bit];
          if (irq_id) {
 -            s->irq_table[n] = qemu_irq_split(is->int_combiner_irq[n],
 -                                             qdev_get_gpio_in(extgicdev,
 -                                                              irq_id - 32));
 +            assert(splitcount < EXYNOS4210_NUM_SPLITTERS);
 +            splitter = DEVICE(&s->splitter[splitcount]);
 +            qdev_prop_set_uint16(splitter, "num-lines", 2);
 +            qdev_realize(splitter, NULL, &error_abort);
 +            splitcount++;
 +            s->irq_table[n] = qdev_get_gpio_in(splitter, 0);
 +            qdev_connect_gpio_out(splitter, 0, is->int_combiner_irq[n]);
 +            qdev_connect_gpio_out(splitter, 1,
 +                                  qdev_get_gpio_in(extgicdev, irq_id - 32));
          }
      }
 +    /*
 +     * We check this here to avoid a more obscure assert later when
 +     * qdev_assert_realized_properly() checks that we realized every
 +     * child object we initialized.
 +     */
 +    assert(splitcount == EXYNOS4210_NUM_SPLITTERS);
  }
- /* NEON Float helpers.  */
+ /*
--uint32_t HELPER(neon_abd_f32)(uint32_t a, uint32_t b, void *fpstp)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init(Object *obj)
--{
+         object_initialize_child(obj, name, &s->cpu_irq_orgate[i], TYPE_OR_IRQ);
--    float_status *fpst = fpstp;
+     }
--    float32 f0 = make_float32(a);
--    float32 f1 = make_float32(b);
++    for (i = 0; i < ARRAY_SIZE(s->splitter); i++) {
--    return float32_val(float32_abs(float32_sub(f0, f1, fpst)));
++        g_autofree char *name = g_strdup_printf("irq-splitter%d", i);
--}
++        object_initialize_child(obj, name, &s->splitter[i], TYPE_SPLIT_IRQ);
  /* Floating point comparisons produce an integer result.
   * Note that EQ doesn't signal InvalidOp for QNaNs but GE and GT do.
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
  DO_3SAME_VQDMULH(VQDMULH, qdmulh)
  DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
 +
 +/*
 + * For all the functions using this macro, size == 1 means fp16,
 + * which is an architecture extension we don't implement yet.
 + */
 +#define DO_3S_FP_GVEC(INSN,FUNC)                                        \
 +    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        TCGv_ptr fpst = get_fpstatus_ptr(1);                            \
 +        tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpst,                \
 +                           oprsz, maxsz, 0, FUNC);                      \
 +        tcg_temp_free_ptr(fpst);                                        \
 +    }                                                                   \
 +    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a)     \
 +    {                                                                   \
 +        if (a->size != 0) {                                             \
 +            /* TODO fp16 support */                                     \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
-+
+     object_initialize_child(obj, "a9mpcore", &s->a9mpcore, TYPE_A9MPCORE_PRIV);
-+DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
+     object_initialize_child(obj, "ext-gic", &s->ext_gic, TYPE_EXYNOS4210_GIC);
 +DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
 +DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          switch (op) {
          case NEON_3R_FLOAT_ARITH:
              pairwise = (u && size < 2); /* if VPADD (float) */
 +            if (!pairwise) {
 +                return 1; /* handled by decodetree */
 +            }
              break;
          case NEON_3R_FLOAT_MINMAX:
              pairwise = u; /* if VPMIN/VPMAX (float) */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
              switch ((u << 2) | size) {
 -            case 0: /* VADD */
              case 4: /* VPADD */
                  gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
                  break;
 -            case 2: /* VSUB */
 -                gen_helper_vfp_subs(tmp, tmp, tmp2, fpstatus);
 -                break;
 -            case 6: /* VABD */
 -                gen_helper_neon_abd_f32(tmp, tmp, tmp2, fpstatus);
 -                break;
              default:
                  abort();
              }
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static float64 float64_ftsmul(float64 op1, uint64_t op2, float_status *stat)
      return result;
  }
-+static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
-+{
-+    return float32_abs(float32_sub(op1, op2, stat));
-+}
-+
- #define DO_3OP(NAME, FUNC, TYPE) \
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
- {                                                                          \
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_h, float16_ftsmul, float16)
- DO_3OP(gvec_ftsmul_s, float32_ftsmul, float32)
- DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
-+DO_3OP(gvec_fabd_s, float32_abd, float32)
-+
- #ifdef TARGET_AARCH64
- DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
 --
-.20.1
+.25.1

-[PULL 34/45] target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
+[PULL 20/31] hw/arm/exynos4210: Fill in irq_table[] for internal-combiner-only IRQ lines
-Convert the Neon VRHADD and VHSUB 3-reg-same insns to decodetree.
+In exynos4210_init_board_irqs(), the loop that handles IRQ lines that
-(These are all the other insns in 3-reg-same which were using
+are in a range that applies to the internal combiner only creates a
-GEN_NEON_INTEGER_OP() and which are not pairwise or
+splitter for those interrupts which go to both the internal combiner
-reversed-operands.)
+and to the external GIC, but it does nothing at all for the
 interrupts which don't go to the external GIC, leaving the
 irq_table[] array element empty for those.  (This will result in
 those interrupts simply being lost, not in a QEMU crash.)
 I don't have a reliable datasheet for this SoC, but since we do wire
 up one interrupt line in this category (the HDMI I2C device on
 interrupt 16,1), this seems like it must be a bug in the existing
 QEMU code.  Fill in the irq_table[] entries where we're not splitting
 the IRQ to both the internal combiner and the external GIC with the
 IRQ line of the internal combiner.  (That is, these IRQ lines go to
 just one device, not multiple.)
 This bug didn't have any visible guest effects because the only
 implemented device that was affected was the HDMI I2C controller,
 and we never connect any I2C devices to that bus.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-7-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-14-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       | 6 ++++++
+ hw/arm/exynos4210.c | 2 ++
- target/arm/translate-neon.inc.c | 4 ++++
+file changed, 2 insertions(+)
  target/arm/translate.c          | 8 ++------
 files changed, 12 insertions(+), 6 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
+             qdev_connect_gpio_out(splitter, 0, is->int_combiner_irq[n]);
- VQADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 1 .... @3same
+             qdev_connect_gpio_out(splitter, 1,
+                                   qdev_get_gpio_in(extgicdev, irq_id - 32));
-+VRHADD_S_3s      1111 001 0 0 . .. .... .... 0001 . . . 0 .... @3same
++        } else {
-+VRHADD_U_3s      1111 001 1 0 . .. .... .... 0001 . . . 0 .... @3same
++            s->irq_table[n] = is->int_combiner_irq[n];
 +
  @3same_logic     .... ... . . . .. .... .... .... . q:1 .. .... \
                   &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp size=0
@@ -XXX,XX +XXX,XX @@ VBSL_3s          1111 001 1 0 . 01 .... .... 0001 ... 1 .... @3same_logic
  VBIT_3s          1111 001 1 0 . 10 .... .... 0001 ... 1 .... @3same_logic
  VBIF_3s          1111 001 1 0 . 11 .... .... 0001 ... 1 .... @3same_logic
 +VHSUB_S_3s       1111 001 0 0 . .. .... .... 0010 . . . 0 .... @3same
 +VHSUB_U_3s       1111 001 1 0 . .. .... .... 0010 . . . 0 .... @3same
 +
  VQSUB_S_3s       1111 001 0 0 . .. .... .... 0010 . . . 1 .... @3same
  VQSUB_U_3s       1111 001 1 0 . .. .... .... 0010 . . . 1 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
  DO_3SAME_32(VHADD_S, hadd_s)
  DO_3SAME_32(VHADD_U, hadd_u)
 +DO_3SAME_32(VHSUB_S, hsub_s)
 +DO_3SAME_32(VHSUB_U, hsub_u)
 +DO_3SAME_32(VRHADD_S, rhadd_s)
 +DO_3SAME_32(VRHADD_U, rhadd_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
          case NEON_3R_VHADD:
 +        case NEON_3R_VRHADD:
 +        case NEON_3R_VHSUB:
          case NEON_3R_VABD:
          case NEON_3R_VABA:
              /* Already handled by decodetree */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
-         switch (op) {
+     }
--        case NEON_3R_VRHADD:
+     /*
 -            GEN_NEON_INTEGER_OP(rhadd);
 -            break;
 -        case NEON_3R_VHSUB:
 -            GEN_NEON_INTEGER_OP(hsub);
 -            break;
          case NEON_3R_VQSHL:
              GEN_NEON_INTEGER_OP_ENV(qshl);
              break;
 --
-.20.1
+.25.1

-[PULL 32/45] target/arm: Convert Neon VHADD 3-reg-same insns
+[PULL 21/31] hw/arm/exynos4210: Connect MCT_G0 and MCT_G1 to both combiners
-Convert the Neon VHADD insns in the 3-reg-same group to decodetree.
+Currently for the interrupts MCT_G0 and MCT_G1 which are
 the only ones in the input range of the external combiner
 and which are also wired to the external GIC, we connect
 them only to the internal combiner and the external GIC.
 This seems likely to be a bug, as all other interrupts
 which are in the input range of both combiners are
 connected to both combiners. (The fact that the code in
 exynos4210_combiner_get_gpioin() is also trying to wire
 up these inputs on both combiners also suggests this.)
 Wire these interrupts up to both combiners, like the rest.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-5-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-15-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  2 ++
+ hw/arm/exynos4210.c | 7 +++----
- target/arm/translate-neon.inc.c | 24 ++++++++++++++++++++++++
+file changed, 3 insertions(+), 4 deletions(-)
  target/arm/translate.c          |  4 +---
 files changed, 27 insertions(+), 3 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
- @3same           .... ... . . . size:2 .... .... .... . q:1 . . .... \
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
+         assert(splitcount < EXYNOS4210_NUM_SPLITTERS);
+         splitter = DEVICE(&s->splitter[splitcount]);
-+VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+-        qdev_prop_set_uint16(splitter, "num-lines", 2);
-+VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
++        qdev_prop_set_uint16(splitter, "num-lines", irq_id ? 3 : 2);
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
+         qdev_realize(splitter, NULL, &error_abort);
- VQADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 1 .... @3same
+         splitcount++;
+         s->irq_table[n] = qdev_get_gpio_in(splitter, 0);
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+         qdev_connect_gpio_out(splitter, 0, is->int_combiner_irq[n]);
-index XXXXXXX..XXXXXXX 100644
++        qdev_connect_gpio_out(splitter, 1, is->ext_combiner_irq[n]);
---- a/target/arm/translate-neon.inc.c
+         if (irq_id) {
-+++ b/target/arm/translate-neon.inc.c
+-            qdev_connect_gpio_out(splitter, 1,
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQSHL_S64, gen_helper_neon_qshl_s64)
++            qdev_connect_gpio_out(splitter, 2,
- DO_3SAME_64_ENV(VQSHL_U64, gen_helper_neon_qshl_u64)
+                                   qdev_get_gpio_in(extgicdev, irq_id - 32));
- DO_3SAME_64_ENV(VQRSHL_S64, gen_helper_neon_qrshl_s64)
+-        } else {
- DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
+-            qdev_connect_gpio_out(splitter, 1, is->ext_combiner_irq[n]);
 +
 +#define DO_3SAME_32(INSN, FUNC)                                         \
 +    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        static const GVecGen3 ops[4] = {                                \
 +            { .fni4 = gen_helper_neon_##FUNC##8 },                      \
 +            { .fni4 = gen_helper_neon_##FUNC##16 },                     \
 +            { .fni4 = gen_helper_neon_##FUNC##32 },                     \
 +            { 0 },                                                      \
 +        };                                                              \
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece]); \
 +    }                                                                   \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        if (a->size > 2) {                                              \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
 +DO_3SAME_32(VHADD_S, hadd_s)
 +DO_3SAME_32(VHADD_U, hadd_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VML:
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
 +        case NEON_3R_VHADD:
              /* Already handled by decodetree */
              return 1;
          }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+     }
-             tmp2 = neon_load_reg(rm, pass);
+     for (; n < EXYNOS4210_MAX_INT_COMBINER_IN_IRQ; n++) {
          }
          switch (op) {
 -        case NEON_3R_VHADD:
 -            GEN_NEON_INTEGER_OP(hadd);
 -            break;
          case NEON_3R_VRHADD:
              GEN_NEON_INTEGER_OP(rhadd);
              break;
 --
-.20.1
+.25.1

-[PULL 33/45] target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
+[PULL 22/31] hw/arm/exynos4210: Don't connect multiple lines to external GIC inputs
-Convert the Neon VABA and VABD insns in the 3-reg-same group to
+The combiner_grp_to_gic_id[] array includes the EXT_GIC_ID_MCT_G0
-decodetree.
+and EXT_GIC_ID_MCT_G1 multiple times. This means that we will
 connect multiple IRQs up to the same external GIC input, which
 is not permitted. We do the same thing in the code in
 exynos4210_init_board_irqs() because the conditionals selecting
 an irq_id in the first loop match multiple interrupt IDs.
 Overall we do this for interrupt IDs
 (1, 4), (12, 4), (35, 4), (51, 4), (53, 4) for EXT_GIC_ID_MCT_G0
 and
 (1, 5), (12, 5), (35, 5), (51, 5), (53, 5) for EXT_GIC_ID_MCT_G1
 These correspond to the cases for the multi-core timer that we are
 wiring up to multiple inputs on the combiner in
 exynos4210_combiner_get_gpioin().  That code already deals with all
 these interrupt IDs being the same input source, so we don't need to
 connect the external GIC interrupt for any of them except the first
 (1, 4) and (1, 5). Remove the array entries and conditionals which
 were incorrectly causing us to wire up extra lines.
 This bug didn't cause any visible effects, because we only connect
 up a device to the "primary" ID values (1, 4) and (1, 5), so the
 extra lines would never be set to a level.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-6-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-16-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  6 ++++++
+ include/hw/arm/exynos4210.h |  2 +-
- target/arm/translate-neon.inc.c |  4 ++++
+ hw/arm/exynos4210.c         | 12 +++++-------
- target/arm/translate.c          | 22 ++--------------------
+files changed, 6 insertions(+), 8 deletions(-)
 files changed, 12 insertions(+), 20 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@
- VMIN_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 1 .... @3same
+  * one for every non-zero entry in combiner_grp_to_gic_id[].
- VMIN_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 1 .... @3same
+  * We'll assert in exynos4210_init_board_irqs() if this is wrong.
+  */
-+VABD_S_3s        1111 001 0 0 . .. .... .... 0111 . . . 0 .... @3same
+-#define EXYNOS4210_NUM_SPLITTERS (EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ + 60)
-+VABD_U_3s        1111 001 1 0 . .. .... .... 0111 . . . 0 .... @3same
++#define EXYNOS4210_NUM_SPLITTERS (EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ + 54)
-+
-+VABA_S_3s        1111 001 0 0 . .. .... .... 0111 . . . 1 .... @3same
+ typedef struct Exynos4210Irq {
-+VABA_U_3s        1111 001 1 0 . .. .... .... 0111 . . . 1 .... @3same
+     qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
-+
+diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
  VADD_3s          1111 001 0 0 . .. .... .... 1000 . . . 0 .... @3same
  VSUB_3s          1111 001 1 0 . .. .... .... 1000 . . . 0 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
+@@ -XXX,XX +XXX,XX @@ combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
- DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
+     /* int combiner group 34 */
- DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
+     { EXT_GIC_ID_ONENAND_AUDI, EXT_GIC_ID_NFC },
- DO_3SAME_NO_SZ_3(VTST, gen_gvec_cmtst)
+     /* int combiner group 35 */
-+DO_3SAME_NO_SZ_3(VABD_S, gen_gvec_sabd)
+-    { 0, 0, 0, EXT_GIC_ID_MCT_L1, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
-+DO_3SAME_NO_SZ_3(VABA_S, gen_gvec_saba)
++    { 0, 0, 0, EXT_GIC_ID_MCT_L1 },
-+DO_3SAME_NO_SZ_3(VABD_U, gen_gvec_uabd)
+     /* int combiner group 36 */
-+DO_3SAME_NO_SZ_3(VABA_U, gen_gvec_uaba)
+     { EXT_GIC_ID_MIXER },
+     /* int combiner group 37 */
- #define DO_3SAME_CMP(INSN, COND)                                        \
+@@ -XXX,XX +XXX,XX @@ combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
+     /* groups 38-50 */
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+     { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { }, { },
-index XXXXXXX..XXXXXXX 100644
+     /* int combiner group 51 */
---- a/target/arm/translate.c
+-    { EXT_GIC_ID_MCT_L0, 0, 0, 0, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
-+++ b/target/arm/translate.c
++    { EXT_GIC_ID_MCT_L0 },
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+     /* group 52 */
-             /* VQRDMLSH : handled by decodetree */
+     { },
-             return 1;
+     /* int combiner group 53 */
+-    { EXT_GIC_ID_WDT, 0, 0, 0, EXT_GIC_ID_MCT_G0, EXT_GIC_ID_MCT_G1 },
--        case NEON_3R_VABD:
++    { EXT_GIC_ID_WDT },
--            if (u) {
+     /* groups 54-63 */
--                gen_gvec_uabd(size, rd_ofs, rn_ofs, rm_ofs,
+     { }, { }, { }, { }, { }, { }, { }, { }, { }, { }
--                              vec_size, vec_size);
+ };
--            } else {
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
--                gen_gvec_sabd(size, rd_ofs, rn_ofs, rm_ofs,
--                              vec_size, vec_size);
+     for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
--            }
+         irq_id = 0;
--            return 0;
+-        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 4) ||
--
+-                n == EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 4)) {
--        case NEON_3R_VABA:
++        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 4)) {
--            if (u) {
+             /* MCT_G0 is passed to External GIC */
--                gen_gvec_uaba(size, rd_ofs, rn_ofs, rm_ofs,
+             irq_id = EXT_GIC_ID_MCT_G0;
--                              vec_size, vec_size);
+         }
--            } else {
+-        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 5) ||
--                gen_gvec_saba(size, rd_ofs, rn_ofs, rm_ofs,
+-                n == EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 5)) {
--                              vec_size, vec_size);
++        if (n == EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 5)) {
--            }
+             /* MCT_G1 is passed to External and GIC */
--            return 0;
+             irq_id = EXT_GIC_ID_MCT_G1;
 -
          case NEON_3R_VADD_VSUB:
          case NEON_3R_LOGIC:
          case NEON_3R_VMAX:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
          case NEON_3R_VHADD:
 +        case NEON_3R_VABD:
 +        case NEON_3R_VABA:
              /* Already handled by decodetree */
              return 1;
          }
 --
-.20.1
+.25.1

-[PULL 26/45] ACPI: Record Generic Error Status Block(GESB) table
+[PULL 23/31] hw/arm/exynos4210: Fold combiner splits into exynos4210_init_board_irqs()
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+At this point, the function exynos4210_init_board_irqs() splits input
+IRQ lines to connect them to the input combiner, output combiner and
-kvm_arch_on_sigbus_vcpu() error injection uses source_id as
+external GIC.  The function exynos4210_combiner_get_gpioin() splits
-index in etc/hardware_errors to find out Error Status Data
+some of the combiner input lines further to connect them to multiple
-Block entry corresponding to error source. So supported source_id
+different inputs on the combiner.
-values should be assigned here and not be changed afterwards to
-make sure that guest will write error into expected Error Status
+Because (unlike qemu_irq_split()) the TYPE_SPLIT_IRQ device has a
-Data Block.
+configurable number of outputs, we can do all this in one place, by
+making exynos4210_init_board_irqs() add extra outputs to the splitter
-Before QEMU writes a new error to ACPI table, it will check whether
+device when it must be connected to more than one input on each
-previous error has been acknowledged. If not acknowledged, the new
+combiner.
-errors will be ignored and not be recorded. For the errors section
-type, QEMU simulate it to memory section error.
+We do this with a new data structure, the combinermap, which is an
+array each of whose elements is a list of the interrupt IDs on the
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+combiner which must be tied together.  As we loop through each
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+interrupt ID, if we find that it is the first one in one of these
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+lists, we configure the splitter device with eonugh extra outputs and
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+wire them up to the other interrupt IDs in the list.
-Message-id: 20200512030609.19593-9-gengdongjiu@huawei.com
 Conveniently, for all the cases where this is necessary, the
 lowest-numbered interrupt ID in each group is in the range of the
 external combiner, so we only need to code for this in the first of
 the two loops in exynos4210_init_board_irqs().
 The old code in exynos4210_combiner_get_gpioin() which is being
 deleted here had several problems which don't exist in the new code
 in its handling of the multi-core timer interrupts:
  (1) the case labels specified bits 4 ... 8, but bit '8' doesn't
      exist; these should have been 4 ... 7
  (2) it used the input irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]
      multiple times as the input of several different splitters,
      which isn't allowed
  (3) in an apparent cut-and-paste error, the cases for all the
      multi-core timer inputs used "bit + 4" even though the
      bit range for the case was (intended to be) 4 ... 7, which
      meant it was looking at non-existent bits 8 ... 11.
 None of these exist in the new code.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20220404154658.565020-17-peter.maydell@linaro.org
 ---
- include/hw/acpi/ghes.h |   1 +
+ include/hw/arm/exynos4210.h |   6 +-
- hw/acpi/ghes.c         | 219 +++++++++++++++++++++++++++++++++++++++++
+ hw/arm/exynos4210.c         | 178 +++++++++++++++++++++++-------------
-files changed, 220 insertions(+)
+files changed, 119 insertions(+), 65 deletions(-)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/include/hw/arm/exynos4210.h
-+++ b/include/hw/acpi/ghes.h
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
+@@ -XXX,XX +XXX,XX @@
- void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
- void acpi_ghes_add_fw_cfg(AcpiGhesState *vms, FWCfgState *s,
+ /*
-                           GArray *hardware_errors);
+  * We need one splitter for every external combiner input, plus
-+int acpi_ghes_record_errors(uint8_t notify, uint64_t error_physical_addr);
+- * one for every non-zero entry in combiner_grp_to_gic_id[].
- #endif
++ * one for every non-zero entry in combiner_grp_to_gic_id[],
-diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
++ * minus one for every external combiner ID in second or later
 + * places in a combinermap[] line.
   * We'll assert in exynos4210_init_board_irqs() if this is wrong.
   */
 -#define EXYNOS4210_NUM_SPLITTERS (EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ + 54)
 +#define EXYNOS4210_NUM_SPLITTERS (EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ + 38)
  typedef struct Exynos4210Irq {
      qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/acpi/ghes.c
+--- a/hw/arm/exynos4210.c
-+++ b/hw/acpi/ghes.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ combiner_grp_to_gic_id[64 - EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][8] = {
- #include "qemu/error-report.h"
+ #define EXYNOS4210_COMBINER_GET_BIT_NUM(irq) \
- #include "hw/acpi/generic_event_device.h"
+     ((irq) - 8 * EXYNOS4210_COMBINER_GET_GRP_NUM(irq))
  #include "hw/nvram/fw_cfg.h"
 +#include "qemu/uuid.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@
  /* Address offset in Generic Address Structure(GAS) */
  #define GAS_ADDR_OFFSET 4
 +/*
-+ * The total size of Generic Error Data Entry
++ * Some interrupt lines go to multiple combiner inputs.
-+ * ACPI 6.1/6.2: 18.3.2.7.1 Generic Error Data,
++ * This data structure defines those: each array element is
-+ * Table 18-343 Generic Error Data Entry
++ * a list of combiner inputs which are connected together;
 + * the one with the smallest interrupt ID value must be first.
 + * As with combiner_grp_to_gic_id[], we rely on (0, 0) not being
 + * wired to anything so we can use 0 as a terminator.
 + */
-+#define ACPI_GHES_DATA_LENGTH               72
++#define IRQNO(G, B) EXYNOS4210_COMBINER_GET_IRQ_NUM(G, B)
-+
++#define IRQNONE 0
-+/* The memory section CPER size, UEFI 2.6: N.2.5 Memory Error Section */
++
-+#define ACPI_GHES_MEM_CPER_LENGTH           80
++#define COMBINERMAP_SIZE 16
 +
-+/* Masks for block_status flags */
++static const int combinermap[COMBINERMAP_SIZE][6] = {
-+#define ACPI_GEBS_UNCORRECTABLE         1
++    /* MDNIE_LCD1 */
-+
++    { IRQNO(0, 4), IRQNO(1, 0), IRQNONE },
-+/*
++    { IRQNO(0, 5), IRQNO(1, 1), IRQNONE },
-+ * Total size for Generic Error Status Block except Generic Error Data Entries
++    { IRQNO(0, 6), IRQNO(1, 2), IRQNONE },
-+ * ACPI 6.2: 18.3.2.7.1 Generic Error Data,
++    { IRQNO(0, 7), IRQNO(1, 3), IRQNONE },
-+ * Table 18-380 Generic Error Status Block
++    /* TMU */
-+ */
++    { IRQNO(2, 4), IRQNO(3, 4), IRQNONE },
-+#define ACPI_GHES_GESB_SIZE                 20
++    { IRQNO(2, 5), IRQNO(3, 5), IRQNONE },
-+
++    { IRQNO(2, 6), IRQNO(3, 6), IRQNONE },
-+/*
++    { IRQNO(2, 7), IRQNO(3, 7), IRQNONE },
-+ * Values for error_severity field
++    /* LCD1 */
-+ */
++    { IRQNO(11, 4), IRQNO(12, 0), IRQNONE },
-+enum AcpiGenericErrorSeverity {
++    { IRQNO(11, 5), IRQNO(12, 1), IRQNONE },
-+    ACPI_CPER_SEV_RECOVERABLE = 0,
++    { IRQNO(11, 6), IRQNO(12, 2), IRQNONE },
-+    ACPI_CPER_SEV_FATAL = 1,
++    { IRQNO(11, 7), IRQNO(12, 3), IRQNONE },
-+    ACPI_CPER_SEV_CORRECTED = 2,
++    /* Multi-core timer */
-+    ACPI_CPER_SEV_NONE = 3,
++    { IRQNO(1, 4), IRQNO(12, 4), IRQNO(35, 4), IRQNO(51, 4), IRQNO(53, 4), IRQNONE },
 +    { IRQNO(1, 5), IRQNO(12, 5), IRQNO(35, 5), IRQNO(51, 5), IRQNO(53, 5), IRQNONE },
 +    { IRQNO(1, 6), IRQNO(12, 6), IRQNO(35, 6), IRQNO(51, 6), IRQNO(53, 6), IRQNONE },
 +    { IRQNO(1, 7), IRQNO(12, 7), IRQNO(35, 7), IRQNO(51, 7), IRQNO(53, 7), IRQNONE },
 +};
 +
- /*
++#undef IRQNO
-  * Hardware Error Notification
++
-  * ACPI 4.0: 17.3.2.7 Hardware Error Notification
++static const int *combinermap_entry(int irq)
@@ -XXX,XX +XXX,XX @@ static void build_ghes_hw_error_notification(GArray *table, const uint8_t type)
      build_append_int_noprefix(table, 0, 4);
  }
 +/*
 + * Generic Error Data Entry
 + * ACPI 6.1: 18.3.2.7.1 Generic Error Data
 + */
 +static void acpi_ghes_generic_error_data(GArray *table,
 +                const uint8_t *section_type, uint32_t error_severity,
 +                uint8_t validation_bits, uint8_t flags,
 +                uint32_t error_data_length, QemuUUID fru_id,
 +                uint64_t time_stamp)
 +{
 +    const uint8_t fru_text[20] = {0};
 +
 +    /* Section Type */
 +    g_array_append_vals(table, section_type, 16);
 +
 +    /* Error Severity */
 +    build_append_int_noprefix(table, error_severity, 4);
 +    /* Revision */
 +    build_append_int_noprefix(table, 0x300, 2);
 +    /* Validation Bits */
 +    build_append_int_noprefix(table, validation_bits, 1);
 +    /* Flags */
 +    build_append_int_noprefix(table, flags, 1);
 +    /* Error Data Length */
 +    build_append_int_noprefix(table, error_data_length, 4);
 +
 +    /* FRU Id */
 +    g_array_append_vals(table, fru_id.data, ARRAY_SIZE(fru_id.data));
 +
 +    /* FRU Text */
 +    g_array_append_vals(table, fru_text, sizeof(fru_text));
 +
 +    /* Timestamp */
 +    build_append_int_noprefix(table, time_stamp, 8);
 +}
 +
 +/*
 + * Generic Error Status Block
 + * ACPI 6.1: 18.3.2.7.1 Generic Error Data
 + */
 +static void acpi_ghes_generic_error_status(GArray *table, uint32_t block_status,
 +                uint32_t raw_data_offset, uint32_t raw_data_length,
 +                uint32_t data_length, uint32_t error_severity)
 +{
 +    /* Block Status */
 +    build_append_int_noprefix(table, block_status, 4);
 +    /* Raw Data Offset */
 +    build_append_int_noprefix(table, raw_data_offset, 4);
 +    /* Raw Data Length */
 +    build_append_int_noprefix(table, raw_data_length, 4);
 +    /* Data Length */
 +    build_append_int_noprefix(table, data_length, 4);
 +    /* Error Severity */
 +    build_append_int_noprefix(table, error_severity, 4);
 +}
 +
 +/* UEFI 2.6: N.2.5 Memory Error Section */
 +static void acpi_ghes_build_append_mem_cper(GArray *table,
 +                                            uint64_t error_physical_addr)
 +{
 +    /*
-+     * Memory Error Record
++     * If the interrupt number passed in is the first entry in some
 +     * line of the combinermap, return a pointer to that line;
 +     * otherwise return NULL.
 +     */
-+
++    int i;
-+    /* Validation Bits */
++    for (i = 0; i < COMBINERMAP_SIZE; i++) {
-+    build_append_int_noprefix(table,
++        if (combinermap[i][0] == irq) {
-+                              (1ULL << 14) | /* Type Valid */
++            return combinermap[i];
-+                              (1ULL << 1) /* Physical Address Valid */,
++        }
-+                              8);
++    }
-+    /* Error Status */
++    return NULL;
 +    build_append_int_noprefix(table, 0, 8);
 +    /* Physical Address */
 +    build_append_int_noprefix(table, error_physical_addr, 8);
 +    /* Skip all the detailed information normally found in such a record */
 +    build_append_int_noprefix(table, 0, 48);
 +    /* Memory Error Type */
 +    build_append_int_noprefix(table, 0 /* Unknown error */, 1);
 +    /* Skip all the detailed information normally found in such a record */
 +    build_append_int_noprefix(table, 0, 7);
 +}
 +
-+static int acpi_ghes_record_mem_error(uint64_t error_block_address,
++static int mapline_size(const int *mapline)
 +                                      uint64_t error_physical_addr)
 +{
-+    GArray *block;
++    /* Return number of entries in this mapline in total */
-+
++    int i = 0;
-+    /* Memory Error Section Type */
++
-+    const uint8_t uefi_cper_mem_sec[] =
++    if (!mapline) {
-+          UUID_LE(0xA5BC1114, 0x6F64, 0x4EDE, 0xB8, 0x63, 0x3E, 0x83, \
++        /* Not in the map? IRQ goes to exactly one combiner input */
-+                  0xED, 0x7C, 0x83, 0xB1);
++        return 1;
 +
 +    /* invalid fru id: ACPI 4.0: 17.3.2.6.1 Generic Error Data,
 +     * Table 17-13 Generic Error Data Entry
 +     */
 +    QemuUUID fru_id = {};
 +    uint32_t data_length;
 +
 +    block = g_array_new(false, true /* clear */, 1);
 +
 +    /* This is the length if adding a new generic error data entry*/
 +    data_length = ACPI_GHES_DATA_LENGTH + ACPI_GHES_MEM_CPER_LENGTH;
 +
 +    /*
 +     * Check whether it will run out of the preallocated memory if adding a new
 +     * generic error data entry
 +     */
 +    if ((data_length + ACPI_GHES_GESB_SIZE) > ACPI_GHES_MAX_RAW_DATA_LENGTH) {
 +        error_report("Not enough memory to record new CPER!!!");
 +        g_array_free(block, true);
 +        return -1;
 +    }
-+
++    while (*mapline != IRQNONE) {
-+    /* Build the new generic error status block header */
++        mapline++;
-+    acpi_ghes_generic_error_status(block, ACPI_GEBS_UNCORRECTABLE,
++        i++;
-+        0, 0, data_length, ACPI_CPER_SEV_RECOVERABLE);
++    }
-+
++    return i;
 +    /* Build this new generic error data entry header */
 +    acpi_ghes_generic_error_data(block, uefi_cper_mem_sec,
 +        ACPI_CPER_SEV_RECOVERABLE, 0, 0,
 +        ACPI_GHES_MEM_CPER_LENGTH, fru_id, 0);
 +
 +    /* Build the memory section CPER for above new generic error data entry */
 +    acpi_ghes_build_append_mem_cper(block, error_physical_addr);
 +
 +    /* Write the generic error data entry into guest memory */
 +    cpu_physical_memory_write(error_block_address, block->data, block->len);
 +
 +    g_array_free(block, true);
 +
 +    return 0;
 +}
 +
  /*
-  * Build table for the hardware error fw_cfg blob.
+  * Initialize board IRQs.
-  * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
+  * These IRQs contain splitted Int/External Combiner and External Gic IRQs.
-@@ -XXX,XX +XXX,XX @@ void acpi_ghes_add_fw_cfg(AcpiGhesState *ags, FWCfgState *s,
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
-     fw_cfg_add_file_callback(s, ACPI_GHES_DATA_ADDR_FW_CFG_FILE, NULL, NULL,
+     DeviceState *extgicdev = DEVICE(&s->ext_gic);
-         NULL, &(ags->ghes_addr_le), sizeof(ags->ghes_addr_le), false);
+     int splitcount = 0;
      DeviceState *splitter;
 +    const int *mapline;
 +    int numlines, splitin, in;
      for (n = 0; n < EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ; n++) {
          irq_id = 0;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
              irq_id = EXT_GIC_ID_MCT_G1;
          }
 +        if (s->irq_table[n]) {
 +            /*
 +             * This must be some non-first entry in a combinermap line,
 +             * and we've already filled it in.
 +             */
 +            continue;
 +        }
 +        mapline = combinermap_entry(n);
 +        /*
 +         * We need to connect the IRQ to multiple inputs on both combiners
 +         * and possibly also to the external GIC.
 +         */
 +        numlines = 2 * mapline_size(mapline);
 +        if (irq_id) {
 +            numlines++;
 +        }
          assert(splitcount < EXYNOS4210_NUM_SPLITTERS);
          splitter = DEVICE(&s->splitter[splitcount]);
 -        qdev_prop_set_uint16(splitter, "num-lines", irq_id ? 3 : 2);
 +        qdev_prop_set_uint16(splitter, "num-lines", numlines);
          qdev_realize(splitter, NULL, &error_abort);
          splitcount++;
 -        s->irq_table[n] = qdev_get_gpio_in(splitter, 0);
 -        qdev_connect_gpio_out(splitter, 0, is->int_combiner_irq[n]);
 -        qdev_connect_gpio_out(splitter, 1, is->ext_combiner_irq[n]);
 +
 +        in = n;
 +        splitin = 0;
 +        for (;;) {
 +            s->irq_table[in] = qdev_get_gpio_in(splitter, 0);
 +            qdev_connect_gpio_out(splitter, splitin, is->int_combiner_irq[in]);
 +            qdev_connect_gpio_out(splitter, splitin + 1, is->ext_combiner_irq[in]);
 +            splitin += 2;
 +            if (!mapline) {
 +                break;
 +            }
 +            mapline++;
 +            in = *mapline;
 +            if (in == IRQNONE) {
 +                break;
 +            }
 +        }
          if (irq_id) {
 -            qdev_connect_gpio_out(splitter, 2,
 +            qdev_connect_gpio_out(splitter, splitin,
                                    qdev_get_gpio_in(extgicdev, irq_id - 32));
          }
      }
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
          irq_id = combiner_grp_to_gic_id[grp -
                       EXYNOS4210_MAX_EXT_COMBINER_OUT_IRQ][bit];
 +        if (s->irq_table[n]) {
 +            /*
 +             * This must be some non-first entry in a combinermap line,
 +             * and we've already filled it in.
 +             */
 +            continue;
 +        }
 +
          if (irq_id) {
              assert(splitcount < EXYNOS4210_NUM_SPLITTERS);
              splitter = DEVICE(&s->splitter[splitcount]);
@@ -XXX,XX +XXX,XX @@ static void exynos4210_combiner_get_gpioin(Exynos4210Irq *irqs,
                                             DeviceState *dev, int ext)
  {
      int n;
 -    int bit;
      int max;
      qemu_irq *irq;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_combiner_get_gpioin(Exynos4210Irq *irqs,
          EXYNOS4210_MAX_INT_COMBINER_IN_IRQ;
      irq = ext ? irqs->ext_combiner_irq : irqs->int_combiner_irq;
 -    /*
 -     * Some IRQs of Int/External Combiner are going to two Combiners groups,
 -     * so let split them.
 -     */
      for (n = 0; n < max; n++) {
 -
 -        bit = EXYNOS4210_COMBINER_GET_BIT_NUM(n);
 -
 -        switch (n) {
 -        /* MDNIE_LCD1 INTG1 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 0) ...
 -             EXYNOS4210_COMBINER_GET_IRQ_NUM(1, 3):
 -            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(0, bit + 4)]);
 -            continue;
 -
 -        /* TMU INTG3 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(3, 4):
 -            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(2, bit)]);
 -            continue;
 -
 -        /* LCD1 INTG12 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 0) ...
 -             EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 3):
 -            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(11, bit + 4)]);
 -            continue;
 -
 -        /* Multi-Core Timer INTG12 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 4) ...
 -             EXYNOS4210_COMBINER_GET_IRQ_NUM(12, 8):
 -               irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                       irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
 -            continue;
 -
 -        /* Multi-Core Timer INTG35 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(35, 4) ...
 -             EXYNOS4210_COMBINER_GET_IRQ_NUM(35, 8):
 -            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
 -            continue;
 -
 -        /* Multi-Core Timer INTG51 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(51, 4) ...
 -             EXYNOS4210_COMBINER_GET_IRQ_NUM(51, 8):
 -            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
 -            continue;
 -
 -        /* Multi-Core Timer INTG53 */
 -        case EXYNOS4210_COMBINER_GET_IRQ_NUM(53, 4) ...
 -             EXYNOS4210_COMBINER_GET_IRQ_NUM(53, 8):
 -            irq[n] = qemu_irq_split(qdev_get_gpio_in(dev, n),
 -                    irq[EXYNOS4210_COMBINER_GET_IRQ_NUM(1, bit + 4)]);
 -            continue;
 -        }
 -
          irq[n] = qdev_get_gpio_in(dev, n);
      }
  }
-+
-+int acpi_ghes_record_errors(uint8_t source_id, uint64_t physical_address)
-+{
-+    uint64_t error_block_addr, read_ack_register_addr, read_ack_register = 0;
-+    uint64_t start_addr;
-+    bool ret = -1;
-+    AcpiGedState *acpi_ged_state;
-+    AcpiGhesState *ags;
-+
-+    assert(source_id < ACPI_HEST_SRC_ID_RESERVED);
-+
-+    acpi_ged_state = ACPI_GED(object_resolve_path_type("", TYPE_ACPI_GED,
-+                                                       NULL));
-+    g_assert(acpi_ged_state);
-+    ags = &acpi_ged_state->ghes_state;
-+
-+    start_addr = le64_to_cpu(ags->ghes_addr_le);
-+
-+    if (physical_address) {
-+
-+        if (source_id < ACPI_HEST_SRC_ID_RESERVED) {
-+            start_addr += source_id * sizeof(uint64_t);
-+        }
-+
-+        cpu_physical_memory_read(start_addr, &error_block_addr,
-+                                 sizeof(error_block_addr));
-+
-+        error_block_addr = le64_to_cpu(error_block_addr);
-+
-+        read_ack_register_addr = start_addr +
-+            ACPI_GHES_ERROR_SOURCE_COUNT * sizeof(uint64_t);
-+
-+        cpu_physical_memory_read(read_ack_register_addr,
-+                                 &read_ack_register, sizeof(read_ack_register));
-+
-+        /* zero means OSPM does not acknowledge the error */
-+        if (!read_ack_register) {
-+            error_report("OSPM does not acknowledge previous error,"
-+                " so can not record CPER for current error anymore");
-+        } else if (error_block_addr) {
-+            read_ack_register = cpu_to_le64(0);
-+            /*
-+             * Clear the Read Ack Register, OSPM will write it to 1 when
-+             * it acknowledges this error.
-+             */
-+            cpu_physical_memory_write(read_ack_register_addr,
-+                &read_ack_register, sizeof(uint64_t));
-+
-+            ret = acpi_ghes_record_mem_error(error_block_addr,
-+                                             physical_address);
-+        } else
-+            error_report("can not find Generic Error Status Block");
-+    }
-+
-+    return ret;
-+}
 --
-.20.1
+.25.1

-[PULL 40/45] target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
+[PULL 24/31] hw/arm/exynos4210: Put combiners into state struct
-Convert the Neon float VPMIN, VPMAX and VPADD 3-reg-same insns to
+Switch the creation of the combiner devices to the new-style
-decodetree. These are the only remaining 'pairwise' operations,
+"embedded in state struct" approach, so we can easily refer
-so we can delete the pairwise-specific bits of the old decoder's
+to the object elsewhere during realize.
 for-each-element loop now.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-13-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-18-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  5 +++
+ include/hw/arm/exynos4210.h           |  3 ++
- target/arm/translate-neon.inc.c | 63 +++++++++++++++++++++++++++++++++
+ include/hw/intc/exynos4210_combiner.h | 57 +++++++++++++++++++++++++++
- target/arm/translate.c          | 63 +++++----------------------------
+ hw/arm/exynos4210.c                   | 20 +++++-----
-files changed, 76 insertions(+), 55 deletions(-)
+ hw/intc/exynos4210_combiner.c         | 31 +--------------
 files changed, 72 insertions(+), 39 deletions(-)
  create mode 100644 include/hw/intc/exynos4210_combiner.h
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/arm/exynos4210.h
 @@ -XXX,XX +XXX,XX @@
- # For FP insns the high bit of 'size' is used as part of opcode decode
+ #include "hw/sysbus.h"
- @3same_fp        .... ... . . . . size:1 .... .... .... . q:1 . . .... \
+ #include "hw/cpu/a9mpcore.h"
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
+ #include "hw/intc/exynos4210_gic.h"
-+@3same_fp_q0     .... ... . . . . size:1 .... .... .... . 0 . . .... \
++#include "hw/intc/exynos4210_combiner.h"
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
+ #include "hw/core/split-irq.h"
+ #include "target/arm/cpu-qom.h"
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+ #include "qom/object.h"
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@ struct Exynos4210State {
-@@ -XXX,XX +XXX,XX @@ VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
+     qemu_or_irq cpu_irq_orgate[EXYNOS4210_NCPUS];
+     A9MPPrivState a9mpcore;
- VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
+     Exynos4210GicState ext_gic;
- VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
++    Exynos4210CombinerState int_combiner;
-+VPADD_fp_3s      1111 001 1 0 . 0 . .... .... 1101 ... 0 .... @3same_fp_q0
++    Exynos4210CombinerState ext_combiner;
- VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+     SplitIRQ splitter[EXYNOS4210_NUM_SPLITTERS];
-+VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
+ };
-+VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+diff --git a/include/hw/intc/exynos4210_combiner.h b/include/hw/intc/exynos4210_combiner.h
-index XXXXXXX..XXXXXXX 100644
+new file mode 100644
---- a/target/arm/translate-neon.inc.c
+index XXXXXXX..XXXXXXX
-+++ b/target/arm/translate-neon.inc.c
+--- /dev/null
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
++++ b/include/hw/intc/exynos4210_combiner.h
- DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
+@@ -XXX,XX +XXX,XX @@
- DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
++/*
- DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
++ * Samsung exynos4210 Interrupt Combiner
 + *
 + * Copyright (c) 2000 - 2011 Samsung Electronics Co., Ltd.
 + * All rights reserved.
 + *
 + * Evgeny Voevodin <e.voevodin@samsung.com>
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or (at your
 + * option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
 + * See the GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
-+static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
++#ifndef HW_INTC_EXYNOS4210_COMBINER
-+{
++#define HW_INTC_EXYNOS4210_COMBINER
 +    /* FP operations handled pairwise 32 bits at a time */
 +    TCGv_i32 tmp, tmp2, tmp3;
 +    TCGv_ptr fpstatus;
 +
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
++#include "hw/sysbus.h"
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    assert(a->q == 0); /* enforced by decode patterns */
 +
 +    /*
 +     * Note that we have to be careful not to clobber the source operands
 +     * in the "vm == vd" case by storing the result of the first pass too
 +     * early. Since Q is 0 there are always just two passes, so instead
 +     * of a complicated loop over each pass we just unroll.
 +     */
 +    fpstatus = get_fpstatus_ptr(1);
 +    tmp = neon_load_reg(a->vn, 0);
 +    tmp2 = neon_load_reg(a->vn, 1);
 +    fn(tmp, tmp, tmp2, fpstatus);
 +    tcg_temp_free_i32(tmp2);
 +
 +    tmp3 = neon_load_reg(a->vm, 0);
 +    tmp2 = neon_load_reg(a->vm, 1);
 +    fn(tmp3, tmp3, tmp2, fpstatus);
 +    tcg_temp_free_i32(tmp2);
 +    tcg_temp_free_ptr(fpstatus);
 +
 +    neon_store_reg(a->vd, 0, tmp);
 +    neon_store_reg(a->vd, 1, tmp3);
 +    return true;
 +}
 +
 +/*
-+ * For all the functions using this macro, size == 1 means fp16,
++ * State for each output signal of internal combiner
 + * which is an architecture extension we don't implement yet.
 + */
-+#define DO_3S_FP_PAIR(INSN,FUNC)                                    \
++typedef struct CombinerGroupState {
-+    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
++    uint8_t src_mask;            /* 1 - source enabled, 0 - disabled */
-+    {                                                               \
++    uint8_t src_pending;        /* Pending source interrupts before masking */
-+        if (a->size != 0) {                                         \
++} CombinerGroupState;
 +            /* TODO fp16 support */                                 \
 +            return false;                                           \
 +        }                                                           \
 +        return do_3same_fp_pair(s, a, FUNC);                        \
 +    }
 +
-+DO_3S_FP_PAIR(VPADD, gen_helper_vfp_adds)
++#define TYPE_EXYNOS4210_COMBINER "exynos4210.combiner"
-+DO_3S_FP_PAIR(VPMAX, gen_helper_vfp_maxs)
++OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210CombinerState, EXYNOS4210_COMBINER)
-+DO_3S_FP_PAIR(VPMIN, gen_helper_vfp_mins)
++
-diff --git a/target/arm/translate.c b/target/arm/translate.c
++/* Number of groups and total number of interrupts for the internal combiner */
 +#define IIC_NGRP 64
 +#define IIC_NIRQ (IIC_NGRP * 8)
 +#define IIC_REGSET_SIZE 0x41
 +
 +struct Exynos4210CombinerState {
 +    SysBusDevice parent_obj;
 +
 +    MemoryRegion iomem;
 +
 +    struct CombinerGroupState group[IIC_NGRP];
 +    uint32_t reg_set[IIC_REGSET_SIZE];
 +    uint32_t icipsr[2];
 +    uint32_t external;          /* 1 means that this combiner is external */
 +
 +    qemu_irq output_irq[IIC_NGRP];
 +};
 +
 +#endif
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
-     int shift;
+     }
-     int pass;
-     int count;
+     /* Internal Interrupt Combiner */
--    int pairwise;
+-    dev = qdev_new("exynos4210.combiner");
-     int u;
+-    busdev = SYS_BUS_DEVICE(dev);
-     int vec_size;
+-    sysbus_realize_and_unref(busdev, &error_fatal);
-     uint32_t imm;
++    busdev = SYS_BUS_DEVICE(&s->int_combiner);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
++    sysbus_realize(busdev, &error_fatal);
-         case NEON_3R_VPMIN:
+     for (n = 0; n < EXYNOS4210_MAX_INT_COMBINER_OUT_IRQ; n++) {
-         case NEON_3R_VPADD_VQRDMLAH:
+         sysbus_connect_irq(busdev, n,
-         case NEON_3R_VQDMULH_VQRDMULH:
+                            qdev_get_gpio_in(DEVICE(&s->a9mpcore), n));
-+        case NEON_3R_FLOAT_ARITH:
+     }
-             /* Already handled by decodetree */
+-    exynos4210_combiner_get_gpioin(&s->irqs, dev, 0);
-             return 1;
++    exynos4210_combiner_get_gpioin(&s->irqs, DEVICE(&s->int_combiner), 0);
-         }
+     sysbus_mmio_map(busdev, 0, EXYNOS4210_INT_COMBINER_BASE_ADDR);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             /* 64-bit element instructions: handled by decodetree */
+     /* External Interrupt Combiner */
-             return 1;
+-    dev = qdev_new("exynos4210.combiner");
-         }
+-    qdev_prop_set_uint32(dev, "external", 1);
--        pairwise = 0;
+-    busdev = SYS_BUS_DEVICE(dev);
-         switch (op) {
+-    sysbus_realize_and_unref(busdev, &error_fatal);
--        case NEON_3R_FLOAT_ARITH:
++    qdev_prop_set_uint32(DEVICE(&s->ext_combiner), "external", 1);
--            pairwise = (u && size < 2); /* if VPADD (float) */
++    busdev = SYS_BUS_DEVICE(&s->ext_combiner);
--            if (!pairwise) {
++    sysbus_realize(busdev, &error_fatal);
--                return 1; /* handled by decodetree */
+     for (n = 0; n < EXYNOS4210_MAX_INT_COMBINER_OUT_IRQ; n++) {
--            }
+         sysbus_connect_irq(busdev, n, qdev_get_gpio_in(DEVICE(&s->ext_gic), n));
--            break;
+     }
-         case NEON_3R_FLOAT_MINMAX:
+-    exynos4210_combiner_get_gpioin(&s->irqs, dev, 1);
--            pairwise = u; /* if VPMIN/VPMAX (float) */
++    exynos4210_combiner_get_gpioin(&s->irqs, DEVICE(&s->ext_combiner), 1);
-+            if (u) {
+     sysbus_mmio_map(busdev, 0, EXYNOS4210_EXT_COMBINER_BASE_ADDR);
-+                return 1; /* VPMIN/VPMAX handled by decodetree */
-+            }
+     /* Initialize board IRQs. */
-             break;
+@@ -XXX,XX +XXX,XX @@ static void exynos4210_init(Object *obj)
-         case NEON_3R_FLOAT_CMP:
-             if (!u && size) {
+     object_initialize_child(obj, "a9mpcore", &s->a9mpcore, TYPE_A9MPCORE_PRIV);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+     object_initialize_child(obj, "ext-gic", &s->ext_gic, TYPE_EXYNOS4210_GIC);
-             break;
++    object_initialize_child(obj, "int-combiner", &s->int_combiner,
-         }
++                            TYPE_EXYNOS4210_COMBINER);
++    object_initialize_child(obj, "ext-combiner", &s->ext_combiner,
--        if (pairwise && q) {
++                            TYPE_EXYNOS4210_COMBINER);
--            /* All the pairwise insns UNDEF if Q is set */
+ }
--            return 1;
--        }
+ static void exynos4210_class_init(ObjectClass *klass, void *data)
 diff --git a/hw/intc/exynos4210_combiner.c b/hw/intc/exynos4210_combiner.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/exynos4210_combiner.c
 +++ b/hw/intc/exynos4210_combiner.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/sysbus.h"
  #include "migration/vmstate.h"
  #include "qemu/module.h"
 -
-         for (pass = 0; pass < (q ? 4 : 2); pass++) {
++#include "hw/intc/exynos4210_combiner.h"
+ #include "hw/arm/exynos4210.h"
--        if (pairwise) {
+ #include "hw/hw.h"
--            /* Pairwise.  */
+ #include "hw/irq.h"
--            if (pass < 1) {
+@@ -XXX,XX +XXX,XX @@
--                tmp = neon_load_reg(rn, 0);
+ #define DPRINTF(fmt, ...) do {} while (0)
--                tmp2 = neon_load_reg(rn, 1);
+ #endif
--            } else {
--                tmp = neon_load_reg(rm, 0);
+-#define    IIC_NGRP        64            /* Internal Interrupt Combiner
--                tmp2 = neon_load_reg(rm, 1);
+-                                            Groups number */
--            }
+-#define    IIC_NIRQ        (IIC_NGRP * 8)/* Internal Interrupt Combiner
--        } else {
+-                                            Interrupts number */
--            /* Elementwise.  */
+ #define IIC_REGION_SIZE    0x108         /* Size of memory mapped region */
--            tmp = neon_load_reg(rn, pass);
+-#define IIC_REGSET_SIZE    0x41
--            tmp2 = neon_load_reg(rm, pass);
+-
--        }
+-/*
-+        /* Elementwise.  */
+- * State for each output signal of internal combiner
-+        tmp = neon_load_reg(rn, pass);
+- */
-+        tmp2 = neon_load_reg(rm, pass);
+-typedef struct CombinerGroupState {
-         switch (op) {
+-    uint8_t src_mask;            /* 1 - source enabled, 0 - disabled */
--        case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
+-    uint8_t src_pending;        /* Pending source interrupts before masking */
--        {
+-} CombinerGroupState;
--            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
+-
--            switch ((u << 2) | size) {
+-#define TYPE_EXYNOS4210_COMBINER "exynos4210.combiner"
--            case 4: /* VPADD */
+-OBJECT_DECLARE_SIMPLE_TYPE(Exynos4210CombinerState, EXYNOS4210_COMBINER)
--                gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
+-
--                break;
+-struct Exynos4210CombinerState {
--            default:
+-    SysBusDevice parent_obj;
--                abort();
+-
--            }
+-    MemoryRegion iomem;
--            tcg_temp_free_ptr(fpstatus);
+-
--            break;
+-    struct CombinerGroupState group[IIC_NGRP];
--        }
+-    uint32_t reg_set[IIC_REGSET_SIZE];
-         case NEON_3R_FLOAT_MULTIPLY:
+-    uint32_t icipsr[2];
-         {
+-    uint32_t external;          /* 1 means that this combiner is external */
-             TCGv_ptr fpstatus = get_fpstatus_ptr(1);
+-
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+-    qemu_irq output_irq[IIC_NGRP];
-         }
+-};
-         tcg_temp_free_i32(tmp2);
+ static const VMStateDescription vmstate_exynos4210_combiner_group_state = {
--        /* Save the result.  For elementwise operations we can put it
+     .name = "exynos4210.combiner.groupstate",
 -           straight into the destination register.  For pairwise operations
 -           we have to be careful to avoid clobbering the source operands.  */
 -        if (pairwise && rd == rm) {
 -            neon_store_scratch(pass, tmp);
 -        } else {
 -            neon_store_reg(rd, pass, tmp);
 -        }
 +        neon_store_reg(rd, pass, tmp);
          } /* for pass */
 -        if (pairwise && rd == rm) {
 -            for (pass = 0; pass < (q ? 4 : 2); pass++) {
 -                tmp = neon_load_scratch(pass);
 -                neon_store_reg(rd, pass, tmp);
 -            }
 -        }
          /* End of 3 register same size operations.  */
      } else if (insn & (1 << 4)) {
          if ((insn & 0x00380080) != 0) {
 --
-.20.1
+.25.1

-[PULL 43/45] target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
+[PULL 25/31] hw/arm/exynos4210: Drop Exynos4210Irq struct
-The usual location for the env argument in the argument list of a TCG helper
+The only time we use the int_combiner_irq[] and ext_combiner_irq[]
-is immediately after the return-value argument. recps_f32 and rsqrts_f32
+arrays in the Exynos4210Irq struct is during realize of the SoC -- we
-differ in that they put it at the end.
+initialize them with the input IRQs of the combiner devices, and then
 connect those to outputs of other devices in
 exynos4210_init_board_irqs().  Now that the combiner objects are
 easily accessible as s->int_combiner and s->ext_combiner we can make
 the connections directly from one device to the other without going
 via these arrays.
-Move the env argument to its usual place; this will allow us to
+Since these are the only two remaining elements of Exynos4210Irq,
-more easily use these helper functions with the gvec APIs.
+we can remove that struct entirely.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-16-peter.maydell@linaro.org
+Message-id: 20220404154658.565020-19-peter.maydell@linaro.org
 ---
- target/arm/helper.h     | 4 ++--
+ include/hw/arm/exynos4210.h |  6 ------
- target/arm/translate.c  | 4 ++--
+ hw/arm/exynos4210.c         | 34 ++++++++--------------------------
- target/arm/vfp_helper.c | 4 ++--
+files changed, 8 insertions(+), 32 deletions(-)
 files changed, 6 insertions(+), 6 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/arm/exynos4210.h b/include/hw/arm/exynos4210.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/arm/exynos4210.h
-+++ b/target/arm/helper.h
++++ b/include/hw/arm/exynos4210.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, ptr, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
+  */
- DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+ #define EXYNOS4210_NUM_SPLITTERS (EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ + 38)
--DEF_HELPER_3(recps_f32, f32, f32, f32, env)
+-typedef struct Exynos4210Irq {
--DEF_HELPER_3(rsqrts_f32, f32, f32, f32, env)
+-    qemu_irq int_combiner_irq[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
-+DEF_HELPER_3(recps_f32, f32, env, f32, f32)
+-    qemu_irq ext_combiner_irq[EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ];
-+DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
+-} Exynos4210Irq;
- DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+-
- DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+ struct Exynos4210State {
- DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+     /*< private >*/
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+     SysBusDevice parent_obj;
      /*< public >*/
      ARMCPU *cpu[EXYNOS4210_NCPUS];
 -    Exynos4210Irq irqs;
      qemu_irq irq_table[EXYNOS4210_MAX_INT_COMBINER_IN_IRQ];
      MemoryRegion chipid_mem;
 diff --git a/hw/arm/exynos4210.c b/hw/arm/exynos4210.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/hw/arm/exynos4210.c
-+++ b/target/arm/translate.c
++++ b/hw/arm/exynos4210.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static int mapline_size(const int *mapline)
-                 tcg_temp_free_ptr(fpstatus);
+ static void exynos4210_init_board_irqs(Exynos4210State *s)
              } else {
                  if (size == 0) {
 -                    gen_helper_recps_f32(tmp, tmp, tmp2, cpu_env);
 +                    gen_helper_recps_f32(tmp, cpu_env, tmp, tmp2);
                  } else {
 -                    gen_helper_rsqrts_f32(tmp, tmp, tmp2, cpu_env);
 +                    gen_helper_rsqrts_f32(tmp, cpu_env, tmp, tmp2);
                }
              }
              break;
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
  #define float32_three make_float32(0x40400000)
  #define float32_one_point_five make_float32(0x3fc00000)
 -float32 HELPER(recps_f32)(float32 a, float32 b, CPUARMState *env)
 +float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
  {
-     float_status *s = &env->vfp.standard_fp_status;
+     uint32_t grp, bit, irq_id, n;
-     if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
+-    Exynos4210Irq *is = &s->irqs;
-@@ -XXX,XX +XXX,XX @@ float32 HELPER(recps_f32)(float32 a, float32 b, CPUARMState *env)
+     DeviceState *extgicdev = DEVICE(&s->ext_gic);
-     return float32_sub(float32_two, float32_mul(a, b, s), s);
++    DeviceState *intcdev = DEVICE(&s->int_combiner);
 +    DeviceState *extcdev = DEVICE(&s->ext_combiner);
      int splitcount = 0;
      DeviceState *splitter;
      const int *mapline;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
          splitin = 0;
          for (;;) {
              s->irq_table[in] = qdev_get_gpio_in(splitter, 0);
 -            qdev_connect_gpio_out(splitter, splitin, is->int_combiner_irq[in]);
 -            qdev_connect_gpio_out(splitter, splitin + 1, is->ext_combiner_irq[in]);
 +            qdev_connect_gpio_out(splitter, splitin,
 +                                  qdev_get_gpio_in(intcdev, in));
 +            qdev_connect_gpio_out(splitter, splitin + 1,
 +                                  qdev_get_gpio_in(extcdev, in));
              splitin += 2;
              if (!mapline) {
                  break;
@@ -XXX,XX +XXX,XX @@ static void exynos4210_init_board_irqs(Exynos4210State *s)
              qdev_realize(splitter, NULL, &error_abort);
              splitcount++;
              s->irq_table[n] = qdev_get_gpio_in(splitter, 0);
 -            qdev_connect_gpio_out(splitter, 0, is->int_combiner_irq[n]);
 +            qdev_connect_gpio_out(splitter, 0, qdev_get_gpio_in(intcdev, n));
              qdev_connect_gpio_out(splitter, 1,
                                    qdev_get_gpio_in(extgicdev, irq_id - 32));
          } else {
 -            s->irq_table[n] = is->int_combiner_irq[n];
 +            s->irq_table[n] = qdev_get_gpio_in(intcdev, n);
          }
      }
      /*
@@ -XXX,XX +XXX,XX @@ uint32_t exynos4210_get_irq(uint32_t grp, uint32_t bit)
      return EXYNOS4210_COMBINER_GET_IRQ_NUM(grp, bit);
  }
--float32 HELPER(rsqrts_f32)(float32 a, float32 b, CPUARMState *env)
+-/*
-+float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
+- * Get Combiner input GPIO into irqs structure
- {
+- */
-     float_status *s = &env->vfp.standard_fp_status;
+-static void exynos4210_combiner_get_gpioin(Exynos4210Irq *irqs,
-     float32 product;
+-                                           DeviceState *dev, int ext)
 -{
 -    int n;
 -    int max;
 -    qemu_irq *irq;
 -
 -    max = ext ? EXYNOS4210_MAX_EXT_COMBINER_IN_IRQ :
 -        EXYNOS4210_MAX_INT_COMBINER_IN_IRQ;
 -    irq = ext ? irqs->ext_combiner_irq : irqs->int_combiner_irq;
 -
 -    for (n = 0; n < max; n++) {
 -        irq[n] = qdev_get_gpio_in(dev, n);
 -    }
 -}
 -
  static uint8_t chipid_and_omr[] = { 0x11, 0x02, 0x21, 0x43,
 x09, 0x00, 0x00, 0x00 };
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
          sysbus_connect_irq(busdev, n,
                             qdev_get_gpio_in(DEVICE(&s->a9mpcore), n));
      }
 -    exynos4210_combiner_get_gpioin(&s->irqs, DEVICE(&s->int_combiner), 0);
      sysbus_mmio_map(busdev, 0, EXYNOS4210_INT_COMBINER_BASE_ADDR);
      /* External Interrupt Combiner */
@@ -XXX,XX +XXX,XX @@ static void exynos4210_realize(DeviceState *socdev, Error **errp)
      for (n = 0; n < EXYNOS4210_MAX_INT_COMBINER_OUT_IRQ; n++) {
          sysbus_connect_irq(busdev, n, qdev_get_gpio_in(DEVICE(&s->ext_gic), n));
      }
 -    exynos4210_combiner_get_gpioin(&s->irqs, DEVICE(&s->ext_combiner), 1);
      sysbus_mmio_map(busdev, 0, EXYNOS4210_EXT_COMBINER_BASE_ADDR);
      /* Initialize board IRQs. */
 --
-.20.1
+.25.1

-[PULL 24/45] ACPI: Record the Generic Error Status Block address
+[PULL 26/31] hw/arm/realview: replace 'qemu_split_irq' with 'TYPE_SPLIT_IRQ'
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Zongyuan Li <zongyuan.li@smartx.com>
-Record the GHEB address via fw_cfg file, when recording
+Signed-off-by: Zongyuan Li <zongyuan.li@smartx.com>
-a error to CPER, it will use this address to find out
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Generic Error Data Entries and write the error.
+Message-id: 20220324181557.203805-2-zongyuan.li@smartx.com
 In order to avoid migration failure, make hardware
 error table address to a part of GED device instead
 of global variable, then this address will be migrated
 to target QEMU.
 Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-7-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/generic_event_device.h |  2 ++
+ hw/arm/realview.c | 33 ++++++++++++++++++++++++---------
- include/hw/acpi/ghes.h                 |  6 ++++++
+file changed, 24 insertions(+), 9 deletions(-)
  hw/acpi/generic_event_device.c         | 19 +++++++++++++++++++
  hw/acpi/ghes.c                         | 14 ++++++++++++++
  hw/arm/virt-acpi-build.c               |  8 ++++++++
 files changed, 49 insertions(+)
-diff --git a/include/hw/acpi/generic_event_device.h b/include/hw/acpi/generic_event_device.h
+diff --git a/hw/arm/realview.c b/hw/arm/realview.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/generic_event_device.h
+--- a/hw/arm/realview.c
-+++ b/include/hw/acpi/generic_event_device.h
++++ b/hw/arm/realview.c
 @@ -XXX,XX +XXX,XX @@
  #include "hw/sysbus.h"
- #include "hw/acpi/memory_hotplug.h"
+ #include "hw/arm/boot.h"
-+#include "hw/acpi/ghes.h"
+ #include "hw/arm/primecell.h"
++#include "hw/core/split-irq.h"
- #define ACPI_POWER_BUTTON_DEVICE "PWRB"
+ #include "hw/net/lan9118.h"
+ #include "hw/net/smc91c111.h"
-@@ -XXX,XX +XXX,XX @@ typedef struct AcpiGedState {
+ #include "hw/pci/pci.h"
-     GEDState ged_state;
++#include "hw/qdev-core.h"
-     uint32_t ged_event_bitmap;
+ #include "net/net.h"
-     qemu_irq irq;
+ #include "sysemu/sysemu.h"
-+    AcpiGhesState ghes_state;
+ #include "hw/boards.h"
- } AcpiGedState;
+@@ -XXX,XX +XXX,XX @@ static const int realview_board_id[] = {
+x76d
  void build_ged_aml(Aml *table, const char* name, HotplugHandler *hotplug_dev,
 diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/hw/acpi/ghes.h
 +++ b/include/hw/acpi/ghes.h
@@ -XXX,XX +XXX,XX @@ enum {
      ACPI_HEST_SRC_ID_RESERVED,
  };
-+typedef struct AcpiGhesState {
++static void split_irq_from_named(DeviceState *src, const char* outname,
-+    uint64_t ghes_addr_le;
++                                 qemu_irq out1, qemu_irq out2) {
-+} AcpiGhesState;
++    DeviceState *splitter = qdev_new(TYPE_SPLIT_IRQ);
 +
- void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
++    qdev_prop_set_uint32(splitter, "num-lines", 2);
- void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
++
-+void acpi_ghes_add_fw_cfg(AcpiGhesState *vms, FWCfgState *s,
++    qdev_realize_and_unref(splitter, NULL, &error_fatal);
-+                          GArray *hardware_errors);
++
- #endif
++    qdev_connect_gpio_out(splitter, 0, out1);
-diff --git a/hw/acpi/generic_event_device.c b/hw/acpi/generic_event_device.c
++    qdev_connect_gpio_out(splitter, 1, out2);
-index XXXXXXX..XXXXXXX 100644
++    qdev_connect_gpio_out_named(src, outname, 0,
---- a/hw/acpi/generic_event_device.c
++                                qdev_get_gpio_in(splitter, 0));
 +++ b/hw/acpi/generic_event_device.c
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_ged_state = {
      }
  };
 +static bool ghes_needed(void *opaque)
 +{
 +    AcpiGedState *s = opaque;
 +    return s->ghes_state.ghes_addr_le;
 +}
 +
-+static const VMStateDescription vmstate_ghes_state = {
+ static void realview_init(MachineState *machine,
-+    .name = "acpi-ged/ghes",
+                           enum realview_board_type board_type)
-+    .version_id = 1,
+ {
-+    .minimum_version_id = 1,
+@@ -XXX,XX +XXX,XX @@ static void realview_init(MachineState *machine,
-+    .needed = ghes_needed,
+     DeviceState *dev, *sysctl, *gpio2, *pl041;
-+    .fields      = (VMStateField[]) {
+     SysBusDevice *busdev;
-+        VMSTATE_STRUCT(ghes_state, AcpiGedState, 1,
+     qemu_irq pic[64];
-+                       vmstate_ghes_state, AcpiGhesState),
+-    qemu_irq mmc_irq[2];
-+        VMSTATE_END_OF_LIST()
+     PCIBus *pci_bus = NULL;
-+    }
+     NICInfo *nd;
-+};
+     DriveInfo *dinfo;
@@ -XXX,XX +XXX,XX @@ static void realview_init(MachineState *machine,
       * and the PL061 has them the other way about. Also the card
       * detect line is inverted.
       */
 -    mmc_irq[0] = qemu_irq_split(
 -        qdev_get_gpio_in(sysctl, ARM_SYSCTL_GPIO_MMC_WPROT),
 -        qdev_get_gpio_in(gpio2, 1));
 -    mmc_irq[1] = qemu_irq_split(
 -        qdev_get_gpio_in(sysctl, ARM_SYSCTL_GPIO_MMC_CARDIN),
 -        qemu_irq_invert(qdev_get_gpio_in(gpio2, 0)));
 -    qdev_connect_gpio_out_named(dev, "card-read-only", 0, mmc_irq[0]);
 -    qdev_connect_gpio_out_named(dev, "card-inserted", 0, mmc_irq[1]);
 +    split_irq_from_named(dev, "card-read-only",
 +                   qdev_get_gpio_in(sysctl, ARM_SYSCTL_GPIO_MMC_WPROT),
 +                   qdev_get_gpio_in(gpio2, 1));
 +
- static const VMStateDescription vmstate_acpi_ged = {
++    split_irq_from_named(dev, "card-inserted",
-     .name = "acpi-ged",
++                   qdev_get_gpio_in(sysctl, ARM_SYSCTL_GPIO_MMC_CARDIN),
-     .version_id = 1,
++                   qemu_irq_invert(qdev_get_gpio_in(gpio2, 0)));
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_acpi_ged = {
      },
      .subsections = (const VMStateDescription * []) {
          &vmstate_memhp_state,
 +        &vmstate_ghes_state,
          NULL
      }
  };
 diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/ghes.c
 +++ b/hw/acpi/ghes.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/acpi/ghes.h"
  #include "hw/acpi/aml-build.h"
  #include "qemu/error-report.h"
 +#include "hw/acpi/generic_event_device.h"
 +#include "hw/nvram/fw_cfg.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@ void acpi_build_hest(GArray *table_data, BIOSLinker *linker)
      build_header(linker, table_data, (void *)(table_data->data + hest_start),
          "HEST", table_data->len - hest_start, 1, NULL, NULL);
  }
 +
-+void acpi_ghes_add_fw_cfg(AcpiGhesState *ags, FWCfgState *s,
+     dinfo = drive_get(IF_SD, 0, 0);
-+                          GArray *hardware_error)
+     if (dinfo) {
-+{
+         DeviceState *card;
 +    /* Create a read-only fw_cfg file for GHES */
 +    fw_cfg_add_file(s, ACPI_GHES_ERRORS_FW_CFG_FILE, hardware_error->data,
 +                    hardware_error->len);
 +
 +    /* Create a read-write fw_cfg file for Address */
 +    fw_cfg_add_file_callback(s, ACPI_GHES_DATA_ADDR_FW_CFG_FILE, NULL, NULL,
 +        NULL, &(ags->ghes_addr_le), sizeof(ags->ghes_addr_le), false);
 +}
 diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt-acpi-build.c
 +++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ void virt_acpi_setup(VirtMachineState *vms)
  {
      AcpiBuildTables tables;
      AcpiBuildState *build_state;
 +    AcpiGedState *acpi_ged_state;
      if (!vms->fw_cfg) {
          trace_virt_acpi_setup();
@@ -XXX,XX +XXX,XX @@ void virt_acpi_setup(VirtMachineState *vms)
      fw_cfg_add_file(vms->fw_cfg, ACPI_BUILD_TPMLOG_FILE, tables.tcpalog->data,
                      acpi_data_len(tables.tcpalog));
 +    if (vms->ras) {
 +        assert(vms->acpi_dev);
 +        acpi_ged_state = ACPI_GED(vms->acpi_dev);
 +        acpi_ghes_add_fw_cfg(&acpi_ged_state->ghes_state,
 +                             vms->fw_cfg, tables.hardware_errors);
 +    }
 +
      build_state->rsdp_mr = acpi_add_rom_blob(virt_acpi_build_update,
                                               build_state, tables.rsdp,
                                               ACPI_BUILD_RSDP_FILE, 0);
 --
-.20.1
+.25.1

-[PULL 17/45] target/arm: Vectorize SABA/UABA
+[PULL 27/31] hw/arm/stellaris: replace 'qemu_split_irq' with 'TYPE_SPLIT_IRQ'
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Zongyuan Li <zongyuan.li@smartx.com>
-Include 64-bit element size in preparation for SVE2.
+Signed-off-by: Zongyuan Li <zongyuan.li@smartx.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20220324181557.203805-3-zongyuan.li@smartx.com
 Message-id: 20200513163245.17915-17-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  17 +++--
+ hw/arm/stellaris.c | 15 +++++++++++++--
- target/arm/translate.h     |   5 ++
+file changed, 13 insertions(+), 2 deletions(-)
  target/arm/neon_helper.c   |  10 ---
  target/arm/translate-a64.c |  17 ++---
  target/arm/translate.c     | 134 +++++++++++++++++++++++++++++++++++--
  target/arm/vec_helper.c    |  24 +++++++
 files changed, 174 insertions(+), 33 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/stellaris.c b/hw/arm/stellaris.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/stellaris.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/stellaris.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_pmax_s8, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_2(neon_pmax_u16, i32, i32, i32)
- DEF_HELPER_2(neon_pmax_s16, i32, i32, i32)
+ #include "qemu/osdep.h"
+ #include "qapi/error.h"
--DEF_HELPER_2(neon_abd_u8, i32, i32, i32)
++#include "hw/core/split-irq.h"
--DEF_HELPER_2(neon_abd_s8, i32, i32, i32)
+ #include "hw/sysbus.h"
--DEF_HELPER_2(neon_abd_u16, i32, i32, i32)
+ #include "hw/sd/sd.h"
--DEF_HELPER_2(neon_abd_s16, i32, i32, i32)
+ #include "hw/ssi/ssi.h"
--DEF_HELPER_2(neon_abd_u32, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@ static void stellaris_init(MachineState *ms, stellaris_board_info *board)
--DEF_HELPER_2(neon_abd_s32, i32, i32, i32)
+             DeviceState *ssddev;
--
+             DriveInfo *dinfo;
- DEF_HELPER_2(neon_shl_u16, i32, i32, i32)
+             DeviceState *carddev;
- DEF_HELPER_2(neon_shl_s16, i32, i32, i32)
++            DeviceState *gpio_d_splitter;
- DEF_HELPER_2(neon_rshl_u8, i32, i32, i32)
+             BlockBackend *blk;
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_uabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_uabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             /*
- DEF_HELPER_FLAGS_4(gvec_uabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void stellaris_init(MachineState *ms, stellaris_board_info *board)
+                                    &error_fatal);
-+DEF_HELPER_FLAGS_4(gvec_saba_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_saba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             ssddev = ssi_create_peripheral(bus, "ssd0323");
-+DEF_HELPER_FLAGS_4(gvec_saba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-            gpio_out[GPIO_D][0] = qemu_irq_split(
-+DEF_HELPER_FLAGS_4(gvec_saba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-                    qdev_get_gpio_in_named(sddev, SSI_GPIO_CS, 0),
 +
-+DEF_HELPER_FLAGS_4(gvec_uaba_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            gpio_d_splitter = qdev_new(TYPE_SPLIT_IRQ);
-+DEF_HELPER_FLAGS_4(gvec_uaba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            qdev_prop_set_uint32(gpio_d_splitter, "num-lines", 2);
-+DEF_HELPER_FLAGS_4(gvec_uaba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            qdev_realize_and_unref(gpio_d_splitter, NULL, &error_fatal);
-+DEF_HELPER_FLAGS_4(gvec_uaba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            qdev_connect_gpio_out(
 +                    gpio_d_splitter, 0,
 +                    qdev_get_gpio_in_named(sddev, SSI_GPIO_CS, 0));
 +            qdev_connect_gpio_out(
 +                    gpio_d_splitter, 1,
                      qdev_get_gpio_in_named(ssddev, SSI_GPIO_CS, 0));
 +            gpio_out[GPIO_D][0] = qdev_get_gpio_in(gpio_d_splitter, 0);
 +
- #ifdef TARGET_AARCH64
+             gpio_out[GPIO_C][7] = qdev_get_gpio_in(ssddev, 0);
- #include "helper-a64.h"
- #include "helper-sve.h"
+             /* Make sure the select pin is high.  */
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.h
 +++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
  void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
                     uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/neon_helper.c
 +++ b/target/arm/neon_helper.c
@@ -XXX,XX +XXX,XX @@ NEON_POP(pmax_s16, neon_s16, 2)
  NEON_POP(pmax_u16, neon_u16, 2)
  #undef NEON_FN
 -#define NEON_FN(dest, src1, src2) \
 -    dest = (src1 > src2) ? (src1 - src2) : (src2 - src1)
 -NEON_VOP(abd_s8, neon_s8, 4)
 -NEON_VOP(abd_u8, neon_u8, 4)
 -NEON_VOP(abd_s16, neon_s16, 2)
 -NEON_VOP(abd_u16, neon_u16, 2)
 -NEON_VOP(abd_s32, neon_s32, 1)
 -NEON_VOP(abd_u32, neon_u32, 1)
 -#undef NEON_FN
 -
  #define NEON_FN(dest, src1, src2) do { \
      int8_t tmp; \
      tmp = (int8_t)src2; \
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
              gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sabd, size);
          }
          return;
 +    case 0xf: /* SABA, UABA */
 +        if (u) {
 +            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uaba, size);
 +        } else {
 +            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_saba, size);
 +        }
 +        return;
      case 0x10: /* ADD, SUB */
          if (u) {
              gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_sub, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                  genenvfn = fns[size][u];
                  break;
              }
 -            case 0xf: /* SABA, UABA */
 -            {
 -                static NeonGenTwoOpFn * const fns[3][2] = {
 -                    { gen_helper_neon_abd_s8, gen_helper_neon_abd_u8 },
 -                    { gen_helper_neon_abd_s16, gen_helper_neon_abd_u16 },
 -                    { gen_helper_neon_abd_s32, gen_helper_neon_abd_u32 },
 -                };
 -                genfn = fns[size][u];
 -                break;
 -            }
              case 0x16: /* SQDMULH, SQRDMULH */
              {
                  static NeonGenTwoOpEnvFn * const fns[2][2] = {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
      tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
  }
 +static void gen_saba_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +    gen_sabd_i32(t, a, b);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_saba_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +    gen_sabd_i64(t, a, b);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_saba_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    gen_sabd_vec(vece, t, a, b);
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sub_vec, INDEX_op_add_vec,
 +        INDEX_op_smin_vec, INDEX_op_smax_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_saba_i32,
 +          .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_saba_i64,
 +          .fniv = gen_saba_vec,
 +          .fno = gen_helper_gvec_saba_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 +
 +static void gen_uaba_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +    gen_uabd_i32(t, a, b);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_uaba_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +    gen_uabd_i64(t, a, b);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_uaba_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    gen_uabd_vec(vece, t, a, b);
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
 +                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_sub_vec, INDEX_op_add_vec,
 +        INDEX_op_umin_vec, INDEX_op_umax_vec, 0
 +    };
 +    static const GVecGen3 ops[4] = {
 +        { .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_uaba_i32,
 +          .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_uaba_i64,
 +          .fniv = gen_uaba_vec,
 +          .fno = gen_helper_gvec_uaba_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
 +}
 +
  /* Translate a NEON data processing instruction.  Return nonzero if the
     instruction is invalid.
     We process data in a mixture of 32-bit and 64-bit chunks.
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              }
              return 0;
 +        case NEON_3R_VABA:
 +            if (u) {
 +                gen_gvec_uaba(size, rd_ofs, rn_ofs, rm_ofs,
 +                              vec_size, vec_size);
 +            } else {
 +                gen_gvec_saba(size, rd_ofs, rn_ofs, rm_ofs,
 +                              vec_size, vec_size);
 +            }
 +            return 0;
 +
          case NEON_3R_VADD_VSUB:
          case NEON_3R_LOGIC:
          case NEON_3R_VMAX:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQRSHL:
              GEN_NEON_INTEGER_OP_ENV(qrshl);
              break;
 -        case NEON_3R_VABA:
 -            GEN_NEON_INTEGER_OP(abd);
 -            tcg_temp_free_i32(tmp2);
 -            tmp2 = neon_load_reg(rd, pass);
 -            gen_neon_add(size, tmp, tmp2);
 -            break;
          case NEON_3R_VPMAX:
              GEN_NEON_INTEGER_OP(pmax);
              break;
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_ABD(gvec_uabd_s, uint32_t)
  DO_ABD(gvec_uabd_d, uint64_t)
  #undef DO_ABD
 +
 +#define DO_ABA(NAME, TYPE)                                      \
 +void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc)  \
 +{                                                               \
 +    intptr_t i, opr_sz = simd_oprsz(desc);                      \
 +    TYPE *d = vd, *n = vn, *m = vm;                             \
 +                                                                \
 +    for (i = 0; i < opr_sz / sizeof(TYPE); ++i) {               \
 +        d[i] += n[i] < m[i] ? m[i] - n[i] : n[i] - m[i];        \
 +    }                                                           \
 +    clear_tail(d, opr_sz, simd_maxsz(desc));                    \
 +}
 +
 +DO_ABA(gvec_saba_b, int8_t)
 +DO_ABA(gvec_saba_h, int16_t)
 +DO_ABA(gvec_saba_s, int32_t)
 +DO_ABA(gvec_saba_d, int64_t)
 +
 +DO_ABA(gvec_uaba_b, uint8_t)
 +DO_ABA(gvec_uaba_h, uint16_t)
 +DO_ABA(gvec_uaba_s, uint32_t)
 +DO_ABA(gvec_uaba_d, uint64_t)
 +
 +#undef DO_ABA
 --
-.20.1
+.25.1

-[PULL 04/45] target/arm: Create gen_gvec_{sri,sli}
+[PULL 28/31] hw/core/irq: remove unused 'qemu_irq_split' function
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Zongyuan Li <zongyuan.li@smartx.com>
-The functions eliminate duplication of the special cases for
+Signed-off-by: Zongyuan Li <zongyuan.li@smartx.com>
 this operation.  They match up with the GVecGen2iFn typedef.
 Add out-of-line helpers.  We got away with only having inline
 expanders because the neon vector size is only 16 bytes, and
 we know that the inline expansion will always succeed.
 When we reuse this for SVE, tcg-gvec-op may decide to use an
 out-of-line helper due to longer vector lengths.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20220324181557.203805-5-zongyuan.li@smartx.com
-Message-id: 20200513163245.17915-4-richard.henderson@linaro.org
+Resolves: https://gitlab.com/qemu-project/qemu/-/issues/811
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  10 ++
+ include/hw/irq.h |  5 -----
- target/arm/translate.h     |   7 +-
+ hw/core/irq.c    | 15 ---------------
- target/arm/translate-a64.c |  20 +---
+files changed, 20 deletions(-)
  target/arm/translate.c     | 186 +++++++++++++++++++++----------------
  target/arm/vec_helper.c    |  38 ++++++++
 files changed, 160 insertions(+), 101 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/irq.h b/include/hw/irq.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/irq.h
-+++ b/target/arm/helper.h
++++ b/include/hw/irq.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_ursra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ void qemu_free_irq(qemu_irq irq);
- DEF_HELPER_FLAGS_3(gvec_ursra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ /* Returns a new IRQ with opposite polarity.  */
- DEF_HELPER_FLAGS_3(gvec_ursra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ qemu_irq qemu_irq_invert(qemu_irq irq);
-+DEF_HELPER_FLAGS_3(gvec_sri_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-/* Returns a new IRQ which feeds into both the passed IRQs.
-+DEF_HELPER_FLAGS_3(gvec_sri_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+- * It's probably better to use the TYPE_SPLIT_IRQ device instead.
-+DEF_HELPER_FLAGS_3(gvec_sri_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+- */
-+DEF_HELPER_FLAGS_3(gvec_sri_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-qemu_irq qemu_irq_split(qemu_irq irq1, qemu_irq irq2);
-+
+-
-+DEF_HELPER_FLAGS_3(gvec_sli_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ /* For internal use in qtest.  Similar to qemu_irq_split, but operating
-+DEF_HELPER_FLAGS_3(gvec_sli_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+    on an existing vector of qemu_irq.  */
-+DEF_HELPER_FLAGS_3(gvec_sli_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ void qemu_irq_intercept_in(qemu_irq *gpio_in, qemu_irq_handler handler, int n);
-+DEF_HELPER_FLAGS_3(gvec_sli_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+diff --git a/hw/core/irq.c b/hw/core/irq.c
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/hw/core/irq.c
-+++ b/target/arm/translate.h
++++ b/hw/core/irq.c
-@@ -XXX,XX +XXX,XX @@ extern const GVecGen3 mls_op[4];
+@@ -XXX,XX +XXX,XX @@ qemu_irq qemu_irq_invert(qemu_irq irq)
- extern const GVecGen3 cmtst_op[4];
+     return qemu_allocate_irq(qemu_notirq, irq, 0);
  extern const GVecGen3 sshl_op[4];
  extern const GVecGen3 ushl_op[4];
 -extern const GVecGen2i sri_op[4];
 -extern const GVecGen2i sli_op[4];
  extern const GVecGen4 uqadd_op[4];
  extern const GVecGen4 sqadd_op[4];
  extern const GVecGen4 uqsub_op[4];
@@ -XXX,XX +XXX,XX @@ void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
  void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
                      int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op2(DisasContext *s, bool is_q, int rd,
                     is_q ? 16 : 8, vec_full_reg_size(s), gvec_op);
  }
--/* Expand a 2-operand + immediate AdvSIMD vector operation using
+-static void qemu_splitirq(void *opaque, int line, int level)
 - * an op descriptor.
 - */
 -static void gen_gvec_op2i(DisasContext *s, bool is_q, int rd,
 -                          int rn, int64_t imm, const GVecGen2i *gvec_op)
 -{
--    tcg_gen_gvec_2i(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
+-    struct IRQState **irq = opaque;
--                    is_q ? 16 : 8, vec_full_reg_size(s), imm, gvec_op);
+-    irq[0]->handler(irq[0]->opaque, irq[0]->n, level);
 -    irq[1]->handler(irq[1]->opaque, irq[1]->n, level);
 -}
 -
- /* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
+-qemu_irq qemu_irq_split(qemu_irq irq1, qemu_irq irq2)
- static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
+-{
-                          int rn, int rm, const GVecGen3 *gvec_op)
+-    qemu_irq *s = g_new0(qemu_irq, 2);
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
+-    s[0] = irq1;
-         gen_gvec_fn2i(s, is_q, rd, rn, shift,
+-    s[1] = irq2;
-                       is_u ? gen_gvec_usra : gen_gvec_ssra, size);
+-    return qemu_allocate_irq(qemu_splitirq, s, 0);
-         return;
+-}
-+
+-
-     case 0x08: /* SRI */
+ void qemu_irq_intercept_in(qemu_irq *gpio_in, qemu_irq_handler handler, int n)
 -        /* Shift count same as element size is valid but does nothing.  */
 -        if (shift == 8 << size) {
 -            goto done;
 -        }
 -        gen_gvec_op2i(s, is_q, rd, rn, shift, &sri_op[size]);
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sri, size);
          return;
      case 0x00: /* SSHR / USHR */
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
      }
      tcg_temp_free_i64(tcg_round);
 - done:
      clear_vec_high(s, is_q, rd);
  }
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shli(DisasContext *s, bool is_q, bool insert,
      }
      if (insert) {
 -        gen_gvec_op2i(s, is_q, rd, rn, shift, &sli_op[size]);
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sli, size);
      } else {
          gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_shli, size);
      }
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_shr64_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  static void gen_shr_ins_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
  {
--    if (sh == 0) {
+     int i;
 -        tcg_gen_mov_vec(d, a);
 -    } else {
 -        TCGv_vec t = tcg_temp_new_vec_matching(d);
 -        TCGv_vec m = tcg_temp_new_vec_matching(d);
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec m = tcg_temp_new_vec_matching(d);
 -        tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK((8 << vece) - sh, sh));
 -        tcg_gen_shri_vec(vece, t, a, sh);
 -        tcg_gen_and_vec(vece, d, d, m);
 -        tcg_gen_or_vec(vece, d, d, t);
 +    tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK((8 << vece) - sh, sh));
 +    tcg_gen_shri_vec(vece, t, a, sh);
 +    tcg_gen_and_vec(vece, d, d, m);
 +    tcg_gen_or_vec(vece, d, d, t);
 -        tcg_temp_free_vec(t);
 -        tcg_temp_free_vec(m);
 -    }
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(m);
  }
 -static const TCGOpcode vecop_list_sri[] = { INDEX_op_shri_vec, 0 };
 +void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = { INDEX_op_shri_vec, 0 };
 +    const GVecGen2i ops[4] = {
 +        { .fni8 = gen_shr8_ins_i64,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_b,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_shr16_ins_i64,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_h,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_shr32_ins_i32,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_s,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_shr64_ins_i64,
 +          .fniv = gen_shr_ins_vec,
 +          .fno = gen_helper_gvec_sri_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 -const GVecGen2i sri_op[4] = {
 -    { .fni8 = gen_shr8_ins_i64,
 -      .fniv = gen_shr_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_8 },
 -    { .fni8 = gen_shr16_ins_i64,
 -      .fniv = gen_shr_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_16 },
 -    { .fni4 = gen_shr32_ins_i32,
 -      .fniv = gen_shr_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_32 },
 -    { .fni8 = gen_shr64_ins_i64,
 -      .fniv = gen_shr_ins_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sri,
 -      .vece = MO_64 },
 -};
 +    /* tszimm encoding produces immediates in the range [1..esize]. */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    /* Shift of esize leaves destination unchanged. */
 +    if (shift < (8 << vece)) {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    } else {
 +        /* Nop, but we do need to clear the tail. */
 +        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
 +    }
 +}
  static void gen_shl8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
@@ -XXX,XX +XXX,XX @@ static void gen_shl64_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  static void gen_shl_ins_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
  {
 -    if (sh == 0) {
 -        tcg_gen_mov_vec(d, a);
 -    } else {
 -        TCGv_vec t = tcg_temp_new_vec_matching(d);
 -        TCGv_vec m = tcg_temp_new_vec_matching(d);
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec m = tcg_temp_new_vec_matching(d);
 -        tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK(0, sh));
 -        tcg_gen_shli_vec(vece, t, a, sh);
 -        tcg_gen_and_vec(vece, d, d, m);
 -        tcg_gen_or_vec(vece, d, d, t);
 +    tcg_gen_shli_vec(vece, t, a, sh);
 +    tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK(0, sh));
 +    tcg_gen_and_vec(vece, d, d, m);
 +    tcg_gen_or_vec(vece, d, d, t);
 -        tcg_temp_free_vec(t);
 -        tcg_temp_free_vec(m);
 -    }
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(m);
  }
 -static const TCGOpcode vecop_list_sli[] = { INDEX_op_shli_vec, 0 };
 +void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = { INDEX_op_shli_vec, 0 };
 +    const GVecGen2i ops[4] = {
 +        { .fni8 = gen_shl8_ins_i64,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_b,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_shl16_ins_i64,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_h,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_shl32_ins_i32,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_s,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_shl64_ins_i64,
 +          .fniv = gen_shl_ins_vec,
 +          .fno = gen_helper_gvec_sli_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .load_dest = true,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 -const GVecGen2i sli_op[4] = {
 -    { .fni8 = gen_shl8_ins_i64,
 -      .fniv = gen_shl_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_8 },
 -    { .fni8 = gen_shl16_ins_i64,
 -      .fniv = gen_shl_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_16 },
 -    { .fni4 = gen_shl32_ins_i32,
 -      .fniv = gen_shl_ins_vec,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_32 },
 -    { .fni8 = gen_shl64_ins_i64,
 -      .fniv = gen_shl_ins_vec,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .load_dest = true,
 -      .opt_opc = vecop_list_sli,
 -      .vece = MO_64 },
 -};
 +    /* tszimm encoding produces immediates in the range [0..esize-1]. */
 +    tcg_debug_assert(shift >= 0);
 +    tcg_debug_assert(shift < (8 << vece));
 +
 +    if (shift == 0) {
 +        tcg_gen_gvec_mov(vece, rd_ofs, rm_ofs, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
  static void gen_mla8_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
  {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                      }
                      /* Right shift comes here negative.  */
                      shift = -shift;
 -                    /* Shift out of range leaves destination unchanged.  */
 -                    if (shift < 8 << size) {
 -                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
 -                                        shift, &sri_op[size]);
 -                    }
 +                    gen_gvec_sri(size, rd_ofs, rm_ofs, shift,
 +                                 vec_size, vec_size);
                      return 0;
                  case 5: /* VSHL, VSLI */
                      if (u) { /* VSLI */
 -                        /* Shift out of range leaves destination unchanged.  */
 -                        if (shift < 8 << size) {
 -                            tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size,
 -                                            vec_size, shift, &sli_op[size]);
 -                        }
 +                        gen_gvec_sli(size, rd_ofs, rm_ofs, shift,
 +                                     vec_size, vec_size);
                      } else { /* VSHL */
                          /* Shifts larger than the element size are
                           * architecturally valid and results in zero.
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_RSRA(gvec_ursra_d, uint64_t)
  #undef DO_RSRA
 +#define DO_SRI(NAME, TYPE)                              \
 +void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
 +{                                                       \
 +    intptr_t i, oprsz = simd_oprsz(desc);               \
 +    int shift = simd_data(desc);                        \
 +    TYPE *d = vd, *n = vn;                              \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
 +        d[i] = deposit64(d[i], 0, sizeof(TYPE) * 8 - shift, n[i] >> shift); \
 +    }                                                   \
 +    clear_tail(d, oprsz, simd_maxsz(desc));             \
 +}
 +
 +DO_SRI(gvec_sri_b, uint8_t)
 +DO_SRI(gvec_sri_h, uint16_t)
 +DO_SRI(gvec_sri_s, uint32_t)
 +DO_SRI(gvec_sri_d, uint64_t)
 +
 +#undef DO_SRI
 +
 +#define DO_SLI(NAME, TYPE)                              \
 +void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
 +{                                                       \
 +    intptr_t i, oprsz = simd_oprsz(desc);               \
 +    int shift = simd_data(desc);                        \
 +    TYPE *d = vd, *n = vn;                              \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
 +        d[i] = deposit64(d[i], shift, sizeof(TYPE) * 8 - shift, n[i]); \
 +    }                                                   \
 +    clear_tail(d, oprsz, simd_maxsz(desc));             \
 +}
 +
 +DO_SLI(gvec_sli_b, uint8_t)
 +DO_SLI(gvec_sli_h, uint16_t)
 +DO_SLI(gvec_sli_s, uint32_t)
 +DO_SLI(gvec_sli_d, uint64_t)
 +
 +#undef DO_SLI
 +
  /*
   * Convert float16 to float32, raising no exceptions and
   * preserving exceptional values, including SNaN.
 --
-.20.1
+.25.1

-[PULL 05/45] target/arm: Remove unnecessary range check for VSHL
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-In 1dc8425e551, while converting to gvec, I added an extra range check
-against the shift count.  This was unnecessary because the encoding of
-the shift count produces 0 to the element size - 1.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-5-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.c | 12 ++----------
-file changed, 2 insertions(+), 10 deletions(-)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         gen_gvec_sli(size, rd_ofs, rm_ofs, shift,
-                                      vec_size, vec_size);
-                     } else { /* VSHL */
--                        /* Shifts larger than the element size are
--                         * architecturally valid and results in zero.
--                         */
--                        if (shift >= 8 << size) {
--                            tcg_gen_gvec_dup_imm(size, rd_ofs,
--                                                 vec_size, vec_size, 0);
--                        } else {
--                            tcg_gen_gvec_shli(size, rd_ofs, rm_ofs, shift,
--                                              vec_size, vec_size);
--                        }
-+                        tcg_gen_gvec_shli(size, rd_ofs, rm_ofs, shift,
-+                                          vec_size, vec_size);
-                     }
-                     return 0;
-                 }
---
-.20.1

-[PULL 06/45] target/arm: Tidy handle_vec_simd_shri
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Now that we've converted all cases to gvec, there is quite a bit
-of dead code at the end of the function.  Remove it.
-Sink the call to gen_gvec_fn2i to the end, loading a function
-pointer within the switch statement.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-6-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate-a64.c | 56 ++++++++++----------------------------
-file changed, 14 insertions(+), 42 deletions(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
-     int size = 32 - clz32(immh) - 1;
-     int immhb = immh << 3 | immb;
-     int shift = 2 * (8 << size) - immhb;
--    bool accumulate = false;
--    int dsize = is_q ? 128 : 64;
--    int esize = 8 << size;
--    int elements = dsize/esize;
--    MemOp memop = size | (is_u ? 0 : MO_SIGN);
--    TCGv_i64 tcg_rn = new_tmp_a64(s);
--    TCGv_i64 tcg_rd = new_tmp_a64(s);
--    TCGv_i64 tcg_round;
--    uint64_t round_const;
--    int i;
-+    GVecGen2iFn *gvec_fn;
-     if (extract32(immh, 3, 1) && !is_q) {
-         unallocated_encoding(s);
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
-     switch (opcode) {
-     case 0x02: /* SSRA / USRA (accumulate) */
--        gen_gvec_fn2i(s, is_q, rd, rn, shift,
--                      is_u ? gen_gvec_usra : gen_gvec_ssra, size);
--        return;
-+        gvec_fn = is_u ? gen_gvec_usra : gen_gvec_ssra;
-+        break;
-     case 0x08: /* SRI */
--        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sri, size);
--        return;
-+        gvec_fn = gen_gvec_sri;
-+        break;
-     case 0x00: /* SSHR / USHR */
-         if (is_u) {
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
-                 /* Shift count the same size as element size produces zero.  */
-                 tcg_gen_gvec_dup_imm(size, vec_full_reg_offset(s, rd),
-                                      is_q ? 16 : 8, vec_full_reg_size(s), 0);
--            } else {
--                gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_shri, size);
-+                return;
-             }
-+            gvec_fn = tcg_gen_gvec_shri;
-         } else {
-             /* Shift count the same size as element size produces all sign.  */
-             if (shift == 8 << size) {
-                 shift -= 1;
-             }
--            gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_sari, size);
-+            gvec_fn = tcg_gen_gvec_sari;
-         }
--        return;
-+        break;
-     case 0x04: /* SRSHR / URSHR (rounding) */
--        gen_gvec_fn2i(s, is_q, rd, rn, shift,
--                      is_u ? gen_gvec_urshr : gen_gvec_srshr, size);
--        return;
-+        gvec_fn = is_u ? gen_gvec_urshr : gen_gvec_srshr;
-+        break;
-     case 0x06: /* SRSRA / URSRA (accum + rounding) */
--        gen_gvec_fn2i(s, is_q, rd, rn, shift,
--                      is_u ? gen_gvec_ursra : gen_gvec_srsra, size);
--        return;
-+        gvec_fn = is_u ? gen_gvec_ursra : gen_gvec_srsra;
-+        break;
-     default:
-         g_assert_not_reached();
-     }
--    round_const = 1ULL << (shift - 1);
--    tcg_round = tcg_const_i64(round_const);
--
--    for (i = 0; i < elements; i++) {
--        read_vec_element(s, tcg_rn, rn, i, memop);
--        if (accumulate) {
--            read_vec_element(s, tcg_rd, rd, i, memop);
--        }
--
--        handle_shri_with_rndacc(tcg_rd, tcg_rn, tcg_round,
--                                accumulate, is_u, size, shift);
--
--        write_vec_element(s, tcg_rd, rd, i, size);
--    }
--    tcg_temp_free_i64(tcg_round);
--
--    clear_vec_high(s, is_q, rd);
-+    gen_gvec_fn2i(s, is_q, rd, rn, shift, gvec_fn, size);
- }
- /* SHL/SLI - Vector shift left */
---
-.20.1

-[PULL 08/45] target/arm: Create gen_gvec_{mla,mls}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-8-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |   7 +-
- target/arm/translate-a64.c      |   4 +-
- target/arm/translate-neon.inc.c |  16 +----
- target/arm/translate.c          | 117 +++++++++++++++++---------------
-files changed, 71 insertions(+), 73 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_cle0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
- void gen_gvec_cge0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                    uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen3 mla_op[4];
--extern const GVecGen3 mls_op[4];
-+void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- extern const GVecGen3 cmtst_op[4];
- extern const GVecGen3 sshl_op[4];
- extern const GVecGen3 ushl_op[4];
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-         return;
-     case 0x12: /* MLA, MLS */
-         if (u) {
--            gen_gvec_op3(s, is_q, rd, rn, rm, &mls_op[size]);
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mls, size);
-         } else {
--            gen_gvec_op3(s, is_q, rd, rn, rm, &mla_op[size]);
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mla, size);
-         }
-         return;
-     case 0x11:
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMAX_U, tcg_gen_gvec_umax)
- DO_3SAME_NO_SZ_3(VMIN_S, tcg_gen_gvec_smin)
- DO_3SAME_NO_SZ_3(VMIN_U, tcg_gen_gvec_umin)
- DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
-+DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
-+DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
- #define DO_3SAME_CMP(INSN, COND)                                        \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-     return do_3same(s, a, gen_VMUL_p_3s);
- }
--#define DO_3SAME_GVEC3_NO_SZ_3(INSN, OPARRAY)                           \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
--                       oprsz, maxsz, &OPARRAY[vece]);                   \
--    }                                                                   \
--    DO_3SAME_NO_SZ_3(INSN, gen_##INSN##_3s)
--
--
--DO_3SAME_GVEC3_NO_SZ_3(VMLA, mla_op)
--DO_3SAME_GVEC3_NO_SZ_3(VMLS, mls_op)
--
- #define DO_3SAME_GVEC3_SHIFT(INSN, OPARRAY)                             \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-                                 uint32_t rn_ofs, uint32_t rm_ofs,       \
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_mls_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
- /* Note that while NEON does not support VMLA and VMLS as 64-bit ops,
-  * these tables are shared with AArch64 which does support them.
-  */
-+void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_mul_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fni4 = gen_mla8_i32,
-+          .fniv = gen_mla_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni4 = gen_mla16_i32,
-+          .fniv = gen_mla_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_mla32_i32,
-+          .fniv = gen_mla_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_mla64_i64,
-+          .fniv = gen_mla_vec,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
--static const TCGOpcode vecop_list_mla[] = {
--    INDEX_op_mul_vec, INDEX_op_add_vec, 0
--};
--
--static const TCGOpcode vecop_list_mls[] = {
--    INDEX_op_mul_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen3 mla_op[4] = {
--    { .fni4 = gen_mla8_i32,
--      .fniv = gen_mla_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_8 },
--    { .fni4 = gen_mla16_i32,
--      .fniv = gen_mla_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_16 },
--    { .fni4 = gen_mla32_i32,
--      .fniv = gen_mla_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_32 },
--    { .fni8 = gen_mla64_i64,
--      .fniv = gen_mla_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_64 },
--};
--
--const GVecGen3 mls_op[4] = {
--    { .fni4 = gen_mls8_i32,
--      .fniv = gen_mls_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_8 },
--    { .fni4 = gen_mls16_i32,
--      .fniv = gen_mls_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_16 },
--    { .fni4 = gen_mls32_i32,
--      .fniv = gen_mls_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_32 },
--    { .fni8 = gen_mls64_i64,
--      .fniv = gen_mls_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_64 },
--};
-+void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_mul_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fni4 = gen_mls8_i32,
-+          .fniv = gen_mls_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni4 = gen_mls16_i32,
-+          .fniv = gen_mls_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_mls32_i32,
-+          .fniv = gen_mls_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_mls64_i64,
-+          .fniv = gen_mls_vec,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- /* CMTST : test is "if (X & Y != 0)". */
- static void gen_cmtst_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
---
-.20.1

-[PULL 09/45] target/arm: Swap argument order for VSHL during decode
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Rather than perform the argument swap during code generation,
-perform it during decode.  This means it doesn't have to be
-special cased later, and we can share code with aarch64 code
-generation.  Hopefully the decode comment addresses any confusion
-that might arise in between.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-9-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/neon-dp.decode       | 17 +++++++++++++++--
- target/arm/translate-neon.inc.c |  3 +--
-files changed, 16 insertions(+), 4 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VCGT_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 0 .... @3same
- VCGE_S_3s        1111 001 0 0 . .. .... .... 0011 . . . 1 .... @3same
- VCGE_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 1 .... @3same
--VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same
--VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same
-+# The _rev suffix indicates that Vn and Vm are reversed. This is
-+# the case for shifts. In the Arm ARM these insns are documented
-+# with the Vm and Vn fields in their usual places, but in the
-+# assembly the operands are listed "backwards", ie in the order
-+# Dd, Dm, Dn where other insns use Dd, Dn, Dm. For QEMU we choose
-+# to consider Vm and Vn as being in different fields in the insn,
-+# which allows us to avoid special-casing shifts in the trans_
-+# function code. We would otherwise need to manually swap the operands
-+# over to call Neon helper functions that are shared with AArch64,
-+# which does not have this odd reversed-operand situation.
-+@3same_rev       .... ... . . . size:2 .... .... .... . q:1 . . .... \
-+                 &3same vn=%vm_dp vm=%vn_dp vd=%vd_dp
-+
-+VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same_rev
-+VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
- VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
- VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-                                 uint32_t rn_ofs, uint32_t rm_ofs,       \
-                                 uint32_t oprsz, uint32_t maxsz)         \
-     {                                                                   \
--        /* Note the operation is vshl vd,vm,vn */                       \
--        tcg_gen_gvec_3(rd_ofs, rm_ofs, rn_ofs,                          \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
-                        oprsz, maxsz, &OPARRAY[vece]);                   \
-     }                                                                   \
-     DO_3SAME(INSN, gen_##INSN##_3s)
---
-.20.1

-[PULL 10/45] target/arm: Create gen_gvec_{cmtst,ushl,sshl}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-10-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |  10 ++-
- target/arm/translate-a64.c      |  18 ++--
- target/arm/translate-neon.inc.c |  23 +----
- target/arm/translate.c          | 146 +++++++++++++++++---------------
-files changed, 95 insertions(+), 102 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen3 cmtst_op[4];
--extern const GVecGen3 sshl_op[4];
--extern const GVecGen3 ushl_op[4];
-+void gen_gvec_cmtst(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- extern const GVecGen4 uqadd_op[4];
- extern const GVecGen4 sqadd_op[4];
- extern const GVecGen4 uqsub_op[4];
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn4(DisasContext *s, bool is_q, int rd, int rn, int rm,
-             is_q ? 16 : 8, vec_full_reg_size(s));
- }
--/* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
--static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
--                         int rn, int rm, const GVecGen3 *gvec_op)
--{
--    tcg_gen_gvec_3(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
--                   vec_full_reg_offset(s, rm), is_q ? 16 : 8,
--                   vec_full_reg_size(s), gvec_op);
--}
--
- /* Expand a 3-operand operation using an out-of-line helper.  */
- static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
-                              int rn, int rm, int data, gen_helper_gvec_3 *fn)
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-                        (u ? uqsub_op : sqsub_op) + size);
-         return;
-     case 0x08: /* SSHL, USHL */
--        gen_gvec_op3(s, is_q, rd, rn, rm,
--                     u ? &ushl_op[size] : &sshl_op[size]);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_ushl, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sshl, size);
-+        }
-         return;
-     case 0x0c: /* SMAX, UMAX */
-         if (u) {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-         return;
-     case 0x11:
-         if (!u) { /* CMTST */
--            gen_gvec_op3(s, is_q, rd, rn, rm, &cmtst_op[size]);
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_cmtst, size);
-             return;
-         }
-         /* else CMEQ */
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME(VBIC, tcg_gen_gvec_andc)
- DO_3SAME(VORR, tcg_gen_gvec_or)
- DO_3SAME(VORN, tcg_gen_gvec_orc)
- DO_3SAME(VEOR, tcg_gen_gvec_xor)
-+DO_3SAME(VSHL_S, gen_gvec_sshl)
-+DO_3SAME(VSHL_U, gen_gvec_ushl)
- /* These insns are all gvec_bitsel but with the inputs in various orders. */
- #define DO_3SAME_BITSEL(INSN, O1, O2, O3)                               \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMIN_U, tcg_gen_gvec_umin)
- DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
- DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
- DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
-+DO_3SAME_NO_SZ_3(VTST, gen_gvec_cmtst)
- #define DO_3SAME_CMP(INSN, COND)                                        \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_CMP(VCGE_S, TCG_COND_GE)
- DO_3SAME_CMP(VCGE_U, TCG_COND_GEU)
- DO_3SAME_CMP(VCEQ, TCG_COND_EQ)
--static void gen_VTST_3s(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
--                         uint32_t rm_ofs, uint32_t oprsz, uint32_t maxsz)
--{
--    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &cmtst_op[vece]);
--}
--DO_3SAME_NO_SZ_3(VTST, gen_VTST_3s)
--
- #define DO_3SAME_GVEC4(INSN, OPARRAY)                                   \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-                                 uint32_t rn_ofs, uint32_t rm_ofs,       \
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-     }
-     return do_3same(s, a, gen_VMUL_p_3s);
- }
--
--#define DO_3SAME_GVEC3_SHIFT(INSN, OPARRAY)                             \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
--                       oprsz, maxsz, &OPARRAY[vece]);                   \
--    }                                                                   \
--    DO_3SAME(INSN, gen_##INSN##_3s)
--
--DO_3SAME_GVEC3_SHIFT(VSHL_S, sshl_op)
--DO_3SAME_GVEC3_SHIFT(VSHL_U, ushl_op)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_cmtst_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-     tcg_gen_cmp_vec(TCG_COND_NE, vece, d, d, a);
- }
--static const TCGOpcode vecop_list_cmtst[] = { INDEX_op_cmp_vec, 0 };
--
--const GVecGen3 cmtst_op[4] = {
--    { .fni4 = gen_helper_neon_tst_u8,
--      .fniv = gen_cmtst_vec,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_8 },
--    { .fni4 = gen_helper_neon_tst_u16,
--      .fniv = gen_cmtst_vec,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_16 },
--    { .fni4 = gen_cmtst_i32,
--      .fniv = gen_cmtst_vec,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_32 },
--    { .fni8 = gen_cmtst_i64,
--      .fniv = gen_cmtst_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_64 },
--};
-+void gen_gvec_cmtst(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = { INDEX_op_cmp_vec, 0 };
-+    static const GVecGen3 ops[4] = {
-+        { .fni4 = gen_helper_neon_tst_u8,
-+          .fniv = gen_cmtst_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni4 = gen_helper_neon_tst_u16,
-+          .fniv = gen_cmtst_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_cmtst_i32,
-+          .fniv = gen_cmtst_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_cmtst_i64,
-+          .fniv = gen_cmtst_vec,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- void gen_ushl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_ushl_vec(unsigned vece, TCGv_vec dst,
-     tcg_temp_free_vec(rsh);
- }
--static const TCGOpcode ushl_list[] = {
--    INDEX_op_neg_vec, INDEX_op_shlv_vec,
--    INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
--};
--
--const GVecGen3 ushl_op[4] = {
--    { .fniv = gen_ushl_vec,
--      .fno = gen_helper_gvec_ushl_b,
--      .opt_opc = ushl_list,
--      .vece = MO_8 },
--    { .fniv = gen_ushl_vec,
--      .fno = gen_helper_gvec_ushl_h,
--      .opt_opc = ushl_list,
--      .vece = MO_16 },
--    { .fni4 = gen_ushl_i32,
--      .fniv = gen_ushl_vec,
--      .opt_opc = ushl_list,
--      .vece = MO_32 },
--    { .fni8 = gen_ushl_i64,
--      .fniv = gen_ushl_vec,
--      .opt_opc = ushl_list,
--      .vece = MO_64 },
--};
-+void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_neg_vec, INDEX_op_shlv_vec,
-+        INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_ushl_vec,
-+          .fno = gen_helper_gvec_ushl_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_ushl_vec,
-+          .fno = gen_helper_gvec_ushl_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_ushl_i32,
-+          .fniv = gen_ushl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_ushl_i64,
-+          .fniv = gen_ushl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- void gen_sshl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_sshl_vec(unsigned vece, TCGv_vec dst,
-     tcg_temp_free_vec(tmp);
- }
--static const TCGOpcode sshl_list[] = {
--    INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
--    INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
--};
--
--const GVecGen3 sshl_op[4] = {
--    { .fniv = gen_sshl_vec,
--      .fno = gen_helper_gvec_sshl_b,
--      .opt_opc = sshl_list,
--      .vece = MO_8 },
--    { .fniv = gen_sshl_vec,
--      .fno = gen_helper_gvec_sshl_h,
--      .opt_opc = sshl_list,
--      .vece = MO_16 },
--    { .fni4 = gen_sshl_i32,
--      .fniv = gen_sshl_vec,
--      .opt_opc = sshl_list,
--      .vece = MO_32 },
--    { .fni8 = gen_sshl_i64,
--      .fniv = gen_sshl_vec,
--      .opt_opc = sshl_list,
--      .vece = MO_64 },
--};
-+void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
-+        INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_sshl_vec,
-+          .fno = gen_helper_gvec_sshl_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_sshl_vec,
-+          .fno = gen_helper_gvec_sshl_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_sshl_i32,
-+          .fniv = gen_sshl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_sshl_i64,
-+          .fniv = gen_sshl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
---
-.20.1

-[PULL 11/45] target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-11-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |  13 +-
- target/arm/translate-a64.c      |  22 ++-
- target/arm/translate-neon.inc.c |  19 +--
- target/arm/translate.c          | 228 +++++++++++++++++---------------
-files changed, 147 insertions(+), 135 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen4 uqadd_op[4];
--extern const GVecGen4 sqadd_op[4];
--extern const GVecGen4 uqsub_op[4];
--extern const GVecGen4 sqsub_op[4];
- void gen_cmtst_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_ushl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_gvec_uqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_uqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
- void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-     switch (opcode) {
-     case 0x01: /* SQADD, UQADD */
--        tcg_gen_gvec_4(vec_full_reg_offset(s, rd),
--                       offsetof(CPUARMState, vfp.qc),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm),
--                       is_q ? 16 : 8, vec_full_reg_size(s),
--                       (u ? uqadd_op : sqadd_op) + size);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uqadd_qc, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqadd_qc, size);
-+        }
-         return;
-     case 0x05: /* SQSUB, UQSUB */
--        tcg_gen_gvec_4(vec_full_reg_offset(s, rd),
--                       offsetof(CPUARMState, vfp.qc),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm),
--                       is_q ? 16 : 8, vec_full_reg_size(s),
--                       (u ? uqsub_op : sqsub_op) + size);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uqsub_qc, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqsub_qc, size);
-+        }
-         return;
-     case 0x08: /* SSHL, USHL */
-         if (u) {
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME(VORN, tcg_gen_gvec_orc)
- DO_3SAME(VEOR, tcg_gen_gvec_xor)
- DO_3SAME(VSHL_S, gen_gvec_sshl)
- DO_3SAME(VSHL_U, gen_gvec_ushl)
-+DO_3SAME(VQADD_S, gen_gvec_sqadd_qc)
-+DO_3SAME(VQADD_U, gen_gvec_uqadd_qc)
-+DO_3SAME(VQSUB_S, gen_gvec_sqsub_qc)
-+DO_3SAME(VQSUB_U, gen_gvec_uqsub_qc)
- /* These insns are all gvec_bitsel but with the inputs in various orders. */
- #define DO_3SAME_BITSEL(INSN, O1, O2, O3)                               \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_CMP(VCGE_S, TCG_COND_GE)
- DO_3SAME_CMP(VCGE_U, TCG_COND_GEU)
- DO_3SAME_CMP(VCEQ, TCG_COND_EQ)
--#define DO_3SAME_GVEC4(INSN, OPARRAY)                                   \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),           \
--                       rn_ofs, rm_ofs, oprsz, maxsz, &OPARRAY[vece]);   \
--    }                                                                   \
--    DO_3SAME(INSN, gen_##INSN##_3s)
--
--DO_3SAME_GVEC4(VQADD_S, sqadd_op)
--DO_3SAME_GVEC4(VQADD_U, uqadd_op)
--DO_3SAME_GVEC4(VQSUB_S, sqsub_op)
--DO_3SAME_GVEC4(VQSUB_U, uqsub_op)
--
- static void gen_VMUL_p_3s(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                            uint32_t rm_ofs, uint32_t oprsz, uint32_t maxsz)
- {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_uqadd[] = {
--    INDEX_op_usadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
--};
--
--const GVecGen4 uqadd_op[4] = {
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_b,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_8 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_h,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_16 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_s,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_32 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_d,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_64 },
--};
-+void gen_gvec_uqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_usadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_b,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_h,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_s,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_d,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_sqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_sqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_sqadd[] = {
--    INDEX_op_ssadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
--};
--
--const GVecGen4 sqadd_op[4] = {
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_b,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_h,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_s,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_d,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_sqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_ssadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_uqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_uqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_uqsub[] = {
--    INDEX_op_ussub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen4 uqsub_op[4] = {
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_b,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_h,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_s,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_d,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_uqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_ussub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_sqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_sqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_sqsub[] = {
--    INDEX_op_sssub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen4 sqsub_op[4] = {
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_b,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_h,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_s,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_d,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sssub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- /* Translate a NEON data processing instruction.  Return nonzero if the
-    instruction is invalid.
---
-.20.1

-[PULL 19/45] acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
+[PULL 29/31] hw/arm/virt: impact of gic-version on max CPUs
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Heinrich Schuchardt <heinrich.schuchardt@canonical.com>
-The little end UUID is used in many places, so make
+Describe that the gic-version influences the maximum number of CPUs.
 NVDIMM_UUID_LE to a common macro to convert the UUID
 to a little end array.
-Reviewed-by: Xiang Zheng <zhengxiang9@huawei.com>
+Signed-off-by: Heinrich Schuchardt <heinrich.schuchardt@canonical.com>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Message-id: 20220413231456.35811-1-heinrich.schuchardt@canonical.com
-Message-id: 20200512030609.19593-2-gengdongjiu@huawei.com
+[PMM: minor punctuation tweaks]
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/qemu/uuid.h | 27 +++++++++++++++++++++++++++
+ docs/system/arm/virt.rst | 4 ++--
- hw/acpi/nvdimm.c    | 10 +++-------
+file changed, 2 insertions(+), 2 deletions(-)
 files changed, 30 insertions(+), 7 deletions(-)
-diff --git a/include/qemu/uuid.h b/include/qemu/uuid.h
+diff --git a/docs/system/arm/virt.rst b/docs/system/arm/virt.rst
 index XXXXXXX..XXXXXXX 100644
---- a/include/qemu/uuid.h
+--- a/docs/system/arm/virt.rst
-+++ b/include/qemu/uuid.h
++++ b/docs/system/arm/virt.rst
-@@ -XXX,XX +XXX,XX @@ typedef struct {
+@@ -XXX,XX +XXX,XX @@ gic-version
-     };
+   Valid values are:
- } QemuUUID;
+   ``2``
-+/**
+-    GICv2
-+ * UUID_LE - converts the fields of UUID to little-endian array,
++    GICv2. Note that this limits the number of CPUs to 8.
-+ * each of parameters is the filed of UUID.
+   ``3``
-+ *
+-    GICv3
-+ * @time_low: The low field of the timestamp
++    GICv3. This allows up to 512 CPUs.
-+ * @time_mid: The middle field of the timestamp
+   ``host``
-+ * @time_hi_and_version: The high field of the timestamp
+     Use the same GIC version the host provides, when using KVM
-+ *                       multiplexed with the version number
+   ``max``
 + * @clock_seq_hi_and_reserved: The high field of the clock
 + *                             sequence multiplexed with the variant
 + * @clock_seq_low: The low field of the clock sequence
 + * @node0: The spatially unique node0 identifier
 + * @node1: The spatially unique node1 identifier
 + * @node2: The spatially unique node2 identifier
 + * @node3: The spatially unique node3 identifier
 + * @node4: The spatially unique node4 identifier
 + * @node5: The spatially unique node5 identifier
 + */
 +#define UUID_LE(time_low, time_mid, time_hi_and_version,                    \
 +  clock_seq_hi_and_reserved, clock_seq_low, node0, node1, node2,            \
 +  node3, node4, node5)                                                      \
 +  { (time_low) & 0xff, ((time_low) >> 8) & 0xff, ((time_low) >> 16) & 0xff, \
 +    ((time_low) >> 24) & 0xff, (time_mid) & 0xff, ((time_mid) >> 8) & 0xff, \
 +    (time_hi_and_version) & 0xff, ((time_hi_and_version) >> 8) & 0xff,      \
 +    (clock_seq_hi_and_reserved), (clock_seq_low), (node0), (node1), (node2),\
 +    (node3), (node4), (node5) }
 +
  #define UUID_FMT "%02hhx%02hhx%02hhx%02hhx-" \
                   "%02hhx%02hhx-%02hhx%02hhx-" \
                   "%02hhx%02hhx-" \
 diff --git a/hw/acpi/nvdimm.c b/hw/acpi/nvdimm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/nvdimm.c
 +++ b/hw/acpi/nvdimm.c
@@ -XXX,XX +XXX,XX @@
   */
  #include "qemu/osdep.h"
 +#include "qemu/uuid.h"
  #include "hw/acpi/acpi.h"
  #include "hw/acpi/aml-build.h"
  #include "hw/acpi/bios-linker-loader.h"
@@ -XXX,XX +XXX,XX @@
  #include "hw/mem/nvdimm.h"
  #include "qemu/nvdimm-utils.h"
 -#define NVDIMM_UUID_LE(a, b, c, d0, d1, d2, d3, d4, d5, d6, d7)             \
 -   { (a) & 0xff, ((a) >> 8) & 0xff, ((a) >> 16) & 0xff, ((a) >> 24) & 0xff, \
 -     (b) & 0xff, ((b) >> 8) & 0xff, (c) & 0xff, ((c) >> 8) & 0xff,          \
 -     (d0), (d1), (d2), (d3), (d4), (d5), (d6), (d7) }
 -
  /*
   * define Byte Addressable Persistent Memory (PM) Region according to
   * ACPI 6.0: 5.2.25.1 System Physical Address Range Structure.
   */
  static const uint8_t nvdimm_nfit_spa_uuid[] =
 -      NVDIMM_UUID_LE(0x66f0d379, 0xb4f3, 0x4074, 0xac, 0x43, 0x0d, 0x33,
 -                     0x18, 0xb7, 0x8c, 0xdb);
 +      UUID_LE(0x66f0d379, 0xb4f3, 0x4074, 0xac, 0x43, 0x0d, 0x33,
 +              0x18, 0xb7, 0x8c, 0xdb);
  /*
   * NVDIMM Firmware Interface Table
 --
-.20.1
+.25.1

-[PULL 23/45] ACPI: Build Hardware Error Source Table
+[PULL 30/31] hw/misc: Add PWRON STRAP bit fields in GCR module
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Hao Wu <wuhaotsh@google.com>
-This patch builds Hardware Error Source Table(HEST) via fw_cfg blobs.
+Similar to the Aspeed code in include/misc/aspeed_scu.h, we define
-Now it only supports ARMv8 SEA, a type of Generic Hardware Error
+the PWRON STRAP fields in their corresponding module for NPCM7XX.
 Source version 2(GHESv2) error source. Afterwards, we can extend
 the supported types if needed. For the CPER section, currently it
 is memory section because kernel mainly wants userspace to handle
 the memory errors.
-This patch follows the spec ACPI 6.2 to build the Hardware Error
+Signed-off-by: Hao Wu <wuhaotsh@google.com>
-Source table. For more detailed information, please refer to
+Reviewed-by: Patrick Venture <venture@google.com>
-document: docs/specs/acpi_hest_ghes.rst
+Message-id: 20220411165842.3912945-2-wuhaotsh@google.com
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 build_ghes_hw_error_notification() helper will help to add Hardware
 Error Notification to ACPI tables without using packed C structures
 and avoid endianness issues as API doesn't need explicit conversion.
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-6-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/ghes.h   |  39 ++++++++++++
+ include/hw/misc/npcm7xx_gcr.h | 30 ++++++++++++++++++++++++++++++
- hw/acpi/ghes.c           | 126 +++++++++++++++++++++++++++++++++++++++
+file changed, 30 insertions(+)
  hw/arm/virt-acpi-build.c |   2 +
 files changed, 167 insertions(+)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+diff --git a/include/hw/misc/npcm7xx_gcr.h b/include/hw/misc/npcm7xx_gcr.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/include/hw/misc/npcm7xx_gcr.h
-+++ b/include/hw/acpi/ghes.h
++++ b/include/hw/misc/npcm7xx_gcr.h
 @@ -XXX,XX +XXX,XX @@
+ #include "exec/memory.h"
- #include "hw/acpi/bios-linker-loader.h"
+ #include "hw/sysbus.h"
 +/*
-+ * Values for Hardware Error Notification Type field
++ * NPCM7XX PWRON STRAP bit fields
 + * 12: SPI0 powered by VSBV3 at 1.8V
 + * 11: System flash attached to BMC
 + * 10: BSP alternative pins.
 + * 9:8: Flash UART command route enabled.
 + * 7: Security enabled.
 + * 6: HI-Z state control.
 + * 5: ECC disabled.
 + * 4: Reserved
 + * 3: JTAG2 enabled.
 + * 2:0: CPU and DRAM clock frequency.
 + */
-+enum AcpiGhesNotifyType {
++#define NPCM7XX_PWRON_STRAP_SPI0F18                 BIT(12)
-+    /* Polled */
++#define NPCM7XX_PWRON_STRAP_SFAB                    BIT(11)
-+    ACPI_GHES_NOTIFY_POLLED = 0,
++#define NPCM7XX_PWRON_STRAP_BSPA                    BIT(10)
-+    /* External Interrupt */
++#define NPCM7XX_PWRON_STRAP_FUP(x)                  ((x) << 8)
-+    ACPI_GHES_NOTIFY_EXTERNAL = 1,
++#define     FUP_NORM_UART2      3
-+    /* Local Interrupt */
++#define     FUP_PROG_UART3      2
-+    ACPI_GHES_NOTIFY_LOCAL = 2,
++#define     FUP_PROG_UART2      1
-+    /* SCI */
++#define     FUP_NORM_UART3      0
-+    ACPI_GHES_NOTIFY_SCI = 3,
++#define NPCM7XX_PWRON_STRAP_SECEN                   BIT(7)
-+    /* NMI */
++#define NPCM7XX_PWRON_STRAP_HIZ                     BIT(6)
-+    ACPI_GHES_NOTIFY_NMI = 4,
++#define NPCM7XX_PWRON_STRAP_ECC                     BIT(5)
-+    /* CMCI, ACPI 5.0: 18.3.2.7, Table 18-290 */
++#define NPCM7XX_PWRON_STRAP_RESERVE1                BIT(4)
-+    ACPI_GHES_NOTIFY_CMCI = 5,
++#define NPCM7XX_PWRON_STRAP_J2EN                    BIT(3)
-+    /* MCE, ACPI 5.0: 18.3.2.7, Table 18-290 */
++#define NPCM7XX_PWRON_STRAP_CKFRQ(x)                (x)
-+    ACPI_GHES_NOTIFY_MCE = 6,
++#define     CKFRQ_SKIPINIT      0x000
-+    /* GPIO-Signal, ACPI 6.0: 18.3.2.7, Table 18-332 */
++#define     CKFRQ_DEFAULT       0x111
 +    ACPI_GHES_NOTIFY_GPIO = 7,
 +    /* ARMv8 SEA, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_SEA = 8,
 +    /* ARMv8 SEI, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_SEI = 9,
 +    /* External Interrupt - GSIV, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_GSIV = 10,
 +    /* Software Delegated Exception, ACPI 6.2: 18.3.2.9, Table 18-383 */
 +    ACPI_GHES_NOTIFY_SDEI = 11,
 +    /* 12 and greater are reserved */
 +    ACPI_GHES_NOTIFY_RESERVED = 12
 +};
 +
 +enum {
 +    ACPI_HEST_SRC_ID_SEA = 0,
 +    /* future ids go here */
 +    ACPI_HEST_SRC_ID_RESERVED,
 +};
 +
  void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
 +void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
  #endif
 diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/ghes.c
 +++ b/hw/acpi/ghes.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/units.h"
  #include "hw/acpi/ghes.h"
  #include "hw/acpi/aml-build.h"
 +#include "qemu/error-report.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@
  /* Now only support ARMv8 SEA notification type error source */
  #define ACPI_GHES_ERROR_SOURCE_COUNT        1
 +/* Generic Hardware Error Source version 2 */
 +#define ACPI_GHES_SOURCE_GENERIC_ERROR_V2   10
 +
 +/* Address offset in Generic Address Structure(GAS) */
 +#define GAS_ADDR_OFFSET 4
 +
 +/*
 + * Hardware Error Notification
 + * ACPI 4.0: 17.3.2.7 Hardware Error Notification
 + * Composes dummy Hardware Error Notification descriptor of specified type
 + */
 +static void build_ghes_hw_error_notification(GArray *table, const uint8_t type)
 +{
 +    /* Type */
 +    build_append_int_noprefix(table, type, 1);
 +    /*
 +     * Length:
 +     * Total length of the structure in bytes
 +     */
 +    build_append_int_noprefix(table, 28, 1);
 +    /* Configuration Write Enable */
 +    build_append_int_noprefix(table, 0, 2);
 +    /* Poll Interval */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Vector */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Switch To Polling Threshold Value */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Switch To Polling Threshold Window */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Error Threshold Value */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Error Threshold Window */
 +    build_append_int_noprefix(table, 0, 4);
 +}
 +
  /*
-  * Build table for the hardware error fw_cfg blob.
+  * Number of registers in our device state structure. Don't change this without
-  * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
+  * incrementing the version_id in the vmstate.
@@ -XXX,XX +XXX,XX @@ void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker)
      bios_linker_loader_write_pointer(linker, ACPI_GHES_DATA_ADDR_FW_CFG_FILE,
 , sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE, 0);
  }
 +
 +/* Build Generic Hardware Error Source version 2 (GHESv2) */
 +static void build_ghes_v2(GArray *table_data, int source_id, BIOSLinker *linker)
 +{
 +    uint64_t address_offset;
 +    /*
 +     * Type:
 +     * Generic Hardware Error Source version 2(GHESv2 - Type 10)
 +     */
 +    build_append_int_noprefix(table_data, ACPI_GHES_SOURCE_GENERIC_ERROR_V2, 2);
 +    /* Source Id */
 +    build_append_int_noprefix(table_data, source_id, 2);
 +    /* Related Source Id */
 +    build_append_int_noprefix(table_data, 0xffff, 2);
 +    /* Flags */
 +    build_append_int_noprefix(table_data, 0, 1);
 +    /* Enabled */
 +    build_append_int_noprefix(table_data, 1, 1);
 +
 +    /* Number of Records To Pre-allocate */
 +    build_append_int_noprefix(table_data, 1, 4);
 +    /* Max Sections Per Record */
 +    build_append_int_noprefix(table_data, 1, 4);
 +    /* Max Raw Data Length */
 +    build_append_int_noprefix(table_data, ACPI_GHES_MAX_RAW_DATA_LENGTH, 4);
 +
 +    address_offset = table_data->len;
 +    /* Error Status Address */
 +    build_append_gas(table_data, AML_AS_SYSTEM_MEMORY, 0x40, 0,
 +                     4 /* QWord access */, 0);
 +    bios_linker_loader_add_pointer(linker, ACPI_BUILD_TABLE_FILE,
 +        address_offset + GAS_ADDR_OFFSET, sizeof(uint64_t),
 +        ACPI_GHES_ERRORS_FW_CFG_FILE, source_id * sizeof(uint64_t));
 +
 +    switch (source_id) {
 +    case ACPI_HEST_SRC_ID_SEA:
 +        /*
 +         * Notification Structure
 +         * Now only enable ARMv8 SEA notification type
 +         */
 +        build_ghes_hw_error_notification(table_data, ACPI_GHES_NOTIFY_SEA);
 +        break;
 +    default:
 +        error_report("Not support this error source");
 +        abort();
 +    }
 +
 +    /* Error Status Block Length */
 +    build_append_int_noprefix(table_data, ACPI_GHES_MAX_RAW_DATA_LENGTH, 4);
 +
 +    /*
 +     * Read Ack Register
 +     * ACPI 6.1: 18.3.2.8 Generic Hardware Error Source
 +     * version 2 (GHESv2 - Type 10)
 +     */
 +    address_offset = table_data->len;
 +    build_append_gas(table_data, AML_AS_SYSTEM_MEMORY, 0x40, 0,
 +                     4 /* QWord access */, 0);
 +    bios_linker_loader_add_pointer(linker, ACPI_BUILD_TABLE_FILE,
 +        address_offset + GAS_ADDR_OFFSET,
 +        sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE,
 +        (ACPI_GHES_ERROR_SOURCE_COUNT + source_id) * sizeof(uint64_t));
 +
 +    /*
 +     * Read Ack Preserve field
 +     * We only provide the first bit in Read Ack Register to OSPM to write
 +     * while the other bits are preserved.
 +     */
 +    build_append_int_noprefix(table_data, ~0x1ULL, 8);
 +    /* Read Ack Write */
 +    build_append_int_noprefix(table_data, 0x1, 8);
 +}
 +
 +/* Build Hardware Error Source Table */
 +void acpi_build_hest(GArray *table_data, BIOSLinker *linker)
 +{
 +    uint64_t hest_start = table_data->len;
 +
 +    /* Hardware Error Source Table header*/
 +    acpi_data_push(table_data, sizeof(AcpiTableHeader));
 +
 +    /* Error Source Count */
 +    build_append_int_noprefix(table_data, ACPI_GHES_ERROR_SOURCE_COUNT, 4);
 +
 +    build_ghes_v2(table_data, ACPI_HEST_SRC_ID_SEA, linker);
 +
 +    build_header(linker, table_data, (void *)(table_data->data + hest_start),
 +        "HEST", table_data->len - hest_start, 1, NULL, NULL);
 +}
 diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt-acpi-build.c
 +++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
      if (vms->ras) {
          build_ghes_error_table(tables->hardware_errors, tables->linker);
 +        acpi_add_table(table_offsets, tables_blob);
 +        acpi_build_hest(tables_blob, tables->linker);
      }
      if (ms->numa_state->num_nodes > 0) {
 --
-.20.1
+.25.1

-[PULL 12/45] target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
+[PULL 31/31] hw/arm: Use bit fields for NPCM7XX PWRON STRAPs
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Hao Wu <wuhaotsh@google.com>
-These operations do not touch fp_status.
+This patch uses the defined fields to describe PWRON STRAPs for
 better readability.
+Signed-off-by: Hao Wu <wuhaotsh@google.com>
+Reviewed-by: Patrick Venture <venture@google.com>
+Message-id: 20220411165842.3912945-3-wuhaotsh@google.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-12-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  4 ++--
+ hw/arm/npcm7xx_boards.c | 24 +++++++++++++++++++-----
- target/arm/translate-a64.c |  5 ++---
+file changed, 19 insertions(+), 5 deletions(-)
  target/arm/translate.c     | 12 ++----------
  target/arm/vfp_helper.c    |  5 ++---
 files changed, 8 insertions(+), 18 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/npcm7xx_boards.c b/hw/arm/npcm7xx_boards.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/npcm7xx_boards.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/npcm7xx_boards.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_2(rsqrte_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+ #include "sysemu/sysemu.h"
- DEF_HELPER_FLAGS_2(rsqrte_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+ #include "sysemu/block-backend.h"
- DEF_HELPER_FLAGS_2(rsqrte_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
--DEF_HELPER_2(recpe_u32, i32, i32, ptr)
+-#define NPCM750_EVB_POWER_ON_STRAPS 0x00001ff7
--DEF_HELPER_FLAGS_2(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32, ptr)
+-#define QUANTA_GSJ_POWER_ON_STRAPS 0x00001fff
-+DEF_HELPER_FLAGS_1(recpe_u32, TCG_CALL_NO_RWG, i32, i32)
+-#define QUANTA_GBS_POWER_ON_STRAPS 0x000017ff
-+DEF_HELPER_FLAGS_1(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32)
+-#define KUDO_BMC_POWER_ON_STRAPS 0x00001fff
- DEF_HELPER_FLAGS_4(neon_tbl, TCG_CALL_NO_RWG, i32, i32, i32, ptr, i32)
+-#define MORI_BMC_POWER_ON_STRAPS 0x00001fff
++#define NPCM7XX_POWER_ON_STRAPS_DEFAULT (           \
- DEF_HELPER_3(shl_cc, i32, env, i32, i32)
++        NPCM7XX_PWRON_STRAP_SPI0F18 |               \
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
++        NPCM7XX_PWRON_STRAP_SFAB |                  \
-index XXXXXXX..XXXXXXX 100644
++        NPCM7XX_PWRON_STRAP_BSPA |                  \
---- a/target/arm/translate-a64.c
++        NPCM7XX_PWRON_STRAP_FUP(FUP_NORM_UART2) |   \
-+++ b/target/arm/translate-a64.c
++        NPCM7XX_PWRON_STRAP_SECEN |                 \
-@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
++        NPCM7XX_PWRON_STRAP_HIZ |                   \
++        NPCM7XX_PWRON_STRAP_ECC |                   \
-             switch (opcode) {
++        NPCM7XX_PWRON_STRAP_RESERVE1 |              \
-             case 0x3c: /* URECPE */
++        NPCM7XX_PWRON_STRAP_J2EN |                  \
--                gen_helper_recpe_u32(tcg_res, tcg_op, fpst);
++        NPCM7XX_PWRON_STRAP_CKFRQ(CKFRQ_DEFAULT))
-+                gen_helper_recpe_u32(tcg_res, tcg_op);
++
-                 break;
++#define NPCM750_EVB_POWER_ON_STRAPS ( \
-             case 0x3d: /* FRECPE */
++        NPCM7XX_POWER_ON_STRAPS_DEFAULT & ~NPCM7XX_PWRON_STRAP_J2EN)
-                 gen_helper_recpe_f32(tcg_res, tcg_op, fpst);
++#define QUANTA_GSJ_POWER_ON_STRAPS NPCM7XX_POWER_ON_STRAPS_DEFAULT
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
++#define QUANTA_GBS_POWER_ON_STRAPS ( \
-                 unallocated_encoding(s);
++        NPCM7XX_POWER_ON_STRAPS_DEFAULT & ~NPCM7XX_PWRON_STRAP_SFAB)
-                 return;
++#define KUDO_BMC_POWER_ON_STRAPS NPCM7XX_POWER_ON_STRAPS_DEFAULT
-             }
++#define MORI_BMC_POWER_ON_STRAPS NPCM7XX_POWER_ON_STRAPS_DEFAULT
--            need_fpstatus = true;
-             break;
+ static const char npcm7xx_default_bootrom[] = "npcm7xx_bootrom.bin";
          case 0x1e: /* FRINT32Z */
          case 0x1f: /* FRINT64Z */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                      gen_helper_rints_exact(tcg_res, tcg_op, tcg_fpstatus);
                      break;
                  case 0x7c: /* URSQRTE */
 -                    gen_helper_rsqrte_u32(tcg_res, tcg_op, tcg_fpstatus);
 +                    gen_helper_rsqrte_u32(tcg_res, tcg_op);
                      break;
                  case 0x1e: /* FRINT32Z */
                  case 0x5e: /* FRINT32X */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                              break;
                          }
                          case NEON_2RM_VRECPE:
 -                        {
 -                            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                            gen_helper_recpe_u32(tmp, tmp, fpstatus);
 -                            tcg_temp_free_ptr(fpstatus);
 +                            gen_helper_recpe_u32(tmp, tmp);
                              break;
 -                        }
                          case NEON_2RM_VRSQRTE:
 -                        {
 -                            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                            gen_helper_rsqrte_u32(tmp, tmp, fpstatus);
 -                            tcg_temp_free_ptr(fpstatus);
 +                            gen_helper_rsqrte_u32(tmp, tmp);
                              break;
 -                        }
                          case NEON_2RM_VRECPE_F:
                          {
                              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrte_f64)(float64 input, void *fpstp)
      return make_float64(val);
  }
 -uint32_t HELPER(recpe_u32)(uint32_t a, void *fpstp)
 +uint32_t HELPER(recpe_u32)(uint32_t a)
  {
 -    /* float_status *s = fpstp; */
      int input, estimate;
      if ((a & 0x80000000) == 0) {
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(recpe_u32)(uint32_t a, void *fpstp)
      return deposit32(0, (32 - 9), 9, estimate);
  }
 -uint32_t HELPER(rsqrte_u32)(uint32_t a, void *fpstp)
 +uint32_t HELPER(rsqrte_u32)(uint32_t a)
  {
      int estimate;
 --
-.20.1
+.25.1

-[PULL 13/45] target/arm: Create gen_gvec_{qrdmla,qrdmls}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-13-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h     |  5 ++++
- target/arm/translate-a64.c | 34 ++----------------------
- target/arm/translate.c     | 54 +++++++++++++++++++-------------------
-files changed, 34 insertions(+), 59 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
- void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
-                        is_q ? 16 : 8, vec_full_reg_size(s), data, fn);
- }
--/* Expand a 3-operand + env pointer operation using
-- * an out-of-line helper.
-- */
--static void gen_gvec_op3_env(DisasContext *s, bool is_q, int rd,
--                             int rn, int rm, gen_helper_gvec_3_ptr *fn)
--{
--    tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm), cpu_env,
--                       is_q ? 16 : 8, vec_full_reg_size(s), 0, fn);
--}
--
- /* Expand a 3-operand + fpstatus pointer + simd data value operation using
-  * an out-of-line helper.
-  */
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
-     switch (opcode) {
-     case 0x0: /* SQRDMLAH (vector) */
--        switch (size) {
--        case 1:
--            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlah_s16);
--            break;
--        case 2:
--            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlah_s32);
--            break;
--        default:
--            g_assert_not_reached();
--        }
-+        gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqrdmlah_qc, size);
-         return;
-     case 0x1: /* SQRDMLSH (vector) */
--        switch (size) {
--        case 1:
--            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlsh_s16);
--            break;
--        case 2:
--            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlsh_s32);
--            break;
--        default:
--            g_assert_not_reached();
--        }
-+        gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqrdmlsh_qc, size);
-         return;
-     case 0x2: /* SDOT / UDOT */
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static const uint8_t neon_2rm_sizes[] = {
-     [NEON_2RM_VCVT_UF] = 0x4,
- };
--
--/* Expand v8.1 simd helper.  */
--static int do_v81_helper(DisasContext *s, gen_helper_gvec_3_ptr *fn,
--                         int q, int rd, int rn, int rm)
-+void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
- {
--    if (dc_isar_feature(aa32_rdm, s)) {
--        int opr_sz = (1 + q) * 8;
--        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
--                           vfp_reg_offset(1, rn),
--                           vfp_reg_offset(1, rm), cpu_env,
--                           opr_sz, opr_sz, 0, fn);
--        return 0;
--    }
--    return 1;
-+    static gen_helper_gvec_3_ptr * const fns[2] = {
-+        gen_helper_gvec_qrdmlah_s16, gen_helper_gvec_qrdmlah_s32
-+    };
-+    tcg_debug_assert(vece >= 1 && vece <= 2);
-+    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
-+                       opr_sz, max_sz, 0, fns[vece - 1]);
-+}
-+
-+void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static gen_helper_gvec_3_ptr * const fns[2] = {
-+        gen_helper_gvec_qrdmlsh_s16, gen_helper_gvec_qrdmlsh_s32
-+    };
-+    tcg_debug_assert(vece >= 1 && vece <= 2);
-+    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
-+                       opr_sz, max_sz, 0, fns[vece - 1]);
- }
- #define GEN_CMP0(NAME, COND)                                            \
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 break;  /* VPADD */
-             }
-             /* VQRDMLAH */
--            switch (size) {
--            case 1:
--                return do_v81_helper(s, gen_helper_gvec_qrdmlah_s16,
--                                     q, rd, rn, rm);
--            case 2:
--                return do_v81_helper(s, gen_helper_gvec_qrdmlah_s32,
--                                     q, rd, rn, rm);
-+            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
-+                gen_gvec_sqrdmlah_qc(size, rd_ofs, rn_ofs, rm_ofs,
-+                                     vec_size, vec_size);
-+                return 0;
-             }
-             return 1;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 break;
-             }
-             /* VQRDMLSH */
--            switch (size) {
--            case 1:
--                return do_v81_helper(s, gen_helper_gvec_qrdmlsh_s16,
--                                     q, rd, rn, rm);
--            case 2:
--                return do_v81_helper(s, gen_helper_gvec_qrdmlsh_s32,
--                                     q, rd, rn, rm);
-+            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
-+                gen_gvec_sqrdmlsh_qc(size, rd_ofs, rn_ofs, rm_ofs,
-+                                     vec_size, vec_size);
-+                return 0;
-             }
-             return 1;
---
-.20.1

-[PULL 15/45] target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Must clear the tail for AdvSIMD when SVE is enabled.
-Fixes: ca40a6e6e39
-Cc: qemu-stable@nongnu.org
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-15-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/vec_helper.c | 2 ++
-file changed, 2 insertions(+)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
-             d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
-         }                                                                  \
-     }                                                                      \
-+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
- }
- DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
-                                      mm, a[i + j], 0, stat);               \
-         }                                                                  \
-     }                                                                      \
-+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
- }
- DO_FMLA_IDX(gvec_fmla_idx_h, float16, H2)
---
-.20.1

-[PULL 16/45] target/arm: Vectorize SABD/UABD
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Include 64-bit element size in preparation for SVE2.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-16-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  10 +++
- target/arm/translate.h     |   5 ++
- target/arm/translate-a64.c |   8 ++-
- target/arm/translate.c     | 133 ++++++++++++++++++++++++++++++++++++-
- target/arm/vec_helper.c    |  24 +++++++
-files changed, 176 insertions(+), 4 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_sli_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
- DEF_HELPER_FLAGS_3(gvec_sli_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
- DEF_HELPER_FLAGS_3(gvec_sli_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(gvec_uabd_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
- #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                           uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_smin, size);
-         }
-         return;
-+    case 0xe: /* SABD, UABD */
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uabd, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sabd, size);
-+        }
-+        return;
-     case 0x10: /* ADD, SUB */
-         if (u) {
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_sub, size);
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-                 genenvfn = fns[size][u];
-                 break;
-             }
--            case 0xe: /* SABD, UABD */
-             case 0xf: /* SABA, UABA */
-             {
-                 static NeonGenTwoOpFn * const fns[3][2] = {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                    rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
- }
-+static void gen_sabd_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
-+{
-+    TCGv_i32 t = tcg_temp_new_i32();
-+
-+    tcg_gen_sub_i32(t, a, b);
-+    tcg_gen_sub_i32(d, b, a);
-+    tcg_gen_movcond_i32(TCG_COND_LT, d, a, b, d, t);
-+    tcg_temp_free_i32(t);
-+}
-+
-+static void gen_sabd_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
-+
-+    tcg_gen_sub_i64(t, a, b);
-+    tcg_gen_sub_i64(d, b, a);
-+    tcg_gen_movcond_i64(TCG_COND_LT, d, a, b, d, t);
-+    tcg_temp_free_i64(t);
-+}
-+
-+static void gen_sabd_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-+{
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+
-+    tcg_gen_smin_vec(vece, t, a, b);
-+    tcg_gen_smax_vec(vece, d, a, b);
-+    tcg_gen_sub_vec(vece, d, d, t);
-+    tcg_temp_free_vec(t);
-+}
-+
-+void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sub_vec, INDEX_op_smin_vec, INDEX_op_smax_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_sabd_i32,
-+          .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_s,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_sabd_i64,
-+          .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
-+
-+static void gen_uabd_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
-+{
-+    TCGv_i32 t = tcg_temp_new_i32();
-+
-+    tcg_gen_sub_i32(t, a, b);
-+    tcg_gen_sub_i32(d, b, a);
-+    tcg_gen_movcond_i32(TCG_COND_LTU, d, a, b, d, t);
-+    tcg_temp_free_i32(t);
-+}
-+
-+static void gen_uabd_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
-+
-+    tcg_gen_sub_i64(t, a, b);
-+    tcg_gen_sub_i64(d, b, a);
-+    tcg_gen_movcond_i64(TCG_COND_LTU, d, a, b, d, t);
-+    tcg_temp_free_i64(t);
-+}
-+
-+static void gen_uabd_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-+{
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+
-+    tcg_gen_umin_vec(vece, t, a, b);
-+    tcg_gen_umax_vec(vece, d, a, b);
-+    tcg_gen_sub_vec(vece, d, d, t);
-+    tcg_temp_free_vec(t);
-+}
-+
-+void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sub_vec, INDEX_op_umin_vec, INDEX_op_umax_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_uabd_i32,
-+          .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_s,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_uabd_i64,
-+          .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
-+
- /* Translate a NEON data processing instruction.  Return nonzero if the
-    instruction is invalid.
-    We process data in a mixture of 32-bit and 64-bit chunks.
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             }
-             return 1;
-+        case NEON_3R_VABD:
-+            if (u) {
-+                gen_gvec_uabd(size, rd_ofs, rn_ofs, rm_ofs,
-+                              vec_size, vec_size);
-+            } else {
-+                gen_gvec_sabd(size, rd_ofs, rn_ofs, rm_ofs,
-+                              vec_size, vec_size);
-+            }
-+            return 0;
-+
-         case NEON_3R_VADD_VSUB:
-         case NEON_3R_LOGIC:
-         case NEON_3R_VMAX:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VQRSHL:
-             GEN_NEON_INTEGER_OP_ENV(qrshl);
-             break;
--        case NEON_3R_VABD:
--            GEN_NEON_INTEGER_OP(abd);
--            break;
-         case NEON_3R_VABA:
-             GEN_NEON_INTEGER_OP(abd);
-             tcg_temp_free_i32(tmp2);
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_CMP0(gvec_cgt0_h, int16_t, >)
- DO_CMP0(gvec_cge0_h, int16_t, >=)
- #undef DO_CMP0
-+
-+#define DO_ABD(NAME, TYPE)                                      \
-+void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc)  \
-+{                                                               \
-+    intptr_t i, opr_sz = simd_oprsz(desc);                      \
-+    TYPE *d = vd, *n = vn, *m = vm;                             \
-+                                                                \
-+    for (i = 0; i < opr_sz / sizeof(TYPE); ++i) {               \
-+        d[i] = n[i] < m[i] ? m[i] - n[i] : n[i] - m[i];         \
-+    }                                                           \
-+    clear_tail(d, opr_sz, simd_maxsz(desc));                    \
-+}
-+
-+DO_ABD(gvec_sabd_b, int8_t)
-+DO_ABD(gvec_sabd_h, int16_t)
-+DO_ABD(gvec_sabd_s, int32_t)
-+DO_ABD(gvec_sabd_d, int64_t)
-+
-+DO_ABD(gvec_uabd_b, uint8_t)
-+DO_ABD(gvec_uabd_h, uint16_t)
-+DO_ABD(gvec_uabd_s, uint32_t)
-+DO_ABD(gvec_uabd_d, uint64_t)
-+
-+#undef DO_ABD
---
-.20.1

-[PULL 29/45] target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
+Deleted patch
-Convert the Neon VQRDMLAH and VQRDMLSH insns in the 3-reg-same group
-to decodetree.  These don't use do_3same() because they want to
-operate on VFP double registers, whose offsets are different from the
-neon_reg_offset() calculations do_3same does.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-2-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  3 +++
- target/arm/translate-neon.inc.c | 15 +++++++++++++++
- target/arm/translate.c          | 14 ++------------
-files changed, 20 insertions(+), 12 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VMLS_3s          1111 001 1 0 . .. .... .... 1001 . . . 0 .... @3same
- VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
-+
-+VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
-+VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-     }
-     return do_3same(s, a, gen_VMUL_p_3s);
- }
-+
-+#define DO_VQRDMLAH(INSN, FUNC)                                         \
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
-+    {                                                                   \
-+        if (!dc_isar_feature(aa32_rdm, s)) {                            \
-+            return false;                                               \
-+        }                                                               \
-+        if (a->size != 1 && a->size != 2) {                             \
-+            return false;                                               \
-+        }                                                               \
-+        return do_3same(s, a, FUNC);                                    \
-+    }
-+
-+DO_VQRDMLAH(VQRDMLAH, gen_gvec_sqrdmlah_qc)
-+DO_VQRDMLAH(VQRDMLSH, gen_gvec_sqrdmlsh_qc)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             if (!u) {
-                 break;  /* VPADD */
-             }
--            /* VQRDMLAH */
--            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
--                gen_gvec_sqrdmlah_qc(size, rd_ofs, rn_ofs, rm_ofs,
--                                     vec_size, vec_size);
--                return 0;
--            }
-+            /* VQRDMLAH : handled by decodetree */
-             return 1;
-         case NEON_3R_VFM_VQRDMLSH:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 }
-                 break;
-             }
--            /* VQRDMLSH */
--            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
--                gen_gvec_sqrdmlsh_qc(size, rd_ofs, rn_ofs, rm_ofs,
--                                     vec_size, vec_size);
--                return 0;
--            }
-+            /* VQRDMLSH : handled by decodetree */
-             return 1;
-         case NEON_3R_VABD:
---
-.20.1

-[PULL 30/45] target/arm: Convert Neon 3-reg-same SHA to decodetree
+Deleted patch
-Convert the Neon SHA instructions in the 3-reg-same group
-to decodetree.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-3-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       |  10 +++
- target/arm/translate-neon.inc.c | 139 ++++++++++++++++++++++++++++++++
- target/arm/translate.c          |  46 +----------
-files changed, 151 insertions(+), 44 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
-+
-+SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+SHA256H_3s       1111 001 1 0 . 00 .... .... 1100 . 1 . 0 .... \
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+SHA256H2_3s      1111 001 1 0 . 01 .... .... 1100 . 1 . 0 .... \
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+
- VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
- DO_VQRDMLAH(VQRDMLAH, gen_gvec_sqrdmlah_qc)
- DO_VQRDMLAH(VQRDMLSH, gen_gvec_sqrdmlsh_qc)
-+
-+static bool trans_SHA1_3s(DisasContext *s, arg_SHA1_3s *a)
-+{
-+    TCGv_ptr ptr1, ptr2, ptr3;
-+    TCGv_i32 tmp;
-+
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
-+        !dc_isar_feature(aa32_sha1, s)) {
-+        return false;
-+    }
-+
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
-+        return false;
-+    }
-+
-+    if ((a->vn | a->vm | a->vd) & 1) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    ptr1 = vfp_reg_ptr(true, a->vd);
-+    ptr2 = vfp_reg_ptr(true, a->vn);
-+    ptr3 = vfp_reg_ptr(true, a->vm);
-+    tmp = tcg_const_i32(a->optype);
-+    gen_helper_crypto_sha1_3reg(ptr1, ptr2, ptr3, tmp);
-+    tcg_temp_free_i32(tmp);
-+    tcg_temp_free_ptr(ptr1);
-+    tcg_temp_free_ptr(ptr2);
-+    tcg_temp_free_ptr(ptr3);
-+
-+    return true;
-+}
-+
-+static bool trans_SHA256H_3s(DisasContext *s, arg_SHA256H_3s *a)
-+{
-+    TCGv_ptr ptr1, ptr2, ptr3;
-+
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
-+        !dc_isar_feature(aa32_sha2, s)) {
-+        return false;
-+    }
-+
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
-+        return false;
-+    }
-+
-+    if ((a->vn | a->vm | a->vd) & 1) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    ptr1 = vfp_reg_ptr(true, a->vd);
-+    ptr2 = vfp_reg_ptr(true, a->vn);
-+    ptr3 = vfp_reg_ptr(true, a->vm);
-+    gen_helper_crypto_sha256h(ptr1, ptr2, ptr3);
-+    tcg_temp_free_ptr(ptr1);
-+    tcg_temp_free_ptr(ptr2);
-+    tcg_temp_free_ptr(ptr3);
-+
-+    return true;
-+}
-+
-+static bool trans_SHA256H2_3s(DisasContext *s, arg_SHA256H2_3s *a)
-+{
-+    TCGv_ptr ptr1, ptr2, ptr3;
-+
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
-+        !dc_isar_feature(aa32_sha2, s)) {
-+        return false;
-+    }
-+
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
-+        return false;
-+    }
-+
-+    if ((a->vn | a->vm | a->vd) & 1) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    ptr1 = vfp_reg_ptr(true, a->vd);
-+    ptr2 = vfp_reg_ptr(true, a->vn);
-+    ptr3 = vfp_reg_ptr(true, a->vm);
-+    gen_helper_crypto_sha256h2(ptr1, ptr2, ptr3);
-+    tcg_temp_free_ptr(ptr1);
-+    tcg_temp_free_ptr(ptr2);
-+    tcg_temp_free_ptr(ptr3);
-+
-+    return true;
-+}
-+
-+static bool trans_SHA256SU1_3s(DisasContext *s, arg_SHA256SU1_3s *a)
-+{
-+    TCGv_ptr ptr1, ptr2, ptr3;
-+
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
-+        !dc_isar_feature(aa32_sha2, s)) {
-+        return false;
-+    }
-+
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
-+        return false;
-+    }
-+
-+    if ((a->vn | a->vm | a->vd) & 1) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    ptr1 = vfp_reg_ptr(true, a->vd);
-+    ptr2 = vfp_reg_ptr(true, a->vn);
-+    ptr3 = vfp_reg_ptr(true, a->vm);
-+    gen_helper_crypto_sha256su1(ptr1, ptr2, ptr3);
-+    tcg_temp_free_ptr(ptr1);
-+    tcg_temp_free_ptr(ptr2);
-+    tcg_temp_free_ptr(ptr3);
-+
-+    return true;
-+}
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-     int vec_size;
-     uint32_t imm;
-     TCGv_i32 tmp, tmp2, tmp3, tmp4, tmp5;
--    TCGv_ptr ptr1, ptr2, ptr3;
-+    TCGv_ptr ptr1, ptr2;
-     TCGv_i64 tmp64;
-     if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             return 1;
-         }
-         switch (op) {
--        case NEON_3R_SHA:
--            /* The SHA-1/SHA-256 3-register instructions require special
--             * treatment here, as their size field is overloaded as an
--             * op type selector, and they all consume their input in a
--             * single pass.
--             */
--            if (!q) {
--                return 1;
--            }
--            if (!u) { /* SHA-1 */
--                if (!dc_isar_feature(aa32_sha1, s)) {
--                    return 1;
--                }
--                ptr1 = vfp_reg_ptr(true, rd);
--                ptr2 = vfp_reg_ptr(true, rn);
--                ptr3 = vfp_reg_ptr(true, rm);
--                tmp4 = tcg_const_i32(size);
--                gen_helper_crypto_sha1_3reg(ptr1, ptr2, ptr3, tmp4);
--                tcg_temp_free_i32(tmp4);
--            } else { /* SHA-256 */
--                if (!dc_isar_feature(aa32_sha2, s) || size == 3) {
--                    return 1;
--                }
--                ptr1 = vfp_reg_ptr(true, rd);
--                ptr2 = vfp_reg_ptr(true, rn);
--                ptr3 = vfp_reg_ptr(true, rm);
--                switch (size) {
--                case 0:
--                    gen_helper_crypto_sha256h(ptr1, ptr2, ptr3);
--                    break;
--                case 1:
--                    gen_helper_crypto_sha256h2(ptr1, ptr2, ptr3);
--                    break;
--                case 2:
--                    gen_helper_crypto_sha256su1(ptr1, ptr2, ptr3);
--                    break;
--                }
--            }
--            tcg_temp_free_ptr(ptr1);
--            tcg_temp_free_ptr(ptr2);
--            tcg_temp_free_ptr(ptr3);
--            return 0;
--
-         case NEON_3R_VPADD_VQRDMLAH:
-             if (!u) {
-                 break;  /* VPADD */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VMUL:
-         case NEON_3R_VML:
-         case NEON_3R_VSHL:
-+        case NEON_3R_SHA:
-             /* Already handled by decodetree */
-             return 1;
-         }
---
-.20.1

-[PULL 31/45] target/arm: Convert Neon 64-bit element 3-reg-same insns
+Deleted patch
-Convert the 64-bit element insns in the 3-reg-same group
-to decodetree. This covers VQSHL, VRSHL and VQRSHL where
-size==0b11.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-4-peter.maydell@linaro.org
----
- target/arm/neon-dp.decode       | 13 +++++++++++
- target/arm/translate-neon.inc.c | 24 +++++++++++++++++++++
- target/arm/translate.c          | 38 ++-------------------------------
-files changed, 39 insertions(+), 36 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VCGE_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 1 .... @3same
- VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same_rev
- VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
-+# Insns operating on 64-bit elements (size!=0b11 handled elsewhere)
-+# The _rev suffix indicates that Vn and Vm are reversed (as explained
-+# by the comment for the @3same_rev format).
-+@3same_64_rev    .... ... . . . 11 .... .... .... . q:1 . . .... \
-+                 &3same vm=%vn_dp vn=%vm_dp vd=%vd_dp size=3
-+
-+VQSHL_S64_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
-+VQSHL_U64_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
-+VRSHL_S64_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
-+VRSHL_U64_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
-+VQRSHL_S64_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
-+VQRSHL_U64_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
-+
- VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
- VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
- VMIN_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 1 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_SHA256SU1_3s(DisasContext *s, arg_SHA256SU1_3s *a)
-     return true;
- }
-+
-+#define DO_3SAME_64(INSN, FUNC)                                         \
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
-+                                uint32_t oprsz, uint32_t maxsz)         \
-+    {                                                                   \
-+        static const GVecGen3 op = { .fni8 = FUNC };                    \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &op);      \
-+    }                                                                   \
-+    DO_3SAME(INSN, gen_##INSN##_3s)
-+
-+#define DO_3SAME_64_ENV(INSN, FUNC)                                     \
-+    static void gen_##INSN##_elt(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m)    \
-+    {                                                                   \
-+        FUNC(d, cpu_env, n, m);                                         \
-+    }                                                                   \
-+    DO_3SAME_64(INSN, gen_##INSN##_elt)
-+
-+DO_3SAME_64(VRSHL_S64, gen_helper_neon_rshl_s64)
-+DO_3SAME_64(VRSHL_U64, gen_helper_neon_rshl_u64)
-+DO_3SAME_64_ENV(VQSHL_S64, gen_helper_neon_qshl_s64)
-+DO_3SAME_64_ENV(VQSHL_U64, gen_helper_neon_qshl_u64)
-+DO_3SAME_64_ENV(VQRSHL_S64, gen_helper_neon_qrshl_s64)
-+DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         }
-         if (size == 3) {
--            /* 64-bit element instructions. */
--            for (pass = 0; pass < (q ? 2 : 1); pass++) {
--                neon_load_reg64(cpu_V0, rn + pass);
--                neon_load_reg64(cpu_V1, rm + pass);
--                switch (op) {
--                case NEON_3R_VQSHL:
--                    if (u) {
--                        gen_helper_neon_qshl_u64(cpu_V0, cpu_env,
--                                                 cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_qshl_s64(cpu_V0, cpu_env,
--                                                 cpu_V1, cpu_V0);
--                    }
--                    break;
--                case NEON_3R_VRSHL:
--                    if (u) {
--                        gen_helper_neon_rshl_u64(cpu_V0, cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_rshl_s64(cpu_V0, cpu_V1, cpu_V0);
--                    }
--                    break;
--                case NEON_3R_VQRSHL:
--                    if (u) {
--                        gen_helper_neon_qrshl_u64(cpu_V0, cpu_env,
--                                                  cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_qrshl_s64(cpu_V0, cpu_env,
--                                                  cpu_V1, cpu_V0);
--                    }
--                    break;
--                default:
--                    abort();
--                }
--                neon_store_reg64(cpu_V0, rd + pass);
--            }
--            return 0;
-+            /* 64-bit element instructions: handled by decodetree */
-+            return 1;
-         }
-         pairwise = 0;
-         switch (op) {
---
-.20.1

Mostly this is patches from me and RTH cleaning up and doing
more decodetree conversion for AArch32 Neon. The major new feature
is Dongjiu Geng's patchset to report host memory errors to KVM guests;
also a new aspeed board from Patrick Williams.

thanks
-- PMM

The following changes since commit 035b448b84f3557206abc44d786c5d3db2638f7d:

Merge remote-tracking branch 'remotes/gkurz/tags/9p-next-2020-05-14' into staging (2020-05-14 10:58:30 +0100)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200514

for you to fetch changes up to e95485f85657be21135c17a9226e297c21e73360:

target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree (2020-05-14 15:03:09 +0100)

----------------------------------------------------------------
target-arm queue:
 * target/arm: Use correct GDB XML for M-profile cores
 * target/arm: Code cleanup to use gvec APIs better
 * aspeed: Add support for the sonorapass-bmc board
 * target/arm: Support reporting KVM host memory errors
   to the guest via ACPI notifications
 * target/arm: Finish conversion of Neon 3-reg-same insns to decodetree

----------------------------------------------------------------
Dongjiu Geng (10):
      acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
      hw/arm/virt: Introduce a RAS machine option
      docs: APEI GHES generation and CPER record description
      ACPI: Build related register address fields via hardware error fw_cfg blob
      ACPI: Build Hardware Error Source Table
      ACPI: Record the Generic Error Status Block address
      KVM: Move hwpoison page related functions into kvm-all.c
      ACPI: Record Generic Error Status Block(GESB) table
      target-arm: kvm64: handle SIGBUS signal from kernel or KVM
      MAINTAINERS: Add ACPI/HEST/GHES entries

Patrick Williams (1):
      aspeed: Add support for the sonorapass-bmc board

Peter Maydell (18):
      target/arm: Use correct GDB XML for M-profile cores
      target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
      target/arm: Convert Neon 3-reg-same SHA to decodetree
      target/arm: Convert Neon 64-bit element 3-reg-same insns
      target/arm: Convert Neon VHADD 3-reg-same insns
      target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
      target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
      target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
      target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
      target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
      target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
      target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
      target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
      target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
      target/arm: Convert Neon 3-reg-same compare insns to decodetree
      target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
      target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
      target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree

Richard Henderson (16):
      target/arm: Create gen_gvec_[us]sra
      target/arm: Create gen_gvec_{u,s}{rshr,rsra}
      target/arm: Create gen_gvec_{sri,sli}
      target/arm: Remove unnecessary range check for VSHL
      target/arm: Tidy handle_vec_simd_shri
      target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
      target/arm: Create gen_gvec_{mla,mls}
      target/arm: Swap argument order for VSHL during decode
      target/arm: Create gen_gvec_{cmtst,ushl,sshl}
      target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
      target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
      target/arm: Create gen_gvec_{qrdmla,qrdmls}
      target/arm: Pass pointer to qc to qrdmla/qrdmls
      target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
      target/arm: Vectorize SABD/UABD
      target/arm: Vectorize SABA/UABA

GDB's remote protocol requires M-profile cores to use the feature
name 'org.gnu.gdb.arm.m-profile' instead of the 'org.gnu.gdb.arm.core'
feature used for A- and R-profile cores. We weren't doing this, which
meant GDB treated our M-profile cores like A-profile ones. This mostly
doesn't matter, but for instance means that it doesn't correctly
handle backtraces where an M-profile exception frame is involved.

Ship a copy of GDB's arm-m-profile.xml and use it on the M-profile
cores.  The integer registers have the same offsets as the
arm-core.xml, but register 25 is the M-profile XPSR rather than the
A-profile CPSR, so we need to update arm_cpu_gdb_read_register() and
arm_cpu_gdb_write_register() to handle XSPR reads and writes.

Fixes: https://bugs.launchpad.net/qemu/+bug/1877136
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200507134755.13997-1-peter.maydell@linaro.org
---
 configure                 |  4 ++--
 target/arm/cpu_tcg.c      |  1 +
 target/arm/gdbstub.c      | 22 ++++++++++++++++++----
 gdb-xml/arm-m-profile.xml | 27 +++++++++++++++++++++++++++
 4 files changed, 48 insertions(+), 6 deletions(-)
 create mode 100644 gdb-xml/arm-m-profile.xml

diff --git a/configure b/configure
index XXXXXXX..XXXXXXX 100755
--- a/configure
+++ b/configure
@@ -XXX,XX +XXX,XX @@ case "$target_name" in
     TARGET_SYSTBL_ABI=common,oabi
     bflt="yes"
     mttcg="yes"
-    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
+    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
   ;;
   aarch64|aarch64_be)
     TARGET_ARCH=aarch64
     TARGET_BASE_ARCH=arm
     bflt="yes"
     mttcg="yes"
-    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
+    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
   ;;
   cris)
   ;;
diff --git a/target/arm/cpu_tcg.c b/target/arm/cpu_tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu_tcg.c
+++ b/target/arm/cpu_tcg.c
@@ -XXX,XX +XXX,XX @@ static void arm_v7m_class_init(ObjectClass *oc, void *data)
 #endif
 
     cc->cpu_exec_interrupt = arm_v7m_cpu_exec_interrupt;
+    cc->gdb_core_xml_file = "arm-m-profile.xml";
 }
 
 static const ARMCPUInfo arm_tcg_cpus[] = {
diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/gdbstub.c
+++ b/target/arm/gdbstub.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_read_register(CPUState *cs, GByteArray *mem_buf, int n)
         }
         return gdb_get_reg32(mem_buf, 0);
     case 25:
-        /* CPSR */
-        return gdb_get_reg32(mem_buf, cpsr_read(env));
+        /* CPSR, or XPSR for M-profile */
+        if (arm_feature(env, ARM_FEATURE_M)) {
+            return gdb_get_reg32(mem_buf, xpsr_read(env));
+        } else {
+            return gdb_get_reg32(mem_buf, cpsr_read(env));
+        }
     }
     /* Unknown register.  */
     return 0;
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
         }
         return 4;
     case 25:
-        /* CPSR */
-        cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
+        /* CPSR, or XPSR for M-profile */
+        if (arm_feature(env, ARM_FEATURE_M)) {
+            /*
+             * Don't allow writing to XPSR.Exception as it can cause
+             * a transition into or out of handler mode (it's not
+             * writeable via the MSR insn so this is a reasonable
+             * restriction). Other fields are safe to update.
+             */
+            xpsr_write(env, tmp, ~XPSR_EXCP);
+        } else {
+            cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
+        }
         return 4;
     }
     /* Unknown register.  */
diff --git a/gdb-xml/arm-m-profile.xml b/gdb-xml/arm-m-profile.xml
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/gdb-xml/arm-m-profile.xml
@@ -XXX,XX +XXX,XX @@
+<?xml version="1.0"?>
+
+
+<!DOCTYPE feature SYSTEM "gdb-target.dtd">
+<feature name="org.gnu.gdb.arm.m-profile">
+  <reg name="r0" bitsize="32"/>
+  <reg name="r1" bitsize="32"/>
+  <reg name="r2" bitsize="32"/>
+  <reg name="r3" bitsize="32"/>
+  <reg name="r4" bitsize="32"/>
+  <reg name="r5" bitsize="32"/>
+  <reg name="r6" bitsize="32"/>
+  <reg name="r7" bitsize="32"/>
+  <reg name="r8" bitsize="32"/>
+  <reg name="r9" bitsize="32"/>
+  <reg name="r10" bitsize="32"/>
+  <reg name="r11" bitsize="32"/>
+  <reg name="r12" bitsize="32"/>
+  <reg name="sp" bitsize="32" type="data_ptr"/>
+  <reg name="lr" bitsize="32"/>
+  <reg name="pc" bitsize="32" type="code_ptr"/>
+  <reg name="xpsr" bitsize="32" regnum="25"/>
+</feature>
-- 
2.20.1