Series comparison

-[PULL 00/45] target-arm queue
+[PULL 00/36] target-arm queue
-Mostly this is patches from me and RTH cleaning up and doing
+First pullreq for 6.0: mostly my v8.1M work, plus some other
-more decodetree conversion for AArch32 Neon. The major new feature
+bits and pieces. (I still have a lot of stuff in my to-review
-is Dongjiu Geng's patchset to report host memory errors to KVM guests;
+folder, which I may or may not get to before the Christmas break...)
 also a new aspeed board from Patrick Williams.
 thanks
 -- PMM
-The following changes since commit 035b448b84f3557206abc44d786c5d3db2638f7d:
+The following changes since commit 5e7b204dbfae9a562fc73684986f936b97f63877:
-  Merge remote-tracking branch 'remotes/gkurz/tags/9p-next-2020-05-14' into staging (2020-05-14 10:58:30 +0100)
+  Merge remote-tracking branch 'remotes/mst/tags/for_upstream' into staging (2020-12-09 20:08:54 +0000)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200514
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20201210
-for you to fetch changes up to e95485f85657be21135c17a9226e297c21e73360:
+for you to fetch changes up to 71f916be1c7e9ede0e37d9cabc781b5a9e8638ff:
-  target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree (2020-05-14 15:03:09 +0100)
+  hw/arm/armv7m: Correct typo in QOM object name (2020-12-10 11:44:56 +0000)
 ----------------------------------------------------------------
 target-arm queue:
- * target/arm: Use correct GDB XML for M-profile cores
+ * hw/arm/smmuv3: Fix up L1STD_SPAN decoding
- * target/arm: Code cleanup to use gvec APIs better
+ * xlnx-zynqmp: Support Xilinx ZynqMP CAN controllers
- * aspeed: Add support for the sonorapass-bmc board
+ * sbsa-ref: allow to use Cortex-A53/57/72 cpus
- * target/arm: Support reporting KVM host memory errors
+ * Various minor code cleanups
-   to the guest via ACPI notifications
+ * hw/intc/armv7m_nvic: Make all of system PPB range be RAZWI/BusFault
- * target/arm: Finish conversion of Neon 3-reg-same insns to decodetree
+ * Implement more pieces of ARMv8.1M support
 ----------------------------------------------------------------
-Dongjiu Geng (10):
+Alex Chen (4):
-      acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
+      i.MX25: Fix bad printf format specifiers
-      hw/arm/virt: Introduce a RAS machine option
+      i.MX31: Fix bad printf format specifiers
-      docs: APEI GHES generation and CPER record description
+      i.MX6: Fix bad printf format specifiers
-      ACPI: Build related register address fields via hardware error fw_cfg blob
+      i.MX6ul: Fix bad printf format specifiers
       ACPI: Build Hardware Error Source Table
       ACPI: Record the Generic Error Status Block address
       KVM: Move hwpoison page related functions into kvm-all.c
       ACPI: Record Generic Error Status Block(GESB) table
       target-arm: kvm64: handle SIGBUS signal from kernel or KVM
       MAINTAINERS: Add ACPI/HEST/GHES entries
-Patrick Williams (1):
+Havard Skinnemoen (1):
-      aspeed: Add support for the sonorapass-bmc board
+      tests/qtest/npcm7xx_rng-test: dump random data on failure
-Peter Maydell (18):
+Kunkun Jiang (1):
-      target/arm: Use correct GDB XML for M-profile cores
+      hw/arm/smmuv3: Fix up L1STD_SPAN decoding
       target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
       target/arm: Convert Neon 3-reg-same SHA to decodetree
       target/arm: Convert Neon 64-bit element 3-reg-same insns
       target/arm: Convert Neon VHADD 3-reg-same insns
       target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
       target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
       target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
       target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
       target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
       target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
       target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
       target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
       target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
       target/arm: Convert Neon 3-reg-same compare insns to decodetree
       target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
       target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
       target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree
-Richard Henderson (16):
+Marcin Juszkiewicz (1):
-      target/arm: Create gen_gvec_[us]sra
+      sbsa-ref: allow to use Cortex-A53/57/72 cpus
       target/arm: Create gen_gvec_{u,s}{rshr,rsra}
       target/arm: Create gen_gvec_{sri,sli}
       target/arm: Remove unnecessary range check for VSHL
       target/arm: Tidy handle_vec_simd_shri
       target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
       target/arm: Create gen_gvec_{mla,mls}
       target/arm: Swap argument order for VSHL during decode
       target/arm: Create gen_gvec_{cmtst,ushl,sshl}
       target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
       target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
       target/arm: Create gen_gvec_{qrdmla,qrdmls}
       target/arm: Pass pointer to qc to qrdmla/qrdmls
       target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
       target/arm: Vectorize SABD/UABD
       target/arm: Vectorize SABA/UABA
- docs/specs/acpi_hest_ghes.rst          |  110 ++
+Peter Maydell (25):
- docs/specs/index.rst                   |    1 +
+      hw/intc/armv7m_nvic: Make all of system PPB range be RAZWI/BusFault
- configure                              |    4 +-
+      target/arm: Implement v8.1M PXN extension
- default-configs/arm-softmmu.mak        |    1 +
+      target/arm: Don't clobber ID_PFR1.Security on M-profile cores
- include/hw/acpi/aml-build.h            |    1 +
+      target/arm: Implement VSCCLRM insn
- include/hw/acpi/generic_event_device.h |    2 +
+      target/arm: Implement CLRM instruction
- include/hw/acpi/ghes.h                 |   74 +
+      target/arm: Enforce M-profile VMRS/VMSR register restrictions
- include/hw/arm/virt.h                  |    1 +
+      target/arm: Refactor M-profile VMSR/VMRS handling
- include/qemu/uuid.h                    |   27 +
+      target/arm: Move general-use constant expanders up in translate.c
- include/sysemu/kvm.h                   |    3 +-
+      target/arm: Implement VLDR/VSTR system register
- include/sysemu/kvm_int.h               |   12 +
+      target/arm: Implement M-profile FPSCR_nzcvqc
- target/arm/cpu.h                       |    4 +
+      target/arm: Use new FPCR_NZCV_MASK constant
- target/arm/helper.h                    |   78 +-
+      target/arm: Factor out preserve-fp-state from full_vfp_access_check()
- target/arm/internals.h                 |    5 +-
+      target/arm: Implement FPCXT_S fp system register
- target/arm/translate.h                 |   84 +-
+      hw/intc/armv7m_nvic: Update FPDSCR masking for v8.1M
- target/i386/cpu.h                      |    2 +
+      target/arm: For v8.1M, always clear R0-R3, R12, APSR, EPSR on exception entry
- target/arm/neon-dp.decode              |  119 +-
+      target/arm: In v8.1M, don't set HFSR.FORCED on vector table fetch failures
- accel/kvm/kvm-all.c                    |   36 +
+      target/arm: Implement v8.1M REVIDR register
- hw/acpi/aml-build.c                    |    2 +
+      target/arm: Implement new v8.1M NOCP check for exception return
- hw/acpi/generic_event_device.c         |   19 +
+      target/arm: Implement new v8.1M VLLDM and VLSTM encodings
- hw/acpi/ghes.c                         |  448 ++++++
+      hw/intc/armv7m_nvic: Support v8.1M CCR.TRD bit
- hw/acpi/nvdimm.c                       |   10 +-
+      target/arm: Implement CCR_S.TRD behaviour for SG insns
- hw/arm/aspeed.c                        |   78 ++
+      hw/intc/armv7m_nvic: Fix "return from inactive handler" check
- hw/arm/virt-acpi-build.c               |   15 +
+      target/arm: Implement M-profile "minimal RAS implementation"
- hw/arm/virt.c                          |   23 +
+      hw/intc/armv7m_nvic: Implement read/write for RAS register block
- target/arm/cpu_tcg.c                   |    1 +
+      hw/arm/armv7m: Correct typo in QOM object name
  target/arm/gdbstub.c                   |   22 +-
  target/arm/helper.c                    |    2 +-
  target/arm/kvm64.c                     |   77 ++
  target/arm/neon_helper.c               |   17 -
  target/arm/tlb_helper.c                |    2 +-
  target/arm/translate-a64.c             |  210 +--
  target/arm/translate-neon.inc.c        |  682 +++++++++-
  target/arm/translate.c                 | 2349 +++++++++++++++++---------------
  target/arm/vec_helper.c                |  240 +++-
  target/arm/vfp_helper.c                |    9 +-
  target/i386/kvm.c                      |   36 -
  MAINTAINERS                            |    9 +
  gdb-xml/arm-m-profile.xml              |   27 +
  hw/acpi/Kconfig                        |    4 +
  hw/acpi/Makefile.objs                  |    1 +
 files changed, 3402 insertions(+), 1445 deletions(-)
  create mode 100644 docs/specs/acpi_hest_ghes.rst
  create mode 100644 include/hw/acpi/ghes.h
  create mode 100644 hw/acpi/ghes.c
  create mode 100644 gdb-xml/arm-m-profile.xml
+Vikram Garhwal (4):
+      hw/net/can: Introduce Xilinx ZynqMP CAN controller
+      xlnx-zynqmp: Connect Xilinx ZynqMP CAN controllers
+      tests/qtest: Introduce tests for Xilinx ZynqMP CAN controller
+      MAINTAINERS: Add maintainer entry for Xilinx ZynqMP CAN controller
+ meson.build                      |    1 +
+ hw/arm/smmuv3-internal.h         |    2 +-
+ hw/net/can/trace.h               |    1 +
+ include/hw/arm/xlnx-zynqmp.h     |    8 +
+ include/hw/intc/armv7m_nvic.h    |    2 +
+ include/hw/net/xlnx-zynqmp-can.h |   78 +++
+ target/arm/cpu.h                 |   46 ++
+ target/arm/m-nocp.decode         |   10 +-
+ target/arm/t32.decode            |   10 +-
+ target/arm/vfp.decode            |   14 +
+ hw/arm/armv7m.c                  |    4 +-
+ hw/arm/sbsa-ref.c                |   23 +-
+ hw/arm/xlnx-zcu102.c             |   20 +
+ hw/arm/xlnx-zynqmp.c             |   34 ++
+ hw/intc/armv7m_nvic.c            |  246 ++++++--
+ hw/misc/imx25_ccm.c              |   12 +-
+ hw/misc/imx31_ccm.c              |   14 +-
+ hw/misc/imx6_ccm.c               |   20 +-
+ hw/misc/imx6_src.c               |    2 +-
+ hw/misc/imx6ul_ccm.c             |    4 +-
+ hw/misc/imx_ccm.c                |    4 +-
+ hw/net/can/xlnx-zynqmp-can.c     | 1161 ++++++++++++++++++++++++++++++++++++++
+ target/arm/cpu.c                 |    5 +-
+ target/arm/helper.c              |    7 +-
+ target/arm/m_helper.c            |  130 ++++-
+ target/arm/translate.c           |  105 +++-
+ tests/qtest/npcm7xx_rng-test.c   |   12 +
+ tests/qtest/xlnx-can-test.c      |  360 ++++++++++++
+ MAINTAINERS                      |    8 +
+ hw/Kconfig                       |    1 +
+ hw/net/can/meson.build           |    1 +
+ hw/net/can/trace-events          |    9 +
+ target/arm/translate-vfp.c.inc   |  511 ++++++++++++++++-
+ tests/qtest/meson.build          |    1 +
+files changed, 2713 insertions(+), 153 deletions(-)
+ create mode 100644 hw/net/can/trace.h
+ create mode 100644 include/hw/net/xlnx-zynqmp-can.h
+ create mode 100644 hw/net/can/xlnx-zynqmp-can.c
+ create mode 100644 tests/qtest/xlnx-can-test.c
+ create mode 100644 hw/net/can/trace-events

-[PULL 01/45] target/arm: Use correct GDB XML for M-profile cores
+Deleted patch
-GDB's remote protocol requires M-profile cores to use the feature
-name 'org.gnu.gdb.arm.m-profile' instead of the 'org.gnu.gdb.arm.core'
-feature used for A- and R-profile cores. We weren't doing this, which
-meant GDB treated our M-profile cores like A-profile ones. This mostly
-doesn't matter, but for instance means that it doesn't correctly
-handle backtraces where an M-profile exception frame is involved.
-Ship a copy of GDB's arm-m-profile.xml and use it on the M-profile
-cores.  The integer registers have the same offsets as the
-arm-core.xml, but register 25 is the M-profile XPSR rather than the
-A-profile CPSR, so we need to update arm_cpu_gdb_read_register() and
-arm_cpu_gdb_write_register() to handle XSPR reads and writes.
-Fixes: https://bugs.launchpad.net/qemu/+bug/1877136
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200507134755.13997-1-peter.maydell@linaro.org
----
- configure                 |  4 ++--
- target/arm/cpu_tcg.c      |  1 +
- target/arm/gdbstub.c      | 22 ++++++++++++++++++----
- gdb-xml/arm-m-profile.xml | 27 +++++++++++++++++++++++++++
-files changed, 48 insertions(+), 6 deletions(-)
- create mode 100644 gdb-xml/arm-m-profile.xml
-diff --git a/configure b/configure
-index XXXXXXX..XXXXXXX 100755
---- a/configure
-+++ b/configure
-@@ -XXX,XX +XXX,XX @@ case "$target_name" in
-     TARGET_SYSTBL_ABI=common,oabi
-     bflt="yes"
-     mttcg="yes"
--    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
-+    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
-   ;;
-   aarch64|aarch64_be)
-     TARGET_ARCH=aarch64
-     TARGET_BASE_ARCH=arm
-     bflt="yes"
-     mttcg="yes"
--    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
-+    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
-   ;;
-   cris)
-   ;;
-diff --git a/target/arm/cpu_tcg.c b/target/arm/cpu_tcg.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu_tcg.c
-+++ b/target/arm/cpu_tcg.c
-@@ -XXX,XX +XXX,XX @@ static void arm_v7m_class_init(ObjectClass *oc, void *data)
- #endif
-     cc->cpu_exec_interrupt = arm_v7m_cpu_exec_interrupt;
-+    cc->gdb_core_xml_file = "arm-m-profile.xml";
- }
- static const ARMCPUInfo arm_tcg_cpus[] = {
-diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/gdbstub.c
-+++ b/target/arm/gdbstub.c
-@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_read_register(CPUState *cs, GByteArray *mem_buf, int n)
-         }
-         return gdb_get_reg32(mem_buf, 0);
-     case 25:
--        /* CPSR */
--        return gdb_get_reg32(mem_buf, cpsr_read(env));
-+        /* CPSR, or XPSR for M-profile */
-+        if (arm_feature(env, ARM_FEATURE_M)) {
-+            return gdb_get_reg32(mem_buf, xpsr_read(env));
-+        } else {
-+            return gdb_get_reg32(mem_buf, cpsr_read(env));
-+        }
-     }
-     /* Unknown register.  */
-     return 0;
-@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
-         }
-         return 4;
-     case 25:
--        /* CPSR */
--        cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
-+        /* CPSR, or XPSR for M-profile */
-+        if (arm_feature(env, ARM_FEATURE_M)) {
-+            /*
-+             * Don't allow writing to XPSR.Exception as it can cause
-+             * a transition into or out of handler mode (it's not
-+             * writeable via the MSR insn so this is a reasonable
-+             * restriction). Other fields are safe to update.
-+             */
-+            xpsr_write(env, tmp, ~XPSR_EXCP);
-+        } else {
-+            cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
-+        }
-         return 4;
-     }
-     /* Unknown register.  */
-diff --git a/gdb-xml/arm-m-profile.xml b/gdb-xml/arm-m-profile.xml
-new file mode 100644
-index XXXXXXX..XXXXXXX
---- /dev/null
-+++ b/gdb-xml/arm-m-profile.xml
-@@ -XXX,XX +XXX,XX @@
-+<?xml version="1.0"?>
-+<!-- Copyright (C) 2010-2020 Free Software Foundation, Inc.
-+
-+     Copying and distribution of this file, with or without modification,
-+     are permitted in any medium without royalty provided the copyright
-+     notice and this notice are preserved.  -->
-+
-+<!DOCTYPE feature SYSTEM "gdb-target.dtd">
-+<feature name="org.gnu.gdb.arm.m-profile">
-+  <reg name="r0" bitsize="32"/>
-+  <reg name="r1" bitsize="32"/>
-+  <reg name="r2" bitsize="32"/>
-+  <reg name="r3" bitsize="32"/>
-+  <reg name="r4" bitsize="32"/>
-+  <reg name="r5" bitsize="32"/>
-+  <reg name="r6" bitsize="32"/>
-+  <reg name="r7" bitsize="32"/>
-+  <reg name="r8" bitsize="32"/>
-+  <reg name="r9" bitsize="32"/>
-+  <reg name="r10" bitsize="32"/>
-+  <reg name="r11" bitsize="32"/>
-+  <reg name="r12" bitsize="32"/>
-+  <reg name="sp" bitsize="32" type="data_ptr"/>
-+  <reg name="lr" bitsize="32"/>
-+  <reg name="pc" bitsize="32" type="code_ptr"/>
-+  <reg name="xpsr" bitsize="32" regnum="25"/>
-+</feature>
---
-.20.1

-[PULL 02/45] target/arm: Create gen_gvec_[us]sra
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-The functions eliminate duplication of the special cases for
-this operation.  They match up with the GVecGen2iFn typedef.
-Add out-of-line helpers.  We got away with only having inline
-expanders because the neon vector size is only 16 bytes, and
-we know that the inline expansion will always succeed.
-When we reuse this for SVE, tcg-gvec-op may decide to use an
-out-of-line helper due to longer vector lengths.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-2-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  10 +++
- target/arm/translate.h     |   7 +-
- target/arm/translate-a64.c |  15 +---
- target/arm/translate.c     | 161 ++++++++++++++++++++++---------------
- target/arm/vec_helper.c    |  25 ++++++
-files changed, 139 insertions(+), 79 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(neon_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ssra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_3(gvec_usra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_usra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_usra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_usra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
- #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ extern const GVecGen3 mls_op[4];
- extern const GVecGen3 cmtst_op[4];
- extern const GVecGen3 sshl_op[4];
- extern const GVecGen3 ushl_op[4];
--extern const GVecGen2i ssra_op[4];
--extern const GVecGen2i usra_op[4];
- extern const GVecGen2i sri_op[4];
- extern const GVecGen2i sli_op[4];
- extern const GVecGen4 uqadd_op[4];
-@@ -XXX,XX +XXX,XX @@ void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
-     switch (opcode) {
-     case 0x02: /* SSRA / USRA (accumulate) */
--        if (is_u) {
--            /* Shift count same as element size produces zero to add.  */
--            if (shift == 8 << size) {
--                goto done;
--            }
--            gen_gvec_op2i(s, is_q, rd, rn, shift, &usra_op[size]);
--        } else {
--            /* Shift count same as element size produces all sign to add.  */
--            if (shift == 8 << size) {
--                shift -= 1;
--            }
--            gen_gvec_op2i(s, is_q, rd, rn, shift, &ssra_op[size]);
--        }
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift,
-+                      is_u ? gen_gvec_usra : gen_gvec_ssra, size);
-         return;
-     case 0x08: /* SRI */
-         /* Shift count same as element size is valid but does nothing.  */
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_ssra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
-     tcg_gen_add_vec(vece, d, d, a);
- }
--static const TCGOpcode vecop_list_ssra[] = {
--    INDEX_op_sari_vec, INDEX_op_add_vec, 0
--};
-+void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sari_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen2i ops[4] = {
-+        { .fni8 = gen_ssra8_i64,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni8 = gen_ssra16_i64,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_ssra32_i32,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_ssra64_i64,
-+          .fniv = gen_ssra_vec,
-+          .fno = gen_helper_gvec_ssra_b,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_64 },
-+    };
--const GVecGen2i ssra_op[4] = {
--    { .fni8 = gen_ssra8_i64,
--      .fniv = gen_ssra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_ssra,
--      .vece = MO_8 },
--    { .fni8 = gen_ssra16_i64,
--      .fniv = gen_ssra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_ssra,
--      .vece = MO_16 },
--    { .fni4 = gen_ssra32_i32,
--      .fniv = gen_ssra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_ssra,
--      .vece = MO_32 },
--    { .fni8 = gen_ssra64_i64,
--      .fniv = gen_ssra_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .opt_opc = vecop_list_ssra,
--      .load_dest = true,
--      .vece = MO_64 },
--};
-+    /* tszimm encoding produces immediates in the range [1..esize]. */
-+    tcg_debug_assert(shift > 0);
-+    tcg_debug_assert(shift <= (8 << vece));
-+
-+    /*
-+     * Shifts larger than the element size are architecturally valid.
-+     * Signed results in all sign bits.
-+     */
-+    shift = MIN(shift, (8 << vece) - 1);
-+    tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+}
- static void gen_usra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_usra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
-     tcg_gen_add_vec(vece, d, d, a);
- }
--static const TCGOpcode vecop_list_usra[] = {
--    INDEX_op_shri_vec, INDEX_op_add_vec, 0
--};
-+void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_shri_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen2i ops[4] = {
-+        { .fni8 = gen_usra8_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8, },
-+        { .fni8 = gen_usra16_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16, },
-+        { .fni4 = gen_usra32_i32,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32, },
-+        { .fni8 = gen_usra64_i64,
-+          .fniv = gen_usra_vec,
-+          .fno = gen_helper_gvec_usra_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64, },
-+    };
--const GVecGen2i usra_op[4] = {
--    { .fni8 = gen_usra8_i64,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_8, },
--    { .fni8 = gen_usra16_i64,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_16, },
--    { .fni4 = gen_usra32_i32,
--      .fniv = gen_usra_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_32, },
--    { .fni8 = gen_usra64_i64,
--      .fniv = gen_usra_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_usra,
--      .vece = MO_64, },
--};
-+    /* tszimm encoding produces immediates in the range [1..esize]. */
-+    tcg_debug_assert(shift > 0);
-+    tcg_debug_assert(shift <= (8 << vece));
-+
-+    /*
-+     * Shifts larger than the element size are architecturally valid.
-+     * Unsigned results in all zeros as input to accumulate: nop.
-+     */
-+    if (shift < (8 << vece)) {
-+        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+    } else {
-+        /* Nop, but we do need to clear the tail. */
-+        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
-+    }
-+}
- static void gen_shr8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 case 1:  /* VSRA */
-                     /* Right shift comes here negative.  */
-                     shift = -shift;
--                    /* Shifts larger than the element size are architecturally
--                     * valid.  Unsigned results in all zeros; signed results
--                     * in all sign bits.
--                     */
--                    if (!u) {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        MIN(shift, (8 << size) - 1),
--                                        &ssra_op[size]);
--                    } else if (shift >= 8 << size) {
--                        /* rd += 0 */
-+                    if (u) {
-+                        gen_gvec_usra(size, rd_ofs, rm_ofs, shift,
-+                                      vec_size, vec_size);
-                     } else {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        shift, &usra_op[size]);
-+                        gen_gvec_ssra(size, rd_ofs, rm_ofs, shift,
-+                                      vec_size, vec_size);
-                     }
-                     return 0;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_sqsub_d)(void *vd, void *vq, void *vn,
-     clear_tail(d, oprsz, simd_maxsz(desc));
- }
-+
-+#define DO_SRA(NAME, TYPE)                              \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        d[i] += n[i] >> shift;                          \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_SRA(gvec_ssra_b, int8_t)
-+DO_SRA(gvec_ssra_h, int16_t)
-+DO_SRA(gvec_ssra_s, int32_t)
-+DO_SRA(gvec_ssra_d, int64_t)
-+
-+DO_SRA(gvec_usra_b, uint8_t)
-+DO_SRA(gvec_usra_h, uint16_t)
-+DO_SRA(gvec_usra_s, uint32_t)
-+DO_SRA(gvec_usra_d, uint64_t)
-+
-+#undef DO_SRA
-+
- /*
-  * Convert float16 to float32, raising no exceptions and
-  * preserving exceptional values, including SNaN.
---
-.20.1

-[PULL 20/45] hw/arm/virt: Introduce a RAS machine option
+[PULL 01/36] hw/arm/smmuv3: Fix up L1STD_SPAN decoding
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Kunkun Jiang <jiangkunkun@huawei.com>
-RAS Virtualization feature is not supported now, so
+Accroding to the SMMUv3 spec, the SPAN field of Level1 Stream Table
-add a RAS machine option and disable it by default.
+Descriptor is 5 bits([4:0]).
+Fixes: 9bde7f0674f(hw/arm/smmuv3: Implement translate callback)
+Signed-off-by: Kunkun Jiang <jiangkunkun@huawei.com>
+Message-id: 20201124023711.1184-1-jiangkunkun@huawei.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Acked-by: Eric Auger <eric.auger@redhat.com>
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Jonathan Cameron <Jonathan.Cameron@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Message-id: 20200512030609.19593-3-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/arm/virt.h |  1 +
+ hw/arm/smmuv3-internal.h | 2 +-
- hw/arm/virt.c         | 23 +++++++++++++++++++++++
+file changed, 1 insertion(+), 1 deletion(-)
 files changed, 24 insertions(+)
-diff --git a/include/hw/arm/virt.h b/include/hw/arm/virt.h
+diff --git a/hw/arm/smmuv3-internal.h b/hw/arm/smmuv3-internal.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/virt.h
+--- a/hw/arm/smmuv3-internal.h
-+++ b/include/hw/arm/virt.h
++++ b/hw/arm/smmuv3-internal.h
-@@ -XXX,XX +XXX,XX @@ typedef struct {
+@@ -XXX,XX +XXX,XX @@ static inline uint64_t l1std_l2ptr(STEDesc *desc)
-     bool highmem_ecam;
+     return hi << 32 | lo;
      bool its;
      bool virt;
 +    bool ras;
      OnOffAuto acpi;
      VirtGICType gic_version;
      VirtIOMMUType iommu;
 diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt.c
 +++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void virt_set_acpi(Object *obj, Visitor *v, const char *name,
      visit_type_OnOffAuto(v, name, &vms->acpi, errp);
  }
-+static bool virt_get_ras(Object *obj, Error **errp)
+-#define L1STD_SPAN(stm) (extract32((stm)->word[0], 0, 4))
-+{
++#define L1STD_SPAN(stm) (extract32((stm)->word[0], 0, 5))
-+    VirtMachineState *vms = VIRT_MACHINE(obj);
-+
+ #endif
 +    return vms->ras;
 +}
 +
 +static void virt_set_ras(Object *obj, bool value, Error **errp)
 +{
 +    VirtMachineState *vms = VIRT_MACHINE(obj);
 +
 +    vms->ras = value;
 +}
 +
  static char *virt_get_gic_version(Object *obj, Error **errp)
  {
      VirtMachineState *vms = VIRT_MACHINE(obj);
@@ -XXX,XX +XXX,XX @@ static void virt_instance_init(Object *obj)
                                      "Valid values are none and smmuv3",
                                      NULL);
 +    /* Default disallows RAS instantiation */
 +    vms->ras = false;
 +    object_property_add_bool(obj, "ras", virt_get_ras,
 +                             virt_set_ras, NULL);
 +    object_property_set_description(obj, "ras",
 +                                    "Set on/off to enable/disable reporting host memory errors "
 +                                    "to a KVM guest using ACPI and guest external abort exceptions",
 +                                    NULL);
 +
      vms->irqmap = a15irqmap;
      virt_flash_create(vms);
 --
 .20.1

-[PULL 22/45] ACPI: Build related register address fields via hardware error fw_cfg blob
+[PULL 02/36] hw/net/can: Introduce Xilinx ZynqMP CAN controller
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Vikram Garhwal <fnu.vikram@xilinx.com>
-This patch builds error_block_address and read_ack_register fields
+The Xilinx ZynqMP CAN controller is developed based on SocketCAN, QEMU CAN bus
-in hardware errors table , the error_block_address points to Generic
+implementation. Bus connection and socketCAN connection for each CAN module
-Error Status Block(GESB) via bios_linker. The max size for one GESB
+can be set through command lines.
 is 1kb, For more detailed information, please refer to
 document: docs/specs/acpi_hest_ghes.rst
-Now we only support one Error source, if necessary, we can extend to
+Example for using single CAN:
-support more.
+    -object can-bus,id=canbus0 \
     -machine xlnx-zcu102.canbus0=canbus0 \
     -object can-host-socketcan,id=socketcan0,if=vcan0,canbus=canbus0
-Suggested-by: Laszlo Ersek <lersek@redhat.com>
+Example for connecting both CAN to same virtual CAN on host machine:
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+    -object can-bus,id=canbus0 -object can-bus,id=canbus1 \
-Reviewed-by: Jonathan Cameron <Jonathan.Cameron@huawei.com>
+    -machine xlnx-zcu102.canbus0=canbus0 \
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+    -machine xlnx-zcu102.canbus1=canbus1 \
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+    -object can-host-socketcan,id=socketcan0,if=vcan0,canbus=canbus0 \
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+    -object can-host-socketcan,id=socketcan1,if=vcan0,canbus=canbus1
-Message-id: 20200512030609.19593-5-gengdongjiu@huawei.com
 To create virtual CAN on the host machine, please check the QEMU CAN docs:
 https://github.com/qemu/qemu/blob/master/docs/can.txt
 Signed-off-by: Vikram Garhwal <fnu.vikram@xilinx.com>
 Message-id: 1605728926-352690-2-git-send-email-fnu.vikram@xilinx.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- default-configs/arm-softmmu.mak |  1 +
+ meson.build                      |    1 +
- include/hw/acpi/aml-build.h     |  1 +
+ hw/net/can/trace.h               |    1 +
- include/hw/acpi/ghes.h          | 28 +++++++++++
+ include/hw/net/xlnx-zynqmp-can.h |   78 ++
- hw/acpi/aml-build.c             |  2 +
+ hw/net/can/xlnx-zynqmp-can.c     | 1161 ++++++++++++++++++++++++++++++
- hw/acpi/ghes.c                  | 89 +++++++++++++++++++++++++++++++++
+ hw/Kconfig                       |    1 +
- hw/arm/virt-acpi-build.c        |  5 ++
+ hw/net/can/meson.build           |    1 +
- hw/acpi/Kconfig                 |  4 ++
+ hw/net/can/trace-events          |    9 +
- hw/acpi/Makefile.objs           |  1 +
+files changed, 1252 insertions(+)
-files changed, 131 insertions(+)
+ create mode 100644 hw/net/can/trace.h
- create mode 100644 include/hw/acpi/ghes.h
+ create mode 100644 include/hw/net/xlnx-zynqmp-can.h
- create mode 100644 hw/acpi/ghes.c
+ create mode 100644 hw/net/can/xlnx-zynqmp-can.c
  create mode 100644 hw/net/can/trace-events
-diff --git a/default-configs/arm-softmmu.mak b/default-configs/arm-softmmu.mak
+diff --git a/meson.build b/meson.build
 index XXXXXXX..XXXXXXX 100644
---- a/default-configs/arm-softmmu.mak
+--- a/meson.build
-+++ b/default-configs/arm-softmmu.mak
++++ b/meson.build
-@@ -XXX,XX +XXX,XX @@ CONFIG_FSL_IMX7=y
+@@ -XXX,XX +XXX,XX @@ if have_system
- CONFIG_FSL_IMX6UL=y
+     'hw/misc',
- CONFIG_SEMIHOSTING=y
+     'hw/misc/macio',
- CONFIG_ALLWINNER_H3=y
+     'hw/net',
-+CONFIG_ACPI_APEI=y
++    'hw/net/can',
-diff --git a/include/hw/acpi/aml-build.h b/include/hw/acpi/aml-build.h
+     'hw/nvram',
-index XXXXXXX..XXXXXXX 100644
+     'hw/pci',
---- a/include/hw/acpi/aml-build.h
+     'hw/pci-host',
-+++ b/include/hw/acpi/aml-build.h
+diff --git a/hw/net/can/trace.h b/hw/net/can/trace.h
@@ -XXX,XX +XXX,XX @@ struct AcpiBuildTables {
      GArray *rsdp;
      GArray *tcpalog;
      GArray *vmgenid;
 +    GArray *hardware_errors;
      BIOSLinker *linker;
  } AcpiBuildTables;
 diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/include/hw/acpi/ghes.h
++++ b/hw/net/can/trace.h
-@@ -XXX,XX +XXX,XX @@
+@@ -0,0 +1 @@
-+/*
++#include "trace/trace-hw_net_can.h"
-+ * Support for generating APEI tables and recording CPER for Guests
+diff --git a/include/hw/net/xlnx-zynqmp-can.h b/include/hw/net/xlnx-zynqmp-can.h
 + *
 + * Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
 + *
 + * Author: Dongjiu Geng <gengdongjiu@huawei.com>
 + *
 + * This program is free software; you can redistribute it and/or modify
 + * it under the terms of the GNU General Public License as published by
 + * the Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 +
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 +
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#ifndef ACPI_GHES_H
 +#define ACPI_GHES_H
 +
 +#include "hw/acpi/bios-linker-loader.h"
 +
 +void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
 +#endif
 diff --git a/hw/acpi/aml-build.c b/hw/acpi/aml-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/aml-build.c
 +++ b/hw/acpi/aml-build.c
@@ -XXX,XX +XXX,XX @@ void acpi_build_tables_init(AcpiBuildTables *tables)
      tables->table_data = g_array_new(false, true /* clear */, 1);
      tables->tcpalog = g_array_new(false, true /* clear */, 1);
      tables->vmgenid = g_array_new(false, true /* clear */, 1);
 +    tables->hardware_errors = g_array_new(false, true /* clear */, 1);
      tables->linker = bios_linker_loader_init();
  }
@@ -XXX,XX +XXX,XX @@ void acpi_build_tables_cleanup(AcpiBuildTables *tables, bool mfre)
      g_array_free(tables->table_data, true);
      g_array_free(tables->tcpalog, mfre);
      g_array_free(tables->vmgenid, mfre);
 +    g_array_free(tables->hardware_errors, mfre);
  }
  /*
 diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/hw/acpi/ghes.c
++++ b/include/hw/net/xlnx-zynqmp-can.h
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * Support for generating APEI tables and recording CPER for Guests
++ * QEMU model of the Xilinx ZynqMP CAN controller.
 + *
-+ * Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
++ * Copyright (c) 2020 Xilinx Inc.
 + *
-+ * Author: Dongjiu Geng <gengdongjiu@huawei.com>
++ * Written-by: Vikram Garhwal<fnu.vikram@xilinx.com>
 + *
-+ * This program is free software; you can redistribute it and/or modify
++ * Based on QEMU CAN Device emulation implemented by Jin Yang, Deniz Eren and
-+ * it under the terms of the GNU General Public License as published by
++ * Pavel Pisa.
-+ * the Free Software Foundation; either version 2 of the License, or
++ *
-+ * (at your option) any later version.
++ * Permission is hereby granted, free of charge, to any person obtaining a copy
-+
++ * of this software and associated documentation files (the "Software"), to deal
-+ * This program is distributed in the hope that it will be useful,
++ * in the Software without restriction, including without limitation the rights
-+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
++ * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
-+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
++ * copies of the Software, and to permit persons to whom the Software is
-+ * GNU General Public License for more details.
++ * furnished to do so, subject to the following conditions:
-+
++ *
-+ * You should have received a copy of the GNU General Public License along
++ * The above copyright notice and this permission notice shall be included in
-+ * with this program; if not, see <http://www.gnu.org/licenses/>.
++ * all copies or substantial portions of the Software.
 + *
 + * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
 + * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
 + * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
 + * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 + * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 + * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 + * THE SOFTWARE.
 + */
 +
++#ifndef XLNX_ZYNQMP_CAN_H
++#define XLNX_ZYNQMP_CAN_H
++
++#include "hw/register.h"
++#include "net/can_emu.h"
++#include "net/can_host.h"
++#include "qemu/fifo32.h"
++#include "hw/ptimer.h"
++#include "hw/qdev-clock.h"
++
++#define TYPE_XLNX_ZYNQMP_CAN "xlnx.zynqmp-can"
++
++#define XLNX_ZYNQMP_CAN(obj) \
++     OBJECT_CHECK(XlnxZynqMPCANState, (obj), TYPE_XLNX_ZYNQMP_CAN)
++
++#define MAX_CAN_CTRLS      2
++#define XLNX_ZYNQMP_CAN_R_MAX     (0x84 / 4)
++#define MAILBOX_CAPACITY   64
++#define CAN_TIMER_MAX  0XFFFFUL
++#define CAN_DEFAULT_CLOCK (24 * 1000 * 1000)
++
++/* Each CAN_FRAME will have 4 * 32bit size. */
++#define CAN_FRAME_SIZE     4
++#define RXFIFO_SIZE        (MAILBOX_CAPACITY * CAN_FRAME_SIZE)
++
++typedef struct XlnxZynqMPCANState {
++    SysBusDevice        parent_obj;
++    MemoryRegion        iomem;
++
++    qemu_irq            irq;
++
++    CanBusClientState   bus_client;
++    CanBusState         *canbus;
++
++    struct {
++        uint32_t        ext_clk_freq;
++    } cfg;
++
++    RegisterInfo        reg_info[XLNX_ZYNQMP_CAN_R_MAX];
++    uint32_t            regs[XLNX_ZYNQMP_CAN_R_MAX];
++
++    Fifo32              rx_fifo;
++    Fifo32              tx_fifo;
++    Fifo32              txhpb_fifo;
++
++    ptimer_state        *can_timer;
++} XlnxZynqMPCANState;
++
++#endif
+diff --git a/hw/net/can/xlnx-zynqmp-can.c b/hw/net/can/xlnx-zynqmp-can.c
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/hw/net/can/xlnx-zynqmp-can.c
+@@ -XXX,XX +XXX,XX @@
++/*
++ * QEMU model of the Xilinx ZynqMP CAN controller.
++ * This implementation is based on the following datasheet:
++ * https://www.xilinx.com/support/documentation/user_guides/ug1085-zynq-ultrascale-trm.pdf
++ *
++ * Copyright (c) 2020 Xilinx Inc.
++ *
++ * Written-by: Vikram Garhwal<fnu.vikram@xilinx.com>
++ *
++ * Based on QEMU CAN Device emulation implemented by Jin Yang, Deniz Eren and
++ * Pavel Pisa
++ *
++ * Permission is hereby granted, free of charge, to any person obtaining a copy
++ * of this software and associated documentation files (the "Software"), to deal
++ * in the Software without restriction, including without limitation the rights
++ * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
++ * copies of the Software, and to permit persons to whom the Software is
++ * furnished to do so, subject to the following conditions:
++ *
++ * The above copyright notice and this permission notice shall be included in
++ * all copies or substantial portions of the Software.
++ *
++ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
++ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
++ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
++ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
++ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
++ * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
++ * THE SOFTWARE.
++ */
++
 +#include "qemu/osdep.h"
-+#include "qemu/units.h"
++#include "hw/sysbus.h"
-+#include "hw/acpi/ghes.h"
++#include "hw/register.h"
-+#include "hw/acpi/aml-build.h"
++#include "hw/irq.h"
-+
++#include "qapi/error.h"
-+#define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
++#include "qemu/bitops.h"
-+#define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
++#include "qemu/log.h"
-+
++#include "qemu/cutils.h"
-+/* The max size in bytes for one error block */
++#include "sysemu/sysemu.h"
-+#define ACPI_GHES_MAX_RAW_DATA_LENGTH   (1 * KiB)
++#include "migration/vmstate.h"
-+
++#include "hw/qdev-properties.h"
-+/* Now only support ARMv8 SEA notification type error source */
++#include "net/can_emu.h"
-+#define ACPI_GHES_ERROR_SOURCE_COUNT        1
++#include "net/can_host.h"
-+
++#include "qemu/event_notifier.h"
-+/*
++#include "qom/object_interfaces.h"
-+ * Build table for the hardware error fw_cfg blob.
++#include "hw/net/xlnx-zynqmp-can.h"
-+ * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
++#include "trace.h"
-+ * See docs/specs/acpi_hest_ghes.rst for blobs format.
++
-+ */
++#ifndef XLNX_ZYNQMP_CAN_ERR_DEBUG
-+void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker)
++#define XLNX_ZYNQMP_CAN_ERR_DEBUG 0
-+{
++#endif
-+    int i, error_status_block_offset;
++
-+
++#define MAX_DLC            8
-+    /* Build error_block_address */
++#undef ERROR
-+    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
++
-+        build_append_int_noprefix(hardware_errors, 0, sizeof(uint64_t));
++REG32(SOFTWARE_RESET_REGISTER, 0x0)
-+    }
++    FIELD(SOFTWARE_RESET_REGISTER, CEN, 1, 1)
-+
++    FIELD(SOFTWARE_RESET_REGISTER, SRST, 0, 1)
-+    /* Build read_ack_register */
++REG32(MODE_SELECT_REGISTER, 0x4)
-+    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
++    FIELD(MODE_SELECT_REGISTER, SNOOP, 2, 1)
 +    FIELD(MODE_SELECT_REGISTER, LBACK, 1, 1)
 +    FIELD(MODE_SELECT_REGISTER, SLEEP, 0, 1)
 +REG32(ARBITRATION_PHASE_BAUD_RATE_PRESCALER_REGISTER, 0x8)
 +    FIELD(ARBITRATION_PHASE_BAUD_RATE_PRESCALER_REGISTER, BRP, 0, 8)
 +REG32(ARBITRATION_PHASE_BIT_TIMING_REGISTER, 0xc)
 +    FIELD(ARBITRATION_PHASE_BIT_TIMING_REGISTER, SJW, 7, 2)
 +    FIELD(ARBITRATION_PHASE_BIT_TIMING_REGISTER, TS2, 4, 3)
 +    FIELD(ARBITRATION_PHASE_BIT_TIMING_REGISTER, TS1, 0, 4)
 +REG32(ERROR_COUNTER_REGISTER, 0x10)
 +    FIELD(ERROR_COUNTER_REGISTER, REC, 8, 8)
 +    FIELD(ERROR_COUNTER_REGISTER, TEC, 0, 8)
 +REG32(ERROR_STATUS_REGISTER, 0x14)
 +    FIELD(ERROR_STATUS_REGISTER, ACKER, 4, 1)
 +    FIELD(ERROR_STATUS_REGISTER, BERR, 3, 1)
 +    FIELD(ERROR_STATUS_REGISTER, STER, 2, 1)
 +    FIELD(ERROR_STATUS_REGISTER, FMER, 1, 1)
 +    FIELD(ERROR_STATUS_REGISTER, CRCER, 0, 1)
 +REG32(STATUS_REGISTER, 0x18)
 +    FIELD(STATUS_REGISTER, SNOOP, 12, 1)
 +    FIELD(STATUS_REGISTER, ACFBSY, 11, 1)
 +    FIELD(STATUS_REGISTER, TXFLL, 10, 1)
 +    FIELD(STATUS_REGISTER, TXBFLL, 9, 1)
 +    FIELD(STATUS_REGISTER, ESTAT, 7, 2)
 +    FIELD(STATUS_REGISTER, ERRWRN, 6, 1)
 +    FIELD(STATUS_REGISTER, BBSY, 5, 1)
 +    FIELD(STATUS_REGISTER, BIDLE, 4, 1)
 +    FIELD(STATUS_REGISTER, NORMAL, 3, 1)
 +    FIELD(STATUS_REGISTER, SLEEP, 2, 1)
 +    FIELD(STATUS_REGISTER, LBACK, 1, 1)
 +    FIELD(STATUS_REGISTER, CONFIG, 0, 1)
 +REG32(INTERRUPT_STATUS_REGISTER, 0x1c)
 +    FIELD(INTERRUPT_STATUS_REGISTER, TXFEMP, 14, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, TXFWMEMP, 13, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, RXFWMFLL, 12, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, WKUP, 11, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, SLP, 10, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, BSOFF, 9, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, ERROR, 8, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, RXNEMP, 7, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, RXOFLW, 6, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, RXUFLW, 5, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, RXOK, 4, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, TXBFLL, 3, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, TXFLL, 2, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, TXOK, 1, 1)
 +    FIELD(INTERRUPT_STATUS_REGISTER, ARBLST, 0, 1)
 +REG32(INTERRUPT_ENABLE_REGISTER, 0x20)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ETXFEMP, 14, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ETXFWMEMP, 13, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ERXFWMFLL, 12, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, EWKUP, 11, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ESLP, 10, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, EBSOFF, 9, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, EERROR, 8, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ERXNEMP, 7, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ERXOFLW, 6, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ERXUFLW, 5, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ERXOK, 4, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ETXBFLL, 3, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ETXFLL, 2, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, ETXOK, 1, 1)
 +    FIELD(INTERRUPT_ENABLE_REGISTER, EARBLST, 0, 1)
 +REG32(INTERRUPT_CLEAR_REGISTER, 0x24)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CTXFEMP, 14, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CTXFWMEMP, 13, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CRXFWMFLL, 12, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CWKUP, 11, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CSLP, 10, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CBSOFF, 9, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CERROR, 8, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CRXNEMP, 7, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CRXOFLW, 6, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CRXUFLW, 5, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CRXOK, 4, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CTXBFLL, 3, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CTXFLL, 2, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CTXOK, 1, 1)
 +    FIELD(INTERRUPT_CLEAR_REGISTER, CARBLST, 0, 1)
 +REG32(TIMESTAMP_REGISTER, 0x28)
 +    FIELD(TIMESTAMP_REGISTER, CTS, 0, 1)
 +REG32(WIR, 0x2c)
 +    FIELD(WIR, EW, 8, 8)
 +    FIELD(WIR, FW, 0, 8)
 +REG32(TXFIFO_ID, 0x30)
 +    FIELD(TXFIFO_ID, IDH, 21, 11)
 +    FIELD(TXFIFO_ID, SRRRTR, 20, 1)
 +    FIELD(TXFIFO_ID, IDE, 19, 1)
 +    FIELD(TXFIFO_ID, IDL, 1, 18)
 +    FIELD(TXFIFO_ID, RTR, 0, 1)
 +REG32(TXFIFO_DLC, 0x34)
 +    FIELD(TXFIFO_DLC, DLC, 28, 4)
 +REG32(TXFIFO_DATA1, 0x38)
 +    FIELD(TXFIFO_DATA1, DB0, 24, 8)
 +    FIELD(TXFIFO_DATA1, DB1, 16, 8)
 +    FIELD(TXFIFO_DATA1, DB2, 8, 8)
 +    FIELD(TXFIFO_DATA1, DB3, 0, 8)
 +REG32(TXFIFO_DATA2, 0x3c)
 +    FIELD(TXFIFO_DATA2, DB4, 24, 8)
 +    FIELD(TXFIFO_DATA2, DB5, 16, 8)
 +    FIELD(TXFIFO_DATA2, DB6, 8, 8)
 +    FIELD(TXFIFO_DATA2, DB7, 0, 8)
 +REG32(TXHPB_ID, 0x40)
 +    FIELD(TXHPB_ID, IDH, 21, 11)
 +    FIELD(TXHPB_ID, SRRRTR, 20, 1)
 +    FIELD(TXHPB_ID, IDE, 19, 1)
 +    FIELD(TXHPB_ID, IDL, 1, 18)
 +    FIELD(TXHPB_ID, RTR, 0, 1)
 +REG32(TXHPB_DLC, 0x44)
 +    FIELD(TXHPB_DLC, DLC, 28, 4)
 +REG32(TXHPB_DATA1, 0x48)
 +    FIELD(TXHPB_DATA1, DB0, 24, 8)
 +    FIELD(TXHPB_DATA1, DB1, 16, 8)
 +    FIELD(TXHPB_DATA1, DB2, 8, 8)
 +    FIELD(TXHPB_DATA1, DB3, 0, 8)
 +REG32(TXHPB_DATA2, 0x4c)
 +    FIELD(TXHPB_DATA2, DB4, 24, 8)
 +    FIELD(TXHPB_DATA2, DB5, 16, 8)
 +    FIELD(TXHPB_DATA2, DB6, 8, 8)
 +    FIELD(TXHPB_DATA2, DB7, 0, 8)
 +REG32(RXFIFO_ID, 0x50)
 +    FIELD(RXFIFO_ID, IDH, 21, 11)
 +    FIELD(RXFIFO_ID, SRRRTR, 20, 1)
 +    FIELD(RXFIFO_ID, IDE, 19, 1)
 +    FIELD(RXFIFO_ID, IDL, 1, 18)
 +    FIELD(RXFIFO_ID, RTR, 0, 1)
 +REG32(RXFIFO_DLC, 0x54)
 +    FIELD(RXFIFO_DLC, DLC, 28, 4)
 +    FIELD(RXFIFO_DLC, RXT, 0, 16)
 +REG32(RXFIFO_DATA1, 0x58)
 +    FIELD(RXFIFO_DATA1, DB0, 24, 8)
 +    FIELD(RXFIFO_DATA1, DB1, 16, 8)
 +    FIELD(RXFIFO_DATA1, DB2, 8, 8)
 +    FIELD(RXFIFO_DATA1, DB3, 0, 8)
 +REG32(RXFIFO_DATA2, 0x5c)
 +    FIELD(RXFIFO_DATA2, DB4, 24, 8)
 +    FIELD(RXFIFO_DATA2, DB5, 16, 8)
 +    FIELD(RXFIFO_DATA2, DB6, 8, 8)
 +    FIELD(RXFIFO_DATA2, DB7, 0, 8)
 +REG32(AFR, 0x60)
 +    FIELD(AFR, UAF4, 3, 1)
 +    FIELD(AFR, UAF3, 2, 1)
 +    FIELD(AFR, UAF2, 1, 1)
 +    FIELD(AFR, UAF1, 0, 1)
 +REG32(AFMR1, 0x64)
 +    FIELD(AFMR1, AMIDH, 21, 11)
 +    FIELD(AFMR1, AMSRR, 20, 1)
 +    FIELD(AFMR1, AMIDE, 19, 1)
 +    FIELD(AFMR1, AMIDL, 1, 18)
 +    FIELD(AFMR1, AMRTR, 0, 1)
 +REG32(AFIR1, 0x68)
 +    FIELD(AFIR1, AIIDH, 21, 11)
 +    FIELD(AFIR1, AISRR, 20, 1)
 +    FIELD(AFIR1, AIIDE, 19, 1)
 +    FIELD(AFIR1, AIIDL, 1, 18)
 +    FIELD(AFIR1, AIRTR, 0, 1)
 +REG32(AFMR2, 0x6c)
 +    FIELD(AFMR2, AMIDH, 21, 11)
 +    FIELD(AFMR2, AMSRR, 20, 1)
 +    FIELD(AFMR2, AMIDE, 19, 1)
 +    FIELD(AFMR2, AMIDL, 1, 18)
 +    FIELD(AFMR2, AMRTR, 0, 1)
 +REG32(AFIR2, 0x70)
 +    FIELD(AFIR2, AIIDH, 21, 11)
 +    FIELD(AFIR2, AISRR, 20, 1)
 +    FIELD(AFIR2, AIIDE, 19, 1)
 +    FIELD(AFIR2, AIIDL, 1, 18)
 +    FIELD(AFIR2, AIRTR, 0, 1)
 +REG32(AFMR3, 0x74)
 +    FIELD(AFMR3, AMIDH, 21, 11)
 +    FIELD(AFMR3, AMSRR, 20, 1)
 +    FIELD(AFMR3, AMIDE, 19, 1)
 +    FIELD(AFMR3, AMIDL, 1, 18)
 +    FIELD(AFMR3, AMRTR, 0, 1)
 +REG32(AFIR3, 0x78)
 +    FIELD(AFIR3, AIIDH, 21, 11)
 +    FIELD(AFIR3, AISRR, 20, 1)
 +    FIELD(AFIR3, AIIDE, 19, 1)
 +    FIELD(AFIR3, AIIDL, 1, 18)
 +    FIELD(AFIR3, AIRTR, 0, 1)
 +REG32(AFMR4, 0x7c)
 +    FIELD(AFMR4, AMIDH, 21, 11)
 +    FIELD(AFMR4, AMSRR, 20, 1)
 +    FIELD(AFMR4, AMIDE, 19, 1)
 +    FIELD(AFMR4, AMIDL, 1, 18)
 +    FIELD(AFMR4, AMRTR, 0, 1)
 +REG32(AFIR4, 0x80)
 +    FIELD(AFIR4, AIIDH, 21, 11)
 +    FIELD(AFIR4, AISRR, 20, 1)
 +    FIELD(AFIR4, AIIDE, 19, 1)
 +    FIELD(AFIR4, AIIDL, 1, 18)
 +    FIELD(AFIR4, AIRTR, 0, 1)
 +
 +static void can_update_irq(XlnxZynqMPCANState *s)
 +{
 +    uint32_t irq;
 +
 +    /* Watermark register interrupts. */
 +    if ((fifo32_num_free(&s->tx_fifo) / CAN_FRAME_SIZE) >
 +            ARRAY_FIELD_EX32(s->regs, WIR, EW)) {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, TXFWMEMP, 1);
 +    }
 +
 +    if ((fifo32_num_used(&s->rx_fifo) / CAN_FRAME_SIZE) >
 +            ARRAY_FIELD_EX32(s->regs, WIR, FW)) {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXFWMFLL, 1);
 +    }
 +
 +    /* RX Interrupts. */
 +    if (fifo32_num_used(&s->rx_fifo) >= CAN_FRAME_SIZE) {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXNEMP, 1);
 +    }
 +
 +    /* TX interrupts. */
 +    if (fifo32_is_empty(&s->tx_fifo)) {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, TXFEMP, 1);
 +    }
 +
 +    if (fifo32_is_full(&s->tx_fifo)) {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, TXFLL, 1);
 +    }
 +
 +    if (fifo32_is_full(&s->txhpb_fifo)) {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, TXBFLL, 1);
 +    }
 +
 +    irq = s->regs[R_INTERRUPT_STATUS_REGISTER];
 +    irq &= s->regs[R_INTERRUPT_ENABLE_REGISTER];
 +
 +    trace_xlnx_can_update_irq(s->regs[R_INTERRUPT_STATUS_REGISTER],
 +                              s->regs[R_INTERRUPT_ENABLE_REGISTER], irq);
 +    qemu_set_irq(s->irq, irq);
 +}
 +
 +static void can_ier_post_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    can_update_irq(s);
 +}
 +
 +static uint64_t can_icr_pre_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    s->regs[R_INTERRUPT_STATUS_REGISTER] &= ~val;
 +    can_update_irq(s);
 +
 +    return 0;
 +}
 +
 +static void can_config_reset(XlnxZynqMPCANState *s)
 +{
 +    /* Reset all the configuration registers. */
 +    register_reset(&s->reg_info[R_SOFTWARE_RESET_REGISTER]);
 +    register_reset(&s->reg_info[R_MODE_SELECT_REGISTER]);
 +    register_reset(
 +              &s->reg_info[R_ARBITRATION_PHASE_BAUD_RATE_PRESCALER_REGISTER]);
 +    register_reset(&s->reg_info[R_ARBITRATION_PHASE_BIT_TIMING_REGISTER]);
 +    register_reset(&s->reg_info[R_STATUS_REGISTER]);
 +    register_reset(&s->reg_info[R_INTERRUPT_STATUS_REGISTER]);
 +    register_reset(&s->reg_info[R_INTERRUPT_ENABLE_REGISTER]);
 +    register_reset(&s->reg_info[R_INTERRUPT_CLEAR_REGISTER]);
 +    register_reset(&s->reg_info[R_WIR]);
 +}
 +
 +static void can_config_mode(XlnxZynqMPCANState *s)
 +{
 +    register_reset(&s->reg_info[R_ERROR_COUNTER_REGISTER]);
 +    register_reset(&s->reg_info[R_ERROR_STATUS_REGISTER]);
 +
 +    /* Put XlnxZynqMPCAN in configuration mode. */
 +    ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, CONFIG, 1);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, WKUP, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, SLP, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, BSOFF, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, ERROR, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXOFLW, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXOK, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, TXOK, 0);
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, ARBLST, 0);
 +
 +    can_update_irq(s);
 +}
 +
 +static void update_status_register_mode_bits(XlnxZynqMPCANState *s)
 +{
 +    bool sleep_status = ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, SLEEP);
 +    bool sleep_mode = ARRAY_FIELD_EX32(s->regs, MODE_SELECT_REGISTER, SLEEP);
 +    /* Wake up interrupt bit. */
 +    bool wakeup_irq_val = sleep_status && (sleep_mode == 0);
 +    /* Sleep interrupt bit. */
 +    bool sleep_irq_val = sleep_mode && (sleep_status == 0);
 +
 +    /* Clear previous core mode status bits. */
 +    ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, LBACK, 0);
 +    ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, SLEEP, 0);
 +    ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, SNOOP, 0);
 +    ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, NORMAL, 0);
 +
 +    /* set current mode bit and generate irqs accordingly. */
 +    if (ARRAY_FIELD_EX32(s->regs, MODE_SELECT_REGISTER, LBACK)) {
 +        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, LBACK, 1);
 +    } else if (ARRAY_FIELD_EX32(s->regs, MODE_SELECT_REGISTER, SLEEP)) {
 +        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, SLEEP, 1);
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, SLP,
 +                         sleep_irq_val);
 +    } else if (ARRAY_FIELD_EX32(s->regs, MODE_SELECT_REGISTER, SNOOP)) {
 +        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, SNOOP, 1);
 +    } else {
 +        /*
-+         * Initialize the value of read_ack_register to 1, so GHES can be
++         * If all bits are zero then XlnxZynqMPCAN is set in normal mode.
 +         * writeable after (re)boot.
 +         * ACPI 6.2: 18.3.2.8 Generic Hardware Error Source version 2
 +         * (GHESv2 - Type 10)
 +         */
-+        build_append_int_noprefix(hardware_errors, 1, sizeof(uint64_t));
++        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, NORMAL, 1);
-+    }
++        /* Set wakeup interrupt bit. */
-+
++        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, WKUP,
-+    /* Generic Error Status Block offset in the hardware error fw_cfg blob */
++                         wakeup_irq_val);
-+    error_status_block_offset = hardware_errors->len;
++    }
 +
-+    /* Reserve space for Error Status Data Block */
++    can_update_irq(s);
-+    acpi_data_push(hardware_errors,
++}
-+        ACPI_GHES_MAX_RAW_DATA_LENGTH * ACPI_GHES_ERROR_SOURCE_COUNT);
++
-+
++static void can_exit_sleep_mode(XlnxZynqMPCANState *s)
-+    /* Tell guest firmware to place hardware_errors blob into RAM */
++{
-+    bios_linker_loader_alloc(linker, ACPI_GHES_ERRORS_FW_CFG_FILE,
++    ARRAY_FIELD_DP32(s->regs, MODE_SELECT_REGISTER, SLEEP, 0);
-+                             hardware_errors, sizeof(uint64_t), false);
++    update_status_register_mode_bits(s);
-+
++}
-+    for (i = 0; i < ACPI_GHES_ERROR_SOURCE_COUNT; i++) {
++
 +static void generate_frame(qemu_can_frame *frame, uint32_t *data)
 +{
 +    frame->can_id = data[0];
 +    frame->can_dlc = FIELD_EX32(data[1], TXFIFO_DLC, DLC);
 +
 +    frame->data[0] = FIELD_EX32(data[2], TXFIFO_DATA1, DB3);
 +    frame->data[1] = FIELD_EX32(data[2], TXFIFO_DATA1, DB2);
 +    frame->data[2] = FIELD_EX32(data[2], TXFIFO_DATA1, DB1);
 +    frame->data[3] = FIELD_EX32(data[2], TXFIFO_DATA1, DB0);
 +
 +    frame->data[4] = FIELD_EX32(data[3], TXFIFO_DATA2, DB7);
 +    frame->data[5] = FIELD_EX32(data[3], TXFIFO_DATA2, DB6);
 +    frame->data[6] = FIELD_EX32(data[3], TXFIFO_DATA2, DB5);
 +    frame->data[7] = FIELD_EX32(data[3], TXFIFO_DATA2, DB4);
 +}
 +
 +static bool tx_ready_check(XlnxZynqMPCANState *s)
 +{
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, SRST)) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Attempting to transfer data while"
 +                      " data while controller is in reset mode.\n",
 +                      path);
 +        return false;
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN) == 0) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Attempting to transfer"
 +                      " data while controller is in configuration mode. Reset"
 +                      " the core so operations can start fresh.\n",
 +                      path);
 +        return false;
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, SNOOP)) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Attempting to transfer"
 +                      " data while controller is in SNOOP MODE.\n",
 +                      path);
 +        return false;
 +    }
 +
 +    return true;
 +}
 +
 +static void transfer_fifo(XlnxZynqMPCANState *s, Fifo32 *fifo)
 +{
 +    qemu_can_frame frame;
 +    uint32_t data[CAN_FRAME_SIZE];
 +    int i;
 +    bool can_tx = tx_ready_check(s);
 +
 +    if (!can_tx) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Controller is not enabled for data"
 +                      " transfer.\n", path);
 +        can_update_irq(s);
 +        return;
 +    }
 +
 +    while (!fifo32_is_empty(fifo)) {
 +        for (i = 0; i < CAN_FRAME_SIZE; i++) {
 +            data[i] = fifo32_pop(fifo);
 +        }
 +
 +        if (ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, LBACK)) {
 +            /*
 +             * Controller is in loopback. In Loopback mode, the CAN core
 +             * transmits a recessive bitstream on to the XlnxZynqMPCAN Bus.
 +             * Any message transmitted is looped back to the RX line and
 +             * acknowledged. The XlnxZynqMPCAN core receives any message
 +             * that it transmits.
 +             */
 +            if (fifo32_is_full(&s->rx_fifo)) {
 +                ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXOFLW, 1);
 +            } else {
 +                for (i = 0; i < CAN_FRAME_SIZE; i++) {
 +                    fifo32_push(&s->rx_fifo, data[i]);
 +                }
 +
 +                ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXOK, 1);
 +            }
 +        } else {
 +            /* Normal mode Tx. */
 +            generate_frame(&frame, data);
 +
 +            trace_xlnx_can_tx_data(frame.can_id, frame.can_dlc,
 +                                   frame.data[0], frame.data[1],
 +                                   frame.data[2], frame.data[3],
 +                                   frame.data[4], frame.data[5],
 +                                   frame.data[6], frame.data[7]);
 +            can_bus_client_send(&s->bus_client, &frame, 1);
 +        }
 +    }
 +
 +    ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, TXOK, 1);
 +    ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, TXBFLL, 0);
 +
 +    if (ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, SLEEP)) {
 +        can_exit_sleep_mode(s);
 +    }
 +
 +    can_update_irq(s);
 +}
 +
 +static uint64_t can_srr_pre_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    ARRAY_FIELD_DP32(s->regs, SOFTWARE_RESET_REGISTER, CEN,
 +                     FIELD_EX32(val, SOFTWARE_RESET_REGISTER, CEN));
 +
 +    if (FIELD_EX32(val, SOFTWARE_RESET_REGISTER, SRST)) {
 +        trace_xlnx_can_reset(val);
 +
 +        /* First, core will do software reset then will enter in config mode. */
 +        can_config_reset(s);
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN) == 0) {
 +        can_config_mode(s);
 +    } else {
 +        /*
-+         * Tell firmware to patch error_block_address entries to point to
++         * Leave config mode. Now XlnxZynqMPCAN core will enter normal,
-+         * corresponding "Generic Error Status Block"
++         * sleep, snoop or loopback mode depending upon LBACK, SLEEP, SNOOP
 +         * register states.
 +         */
-+        bios_linker_loader_add_pointer(linker,
++        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, CONFIG, 0);
-+            ACPI_GHES_ERRORS_FW_CFG_FILE, sizeof(uint64_t) * i,
++
-+            sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE,
++        ptimer_transaction_begin(s->can_timer);
-+            error_status_block_offset + i * ACPI_GHES_MAX_RAW_DATA_LENGTH);
++        ptimer_set_count(s->can_timer, 0);
-+    }
++        ptimer_transaction_commit(s->can_timer);
 +
 +        /* XlnxZynqMPCAN is out of config mode. It will send pending data. */
 +        transfer_fifo(s, &s->txhpb_fifo);
 +        transfer_fifo(s, &s->tx_fifo);
 +    }
 +
 +    update_status_register_mode_bits(s);
 +
 +    return s->regs[R_SOFTWARE_RESET_REGISTER];
 +}
 +
 +static uint64_t can_msr_pre_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +    uint8_t multi_mode;
 +
 +    /*
-+     * tell firmware to write hardware_errors GPA into
++     * Multiple mode set check. This is done to make sure user doesn't set
-+     * hardware_errors_addr fw_cfg, once the former has been initialized.
++     * multiple modes.
 +     */
-+    bios_linker_loader_write_pointer(linker, ACPI_GHES_DATA_ADDR_FW_CFG_FILE,
++    multi_mode = FIELD_EX32(val, MODE_SELECT_REGISTER, LBACK) +
-+        0, sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE, 0);
++                 FIELD_EX32(val, MODE_SELECT_REGISTER, SLEEP) +
-+}
++                 FIELD_EX32(val, MODE_SELECT_REGISTER, SNOOP);
-diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
++
 +    if (multi_mode > 1) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Attempting to config"
 +                      " several modes simultaneously. One mode will be selected"
 +                      " according to their priority: LBACK > SLEEP > SNOOP.\n",
 +                      path);
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN) == 0) {
 +        /* We are in configuration mode, any mode can be selected. */
 +        s->regs[R_MODE_SELECT_REGISTER] = val;
 +    } else {
 +        bool sleep_mode_bit = FIELD_EX32(val, MODE_SELECT_REGISTER, SLEEP);
 +
 +        ARRAY_FIELD_DP32(s->regs, MODE_SELECT_REGISTER, SLEEP, sleep_mode_bit);
 +
 +        if (FIELD_EX32(val, MODE_SELECT_REGISTER, LBACK)) {
 +            g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +            qemu_log_mask(LOG_GUEST_ERROR, "%s: Attempting to set"
 +                          " LBACK mode without setting CEN bit as 0.\n",
 +                          path);
 +        } else if (FIELD_EX32(val, MODE_SELECT_REGISTER, SNOOP)) {
 +            g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +            qemu_log_mask(LOG_GUEST_ERROR, "%s: Attempting to set"
 +                          " SNOOP mode without setting CEN bit as 0.\n",
 +                          path);
 +        }
 +
 +        update_status_register_mode_bits(s);
 +    }
 +
 +    return s->regs[R_MODE_SELECT_REGISTER];
 +}
 +
 +static uint64_t can_brpr_pre_write(RegisterInfo  *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    /* Only allow writes when in config mode. */
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN)) {
 +        return s->regs[R_ARBITRATION_PHASE_BAUD_RATE_PRESCALER_REGISTER];
 +    }
 +
 +    return val;
 +}
 +
 +static uint64_t can_btr_pre_write(RegisterInfo  *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    /* Only allow writes when in config mode. */
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN)) {
 +        return s->regs[R_ARBITRATION_PHASE_BIT_TIMING_REGISTER];
 +    }
 +
 +    return val;
 +}
 +
 +static uint64_t can_tcr_pre_write(RegisterInfo  *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    if (FIELD_EX32(val, TIMESTAMP_REGISTER, CTS)) {
 +        ptimer_transaction_begin(s->can_timer);
 +        ptimer_set_count(s->can_timer, 0);
 +        ptimer_transaction_commit(s->can_timer);
 +    }
 +
 +    return 0;
 +}
 +
 +static void update_rx_fifo(XlnxZynqMPCANState *s, const qemu_can_frame *frame)
 +{
 +    bool filter_pass = false;
 +    uint16_t timestamp = 0;
 +
 +    /* If no filter is enabled. Message will be stored in FIFO. */
 +    if (!((ARRAY_FIELD_EX32(s->regs, AFR, UAF1)) |
 +       (ARRAY_FIELD_EX32(s->regs, AFR, UAF2)) |
 +       (ARRAY_FIELD_EX32(s->regs, AFR, UAF3)) |
 +       (ARRAY_FIELD_EX32(s->regs, AFR, UAF4)))) {
 +        filter_pass = true;
 +    }
 +
 +    /*
 +     * Messages that pass any of the acceptance filters will be stored in
 +     * the RX FIFO.
 +     */
 +    if (ARRAY_FIELD_EX32(s->regs, AFR, UAF1)) {
 +        uint32_t id_masked = s->regs[R_AFMR1] & frame->can_id;
 +        uint32_t filter_id_masked = s->regs[R_AFMR1] & s->regs[R_AFIR1];
 +
 +        if (filter_id_masked == id_masked) {
 +            filter_pass = true;
 +        }
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, AFR, UAF2)) {
 +        uint32_t id_masked = s->regs[R_AFMR2] & frame->can_id;
 +        uint32_t filter_id_masked = s->regs[R_AFMR2] & s->regs[R_AFIR2];
 +
 +        if (filter_id_masked == id_masked) {
 +            filter_pass = true;
 +        }
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, AFR, UAF3)) {
 +        uint32_t id_masked = s->regs[R_AFMR3] & frame->can_id;
 +        uint32_t filter_id_masked = s->regs[R_AFMR3] & s->regs[R_AFIR3];
 +
 +        if (filter_id_masked == id_masked) {
 +            filter_pass = true;
 +        }
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, AFR, UAF4)) {
 +        uint32_t id_masked = s->regs[R_AFMR4] & frame->can_id;
 +        uint32_t filter_id_masked = s->regs[R_AFMR4] & s->regs[R_AFIR4];
 +
 +        if (filter_id_masked == id_masked) {
 +            filter_pass = true;
 +        }
 +    }
 +
 +    if (!filter_pass) {
 +        trace_xlnx_can_rx_fifo_filter_reject(frame->can_id, frame->can_dlc);
 +        return;
 +    }
 +
 +    /* Store the message in fifo if it passed through any of the filters. */
 +    if (filter_pass && frame->can_dlc <= MAX_DLC) {
 +
 +        if (fifo32_is_full(&s->rx_fifo)) {
 +            ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXOFLW, 1);
 +        } else {
 +            timestamp = CAN_TIMER_MAX - ptimer_get_count(s->can_timer);
 +
 +            fifo32_push(&s->rx_fifo, frame->can_id);
 +
 +            fifo32_push(&s->rx_fifo, deposit32(0, R_RXFIFO_DLC_DLC_SHIFT,
 +                                               R_RXFIFO_DLC_DLC_LENGTH,
 +                                               frame->can_dlc) |
 +                                     deposit32(0, R_RXFIFO_DLC_RXT_SHIFT,
 +                                               R_RXFIFO_DLC_RXT_LENGTH,
 +                                               timestamp));
 +
 +            /* First 32 bit of the data. */
 +            fifo32_push(&s->rx_fifo, deposit32(0, R_TXFIFO_DATA1_DB3_SHIFT,
 +                                               R_TXFIFO_DATA1_DB3_LENGTH,
 +                                               frame->data[0]) |
 +                                     deposit32(0, R_TXFIFO_DATA1_DB2_SHIFT,
 +                                               R_TXFIFO_DATA1_DB2_LENGTH,
 +                                               frame->data[1]) |
 +                                     deposit32(0, R_TXFIFO_DATA1_DB1_SHIFT,
 +                                               R_TXFIFO_DATA1_DB1_LENGTH,
 +                                               frame->data[2]) |
 +                                     deposit32(0, R_TXFIFO_DATA1_DB0_SHIFT,
 +                                               R_TXFIFO_DATA1_DB0_LENGTH,
 +                                               frame->data[3]));
 +            /* Last 32 bit of the data. */
 +            fifo32_push(&s->rx_fifo, deposit32(0, R_TXFIFO_DATA2_DB7_SHIFT,
 +                                               R_TXFIFO_DATA2_DB7_LENGTH,
 +                                               frame->data[4]) |
 +                                     deposit32(0, R_TXFIFO_DATA2_DB6_SHIFT,
 +                                               R_TXFIFO_DATA2_DB6_LENGTH,
 +                                               frame->data[5]) |
 +                                     deposit32(0, R_TXFIFO_DATA2_DB5_SHIFT,
 +                                               R_TXFIFO_DATA2_DB5_LENGTH,
 +                                               frame->data[6]) |
 +                                     deposit32(0, R_TXFIFO_DATA2_DB4_SHIFT,
 +                                               R_TXFIFO_DATA2_DB4_LENGTH,
 +                                               frame->data[7]));
 +
 +            ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXOK, 1);
 +            trace_xlnx_can_rx_data(frame->can_id, frame->can_dlc,
 +                                   frame->data[0], frame->data[1],
 +                                   frame->data[2], frame->data[3],
 +                                   frame->data[4], frame->data[5],
 +                                   frame->data[6], frame->data[7]);
 +        }
 +
 +        can_update_irq(s);
 +    }
 +}
 +
 +static uint64_t can_rxfifo_pre_read(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    if (!fifo32_is_empty(&s->rx_fifo)) {
 +        val = fifo32_pop(&s->rx_fifo);
 +    } else {
 +        ARRAY_FIELD_DP32(s->regs, INTERRUPT_STATUS_REGISTER, RXUFLW, 1);
 +    }
 +
 +    can_update_irq(s);
 +    return val;
 +}
 +
 +static void can_filter_enable_post_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    if (ARRAY_FIELD_EX32(s->regs, AFR, UAF1) &&
 +        ARRAY_FIELD_EX32(s->regs, AFR, UAF2) &&
 +        ARRAY_FIELD_EX32(s->regs, AFR, UAF3) &&
 +        ARRAY_FIELD_EX32(s->regs, AFR, UAF4)) {
 +        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, ACFBSY, 1);
 +    } else {
 +        ARRAY_FIELD_DP32(s->regs, STATUS_REGISTER, ACFBSY, 0);
 +    }
 +}
 +
 +static uint64_t can_filter_mask_pre_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +    uint32_t reg_idx = (reg->access->addr) / 4;
 +    uint32_t filter_number = (reg_idx - R_AFMR1) / 2;
 +
 +    /* modify an acceptance filter, the corresponding UAF bit should be '0'. */
 +    if (!(s->regs[R_AFR] & (1 << filter_number))) {
 +        s->regs[reg_idx] = val;
 +
 +        trace_xlnx_can_filter_mask_pre_write(filter_number, s->regs[reg_idx]);
 +    } else {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Acceptance filter %d"
 +                      " mask is not set as corresponding UAF bit is not 0.\n",
 +                      path, filter_number + 1);
 +    }
 +
 +    return s->regs[reg_idx];
 +}
 +
 +static uint64_t can_filter_id_pre_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +    uint32_t reg_idx = (reg->access->addr) / 4;
 +    uint32_t filter_number = (reg_idx - R_AFIR1) / 2;
 +
 +    if (!(s->regs[R_AFR] & (1 << filter_number))) {
 +        s->regs[reg_idx] = val;
 +
 +        trace_xlnx_can_filter_id_pre_write(filter_number, s->regs[reg_idx]);
 +    } else {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Acceptance filter %d"
 +                      " id is not set as corresponding UAF bit is not 0.\n",
 +                      path, filter_number + 1);
 +    }
 +
 +    return s->regs[reg_idx];
 +}
 +
 +static void can_tx_post_write(RegisterInfo *reg, uint64_t val)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(reg->opaque);
 +
 +    bool is_txhpb = reg->access->addr > A_TXFIFO_DATA2;
 +
 +    bool initiate_transfer = (reg->access->addr == A_TXFIFO_DATA2) ||
 +                             (reg->access->addr == A_TXHPB_DATA2);
 +
 +    Fifo32 *f = is_txhpb ? &s->txhpb_fifo : &s->tx_fifo;
 +
 +    if (!fifo32_is_full(f)) {
 +        fifo32_push(f, val);
 +    } else {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: TX FIFO is full.\n", path);
 +    }
 +
 +    /* Initiate the message send if TX register is written. */
 +    if (initiate_transfer &&
 +        ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN)) {
 +        transfer_fifo(s, f);
 +    }
 +
 +    can_update_irq(s);
 +}
 +
 +static const RegisterAccessInfo can_regs_info[] = {
 +    {   .name = "SOFTWARE_RESET_REGISTER",
 +        .addr = A_SOFTWARE_RESET_REGISTER,
 +        .rsvd = 0xfffffffc,
 +        .pre_write = can_srr_pre_write,
 +    },{ .name = "MODE_SELECT_REGISTER",
 +        .addr = A_MODE_SELECT_REGISTER,
 +        .rsvd = 0xfffffff8,
 +        .pre_write = can_msr_pre_write,
 +    },{ .name = "ARBITRATION_PHASE_BAUD_RATE_PRESCALER_REGISTER",
 +        .addr = A_ARBITRATION_PHASE_BAUD_RATE_PRESCALER_REGISTER,
 +        .rsvd = 0xffffff00,
 +        .pre_write = can_brpr_pre_write,
 +    },{ .name = "ARBITRATION_PHASE_BIT_TIMING_REGISTER",
 +        .addr = A_ARBITRATION_PHASE_BIT_TIMING_REGISTER,
 +        .rsvd = 0xfffffe00,
 +        .pre_write = can_btr_pre_write,
 +    },{ .name = "ERROR_COUNTER_REGISTER",
 +        .addr = A_ERROR_COUNTER_REGISTER,
 +        .rsvd = 0xffff0000,
 +        .ro = 0xffffffff,
 +    },{ .name = "ERROR_STATUS_REGISTER",
 +        .addr = A_ERROR_STATUS_REGISTER,
 +        .rsvd = 0xffffffe0,
 +        .w1c = 0x1f,
 +    },{ .name = "STATUS_REGISTER",  .addr = A_STATUS_REGISTER,
 +        .reset = 0x1,
 +        .rsvd = 0xffffe000,
 +        .ro = 0x1fff,
 +    },{ .name = "INTERRUPT_STATUS_REGISTER",
 +        .addr = A_INTERRUPT_STATUS_REGISTER,
 +        .reset = 0x6000,
 +        .rsvd = 0xffff8000,
 +        .ro = 0x7fff,
 +    },{ .name = "INTERRUPT_ENABLE_REGISTER",
 +        .addr = A_INTERRUPT_ENABLE_REGISTER,
 +        .rsvd = 0xffff8000,
 +        .post_write = can_ier_post_write,
 +    },{ .name = "INTERRUPT_CLEAR_REGISTER",
 +        .addr = A_INTERRUPT_CLEAR_REGISTER,
 +        .rsvd = 0xffff8000,
 +        .pre_write = can_icr_pre_write,
 +    },{ .name = "TIMESTAMP_REGISTER",
 +        .addr = A_TIMESTAMP_REGISTER,
 +        .rsvd = 0xfffffffe,
 +        .pre_write = can_tcr_pre_write,
 +    },{ .name = "WIR",  .addr = A_WIR,
 +        .reset = 0x3f3f,
 +        .rsvd = 0xffff0000,
 +    },{ .name = "TXFIFO_ID",  .addr = A_TXFIFO_ID,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXFIFO_DLC",  .addr = A_TXFIFO_DLC,
 +        .rsvd = 0xfffffff,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXFIFO_DATA1",  .addr = A_TXFIFO_DATA1,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXFIFO_DATA2",  .addr = A_TXFIFO_DATA2,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXHPB_ID",  .addr = A_TXHPB_ID,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXHPB_DLC",  .addr = A_TXHPB_DLC,
 +        .rsvd = 0xfffffff,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXHPB_DATA1",  .addr = A_TXHPB_DATA1,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "TXHPB_DATA2",  .addr = A_TXHPB_DATA2,
 +        .post_write = can_tx_post_write,
 +    },{ .name = "RXFIFO_ID",  .addr = A_RXFIFO_ID,
 +        .ro = 0xffffffff,
 +        .post_read = can_rxfifo_pre_read,
 +    },{ .name = "RXFIFO_DLC",  .addr = A_RXFIFO_DLC,
 +        .rsvd = 0xfff0000,
 +        .post_read = can_rxfifo_pre_read,
 +    },{ .name = "RXFIFO_DATA1",  .addr = A_RXFIFO_DATA1,
 +        .post_read = can_rxfifo_pre_read,
 +    },{ .name = "RXFIFO_DATA2",  .addr = A_RXFIFO_DATA2,
 +        .post_read = can_rxfifo_pre_read,
 +    },{ .name = "AFR",  .addr = A_AFR,
 +        .rsvd = 0xfffffff0,
 +        .post_write = can_filter_enable_post_write,
 +    },{ .name = "AFMR1",  .addr = A_AFMR1,
 +        .pre_write = can_filter_mask_pre_write,
 +    },{ .name = "AFIR1",  .addr = A_AFIR1,
 +        .pre_write = can_filter_id_pre_write,
 +    },{ .name = "AFMR2",  .addr = A_AFMR2,
 +        .pre_write = can_filter_mask_pre_write,
 +    },{ .name = "AFIR2",  .addr = A_AFIR2,
 +        .pre_write = can_filter_id_pre_write,
 +    },{ .name = "AFMR3",  .addr = A_AFMR3,
 +        .pre_write = can_filter_mask_pre_write,
 +    },{ .name = "AFIR3",  .addr = A_AFIR3,
 +        .pre_write = can_filter_id_pre_write,
 +    },{ .name = "AFMR4",  .addr = A_AFMR4,
 +        .pre_write = can_filter_mask_pre_write,
 +    },{ .name = "AFIR4",  .addr = A_AFIR4,
 +        .pre_write = can_filter_id_pre_write,
 +    }
 +};
 +
 +static void xlnx_zynqmp_can_ptimer_cb(void *opaque)
 +{
 +    /* No action required on the timer rollover. */
 +}
 +
 +static const MemoryRegionOps can_ops = {
 +    .read = register_read_memory,
 +    .write = register_write_memory,
 +    .endianness = DEVICE_LITTLE_ENDIAN,
 +    .valid = {
 +        .min_access_size = 4,
 +        .max_access_size = 4,
 +    },
 +};
 +
 +static void xlnx_zynqmp_can_reset_init(Object *obj, ResetType type)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(obj);
 +    unsigned int i;
 +
 +    for (i = R_RXFIFO_ID; i < ARRAY_SIZE(s->reg_info); ++i) {
 +        register_reset(&s->reg_info[i]);
 +    }
 +
 +    ptimer_transaction_begin(s->can_timer);
 +    ptimer_set_count(s->can_timer, 0);
 +    ptimer_transaction_commit(s->can_timer);
 +}
 +
 +static void xlnx_zynqmp_can_reset_hold(Object *obj)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(obj);
 +    unsigned int i;
 +
 +    for (i = 0; i < R_RXFIFO_ID; ++i) {
 +        register_reset(&s->reg_info[i]);
 +    }
 +
 +    /*
 +     * Reset FIFOs when CAN model is reset. This will clear the fifo writes
 +     * done by post_write which gets called from register_reset function,
 +     * post_write handle will not be able to trigger tx because CAN will be
 +     * disabled when software_reset_register is cleared first.
 +     */
 +    fifo32_reset(&s->rx_fifo);
 +    fifo32_reset(&s->tx_fifo);
 +    fifo32_reset(&s->txhpb_fifo);
 +}
 +
 +static bool xlnx_zynqmp_can_can_receive(CanBusClientState *client)
 +{
 +    XlnxZynqMPCANState *s = container_of(client, XlnxZynqMPCANState,
 +                                         bus_client);
 +
 +    if (ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, SRST)) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Controller is in reset state.\n",
 +                      path);
 +        return false;
 +    }
 +
 +    if ((ARRAY_FIELD_EX32(s->regs, SOFTWARE_RESET_REGISTER, CEN)) == 0) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Controller is disabled. Incoming"
 +                      " messages will be discarded.\n", path);
 +        return false;
 +    }
 +
 +    return true;
 +}
 +
 +static ssize_t xlnx_zynqmp_can_receive(CanBusClientState *client,
 +                               const qemu_can_frame *buf, size_t buf_size) {
 +    XlnxZynqMPCANState *s = container_of(client, XlnxZynqMPCANState,
 +                                         bus_client);
 +    const qemu_can_frame *frame = buf;
 +
 +    if (buf_size <= 0) {
 +        g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Error in the data received.\n",
 +                      path);
 +        return 0;
 +    }
 +
 +    if (ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, SNOOP)) {
 +        /* Snoop Mode: Just keep the data. no response back. */
 +        update_rx_fifo(s, frame);
 +    } else if ((ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, SLEEP))) {
 +        /*
 +         * XlnxZynqMPCAN is in sleep mode. Any data on bus will bring it to wake
 +         * up state.
 +         */
 +        can_exit_sleep_mode(s);
 +        update_rx_fifo(s, frame);
 +    } else if ((ARRAY_FIELD_EX32(s->regs, STATUS_REGISTER, SLEEP)) == 0) {
 +        update_rx_fifo(s, frame);
 +    } else {
 +        /*
 +         * XlnxZynqMPCAN will not participate in normal bus communication
 +         * and will not receive any messages transmitted by other CAN nodes.
 +         */
 +        trace_xlnx_can_rx_discard(s->regs[R_STATUS_REGISTER]);
 +    }
 +
 +    return 1;
 +}
 +
 +static CanBusClientInfo can_xilinx_bus_client_info = {
 +    .can_receive = xlnx_zynqmp_can_can_receive,
 +    .receive = xlnx_zynqmp_can_receive,
 +};
 +
 +static int xlnx_zynqmp_can_connect_to_bus(XlnxZynqMPCANState *s,
 +                                          CanBusState *bus)
 +{
 +    s->bus_client.info = &can_xilinx_bus_client_info;
 +
 +    if (can_bus_insert_client(bus, &s->bus_client) < 0) {
 +        return -1;
 +    }
 +    return 0;
 +}
 +
 +static void xlnx_zynqmp_can_realize(DeviceState *dev, Error **errp)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(dev);
 +
 +    if (s->canbus) {
 +        if (xlnx_zynqmp_can_connect_to_bus(s, s->canbus) < 0) {
 +            g_autofree char *path = object_get_canonical_path(OBJECT(s));
 +
 +            error_setg(errp, "%s: xlnx_zynqmp_can_connect_to_bus"
 +                       " failed.", path);
 +            return;
 +        }
 +    }
 +
 +    /* Create RX FIFO, TXFIFO, TXHPB storage. */
 +    fifo32_create(&s->rx_fifo, RXFIFO_SIZE);
 +    fifo32_create(&s->tx_fifo, RXFIFO_SIZE);
 +    fifo32_create(&s->txhpb_fifo, CAN_FRAME_SIZE);
 +
 +    /* Allocate a new timer. */
 +    s->can_timer = ptimer_init(xlnx_zynqmp_can_ptimer_cb, s,
 +                               PTIMER_POLICY_DEFAULT);
 +
 +    ptimer_transaction_begin(s->can_timer);
 +
 +    ptimer_set_freq(s->can_timer, s->cfg.ext_clk_freq);
 +    ptimer_set_limit(s->can_timer, CAN_TIMER_MAX, 1);
 +    ptimer_run(s->can_timer, 0);
 +    ptimer_transaction_commit(s->can_timer);
 +}
 +
 +static void xlnx_zynqmp_can_init(Object *obj)
 +{
 +    XlnxZynqMPCANState *s = XLNX_ZYNQMP_CAN(obj);
 +    SysBusDevice *sbd = SYS_BUS_DEVICE(obj);
 +
 +    RegisterInfoArray *reg_array;
 +
 +    memory_region_init(&s->iomem, obj, TYPE_XLNX_ZYNQMP_CAN,
 +                        XLNX_ZYNQMP_CAN_R_MAX * 4);
 +    reg_array = register_init_block32(DEVICE(obj), can_regs_info,
 +                               ARRAY_SIZE(can_regs_info),
 +                               s->reg_info, s->regs,
 +                               &can_ops,
 +                               XLNX_ZYNQMP_CAN_ERR_DEBUG,
 +                               XLNX_ZYNQMP_CAN_R_MAX * 4);
 +
 +    memory_region_add_subregion(&s->iomem, 0x00, &reg_array->mem);
 +    sysbus_init_mmio(sbd, &s->iomem);
 +    sysbus_init_irq(SYS_BUS_DEVICE(obj), &s->irq);
 +}
 +
 +static const VMStateDescription vmstate_can = {
 +    .name = TYPE_XLNX_ZYNQMP_CAN,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_FIFO32(rx_fifo, XlnxZynqMPCANState),
 +        VMSTATE_FIFO32(tx_fifo, XlnxZynqMPCANState),
 +        VMSTATE_FIFO32(txhpb_fifo, XlnxZynqMPCANState),
 +        VMSTATE_UINT32_ARRAY(regs, XlnxZynqMPCANState, XLNX_ZYNQMP_CAN_R_MAX),
 +        VMSTATE_PTIMER(can_timer, XlnxZynqMPCANState),
 +        VMSTATE_END_OF_LIST(),
 +    }
 +};
 +
 +static Property xlnx_zynqmp_can_properties[] = {
 +    DEFINE_PROP_UINT32("ext_clk_freq", XlnxZynqMPCANState, cfg.ext_clk_freq,
 +                       CAN_DEFAULT_CLOCK),
 +    DEFINE_PROP_LINK("canbus", XlnxZynqMPCANState, canbus, TYPE_CAN_BUS,
 +                     CanBusState *),
 +    DEFINE_PROP_END_OF_LIST(),
 +};
 +
 +static void xlnx_zynqmp_can_class_init(ObjectClass *klass, void *data)
 +{
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +    ResettableClass *rc = RESETTABLE_CLASS(klass);
 +
 +    rc->phases.enter = xlnx_zynqmp_can_reset_init;
 +    rc->phases.hold = xlnx_zynqmp_can_reset_hold;
 +    dc->realize = xlnx_zynqmp_can_realize;
 +    device_class_set_props(dc, xlnx_zynqmp_can_properties);
 +    dc->vmsd = &vmstate_can;
 +}
 +
 +static const TypeInfo can_info = {
 +    .name          = TYPE_XLNX_ZYNQMP_CAN,
 +    .parent        = TYPE_SYS_BUS_DEVICE,
 +    .instance_size = sizeof(XlnxZynqMPCANState),
 +    .class_init    = xlnx_zynqmp_can_class_init,
 +    .instance_init = xlnx_zynqmp_can_init,
 +};
 +
 +static void can_register_types(void)
 +{
 +    type_register_static(&can_info);
 +}
 +
 +type_init(can_register_types)
 diff --git a/hw/Kconfig b/hw/Kconfig
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/virt-acpi-build.c
+--- a/hw/Kconfig
-+++ b/hw/arm/virt-acpi-build.c
++++ b/hw/Kconfig
@@ -XXX,XX +XXX,XX @@ config XILINX_AXI
  config XLNX_ZYNQMP
      bool
      select REGISTER
 +    select CAN_BUS
 diff --git a/hw/net/can/meson.build b/hw/net/can/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/net/can/meson.build
 +++ b/hw/net/can/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_CAN_PCI', if_true: files('can_pcm3680_pci.c'))
  softmmu_ss.add(when: 'CONFIG_CAN_PCI', if_true: files('can_mioe3680_pci.c'))
  softmmu_ss.add(when: 'CONFIG_CAN_CTUCANFD', if_true: files('ctucan_core.c'))
  softmmu_ss.add(when: 'CONFIG_CAN_CTUCANFD_PCI', if_true: files('ctucan_pci.c'))
 +softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP', if_true: files('xlnx-zynqmp-can.c'))
 diff --git a/hw/net/can/trace-events b/hw/net/can/trace-events
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/net/can/trace-events
 @@ -XXX,XX +XXX,XX @@
- #include "sysemu/reset.h"
++# xlnx-zynqmp-can.c
- #include "kvm_arm.h"
++xlnx_can_update_irq(uint32_t isr, uint32_t ier, uint32_t irq) "ISR: 0x%08x IER: 0x%08x IRQ: 0x%08x"
- #include "migration/vmstate.h"
++xlnx_can_reset(uint32_t val) "Resetting controller with value = 0x%08x"
-+#include "hw/acpi/ghes.h"
++xlnx_can_rx_fifo_filter_reject(uint32_t id, uint8_t dlc) "Frame: ID: 0x%08x DLC: 0x%02x"
++xlnx_can_filter_id_pre_write(uint8_t filter_num, uint32_t value) "Filter%d ID: 0x%08x"
- #define ARM_SPI_BASE 32
++xlnx_can_filter_mask_pre_write(uint8_t filter_num, uint32_t value) "Filter%d MASK: 0x%08x"
++xlnx_can_tx_data(uint32_t id, uint8_t dlc, uint8_t db0, uint8_t db1, uint8_t db2, uint8_t db3, uint8_t db4, uint8_t db5, uint8_t db6, uint8_t db7) "Frame: ID: 0x%08x DLC: 0x%02x DATA: 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x"
-@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
++xlnx_can_rx_data(uint32_t id, uint32_t dlc, uint8_t db0, uint8_t db1, uint8_t db2, uint8_t db3, uint8_t db4, uint8_t db5, uint8_t db6, uint8_t db7) "Frame: ID: 0x%08x DLC: 0x%02x DATA: 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x 0x%02x"
-     acpi_add_table(table_offsets, tables_blob);
++xlnx_can_rx_discard(uint32_t status) "Controller is not enabled for bus communication. Status Register: 0x%08x"
      build_spcr(tables_blob, tables->linker, vms);
 +    if (vms->ras) {
 +        build_ghes_error_table(tables->hardware_errors, tables->linker);
 +    }
 +
      if (ms->numa_state->num_nodes > 0) {
          acpi_add_table(table_offsets, tables_blob);
          build_srat(tables_blob, tables->linker, vms);
 diff --git a/hw/acpi/Kconfig b/hw/acpi/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/Kconfig
 +++ b/hw/acpi/Kconfig
@@ -XXX,XX +XXX,XX @@ config ACPI_HMAT
      bool
      depends on ACPI
 +config ACPI_APEI
 +    bool
 +    depends on ACPI
 +
  config ACPI_PCI
      bool
      depends on ACPI && PCI
 diff --git a/hw/acpi/Makefile.objs b/hw/acpi/Makefile.objs
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/Makefile.objs
 +++ b/hw/acpi/Makefile.objs
@@ -XXX,XX +XXX,XX @@ common-obj-$(CONFIG_ACPI_NVDIMM) += nvdimm.o
  common-obj-$(CONFIG_ACPI_VMGENID) += vmgenid.o
  common-obj-$(CONFIG_ACPI_HW_REDUCED) += generic_event_device.o
  common-obj-$(CONFIG_ACPI_HMAT) += hmat.o
 +common-obj-$(CONFIG_ACPI_APEI) += ghes.o
  common-obj-$(call lnot,$(CONFIG_ACPI_X86)) += acpi-stub.o
  common-obj-$(call lnot,$(CONFIG_PC)) += acpi-x86-stub.o
 --
 .20.1

-[PULL 24/45] ACPI: Record the Generic Error Status Block address
+[PULL 03/36] xlnx-zynqmp: Connect Xilinx ZynqMP CAN controllers
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Vikram Garhwal <fnu.vikram@xilinx.com>
-Record the GHEB address via fw_cfg file, when recording
+Connect CAN0 and CAN1 on the ZynqMP.
 a error to CPER, it will use this address to find out
 Generic Error Data Entries and write the error.
-In order to avoid migration failure, make hardware
+Reviewed-by: Francisco Iglesias <francisco.iglesias@xilinx.com>
-error table address to a part of GED device instead
+Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
-of global variable, then this address will be migrated
+Signed-off-by: Vikram Garhwal <fnu.vikram@xilinx.com>
-to target QEMU.
+Message-id: 1605728926-352690-3-git-send-email-fnu.vikram@xilinx.com
 Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-7-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/generic_event_device.h |  2 ++
+ include/hw/arm/xlnx-zynqmp.h |  8 ++++++++
- include/hw/acpi/ghes.h                 |  6 ++++++
+ hw/arm/xlnx-zcu102.c         | 20 ++++++++++++++++++++
- hw/acpi/generic_event_device.c         | 19 +++++++++++++++++++
+ hw/arm/xlnx-zynqmp.c         | 34 ++++++++++++++++++++++++++++++++++
- hw/acpi/ghes.c                         | 14 ++++++++++++++
+files changed, 62 insertions(+)
  hw/arm/virt-acpi-build.c               |  8 ++++++++
 files changed, 49 insertions(+)
-diff --git a/include/hw/acpi/generic_event_device.h b/include/hw/acpi/generic_event_device.h
+diff --git a/include/hw/arm/xlnx-zynqmp.h b/include/hw/arm/xlnx-zynqmp.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/generic_event_device.h
+--- a/include/hw/arm/xlnx-zynqmp.h
-+++ b/include/hw/acpi/generic_event_device.h
++++ b/include/hw/arm/xlnx-zynqmp.h
 @@ -XXX,XX +XXX,XX @@
+ #include "hw/intc/arm_gic.h"
- #include "hw/sysbus.h"
+ #include "hw/net/cadence_gem.h"
- #include "hw/acpi/memory_hotplug.h"
+ #include "hw/char/cadence_uart.h"
-+#include "hw/acpi/ghes.h"
++#include "hw/net/xlnx-zynqmp-can.h"
+ #include "hw/ide/ahci.h"
- #define ACPI_POWER_BUTTON_DEVICE "PWRB"
+ #include "hw/sd/sdhci.h"
+ #include "hw/ssi/xilinx_spips.h"
-@@ -XXX,XX +XXX,XX @@ typedef struct AcpiGedState {
+@@ -XXX,XX +XXX,XX @@
-     GEDState ged_state;
+ #include "hw/cpu/cluster.h"
-     uint32_t ged_event_bitmap;
+ #include "target/arm/cpu.h"
-     qemu_irq irq;
+ #include "qom/object.h"
-+    AcpiGhesState ghes_state;
++#include "net/can_emu.h"
- } AcpiGedState;
+ #define TYPE_XLNX_ZYNQMP "xlnx,zynqmp"
- void build_ged_aml(Aml *table, const char* name, HotplugHandler *hotplug_dev,
+ OBJECT_DECLARE_SIMPLE_TYPE(XlnxZynqMPState, XLNX_ZYNQMP)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+@@ -XXX,XX +XXX,XX @@ OBJECT_DECLARE_SIMPLE_TYPE(XlnxZynqMPState, XLNX_ZYNQMP)
  #define XLNX_ZYNQMP_NUM_RPU_CPUS 2
  #define XLNX_ZYNQMP_NUM_GEMS 4
  #define XLNX_ZYNQMP_NUM_UARTS 2
 +#define XLNX_ZYNQMP_NUM_CAN 2
 +#define XLNX_ZYNQMP_CAN_REF_CLK (24 * 1000 * 1000)
  #define XLNX_ZYNQMP_NUM_SDHCI 2
  #define XLNX_ZYNQMP_NUM_SPIS 2
  #define XLNX_ZYNQMP_NUM_GDMA_CH 8
@@ -XXX,XX +XXX,XX @@ struct XlnxZynqMPState {
      CadenceGEMState gem[XLNX_ZYNQMP_NUM_GEMS];
      CadenceUARTState uart[XLNX_ZYNQMP_NUM_UARTS];
 +    XlnxZynqMPCANState can[XLNX_ZYNQMP_NUM_CAN];
      SysbusAHCIState sata;
      SDHCIState sdhci[XLNX_ZYNQMP_NUM_SDHCI];
      XilinxSPIPS spi[XLNX_ZYNQMP_NUM_SPIS];
@@ -XXX,XX +XXX,XX @@ struct XlnxZynqMPState {
      bool virt;
      /* Has the RPU subsystem?  */
      bool has_rpu;
 +
 +    /* CAN bus. */
 +    CanBusState *canbus[XLNX_ZYNQMP_NUM_CAN];
  };
  #endif
 diff --git a/hw/arm/xlnx-zcu102.c b/hw/arm/xlnx-zcu102.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/hw/arm/xlnx-zcu102.c
-+++ b/include/hw/acpi/ghes.h
++++ b/hw/arm/xlnx-zcu102.c
-@@ -XXX,XX +XXX,XX @@ enum {
+@@ -XXX,XX +XXX,XX @@
-     ACPI_HEST_SRC_ID_RESERVED,
+ #include "sysemu/qtest.h"
  #include "sysemu/device_tree.h"
  #include "qom/object.h"
 +#include "net/can_emu.h"
  struct XlnxZCU102 {
      MachineState parent_obj;
@@ -XXX,XX +XXX,XX @@ struct XlnxZCU102 {
      bool secure;
      bool virt;
 +    CanBusState *canbus[XLNX_ZYNQMP_NUM_CAN];
 +
      struct arm_boot_info binfo;
  };
-+typedef struct AcpiGhesState {
+@@ -XXX,XX +XXX,XX @@ static void xlnx_zcu102_init(MachineState *machine)
-+    uint64_t ghes_addr_le;
+     object_property_set_bool(OBJECT(&s->soc), "virtualization", s->virt,
-+} AcpiGhesState;
+                              &error_fatal);
 +    for (i = 0; i < XLNX_ZYNQMP_NUM_CAN; i++) {
 +        gchar *bus_name = g_strdup_printf("canbus%d", i);
 +
- void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
++        object_property_set_link(OBJECT(&s->soc), bus_name,
- void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
++                                 OBJECT(s->canbus[i]), &error_fatal);
-+void acpi_ghes_add_fw_cfg(AcpiGhesState *vms, FWCfgState *s,
++        g_free(bus_name);
-+                          GArray *hardware_errors);
++    }
- #endif
++
-diff --git a/hw/acpi/generic_event_device.c b/hw/acpi/generic_event_device.c
+     qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
      /* Create and plug in the SD cards */
@@ -XXX,XX +XXX,XX @@ static void xlnx_zcu102_machine_instance_init(Object *obj)
      s->secure = false;
      /* Default to virt (EL2) being disabled */
      s->virt = false;
 +    object_property_add_link(obj, "xlnx-zcu102.canbus0", TYPE_CAN_BUS,
 +                             (Object **)&s->canbus[0],
 +                             object_property_allow_set_link,
 +                             0);
 +
 +    object_property_add_link(obj, "xlnx-zcu102.canbus1", TYPE_CAN_BUS,
 +                             (Object **)&s->canbus[1],
 +                             object_property_allow_set_link,
 +                             0);
  }
  static void xlnx_zcu102_machine_class_init(ObjectClass *oc, void *data)
 diff --git a/hw/arm/xlnx-zynqmp.c b/hw/arm/xlnx-zynqmp.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/acpi/generic_event_device.c
+--- a/hw/arm/xlnx-zynqmp.c
-+++ b/hw/acpi/generic_event_device.c
++++ b/hw/arm/xlnx-zynqmp.c
-@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_ged_state = {
+@@ -XXX,XX +XXX,XX @@ static const int uart_intr[XLNX_ZYNQMP_NUM_UARTS] = {
-     }
+, 22,
  };
-+static bool ghes_needed(void *opaque)
++static const uint64_t can_addr[XLNX_ZYNQMP_NUM_CAN] = {
-+{
++    0xFF060000, 0xFF070000,
 +    AcpiGedState *s = opaque;
 +    return s->ghes_state.ghes_addr_le;
 +}
 +
 +static const VMStateDescription vmstate_ghes_state = {
 +    .name = "acpi-ged/ghes",
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .needed = ghes_needed,
 +    .fields      = (VMStateField[]) {
 +        VMSTATE_STRUCT(ghes_state, AcpiGedState, 1,
 +                       vmstate_ghes_state, AcpiGhesState),
 +        VMSTATE_END_OF_LIST()
 +    }
 +};
 +
- static const VMStateDescription vmstate_acpi_ged = {
++static const int can_intr[XLNX_ZYNQMP_NUM_CAN] = {
-     .name = "acpi-ged",
++    23, 24,
-     .version_id = 1,
++};
-@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_acpi_ged = {
++
-     },
+ static const uint64_t sdhci_addr[XLNX_ZYNQMP_NUM_SDHCI] = {
-     .subsections = (const VMStateDescription * []) {
+xFF160000, 0xFF170000,
-         &vmstate_memhp_state,
+ };
-+        &vmstate_ghes_state,
+@@ -XXX,XX +XXX,XX @@ static void xlnx_zynqmp_init(Object *obj)
-         NULL
+                                 TYPE_CADENCE_UART);
      }
- };
-diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
++    for (i = 0; i < XLNX_ZYNQMP_NUM_CAN; i++) {
-index XXXXXXX..XXXXXXX 100644
++        object_initialize_child(obj, "can[*]", &s->can[i],
---- a/hw/acpi/ghes.c
++                                TYPE_XLNX_ZYNQMP_CAN);
 +++ b/hw/acpi/ghes.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/acpi/ghes.h"
  #include "hw/acpi/aml-build.h"
  #include "qemu/error-report.h"
 +#include "hw/acpi/generic_event_device.h"
 +#include "hw/nvram/fw_cfg.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@ void acpi_build_hest(GArray *table_data, BIOSLinker *linker)
      build_header(linker, table_data, (void *)(table_data->data + hest_start),
          "HEST", table_data->len - hest_start, 1, NULL, NULL);
  }
 +
 +void acpi_ghes_add_fw_cfg(AcpiGhesState *ags, FWCfgState *s,
 +                          GArray *hardware_error)
 +{
 +    /* Create a read-only fw_cfg file for GHES */
 +    fw_cfg_add_file(s, ACPI_GHES_ERRORS_FW_CFG_FILE, hardware_error->data,
 +                    hardware_error->len);
 +
 +    /* Create a read-write fw_cfg file for Address */
 +    fw_cfg_add_file_callback(s, ACPI_GHES_DATA_ADDR_FW_CFG_FILE, NULL, NULL,
 +        NULL, &(ags->ghes_addr_le), sizeof(ags->ghes_addr_le), false);
 +}
 diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt-acpi-build.c
 +++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ void virt_acpi_setup(VirtMachineState *vms)
  {
      AcpiBuildTables tables;
      AcpiBuildState *build_state;
 +    AcpiGedState *acpi_ged_state;
      if (!vms->fw_cfg) {
          trace_virt_acpi_setup();
@@ -XXX,XX +XXX,XX @@ void virt_acpi_setup(VirtMachineState *vms)
      fw_cfg_add_file(vms->fw_cfg, ACPI_BUILD_TPMLOG_FILE, tables.tcpalog->data,
                      acpi_data_len(tables.tcpalog));
 +    if (vms->ras) {
 +        assert(vms->acpi_dev);
 +        acpi_ged_state = ACPI_GED(vms->acpi_dev);
 +        acpi_ghes_add_fw_cfg(&acpi_ged_state->ghes_state,
 +                             vms->fw_cfg, tables.hardware_errors);
 +    }
 +
-     build_state->rsdp_mr = acpi_add_rom_blob(virt_acpi_build_update,
+     object_initialize_child(obj, "sata", &s->sata, TYPE_SYSBUS_AHCI);
-                                              build_state, tables.rsdp,
-                                              ACPI_BUILD_RSDP_FILE, 0);
+     for (i = 0; i < XLNX_ZYNQMP_NUM_SDHCI; i++) {
@@ -XXX,XX +XXX,XX @@ static void xlnx_zynqmp_realize(DeviceState *dev, Error **errp)
                             gic_spi[uart_intr[i]]);
      }
 +    for (i = 0; i < XLNX_ZYNQMP_NUM_CAN; i++) {
 +        object_property_set_int(OBJECT(&s->can[i]), "ext_clk_freq",
 +                                XLNX_ZYNQMP_CAN_REF_CLK, &error_abort);
 +
 +        object_property_set_link(OBJECT(&s->can[i]), "canbus",
 +                                 OBJECT(s->canbus[i]), &error_fatal);
 +
 +        sysbus_realize(SYS_BUS_DEVICE(&s->can[i]), &err);
 +        if (err) {
 +            error_propagate(errp, err);
 +            return;
 +        }
 +        sysbus_mmio_map(SYS_BUS_DEVICE(&s->can[i]), 0, can_addr[i]);
 +        sysbus_connect_irq(SYS_BUS_DEVICE(&s->can[i]), 0,
 +                           gic_spi[can_intr[i]]);
 +    }
 +
      object_property_set_int(OBJECT(&s->sata), "num-ports", SATA_NUM_PORTS,
                              &error_abort);
      if (!sysbus_realize(SYS_BUS_DEVICE(&s->sata), errp)) {
@@ -XXX,XX +XXX,XX @@ static Property xlnx_zynqmp_props[] = {
      DEFINE_PROP_BOOL("has_rpu", XlnxZynqMPState, has_rpu, false),
      DEFINE_PROP_LINK("ddr-ram", XlnxZynqMPState, ddr_ram, TYPE_MEMORY_REGION,
                       MemoryRegion *),
 +    DEFINE_PROP_LINK("canbus0", XlnxZynqMPState, canbus[0], TYPE_CAN_BUS,
 +                     CanBusState *),
 +    DEFINE_PROP_LINK("canbus1", XlnxZynqMPState, canbus[1], TYPE_CAN_BUS,
 +                     CanBusState *),
      DEFINE_PROP_END_OF_LIST()
  };
 --
 .20.1

-[PULL 21/45] docs: APEI GHES generation and CPER record description
+[PULL 04/36] tests/qtest: Introduce tests for Xilinx ZynqMP CAN controller
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Vikram Garhwal <fnu.vikram@xilinx.com>
-Add APEI/GHES detailed design document
+The QTests perform five tests on the Xilinx ZynqMP CAN controller:
+    Tests the CAN controller in loopback, sleep and snoop mode.
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+    Tests filtering of incoming CAN messages.
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+Reviewed-by: Francisco Iglesias <francisco.iglesias@xilinx.com>
-Message-id: 20200512030609.19593-4-gengdongjiu@huawei.com
+Signed-off-by: Vikram Garhwal <fnu.vikram@xilinx.com>
 Message-id: 1605728926-352690-4-git-send-email-fnu.vikram@xilinx.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- docs/specs/acpi_hest_ghes.rst | 110 ++++++++++++++++++++++++++++++++++
+ tests/qtest/xlnx-can-test.c | 360 ++++++++++++++++++++++++++++++++++++
- docs/specs/index.rst          |   1 +
+ tests/qtest/meson.build     |   1 +
-files changed, 111 insertions(+)
+files changed, 361 insertions(+)
- create mode 100644 docs/specs/acpi_hest_ghes.rst
+ create mode 100644 tests/qtest/xlnx-can-test.c
-diff --git a/docs/specs/acpi_hest_ghes.rst b/docs/specs/acpi_hest_ghes.rst
+diff --git a/tests/qtest/xlnx-can-test.c b/tests/qtest/xlnx-can-test.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/docs/specs/acpi_hest_ghes.rst
++++ b/tests/qtest/xlnx-can-test.c
 @@ -XXX,XX +XXX,XX @@
-+APEI tables generating and CPER record
++/*
-+======================================
++ * QTests for the Xilinx ZynqMP CAN controller.
-+
++ *
-+..
++ * Copyright (c) 2020 Xilinx Inc.
-+   Copyright (c) 2020 HUAWEI TECHNOLOGIES CO., LTD.
++ *
-+
++ * Written-by: Vikram Garhwal<fnu.vikram@xilinx.com>
-+   This work is licensed under the terms of the GNU GPL, version 2 or later.
++ *
-+   See the COPYING file in the top-level directory.
++ * Permission is hereby granted, free of charge, to any person obtaining a copy
-+
++ * of this software and associated documentation files (the "Software"), to deal
-+Design Details
++ * in the Software without restriction, including without limitation the rights
-+--------------
++ * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
-+
++ * copies of the Software, and to permit persons to whom the Software is
-+::
++ * furnished to do so, subject to the following conditions:
-+
++ *
-+         etc/acpi/tables                           etc/hardware_errors
++ * The above copyright notice and this permission notice shall be included in
-+      ====================                   ===============================
++ * all copies or substantial portions of the Software.
-+  + +--------------------------+            +----------------------------+
++ *
-+  | | HEST                     | +--------->|    error_block_address1    |------+
++ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
-+  | +--------------------------+ |          +----------------------------+      |
++ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
-+  | | GHES1                    | | +------->|    error_block_address2    |------+-+
++ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
-+  | +--------------------------+ | |        +----------------------------+      | |
++ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
-+  | | .................        | | |        |      ..............        |      | |
++ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
-+  | | error_status_address-----+-+ |        -----------------------------+      | |
++ * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
-+  | | .................        |   |   +--->|    error_block_addressN    |------+-+---+
++ * THE SOFTWARE.
-+  | | read_ack_register--------+-+ |   |    +----------------------------+      | |   |
++ */
-+  | | read_ack_preserve        | +-+---+--->|     read_ack_register1     |      | |   |
++
-+  | | read_ack_write           |   |   |    +----------------------------+      | |   |
++#include "qemu/osdep.h"
-+  + +--------------------------+   | +-+--->|     read_ack_register2     |      | |   |
++#include "libqos/libqtest.h"
-+  | | GHES2                    |   | | |    +----------------------------+      | |   |
++
-+  + +--------------------------+   | | |    |       .............        |      | |   |
++/* Base address. */
-+  | | .................        |   | | |    +----------------------------+      | |   |
++#define CAN0_BASE_ADDR          0xFF060000
-+  | | error_status_address-----+---+ | | +->|     read_ack_registerN     |      | |   |
++#define CAN1_BASE_ADDR          0xFF070000
-+  | | .................        |     | | |  +----------------------------+      | |   |
++
-+  | | read_ack_register--------+-----+ | |  |Generic Error Status Block 1|<-----+ |   |
++/* Register addresses. */
-+  | | read_ack_preserve        |       | |  |-+------------------------+-+        |   |
++#define R_SRR_OFFSET            0x00
-+  | | read_ack_write           |       | |  | |          CPER          | |        |   |
++#define R_MSR_OFFSET            0x04
-+  + +--------------------------|       | |  | |          CPER          | |        |   |
++#define R_SR_OFFSET             0x18
-+  | | ...............          |       | |  | |          ....          | |        |   |
++#define R_ISR_OFFSET            0x1C
-+  + +--------------------------+       | |  | |          CPER          | |        |   |
++#define R_ICR_OFFSET            0x24
-+  | | GHESN                    |       | |  |-+------------------------+-|        |   |
++#define R_TXID_OFFSET           0x30
-+  + +--------------------------+       | |  |Generic Error Status Block 2|<-------+   |
++#define R_TXDLC_OFFSET          0x34
-+  | | .................        |       | |  |-+------------------------+-+            |
++#define R_TXDATA1_OFFSET        0x38
-+  | | error_status_address-----+-------+ |  | |           CPER         | |            |
++#define R_TXDATA2_OFFSET        0x3C
-+  | | .................        |         |  | |           CPER         | |            |
++#define R_RXID_OFFSET           0x50
-+  | | read_ack_register--------+---------+  | |           ....         | |            |
++#define R_RXDLC_OFFSET          0x54
-+  | | read_ack_preserve        |            | |           CPER         | |            |
++#define R_RXDATA1_OFFSET        0x58
-+  | | read_ack_write           |            +-+------------------------+-+            |
++#define R_RXDATA2_OFFSET        0x5C
-+  + +--------------------------+            |         ..........         |            |
++#define R_AFR                   0x60
-+                                            |----------------------------+            |
++#define R_AFMR1                 0x64
-+                                            |Generic Error Status Block N |<----------+
++#define R_AFIR1                 0x68
-+                                            |-+-------------------------+-+
++#define R_AFMR2                 0x6C
-+                                            | |          CPER           | |
++#define R_AFIR2                 0x70
-+                                            | |          CPER           | |
++#define R_AFMR3                 0x74
-+                                            | |          ....           | |
++#define R_AFIR3                 0x78
-+                                            | |          CPER           | |
++#define R_AFMR4                 0x7C
-+                                            +-+-------------------------+-+
++#define R_AFIR4                 0x80
 +
-+
++/* CAN modes. */
-+(1) QEMU generates the ACPI HEST table. This table goes in the current
++#define CONFIG_MODE             0x00
-+    "etc/acpi/tables" fw_cfg blob. Each error source has different
++#define NORMAL_MODE             0x00
-+    notification types.
++#define LOOPBACK_MODE           0x02
-+
++#define SNOOP_MODE              0x04
-+(2) A new fw_cfg blob called "etc/hardware_errors" is introduced. QEMU
++#define SLEEP_MODE              0x01
-+    also needs to populate this blob. The "etc/hardware_errors" fw_cfg blob
++#define ENABLE_CAN              (1 << 1)
-+    contains an address registers table and an Error Status Data Block table.
++#define STATUS_NORMAL_MODE      (1 << 3)
-+
++#define STATUS_LOOPBACK_MODE    (1 << 1)
-+(3) The address registers table contains N Error Block Address entries
++#define STATUS_SNOOP_MODE       (1 << 12)
-+    and N Read Ack Register entries. The size for each entry is 8-byte.
++#define STATUS_SLEEP_MODE       (1 << 2)
-+    The Error Status Data Block table contains N Error Status Data Block
++#define ISR_TXOK                (1 << 1)
-+    entries. The size for each entry is 4096(0x1000) bytes. The total size
++#define ISR_RXOK                (1 << 4)
-+    for the "etc/hardware_errors" fw_cfg blob is (N * 8 * 2 + N * 4096) bytes.
++
-+    N is the number of the kinds of hardware error sources.
++static void match_rx_tx_data(const uint32_t *buf_tx, const uint32_t *buf_rx,
-+
++                             uint8_t can_timestamp)
-+(4) QEMU generates the ACPI linker/loader script for the firmware. The
++{
-+    firmware pre-allocates memory for "etc/acpi/tables", "etc/hardware_errors"
++    uint16_t size = 0;
-+    and copies blob contents there.
++    uint8_t len = 4;
 +
-+(5) QEMU generates N ADD_POINTER commands, which patch addresses in the
++    while (size < len) {
-+    "error_status_address" fields of the HEST table with a pointer to the
++        if (R_RXID_OFFSET + 4 * size == R_RXDLC_OFFSET)  {
-+    corresponding "address registers" in the "etc/hardware_errors" blob.
++            g_assert_cmpint(buf_rx[size], ==, buf_tx[size] + can_timestamp);
-+
++        } else {
-+(6) QEMU generates N ADD_POINTER commands, which patch addresses in the
++            g_assert_cmpint(buf_rx[size], ==, buf_tx[size]);
-+    "read_ack_register" fields of the HEST table with a pointer to the
++        }
-+    corresponding "read_ack_register" within the "etc/hardware_errors" blob.
++
-+
++        size++;
-+(7) QEMU generates N ADD_POINTER commands for the firmware, which patch
++    }
-+    addresses in the "error_block_address" fields with a pointer to the
++}
-+    respective "Error Status Data Block" in the "etc/hardware_errors" blob.
++
-+
++static void read_data(QTestState *qts, uint64_t can_base_addr, uint32_t *buf_rx)
-+(8) QEMU defines a third and write-only fw_cfg blob which is called
++{
-+    "etc/hardware_errors_addr". Through that blob, the firmware can send back
++    uint32_t int_status;
-+    the guest-side allocation addresses to QEMU. The "etc/hardware_errors_addr"
++
-+    blob contains a 8-byte entry. QEMU generates a single WRITE_POINTER command
++    /* Read the interrupt on CAN rx. */
-+    for the firmware. The firmware will write back the start address of
++    int_status = qtest_readl(qts, can_base_addr + R_ISR_OFFSET) & ISR_RXOK;
-+    "etc/hardware_errors" blob to the fw_cfg file "etc/hardware_errors_addr".
++
-+
++    g_assert_cmpint(int_status, ==, ISR_RXOK);
-+(9) When QEMU gets a SIGBUS from the kernel, QEMU writes CPER into corresponding
++
-+    "Error Status Data Block", guest memory, and then injects platform specific
++    /* Read the RX register data for CAN. */
-+    interrupt (in case of arm/virt machine it's Synchronous External Abort) as a
++    buf_rx[0] = qtest_readl(qts, can_base_addr + R_RXID_OFFSET);
-+    notification which is necessary for notifying the guest.
++    buf_rx[1] = qtest_readl(qts, can_base_addr + R_RXDLC_OFFSET);
-+
++    buf_rx[2] = qtest_readl(qts, can_base_addr + R_RXDATA1_OFFSET);
-+(10) This notification (in virtual hardware) will be handled by the guest
++    buf_rx[3] = qtest_readl(qts, can_base_addr + R_RXDATA2_OFFSET);
-+     kernel, on receiving notification, guest APEI driver could read the CPER error
++
-+     and take appropriate action.
++    /* Clear the RX interrupt. */
-+
++    qtest_writel(qts, CAN1_BASE_ADDR + R_ICR_OFFSET, ISR_RXOK);
-+(11) kvm_arch_on_sigbus_vcpu() uses source_id as index in "etc/hardware_errors" to
++}
-+     find out "Error Status Data Block" entry corresponding to error source. So supported
++
-+     source_id values should be assigned here and not be changed afterwards to make sure
++static void send_data(QTestState *qts, uint64_t can_base_addr,
-+     that guest will write error into expected "Error Status Data Block" even if guest was
++                      const uint32_t *buf_tx)
-+     migrated to a newer QEMU.
++{
-diff --git a/docs/specs/index.rst b/docs/specs/index.rst
++    uint32_t int_status;
 +
 +    /* Write the TX register data for CAN. */
 +    qtest_writel(qts, can_base_addr + R_TXID_OFFSET, buf_tx[0]);
 +    qtest_writel(qts, can_base_addr + R_TXDLC_OFFSET, buf_tx[1]);
 +    qtest_writel(qts, can_base_addr + R_TXDATA1_OFFSET, buf_tx[2]);
 +    qtest_writel(qts, can_base_addr + R_TXDATA2_OFFSET, buf_tx[3]);
 +
 +    /* Read the interrupt on CAN for tx. */
 +    int_status = qtest_readl(qts, can_base_addr + R_ISR_OFFSET) & ISR_TXOK;
 +
 +    g_assert_cmpint(int_status, ==, ISR_TXOK);
 +
 +    /* Clear the interrupt for tx. */
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_ICR_OFFSET, ISR_TXOK);
 +}
 +
 +/*
 + * This test will be transferring data from CAN0 and CAN1 through canbus. CAN0
 + * initiate the data transfer to can-bus, CAN1 receives the data. Test compares
 + * the data sent from CAN0 with received on CAN1.
 + */
 +static void test_can_bus(void)
 +{
 +    const uint32_t buf_tx[4] = { 0xFF, 0x80000000, 0x12345678, 0x87654321 };
 +    uint32_t buf_rx[4] = { 0x00, 0x00, 0x00, 0x00 };
 +    uint32_t status = 0;
 +    uint8_t can_timestamp = 1;
 +
 +    QTestState *qts = qtest_init("-machine xlnx-zcu102"
 +                " -object can-bus,id=canbus0"
 +                " -machine xlnx-zcu102.canbus0=canbus0"
 +                " -machine xlnx-zcu102.canbus1=canbus0"
 +                );
 +
 +    /* Configure the CAN0 and CAN1. */
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_MSR_OFFSET, NORMAL_MODE);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_MSR_OFFSET, NORMAL_MODE);
 +
 +    /* Check here if CAN0 and CAN1 are in normal mode. */
 +    status = qtest_readl(qts, CAN0_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    status = qtest_readl(qts, CAN1_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    send_data(qts, CAN0_BASE_ADDR, buf_tx);
 +
 +    read_data(qts, CAN1_BASE_ADDR, buf_rx);
 +    match_rx_tx_data(buf_tx, buf_rx, can_timestamp);
 +
 +    qtest_quit(qts);
 +}
 +
 +/*
 + * This test is performing loopback mode on CAN0 and CAN1. Data sent from TX of
 + * each CAN0 and CAN1 are compared with RX register data for respective CAN.
 + */
 +static void test_can_loopback(void)
 +{
 +    uint32_t buf_tx[4] = { 0xFF, 0x80000000, 0x12345678, 0x87654321 };
 +    uint32_t buf_rx[4] = { 0x00, 0x00, 0x00, 0x00 };
 +    uint32_t status = 0;
 +
 +    QTestState *qts = qtest_init("-machine xlnx-zcu102"
 +                " -object can-bus,id=canbus0"
 +                " -machine xlnx-zcu102.canbus0=canbus0"
 +                " -machine xlnx-zcu102.canbus1=canbus0"
 +                );
 +
 +    /* Configure the CAN0 in loopback mode. */
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, CONFIG_MODE);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_MSR_OFFSET, LOOPBACK_MODE);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +
 +    /* Check here if CAN0 is set in loopback mode. */
 +    status = qtest_readl(qts, CAN0_BASE_ADDR + R_SR_OFFSET);
 +
 +    g_assert_cmpint(status, ==, STATUS_LOOPBACK_MODE);
 +
 +    send_data(qts, CAN0_BASE_ADDR, buf_tx);
 +    read_data(qts, CAN0_BASE_ADDR, buf_rx);
 +    match_rx_tx_data(buf_tx, buf_rx, 0);
 +
 +    /* Configure the CAN1 in loopback mode. */
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_SRR_OFFSET, CONFIG_MODE);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_MSR_OFFSET, LOOPBACK_MODE);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +
 +    /* Check here if CAN1 is set in loopback mode. */
 +    status = qtest_readl(qts, CAN1_BASE_ADDR + R_SR_OFFSET);
 +
 +    g_assert_cmpint(status, ==, STATUS_LOOPBACK_MODE);
 +
 +    send_data(qts, CAN1_BASE_ADDR, buf_tx);
 +    read_data(qts, CAN1_BASE_ADDR, buf_rx);
 +    match_rx_tx_data(buf_tx, buf_rx, 0);
 +
 +    qtest_quit(qts);
 +}
 +
 +/*
 + * Enable filters for CAN1. This will filter incoming messages with ID. In this
 + * test message will pass through filter 2.
 + */
 +static void test_can_filter(void)
 +{
 +    uint32_t buf_tx[4] = { 0x14, 0x80000000, 0x12345678, 0x87654321 };
 +    uint32_t buf_rx[4] = { 0x00, 0x00, 0x00, 0x00 };
 +    uint32_t status = 0;
 +    uint8_t can_timestamp = 1;
 +
 +    QTestState *qts = qtest_init("-machine xlnx-zcu102"
 +                " -object can-bus,id=canbus0"
 +                " -machine xlnx-zcu102.canbus0=canbus0"
 +                " -machine xlnx-zcu102.canbus1=canbus0"
 +                );
 +
 +    /* Configure the CAN0 and CAN1. */
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_MSR_OFFSET, NORMAL_MODE);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_MSR_OFFSET, NORMAL_MODE);
 +
 +    /* Check here if CAN0 and CAN1 are in normal mode. */
 +    status = qtest_readl(qts, CAN0_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    status = qtest_readl(qts, CAN1_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    /* Set filter for CAN1 for incoming messages. */
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFR, 0x0);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFMR1, 0xF7);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFIR1, 0x121F);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFMR2, 0x5431);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFIR2, 0x14);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFMR3, 0x1234);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFIR3, 0x5431);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFMR4, 0xFFF);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFIR4, 0x1234);
 +
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_AFR, 0xF);
 +
 +    send_data(qts, CAN0_BASE_ADDR, buf_tx);
 +
 +    read_data(qts, CAN1_BASE_ADDR, buf_rx);
 +    match_rx_tx_data(buf_tx, buf_rx, can_timestamp);
 +
 +    qtest_quit(qts);
 +}
 +
 +/* Testing sleep mode on CAN0 while CAN1 is in normal mode. */
 +static void test_can_sleepmode(void)
 +{
 +    uint32_t buf_tx[4] = { 0x14, 0x80000000, 0x12345678, 0x87654321 };
 +    uint32_t buf_rx[4] = { 0x00, 0x00, 0x00, 0x00 };
 +    uint32_t status = 0;
 +    uint8_t can_timestamp = 1;
 +
 +    QTestState *qts = qtest_init("-machine xlnx-zcu102"
 +                " -object can-bus,id=canbus0"
 +                " -machine xlnx-zcu102.canbus0=canbus0"
 +                " -machine xlnx-zcu102.canbus1=canbus0"
 +                );
 +
 +    /* Configure the CAN0. */
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, CONFIG_MODE);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_MSR_OFFSET, SLEEP_MODE);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_MSR_OFFSET, NORMAL_MODE);
 +
 +    /* Check here if CAN0 is in SLEEP mode and CAN1 in normal mode. */
 +    status = qtest_readl(qts, CAN0_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_SLEEP_MODE);
 +
 +    status = qtest_readl(qts, CAN1_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    send_data(qts, CAN1_BASE_ADDR, buf_tx);
 +
 +    /*
 +     * Once CAN1 sends data on can-bus. CAN0 should exit sleep mode.
 +     * Check the CAN0 status now. It should exit the sleep mode and receive the
 +     * incoming data.
 +     */
 +    status = qtest_readl(qts, CAN0_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    read_data(qts, CAN0_BASE_ADDR, buf_rx);
 +
 +    match_rx_tx_data(buf_tx, buf_rx, can_timestamp);
 +
 +    qtest_quit(qts);
 +}
 +
 +/* Testing Snoop mode on CAN0 while CAN1 is in normal mode. */
 +static void test_can_snoopmode(void)
 +{
 +    uint32_t buf_tx[4] = { 0x14, 0x80000000, 0x12345678, 0x87654321 };
 +    uint32_t buf_rx[4] = { 0x00, 0x00, 0x00, 0x00 };
 +    uint32_t status = 0;
 +    uint8_t can_timestamp = 1;
 +
 +    QTestState *qts = qtest_init("-machine xlnx-zcu102"
 +                " -object can-bus,id=canbus0"
 +                " -machine xlnx-zcu102.canbus0=canbus0"
 +                " -machine xlnx-zcu102.canbus1=canbus0"
 +                );
 +
 +    /* Configure the CAN0. */
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, CONFIG_MODE);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_MSR_OFFSET, SNOOP_MODE);
 +    qtest_writel(qts, CAN0_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_SRR_OFFSET, ENABLE_CAN);
 +    qtest_writel(qts, CAN1_BASE_ADDR + R_MSR_OFFSET, NORMAL_MODE);
 +
 +    /* Check here if CAN0 is in SNOOP mode and CAN1 in normal mode. */
 +    status = qtest_readl(qts, CAN0_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_SNOOP_MODE);
 +
 +    status = qtest_readl(qts, CAN1_BASE_ADDR + R_SR_OFFSET);
 +    g_assert_cmpint(status, ==, STATUS_NORMAL_MODE);
 +
 +    send_data(qts, CAN1_BASE_ADDR, buf_tx);
 +
 +    read_data(qts, CAN0_BASE_ADDR, buf_rx);
 +
 +    match_rx_tx_data(buf_tx, buf_rx, can_timestamp);
 +
 +    qtest_quit(qts);
 +}
 +
 +int main(int argc, char **argv)
 +{
 +    g_test_init(&argc, &argv, NULL);
 +
 +    qtest_add_func("/net/can/can_bus", test_can_bus);
 +    qtest_add_func("/net/can/can_loopback", test_can_loopback);
 +    qtest_add_func("/net/can/can_filter", test_can_filter);
 +    qtest_add_func("/net/can/can_test_snoopmode", test_can_snoopmode);
 +    qtest_add_func("/net/can/can_test_sleepmode", test_can_sleepmode);
 +
 +    return g_test_run();
 +}
 diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
 index XXXXXXX..XXXXXXX 100644
---- a/docs/specs/index.rst
+--- a/tests/qtest/meson.build
-+++ b/docs/specs/index.rst
++++ b/tests/qtest/meson.build
-@@ -XXX,XX +XXX,XX @@ Contents:
+@@ -XXX,XX +XXX,XX @@ qtests_aarch64 = \
-    ppc-spapr-xive
+   ['arm-cpu-features',
-    acpi_hw_reduced_hotplug
+    'numa-test',
-    tpm
+    'boot-serial-test',
-+   acpi_hest_ghes
++   'xlnx-can-test',
     'migration-test']
  qtests_s390x = \
 --
 .20.1

-[PULL 28/45] MAINTAINERS: Add ACPI/HEST/GHES entries
+[PULL 05/36] MAINTAINERS: Add maintainer entry for Xilinx ZynqMP CAN controller
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Vikram Garhwal <fnu.vikram@xilinx.com>
-I and Xiang are willing to review the APEI-related patches and
+Reviewed-by: Francisco Iglesias <francisco.iglesias@xilinx.com>
-volunteer as the reviewers for the HEST/GHES part.
+Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
+Signed-off-by: Vikram Garhwal <fnu.vikram@xilinx.com>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Message-id: 1605728926-352690-5-git-send-email-fnu.vikram@xilinx.com
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Acked-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-11-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- MAINTAINERS | 9 +++++++++
+ MAINTAINERS | 8 ++++++++
-file changed, 9 insertions(+)
+file changed, 8 insertions(+)
 diff --git a/MAINTAINERS b/MAINTAINERS
 index XXXXXXX..XXXXXXX 100644
 --- a/MAINTAINERS
 +++ b/MAINTAINERS
-@@ -XXX,XX +XXX,XX @@ F: tests/qtest/bios-tables-test.c
+@@ -XXX,XX +XXX,XX @@ F: hw/net/opencores_eth.c
- F: tests/qtest/acpi-utils.[hc]
- F: tests/data/acpi/
+ Devices
+ -------
-+ACPI/HEST/GHES
++Xilinx CAN
-+R: Dongjiu Geng <gengdongjiu@huawei.com>
++M: Vikram Garhwal <fnu.vikram@xilinx.com>
-+R: Xiang Zheng <zhengxiang9@huawei.com>
++M: Francisco Iglesias <francisco.iglesias@xilinx.com>
 +L: qemu-arm@nongnu.org
 +S: Maintained
-+F: hw/acpi/ghes.c
++F: hw/net/can/xlnx-*
-+F: include/hw/acpi/ghes.h
++F: include/hw/net/xlnx-*
-+F: docs/specs/acpi_hest_ghes.rst
++F: tests/qtest/xlnx-can-test*
 +
- ppc4xx
+ EDU
- M: David Gibson <david@gibson.dropbear.id.au>
+ M: Jiri Slaby <jslaby@suse.cz>
- L: qemu-ppc@nongnu.org
+ S: Maintained
 --
 .20.1

-[PULL 23/45] ACPI: Build Hardware Error Source Table
+[PULL 06/36] sbsa-ref: allow to use Cortex-A53/57/72 cpus
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Marcin Juszkiewicz <marcin.juszkiewicz@linaro.org>
-This patch builds Hardware Error Source Table(HEST) via fw_cfg blobs.
+Trusted Firmware now supports A72 on sbsa-ref by default [1] so enable
-Now it only supports ARMv8 SEA, a type of Generic Hardware Error
+it for QEMU as well. A53 was already enabled there.
 Source version 2(GHESv2) error source. Afterwards, we can extend
 the supported types if needed. For the CPER section, currently it
 is memory section because kernel mainly wants userspace to handle
 the memory errors.
-This patch follows the spec ACPI 6.2 to build the Hardware Error
+. https://review.trustedfirmware.org/c/TF-A/trusted-firmware-a/+/7117
 Source table. For more detailed information, please refer to
 document: docs/specs/acpi_hest_ghes.rst
-build_ghes_hw_error_notification() helper will help to add Hardware
+Signed-off-by: Marcin Juszkiewicz <marcin.juszkiewicz@linaro.org>
-Error Notification to ACPI tables without using packed C structures
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-and avoid endianness issues as API doesn't need explicit conversion.
+Message-id: 20201120141705.246690-1-marcin.juszkiewicz@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
 Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
 Message-id: 20200512030609.19593-6-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/acpi/ghes.h   |  39 ++++++++++++
+ hw/arm/sbsa-ref.c | 23 ++++++++++++++++++++---
- hw/acpi/ghes.c           | 126 +++++++++++++++++++++++++++++++++++++++
+file changed, 20 insertions(+), 3 deletions(-)
  hw/arm/virt-acpi-build.c |   2 +
 files changed, 167 insertions(+)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/hw/arm/sbsa-ref.c
-+++ b/include/hw/acpi/ghes.h
++++ b/hw/arm/sbsa-ref.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static const int sbsa_ref_irqmap[] = {
+     [SBSA_GWDT] = 16,
- #include "hw/acpi/bios-linker-loader.h"
+ };
-+/*
++static const char * const valid_cpus[] = {
-+ * Values for Hardware Error Notification Type field
++    ARM_CPU_TYPE_NAME("cortex-a53"),
-+ */
++    ARM_CPU_TYPE_NAME("cortex-a57"),
-+enum AcpiGhesNotifyType {
++    ARM_CPU_TYPE_NAME("cortex-a72"),
 +    /* Polled */
 +    ACPI_GHES_NOTIFY_POLLED = 0,
 +    /* External Interrupt */
 +    ACPI_GHES_NOTIFY_EXTERNAL = 1,
 +    /* Local Interrupt */
 +    ACPI_GHES_NOTIFY_LOCAL = 2,
 +    /* SCI */
 +    ACPI_GHES_NOTIFY_SCI = 3,
 +    /* NMI */
 +    ACPI_GHES_NOTIFY_NMI = 4,
 +    /* CMCI, ACPI 5.0: 18.3.2.7, Table 18-290 */
 +    ACPI_GHES_NOTIFY_CMCI = 5,
 +    /* MCE, ACPI 5.0: 18.3.2.7, Table 18-290 */
 +    ACPI_GHES_NOTIFY_MCE = 6,
 +    /* GPIO-Signal, ACPI 6.0: 18.3.2.7, Table 18-332 */
 +    ACPI_GHES_NOTIFY_GPIO = 7,
 +    /* ARMv8 SEA, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_SEA = 8,
 +    /* ARMv8 SEI, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_SEI = 9,
 +    /* External Interrupt - GSIV, ACPI 6.1: 18.3.2.9, Table 18-345 */
 +    ACPI_GHES_NOTIFY_GSIV = 10,
 +    /* Software Delegated Exception, ACPI 6.2: 18.3.2.9, Table 18-383 */
 +    ACPI_GHES_NOTIFY_SDEI = 11,
 +    /* 12 and greater are reserved */
 +    ACPI_GHES_NOTIFY_RESERVED = 12
 +};
 +
-+enum {
++static bool cpu_type_valid(const char *cpu)
-+    ACPI_HEST_SRC_ID_SEA = 0,
++{
-+    /* future ids go here */
++    int i;
 +    ACPI_HEST_SRC_ID_RESERVED,
 +};
 +
- void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
++    for (i = 0; i < ARRAY_SIZE(valid_cpus); i++) {
-+void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
++        if (strcmp(cpu, valid_cpus[i]) == 0) {
- #endif
++            return true;
-diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
++        }
-index XXXXXXX..XXXXXXX 100644
++    }
---- a/hw/acpi/ghes.c
++    return false;
 +++ b/hw/acpi/ghes.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/units.h"
  #include "hw/acpi/ghes.h"
  #include "hw/acpi/aml-build.h"
 +#include "qemu/error-report.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@
  /* Now only support ARMv8 SEA notification type error source */
  #define ACPI_GHES_ERROR_SOURCE_COUNT        1
 +/* Generic Hardware Error Source version 2 */
 +#define ACPI_GHES_SOURCE_GENERIC_ERROR_V2   10
 +
 +/* Address offset in Generic Address Structure(GAS) */
 +#define GAS_ADDR_OFFSET 4
 +
 +/*
 + * Hardware Error Notification
 + * ACPI 4.0: 17.3.2.7 Hardware Error Notification
 + * Composes dummy Hardware Error Notification descriptor of specified type
 + */
 +static void build_ghes_hw_error_notification(GArray *table, const uint8_t type)
 +{
 +    /* Type */
 +    build_append_int_noprefix(table, type, 1);
 +    /*
 +     * Length:
 +     * Total length of the structure in bytes
 +     */
 +    build_append_int_noprefix(table, 28, 1);
 +    /* Configuration Write Enable */
 +    build_append_int_noprefix(table, 0, 2);
 +    /* Poll Interval */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Vector */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Switch To Polling Threshold Value */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Switch To Polling Threshold Window */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Error Threshold Value */
 +    build_append_int_noprefix(table, 0, 4);
 +    /* Error Threshold Window */
 +    build_append_int_noprefix(table, 0, 4);
 +}
 +
- /*
+ static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
-  * Build table for the hardware error fw_cfg blob.
+ {
-  * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
+     uint8_t clustersz = ARM_DEFAULT_CPUS_PER_CLUSTER;
-@@ -XXX,XX +XXX,XX @@ void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker)
+@@ -XXX,XX +XXX,XX @@ static void sbsa_ref_init(MachineState *machine)
-     bios_linker_loader_write_pointer(linker, ACPI_GHES_DATA_ADDR_FW_CFG_FILE,
+     const CPUArchIdList *possible_cpus;
-, sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE, 0);
+     int n, sbsa_max_cpus;
- }
-+
+-    if (strcmp(machine->cpu_type, ARM_CPU_TYPE_NAME("cortex-a57"))) {
-+/* Build Generic Hardware Error Source version 2 (GHESv2) */
+-        error_report("sbsa-ref: CPU type other than the built-in "
-+static void build_ghes_v2(GArray *table_data, int source_id, BIOSLinker *linker)
+-                     "cortex-a57 not supported");
-+{
++    if (!cpu_type_valid(machine->cpu_type)) {
-+    uint64_t address_offset;
++        error_report("mach-virt: CPU type %s not supported", machine->cpu_type);
-+    /*
+         exit(1);
 +     * Type:
 +     * Generic Hardware Error Source version 2(GHESv2 - Type 10)
 +     */
 +    build_append_int_noprefix(table_data, ACPI_GHES_SOURCE_GENERIC_ERROR_V2, 2);
 +    /* Source Id */
 +    build_append_int_noprefix(table_data, source_id, 2);
 +    /* Related Source Id */
 +    build_append_int_noprefix(table_data, 0xffff, 2);
 +    /* Flags */
 +    build_append_int_noprefix(table_data, 0, 1);
 +    /* Enabled */
 +    build_append_int_noprefix(table_data, 1, 1);
 +
 +    /* Number of Records To Pre-allocate */
 +    build_append_int_noprefix(table_data, 1, 4);
 +    /* Max Sections Per Record */
 +    build_append_int_noprefix(table_data, 1, 4);
 +    /* Max Raw Data Length */
 +    build_append_int_noprefix(table_data, ACPI_GHES_MAX_RAW_DATA_LENGTH, 4);
 +
 +    address_offset = table_data->len;
 +    /* Error Status Address */
 +    build_append_gas(table_data, AML_AS_SYSTEM_MEMORY, 0x40, 0,
 +                     4 /* QWord access */, 0);
 +    bios_linker_loader_add_pointer(linker, ACPI_BUILD_TABLE_FILE,
 +        address_offset + GAS_ADDR_OFFSET, sizeof(uint64_t),
 +        ACPI_GHES_ERRORS_FW_CFG_FILE, source_id * sizeof(uint64_t));
 +
 +    switch (source_id) {
 +    case ACPI_HEST_SRC_ID_SEA:
 +        /*
 +         * Notification Structure
 +         * Now only enable ARMv8 SEA notification type
 +         */
 +        build_ghes_hw_error_notification(table_data, ACPI_GHES_NOTIFY_SEA);
 +        break;
 +    default:
 +        error_report("Not support this error source");
 +        abort();
 +    }
 +
 +    /* Error Status Block Length */
 +    build_append_int_noprefix(table_data, ACPI_GHES_MAX_RAW_DATA_LENGTH, 4);
 +
 +    /*
 +     * Read Ack Register
 +     * ACPI 6.1: 18.3.2.8 Generic Hardware Error Source
 +     * version 2 (GHESv2 - Type 10)
 +     */
 +    address_offset = table_data->len;
 +    build_append_gas(table_data, AML_AS_SYSTEM_MEMORY, 0x40, 0,
 +                     4 /* QWord access */, 0);
 +    bios_linker_loader_add_pointer(linker, ACPI_BUILD_TABLE_FILE,
 +        address_offset + GAS_ADDR_OFFSET,
 +        sizeof(uint64_t), ACPI_GHES_ERRORS_FW_CFG_FILE,
 +        (ACPI_GHES_ERROR_SOURCE_COUNT + source_id) * sizeof(uint64_t));
 +
 +    /*
 +     * Read Ack Preserve field
 +     * We only provide the first bit in Read Ack Register to OSPM to write
 +     * while the other bits are preserved.
 +     */
 +    build_append_int_noprefix(table_data, ~0x1ULL, 8);
 +    /* Read Ack Write */
 +    build_append_int_noprefix(table_data, 0x1, 8);
 +}
 +
 +/* Build Hardware Error Source Table */
 +void acpi_build_hest(GArray *table_data, BIOSLinker *linker)
 +{
 +    uint64_t hest_start = table_data->len;
 +
 +    /* Hardware Error Source Table header*/
 +    acpi_data_push(table_data, sizeof(AcpiTableHeader));
 +
 +    /* Error Source Count */
 +    build_append_int_noprefix(table_data, ACPI_GHES_ERROR_SOURCE_COUNT, 4);
 +
 +    build_ghes_v2(table_data, ACPI_HEST_SRC_ID_SEA, linker);
 +
 +    build_header(linker, table_data, (void *)(table_data->data + hest_start),
 +        "HEST", table_data->len - hest_start, 1, NULL, NULL);
 +}
 diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt-acpi-build.c
 +++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
      if (vms->ras) {
          build_ghes_error_table(tables->hardware_errors, tables->linker);
 +        acpi_add_table(table_offsets, tables_blob);
 +        acpi_build_hest(tables_blob, tables->linker);
      }
-     if (ms->numa_state->num_nodes > 0) {
 --
 .20.1

-[PULL 14/45] target/arm: Pass pointer to qc to qrdmla/qrdmls
+[PULL 07/36] tests/qtest/npcm7xx_rng-test: dump random data on failure
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Havard Skinnemoen <hskinnemoen@google.com>
-Pass a pointer directly to env->vfp.qc[0], rather than env.
+Dump the collected random data after a randomness test failure.
 This will allow SVE2, which does not modify QC, to pass a
 pointer to dummy storage.
-Change the return type of inl_qrdml.h_s16 to match the
+Note that this relies on the test having called
-sense of the operation: signed.
+g_test_set_nonfatal_assertions() so we don't abort immediately on the
 assertion failure.
+Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+[PMM: minor commit message tweak]
 Message-id: 20200513163245.17915-14-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate.c  | 18 ++++++++---
+ tests/qtest/npcm7xx_rng-test.c | 12 ++++++++++++
- target/arm/vec_helper.c | 70 +++++++++++++++++++++++------------------
+file changed, 12 insertions(+)
 files changed, 54 insertions(+), 34 deletions(-)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+diff --git a/tests/qtest/npcm7xx_rng-test.c b/tests/qtest/npcm7xx_rng-test.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/tests/qtest/npcm7xx_rng-test.c
-+++ b/target/arm/translate.c
++++ b/tests/qtest/npcm7xx_rng-test.c
-@@ -XXX,XX +XXX,XX @@ static const uint8_t neon_2rm_sizes[] = {
+@@ -XXX,XX +XXX,XX @@
-     [NEON_2RM_VCVT_UF] = 0x4,
- };
+ #include "libqtest-single.h"
+ #include "qemu/bitops.h"
-+static void gen_gvec_fn3_qc(uint32_t rd_ofs, uint32_t rn_ofs, uint32_t rm_ofs,
++#include "qemu-common.h"
-+                            uint32_t opr_sz, uint32_t max_sz,
-+                            gen_helper_gvec_3_ptr *fn)
+ #define RNG_BASE_ADDR   0xf000b000
@@ -XXX,XX +XXX,XX @@
  /* Number of bits to collect for randomness tests. */
  #define TEST_INPUT_BITS  (128)
 +static void dump_buf_if_failed(const uint8_t *buf, size_t size)
 +{
-+    TCGv_ptr qc_ptr = tcg_temp_new_ptr();
++    if (g_test_failed()) {
-+
++        qemu_hexdump(stderr, "", buf, size);
-+    tcg_gen_addi_ptr(qc_ptr, cpu_env, offsetof(CPUARMState, vfp.qc));
++    }
 +    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, qc_ptr,
 +                       opr_sz, max_sz, 0, fn);
 +    tcg_temp_free_ptr(qc_ptr);
 +}
 +
- void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ static void rng_writeb(unsigned int offset, uint8_t value)
                            uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
  {
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     writeb(RNG_BASE_ADDR + offset, value);
-         gen_helper_gvec_qrdmlah_s16, gen_helper_gvec_qrdmlah_s32
+@@ -XXX,XX +XXX,XX @@ static void test_continuous_monobit(void)
-     };
+     }
-     tcg_debug_assert(vece >= 1 && vece <= 2);
--    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
+     g_assert_cmpfloat(calc_monobit_p(buf, sizeof(buf)), >, 0.01);
--                       opr_sz, max_sz, 0, fns[vece - 1]);
++    dump_buf_if_failed(buf, sizeof(buf));
 +    gen_gvec_fn3_qc(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, fns[vece - 1]);
  }
- void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+ /*
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+@@ -XXX,XX +XXX,XX @@ static void test_continuous_runs(void)
-         gen_helper_gvec_qrdmlsh_s16, gen_helper_gvec_qrdmlsh_s32
+     }
-     };
-     tcg_debug_assert(vece >= 1 && vece <= 2);
+     g_assert_cmpfloat(calc_runs_p(buf.l, sizeof(buf) * BITS_PER_BYTE), >, 0.01);
--    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
++    dump_buf_if_failed(buf.c, sizeof(buf));
 -                       opr_sz, max_sz, 0, fns[vece - 1]);
 +    gen_gvec_fn3_qc(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, fns[vece - 1]);
  }
- #define GEN_CMP0(NAME, COND)                                            \
+ /*
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ static void test_first_byte_monobit(void)
-index XXXXXXX..XXXXXXX 100644
+     }
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
+     g_assert_cmpfloat(calc_monobit_p(buf, sizeof(buf)), >, 0.01);
-@@ -XXX,XX +XXX,XX @@
++    dump_buf_if_failed(buf, sizeof(buf));
  #define H4(x)  (x)
  #endif
 -#define SET_QC() env->vfp.qc[0] = 1
 -
  static void clear_tail(void *vd, uintptr_t opr_sz, uintptr_t max_sz)
  {
      uint64_t *d = vd + opr_sz;
@@ -XXX,XX +XXX,XX @@ static void clear_tail(void *vd, uintptr_t opr_sz, uintptr_t max_sz)
  }
- /* Signed saturating rounding doubling multiply-accumulate high half, 16-bit */
+ /*
--static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
+@@ -XXX,XX +XXX,XX @@ static void test_first_byte_runs(void)
 -                                int16_t src2, int16_t src3)
 +static int16_t inl_qrdmlah_s16(int16_t src1, int16_t src2,
 +                               int16_t src3, uint32_t *sat)
  {
      /* Simplify:
       * = ((a3 << 16) + ((e1 * e2) << 1) + (1 << 15)) >> 16
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
      ret = ((int32_t)src3 << 15) + ret + (1 << 14);
      ret >>= 15;
      if (ret != (int16_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? -0x8000 : 0x7fff);
      }
-     return ret;
-@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlah_s16(CPUARMState *env, int16_t src1,
+     g_assert_cmpfloat(calc_runs_p(buf.l, sizeof(buf) * BITS_PER_BYTE), >, 0.01);
- uint32_t HELPER(neon_qrdmlah_s16)(CPUARMState *env, uint32_t src1,
++    dump_buf_if_failed(buf.c, sizeof(buf));
                                    uint32_t src2, uint32_t src3)
  {
 -    uint16_t e1 = inl_qrdmlah_s16(env, src1, src2, src3);
 -    uint16_t e2 = inl_qrdmlah_s16(env, src1 >> 16, src2 >> 16, src3 >> 16);
 +    uint32_t *sat = &env->vfp.qc[0];
 +    uint16_t e1 = inl_qrdmlah_s16(src1, src2, src3, sat);
 +    uint16_t e2 = inl_qrdmlah_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
      return deposit32(e1, 16, 16, e2);
  }
- void HELPER(gvec_qrdmlah_s16)(void *vd, void *vn, void *vm,
+ int main(int argc, char **argv)
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int16_t *d = vd;
      int16_t *n = vn;
      int16_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 2; ++i) {
 -        d[i] = inl_qrdmlah_s16(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlah_s16(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
  /* Signed saturating rounding doubling multiply-subtract high half, 16-bit */
 -static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
 -                                int16_t src2, int16_t src3)
 +static int16_t inl_qrdmlsh_s16(int16_t src1, int16_t src2,
 +                               int16_t src3, uint32_t *sat)
  {
      /* Similarly, using subtraction:
       * = ((a3 << 16) - ((e1 * e2) << 1) + (1 << 15)) >> 16
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
      ret = ((int32_t)src3 << 15) - ret + (1 << 14);
      ret >>= 15;
      if (ret != (int16_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? -0x8000 : 0x7fff);
      }
      return ret;
@@ -XXX,XX +XXX,XX @@ static uint16_t inl_qrdmlsh_s16(CPUARMState *env, int16_t src1,
  uint32_t HELPER(neon_qrdmlsh_s16)(CPUARMState *env, uint32_t src1,
                                    uint32_t src2, uint32_t src3)
  {
 -    uint16_t e1 = inl_qrdmlsh_s16(env, src1, src2, src3);
 -    uint16_t e2 = inl_qrdmlsh_s16(env, src1 >> 16, src2 >> 16, src3 >> 16);
 +    uint32_t *sat = &env->vfp.qc[0];
 +    uint16_t e1 = inl_qrdmlsh_s16(src1, src2, src3, sat);
 +    uint16_t e2 = inl_qrdmlsh_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
      return deposit32(e1, 16, 16, e2);
  }
  void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int16_t *d = vd;
      int16_t *n = vn;
      int16_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 2; ++i) {
 -        d[i] = inl_qrdmlsh_s16(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlsh_s16(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
  /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
 -uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
 -                                  int32_t src2, int32_t src3)
 +static int32_t inl_qrdmlah_s32(int32_t src1, int32_t src2,
 +                               int32_t src3, uint32_t *sat)
  {
      /* Simplify similarly to int_qrdmlah_s16 above.  */
      int64_t ret = (int64_t)src1 * src2;
      ret = ((int64_t)src3 << 31) + ret + (1 << 30);
      ret >>= 31;
      if (ret != (int32_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? INT32_MIN : INT32_MAX);
      }
      return ret;
  }
 +uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
 +                                  int32_t src2, int32_t src3)
 +{
 +    uint32_t *sat = &env->vfp.qc[0];
 +    return inl_qrdmlah_s32(src1, src2, src3, sat);
 +}
 +
  void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int32_t *d = vd;
      int32_t *n = vn;
      int32_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 4; ++i) {
 -        d[i] = helper_neon_qrdmlah_s32(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlah_s32(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
  /* Signed saturating rounding doubling multiply-subtract high half, 32-bit */
 -uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
 -                                  int32_t src2, int32_t src3)
 +static int32_t inl_qrdmlsh_s32(int32_t src1, int32_t src2,
 +                               int32_t src3, uint32_t *sat)
  {
      /* Simplify similarly to int_qrdmlsh_s16 above.  */
      int64_t ret = (int64_t)src1 * src2;
      ret = ((int64_t)src3 << 31) - ret + (1 << 30);
      ret >>= 31;
      if (ret != (int32_t)ret) {
 -        SET_QC();
 +        *sat = 1;
          ret = (ret < 0 ? INT32_MIN : INT32_MAX);
      }
      return ret;
  }
 +uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
 +                                  int32_t src2, int32_t src3)
 +{
 +    uint32_t *sat = &env->vfp.qc[0];
 +    return inl_qrdmlsh_s32(src1, src2, src3, sat);
 +}
 +
  void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
 -                              void *ve, uint32_t desc)
 +                              void *vq, uint32_t desc)
  {
      uintptr_t opr_sz = simd_oprsz(desc);
      int32_t *d = vd;
      int32_t *n = vn;
      int32_t *m = vm;
 -    CPUARMState *env = ve;
      uintptr_t i;
      for (i = 0; i < opr_sz / 4; ++i) {
 -        d[i] = helper_neon_qrdmlsh_s32(env, n[i], m[i], d[i]);
 +        d[i] = inl_qrdmlsh_s32(n[i], m[i], d[i], vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
 --
 .20.1

-[PULL 04/45] target/arm: Create gen_gvec_{sri,sli}
+[PULL 08/36] i.MX25: Fix bad printf format specifiers
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Alex Chen <alex.chen@huawei.com>
-The functions eliminate duplication of the special cases for
+We should use printf format specifier "%u" instead of "%d" for
-this operation.  They match up with the GVecGen2iFn typedef.
+argument of type "unsigned int".
-Add out-of-line helpers.  We got away with only having inline
+Reported-by: Euler Robot <euler.robot@huawei.com>
-expanders because the neon vector size is only 16 bytes, and
+Signed-off-by: Alex Chen <alex.chen@huawei.com>
-we know that the inline expansion will always succeed.
+Message-id: 20201126111109.112238-2-alex.chen@huawei.com
 When we reuse this for SVE, tcg-gvec-op may decide to use an
 out-of-line helper due to longer vector lengths.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  10 ++
+ hw/misc/imx25_ccm.c | 12 ++++++------
- target/arm/translate.h     |   7 +-
+file changed, 6 insertions(+), 6 deletions(-)
  target/arm/translate-a64.c |  20 +---
  target/arm/translate.c     | 186 +++++++++++++++++++++----------------
  target/arm/vec_helper.c    |  38 ++++++++
 files changed, 160 insertions(+), 101 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/misc/imx25_ccm.c b/hw/misc/imx25_ccm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/misc/imx25_ccm.c
-+++ b/target/arm/helper.h
++++ b/hw/misc/imx25_ccm.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_ursra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static const char *imx25_ccm_reg_name(uint32_t reg)
- DEF_HELPER_FLAGS_3(gvec_ursra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+     case IMX25_CCM_LPIMR1_REG:
- DEF_HELPER_FLAGS_3(gvec_ursra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+         return "lpimr1";
+     default:
-+DEF_HELPER_FLAGS_3(gvec_sri_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+-        sprintf(unknown, "[%d ?]", reg);
-+DEF_HELPER_FLAGS_3(gvec_sri_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
++        sprintf(unknown, "[%u ?]", reg);
-+DEF_HELPER_FLAGS_3(gvec_sri_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+         return unknown;
-+DEF_HELPER_FLAGS_3(gvec_sri_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+     }
 +
 +DEF_HELPER_FLAGS_3(gvec_sli_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sli_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sli_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_3(gvec_sli_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.h
 +++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ extern const GVecGen3 mls_op[4];
  extern const GVecGen3 cmtst_op[4];
  extern const GVecGen3 sshl_op[4];
  extern const GVecGen3 ushl_op[4];
 -extern const GVecGen2i sri_op[4];
 -extern const GVecGen2i sli_op[4];
  extern const GVecGen4 uqadd_op[4];
  extern const GVecGen4 sqadd_op[4];
  extern const GVecGen4 uqsub_op[4];
@@ -XXX,XX +XXX,XX @@ void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
  void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
                      int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                  int64_t shift, uint32_t opr_sz, uint32_t max_sz);
 +
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op2(DisasContext *s, bool is_q, int rd,
                     is_q ? 16 : 8, vec_full_reg_size(s), gvec_op);
  }
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx25_ccm_get_mpll_clk(IMXCCMState *dev)
--/* Expand a 2-operand + immediate AdvSIMD vector operation using
+         freq = imx_ccm_calc_pll(s->reg[IMX25_CCM_MPCTL_REG], CKIH_FREQ);
 - * an op descriptor.
 - */
 -static void gen_gvec_op2i(DisasContext *s, bool is_q, int rd,
 -                          int rn, int64_t imm, const GVecGen2i *gvec_op)
 -{
 -    tcg_gen_gvec_2i(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
 -                    is_q ? 16 : 8, vec_full_reg_size(s), imm, gvec_op);
 -}
 -
  /* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
  static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
                           int rn, int rm, const GVecGen3 *gvec_op)
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
          gen_gvec_fn2i(s, is_q, rd, rn, shift,
                        is_u ? gen_gvec_usra : gen_gvec_ssra, size);
          return;
 +
      case 0x08: /* SRI */
 -        /* Shift count same as element size is valid but does nothing.  */
 -        if (shift == 8 << size) {
 -            goto done;
 -        }
 -        gen_gvec_op2i(s, is_q, rd, rn, shift, &sri_op[size]);
 +        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sri, size);
          return;
      case 0x00: /* SSHR / USHR */
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
      }
-     tcg_temp_free_i64(tcg_round);
+-    DPRINTF("freq = %d\n", freq);
-- done:
++    DPRINTF("freq = %u\n", freq);
-     clear_vec_high(s, is_q, rd);
      return freq;
  }
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx25_ccm_get_mcu_clk(IMXCCMState *dev)
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shli(DisasContext *s, bool is_q, bool insert,
      freq = freq / (1 + EXTRACT(s->reg[IMX25_CCM_CCTL_REG], ARM_CLK_DIV));
 -    DPRINTF("freq = %d\n", freq);
 +    DPRINTF("freq = %u\n", freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint32_t imx25_ccm_get_ahb_clk(IMXCCMState *dev)
      freq = imx25_ccm_get_mcu_clk(dev)
             / (1 + EXTRACT(s->reg[IMX25_CCM_CCTL_REG], AHB_CLK_DIV));
 -    DPRINTF("freq = %d\n", freq);
 +    DPRINTF("freq = %u\n", freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint32_t imx25_ccm_get_ipg_clk(IMXCCMState *dev)
      freq = imx25_ccm_get_ahb_clk(dev) / 2;
 -    DPRINTF("freq = %d\n", freq);
 +    DPRINTF("freq = %u\n", freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint32_t imx25_ccm_get_clock_frequency(IMXCCMState *dev, IMXClk clock)
          break;
      }
-     if (insert) {
+-    DPRINTF("Clock = %d) = %d\n", clock, freq);
--        gen_gvec_op2i(s, is_q, rd, rn, shift, &sli_op[size]);
++    DPRINTF("Clock = %d) = %u\n", clock, freq);
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sli, size);
-     } else {
+     return freq;
          gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_shli, size);
      }
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_shr64_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  static void gen_shr_ins_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
  {
 -    if (sh == 0) {
 -        tcg_gen_mov_vec(d, a);
 -    } else {
 -        TCGv_vec t = tcg_temp_new_vec_matching(d);
 -        TCGv_vec m = tcg_temp_new_vec_matching(d);
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec m = tcg_temp_new_vec_matching(d);
 -        tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK((8 << vece) - sh, sh));
 -        tcg_gen_shri_vec(vece, t, a, sh);
 -        tcg_gen_and_vec(vece, d, d, m);
 -        tcg_gen_or_vec(vece, d, d, t);
 +    tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK((8 << vece) - sh, sh));
 +    tcg_gen_shri_vec(vece, t, a, sh);
 +    tcg_gen_and_vec(vece, d, d, m);
 +    tcg_gen_or_vec(vece, d, d, t);
 -        tcg_temp_free_vec(t);
 -        tcg_temp_free_vec(m);
 -    }
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(m);
  }
--static const TCGOpcode vecop_list_sri[] = { INDEX_op_shri_vec, 0 };
-+void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                  int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = { INDEX_op_shri_vec, 0 };
-+    const GVecGen2i ops[4] = {
-+        { .fni8 = gen_shr8_ins_i64,
-+          .fniv = gen_shr_ins_vec,
-+          .fno = gen_helper_gvec_sri_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni8 = gen_shr16_ins_i64,
-+          .fniv = gen_shr_ins_vec,
-+          .fno = gen_helper_gvec_sri_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_shr32_ins_i32,
-+          .fniv = gen_shr_ins_vec,
-+          .fno = gen_helper_gvec_sri_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_shr64_ins_i64,
-+          .fniv = gen_shr_ins_vec,
-+          .fno = gen_helper_gvec_sri_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
--const GVecGen2i sri_op[4] = {
--    { .fni8 = gen_shr8_ins_i64,
--      .fniv = gen_shr_ins_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_sri,
--      .vece = MO_8 },
--    { .fni8 = gen_shr16_ins_i64,
--      .fniv = gen_shr_ins_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_sri,
--      .vece = MO_16 },
--    { .fni4 = gen_shr32_ins_i32,
--      .fniv = gen_shr_ins_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_sri,
--      .vece = MO_32 },
--    { .fni8 = gen_shr64_ins_i64,
--      .fniv = gen_shr_ins_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_sri,
--      .vece = MO_64 },
--};
-+    /* tszimm encoding produces immediates in the range [1..esize]. */
-+    tcg_debug_assert(shift > 0);
-+    tcg_debug_assert(shift <= (8 << vece));
-+
-+    /* Shift of esize leaves destination unchanged. */
-+    if (shift < (8 << vece)) {
-+        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+    } else {
-+        /* Nop, but we do need to clear the tail. */
-+        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
-+    }
-+}
- static void gen_shl8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_shl64_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
- static void gen_shl_ins_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
- {
--    if (sh == 0) {
--        tcg_gen_mov_vec(d, a);
--    } else {
--        TCGv_vec t = tcg_temp_new_vec_matching(d);
--        TCGv_vec m = tcg_temp_new_vec_matching(d);
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+    TCGv_vec m = tcg_temp_new_vec_matching(d);
--        tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK(0, sh));
--        tcg_gen_shli_vec(vece, t, a, sh);
--        tcg_gen_and_vec(vece, d, d, m);
--        tcg_gen_or_vec(vece, d, d, t);
-+    tcg_gen_shli_vec(vece, t, a, sh);
-+    tcg_gen_dupi_vec(vece, m, MAKE_64BIT_MASK(0, sh));
-+    tcg_gen_and_vec(vece, d, d, m);
-+    tcg_gen_or_vec(vece, d, d, t);
--        tcg_temp_free_vec(t);
--        tcg_temp_free_vec(m);
--    }
-+    tcg_temp_free_vec(t);
-+    tcg_temp_free_vec(m);
- }
--static const TCGOpcode vecop_list_sli[] = { INDEX_op_shli_vec, 0 };
-+void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                  int64_t shift, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = { INDEX_op_shli_vec, 0 };
-+    const GVecGen2i ops[4] = {
-+        { .fni8 = gen_shl8_ins_i64,
-+          .fniv = gen_shl_ins_vec,
-+          .fno = gen_helper_gvec_sli_b,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni8 = gen_shl16_ins_i64,
-+          .fniv = gen_shl_ins_vec,
-+          .fno = gen_helper_gvec_sli_h,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_shl32_ins_i32,
-+          .fniv = gen_shl_ins_vec,
-+          .fno = gen_helper_gvec_sli_s,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_shl64_ins_i64,
-+          .fniv = gen_shl_ins_vec,
-+          .fno = gen_helper_gvec_sli_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
--const GVecGen2i sli_op[4] = {
--    { .fni8 = gen_shl8_ins_i64,
--      .fniv = gen_shl_ins_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_sli,
--      .vece = MO_8 },
--    { .fni8 = gen_shl16_ins_i64,
--      .fniv = gen_shl_ins_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_sli,
--      .vece = MO_16 },
--    { .fni4 = gen_shl32_ins_i32,
--      .fniv = gen_shl_ins_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_sli,
--      .vece = MO_32 },
--    { .fni8 = gen_shl64_ins_i64,
--      .fniv = gen_shl_ins_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_sli,
--      .vece = MO_64 },
--};
-+    /* tszimm encoding produces immediates in the range [0..esize-1]. */
-+    tcg_debug_assert(shift >= 0);
-+    tcg_debug_assert(shift < (8 << vece));
-+
-+    if (shift == 0) {
-+        tcg_gen_gvec_mov(vece, rd_ofs, rm_ofs, opr_sz, max_sz);
-+    } else {
-+        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
-+    }
-+}
- static void gen_mla8_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
- {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                     }
-                     /* Right shift comes here negative.  */
-                     shift = -shift;
--                    /* Shift out of range leaves destination unchanged.  */
--                    if (shift < 8 << size) {
--                        tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size, vec_size,
--                                        shift, &sri_op[size]);
--                    }
-+                    gen_gvec_sri(size, rd_ofs, rm_ofs, shift,
-+                                 vec_size, vec_size);
-                     return 0;
-                 case 5: /* VSHL, VSLI */
-                     if (u) { /* VSLI */
--                        /* Shift out of range leaves destination unchanged.  */
--                        if (shift < 8 << size) {
--                            tcg_gen_gvec_2i(rd_ofs, rm_ofs, vec_size,
--                                            vec_size, shift, &sli_op[size]);
--                        }
-+                        gen_gvec_sli(size, rd_ofs, rm_ofs, shift,
-+                                     vec_size, vec_size);
-                     } else { /* VSHL */
-                         /* Shifts larger than the element size are
-                          * architecturally valid and results in zero.
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_RSRA(gvec_ursra_d, uint64_t)
- #undef DO_RSRA
-+#define DO_SRI(NAME, TYPE)                              \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        d[i] = deposit64(d[i], 0, sizeof(TYPE) * 8 - shift, n[i] >> shift); \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_SRI(gvec_sri_b, uint8_t)
-+DO_SRI(gvec_sri_h, uint16_t)
-+DO_SRI(gvec_sri_s, uint32_t)
-+DO_SRI(gvec_sri_d, uint64_t)
-+
-+#undef DO_SRI
-+
-+#define DO_SLI(NAME, TYPE)                              \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        d[i] = deposit64(d[i], shift, sizeof(TYPE) * 8 - shift, n[i]); \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_SLI(gvec_sli_b, uint8_t)
-+DO_SLI(gvec_sli_h, uint16_t)
-+DO_SLI(gvec_sli_s, uint32_t)
-+DO_SLI(gvec_sli_d, uint64_t)
-+
-+#undef DO_SLI
-+
- /*
-  * Convert float16 to float32, raising no exceptions and
-  * preserving exceptional values, including SNaN.
 --
 .20.1

-[PULL 18/45] aspeed: Add support for the sonorapass-bmc board
+[PULL 09/36] i.MX31: Fix bad printf format specifiers
-From: Patrick Williams <patrick@stwcx.xyz>
+From: Alex Chen <alex.chen@huawei.com>
-Sonora Pass is a 2 socket x86 motherboard designed by Facebook
+We should use printf format specifier "%u" instead of "%d" for
-and supported by OpenBMC.  Strapping configuration was obtained
+argument of type "unsigned int".
 from hardware and i2c configuration is based on dts found at:
-https://github.com/facebook/openbmc-linux/blob/1633c87b8ba7c162095787c988979b748ba65dc8/arch/arm/boot/dts/aspeed-bmc-facebook-sonorapass.dts
+Reported-by: Euler Robot <euler.robot@huawei.com>
+Signed-off-by: Alex Chen <alex.chen@huawei.com>
-Booted a test image of http://github.com/facebook/openbmc to login
+Message-id: 20201126111109.112238-3-alex.chen@huawei.com
-prompt.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Patrick Williams <patrick@stwcx.xyz>
 Reviewed-by: Amithash Prasad <amithash@fb.com>
 Reviewed-by: Cédric Le Goater <clg@kaod.org>
 [PMM: fixed block comment style nit]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/aspeed.c | 78 +++++++++++++++++++++++++++++++++++++++++++++++++
+ hw/misc/imx31_ccm.c | 14 +++++++-------
-file changed, 78 insertions(+)
+ hw/misc/imx_ccm.c   |  4 ++--
 files changed, 9 insertions(+), 9 deletions(-)
-diff --git a/hw/arm/aspeed.c b/hw/arm/aspeed.c
+diff --git a/hw/misc/imx31_ccm.c b/hw/misc/imx31_ccm.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/aspeed.c
+--- a/hw/misc/imx31_ccm.c
-+++ b/hw/arm/aspeed.c
++++ b/hw/misc/imx31_ccm.c
-@@ -XXX,XX +XXX,XX @@ struct AspeedBoardState {
+@@ -XXX,XX +XXX,XX @@ static const char *imx31_ccm_reg_name(uint32_t reg)
-         SCU_AST2500_HW_STRAP_ACPI_ENABLE |                              \
+     case IMX31_CCM_PDR2_REG:
-         SCU_HW_STRAP_SPI_MODE(SCU_HW_STRAP_SPI_MASTER))
+         return "PDR2";
+     default:
-+/* Sonorapass hardware value: 0xF100D216 */
+-        sprintf(unknown, "[%d ?]", reg);
-+#define SONORAPASS_BMC_HW_STRAP1 (                                      \
++        sprintf(unknown, "[%u ?]", reg);
-+        SCU_AST2500_HW_STRAP_SPI_AUTOFETCH_ENABLE |                     \
+         return unknown;
-+        SCU_AST2500_HW_STRAP_GPIO_STRAP_ENABLE |                        \
+     }
 +        SCU_AST2500_HW_STRAP_UART_DEBUG |                               \
 +        SCU_AST2500_HW_STRAP_RESERVED28 |                               \
 +        SCU_AST2500_HW_STRAP_DDR4_ENABLE |                              \
 +        SCU_HW_STRAP_VGA_CLASS_CODE |                                   \
 +        SCU_HW_STRAP_LPC_RESET_PIN |                                    \
 +        SCU_HW_STRAP_SPI_MODE(SCU_HW_STRAP_SPI_MASTER) |                \
 +        SCU_AST2500_HW_STRAP_SET_AXI_AHB_RATIO(AXI_AHB_RATIO_2_1) |     \
 +        SCU_HW_STRAP_VGA_BIOS_ROM |                                     \
 +        SCU_HW_STRAP_VGA_SIZE_SET(VGA_16M_DRAM) |                       \
 +        SCU_AST2500_HW_STRAP_RESERVED1)
 +
  /* Swift hardware value: 0xF11AD206 */
  #define SWIFT_BMC_HW_STRAP1 (                                           \
          AST2500_HW_STRAP1_DEFAULTS |                                    \
@@ -XXX,XX +XXX,XX @@ static void swift_bmc_i2c_init(AspeedBoardState *bmc)
      i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 12), "tmp105", 0x4a);
  }
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx31_ccm_get_pll_ref_clk(IMXCCMState *dev)
-+static void sonorapass_bmc_i2c_init(AspeedBoardState *bmc)
+         freq = CKIH_FREQ;
-+{
+     }
-+    AspeedSoCState *soc = &bmc->soc;
-+
+-    DPRINTF("freq = %d\n", freq);
-+    /* bus 2 : */
++    DPRINTF("freq = %u\n", freq);
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 2), "tmp105", 0x48);
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 2), "tmp105", 0x49);
+     return freq;
-+    /* bus 2 : pca9546 @ 0x73 */
+ }
-+
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx31_ccm_get_mpll_clk(IMXCCMState *dev)
-+    /* bus 3 : pca9548 @ 0x70 */
+     freq = imx_ccm_calc_pll(s->reg[IMX31_CCM_MPCTL_REG],
-+
+                             imx31_ccm_get_pll_ref_clk(dev));
-+    /* bus 4 : */
-+    uint8_t *eeprom4_54 = g_malloc0(8 * 1024);
+-    DPRINTF("freq = %d\n", freq);
-+    smbus_eeprom_init_one(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), 0x54,
++    DPRINTF("freq = %u\n", freq);
-+                          eeprom4_54);
-+    /* PCA9539 @ 0x76, but PCA9552 is compatible */
+     return freq;
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), "pca9552", 0x76);
+ }
-+    /* PCA9539 @ 0x77, but PCA9552 is compatible */
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx31_ccm_get_mcu_main_clk(IMXCCMState *dev)
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 4), "pca9552", 0x77);
+         freq = imx31_ccm_get_mpll_clk(dev);
-+
+     }
-+    /* bus 6 : */
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 6), "tmp105", 0x48);
+-    DPRINTF("freq = %d\n", freq);
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 6), "tmp105", 0x49);
++    DPRINTF("freq = %u\n", freq);
-+    /* bus 6 : pca9546 @ 0x73 */
-+
+     return freq;
-+    /* bus 8 : */
+ }
-+    uint8_t *eeprom8_56 = g_malloc0(8 * 1024);
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx31_ccm_get_hclk_clk(IMXCCMState *dev)
-+    smbus_eeprom_init_one(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), 0x56,
+     freq = imx31_ccm_get_mcu_main_clk(dev)
-+                          eeprom8_56);
+            / (1 + EXTRACT(s->reg[IMX31_CCM_PDR0_REG], MAX));
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), "pca9552", 0x60);
-+    i2c_create_slave(aspeed_i2c_get_bus(DEVICE(&soc->i2c), 8), "pca9552", 0x61);
+-    DPRINTF("freq = %d\n", freq);
-+    /* bus 8 : adc128d818 @ 0x1d */
++    DPRINTF("freq = %u\n", freq);
-+    /* bus 8 : adc128d818 @ 0x1f */
-+
+     return freq;
-+    /*
+ }
-+     * bus 13 : pca9548 @ 0x71
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx31_ccm_get_ipg_clk(IMXCCMState *dev)
-+     *      - channel 3:
+     freq = imx31_ccm_get_hclk_clk(dev)
-+     *          - tmm421 @ 0x4c
+            / (1 + EXTRACT(s->reg[IMX31_CCM_PDR0_REG], IPG));
-+     *          - tmp421 @ 0x4e
-+     *          - tmp421 @ 0x4f
+-    DPRINTF("freq = %d\n", freq);
-+     */
++    DPRINTF("freq = %u\n", freq);
-+
-+}
+     return freq;
-+
+ }
- static void witherspoon_bmc_i2c_init(AspeedBoardState *bmc)
+@@ -XXX,XX +XXX,XX @@ static uint32_t imx31_ccm_get_clock_frequency(IMXCCMState *dev, IMXClk clock)
- {
+         break;
-     AspeedSoCState *soc = &bmc->soc;
+     }
-@@ -XXX,XX +XXX,XX @@ static void aspeed_machine_romulus_class_init(ObjectClass *oc, void *data)
-     mc->default_ram_size       = 512 * MiB;
+-    DPRINTF("Clock = %d) = %d\n", clock, freq);
- };
++    DPRINTF("Clock = %d) = %u\n", clock, freq);
-+static void aspeed_machine_sonorapass_class_init(ObjectClass *oc, void *data)
+     return freq;
-+{
+ }
-+    MachineClass *mc = MACHINE_CLASS(oc);
+diff --git a/hw/misc/imx_ccm.c b/hw/misc/imx_ccm.c
-+    AspeedMachineClass *amc = ASPEED_MACHINE_CLASS(oc);
+index XXXXXXX..XXXXXXX 100644
-+
+--- a/hw/misc/imx_ccm.c
-+    mc->desc       = "OCP SonoraPass BMC (ARM1176)";
++++ b/hw/misc/imx_ccm.c
-+    amc->soc_name  = "ast2500-a1";
+@@ -XXX,XX +XXX,XX @@ uint32_t imx_ccm_get_clock_frequency(IMXCCMState *dev, IMXClk clock)
-+    amc->hw_strap1 = SONORAPASS_BMC_HW_STRAP1;
+         freq = klass->get_clock_frequency(dev, clock);
-+    amc->fmc_model = "mx66l1g45g";
+     }
-+    amc->spi_model = "mx66l1g45g";
-+    amc->num_cs    = 2;
+-    DPRINTF("(clock = %d) = %d\n", clock, freq);
-+    amc->i2c_init  = sonorapass_bmc_i2c_init;
++    DPRINTF("(clock = %d) = %u\n", clock, freq);
-+    mc->default_ram_size       = 512 * MiB;
-+};
+     return freq;
-+
+ }
- static void aspeed_machine_swift_class_init(ObjectClass *oc, void *data)
+@@ -XXX,XX +XXX,XX @@ uint32_t imx_ccm_calc_pll(uint32_t pllreg, uint32_t base_freq)
- {
+     freq = ((2 * (base_freq >> 10) * (mfi * mfd + mfn)) /
-     MachineClass *mc = MACHINE_CLASS(oc);
+             (mfd * pd)) << 10;
-@@ -XXX,XX +XXX,XX @@ static const TypeInfo aspeed_machine_types[] = {
-         .name          = MACHINE_TYPE_NAME("swift-bmc"),
+-    DPRINTF("(pllreg = 0x%08x, base_freq = %d) = %d\n", pllreg, base_freq,
-         .parent        = TYPE_ASPEED_MACHINE,
++    DPRINTF("(pllreg = 0x%08x, base_freq = %u) = %d\n", pllreg, base_freq,
-         .class_init    = aspeed_machine_swift_class_init,
+             freq);
-+    }, {
-+        .name          = MACHINE_TYPE_NAME("sonorapass-bmc"),
+     return freq;
 +        .parent        = TYPE_ASPEED_MACHINE,
 +        .class_init    = aspeed_machine_sonorapass_class_init,
      }, {
          .name          = MACHINE_TYPE_NAME("witherspoon-bmc"),
          .parent        = TYPE_ASPEED_MACHINE,
 --
 .20.1

-[PULL 25/45] KVM: Move hwpoison page related functions into kvm-all.c
+[PULL 10/36] i.MX6: Fix bad printf format specifiers
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Alex Chen <alex.chen@huawei.com>
-kvm_hwpoison_page_add() and kvm_unpoison_all() will both
+We should use printf format specifier "%u" instead of "%d" for
-be used by X86 and ARM platforms, so moving them into
+argument of type "unsigned int".
 "accel/kvm/kvm-all.c" to avoid duplicate code.
-For architectures that don't use the poison-list functionality
+Reported-by: Euler Robot <euler.robot@huawei.com>
-the reset handler will harmlessly do nothing, so let's register
+Signed-off-by: Alex Chen <alex.chen@huawei.com>
-the kvm_unpoison_all() function in the generic kvm_init() function.
+Message-id: 20201126111109.112238-4-alex.chen@huawei.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
-Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
-Message-id: 20200512030609.19593-8-gengdongjiu@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/sysemu/kvm_int.h | 12 ++++++++++++
+ hw/misc/imx6_ccm.c | 20 ++++++++++----------
- accel/kvm/kvm-all.c      | 36 ++++++++++++++++++++++++++++++++++++
+ hw/misc/imx6_src.c |  2 +-
- target/i386/kvm.c        | 36 ------------------------------------
+files changed, 11 insertions(+), 11 deletions(-)
 files changed, 48 insertions(+), 36 deletions(-)
-diff --git a/include/sysemu/kvm_int.h b/include/sysemu/kvm_int.h
+diff --git a/hw/misc/imx6_ccm.c b/hw/misc/imx6_ccm.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/kvm_int.h
+--- a/hw/misc/imx6_ccm.c
-+++ b/include/sysemu/kvm_int.h
++++ b/hw/misc/imx6_ccm.c
-@@ -XXX,XX +XXX,XX @@ void kvm_memory_listener_register(KVMState *s, KVMMemoryListener *kml,
+@@ -XXX,XX +XXX,XX @@ static const char *imx6_ccm_reg_name(uint32_t reg)
-                                   AddressSpace *as, int as_id);
+     case CCM_CMEOR:
+         return "CMEOR";
- void kvm_set_max_memslot_size(hwaddr max_slot_size);
+     default:
-+
+-        sprintf(unknown, "%d ?", reg);
-+/**
++        sprintf(unknown, "%u ?", reg);
-+ * kvm_hwpoison_page_add:
+         return unknown;
 + *
 + * Parameters:
 + *  @ram_addr: the address in the RAM for the poisoned page
 + *
 + * Add a poisoned page to the list
 + *
 + * Return: None.
 + */
 +void kvm_hwpoison_page_add(ram_addr_t ram_addr);
  #endif
 diff --git a/accel/kvm/kvm-all.c b/accel/kvm/kvm-all.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/kvm/kvm-all.c
 +++ b/accel/kvm/kvm-all.c
@@ -XXX,XX +XXX,XX @@
  #include "qapi/visitor.h"
  #include "qapi/qapi-types-common.h"
  #include "qapi/qapi-visit-common.h"
 +#include "sysemu/reset.h"
  #include "hw/boards.h"
@@ -XXX,XX +XXX,XX @@ int kvm_vm_check_extension(KVMState *s, unsigned int extension)
      return ret;
  }
 +typedef struct HWPoisonPage {
 +    ram_addr_t ram_addr;
 +    QLIST_ENTRY(HWPoisonPage) list;
 +} HWPoisonPage;
 +
 +static QLIST_HEAD(, HWPoisonPage) hwpoison_page_list =
 +    QLIST_HEAD_INITIALIZER(hwpoison_page_list);
 +
 +static void kvm_unpoison_all(void *param)
 +{
 +    HWPoisonPage *page, *next_page;
 +
 +    QLIST_FOREACH_SAFE(page, &hwpoison_page_list, list, next_page) {
 +        QLIST_REMOVE(page, list);
 +        qemu_ram_remap(page->ram_addr, TARGET_PAGE_SIZE);
 +        g_free(page);
 +    }
 +}
 +
 +void kvm_hwpoison_page_add(ram_addr_t ram_addr)
 +{
 +    HWPoisonPage *page;
 +
 +    QLIST_FOREACH(page, &hwpoison_page_list, list) {
 +        if (page->ram_addr == ram_addr) {
 +            return;
 +        }
 +    }
 +    page = g_new(HWPoisonPage, 1);
 +    page->ram_addr = ram_addr;
 +    QLIST_INSERT_HEAD(&hwpoison_page_list, page, list);
 +}
 +
  static uint32_t adjust_ioeventfd_endianness(uint32_t val, uint32_t size)
  {
  #if defined(HOST_WORDS_BIGENDIAN) != defined(TARGET_WORDS_BIGENDIAN)
@@ -XXX,XX +XXX,XX @@ static int kvm_init(MachineState *ms)
          s->kernel_irqchip_split = mc->default_kernel_irqchip_split ? ON_OFF_AUTO_ON : ON_OFF_AUTO_OFF;
      }
 +    qemu_register_reset(kvm_unpoison_all, NULL);
 +
      if (s->kernel_irqchip_allowed) {
          kvm_irqchip_create(s);
      }
 diff --git a/target/i386/kvm.c b/target/i386/kvm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/kvm.c
 +++ b/target/i386/kvm.c
@@ -XXX,XX +XXX,XX @@
  #include "sysemu/sysemu.h"
  #include "sysemu/hw_accel.h"
  #include "sysemu/kvm_int.h"
 -#include "sysemu/reset.h"
  #include "sysemu/runstate.h"
  #include "kvm_i386.h"
  #include "hyperv.h"
@@ -XXX,XX +XXX,XX @@ uint64_t kvm_arch_get_supported_msr_feature(KVMState *s, uint32_t index)
      }
  }
+@@ -XXX,XX +XXX,XX @@ static const char *imx6_analog_reg_name(uint32_t reg)
--
+     case USB_ANALOG_DIGPROG:
--typedef struct HWPoisonPage {
+         return "USB_ANALOG_DIGPROG";
--    ram_addr_t ram_addr;
+     default:
--    QLIST_ENTRY(HWPoisonPage) list;
+-        sprintf(unknown, "%d ?", reg);
--} HWPoisonPage;
++        sprintf(unknown, "%u ?", reg);
--
+         return unknown;
 -static QLIST_HEAD(, HWPoisonPage) hwpoison_page_list =
 -    QLIST_HEAD_INITIALIZER(hwpoison_page_list);
 -
 -static void kvm_unpoison_all(void *param)
 -{
 -    HWPoisonPage *page, *next_page;
 -
 -    QLIST_FOREACH_SAFE(page, &hwpoison_page_list, list, next_page) {
 -        QLIST_REMOVE(page, list);
 -        qemu_ram_remap(page->ram_addr, TARGET_PAGE_SIZE);
 -        g_free(page);
 -    }
 -}
 -
 -static void kvm_hwpoison_page_add(ram_addr_t ram_addr)
 -{
 -    HWPoisonPage *page;
 -
 -    QLIST_FOREACH(page, &hwpoison_page_list, list) {
 -        if (page->ram_addr == ram_addr) {
 -            return;
 -        }
 -    }
 -    page = g_new(HWPoisonPage, 1);
 -    page->ram_addr = ram_addr;
 -    QLIST_INSERT_HEAD(&hwpoison_page_list, page, list);
 -}
 -
  static int kvm_get_mce_cap_supported(KVMState *s, uint64_t *mce_cap,
                                       int *max_banks)
  {
@@ -XXX,XX +XXX,XX @@ int kvm_arch_init(MachineState *ms, KVMState *s)
          fprintf(stderr, "e820_add_entry() table is full\n");
          return ret;
      }
--    qemu_register_reset(kvm_unpoison_all, NULL);
+ }
+@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_analog_get_pll2_clk(IMX6CCMState *dev)
-     shadow_mem = object_property_get_int(OBJECT(s), "kvm-shadow-mem", &error_abort);
+         freq *= 20;
-     if (shadow_mem != -1) {
+     }
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_analog_get_pll2_pfd0_clk(IMX6CCMState *dev)
      freq = imx6_analog_get_pll2_clk(dev) * 18
             / EXTRACT(dev->analog[CCM_ANALOG_PFD_528], PFD0_FRAC);
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_analog_get_pll2_pfd2_clk(IMX6CCMState *dev)
      freq = imx6_analog_get_pll2_clk(dev) * 18
             / EXTRACT(dev->analog[CCM_ANALOG_PFD_528], PFD2_FRAC);
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_analog_get_periph_clk(IMX6CCMState *dev)
          break;
      }
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_ccm_get_ahb_clk(IMX6CCMState *dev)
      freq = imx6_analog_get_periph_clk(dev)
             / (1 + EXTRACT(dev->ccm[CCM_CBCDR], AHB_PODF));
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_ccm_get_ipg_clk(IMX6CCMState *dev)
      freq = imx6_ccm_get_ahb_clk(dev)
             / (1 + EXTRACT(dev->ccm[CCM_CBCDR], IPG_PODF));
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t imx6_ccm_get_per_clk(IMX6CCMState *dev)
      freq = imx6_ccm_get_ipg_clk(dev)
             / (1 + EXTRACT(dev->ccm[CCM_CSCMR1], PERCLK_PODF));
 -    DPRINTF("freq = %d\n", (uint32_t)freq);
 +    DPRINTF("freq = %u\n", (uint32_t)freq);
      return freq;
  }
@@ -XXX,XX +XXX,XX @@ static uint32_t imx6_ccm_get_clock_frequency(IMXCCMState *dev, IMXClk clock)
          break;
      }
 -    DPRINTF("Clock = %d) = %d\n", clock, freq);
 +    DPRINTF("Clock = %d) = %u\n", clock, freq);
      return freq;
  }
 diff --git a/hw/misc/imx6_src.c b/hw/misc/imx6_src.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/imx6_src.c
 +++ b/hw/misc/imx6_src.c
@@ -XXX,XX +XXX,XX @@ static const char *imx6_src_reg_name(uint32_t reg)
      case SRC_GPR10:
          return "SRC_GPR10";
      default:
 -        sprintf(unknown, "%d ?", reg);
 +        sprintf(unknown, "%u ?", reg);
          return unknown;
      }
  }
 --
 .20.1

-[PULL 19/45] acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
+[PULL 11/36] i.MX6ul: Fix bad printf format specifiers
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+From: Alex Chen <alex.chen@huawei.com>
-The little end UUID is used in many places, so make
+We should use printf format specifier "%u" instead of "%d" for
-NVDIMM_UUID_LE to a common macro to convert the UUID
+argument of type "unsigned int".
 to a little end array.
-Reviewed-by: Xiang Zheng <zhengxiang9@huawei.com>
+Reported-by: Euler Robot <euler.robot@huawei.com>
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
+Signed-off-by: Alex Chen <alex.chen@huawei.com>
-Message-id: 20200512030609.19593-2-gengdongjiu@huawei.com
+Message-id: 20201126111109.112238-5-alex.chen@huawei.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/qemu/uuid.h | 27 +++++++++++++++++++++++++++
+ hw/misc/imx6ul_ccm.c | 4 ++--
- hw/acpi/nvdimm.c    | 10 +++-------
+file changed, 2 insertions(+), 2 deletions(-)
 files changed, 30 insertions(+), 7 deletions(-)
-diff --git a/include/qemu/uuid.h b/include/qemu/uuid.h
+diff --git a/hw/misc/imx6ul_ccm.c b/hw/misc/imx6ul_ccm.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/qemu/uuid.h
+--- a/hw/misc/imx6ul_ccm.c
-+++ b/include/qemu/uuid.h
++++ b/hw/misc/imx6ul_ccm.c
-@@ -XXX,XX +XXX,XX @@ typedef struct {
+@@ -XXX,XX +XXX,XX @@ static const char *imx6ul_ccm_reg_name(uint32_t reg)
-     };
+     case CCM_CMEOR:
- } QemuUUID;
+         return "CMEOR";
+     default:
-+/**
+-        sprintf(unknown, "%d ?", reg);
-+ * UUID_LE - converts the fields of UUID to little-endian array,
++        sprintf(unknown, "%u ?", reg);
-+ * each of parameters is the filed of UUID.
+         return unknown;
-+ *
+     }
-+ * @time_low: The low field of the timestamp
+ }
-+ * @time_mid: The middle field of the timestamp
+@@ -XXX,XX +XXX,XX @@ static const char *imx6ul_analog_reg_name(uint32_t reg)
-+ * @time_hi_and_version: The high field of the timestamp
+     case USB_ANALOG_DIGPROG:
-+ *                       multiplexed with the version number
+         return "USB_ANALOG_DIGPROG";
-+ * @clock_seq_hi_and_reserved: The high field of the clock
+     default:
-+ *                             sequence multiplexed with the variant
+-        sprintf(unknown, "%d ?", reg);
-+ * @clock_seq_low: The low field of the clock sequence
++        sprintf(unknown, "%u ?", reg);
-+ * @node0: The spatially unique node0 identifier
+         return unknown;
-+ * @node1: The spatially unique node1 identifier
+     }
-+ * @node2: The spatially unique node2 identifier
+ }
 + * @node3: The spatially unique node3 identifier
 + * @node4: The spatially unique node4 identifier
 + * @node5: The spatially unique node5 identifier
 + */
 +#define UUID_LE(time_low, time_mid, time_hi_and_version,                    \
 +  clock_seq_hi_and_reserved, clock_seq_low, node0, node1, node2,            \
 +  node3, node4, node5)                                                      \
 +  { (time_low) & 0xff, ((time_low) >> 8) & 0xff, ((time_low) >> 16) & 0xff, \
 +    ((time_low) >> 24) & 0xff, (time_mid) & 0xff, ((time_mid) >> 8) & 0xff, \
 +    (time_hi_and_version) & 0xff, ((time_hi_and_version) >> 8) & 0xff,      \
 +    (clock_seq_hi_and_reserved), (clock_seq_low), (node0), (node1), (node2),\
 +    (node3), (node4), (node5) }
 +
  #define UUID_FMT "%02hhx%02hhx%02hhx%02hhx-" \
                   "%02hhx%02hhx-%02hhx%02hhx-" \
                   "%02hhx%02hhx-" \
 diff --git a/hw/acpi/nvdimm.c b/hw/acpi/nvdimm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/acpi/nvdimm.c
 +++ b/hw/acpi/nvdimm.c
@@ -XXX,XX +XXX,XX @@
   */
  #include "qemu/osdep.h"
 +#include "qemu/uuid.h"
  #include "hw/acpi/acpi.h"
  #include "hw/acpi/aml-build.h"
  #include "hw/acpi/bios-linker-loader.h"
@@ -XXX,XX +XXX,XX @@
  #include "hw/mem/nvdimm.h"
  #include "qemu/nvdimm-utils.h"
 -#define NVDIMM_UUID_LE(a, b, c, d0, d1, d2, d3, d4, d5, d6, d7)             \
 -   { (a) & 0xff, ((a) >> 8) & 0xff, ((a) >> 16) & 0xff, ((a) >> 24) & 0xff, \
 -     (b) & 0xff, ((b) >> 8) & 0xff, (c) & 0xff, ((c) >> 8) & 0xff,          \
 -     (d0), (d1), (d2), (d3), (d4), (d5), (d6), (d7) }
 -
  /*
   * define Byte Addressable Persistent Memory (PM) Region according to
   * ACPI 6.0: 5.2.25.1 System Physical Address Range Structure.
   */
  static const uint8_t nvdimm_nfit_spa_uuid[] =
 -      NVDIMM_UUID_LE(0x66f0d379, 0xb4f3, 0x4074, 0xac, 0x43, 0x0d, 0x33,
 -                     0x18, 0xb7, 0x8c, 0xdb);
 +      UUID_LE(0x66f0d379, 0xb4f3, 0x4074, 0xac, 0x43, 0x0d, 0x33,
 +              0x18, 0xb7, 0x8c, 0xdb);
  /*
   * NVDIMM Firmware Interface Table
 --
 .20.1

-[PULL 13/45] target/arm: Create gen_gvec_{qrdmla,qrdmls}
+[PULL 12/36] hw/intc/armv7m_nvic: Make all of system PPB range be RAZWI/BusFault
-From: Richard Henderson <richard.henderson@linaro.org>
+For M-profile CPUs, the range from 0xe0000000 to 0xe00fffff is the
 Private Peripheral Bus range, which includes all of the memory mapped
 devices and registers that are part of the CPU itself, including the
 NVIC, systick timer, and debug and trace components like the Data
 Watchpoint and Trace unit (DWT).  Within this large region, the range
 xe000e000 to 0xe000efff is the System Control Space (NVIC, system
 registers, systick) and 0xe002e000 to 0exe002efff is its Non-secure
 alias.
-Provide a functional interface for the vector expansion.
+The architecture is clear that within the SCS unimplemented registers
-This fits better with the existing set of helpers that
+should be RES0 for privileged accesses and generate BusFault for
-we provide for other operations.
+unprivileged accesses, and we currently implement this.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+It is less clear about how to handle accesses to unimplemented
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+regions of the wider PPB.  Unprivileged accesses should definitely
-Message-id: 20200513163245.17915-13-richard.henderson@linaro.org
+cause BusFaults (R_DQQS), but the behaviour of privileged accesses is
 not given as a general rule.  However, the register definitions of
 individual registers for components like the DWT all state that they
 are RES0 if the relevant component is not implemented, so the
 simplest way to provide that is to provide RAZ/WI for the whole range
 for privileged accesses.  (The v7M Arm ARM does say that reserved
 registers should be UNK/SBZP.)
 Expand the container MemoryRegion that the NVIC exposes so that
 it covers the whole PPB space. This means:
  * moving the address that the ARMV7M device maps it to down by
 xe000 bytes
  * moving the off and the offsets within the container of all the
    subregions forward by 0xe000 bytes
  * adding a new default MemoryRegion that covers the whole container
    at a lower priority than anything else and which provides the
    RAZWI/BusFault behaviour
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201119215617.29887-2-peter.maydell@linaro.org
 ---
- target/arm/translate.h     |  5 ++++
+ include/hw/intc/armv7m_nvic.h |  1 +
- target/arm/translate-a64.c | 34 ++----------------------
+ hw/arm/armv7m.c               |  2 +-
- target/arm/translate.c     | 54 +++++++++++++++++++-------------------
+ hw/intc/armv7m_nvic.c         | 78 ++++++++++++++++++++++++++++++-----
-files changed, 34 insertions(+), 59 deletions(-)
+files changed, 69 insertions(+), 12 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
+diff --git a/include/hw/intc/armv7m_nvic.h b/include/hw/intc/armv7m_nvic.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/include/hw/intc/armv7m_nvic.h
-+++ b/target/arm/translate.h
++++ b/include/hw/intc/armv7m_nvic.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sri(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+@@ -XXX,XX +XXX,XX @@ struct NVICState {
- void gen_gvec_sli(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+     MemoryRegion systickmem;
-                   int64_t shift, uint32_t opr_sz, uint32_t max_sz);
+     MemoryRegion systick_ns_mem;
+     MemoryRegion container;
-+void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++    MemoryRegion defaultmem;
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
+     uint32_t num_irq;
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
+     qemu_irq excpout;
-+
+diff --git a/hw/arm/armv7m.c b/hw/arm/armv7m.c
  /*
   * Forward to the isar_feature_* tests given a DisasContext pointer.
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/arm/armv7m.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/arm/armv7m.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
+@@ -XXX,XX +XXX,XX @@ static void armv7m_realize(DeviceState *dev, Error **errp)
-                        is_q ? 16 : 8, vec_full_reg_size(s), data, fn);
+     sysbus_connect_irq(sbd, 0,
- }
+                        qdev_get_gpio_in(DEVICE(s->cpu), ARM_CPU_IRQ));
--/* Expand a 3-operand + env pointer operation using
+-    memory_region_add_subregion(&s->container, 0xe000e000,
-- * an out-of-line helper.
++    memory_region_add_subregion(&s->container, 0xe0000000,
-- */
+                                 sysbus_mmio_get_region(sbd, 0));
--static void gen_gvec_op3_env(DisasContext *s, bool is_q, int rd,
--                             int rn, int rm, gen_helper_gvec_3_ptr *fn)
+     for (i = 0; i < ARRAY_SIZE(s->bitband); i++) {
--{
+diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 -    tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
 -                       vec_full_reg_offset(s, rn),
 -                       vec_full_reg_offset(s, rm), cpu_env,
 -                       is_q ? 16 : 8, vec_full_reg_size(s), 0, fn);
 -}
 -
  /* Expand a 3-operand + fpstatus pointer + simd data value operation using
   * an out-of-line helper.
   */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
      switch (opcode) {
      case 0x0: /* SQRDMLAH (vector) */
 -        switch (size) {
 -        case 1:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlah_s16);
 -            break;
 -        case 2:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlah_s32);
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 +        gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqrdmlah_qc, size);
          return;
      case 0x1: /* SQRDMLSH (vector) */
 -        switch (size) {
 -        case 1:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlsh_s16);
 -            break;
 -        case 2:
 -            gen_gvec_op3_env(s, is_q, rd, rn, rm, gen_helper_gvec_qrdmlsh_s32);
 -            break;
 -        default:
 -            g_assert_not_reached();
 -        }
 +        gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqrdmlsh_qc, size);
          return;
      case 0x2: /* SDOT / UDOT */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/hw/intc/armv7m_nvic.c
-+++ b/target/arm/translate.c
++++ b/hw/intc/armv7m_nvic.c
-@@ -XXX,XX +XXX,XX @@ static const uint8_t neon_2rm_sizes[] = {
+@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps nvic_systick_ops = {
-     [NEON_2RM_VCVT_UF] = 0x4,
+     .endianness = DEVICE_NATIVE_ENDIAN,
  };
--
++/*
--/* Expand v8.1 simd helper.  */
++ * Unassigned portions of the PPB space are RAZ/WI for privileged
--static int do_v81_helper(DisasContext *s, gen_helper_gvec_3_ptr *fn,
++ * accesses, and fault for non-privileged accesses.
--                         int q, int rd, int rn, int rm)
++ */
-+void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++static MemTxResult ppb_default_read(void *opaque, hwaddr addr,
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
++                                    uint64_t *data, unsigned size,
- {
++                                    MemTxAttrs attrs)
--    if (dc_isar_feature(aa32_rdm, s)) {
++{
--        int opr_sz = (1 + q) * 8;
++    qemu_log_mask(LOG_UNIMP, "Read of unassigned area of PPB: offset 0x%x\n",
--        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
++                  (uint32_t)addr);
--                           vfp_reg_offset(1, rn),
++    if (attrs.user) {
--                           vfp_reg_offset(1, rm), cpu_env,
++        return MEMTX_ERROR;
--                           opr_sz, opr_sz, 0, fn);
++    }
--        return 0;
++    *data = 0;
--    }
++    return MEMTX_OK;
 -    return 1;
 +    static gen_helper_gvec_3_ptr * const fns[2] = {
 +        gen_helper_gvec_qrdmlah_s16, gen_helper_gvec_qrdmlah_s32
 +    };
 +    tcg_debug_assert(vece >= 1 && vece <= 2);
 +    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
 +                       opr_sz, max_sz, 0, fns[vece - 1]);
 +}
 +
-+void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
++static MemTxResult ppb_default_write(void *opaque, hwaddr addr,
-+                          uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
++                                     uint64_t value, unsigned size,
 +                                     MemTxAttrs attrs)
 +{
-+    static gen_helper_gvec_3_ptr * const fns[2] = {
++    qemu_log_mask(LOG_UNIMP, "Write of unassigned area of PPB: offset 0x%x\n",
-+        gen_helper_gvec_qrdmlsh_s16, gen_helper_gvec_qrdmlsh_s32
++                  (uint32_t)addr);
-+    };
++    if (attrs.user) {
-+    tcg_debug_assert(vece >= 1 && vece <= 2);
++        return MEMTX_ERROR;
-+    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, cpu_env,
++    }
-+                       opr_sz, max_sz, 0, fns[vece - 1]);
++    return MEMTX_OK;
- }
++}
++
- #define GEN_CMP0(NAME, COND)                                            \
++static const MemoryRegionOps ppb_default_ops = {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
++    .read_with_attrs = ppb_default_read,
-                 break;  /* VPADD */
++    .write_with_attrs = ppb_default_write,
-             }
++    .endianness = DEVICE_NATIVE_ENDIAN,
-             /* VQRDMLAH */
++    .valid.min_access_size = 1,
--            switch (size) {
++    .valid.max_access_size = 8,
--            case 1:
++};
--                return do_v81_helper(s, gen_helper_gvec_qrdmlah_s16,
++
--                                     q, rd, rn, rm);
+ static int nvic_post_load(void *opaque, int version_id)
--            case 2:
+ {
--                return do_v81_helper(s, gen_helper_gvec_qrdmlah_s32,
+     NVICState *s = opaque;
--                                     q, rd, rn, rm);
+@@ -XXX,XX +XXX,XX @@ static void nvic_systick_trigger(void *opaque, int n, int level)
-+            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
+ static void armv7m_nvic_realize(DeviceState *dev, Error **errp)
-+                gen_gvec_sqrdmlah_qc(size, rd_ofs, rn_ofs, rm_ofs,
+ {
-+                                     vec_size, vec_size);
+     NVICState *s = NVIC(dev);
-+                return 0;
+-    int regionlen;
-             }
-             return 1;
+     /* The armv7m container object will have set our CPU pointer */
+     if (!s->cpu || !arm_feature(&s->cpu->env, ARM_FEATURE_M)) {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void armv7m_nvic_realize(DeviceState *dev, Error **errp)
-                 break;
+                                                   M_REG_S));
-             }
+     }
-             /* VQRDMLSH */
--            switch (size) {
+-    /* The NVIC and System Control Space (SCS) starts at 0xe000e000
--            case 1:
++    /*
--                return do_v81_helper(s, gen_helper_gvec_qrdmlsh_s16,
++     * This device provides a single sysbus memory region which
--                                     q, rd, rn, rm);
++     * represents the whole of the "System PPB" space. This is the
--            case 2:
++     * range from 0xe0000000 to 0xe00fffff and includes the NVIC,
--                return do_v81_helper(s, gen_helper_gvec_qrdmlsh_s32,
++     * the System Control Space (system registers), the systick timer,
--                                     q, rd, rn, rm);
++     * and for CPUs with the Security extension an NS banked version
-+            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
++     * of all of these.
-+                gen_gvec_sqrdmlsh_qc(size, rd_ofs, rn_ofs, rm_ofs,
++     *
-+                                     vec_size, vec_size);
++     * The default behaviour for unimplemented registers/ranges
-+                return 0;
++     * (for instance the Data Watchpoint and Trace unit at 0xe0001000)
-             }
++     * is to RAZ/WI for privileged access and BusFault for non-privileged
-             return 1;
++     * access.
 +     *
 +     * The NVIC and System Control Space (SCS) starts at 0xe000e000
       * and looks like this:
       *  0x004 - ICTR
       *  0x010 - 0xff - systick
@@ -XXX,XX +XXX,XX @@ static void armv7m_nvic_realize(DeviceState *dev, Error **errp)
       * generally code determining which banked register to use should
       * use attrs.secure; code determining actual behaviour of the system
       * should use env->v7m.secure.
 +     *
 +     * The container covers the whole PPB space. Within it the priority
 +     * of overlapping regions is:
 +     *  - default region (for RAZ/WI and BusFault) : -1
 +     *  - system register regions : 0
 +     *  - systick : 1
 +     * This is because the systick device is a small block of registers
 +     * in the middle of the other system control registers.
       */
 -    regionlen = arm_feature(&s->cpu->env, ARM_FEATURE_V8) ? 0x21000 : 0x1000;
 -    memory_region_init(&s->container, OBJECT(s), "nvic", regionlen);
 -    /* The system register region goes at the bottom of the priority
 -     * stack as it covers the whole page.
 -     */
 +    memory_region_init(&s->container, OBJECT(s), "nvic", 0x100000);
 +    memory_region_init_io(&s->defaultmem, OBJECT(s), &ppb_default_ops, s,
 +                          "nvic-default", 0x100000);
 +    memory_region_add_subregion_overlap(&s->container, 0, &s->defaultmem, -1);
      memory_region_init_io(&s->sysregmem, OBJECT(s), &nvic_sysreg_ops, s,
                            "nvic_sysregs", 0x1000);
 -    memory_region_add_subregion(&s->container, 0, &s->sysregmem);
 +    memory_region_add_subregion(&s->container, 0xe000, &s->sysregmem);
      memory_region_init_io(&s->systickmem, OBJECT(s),
                            &nvic_systick_ops, s,
                            "nvic_systick", 0xe0);
 -    memory_region_add_subregion_overlap(&s->container, 0x10,
 +    memory_region_add_subregion_overlap(&s->container, 0xe010,
                                          &s->systickmem, 1);
      if (arm_feature(&s->cpu->env, ARM_FEATURE_V8)) {
          memory_region_init_io(&s->sysreg_ns_mem, OBJECT(s),
                                &nvic_sysreg_ns_ops, &s->sysregmem,
                                "nvic_sysregs_ns", 0x1000);
 -        memory_region_add_subregion(&s->container, 0x20000, &s->sysreg_ns_mem);
 +        memory_region_add_subregion(&s->container, 0x2e000, &s->sysreg_ns_mem);
          memory_region_init_io(&s->systick_ns_mem, OBJECT(s),
                                &nvic_sysreg_ns_ops, &s->systickmem,
                                "nvic_systick_ns", 0xe0);
 -        memory_region_add_subregion_overlap(&s->container, 0x20010,
 +        memory_region_add_subregion_overlap(&s->container, 0x2e010,
                                              &s->systick_ns_mem, 1);
      }
 --
 .20.1

-[PULL 45/45] target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree
+[PULL 13/36] target/arm: Implement v8.1M PXN extension
-Convert the Neon floating point VFMA and VFMS insn to decodetree.
+In v8.1M the PXN architecture extension adds a new PXN bit to the
-These are the last insns in the 3-reg-same group so we can
+MPU_RLAR registers, which forbids execution of code in the region
-remove all the support/loop code from the old decoder.
+from a privileged mode.
 This is another feature which is just in the generic "in v8.1M" set
 and has no ID register field indicating its presence.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-18-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-3-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |   3 +
+ target/arm/helper.c | 7 ++++++-
- target/arm/translate-neon.inc.c |  41 ++++++++
+file changed, 6 insertions(+), 1 deletion(-)
  target/arm/translate.c          | 176 +-------------------------------
 files changed, 46 insertions(+), 174 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/helper.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ SHA256H2_3s      1111 001 1 0 . 01 .... .... 1100 . 1 . 0 .... \
+@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
- SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
+     } else {
-                  vm=%vm_dp vn=%vn_dp vd=%vd_dp
+         uint32_t ap = extract32(env->pmsav8.rbar[secure][matchregion], 1, 2);
+         uint32_t xn = extract32(env->pmsav8.rbar[secure][matchregion], 0, 1);
-+VFMA_fp_3s       1111 001 0 0 . 0 . .... .... 1100 ... 1 .... @3same_fp
++        bool pxn = false;
 +VFMS_fp_3s       1111 001 0 0 . 1 . .... .... 1100 ... 1 .... @3same_fp
 +
- VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
++        if (arm_feature(env, ARM_FEATURE_V8_1M)) {
++            pxn = extract32(env->pmsav8.rlar[secure][matchregion], 4, 1);
- VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
++        }
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
+         if (m_is_system_region(env, address)) {
---- a/target/arm/translate-neon.inc.c
+             /* System space is always execute never */
-+++ b/target/arm/translate-neon.inc.c
+@@ -XXX,XX +XXX,XX @@ bool pmsav8_mpu_lookup(CPUARMState *env, uint32_t address,
-@@ -XXX,XX +XXX,XX @@ static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
+         }
-     return do_3same(s, a, gen_VRSQRTS_fp_3s);
- }
+         *prot = simple_ap_to_rw_prot(env, mmu_idx, ap);
+-        if (*prot && !xn) {
-+static void gen_VFMA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
++        if (*prot && !xn && !(pxn && !is_user)) {
-+                            TCGv_ptr fpstatus)
+             *prot |= PAGE_EXEC;
-+{
+         }
-+    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
+         /* We don't need to look the attribute up in the MAIR0/MAIR1
 +}
 +
 +static bool trans_VFMA_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!dc_isar_feature(aa32_simdfmac, s)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_VFMA_fp_3s, true);
 +}
 +
 +static void gen_VFMS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_negs(vn, vn);
 +    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 +}
 +
 +static bool trans_VFMS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (!dc_isar_feature(aa32_simdfmac, s)) {
 +        return false;
 +    }
 +
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same_fp(s, a, gen_VFMS_fp_3s, true);
 +}
 +
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
      /* FP operations handled pairwise 32 bits at a time */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_neon_narrow_op(int op, int u, int size,
      }
  }
 -/* Symbolic constants for op fields for Neon 3-register same-length.
 - * The values correspond to bits [11:8,4]; see the ARM ARM DDI0406B
 - * table A7-9.
 - */
 -#define NEON_3R_VHADD 0
 -#define NEON_3R_VQADD 1
 -#define NEON_3R_VRHADD 2
 -#define NEON_3R_LOGIC 3 /* VAND,VBIC,VORR,VMOV,VORN,VEOR,VBIF,VBIT,VBSL */
 -#define NEON_3R_VHSUB 4
 -#define NEON_3R_VQSUB 5
 -#define NEON_3R_VCGT 6
 -#define NEON_3R_VCGE 7
 -#define NEON_3R_VSHL 8
 -#define NEON_3R_VQSHL 9
 -#define NEON_3R_VRSHL 10
 -#define NEON_3R_VQRSHL 11
 -#define NEON_3R_VMAX 12
 -#define NEON_3R_VMIN 13
 -#define NEON_3R_VABD 14
 -#define NEON_3R_VABA 15
 -#define NEON_3R_VADD_VSUB 16
 -#define NEON_3R_VTST_VCEQ 17
 -#define NEON_3R_VML 18 /* VMLA, VMLS */
 -#define NEON_3R_VMUL 19
 -#define NEON_3R_VPMAX 20
 -#define NEON_3R_VPMIN 21
 -#define NEON_3R_VQDMULH_VQRDMULH 22
 -#define NEON_3R_VPADD_VQRDMLAH 23
 -#define NEON_3R_SHA 24 /* SHA1C,SHA1P,SHA1M,SHA1SU0,SHA256H{2},SHA256SU1 */
 -#define NEON_3R_VFM_VQRDMLSH 25 /* VFMA, VFMS, VQRDMLSH */
 -#define NEON_3R_FLOAT_ARITH 26 /* float VADD, VSUB, VPADD, VABD */
 -#define NEON_3R_FLOAT_MULTIPLY 27 /* float VMLA, VMLS, VMUL */
 -#define NEON_3R_FLOAT_CMP 28 /* float VCEQ, VCGE, VCGT */
 -#define NEON_3R_FLOAT_ACMP 29 /* float VACGE, VACGT, VACLE, VACLT */
 -#define NEON_3R_FLOAT_MINMAX 30 /* float VMIN, VMAX */
 -#define NEON_3R_FLOAT_MISC 31 /* float VRECPS, VRSQRTS, VMAXNM/MINNM */
 -
 -static const uint8_t neon_3r_sizes[] = {
 -    [NEON_3R_VHADD] = 0x7,
 -    [NEON_3R_VQADD] = 0xf,
 -    [NEON_3R_VRHADD] = 0x7,
 -    [NEON_3R_LOGIC] = 0xf, /* size field encodes op type */
 -    [NEON_3R_VHSUB] = 0x7,
 -    [NEON_3R_VQSUB] = 0xf,
 -    [NEON_3R_VCGT] = 0x7,
 -    [NEON_3R_VCGE] = 0x7,
 -    [NEON_3R_VSHL] = 0xf,
 -    [NEON_3R_VQSHL] = 0xf,
 -    [NEON_3R_VRSHL] = 0xf,
 -    [NEON_3R_VQRSHL] = 0xf,
 -    [NEON_3R_VMAX] = 0x7,
 -    [NEON_3R_VMIN] = 0x7,
 -    [NEON_3R_VABD] = 0x7,
 -    [NEON_3R_VABA] = 0x7,
 -    [NEON_3R_VADD_VSUB] = 0xf,
 -    [NEON_3R_VTST_VCEQ] = 0x7,
 -    [NEON_3R_VML] = 0x7,
 -    [NEON_3R_VMUL] = 0x7,
 -    [NEON_3R_VPMAX] = 0x7,
 -    [NEON_3R_VPMIN] = 0x7,
 -    [NEON_3R_VQDMULH_VQRDMULH] = 0x6,
 -    [NEON_3R_VPADD_VQRDMLAH] = 0x7,
 -    [NEON_3R_SHA] = 0xf, /* size field encodes op type */
 -    [NEON_3R_VFM_VQRDMLSH] = 0x7, /* For VFM, size bit 1 encodes op */
 -    [NEON_3R_FLOAT_ARITH] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_MULTIPLY] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_CMP] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_ACMP] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_MINMAX] = 0x5, /* size bit 1 encodes op */
 -    [NEON_3R_FLOAT_MISC] = 0x5, /* size bit 1 encodes op */
 -};
 -
  /* Symbolic constants for op fields for Neon 2-register miscellaneous.
   * The values correspond to bits [17:16,10:7]; see the ARM ARM DDI0406B
   * table A7-13.
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
      rm_ofs = neon_reg_offset(rm, 0);
      if ((insn & (1 << 23)) == 0) {
 -        /* Three register same length.  */
 -        op = ((insn >> 7) & 0x1e) | ((insn >> 4) & 1);
 -        /* Catch invalid op and bad size combinations: UNDEF */
 -        if ((neon_3r_sizes[op] & (1 << size)) == 0) {
 -            return 1;
 -        }
 -        /* All insns of this form UNDEF for either this condition or the
 -         * superset of cases "Q==1"; we catch the latter later.
 -         */
 -        if (q && ((rd | rn | rm) & 1)) {
 -            return 1;
 -        }
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -            if (!u) {
 -                /* VFM, VFMS */
 -                if (size == 1) {
 -                    return 1;
 -                }
 -                break;
 -            }
 -            /* VQRDMLSH : handled by decodetree */
 -            return 1;
 -
 -        case NEON_3R_VADD_VSUB:
 -        case NEON_3R_LOGIC:
 -        case NEON_3R_VMAX:
 -        case NEON_3R_VMIN:
 -        case NEON_3R_VTST_VCEQ:
 -        case NEON_3R_VCGT:
 -        case NEON_3R_VCGE:
 -        case NEON_3R_VQADD:
 -        case NEON_3R_VQSUB:
 -        case NEON_3R_VMUL:
 -        case NEON_3R_VML:
 -        case NEON_3R_VSHL:
 -        case NEON_3R_SHA:
 -        case NEON_3R_VHADD:
 -        case NEON_3R_VRHADD:
 -        case NEON_3R_VHSUB:
 -        case NEON_3R_VABD:
 -        case NEON_3R_VABA:
 -        case NEON_3R_VQSHL:
 -        case NEON_3R_VRSHL:
 -        case NEON_3R_VQRSHL:
 -        case NEON_3R_VPMAX:
 -        case NEON_3R_VPMIN:
 -        case NEON_3R_VPADD_VQRDMLAH:
 -        case NEON_3R_VQDMULH_VQRDMULH:
 -        case NEON_3R_FLOAT_ARITH:
 -        case NEON_3R_FLOAT_MULTIPLY:
 -        case NEON_3R_FLOAT_CMP:
 -        case NEON_3R_FLOAT_ACMP:
 -        case NEON_3R_FLOAT_MINMAX:
 -        case NEON_3R_FLOAT_MISC:
 -            /* Already handled by decodetree */
 -            return 1;
 -        }
 -
 -        if (size == 3) {
 -            /* 64-bit element instructions: handled by decodetree */
 -            return 1;
 -        }
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -            if (!dc_isar_feature(aa32_simdfmac, s)) {
 -                return 1;
 -            }
 -            break;
 -        default:
 -            break;
 -        }
 -
 -        for (pass = 0; pass < (q ? 4 : 2); pass++) {
 -
 -        /* Elementwise.  */
 -        tmp = neon_load_reg(rn, pass);
 -        tmp2 = neon_load_reg(rm, pass);
 -        switch (op) {
 -        case NEON_3R_VFM_VQRDMLSH:
 -        {
 -            /* VFMA, VFMS: fused multiply-add */
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            TCGv_i32 tmp3 = neon_load_reg(rd, pass);
 -            if (size) {
 -                /* VFMS */
 -                gen_helper_vfp_negs(tmp, tmp);
 -            }
 -            gen_helper_vfp_muladds(tmp, tmp, tmp2, tmp3, fpstatus);
 -            tcg_temp_free_i32(tmp3);
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        default:
 -            abort();
 -        }
 -        tcg_temp_free_i32(tmp2);
 -
 -        neon_store_reg(rd, pass, tmp);
 -
 -        } /* for pass */
 -        /* End of 3 register same size operations.  */
 +        /* Three register same length: handled by decodetree */
 +        return 1;
      } else if (insn & (1 << 4)) {
          if ((insn & 0x00380080) != 0) {
              /* Two registers and shift.  */
 --
 .20.1

-[PULL 42/45] target/arm: Convert Neon 3-reg-same compare insns to decodetree
+[PULL 14/36] target/arm: Don't clobber ID_PFR1.Security on M-profile cores
-Convert the Neon integer 3-reg-same compare insns VCGE, VCGT,
+In arm_cpu_realizefn() we check whether the board code disabled EL3
-VCEQ, VACGE and VACGT to decodetree.
+via the has_el3 CPU object property, which we create if the CPU
 starts with the ARM_FEATURE_EL3 feature bit.  If it is disabled, then
 we turn off ARM_FEATURE_EL3 and also zero out the relevant fields in
 the ID_PFR1 and ID_AA64PFR0 registers.
 This codepath was incorrectly being taken for M-profile CPUs, which
 do not have an EL3 and don't set ARM_FEATURE_EL3, but which may have
 the M-profile Security extension and so should have non-zero values
 in the ID_PFR1.Security field.
 Restrict the handling of the feature flag to A/R-profile cores.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-15-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-4-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  5 +++++
+ target/arm/cpu.c | 2 +-
- target/arm/translate-neon.inc.c |  6 +++++
+file changed, 1 insertion(+), 1 deletion(-)
  target/arm/translate.c          | 39 ++-------------------------------
 files changed, 13 insertions(+), 37 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/cpu.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
- VMLA_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
+         }
  VMLS_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 1 .... @3same_fp
  VMUL_fp_3s       1111 001 1 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
 +VCEQ_fp_3s       1111 001 0 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
 +VCGE_fp_3s       1111 001 1 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
 +VACGE_fp_3s      1111 001 1 0 . 0 . .... .... 1110 ... 1 .... @3same_fp
 +VCGT_fp_3s       1111 001 1 0 . 1 . .... .... 1110 ... 0 .... @3same_fp
 +VACGT_fp_3s      1111 001 1 0 . 1 . .... .... 1110 ... 1 .... @3same_fp
  VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
  VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
          return do_3same_fp(s, a, FUNC, READS_VD);                   \
      }
-+DO_3S_FP(VCEQ, gen_helper_neon_ceq_f32, false)
+-    if (!cpu->has_el3) {
-+DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
++    if (!arm_feature(env, ARM_FEATURE_M) && !cpu->has_el3) {
-+DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
+         /* If the has_el3 CPU property is disabled then we need to disable the
-+DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
+          * feature.
-+DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
+          */
 +
  static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
                              TCGv_ptr fpstatus)
  {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQDMULH_VQRDMULH:
          case NEON_3R_FLOAT_ARITH:
          case NEON_3R_FLOAT_MULTIPLY:
 +        case NEON_3R_FLOAT_CMP:
 +        case NEON_3R_FLOAT_ACMP:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  return 1; /* VPMIN/VPMAX handled by decodetree */
              }
              break;
 -        case NEON_3R_FLOAT_CMP:
 -            if (!u && size) {
 -                /* no encoding for U=0 C=1x */
 -                return 1;
 -            }
 -            break;
 -        case NEON_3R_FLOAT_ACMP:
 -            if (!u) {
 -                return 1;
 -            }
 -            break;
          case NEON_3R_FLOAT_MISC:
              /* VMAXNM/VMINNM in ARMv8 */
              if (u && !arm_dc_feature(s, ARM_FEATURE_V8)) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_CMP:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (!u) {
 -                gen_helper_neon_ceq_f32(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                if (size == 0) {
 -                    gen_helper_neon_cge_f32(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_neon_cgt_f32(tmp, tmp, tmp2, fpstatus);
 -                }
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        case NEON_3R_FLOAT_ACMP:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (size == 0) {
 -                gen_helper_neon_acge_f32(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                gen_helper_neon_acgt_f32(tmp, tmp, tmp2, fpstatus);
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
          case NEON_3R_FLOAT_MINMAX:
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
 .20.1

-[PULL 40/45] target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
+[PULL 15/36] target/arm: Implement VSCCLRM insn
-Convert the Neon float VPMIN, VPMAX and VPADD 3-reg-same insns to
+Implement the v8.1M VSCCLRM insn, which zeros floating point
-decodetree. These are the only remaining 'pairwise' operations,
+registers if there is an active floating point context.
-so we can delete the pairwise-specific bits of the old decoder's
+This requires support in write_neon_element32() for the MO_32
-for-each-element loop now.
+element size, so add it.
 Because we want to use arm_gen_condlabel(), we need to move
 the definition of that function up in translate.c so it is
 before the #include of translate-vfp.c.inc.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-13-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-5-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  5 +++
+ target/arm/cpu.h               |  9 ++++
- target/arm/translate-neon.inc.c | 63 +++++++++++++++++++++++++++++++++
+ target/arm/m-nocp.decode       |  8 +++-
- target/arm/translate.c          | 63 +++++----------------------------
+ target/arm/translate.c         | 21 +++++----
-files changed, 76 insertions(+), 55 deletions(-)
+ target/arm/translate-vfp.c.inc | 84 ++++++++++++++++++++++++++++++++++
+files changed, 111 insertions(+), 11 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
+diff --git a/target/arm/cpu.h b/target/arm/cpu.h
---- a/target/arm/neon-dp.decode
+index XXXXXXX..XXXXXXX 100644
-+++ b/target/arm/neon-dp.decode
+--- a/target/arm/cpu.h
 +++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_mprofile(const ARMISARegisters *id)
      return FIELD_EX32(id->id_pfr1, ID_PFR1, MPROGMOD) != 0;
  }
 +static inline bool isar_feature_aa32_m_sec_state(const ARMISARegisters *id)
 +{
 +    /*
 +     * Return true if M-profile state handling insns
 +     * (VSCCLRM, CLRM, FPCTX access insns) are implemented
 +     */
 +    return FIELD_EX32(id->id_pfr1, ID_PFR1, SECURITY) >= 3;
 +}
 +
  static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
  {
      /* Sadly this is encoded differently for A-profile and M-profile */
 diff --git a/target/arm/m-nocp.decode b/target/arm/m-nocp.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/m-nocp.decode
 +++ b/target/arm/m-nocp.decode
 @@ -XXX,XX +XXX,XX @@
- # For FP insns the high bit of 'size' is used as part of opcode decode
+ # If the coprocessor is not present or disabled then we will generate
- @3same_fp        .... ... . . . . size:1 .... .... .... . q:1 . . .... \
+ # the NOCP exception; otherwise we let the insn through to the main decode.
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
-+@3same_fp_q0     .... ... . . . . size:1 .... .... .... . 0 . . .... \
++%vd_dp  22:1 12:4
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
++%vd_sp  12:4 22:1
++
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+ &nocp cp
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
-@@ -XXX,XX +XXX,XX @@ VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
+ {
+   # Special cases which do not take an early NOCP: VLLDM and VLSTM
- VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
+   VLLDM_VLSTM  1110 1100 001 l:1 rn:4 0000 1010 0000 0000
- VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+-  # TODO: VSCCLRM (new in v8.1M) is similar:
-+VPADD_fp_3s      1111 001 1 0 . 0 . .... .... 1101 ... 0 .... @3same_fp_q0
+-  #VSCCLRM      1110 1100 1-01 1111 ---- 1011 ---- ---0
- VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
++  # VSCCLRM (new in v8.1M) is similar:
-+VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
++  VSCCLRM      1110 1100 1.01 1111 .... 1011 imm:7 0   vd=%vd_dp size=3
-+VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
++  VSCCLRM      1110 1100 1.01 1111 .... 1010 imm:8     vd=%vd_sp size=2
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
+   NOCP         111- 1110 ---- ---- ---- cp:4 ---- ---- &nocp
---- a/target/arm/translate-neon.inc.c
+   NOCP         111- 110- ---- ---- ---- cp:4 ---- ---- &nocp
-+++ b/target/arm/translate-neon.inc.c
+diff --git a/target/arm/translate.c b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
+index XXXXXXX..XXXXXXX 100644
- DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
+--- a/target/arm/translate.c
- DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
++++ b/target/arm/translate.c
- DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
+@@ -XXX,XX +XXX,XX @@ void arm_translate_init(void)
-+
+     a64_translate_init();
-+static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
+ }
 +/* Generate a label used for skipping this instruction */
 +static void arm_gen_condlabel(DisasContext *s)
 +{
-+    /* FP operations handled pairwise 32 bits at a time */
++    if (!s->condjmp) {
-+    TCGv_i32 tmp, tmp2, tmp3;
++        s->condlabel = gen_new_label();
-+    TCGv_ptr fpstatus;
++        s->condjmp = 1;
-+
++    }
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
++}
 +
  /* Flags for the disas_set_da_iss info argument:
   * lower bits hold the Rt register number, higher bits are flags.
   */
@@ -XXX,XX +XXX,XX @@ static void write_neon_element64(TCGv_i64 src, int reg, int ele, MemOp memop)
      long off = neon_element_offset(reg, ele, memop);
      switch (memop) {
 +    case MO_32:
 +        tcg_gen_st32_i64(src, cpu_env, off);
 +        break;
      case MO_64:
          tcg_gen_st_i64(src, cpu_env, off);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_srs(DisasContext *s,
      s->base.is_jmp = DISAS_UPDATE_EXIT;
  }
 -/* Generate a label used for skipping this instruction */
 -static void arm_gen_condlabel(DisasContext *s)
 -{
 -    if (!s->condjmp) {
 -        s->condlabel = gen_new_label();
 -        s->condjmp = 1;
 -    }
 -}
 -
  /* Skip this instruction if the ARM condition is false */
  static void arm_skip_unless(DisasContext *s, uint32_t cond)
  {
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VLLDM_VLSTM(DisasContext *s, arg_VLLDM_VLSTM *a)
      return true;
  }
 +static bool trans_VSCCLRM(DisasContext *s, arg_VSCCLRM *a)
 +{
 +    int btmreg, topreg;
 +    TCGv_i64 zero;
 +    TCGv_i32 aspen, sfpa;
 +
 +    if (!dc_isar_feature(aa32_m_sec_state, s)) {
 +        /* Before v8.1M, fall through in decode to NOCP check */
 +        return false;
 +    }
 +
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
++    /* Explicitly UNDEF because this takes precedence over NOCP */
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
++    if (!arm_dc_feature(s, ARM_FEATURE_M_MAIN) || !s->v8m_secure) {
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
++        unallocated_encoding(s);
-+        return false;
++        return true;
 +    }
 +
 +    if (!dc_isar_feature(aa32_vfp_simd, s)) {
 +        /* NOP if we have neither FP nor MVE */
 +        return true;
 +    }
 +
 +    /*
 +     * If FPCCR.ASPEN != 0 && CONTROL_S.SFPA == 0 then there is no
 +     * active floating point context so we must NOP (without doing
 +     * any lazy state preservation or the NOCP check).
 +     */
 +    aspen = load_cpu_field(v7m.fpccr[M_REG_S]);
 +    sfpa = load_cpu_field(v7m.control[M_REG_S]);
 +    tcg_gen_andi_i32(aspen, aspen, R_V7M_FPCCR_ASPEN_MASK);
 +    tcg_gen_xori_i32(aspen, aspen, R_V7M_FPCCR_ASPEN_MASK);
 +    tcg_gen_andi_i32(sfpa, sfpa, R_V7M_CONTROL_SFPA_MASK);
 +    tcg_gen_or_i32(sfpa, sfpa, aspen);
 +    arm_gen_condlabel(s);
 +    tcg_gen_brcondi_i32(TCG_COND_EQ, sfpa, 0, s->condlabel);
 +
 +    if (s->fp_excp_el != 0) {
 +        gen_exception_insn(s, s->pc_curr, EXCP_NOCP,
 +                           syn_uncategorized(), s->fp_excp_el);
 +        return true;
 +    }
 +
 +    topreg = a->vd + a->imm - 1;
 +    btmreg = a->vd;
 +
 +    /* Convert to Sreg numbers if the insn specified in Dregs */
 +    if (a->size == 3) {
 +        topreg = topreg * 2 + 1;
 +        btmreg *= 2;
 +    }
 +
 +    if (topreg > 63 || (topreg > 31 && !(topreg & 1))) {
 +        /* UNPREDICTABLE: we choose to undef */
 +        unallocated_encoding(s);
 +        return true;
 +    }
 +
 +    /* Silently ignore requests to clear D16-D31 if they don't exist */
 +    if (topreg > 31 && !dc_isar_feature(aa32_simd_r32, s)) {
 +        topreg = 31;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
-+    assert(a->q == 0); /* enforced by decode patterns */
++    /* Zero the Sregs from btmreg to topreg inclusive. */
-+
++    zero = tcg_const_i64(0);
-+    /*
++    if (btmreg & 1) {
-+     * Note that we have to be careful not to clobber the source operands
++        write_neon_element64(zero, btmreg >> 1, 1, MO_32);
-+     * in the "vm == vd" case by storing the result of the first pass too
++        btmreg++;
-+     * early. Since Q is 0 there are always just two passes, so instead
++    }
-+     * of a complicated loop over each pass we just unroll.
++    for (; btmreg + 1 <= topreg; btmreg += 2) {
-+     */
++        write_neon_element64(zero, btmreg >> 1, 0, MO_64);
-+    fpstatus = get_fpstatus_ptr(1);
++    }
-+    tmp = neon_load_reg(a->vn, 0);
++    if (btmreg == topreg) {
-+    tmp2 = neon_load_reg(a->vn, 1);
++        write_neon_element64(zero, btmreg >> 1, 0, MO_32);
-+    fn(tmp, tmp, tmp2, fpstatus);
++        btmreg++;
-+    tcg_temp_free_i32(tmp2);
++    }
-+
++    assert(btmreg == topreg + 1);
-+    tmp3 = neon_load_reg(a->vm, 0);
++    /* TODO: when MVE is implemented, zero VPR here */
 +    tmp2 = neon_load_reg(a->vm, 1);
 +    fn(tmp3, tmp3, tmp2, fpstatus);
 +    tcg_temp_free_i32(tmp2);
 +    tcg_temp_free_ptr(fpstatus);
 +
 +    neon_store_reg(a->vd, 0, tmp);
 +    neon_store_reg(a->vd, 1, tmp3);
 +    return true;
 +}
 +
-+/*
+ static bool trans_NOCP(DisasContext *s, arg_nocp *a)
-+ * For all the functions using this macro, size == 1 means fp16,
+ {
-+ * which is an architecture extension we don't implement yet.
+     /*
 + */
 +#define DO_3S_FP_PAIR(INSN,FUNC)                                    \
 +    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
 +    {                                                               \
 +        if (a->size != 0) {                                         \
 +            /* TODO fp16 support */                                 \
 +            return false;                                           \
 +        }                                                           \
 +        return do_3same_fp_pair(s, a, FUNC);                        \
 +    }
 +
 +DO_3S_FP_PAIR(VPADD, gen_helper_vfp_adds)
 +DO_3S_FP_PAIR(VPMAX, gen_helper_vfp_maxs)
 +DO_3S_FP_PAIR(VPMIN, gen_helper_vfp_mins)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
      int shift;
      int pass;
      int count;
 -    int pairwise;
      int u;
      int vec_size;
      uint32_t imm;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VPMIN:
          case NEON_3R_VPADD_VQRDMLAH:
          case NEON_3R_VQDMULH_VQRDMULH:
 +        case NEON_3R_FLOAT_ARITH:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              /* 64-bit element instructions: handled by decodetree */
              return 1;
          }
 -        pairwise = 0;
          switch (op) {
 -        case NEON_3R_FLOAT_ARITH:
 -            pairwise = (u && size < 2); /* if VPADD (float) */
 -            if (!pairwise) {
 -                return 1; /* handled by decodetree */
 -            }
 -            break;
          case NEON_3R_FLOAT_MINMAX:
 -            pairwise = u; /* if VPMIN/VPMAX (float) */
 +            if (u) {
 +                return 1; /* VPMIN/VPMAX handled by decodetree */
 +            }
              break;
          case NEON_3R_FLOAT_CMP:
              if (!u && size) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              break;
          }
 -        if (pairwise && q) {
 -            /* All the pairwise insns UNDEF if Q is set */
 -            return 1;
 -        }
 -
          for (pass = 0; pass < (q ? 4 : 2); pass++) {
 -        if (pairwise) {
 -            /* Pairwise.  */
 -            if (pass < 1) {
 -                tmp = neon_load_reg(rn, 0);
 -                tmp2 = neon_load_reg(rn, 1);
 -            } else {
 -                tmp = neon_load_reg(rm, 0);
 -                tmp2 = neon_load_reg(rm, 1);
 -            }
 -        } else {
 -            /* Elementwise.  */
 -            tmp = neon_load_reg(rn, pass);
 -            tmp2 = neon_load_reg(rm, pass);
 -        }
 +        /* Elementwise.  */
 +        tmp = neon_load_reg(rn, pass);
 +        tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            switch ((u << 2) | size) {
 -            case 4: /* VPADD */
 -                gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
 -                break;
 -            default:
 -                abort();
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
          case NEON_3R_FLOAT_MULTIPLY:
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          }
          tcg_temp_free_i32(tmp2);
 -        /* Save the result.  For elementwise operations we can put it
 -           straight into the destination register.  For pairwise operations
 -           we have to be careful to avoid clobbering the source operands.  */
 -        if (pairwise && rd == rm) {
 -            neon_store_scratch(pass, tmp);
 -        } else {
 -            neon_store_reg(rd, pass, tmp);
 -        }
 +        neon_store_reg(rd, pass, tmp);
          } /* for pass */
 -        if (pairwise && rd == rm) {
 -            for (pass = 0; pass < (q ? 4 : 2); pass++) {
 -                tmp = neon_load_scratch(pass);
 -                neon_store_reg(rd, pass, tmp);
 -            }
 -        }
          /* End of 3 register same size operations.  */
      } else if (insn & (1 << 4)) {
          if ((insn & 0x00380080) != 0) {
 --
 .20.1

-[PULL 41/45] target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
+[PULL 16/36] target/arm: Implement CLRM instruction
-Convert the Neon integer VMUL, VMLA, and VMLS 3-reg-same inssn to
+In v8.1M the new CLRM instruction allows zeroing an arbitrary set of
-decodetree.
+the general-purpose registers and APSR.  Implement this.
-We don't have a gvec helper for multiply-accumulate, so VMLA and VMLS
+The encoding is a subset of the LDMIA T2 encoding, using what would
-need a loop function do_3same_fp().  This takes a reads_vd parameter
+be Rn=0b1111 (which UNDEFs for LDMIA).
 to do_3same_fp() which tells it to load the old value into vd before
 calling the callback function, in the same way that the do_vfp_3op_sp()
 and do_vfp_3op_dp() functions in translate-vfp.inc.c work. (The
 only uses in this patch pass reads_vd == true, but later commits
 will use reads_vd == false.)
 This conversion fixes in passing an underdecoding for VMUL
 (originally reported by Fredrik Strupe <fredrik@strupe.net>): bit 1
 of the 'size' field must be 0.  The old decoder didn't enforce this,
 but the decodetree pattern does.
 The gen_VMLA_fp_reg() function performs the addition operation
 with the operands in the opposite order to the old decoder:
 since Neon sets 'default NaN mode' float32_add operations are
 commutative so there is no behaviour difference, but putting
 them this way around matches the Arm ARM pseudocode and the
 required operation order for the subtraction in gen_VMLS_fp_reg().
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-14-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-6-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  3 ++
+ target/arm/t32.decode  |  6 +++++-
- target/arm/translate-neon.inc.c | 81 +++++++++++++++++++++++++++++++++
+ target/arm/translate.c | 38 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate.c          | 17 +------
+files changed, 43 insertions(+), 1 deletion(-)
 files changed, 85 insertions(+), 16 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/t32.decode b/target/arm/t32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/t32.decode
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/t32.decode
-@@ -XXX,XX +XXX,XX @@ VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@ UXTAB            1111 1010 0101 .... 1111 .... 10.. ....      @rrr_rot
- VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
- VPADD_fp_3s      1111 001 1 0 . 0 . .... .... 1101 ... 0 .... @3same_fp_q0
+ STM_t32          1110 1000 10.0 .... ................         @ldstm i=1 b=0
- VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
+ STM_t32          1110 1001 00.0 .... ................         @ldstm i=0 b=1
-+VMLA_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
+-LDM_t32          1110 1000 10.1 .... ................         @ldstm i=1 b=0
-+VMLS_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 1 .... @3same_fp
++{
-+VMUL_fp_3s       1111 001 1 0 . 0 . .... .... 1101 ... 1 .... @3same_fp
++  # Rn=15 UNDEFs for LDM; M-profile CLRM uses that encoding
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
++  CLRM           1110 1000 1001 1111 list:16
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
++  LDM_t32        1110 1000 10.1 .... ................         @ldstm i=1 b=0
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++}
  LDM_t32          1110 1001 00.1 .... ................         @ldstm i=0 b=1
  &rfe             !extern rn w pu
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/target/arm/translate.c
-+++ b/target/arm/translate-neon.inc.c
++++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
+@@ -XXX,XX +XXX,XX @@ static bool trans_LDM_t16(DisasContext *s, arg_ldst_block *a)
- DO_3SAME_VQDMULH(VQDMULH, qdmulh)
+     return do_ldm(s, a, 1);
- DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
+ }
-+static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
++static bool trans_CLRM(DisasContext *s, arg_CLRM *a)
 +                        bool reads_vd)
 +{
-+    /*
++    int i;
-+     * FP operations handled elementwise 32 bits at a time.
++    TCGv_i32 zero;
 +     * If reads_vd is true then the old value of Vd will be
 +     * loaded before calling the callback function. This is
 +     * used for multiply-accumulate type operations.
 +     */
 +    TCGv_i32 tmp, tmp2;
 +    int pass;
 +
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
++    if (!dc_isar_feature(aa32_m_sec_state, s)) {
 +        return false;
 +    }
 +
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
++    if (extract32(a->list, 13, 1)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
-+    if ((a->vn | a->vm | a->vd) & a->q) {
++    if (!a->list) {
 +        /* UNPREDICTABLE; we choose to UNDEF */
 +        return false;
 +    }
 +
-+    if (!vfp_access_check(s)) {
++    zero = tcg_const_i32(0);
-+        return true;
++    for (i = 0; i < 15; i++) {
 +        if (extract32(a->list, i, 1)) {
 +            /* Clear R[i] */
 +            tcg_gen_mov_i32(cpu_R[i], zero);
 +        }
 +    }
-+
++    if (extract32(a->list, 15, 1)) {
-+    TCGv_ptr fpstatus = get_fpstatus_ptr(1);
++        /*
-+    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
++         * Clear APSR (by calling the MSR helper with the same argument
-+        tmp = neon_load_reg(a->vn, pass);
++         * as for "MSR APSR_nzcvqg, Rn": mask = 0b1100, SYSM=0)
-+        tmp2 = neon_load_reg(a->vm, pass);
++         */
-+        if (reads_vd) {
++        TCGv_i32 maskreg = tcg_const_i32(0xc << 8);
-+            TCGv_i32 tmp_rd = neon_load_reg(a->vd, pass);
++        gen_helper_v7m_msr(cpu_env, maskreg, zero);
-+            fn(tmp_rd, tmp, tmp2, fpstatus);
++        tcg_temp_free_i32(maskreg);
 +            neon_store_reg(a->vd, pass, tmp_rd);
 +            tcg_temp_free_i32(tmp);
 +        } else {
 +            fn(tmp, tmp, tmp2, fpstatus);
 +            neon_store_reg(a->vd, pass, tmp);
 +        }
 +        tcg_temp_free_i32(tmp2);
 +    }
-+    tcg_temp_free_ptr(fpstatus);
++    tcg_temp_free_i32(zero);
 +    return true;
 +}
 +
  /*
-  * For all the functions using this macro, size == 1 means fp16,
+  * Branch, branch with link
-  * which is an architecture extension we don't implement yet.
+  */
@@ -XXX,XX +XXX,XX @@ DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
  DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
  DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
  DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
 +DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
 +
 +/*
 + * For all the functions using this macro, size == 1 means fp16,
 + * which is an architecture extension we don't implement yet.
 + */
 +#define DO_3S_FP(INSN,FUNC,READS_VD)                                \
 +    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
 +    {                                                               \
 +        if (a->size != 0) {                                         \
 +            /* TODO fp16 support */                                 \
 +            return false;                                           \
 +        }                                                           \
 +        return do_3same_fp(s, a, FUNC, READS_VD);                   \
 +    }
 +
 +static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
 +    gen_helper_vfp_adds(vd, vd, vn, fpstatus);
 +}
 +
 +static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 +                            TCGv_ptr fpstatus)
 +{
 +    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
 +    gen_helper_vfp_subs(vd, vd, vn, fpstatus);
 +}
 +
 +DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
 +DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VPADD_VQRDMLAH:
          case NEON_3R_VQDMULH_VQRDMULH:
          case NEON_3R_FLOAT_ARITH:
 +        case NEON_3R_FLOAT_MULTIPLY:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_MULTIPLY:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            gen_helper_vfp_muls(tmp, tmp, tmp2, fpstatus);
 -            if (!u) {
 -                tcg_temp_free_i32(tmp2);
 -                tmp2 = neon_load_reg(rd, pass);
 -                if (size == 0) {
 -                    gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_vfp_subs(tmp, tmp2, tmp, fpstatus);
 -                }
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
          case NEON_3R_FLOAT_CMP:
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
 .20.1

-[PULL 38/45] target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
+[PULL 17/36] target/arm: Enforce M-profile VMRS/VMSR register restrictions
-Convert the Neon VQDMULH and VQRDMULH 3-reg-same insns to
+For M-profile before v8.1M, the only valid register for VMSR/VMRS is
-decodetree. These are the last integer operations in the
+the FPSCR.  We have a comment that states this, but the actual logic
--reg-same group.
+to forbid accesses for any other register value is missing, so we
 would end up with A-profile style behaviour.  Add the missing check.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-11-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-7-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  3 +++
+ target/arm/translate-vfp.c.inc | 5 ++++-
- target/arm/translate-neon.inc.c | 24 ++++++++++++++++++++++++
+file changed, 4 insertions(+), 1 deletion(-)
  target/arm/translate.c          | 24 +-----------------------
 files changed, 28 insertions(+), 23 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@ VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
+@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
- VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+          * Accesses to R15 are UNPREDICTABLE; we choose to undef.
- VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+          * (FPSCR -> r15 is a special case which writes to the PSR flags.)
+          */
-+VQDMULH_3s       1111 001 0 0 . .. .... .... 1011 . . . 0 .... @3same
+-        if (a->rt == 15 && (!a->l || a->reg != ARM_VFP_FPSCR)) {
-+VQRDMULH_3s      1111 001 1 0 . .. .... .... 1011 . . . 0 .... @3same
++        if (a->reg != ARM_VFP_FPSCR) {
-+
++            return false;
- VPADD_3s         1111 001 0 0 . .. .... .... 1011 . . . 1 .... @3same_q0
++        }
++        if (a->rt == 15 && !a->l) {
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
+             return false;
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPMIN_S, pmin_s)
  DO_3SAME_PAIR(VPMAX_U, pmax_u)
  DO_3SAME_PAIR(VPMIN_U, pmin_u)
  DO_3SAME_PAIR(VPADD, padd_u)
 +
 +#define DO_3SAME_VQDMULH(INSN, FUNC)                                    \
 +    WRAP_ENV_FN(gen_##INSN##_tramp16, gen_helper_neon_##FUNC##_s16);    \
 +    WRAP_ENV_FN(gen_##INSN##_tramp32, gen_helper_neon_##FUNC##_s32);    \
 +    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        static const GVecGen3 ops[2] = {                                \
 +            { .fni4 = gen_##INSN##_tramp16 },                           \
 +            { .fni4 = gen_##INSN##_tramp32 },                           \
 +        };                                                              \
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece - 1]); \
 +    }                                                                   \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        if (a->size != 1 && a->size != 2) {                             \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
 +DO_3SAME_VQDMULH(VQDMULH, qdmulh)
 +DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VPMAX:
          case NEON_3R_VPMIN:
          case NEON_3R_VPADD_VQRDMLAH:
 +        case NEON_3R_VQDMULH_VQRDMULH:
              /* Already handled by decodetree */
              return 1;
          }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+     }
              tmp2 = neon_load_reg(rm, pass);
          }
          switch (op) {
 -        case NEON_3R_VQDMULH_VQRDMULH: /* Multiply high.  */
 -            if (!u) { /* VQDMULH */
 -                switch (size) {
 -                case 1:
 -                    gen_helper_neon_qdmulh_s16(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                case 2:
 -                    gen_helper_neon_qdmulh_s32(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                default: abort();
 -                }
 -            } else { /* VQRDMULH */
 -                switch (size) {
 -                case 1:
 -                    gen_helper_neon_qrdmulh_s16(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                case 2:
 -                    gen_helper_neon_qrdmulh_s32(tmp, cpu_env, tmp, tmp2);
 -                    break;
 -                default: abort();
 -                }
 -            }
 -            break;
          case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
 .20.1

-[PULL 26/45] ACPI: Record Generic Error Status Block(GESB) table
+[PULL 18/36] target/arm: Refactor M-profile VMSR/VMRS handling
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+Currently M-profile borrows the A-profile code for VMSR and VMRS
+(access to the FP system registers), because all it needs to support
-kvm_arch_on_sigbus_vcpu() error injection uses source_id as
+is the FPSCR.  In v8.1M things become significantly more complicated
-index in etc/hardware_errors to find out Error Status Data
+in two ways:
-Block entry corresponding to error source. So supported source_id
-values should be assigned here and not be changed afterwards to
+ * there are several new FP system registers; some have side effects
-make sure that guest will write error into expected Error Status
+   on read, and one (FPCXT_NS) needs to avoid the usual
-Data Block.
+   vfp_access_check() and the "only if FPU implemented" check
-Before QEMU writes a new error to ACPI table, it will check whether
+ * all sysregs are now accessible both by VMRS/VMSR (which
-previous error has been acknowledged. If not acknowledged, the new
+   reads/writes a general purpose register) and also by VLDR/VSTR
-errors will be ignored and not be recorded. For the errors section
+   (which reads/writes them directly to memory)
-type, QEMU simulate it to memory section error.
+Refactor the structure of how we handle VMSR/VMRS to cope with this:
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
+ * keep the M-profile code entirely separate from the A-profile code
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
+ * abstract out the "read or write the general purpose register" part
-Message-id: 20200512030609.19593-9-gengdongjiu@huawei.com
+   of the code into a loadfn or storefn function pointer, so we can
    reuse it for VLDR/VSTR.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201119215617.29887-8-peter.maydell@linaro.org
 ---
- include/hw/acpi/ghes.h |   1 +
+ target/arm/cpu.h               |   3 +
- hw/acpi/ghes.c         | 219 +++++++++++++++++++++++++++++++++++++++++
+ target/arm/translate-vfp.c.inc | 182 ++++++++++++++++++++++++++++++---
-files changed, 220 insertions(+)
+files changed, 171 insertions(+), 14 deletions(-)
-diff --git a/include/hw/acpi/ghes.h b/include/hw/acpi/ghes.h
+diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/acpi/ghes.h
+--- a/target/arm/cpu.h
-+++ b/include/hw/acpi/ghes.h
++++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ void build_ghes_error_table(GArray *hardware_errors, BIOSLinker *linker);
+@@ -XXX,XX +XXX,XX @@ enum arm_cpu_mode {
- void acpi_build_hest(GArray *table_data, BIOSLinker *linker);
+ #define ARM_VFP_FPINST  9
- void acpi_ghes_add_fw_cfg(AcpiGhesState *vms, FWCfgState *s,
+ #define ARM_VFP_FPINST2 10
-                           GArray *hardware_errors);
-+int acpi_ghes_record_errors(uint8_t notify, uint64_t error_physical_addr);
++/* QEMU-internal value meaning "FPSCR, but we care only about NZCV" */
- #endif
++#define QEMU_VFP_FPSCR_NZCV 0xffff
-diff --git a/hw/acpi/ghes.c b/hw/acpi/ghes.c
++
  /* iwMMXt coprocessor control registers.  */
  #define ARM_IWMMXT_wCID  0
  #define ARM_IWMMXT_wCon  1
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/hw/acpi/ghes.c
+--- a/target/arm/translate-vfp.c.inc
-+++ b/hw/acpi/ghes.c
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP(DisasContext *s, arg_VDUP *a)
- #include "qemu/error-report.h"
+     return true;
- #include "hw/acpi/generic_event_device.h"
+ }
  #include "hw/nvram/fw_cfg.h"
 +#include "qemu/uuid.h"
  #define ACPI_GHES_ERRORS_FW_CFG_FILE        "etc/hardware_errors"
  #define ACPI_GHES_DATA_ADDR_FW_CFG_FILE     "etc/hardware_errors_addr"
@@ -XXX,XX +XXX,XX @@
  /* Address offset in Generic Address Structure(GAS) */
  #define GAS_ADDR_OFFSET 4
 +/*
-+ * The total size of Generic Error Data Entry
++ * M-profile provides two different sets of instructions that can
-+ * ACPI 6.1/6.2: 18.3.2.7.1 Generic Error Data,
++ * access floating point system registers: VMSR/VMRS (which move
-+ * Table 18-343 Generic Error Data Entry
++ * to/from a general purpose register) and VLDR/VSTR sysreg (which
 + * move directly to/from memory). In some cases there are also side
 + * effects which must happen after any write to memory (which could
 + * cause an exception). So we implement the common logic for the
 + * sysreg access in gen_M_fp_sysreg_write() and gen_M_fp_sysreg_read(),
 + * which take pointers to callback functions which will perform the
 + * actual "read/write general purpose register" and "read/write
 + * memory" operations.
 + */
-+#define ACPI_GHES_DATA_LENGTH               72
-+
-+/* The memory section CPER size, UEFI 2.6: N.2.5 Memory Error Section */
-+#define ACPI_GHES_MEM_CPER_LENGTH           80
-+
-+/* Masks for block_status flags */
-+#define ACPI_GEBS_UNCORRECTABLE         1
 +
 +/*
-+ * Total size for Generic Error Status Block except Generic Error Data Entries
++ * Emit code to store the sysreg to its final destination; frees the
-+ * ACPI 6.2: 18.3.2.7.1 Generic Error Data,
++ * TCG temp 'value' it is passed.
 + * Table 18-380 Generic Error Status Block
 + */
-+#define ACPI_GHES_GESB_SIZE                 20
++typedef void fp_sysreg_storefn(DisasContext *s, void *opaque, TCGv_i32 value);
 +
 +/*
-+ * Values for error_severity field
++ * Emit code to load the value to be copied to the sysreg; returns
 + * a new TCG temporary
 + */
-+enum AcpiGenericErrorSeverity {
++typedef TCGv_i32 fp_sysreg_loadfn(DisasContext *s, void *opaque);
-+    ACPI_CPER_SEV_RECOVERABLE = 0,
++
-+    ACPI_CPER_SEV_FATAL = 1,
++/* Common decode/access checks for fp sysreg read/write */
-+    ACPI_CPER_SEV_CORRECTED = 2,
++typedef enum FPSysRegCheckResult {
-+    ACPI_CPER_SEV_NONE = 3,
++    FPSysRegCheckFailed, /* caller should return false */
-+};
++    FPSysRegCheckDone, /* caller should return true */
-+
++    FPSysRegCheckContinue, /* caller should continue generating code */
- /*
++} FPSysRegCheckResult;
-  * Hardware Error Notification
++
-  * ACPI 4.0: 17.3.2.7 Hardware Error Notification
++static FPSysRegCheckResult fp_sysreg_checks(DisasContext *s, int regno)
-@@ -XXX,XX +XXX,XX @@ static void build_ghes_hw_error_notification(GArray *table, const uint8_t type)
++{
-     build_append_int_noprefix(table, 0, 4);
++    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
- }
++        return FPSysRegCheckFailed;
++    }
-+/*
++
-+ * Generic Error Data Entry
++    switch (regno) {
-+ * ACPI 6.1: 18.3.2.7.1 Generic Error Data
++    case ARM_VFP_FPSCR:
-+ */
++    case QEMU_VFP_FPSCR_NZCV:
-+static void acpi_ghes_generic_error_data(GArray *table,
++        break;
-+                const uint8_t *section_type, uint32_t error_severity,
++    default:
-+                uint8_t validation_bits, uint8_t flags,
++        return FPSysRegCheckFailed;
-+                uint32_t error_data_length, QemuUUID fru_id,
++    }
-+                uint64_t time_stamp)
++
-+{
++    if (!vfp_access_check(s)) {
-+    const uint8_t fru_text[20] = {0};
++        return FPSysRegCheckDone;
-+
++    }
-+    /* Section Type */
++
-+    g_array_append_vals(table, section_type, 16);
++    return FPSysRegCheckContinue;
-+
++}
-+    /* Error Severity */
++
-+    build_append_int_noprefix(table, error_severity, 4);
++static bool gen_M_fp_sysreg_write(DisasContext *s, int regno,
-+    /* Revision */
++
-+    build_append_int_noprefix(table, 0x300, 2);
++                                  fp_sysreg_loadfn *loadfn,
-+    /* Validation Bits */
++                                 void *opaque)
-+    build_append_int_noprefix(table, validation_bits, 1);
++{
-+    /* Flags */
++    /* Do a write to an M-profile floating point system register */
-+    build_append_int_noprefix(table, flags, 1);
++    TCGv_i32 tmp;
-+    /* Error Data Length */
++
-+    build_append_int_noprefix(table, error_data_length, 4);
++    switch (fp_sysreg_checks(s, regno)) {
-+
++    case FPSysRegCheckFailed:
-+    /* FRU Id */
++        return false;
-+    g_array_append_vals(table, fru_id.data, ARRAY_SIZE(fru_id.data));
++    case FPSysRegCheckDone:
-+
++        return true;
-+    /* FRU Text */
++    case FPSysRegCheckContinue:
-+    g_array_append_vals(table, fru_text, sizeof(fru_text));
++        break;
-+
++    }
-+    /* Timestamp */
++
-+    build_append_int_noprefix(table, time_stamp, 8);
++    switch (regno) {
-+}
++    case ARM_VFP_FPSCR:
-+
++        tmp = loadfn(s, opaque);
-+/*
++        gen_helper_vfp_set_fpscr(cpu_env, tmp);
-+ * Generic Error Status Block
++        tcg_temp_free_i32(tmp);
-+ * ACPI 6.1: 18.3.2.7.1 Generic Error Data
++        gen_lookup_tb(s);
-+ */
++        break;
-+static void acpi_ghes_generic_error_status(GArray *table, uint32_t block_status,
++    default:
-+                uint32_t raw_data_offset, uint32_t raw_data_length,
++        g_assert_not_reached();
-+                uint32_t data_length, uint32_t error_severity)
++    }
-+{
++    return true;
-+    /* Block Status */
++}
-+    build_append_int_noprefix(table, block_status, 4);
++
-+    /* Raw Data Offset */
++static bool gen_M_fp_sysreg_read(DisasContext *s, int regno,
-+    build_append_int_noprefix(table, raw_data_offset, 4);
++                                fp_sysreg_storefn *storefn,
-+    /* Raw Data Length */
++                                void *opaque)
-+    build_append_int_noprefix(table, raw_data_length, 4);
++{
-+    /* Data Length */
++    /* Do a read from an M-profile floating point system register */
-+    build_append_int_noprefix(table, data_length, 4);
++    TCGv_i32 tmp;
-+    /* Error Severity */
++
-+    build_append_int_noprefix(table, error_severity, 4);
++    switch (fp_sysreg_checks(s, regno)) {
-+}
++    case FPSysRegCheckFailed:
-+
++        return false;
-+/* UEFI 2.6: N.2.5 Memory Error Section */
++    case FPSysRegCheckDone:
-+static void acpi_ghes_build_append_mem_cper(GArray *table,
++        return true;
-+                                            uint64_t error_physical_addr)
++    case FPSysRegCheckContinue:
 +        break;
 +    }
 +
 +    switch (regno) {
 +    case ARM_VFP_FPSCR:
 +        tmp = tcg_temp_new_i32();
 +        gen_helper_vfp_get_fpscr(tmp, cpu_env);
 +        storefn(s, opaque, tmp);
 +        break;
 +    case QEMU_VFP_FPSCR_NZCV:
 +        /*
 +         * Read just NZCV; this is a special case to avoid the
 +         * helper call for the "VMRS to CPSR.NZCV" insn.
 +         */
 +        tmp = load_cpu_field(vfp.xregs[ARM_VFP_FPSCR]);
 +        tcg_gen_andi_i32(tmp, tmp, 0xf0000000);
 +        storefn(s, opaque, tmp);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +    }
 +    return true;
 +}
 +
 +static void fp_sysreg_to_gpr(DisasContext *s, void *opaque, TCGv_i32 value)
 +{
 +    arg_VMSR_VMRS *a = opaque;
 +
 +    if (a->rt == 15) {
 +        /* Set the 4 flag bits in the CPSR */
 +        gen_set_nzcv(value);
 +        tcg_temp_free_i32(value);
 +    } else {
 +        store_reg(s, a->rt, value);
 +    }
 +}
 +
 +static TCGv_i32 gpr_to_fp_sysreg(DisasContext *s, void *opaque)
 +{
 +    arg_VMSR_VMRS *a = opaque;
 +
 +    return load_reg(s, a->rt);
 +}
 +
 +static bool gen_M_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
 +{
 +    /*
-+     * Memory Error Record
++     * Accesses to R15 are UNPREDICTABLE; we choose to undef.
 +     * FPSCR -> r15 is a special case which writes to the PSR flags;
 +     * set a->reg to a special value to tell gen_M_fp_sysreg_read()
 +     * we only care about the top 4 bits of FPSCR there.
 +     */
-+
++    if (a->rt == 15) {
-+    /* Validation Bits */
++        if (a->l && a->reg == ARM_VFP_FPSCR) {
-+    build_append_int_noprefix(table,
++            a->reg = QEMU_VFP_FPSCR_NZCV;
-+                              (1ULL << 14) | /* Type Valid */
++        } else {
-+                              (1ULL << 1) /* Physical Address Valid */,
++            return false;
 +                              8);
 +    /* Error Status */
 +    build_append_int_noprefix(table, 0, 8);
 +    /* Physical Address */
 +    build_append_int_noprefix(table, error_physical_addr, 8);
 +    /* Skip all the detailed information normally found in such a record */
 +    build_append_int_noprefix(table, 0, 48);
 +    /* Memory Error Type */
 +    build_append_int_noprefix(table, 0 /* Unknown error */, 1);
 +    /* Skip all the detailed information normally found in such a record */
 +    build_append_int_noprefix(table, 0, 7);
 +}
 +
 +static int acpi_ghes_record_mem_error(uint64_t error_block_address,
 +                                      uint64_t error_physical_addr)
 +{
 +    GArray *block;
 +
 +    /* Memory Error Section Type */
 +    const uint8_t uefi_cper_mem_sec[] =
 +          UUID_LE(0xA5BC1114, 0x6F64, 0x4EDE, 0xB8, 0x63, 0x3E, 0x83, \
 +                  0xED, 0x7C, 0x83, 0xB1);
 +
 +    /* invalid fru id: ACPI 4.0: 17.3.2.6.1 Generic Error Data,
 +     * Table 17-13 Generic Error Data Entry
 +     */
 +    QemuUUID fru_id = {};
 +    uint32_t data_length;
 +
 +    block = g_array_new(false, true /* clear */, 1);
 +
 +    /* This is the length if adding a new generic error data entry*/
 +    data_length = ACPI_GHES_DATA_LENGTH + ACPI_GHES_MEM_CPER_LENGTH;
 +
 +    /*
 +     * Check whether it will run out of the preallocated memory if adding a new
 +     * generic error data entry
 +     */
 +    if ((data_length + ACPI_GHES_GESB_SIZE) > ACPI_GHES_MAX_RAW_DATA_LENGTH) {
 +        error_report("Not enough memory to record new CPER!!!");
 +        g_array_free(block, true);
 +        return -1;
 +    }
 +
 +    /* Build the new generic error status block header */
 +    acpi_ghes_generic_error_status(block, ACPI_GEBS_UNCORRECTABLE,
 +        0, 0, data_length, ACPI_CPER_SEV_RECOVERABLE);
 +
 +    /* Build this new generic error data entry header */
 +    acpi_ghes_generic_error_data(block, uefi_cper_mem_sec,
 +        ACPI_CPER_SEV_RECOVERABLE, 0, 0,
 +        ACPI_GHES_MEM_CPER_LENGTH, fru_id, 0);
 +
 +    /* Build the memory section CPER for above new generic error data entry */
 +    acpi_ghes_build_append_mem_cper(block, error_physical_addr);
 +
 +    /* Write the generic error data entry into guest memory */
 +    cpu_physical_memory_write(error_block_address, block->data, block->len);
 +
 +    g_array_free(block, true);
 +
 +    return 0;
 +}
 +
  /*
   * Build table for the hardware error fw_cfg blob.
   * Initialize "etc/hardware_errors" and "etc/hardware_errors_addr" fw_cfg blobs.
@@ -XXX,XX +XXX,XX @@ void acpi_ghes_add_fw_cfg(AcpiGhesState *ags, FWCfgState *s,
      fw_cfg_add_file_callback(s, ACPI_GHES_DATA_ADDR_FW_CFG_FILE, NULL, NULL,
          NULL, &(ags->ghes_addr_le), sizeof(ags->ghes_addr_le), false);
  }
 +
 +int acpi_ghes_record_errors(uint8_t source_id, uint64_t physical_address)
 +{
 +    uint64_t error_block_addr, read_ack_register_addr, read_ack_register = 0;
 +    uint64_t start_addr;
 +    bool ret = -1;
 +    AcpiGedState *acpi_ged_state;
 +    AcpiGhesState *ags;
 +
 +    assert(source_id < ACPI_HEST_SRC_ID_RESERVED);
 +
 +    acpi_ged_state = ACPI_GED(object_resolve_path_type("", TYPE_ACPI_GED,
 +                                                       NULL));
 +    g_assert(acpi_ged_state);
 +    ags = &acpi_ged_state->ghes_state;
 +
 +    start_addr = le64_to_cpu(ags->ghes_addr_le);
 +
 +    if (physical_address) {
 +
 +        if (source_id < ACPI_HEST_SRC_ID_RESERVED) {
 +            start_addr += source_id * sizeof(uint64_t);
 +        }
-+
++    }
-+        cpu_physical_memory_read(start_addr, &error_block_addr,
++
-+                                 sizeof(error_block_addr));
++    if (a->l) {
-+
++        /* VMRS, move FP system register to gp register */
-+        error_block_addr = le64_to_cpu(error_block_addr);
++        return gen_M_fp_sysreg_read(s, a->reg, fp_sysreg_to_gpr, a);
-+
++    } else {
-+        read_ack_register_addr = start_addr +
++        /* VMSR, move gp register to FP system register */
-+            ACPI_GHES_ERROR_SOURCE_COUNT * sizeof(uint64_t);
++        return gen_M_fp_sysreg_write(s, a->reg, gpr_to_fp_sysreg, a);
-+
++    }
-+        cpu_physical_memory_read(read_ack_register_addr,
++}
-+                                 &read_ack_register, sizeof(read_ack_register));
++
-+
+ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
-+        /* zero means OSPM does not acknowledge the error */
+ {
-+        if (!read_ack_register) {
+     TCGv_i32 tmp;
-+            error_report("OSPM does not acknowledge previous error,"
+     bool ignore_vfp_enabled = false;
-+                " so can not record CPER for current error anymore");
-+        } else if (error_block_addr) {
+-    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
-+            read_ack_register = cpu_to_le64(0);
+-        return false;
-+            /*
++    if (arm_dc_feature(s, ARM_FEATURE_M)) {
-+             * Clear the Read Ack Register, OSPM will write it to 1 when
++        return gen_M_VMSR_VMRS(s, a);
-+             * it acknowledges this error.
+     }
-+             */
-+            cpu_physical_memory_write(read_ack_register_addr,
+-    if (arm_dc_feature(s, ARM_FEATURE_M)) {
-+                &read_ack_register, sizeof(uint64_t));
+-        /*
-+
+-         * The only M-profile VFP vmrs/vmsr sysreg is FPSCR.
-+            ret = acpi_ghes_record_mem_error(error_block_addr,
+-         * Accesses to R15 are UNPREDICTABLE; we choose to undef.
-+                                             physical_address);
+-         * (FPSCR -> r15 is a special case which writes to the PSR flags.)
-+        } else
+-         */
-+            error_report("can not find Generic Error Status Block");
+-        if (a->reg != ARM_VFP_FPSCR) {
-+    }
+-            return false;
-+
+-        }
-+    return ret;
+-        if (a->rt == 15 && !a->l) {
-+}
+-            return false;
 -        }
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
      }
      switch (a->reg) {
 --
 .20.1

-[PULL 03/45] target/arm: Create gen_gvec_{u,s}{rshr,rsra}
+[PULL 19/36] target/arm: Move general-use constant expanders up in translate.c
-From: Richard Henderson <richard.henderson@linaro.org>
+The constant-expander functions like negate, plus_2, etc, are
 generally useful; move them up in translate.c so we can use them in
 the VFP/Neon decoders as well as in the A32/T32/T16 decoders.
-Create vectorized versions of handle_shri_with_rndacc
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-for shift+round and shift+round+accumulate.  Add out-of-line
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-helpers in preparation for longer vector lengths from SVE.
+Message-id: 20201119215617.29887-9-peter.maydell@linaro.org
 ---
  target/arm/translate.c | 46 +++++++++++++++++++++++-------------------
 file changed, 25 insertions(+), 21 deletions(-)
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-3-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  20 ++
- target/arm/translate.h     |   9 +
- target/arm/translate-a64.c |  11 +-
- target/arm/translate.c     | 463 +++++++++++++++++++++++++++++++++++--
- target/arm/vec_helper.c    |  50 ++++
-files changed, 527 insertions(+), 26 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_usra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
- DEF_HELPER_FLAGS_3(gvec_usra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
- DEF_HELPER_FLAGS_3(gvec_usra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srshr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srshr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srshr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srshr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_3(gvec_urshr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_urshr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_urshr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_urshr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_3(gvec_srsra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srsra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srsra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_srsra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_3(gvec_ursra_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ursra_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ursra_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_3(gvec_ursra_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
- #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
- void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_srshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_urshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
-         return;
-     case 0x04: /* SRSHR / URSHR (rounding) */
--        break;
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift,
-+                      is_u ? gen_gvec_urshr : gen_gvec_srshr, size);
-+        return;
-+
-     case 0x06: /* SRSRA / URSRA (accum + rounding) */
--        accumulate = true;
--        break;
-+        gen_gvec_fn2i(s, is_q, rd, rn, shift,
-+                      is_u ? gen_gvec_ursra : gen_gvec_srsra, size);
-+        return;
-+
-     default:
-         g_assert_not_reached();
-     }
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+@@ -XXX,XX +XXX,XX @@ static void arm_gen_condlabel(DisasContext *s)
      }
  }
 +/*
-+ * Shift one less than the requested amount, and the low bit is
++ * Constant expanders for the decoders.
 + * the rounding bit.  For the 8 and 16-bit operations, because we
 + * mask the low bit, we can perform a normal integer shift instead
 + * of a vector shift.
 + */
-+static void gen_srshr8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
++
 +static int negate(DisasContext *s, int x)
 +{
-+    TCGv_i64 t = tcg_temp_new_i64();
++    return -x;
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_8, 1));
 +    tcg_gen_vec_sar8i_i64(d, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
-+static void gen_srshr16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
++static int plus_2(DisasContext *s, int x)
 +{
-+    TCGv_i64 t = tcg_temp_new_i64();
++    return x + 2;
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_16, 1));
 +    tcg_gen_vec_sar16i_i64(d, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
-+static void gen_srshr32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
++static int times_2(DisasContext *s, int x)
 +{
-+    TCGv_i32 t = tcg_temp_new_i32();
++    return x * 2;
 +
 +    tcg_gen_extract_i32(t, a, sh - 1, 1);
 +    tcg_gen_sari_i32(d, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
-+static void gen_srshr64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
++static int times_4(DisasContext *s, int x)
 +{
-+    TCGv_i64 t = tcg_temp_new_i64();
++    return x * 4;
 +
 +    tcg_gen_extract_i64(t, a, sh - 1, 1);
 +    tcg_gen_sari_i64(d, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
-+static void gen_srshr_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
+ /* Flags for the disas_set_da_iss info argument:
-+{
+  * lower bits hold the Rt register number, higher bits are flags.
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
+  */
-+    TCGv_vec ones = tcg_temp_new_vec_matching(d);
+@@ -XXX,XX +XXX,XX @@ static void arm_skip_unless(DisasContext *s, uint32_t cond)
-+
-+    tcg_gen_shri_vec(vece, t, a, sh - 1);
-+    tcg_gen_dupi_vec(vece, ones, 1);
+ /*
-+    tcg_gen_and_vec(vece, t, t, ones);
+- * Constant expanders for the decoders.
-+    tcg_gen_sari_vec(vece, d, a, sh);
++ * Constant expanders used by T16/T32 decode
-+    tcg_gen_add_vec(vece, d, d, t);
+  */
-+
-+    tcg_temp_free_vec(t);
+-static int negate(DisasContext *s, int x)
-+    tcg_temp_free_vec(ones);
+-{
-+}
+-    return -x;
-+
+-}
-+void gen_gvec_srshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+-
-+                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
+-static int plus_2(DisasContext *s, int x)
-+{
+-{
-+    static const TCGOpcode vecop_list[] = {
+-    return x + 2;
-+        INDEX_op_shri_vec, INDEX_op_sari_vec, INDEX_op_add_vec, 0
+-}
-+    };
+-
-+    static const GVecGen2i ops[4] = {
+-static int times_2(DisasContext *s, int x)
-+        { .fni8 = gen_srshr8_i64,
+-{
-+          .fniv = gen_srshr_vec,
+-    return x * 2;
-+          .fno = gen_helper_gvec_srshr_b,
+-}
-+          .opt_opc = vecop_list,
+-
-+          .vece = MO_8 },
+-static int times_4(DisasContext *s, int x)
-+        { .fni8 = gen_srshr16_i64,
+-{
-+          .fniv = gen_srshr_vec,
+-    return x * 4;
-+          .fno = gen_helper_gvec_srshr_h,
+-}
-+          .opt_opc = vecop_list,
+-
-+          .vece = MO_16 },
+ /* Return only the rotation part of T32ExpandImm.  */
-+        { .fni4 = gen_srshr32_i32,
+ static int t32_expandimm_rot(DisasContext *s, int x)
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_srshr64_i64,
 +          .fniv = gen_srshr_vec,
 +          .fno = gen_helper_gvec_srshr_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    if (shift == (8 << vece)) {
 +        /*
 +         * Shifts larger than the element size are architecturally valid.
 +         * Signed results in all sign bits.  With rounding, this produces
 +         *   (-1 + 1) >> 1 == 0, or (0 + 1) >> 1 == 0.
 +         * I.e. always zero.
 +         */
 +        tcg_gen_gvec_dup_imm(vece, rd_ofs, opr_sz, max_sz, 0);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_srsra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_srshr8_i64(t, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srsra16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_srshr16_i64(t, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srsra32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    gen_srshr32_i32(t, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_srsra64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    gen_srshr64_i64(t, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_srsra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    gen_srshr_vec(vece, t, a, sh);
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_srsra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_sari_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_srsra8_i64,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fni8 = gen_srsra16_i64,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_srsra32_i32,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_srsra64_i64,
 +          .fniv = gen_srsra_vec,
 +          .fno = gen_helper_gvec_srsra_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    /*
 +     * Shifts larger than the element size are architecturally valid.
 +     * Signed results in all sign bits.  With rounding, this produces
 +     *   (-1 + 1) >> 1 == 0, or (0 + 1) >> 1 == 0.
 +     * I.e. always zero.  With accumulation, this leaves D unchanged.
 +     */
 +    if (shift == (8 << vece)) {
 +        /* Nop, but we do need to clear the tail. */
 +        tcg_gen_gvec_mov(vece, rd_ofs, rd_ofs, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_urshr8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_8, 1));
 +    tcg_gen_vec_shr8i_i64(d, a, sh);
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_shri_i64(t, a, sh - 1);
 +    tcg_gen_andi_i64(t, t, dup_const(MO_16, 1));
 +    tcg_gen_vec_shr16i_i64(d, a, sh);
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    tcg_gen_extract_i32(t, a, sh - 1, 1);
 +    tcg_gen_shri_i32(d, a, sh);
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_urshr64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    tcg_gen_extract_i64(t, a, sh - 1, 1);
 +    tcg_gen_shri_i64(d, a, sh);
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_urshr_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t shift)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +    TCGv_vec ones = tcg_temp_new_vec_matching(d);
 +
 +    tcg_gen_shri_vec(vece, t, a, shift - 1);
 +    tcg_gen_dupi_vec(vece, ones, 1);
 +    tcg_gen_and_vec(vece, t, t, ones);
 +    tcg_gen_shri_vec(vece, d, a, shift);
 +    tcg_gen_add_vec(vece, d, d, t);
 +
 +    tcg_temp_free_vec(t);
 +    tcg_temp_free_vec(ones);
 +}
 +
 +void gen_gvec_urshr(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_urshr8_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_b,
 +          .opt_opc = vecop_list,
 +          .vece = MO_8 },
 +        { .fni8 = gen_urshr16_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_h,
 +          .opt_opc = vecop_list,
 +          .vece = MO_16 },
 +        { .fni4 = gen_urshr32_i32,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_s,
 +          .opt_opc = vecop_list,
 +          .vece = MO_32 },
 +        { .fni8 = gen_urshr64_i64,
 +          .fniv = gen_urshr_vec,
 +          .fno = gen_helper_gvec_urshr_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    if (shift == (8 << vece)) {
 +        /*
 +         * Shifts larger than the element size are architecturally valid.
 +         * Unsigned results in zero.  With rounding, this produces a
 +         * copy of the most significant bit.
 +         */
 +        tcg_gen_gvec_shri(vece, rd_ofs, rm_ofs, shift - 1, opr_sz, max_sz);
 +    } else {
 +        tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +    }
 +}
 +
 +static void gen_ursra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 8) {
 +        tcg_gen_vec_shr8i_i64(t, a, 7);
 +    } else {
 +        gen_urshr8_i64(t, a, sh);
 +    }
 +    tcg_gen_vec_add8_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra16_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 16) {
 +        tcg_gen_vec_shr16i_i64(t, a, 15);
 +    } else {
 +        gen_urshr16_i64(t, a, sh);
 +    }
 +    tcg_gen_vec_add16_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra32_i32(TCGv_i32 d, TCGv_i32 a, int32_t sh)
 +{
 +    TCGv_i32 t = tcg_temp_new_i32();
 +
 +    if (sh == 32) {
 +        tcg_gen_shri_i32(t, a, 31);
 +    } else {
 +        gen_urshr32_i32(t, a, sh);
 +    }
 +    tcg_gen_add_i32(d, d, t);
 +    tcg_temp_free_i32(t);
 +}
 +
 +static void gen_ursra64_i64(TCGv_i64 d, TCGv_i64 a, int64_t sh)
 +{
 +    TCGv_i64 t = tcg_temp_new_i64();
 +
 +    if (sh == 64) {
 +        tcg_gen_shri_i64(t, a, 63);
 +    } else {
 +        gen_urshr64_i64(t, a, sh);
 +    }
 +    tcg_gen_add_i64(d, d, t);
 +    tcg_temp_free_i64(t);
 +}
 +
 +static void gen_ursra_vec(unsigned vece, TCGv_vec d, TCGv_vec a, int64_t sh)
 +{
 +    TCGv_vec t = tcg_temp_new_vec_matching(d);
 +
 +    if (sh == (8 << vece)) {
 +        tcg_gen_shri_vec(vece, t, a, sh - 1);
 +    } else {
 +        gen_urshr_vec(vece, t, a, sh);
 +    }
 +    tcg_gen_add_vec(vece, d, d, t);
 +    tcg_temp_free_vec(t);
 +}
 +
 +void gen_gvec_ursra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                    int64_t shift, uint32_t opr_sz, uint32_t max_sz)
 +{
 +    static const TCGOpcode vecop_list[] = {
 +        INDEX_op_shri_vec, INDEX_op_add_vec, 0
 +    };
 +    static const GVecGen2i ops[4] = {
 +        { .fni8 = gen_ursra8_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_b,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_8 },
 +        { .fni8 = gen_ursra16_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_h,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_16 },
 +        { .fni4 = gen_ursra32_i32,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_s,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_32 },
 +        { .fni8 = gen_ursra64_i64,
 +          .fniv = gen_ursra_vec,
 +          .fno = gen_helper_gvec_ursra_d,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .opt_opc = vecop_list,
 +          .load_dest = true,
 +          .vece = MO_64 },
 +    };
 +
 +    /* tszimm encoding produces immediates in the range [1..esize] */
 +    tcg_debug_assert(shift > 0);
 +    tcg_debug_assert(shift <= (8 << vece));
 +
 +    tcg_gen_gvec_2i(rd_ofs, rm_ofs, opr_sz, max_sz, shift, &ops[vece]);
 +}
 +
  static void gen_shr8_ins_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
-     uint64_t mask = dup_const(MO_8, 0xff >> shift);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                     }
-                     return 0;
-+                case 2: /* VRSHR */
-+                    /* Right shift comes here negative.  */
-+                    shift = -shift;
-+                    if (u) {
-+                        gen_gvec_urshr(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    } else {
-+                        gen_gvec_srshr(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    }
-+                    return 0;
-+
-+                case 3: /* VRSRA */
-+                    /* Right shift comes here negative.  */
-+                    shift = -shift;
-+                    if (u) {
-+                        gen_gvec_ursra(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    } else {
-+                        gen_gvec_srsra(size, rd_ofs, rm_ofs, shift,
-+                                       vec_size, vec_size);
-+                    }
-+                    return 0;
-+
-                 case 4: /* VSRI */
-                     if (!u) {
-                         return 1;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         neon_load_reg64(cpu_V0, rm + pass);
-                         tcg_gen_movi_i64(cpu_V1, imm);
-                         switch (op) {
--                        case 2: /* VRSHR */
--                        case 3: /* VRSRA */
--                            if (u)
--                                gen_helper_neon_rshl_u64(cpu_V0, cpu_V0, cpu_V1);
--                            else
--                                gen_helper_neon_rshl_s64(cpu_V0, cpu_V0, cpu_V1);
--                            break;
-                         case 6: /* VQSHLU */
-                             gen_helper_neon_qshlu_s64(cpu_V0, cpu_env,
-                                                       cpu_V0, cpu_V1);
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         default:
-                             g_assert_not_reached();
-                         }
--                        if (op == 3) {
--                            /* Accumulate.  */
--                            neon_load_reg64(cpu_V1, rd + pass);
--                            tcg_gen_add_i64(cpu_V0, cpu_V0, cpu_V1);
--                        }
-                         neon_store_reg64(cpu_V0, rd + pass);
-                     } else { /* size < 3 */
-                         /* Operands in T0 and T1.  */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                         tmp2 = tcg_temp_new_i32();
-                         tcg_gen_movi_i32(tmp2, imm);
-                         switch (op) {
--                        case 2: /* VRSHR */
--                        case 3: /* VRSRA */
--                            GEN_NEON_INTEGER_OP(rshl);
--                            break;
-                         case 6: /* VQSHLU */
-                             switch (size) {
-                             case 0:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                             g_assert_not_reached();
-                         }
-                         tcg_temp_free_i32(tmp2);
--
--                        if (op == 3) {
--                            /* Accumulate.  */
--                            tmp2 = neon_load_reg(rd, pass);
--                            gen_neon_add(size, tmp, tmp2);
--                            tcg_temp_free_i32(tmp2);
--                        }
-                         neon_store_reg(rd, pass, tmp);
-                     }
-                 } /* for pass */
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_SRA(gvec_usra_d, uint64_t)
- #undef DO_SRA
-+#define DO_RSHR(NAME, TYPE)                             \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        TYPE tmp = n[i] >> (shift - 1);                 \
-+        d[i] = (tmp >> 1) + (tmp & 1);                  \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_RSHR(gvec_srshr_b, int8_t)
-+DO_RSHR(gvec_srshr_h, int16_t)
-+DO_RSHR(gvec_srshr_s, int32_t)
-+DO_RSHR(gvec_srshr_d, int64_t)
-+
-+DO_RSHR(gvec_urshr_b, uint8_t)
-+DO_RSHR(gvec_urshr_h, uint16_t)
-+DO_RSHR(gvec_urshr_s, uint32_t)
-+DO_RSHR(gvec_urshr_d, uint64_t)
-+
-+#undef DO_RSHR
-+
-+#define DO_RSRA(NAME, TYPE)                             \
-+void HELPER(NAME)(void *vd, void *vn, uint32_t desc)    \
-+{                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);               \
-+    int shift = simd_data(desc);                        \
-+    TYPE *d = vd, *n = vn;                              \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {        \
-+        TYPE tmp = n[i] >> (shift - 1);                 \
-+        d[i] += (tmp >> 1) + (tmp & 1);                 \
-+    }                                                   \
-+    clear_tail(d, oprsz, simd_maxsz(desc));             \
-+}
-+
-+DO_RSRA(gvec_srsra_b, int8_t)
-+DO_RSRA(gvec_srsra_h, int16_t)
-+DO_RSRA(gvec_srsra_s, int32_t)
-+DO_RSRA(gvec_srsra_d, int64_t)
-+
-+DO_RSRA(gvec_ursra_b, uint8_t)
-+DO_RSRA(gvec_ursra_h, uint16_t)
-+DO_RSRA(gvec_ursra_s, uint32_t)
-+DO_RSRA(gvec_ursra_d, uint64_t)
-+
-+#undef DO_RSRA
-+
- /*
-  * Convert float16 to float32, raising no exceptions and
-  * preserving exceptional values, including SNaN.
 --
 .20.1

-[PULL 44/45] target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
+[PULL 20/36] target/arm: Implement VLDR/VSTR system register
-Convert the Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS 3-reg-same
+Implement the new-in-v8.1M VLDR/VSTR variants which directly
-insns to decodetree. (These are all the remaining non-accumulation
+read or write FP system registers to memory.
 instructions in this group.)
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-17-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-10-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  6 +++
+ target/arm/vfp.decode          | 14 ++++++
- target/arm/translate-neon.inc.c | 70 +++++++++++++++++++++++++++++++++
+ target/arm/translate-vfp.c.inc | 91 ++++++++++++++++++++++++++++++++++
- target/arm/translate.c          | 42 +-------------------
+files changed, 105 insertions(+)
 files changed, 78 insertions(+), 40 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/vfp.decode
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/vfp.decode
-@@ -XXX,XX +XXX,XX @@ VCGE_fp_3s       1111 001 1 0 . 0 . .... .... 1110 ... 0 .... @3same_fp
+@@ -XXX,XX +XXX,XX @@ VLDR_VSTR_hp ---- 1101 u:1 .0 l:1 rn:4 .... 1001 imm:8      vd=%vd_sp
- VACGE_fp_3s      1111 001 1 0 . 0 . .... .... 1110 ... 1 .... @3same_fp
+ VLDR_VSTR_sp ---- 1101 u:1 .0 l:1 rn:4 .... 1010 imm:8      vd=%vd_sp
- VCGT_fp_3s       1111 001 1 0 . 1 . .... .... 1110 ... 0 .... @3same_fp
+ VLDR_VSTR_dp ---- 1101 u:1 .0 l:1 rn:4 .... 1011 imm:8      vd=%vd_dp
- VACGT_fp_3s      1111 001 1 0 . 1 . .... .... 1110 ... 1 .... @3same_fp
-+VMAX_fp_3s       1111 001 0 0 . 0 . .... .... 1111 ... 0 .... @3same_fp
++# M-profile VLDR/VSTR to sysreg
-+VMIN_fp_3s       1111 001 0 0 . 1 . .... .... 1111 ... 0 .... @3same_fp
++%vldr_sysreg 22:1 13:3
- VPMAX_fp_3s      1111 001 1 0 . 0 . .... .... 1111 ... 0 .... @3same_fp_q0
++%imm7_0x4 0:7 !function=times_4
- VPMIN_fp_3s      1111 001 1 0 . 1 . .... .... 1111 ... 0 .... @3same_fp_q0
++
-+VRECPS_fp_3s     1111 001 0 0 . 0 . .... .... 1111 ... 1 .... @3same_fp
++&vldr_sysreg rn reg imm a w p
-+VRSQRTS_fp_3s    1111 001 0 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
++@vldr_sysreg .... ... . a:1 . . . rn:4 ... . ... .. ....... \
-+VMAXNM_fp_3s     1111 001 1 0 . 0 . .... .... 1111 ... 1 .... @3same_fp
++             reg=%vldr_sysreg imm=%imm7_0x4 &vldr_sysreg
-+VMINNM_fp_3s     1111 001 1 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
++
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++# P=0 W=0 is SEE "Related encodings", so split into two patterns
 +VLDR_sysreg  ---- 110 1 . . w:1 1 .... ... 0 111 11 ....... @vldr_sysreg p=1
 +VLDR_sysreg  ---- 110 0 . . 1   1 .... ... 0 111 11 ....... @vldr_sysreg p=0 w=1
 +VSTR_sysreg  ---- 110 1 . . w:1 0 .... ... 0 111 11 ....... @vldr_sysreg p=1
 +VSTR_sysreg  ---- 110 0 . . 1   0 .... ... 0 111 11 ....... @vldr_sysreg p=0 w=1
 +
  # We split the load/store multiple up into two patterns to avoid
  # overlap with other insns in the "Advanced SIMD load/store and 64-bit move"
  # grouping:
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
+--- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/translate-neon.inc.c
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
+@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
- DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
+     return true;
- DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
+ }
- DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
-+DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
++static void fp_sysreg_to_memory(DisasContext *s, void *opaque, TCGv_i32 value)
 +DO_3S_FP(VMIN, gen_helper_vfp_mins, false)
  static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
                              TCGv_ptr fpstatus)
@@ -XXX,XX +XXX,XX @@ static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
  DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
  DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
 +static bool trans_VMAXNM_fp_3s(DisasContext *s, arg_3same *a)
 +{
-+    if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
++    arg_vldr_sysreg *a = opaque;
 +    uint32_t offset = a->imm;
 +    TCGv_i32 addr;
 +
 +    if (!a->a) {
 +        offset = - offset;
 +    }
 +
 +    addr = load_reg(s, a->rn);
 +    if (a->p) {
 +        tcg_gen_addi_i32(addr, addr, offset);
 +    }
 +
 +    if (s->v8m_stackcheck && a->rn == 13 && a->w) {
 +        gen_helper_v8m_stackcheck(cpu_env, addr);
 +    }
 +
 +    gen_aa32_st_i32(s, value, addr, get_mem_index(s),
 +                    MO_UL | MO_ALIGN | s->be_data);
 +    tcg_temp_free_i32(value);
 +
 +    if (a->w) {
 +        /* writeback */
 +        if (!a->p) {
 +            tcg_gen_addi_i32(addr, addr, offset);
 +        }
 +        store_reg(s, a->rn, addr);
 +    } else {
 +        tcg_temp_free_i32(addr);
 +    }
 +}
 +
 +static TCGv_i32 memory_to_fp_sysreg(DisasContext *s, void *opaque)
 +{
 +    arg_vldr_sysreg *a = opaque;
 +    uint32_t offset = a->imm;
 +    TCGv_i32 addr;
 +    TCGv_i32 value = tcg_temp_new_i32();
 +
 +    if (!a->a) {
 +        offset = - offset;
 +    }
 +
 +    addr = load_reg(s, a->rn);
 +    if (a->p) {
 +        tcg_gen_addi_i32(addr, addr, offset);
 +    }
 +
 +    if (s->v8m_stackcheck && a->rn == 13 && a->w) {
 +        gen_helper_v8m_stackcheck(cpu_env, addr);
 +    }
 +
 +    gen_aa32_ld_i32(s, value, addr, get_mem_index(s),
 +                    MO_UL | MO_ALIGN | s->be_data);
 +
 +    if (a->w) {
 +        /* writeback */
 +        if (!a->p) {
 +            tcg_gen_addi_i32(addr, addr, offset);
 +        }
 +        store_reg(s, a->rn, addr);
 +    } else {
 +        tcg_temp_free_i32(addr);
 +    }
 +    return value;
 +}
 +
 +static bool trans_VLDR_sysreg(DisasContext *s, arg_vldr_sysreg *a)
 +{
 +    if (!arm_dc_feature(s, ARM_FEATURE_V8_1M)) {
 +        return false;
 +    }
-+
++    if (a->rn == 15) {
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
-+
++    return gen_M_fp_sysreg_write(s, a->reg, memory_to_fp_sysreg, a);
 +    return do_3same_fp(s, a, gen_helper_vfp_maxnums, false);
 +}
 +
-+static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
++static bool trans_VSTR_sysreg(DisasContext *s, arg_vldr_sysreg *a)
 +{
-+    if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
++    if (!arm_dc_feature(s, ARM_FEATURE_V8_1M)) {
 +        return false;
 +    }
-+
++    if (a->rn == 15) {
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
-+
++    return gen_M_fp_sysreg_read(s, a->reg, fp_sysreg_to_memory, a);
 +    return do_3same_fp(s, a, gen_helper_vfp_minnums, false);
 +}
 +
-+WRAP_ENV_FN(gen_VRECPS_tramp, gen_helper_recps_f32)
+ static bool trans_VMOV_half(DisasContext *s, arg_VMOV_single *a)
 +
 +static void gen_VRECPS_fp_3s(unsigned vece, uint32_t rd_ofs,
 +                             uint32_t rn_ofs, uint32_t rm_ofs,
 +                             uint32_t oprsz, uint32_t maxsz)
 +{
 +    static const GVecGen3 ops = { .fni4 = gen_VRECPS_tramp };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
 +}
 +
 +static bool trans_VRECPS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same(s, a, gen_VRECPS_fp_3s);
 +}
 +
 +WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
 +
 +static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
 +                              uint32_t rn_ofs, uint32_t rm_ofs,
 +                              uint32_t oprsz, uint32_t maxsz)
 +{
 +    static const GVecGen3 ops = { .fni4 = gen_VRSQRTS_tramp };
 +    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
 +}
 +
 +static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
 +{
 +    if (a->size != 0) {
 +        /* TODO fp16 support */
 +        return false;
 +    }
 +
 +    return do_3same(s, a, gen_VRSQRTS_fp_3s);
 +}
 +
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
-     /* FP operations handled pairwise 32 bits at a time */
+     TCGv_i32 tmp;
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_FLOAT_MULTIPLY:
          case NEON_3R_FLOAT_CMP:
          case NEON_3R_FLOAT_ACMP:
 +        case NEON_3R_FLOAT_MINMAX:
 +        case NEON_3R_FLOAT_MISC:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              return 1;
          }
          switch (op) {
 -        case NEON_3R_FLOAT_MINMAX:
 -            if (u) {
 -                return 1; /* VPMIN/VPMAX handled by decodetree */
 -            }
 -            break;
 -        case NEON_3R_FLOAT_MISC:
 -            /* VMAXNM/VMINNM in ARMv8 */
 -            if (u && !arm_dc_feature(s, ARM_FEATURE_V8)) {
 -                return 1;
 -            }
 -            break;
          case NEON_3R_VFM_VQRDMLSH:
              if (!dc_isar_feature(aa32_simdfmac, s)) {
                  return 1;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          tmp = neon_load_reg(rn, pass);
          tmp2 = neon_load_reg(rm, pass);
          switch (op) {
 -        case NEON_3R_FLOAT_MINMAX:
 -        {
 -            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -            if (size == 0) {
 -                gen_helper_vfp_maxs(tmp, tmp, tmp2, fpstatus);
 -            } else {
 -                gen_helper_vfp_mins(tmp, tmp, tmp2, fpstatus);
 -            }
 -            tcg_temp_free_ptr(fpstatus);
 -            break;
 -        }
 -        case NEON_3R_FLOAT_MISC:
 -            if (u) {
 -                /* VMAXNM/VMINNM */
 -                TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                if (size == 0) {
 -                    gen_helper_vfp_maxnums(tmp, tmp, tmp2, fpstatus);
 -                } else {
 -                    gen_helper_vfp_minnums(tmp, tmp, tmp2, fpstatus);
 -                }
 -                tcg_temp_free_ptr(fpstatus);
 -            } else {
 -                if (size == 0) {
 -                    gen_helper_recps_f32(tmp, cpu_env, tmp, tmp2);
 -                } else {
 -                    gen_helper_rsqrts_f32(tmp, cpu_env, tmp, tmp2);
 -              }
 -            }
 -            break;
          case NEON_3R_VFM_VQRDMLSH:
          {
              /* VFMA, VFMS: fused multiply-add */
 --
 .20.1

-[PULL 43/45] target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
+[PULL 21/36] target/arm: Implement M-profile FPSCR_nzcvqc
-The usual location for the env argument in the argument list of a TCG helper
+v8.1M defines a new FP system register FPSCR_nzcvqc; this behaves
-is immediately after the return-value argument. recps_f32 and rsqrts_f32
+like the existing FPSCR, except that it reads and writes only bits
-differ in that they put it at the end.
+[31:27] of the FPSCR (the N, Z, C, V and QC flag bits).  (Unlike the
 FPSCR, the special case for Rt=15 of writing the CPSR.NZCV is not
 permitted.)
-Move the env argument to its usual place; this will allow us to
+Implement the register.  Since we don't yet implement MVE, we handle
-more easily use these helper functions with the gvec APIs.
+the QC bit as RES0, with todo comments for where we will need to add
 support later.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-16-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-11-peter.maydell@linaro.org
 ---
- target/arm/helper.h     | 4 ++--
+ target/arm/cpu.h               | 13 +++++++++++++
- target/arm/translate.c  | 4 ++--
+ target/arm/translate-vfp.c.inc | 27 +++++++++++++++++++++++++++
- target/arm/vfp_helper.c | 4 ++--
+files changed, 40 insertions(+)
 files changed, 6 insertions(+), 6 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/target/arm/cpu.h
-+++ b/target/arm/helper.h
++++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ void vfp_set_fpscr(CPUARMState *env, uint32_t val);
- DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
+ #define FPCR_FZ     (1 << 24)   /* Flush-to-zero enable bit */
- DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+ #define FPCR_DN     (1 << 25)   /* Default NaN enable bit */
+ #define FPCR_QC     (1 << 27)   /* Cumulative saturation bit */
--DEF_HELPER_3(recps_f32, f32, f32, f32, env)
++#define FPCR_V      (1 << 28)   /* FP overflow flag */
--DEF_HELPER_3(rsqrts_f32, f32, f32, f32, env)
++#define FPCR_C      (1 << 29)   /* FP carry flag */
-+DEF_HELPER_3(recps_f32, f32, env, f32, f32)
++#define FPCR_Z      (1 << 30)   /* FP zero flag */
-+DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
++#define FPCR_N      (1 << 31)   /* FP negative flag */
- DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
++
- DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
++#define FPCR_NZCV_MASK (FPCR_N | FPCR_Z | FPCR_C | FPCR_V)
- DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
++#define FPCR_NZCVQC_MASK (FPCR_NZCV_MASK | FPCR_QC)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
  static inline uint32_t vfp_get_fpsr(CPUARMState *env)
  {
@@ -XXX,XX +XXX,XX @@ enum arm_cpu_mode {
  #define ARM_VFP_FPEXC   8
  #define ARM_VFP_FPINST  9
  #define ARM_VFP_FPINST2 10
 +/* These ones are M-profile only */
 +#define ARM_VFP_FPSCR_NZCVQC 2
 +#define ARM_VFP_VPR 12
 +#define ARM_VFP_P0 13
 +#define ARM_VFP_FPCXT_NS 14
 +#define ARM_VFP_FPCXT_S 15
  /* QEMU-internal value meaning "FPSCR, but we care only about NZCV" */
  #define QEMU_VFP_FPSCR_NZCV 0xffff
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/translate.c
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static FPSysRegCheckResult fp_sysreg_checks(DisasContext *s, int regno)
-                 tcg_temp_free_ptr(fpstatus);
+     case ARM_VFP_FPSCR:
-             } else {
+     case QEMU_VFP_FPSCR_NZCV:
-                 if (size == 0) {
+         break;
--                    gen_helper_recps_f32(tmp, tmp, tmp2, cpu_env);
++    case ARM_VFP_FPSCR_NZCVQC:
-+                    gen_helper_recps_f32(tmp, cpu_env, tmp, tmp2);
++        if (!arm_dc_feature(s, ARM_FEATURE_V8_1M)) {
-                 } else {
++            return false;
--                    gen_helper_rsqrts_f32(tmp, tmp, tmp2, cpu_env);
++        }
-+                    gen_helper_rsqrts_f32(tmp, cpu_env, tmp, tmp2);
++        break;
-               }
+     default:
-             }
+         return FPSysRegCheckFailed;
-             break;
+     }
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
+@@ -XXX,XX +XXX,XX @@ static bool gen_M_fp_sysreg_write(DisasContext *s, int regno,
-index XXXXXXX..XXXXXXX 100644
+         tcg_temp_free_i32(tmp);
---- a/target/arm/vfp_helper.c
+         gen_lookup_tb(s);
-+++ b/target/arm/vfp_helper.c
+         break;
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
++    case ARM_VFP_FPSCR_NZCVQC:
- #define float32_three make_float32(0x40400000)
++    {
- #define float32_one_point_five make_float32(0x3fc00000)
++        TCGv_i32 fpscr;
++        tmp = loadfn(s, opaque);
--float32 HELPER(recps_f32)(float32 a, float32 b, CPUARMState *env)
++        /*
-+float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
++         * TODO: when we implement MVE, write the QC bit.
- {
++         * For non-MVE, QC is RES0.
-     float_status *s = &env->vfp.standard_fp_status;
++         */
-     if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
++        tcg_gen_andi_i32(tmp, tmp, FPCR_NZCV_MASK);
-@@ -XXX,XX +XXX,XX @@ float32 HELPER(recps_f32)(float32 a, float32 b, CPUARMState *env)
++        fpscr = load_cpu_field(vfp.xregs[ARM_VFP_FPSCR]);
-     return float32_sub(float32_two, float32_mul(a, b, s), s);
++        tcg_gen_andi_i32(fpscr, fpscr, ~FPCR_NZCV_MASK);
- }
++        tcg_gen_or_i32(fpscr, fpscr, tmp);
++        store_cpu_field(fpscr, vfp.xregs[ARM_VFP_FPSCR]);
--float32 HELPER(rsqrts_f32)(float32 a, float32 b, CPUARMState *env)
++        tcg_temp_free_i32(tmp);
-+float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
++        break;
- {
++    }
-     float_status *s = &env->vfp.standard_fp_status;
+     default:
-     float32 product;
+         g_assert_not_reached();
      }
@@ -XXX,XX +XXX,XX @@ static bool gen_M_fp_sysreg_read(DisasContext *s, int regno,
          gen_helper_vfp_get_fpscr(tmp, cpu_env);
          storefn(s, opaque, tmp);
          break;
 +    case ARM_VFP_FPSCR_NZCVQC:
 +        /*
 +         * TODO: MVE has a QC bit, which we probably won't store
 +         * in the xregs[] field. For non-MVE, where QC is RES0,
 +         * we can just fall through to the FPSCR_NZCV case.
 +         */
      case QEMU_VFP_FPSCR_NZCV:
          /*
           * Read just NZCV; this is a special case to avoid the
 --
 .20.1

-[PULL 37/45] target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
+[PULL 22/36] target/arm: Use new FPCR_NZCV_MASK constant
-Convert the Neon integer VPADD 3-reg-same insns to decodetree.  These
+We defined a constant name for the mask of NZCV bits in the FPCR/FPSCR
-are 'pairwise' operations.  (Note that VQRDMLAH, which shares the
+in the previous commit; use it in a couple of places in existing code,
-same primary opcode but has U=1, has already been converted.)
+where we're masking out everything except NZCV for the "load to Rt=15
 sets CPSR.NZCV" special case.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-10-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-12-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  2 ++
+ target/arm/translate-vfp.c.inc | 4 ++--
- target/arm/translate-neon.inc.c |  2 ++
+file changed, 2 insertions(+), 2 deletions(-)
  target/arm/translate.c          | 19 +------------------
 files changed, 5 insertions(+), 18 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@ VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
+@@ -XXX,XX +XXX,XX @@ static bool gen_M_fp_sysreg_read(DisasContext *s, int regno,
- VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+          * helper call for the "VMRS to CPSR.NZCV" insn.
- VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
+          */
+         tmp = load_cpu_field(vfp.xregs[ARM_VFP_FPSCR]);
-+VPADD_3s         1111 001 0 0 . .. .... .... 1011 . . . 1 .... @3same_q0
+-        tcg_gen_andi_i32(tmp, tmp, 0xf0000000);
-+
++        tcg_gen_andi_i32(tmp, tmp, FPCR_NZCV_MASK);
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
+         storefn(s, opaque, tmp);
+         break;
- SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
+     default:
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
-index XXXXXXX..XXXXXXX 100644
+         case ARM_VFP_FPSCR:
---- a/target/arm/translate-neon.inc.c
+             if (a->rt == 15) {
-+++ b/target/arm/translate-neon.inc.c
+                 tmp = load_cpu_field(vfp.xregs[ARM_VFP_FPSCR]);
-@@ -XXX,XX +XXX,XX @@ static bool do_3same_pair(DisasContext *s, arg_3same *a, NeonGenTwoOpFn *fn)
+-                tcg_gen_andi_i32(tmp, tmp, 0xf0000000);
- #define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
++                tcg_gen_andi_i32(tmp, tmp, FPCR_NZCV_MASK);
- #define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
+             } else {
- #define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
+                 tmp = tcg_temp_new_i32();
-+#define gen_helper_neon_padd_u32  tcg_gen_add_i32
+                 gen_helper_vfp_get_fpscr(tmp, cpu_env);
  DO_3SAME_PAIR(VPMAX_S, pmax_s)
  DO_3SAME_PAIR(VPMIN_S, pmin_s)
  DO_3SAME_PAIR(VPMAX_U, pmax_u)
  DO_3SAME_PAIR(VPMIN_U, pmin_u)
 +DO_3SAME_PAIR(VPADD, padd_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              return 1;
          }
          switch (op) {
 -        case NEON_3R_VPADD_VQRDMLAH:
 -            if (!u) {
 -                break;  /* VPADD */
 -            }
 -            /* VQRDMLAH : handled by decodetree */
 -            return 1;
 -
          case NEON_3R_VFM_VQRDMLSH:
              if (!u) {
                  /* VFM, VFMS */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VQRSHL:
          case NEON_3R_VPMAX:
          case NEON_3R_VPMIN:
 +        case NEON_3R_VPADD_VQRDMLAH:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          }
          pairwise = 0;
          switch (op) {
 -        case NEON_3R_VPADD_VQRDMLAH:
 -            pairwise = 1;
 -            break;
          case NEON_3R_FLOAT_ARITH:
              pairwise = (u && size < 2); /* if VPADD (float) */
              break;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  }
              }
              break;
 -        case NEON_3R_VPADD_VQRDMLAH:
 -            switch (size) {
 -            case 0: gen_helper_neon_padd_u8(tmp, tmp, tmp2); break;
 -            case 1: gen_helper_neon_padd_u16(tmp, tmp, tmp2); break;
 -            case 2: tcg_gen_add_i32(tmp, tmp, tmp2); break;
 -            default: abort();
 -            }
 -            break;
          case NEON_3R_FLOAT_ARITH: /* Floating point arithmetic. */
          {
              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 --
 .20.1

-[PULL 39/45] target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
+[PULL 23/36] target/arm: Factor out preserve-fp-state from full_vfp_access_check()
-Convert the Neon VADD, VSUB, VABD 3-reg-same insns to decodetree.
+Factor out the code which handles M-profile lazy FP state preservation
-We already have gvec helpers for addition and subtraction, but must
+from full_vfp_access_check(); accesses to the FPCXT_NS register are
-add one for fabd.
+a special case which need to do just this part (corresponding in the
 pseudocode to the PreserveFPState() function), and not the full
 set of actions matching the pseudocode ExecuteFPCheck() which
 normal FP instructions need to do.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-12-peter.maydell@linaro.org
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20201119215617.29887-13-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  3 ++-
+ target/arm/translate-vfp.c.inc | 45 ++++++++++++++++++++--------------
- target/arm/neon-dp.decode       |  8 ++++++++
+file changed, 27 insertions(+), 18 deletions(-)
  target/arm/neon_helper.c        |  7 -------
  target/arm/translate-neon.inc.c | 28 ++++++++++++++++++++++++++++
  target/arm/translate.c          | 10 +++-------
  target/arm/vec_helper.c         |  7 +++++++
 files changed, 48 insertions(+), 15 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/helper.h
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(neon_qneg_s16, TCG_CALL_NO_RWG, i32, env, i32)
+@@ -XXX,XX +XXX,XX @@ static inline long vfp_f16_offset(unsigned reg, bool top)
- DEF_HELPER_FLAGS_2(neon_qneg_s32, TCG_CALL_NO_RWG, i32, env, i32)
+     return offs;
  DEF_HELPER_FLAGS_2(neon_qneg_s64, TCG_CALL_NO_RWG, i64, env, i64)
 -DEF_HELPER_3(neon_abd_f32, i32, i32, i32, ptr)
  DEF_HELPER_3(neon_ceq_f32, i32, i32, i32, ptr)
  DEF_HELPER_3(neon_cge_f32, i32, i32, i32, ptr)
  DEF_HELPER_3(neon_cgt_f32, i32, i32, i32, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 +
  DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
 diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/neon-dp.decode
 +++ b/target/arm/neon-dp.decode
@@ -XXX,XX +XXX,XX @@
  @3same_q0        .... ... . . . size:2 .... .... .... . 0 . . .... \
                   &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
 +# For FP insns the high bit of 'size' is used as part of opcode decode
 +@3same_fp        .... ... . . . . size:1 .... .... .... . q:1 . . .... \
 +                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +
  VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
  VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
  VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
@@ -XXX,XX +XXX,XX @@ SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
                   vm=%vm_dp vn=%vn_dp vd=%vd_dp
  VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
 +
 +VADD_fp_3s       1111 001 0 0 . 0 . .... .... 1101 ... 0 .... @3same_fp
 +VSUB_fp_3s       1111 001 0 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
 +VABD_fp_3s       1111 001 1 0 . 1 . .... .... 1101 ... 0 .... @3same_fp
 diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/neon_helper.c
 +++ b/target/arm/neon_helper.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_qneg_s64)(CPUARMState *env, uint64_t x)
  }
- /* NEON Float helpers.  */
--uint32_t HELPER(neon_abd_f32)(uint32_t a, uint32_t b, void *fpstp)
--{
--    float_status *fpst = fpstp;
--    float32 f0 = make_float32(a);
--    float32 f1 = make_float32(b);
--    return float32_val(float32_abs(float32_sub(f0, f1, fpst)));
--}
- /* Floating point comparisons produce an integer result.
-  * Note that EQ doesn't signal InvalidOp for QNaNs but GE and GT do.
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
- DO_3SAME_VQDMULH(VQDMULH, qdmulh)
- DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
-+
 +/*
-+ * For all the functions using this macro, size == 1 means fp16,
++ * Generate code for M-profile lazy FP state preservation if needed;
-+ * which is an architecture extension we don't implement yet.
++ * this corresponds to the pseudocode PreserveFPState() function.
 + */
-+#define DO_3S_FP_GVEC(INSN,FUNC)                                        \
++static void gen_preserve_fp_state(DisasContext *s)
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
++{
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
++    if (s->v7m_lspact) {
-+                                uint32_t oprsz, uint32_t maxsz)         \
++        /*
-+    {                                                                   \
++         * Lazy state saving affects external memory and also the NVIC,
-+        TCGv_ptr fpst = get_fpstatus_ptr(1);                            \
++         * so we must mark it as an IO operation for icount (and cause
-+        tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpst,                \
++         * this to be the last insn in the TB).
-+                           oprsz, maxsz, 0, FUNC);                      \
++         */
-+        tcg_temp_free_ptr(fpst);                                        \
++        if (tb_cflags(s->base.tb) & CF_USE_ICOUNT) {
-+    }                                                                   \
++            s->base.is_jmp = DISAS_UPDATE_EXIT;
-+    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a)     \
++            gen_io_start();
-+    {                                                                   \
++        }
-+        if (a->size != 0) {                                             \
++        gen_helper_v7m_preserve_fp_state(cpu_env);
-+            /* TODO fp16 support */                                     \
++        /*
-+            return false;                                               \
++         * If the preserve_fp_state helper doesn't throw an exception
-+        }                                                               \
++         * then it will clear LSPACT; we don't need to repeat this for
-+        return do_3same(s, a, gen_##INSN##_3s);                         \
++         * any further FP insns in this TB.
 +         */
 +        s->v7m_lspact = false;
 +    }
-+
-+
-+DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
-+DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
-+DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         switch (op) {
-         case NEON_3R_FLOAT_ARITH:
-             pairwise = (u && size < 2); /* if VPADD (float) */
-+            if (!pairwise) {
-+                return 1; /* handled by decodetree */
-+            }
-             break;
-         case NEON_3R_FLOAT_MINMAX:
-             pairwise = u; /* if VPMIN/VPMAX (float) */
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         {
-             TCGv_ptr fpstatus = get_fpstatus_ptr(1);
-             switch ((u << 2) | size) {
--            case 0: /* VADD */
-             case 4: /* VPADD */
-                 gen_helper_vfp_adds(tmp, tmp, tmp2, fpstatus);
-                 break;
--            case 2: /* VSUB */
--                gen_helper_vfp_subs(tmp, tmp, tmp2, fpstatus);
--                break;
--            case 6: /* VABD */
--                gen_helper_neon_abd_f32(tmp, tmp, tmp2, fpstatus);
--                break;
-             default:
-                 abort();
-             }
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ static float64 float64_ftsmul(float64 op1, uint64_t op2, float_status *stat)
-     return result;
- }
-+static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
-+{
-+    return float32_abs(float32_sub(op1, op2, stat));
 +}
 +
- #define DO_3OP(NAME, FUNC, TYPE) \
+ /*
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+  * Check that VFP access is enabled. If it is, do the necessary
- {                                                                          \
+  * M-profile lazy-FP handling and then return true.
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_h, float16_ftsmul, float16)
+@@ -XXX,XX +XXX,XX @@ static bool full_vfp_access_check(DisasContext *s, bool ignore_vfp_enabled)
- DO_3OP(gvec_ftsmul_s, float32_ftsmul, float32)
+         /* Handle M-profile lazy FP state mechanics */
- DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
+         /* Trigger lazy-state preservation if necessary */
-+DO_3OP(gvec_fabd_s, float32_abd, float32)
+-        if (s->v7m_lspact) {
-+
+-            /*
- #ifdef TARGET_AARCH64
+-             * Lazy state saving affects external memory and also the NVIC,
+-             * so we must mark it as an IO operation for icount (and cause
- DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
+-             * this to be the last insn in the TB).
 -             */
 -            if (tb_cflags(s->base.tb) & CF_USE_ICOUNT) {
 -                s->base.is_jmp = DISAS_UPDATE_EXIT;
 -                gen_io_start();
 -            }
 -            gen_helper_v7m_preserve_fp_state(cpu_env);
 -            /*
 -             * If the preserve_fp_state helper doesn't throw an exception
 -             * then it will clear LSPACT; we don't need to repeat this for
 -             * any further FP insns in this TB.
 -             */
 -            s->v7m_lspact = false;
 -        }
 +        gen_preserve_fp_state(s);
          /* Update ownership of FP context: set FPCCR.S to match current state */
          if (s->v8m_fpccr_s_wrong) {
 --
 .20.1

-[PULL 06/45] target/arm: Tidy handle_vec_simd_shri
+[PULL 24/36] target/arm: Implement FPCXT_S fp system register
-From: Richard Henderson <richard.henderson@linaro.org>
+Implement the new-in-v8.1M FPCXT_S floating point system register.
 This is for saving and restoring the secure floating point context,
 and it reads and writes bits [27:0] from the FPSCR and the
 CONTROL.SFPA bit in bit [31].
-Now that we've converted all cases to gvec, there is quite a bit
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-of dead code at the end of the function.  Remove it.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20201119215617.29887-14-peter.maydell@linaro.org
 ---
  target/arm/translate-vfp.c.inc | 58 ++++++++++++++++++++++++++++++++++
 file changed, 58 insertions(+)
-Sink the call to gen_gvec_fn2i to the end, loading a function
+diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 pointer within the switch statement.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-6-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/translate-a64.c | 56 ++++++++++----------------------------
 file changed, 14 insertions(+), 42 deletions(-)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/translate-a64.c
++++ b/target/arm/translate-vfp.c.inc
-@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
+@@ -XXX,XX +XXX,XX @@ static FPSysRegCheckResult fp_sysreg_checks(DisasContext *s, int regno)
-     int size = 32 - clz32(immh) - 1;
+             return false;
-     int immhb = immh << 3 | immb;
+         }
-     int shift = 2 * (8 << size) - immhb;
+         break;
--    bool accumulate = false;
++    case ARM_VFP_FPCXT_S:
--    int dsize = is_q ? 128 : 64;
++        if (!arm_dc_feature(s, ARM_FEATURE_V8_1M)) {
--    int esize = 8 << size;
++            return false;
--    int elements = dsize/esize;
++        }
--    MemOp memop = size | (is_u ? 0 : MO_SIGN);
++        if (!s->v8m_secure) {
--    TCGv_i64 tcg_rn = new_tmp_a64(s);
++            return false;
--    TCGv_i64 tcg_rd = new_tmp_a64(s);
++        }
 -    TCGv_i64 tcg_round;
 -    uint64_t round_const;
 -    int i;
 +    GVecGen2iFn *gvec_fn;
      if (extract32(immh, 3, 1) && !is_q) {
          unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
      switch (opcode) {
      case 0x02: /* SSRA / USRA (accumulate) */
 -        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 -                      is_u ? gen_gvec_usra : gen_gvec_ssra, size);
 -        return;
 +        gvec_fn = is_u ? gen_gvec_usra : gen_gvec_ssra;
 +        break;
+     default:
-     case 0x08: /* SRI */
+         return FPSysRegCheckFailed;
--        gen_gvec_fn2i(s, is_q, rd, rn, shift, gen_gvec_sri, size);
+     }
--        return;
+@@ -XXX,XX +XXX,XX @@ static bool gen_M_fp_sysreg_write(DisasContext *s, int regno,
-+        gvec_fn = gen_gvec_sri;
+         tcg_temp_free_i32(tmp);
          break;
      }
 +    case ARM_VFP_FPCXT_S:
 +    {
 +        TCGv_i32 sfpa, control, fpscr;
 +        /* Set FPSCR[27:0] and CONTROL.SFPA from value */
 +        tmp = loadfn(s, opaque);
 +        sfpa = tcg_temp_new_i32();
 +        tcg_gen_shri_i32(sfpa, tmp, 31);
 +        control = load_cpu_field(v7m.control[M_REG_S]);
 +        tcg_gen_deposit_i32(control, control, sfpa,
 +                            R_V7M_CONTROL_SFPA_SHIFT, 1);
 +        store_cpu_field(control, v7m.control[M_REG_S]);
 +        fpscr = load_cpu_field(vfp.xregs[ARM_VFP_FPSCR]);
 +        tcg_gen_andi_i32(fpscr, fpscr, FPCR_NZCV_MASK);
 +        tcg_gen_andi_i32(tmp, tmp, ~FPCR_NZCV_MASK);
 +        tcg_gen_or_i32(fpscr, fpscr, tmp);
 +        store_cpu_field(fpscr, vfp.xregs[ARM_VFP_FPSCR]);
 +        tcg_temp_free_i32(tmp);
 +        tcg_temp_free_i32(sfpa);
 +        break;
++    }
      case 0x00: /* SSHR / USHR */
          if (is_u) {
@@ -XXX,XX +XXX,XX @@ static void handle_vec_simd_shri(DisasContext *s, bool is_q, bool is_u,
                  /* Shift count the same size as element size produces zero.  */
                  tcg_gen_gvec_dup_imm(size, vec_full_reg_offset(s, rd),
                                       is_q ? 16 : 8, vec_full_reg_size(s), 0);
 -            } else {
 -                gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_shri, size);
 +                return;
              }
 +            gvec_fn = tcg_gen_gvec_shri;
          } else {
              /* Shift count the same size as element size produces all sign.  */
              if (shift == 8 << size) {
                  shift -= 1;
              }
 -            gen_gvec_fn2i(s, is_q, rd, rn, shift, tcg_gen_gvec_sari, size);
 +            gvec_fn = tcg_gen_gvec_sari;
          }
 -        return;
 +        break;
      case 0x04: /* SRSHR / URSHR (rounding) */
 -        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 -                      is_u ? gen_gvec_urshr : gen_gvec_srshr, size);
 -        return;
 +        gvec_fn = is_u ? gen_gvec_urshr : gen_gvec_srshr;
 +        break;
      case 0x06: /* SRSRA / URSRA (accum + rounding) */
 -        gen_gvec_fn2i(s, is_q, rd, rn, shift,
 -                      is_u ? gen_gvec_ursra : gen_gvec_srsra, size);
 -        return;
 +        gvec_fn = is_u ? gen_gvec_ursra : gen_gvec_srsra;
 +        break;
      default:
          g_assert_not_reached();
      }
+@@ -XXX,XX +XXX,XX @@ static bool gen_M_fp_sysreg_read(DisasContext *s, int regno,
--    round_const = 1ULL << (shift - 1);
+         tcg_gen_andi_i32(tmp, tmp, FPCR_NZCV_MASK);
--    tcg_round = tcg_const_i64(round_const);
+         storefn(s, opaque, tmp);
--
+         break;
--    for (i = 0; i < elements; i++) {
++    case ARM_VFP_FPCXT_S:
--        read_vec_element(s, tcg_rn, rn, i, memop);
++    {
--        if (accumulate) {
++        TCGv_i32 control, sfpa, fpscr;
--            read_vec_element(s, tcg_rd, rd, i, memop);
++        /* Bits [27:0] from FPSCR, bit [31] from CONTROL.SFPA */
--        }
++        tmp = tcg_temp_new_i32();
--
++        sfpa = tcg_temp_new_i32();
--        handle_shri_with_rndacc(tcg_rd, tcg_rn, tcg_round,
++        gen_helper_vfp_get_fpscr(tmp, cpu_env);
--                                accumulate, is_u, size, shift);
++        tcg_gen_andi_i32(tmp, tmp, ~FPCR_NZCV_MASK);
--
++        control = load_cpu_field(v7m.control[M_REG_S]);
--        write_vec_element(s, tcg_rd, rd, i, size);
++        tcg_gen_andi_i32(sfpa, control, R_V7M_CONTROL_SFPA_MASK);
--    }
++        tcg_gen_shli_i32(sfpa, sfpa, 31 - R_V7M_CONTROL_SFPA_SHIFT);
--    tcg_temp_free_i64(tcg_round);
++        tcg_gen_or_i32(tmp, tmp, sfpa);
--
++        tcg_temp_free_i32(sfpa);
--    clear_vec_high(s, is_q, rd);
++        /*
-+    gen_gvec_fn2i(s, is_q, rd, rn, shift, gvec_fn, size);
++         * Store result before updating FPSCR etc, in case
- }
++         * it is a memory write which causes an exception.
++         */
- /* SHL/SLI - Vector shift left */
++        storefn(s, opaque, tmp);
 +        /*
 +         * Now we must reset FPSCR from FPDSCR_NS, and clear
 +         * CONTROL.SFPA; so we'll end the TB here.
 +         */
 +        tcg_gen_andi_i32(control, control, ~R_V7M_CONTROL_SFPA_MASK);
 +        store_cpu_field(control, v7m.control[M_REG_S]);
 +        fpscr = load_cpu_field(v7m.fpdscr[M_REG_NS]);
 +        gen_helper_vfp_set_fpscr(cpu_env, fpscr);
 +        tcg_temp_free_i32(fpscr);
 +        gen_lookup_tb(s);
 +        break;
 +    }
      default:
          g_assert_not_reached();
      }
 --
 .20.1

-[PULL 07/45] target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
+[PULL 25/36] hw/intc/armv7m_nvic: Update FPDSCR masking for v8.1M
-From: Richard Henderson <richard.henderson@linaro.org>
+The FPDSCR register has a similar layout to the FPSCR.  In v8.1M it
 gains new fields FZ16 (if half-precision floating point is supported)
 and LTPSIZE (always reads as 4).  Update the reset value and the code
 that handles writes to this register accordingly.
-Provide a functional interface for the vector expansion.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-This fits better with the existing set of helpers that
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-we provide for other operations.
+Message-id: 20201119215617.29887-16-peter.maydell@linaro.org
 ---
  target/arm/cpu.h      | 5 +++++
  hw/intc/armv7m_nvic.c | 9 ++++++++-
  target/arm/cpu.c      | 3 +++
 files changed, 16 insertions(+), 1 deletion(-)
-Macro-ize the 5 nearly identical comparisons.
+diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-7-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/translate.h     |  16 ++-
  target/arm/translate-a64.c |  22 ++--
  target/arm/translate.c     | 254 ++++++++-----------------------------
 files changed, 74 insertions(+), 218 deletions(-)
 diff --git a/target/arm/translate.h b/target/arm/translate.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
+--- a/target/arm/cpu.h
-+++ b/target/arm/translate.h
++++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ static inline void gen_swstep_exception(DisasContext *s, int isv, int ex)
+@@ -XXX,XX +XXX,XX @@ void vfp_set_fpscr(CPUARMState *env, uint32_t val);
- uint64_t vfp_expand_imm(int size, uint8_t imm8);
+ #define FPCR_IXE    (1 << 12)   /* Inexact exception trap enable */
+ #define FPCR_IDE    (1 << 15)   /* Input Denormal exception trap enable */
- /* Vector operations shared between ARM and AArch64.  */
+ #define FPCR_FZ16   (1 << 19)   /* ARMv8.2+, FP16 flush-to-zero */
--extern const GVecGen2 ceq0_op[4];
++#define FPCR_RMODE_MASK (3 << 22) /* Rounding mode */
--extern const GVecGen2 clt0_op[4];
+ #define FPCR_FZ     (1 << 24)   /* Flush-to-zero enable bit */
--extern const GVecGen2 cgt0_op[4];
+ #define FPCR_DN     (1 << 25)   /* Default NaN enable bit */
--extern const GVecGen2 cle0_op[4];
++#define FPCR_AHP    (1 << 26)   /* Alternative half-precision */
--extern const GVecGen2 cge0_op[4];
+ #define FPCR_QC     (1 << 27)   /* Cumulative saturation bit */
-+void gen_gvec_ceq0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+ #define FPCR_V      (1 << 28)   /* FP overflow flag */
-+                   uint32_t opr_sz, uint32_t max_sz);
+ #define FPCR_C      (1 << 29)   /* FP carry flag */
-+void gen_gvec_clt0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
+ #define FPCR_Z      (1 << 30)   /* FP zero flag */
-+                   uint32_t opr_sz, uint32_t max_sz);
+ #define FPCR_N      (1 << 31)   /* FP negative flag */
-+void gen_gvec_cgt0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                   uint32_t opr_sz, uint32_t max_sz);
++#define FPCR_LTPSIZE_SHIFT 16   /* LTPSIZE, M-profile only */
-+void gen_gvec_cle0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
++#define FPCR_LTPSIZE_MASK (7 << FPCR_LTPSIZE_SHIFT)
 +                   uint32_t opr_sz, uint32_t max_sz);
 +void gen_gvec_cge0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                   uint32_t opr_sz, uint32_t max_sz);
 +
- extern const GVecGen3 mla_op[4];
+ #define FPCR_NZCV_MASK (FPCR_N | FPCR_Z | FPCR_C | FPCR_V)
- extern const GVecGen3 mls_op[4];
+ #define FPCR_NZCVQC_MASK (FPCR_NZCV_MASK | FPCR_QC)
- extern const GVecGen3 cmtst_op[4];
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/intc/armv7m_nvic.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/intc/armv7m_nvic.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn4(DisasContext *s, bool is_q, int rd, int rn, int rm,
+@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
-             is_q ? 16 : 8, vec_full_reg_size(s));
+         break;
- }
+     case 0xf3c: /* FPDSCR */
+         if (cpu_isar_feature(aa32_vfp_simd, cpu)) {
--/* Expand a 2-operand AdvSIMD vector operation using an op descriptor. */
+-            value &= 0x07c00000;
--static void gen_gvec_op2(DisasContext *s, bool is_q, int rd,
++            uint32_t mask = FPCR_AHP | FPCR_DN | FPCR_FZ | FPCR_RMODE_MASK;
--                         int rn, const GVecGen2 *gvec_op)
++            if (cpu_isar_feature(any_fp16, cpu)) {
--{
++                mask |= FPCR_FZ16;
--    tcg_gen_gvec_2(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
++            }
--                   is_q ? 16 : 8, vec_full_reg_size(s), gvec_op);
++            value &= mask;
--}
++            if (cpu_isar_feature(aa32_lob, cpu)) {
--
++                value |= 4 << FPCR_LTPSIZE_SHIFT;
- /* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
++            }
- static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
+             cpu->env.v7m.fpdscr[attrs.secure] = value;
                           int rn, int rm, const GVecGen3 *gvec_op)
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
          }
          break;
-     case 0x8: /* CMGT, CMGE */
+diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 -        gen_gvec_op2(s, is_q, rd, rn, u ? &cge0_op[size] : &cgt0_op[size]);
 +        if (u) {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cge0, size);
 +        } else {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cgt0, size);
 +        }
          return;
      case 0x9: /* CMEQ, CMLE */
 -        gen_gvec_op2(s, is_q, rd, rn, u ? &cle0_op[size] : &ceq0_op[size]);
 +        if (u) {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_cle0, size);
 +        } else {
 +            gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_ceq0, size);
 +        }
          return;
      case 0xa: /* CMLT */
 -        gen_gvec_op2(s, is_q, rd, rn, &clt0_op[size]);
 +        gen_gvec_fn2(s, is_q, rd, rn, gen_gvec_clt0, size);
          return;
      case 0xb:
          if (u) { /* ABS, NEG */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/target/arm/cpu.c
-+++ b/target/arm/translate.c
++++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static int do_v81_helper(DisasContext *s, gen_helper_gvec_3_ptr *fn,
+@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(DeviceState *dev)
-     return 1;
+              * always reset to 4.
- }
+              */
+             env->v7m.ltpsize = 4;
--static void gen_ceq0_i32(TCGv_i32 d, TCGv_i32 a)
++            /* The LTPSIZE field in FPDSCR is constant and reads as 4. */
--{
++            env->v7m.fpdscr[M_REG_NS] = 4 << FPCR_LTPSIZE_SHIFT;
--    tcg_gen_setcondi_i32(TCG_COND_EQ, d, a, 0);
++            env->v7m.fpdscr[M_REG_S] = 4 << FPCR_LTPSIZE_SHIFT;
--    tcg_gen_neg_i32(d, d);
+         }
--}
--
+         if (arm_feature(env, ARM_FEATURE_M_SECURITY)) {
 -static void gen_ceq0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_EQ, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_ceq0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_EQ, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 +#define GEN_CMP0(NAME, COND)                                            \
 +    static void gen_##NAME##0_i32(TCGv_i32 d, TCGv_i32 a)               \
 +    {                                                                   \
 +        tcg_gen_setcondi_i32(COND, d, a, 0);                            \
 +        tcg_gen_neg_i32(d, d);                                          \
 +    }                                                                   \
 +    static void gen_##NAME##0_i64(TCGv_i64 d, TCGv_i64 a)               \
 +    {                                                                   \
 +        tcg_gen_setcondi_i64(COND, d, a, 0);                            \
 +        tcg_gen_neg_i64(d, d);                                          \
 +    }                                                                   \
 +    static void gen_##NAME##0_vec(unsigned vece, TCGv_vec d, TCGv_vec a) \
 +    {                                                                   \
 +        TCGv_vec zero = tcg_const_zeros_vec_matching(d);                \
 +        tcg_gen_cmp_vec(COND, vece, d, a, zero);                        \
 +        tcg_temp_free_vec(zero);                                        \
 +    }                                                                   \
 +    void gen_gvec_##NAME##0(unsigned vece, uint32_t d, uint32_t m,      \
 +                            uint32_t opr_sz, uint32_t max_sz)           \
 +    {                                                                   \
 +        const GVecGen2 op[4] = {                                        \
 +            { .fno = gen_helper_gvec_##NAME##0_b,                       \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .vece = MO_8 },                                           \
 +            { .fno = gen_helper_gvec_##NAME##0_h,                       \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .vece = MO_16 },                                          \
 +            { .fni4 = gen_##NAME##0_i32,                                \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .vece = MO_32 },                                          \
 +            { .fni8 = gen_##NAME##0_i64,                                \
 +              .fniv = gen_##NAME##0_vec,                                \
 +              .opt_opc = vecop_list_cmp,                                \
 +              .prefer_i64 = TCG_TARGET_REG_BITS == 64,                  \
 +              .vece = MO_64 },                                          \
 +        };                                                              \
 +        tcg_gen_gvec_2(d, m, opr_sz, max_sz, &op[vece]);                \
 +    }
  static const TCGOpcode vecop_list_cmp[] = {
      INDEX_op_cmp_vec, 0
  };
 -const GVecGen2 ceq0_op[4] = {
 -    { .fno = gen_helper_gvec_ceq0_b,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_ceq0_h,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_ceq0_i32,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_ceq0_i64,
 -      .fniv = gen_ceq0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 +GEN_CMP0(ceq, TCG_COND_EQ)
 +GEN_CMP0(cle, TCG_COND_LE)
 +GEN_CMP0(cge, TCG_COND_GE)
 +GEN_CMP0(clt, TCG_COND_LT)
 +GEN_CMP0(cgt, TCG_COND_GT)
 -static void gen_cle0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_LE, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_cle0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_LE, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_cle0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_LE, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 cle0_op[4] = {
 -    { .fno = gen_helper_gvec_cle0_b,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_cle0_h,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cle0_i32,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cle0_i64,
 -      .fniv = gen_cle0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 -
 -static void gen_cge0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_GE, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_cge0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_GE, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_cge0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_GE, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 cge0_op[4] = {
 -    { .fno = gen_helper_gvec_cge0_b,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_cge0_h,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cge0_i32,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cge0_i64,
 -      .fniv = gen_cge0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 -
 -static void gen_clt0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_LT, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_clt0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_LT, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_clt0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_LT, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 clt0_op[4] = {
 -    { .fno = gen_helper_gvec_clt0_b,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_clt0_h,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_clt0_i32,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_clt0_i64,
 -      .fniv = gen_clt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 -
 -static void gen_cgt0_i32(TCGv_i32 d, TCGv_i32 a)
 -{
 -    tcg_gen_setcondi_i32(TCG_COND_GT, d, a, 0);
 -    tcg_gen_neg_i32(d, d);
 -}
 -
 -static void gen_cgt0_i64(TCGv_i64 d, TCGv_i64 a)
 -{
 -    tcg_gen_setcondi_i64(TCG_COND_GT, d, a, 0);
 -    tcg_gen_neg_i64(d, d);
 -}
 -
 -static void gen_cgt0_vec(unsigned vece, TCGv_vec d, TCGv_vec a)
 -{
 -    TCGv_vec zero = tcg_const_zeros_vec_matching(d);
 -    tcg_gen_cmp_vec(TCG_COND_GT, vece, d, a, zero);
 -    tcg_temp_free_vec(zero);
 -}
 -
 -const GVecGen2 cgt0_op[4] = {
 -    { .fno = gen_helper_gvec_cgt0_b,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_8 },
 -    { .fno = gen_helper_gvec_cgt0_h,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_16 },
 -    { .fni4 = gen_cgt0_i32,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .vece = MO_32 },
 -    { .fni8 = gen_cgt0_i64,
 -      .fniv = gen_cgt0_vec,
 -      .opt_opc = vecop_list_cmp,
 -      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -      .vece = MO_64 },
 -};
 +#undef GEN_CMP0
  static void gen_ssra8_i64(TCGv_i64 d, TCGv_i64 a, int64_t shift)
  {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                      break;
                  case NEON_2RM_VCEQ0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &ceq0_op[size]);
 +                    gen_gvec_ceq0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCGT0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &cgt0_op[size]);
 +                    gen_gvec_cgt0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCLE0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &cle0_op[size]);
 +                    gen_gvec_cle0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCGE0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &cge0_op[size]);
 +                    gen_gvec_cge0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  case NEON_2RM_VCLT0:
 -                    tcg_gen_gvec_2(rd_ofs, rm_ofs, vec_size,
 -                                   vec_size, &clt0_op[size]);
 +                    gen_gvec_clt0(size, rd_ofs, rm_ofs, vec_size, vec_size);
                      break;
                  default:
 --
 .20.1

-[PULL 05/45] target/arm: Remove unnecessary range check for VSHL
+[PULL 26/36] target/arm: For v8.1M, always clear R0-R3, R12, APSR, EPSR on exception entry
-From: Richard Henderson <richard.henderson@linaro.org>
+In v8.0M, on exception entry the registers R0-R3, R12, APSR and EPSR
 are zeroed for an exception taken to Non-secure state; for an
 exception taken to Secure state they become UNKNOWN, and we chose to
 leave them at their previous values.
-In 1dc8425e551, while converting to gvec, I added an extra range check
+In v8.1M the behaviour is specified more tightly and these registers
-against the shift count.  This was unnecessary because the encoding of
+are always zeroed regardless of the security state that the exception
-the shift count produces 0 to the element size - 1.
+targets (see rule R_KPZV).  Implement this.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201119215617.29887-17-peter.maydell@linaro.org
 ---
- target/arm/translate.c | 12 ++----------
+ target/arm/m_helper.c | 16 ++++++++++++----
-file changed, 2 insertions(+), 10 deletions(-)
+file changed, 12 insertions(+), 4 deletions(-)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+--- a/target/arm/m_helper.c
-+++ b/target/arm/translate.c
++++ b/target/arm/m_helper.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void v7m_exception_taken(ARMCPU *cpu, uint32_t lr, bool dotailchain,
-                         gen_gvec_sli(size, rd_ofs, rm_ofs, shift,
+          * Clear registers if necessary to prevent non-secure exception
-                                      vec_size, vec_size);
+          * code being able to see register values from secure code.
-                     } else { /* VSHL */
+          * Where register values become architecturally UNKNOWN we leave
--                        /* Shifts larger than the element size are
+-         * them with their previous values.
--                         * architecturally valid and results in zero.
++         * them with their previous values. v8.1M is tighter than v8.0M
--                         */
++         * here and always zeroes the caller-saved registers regardless
--                        if (shift >= 8 << size) {
++         * of the security state the exception is targeting.
--                            tcg_gen_gvec_dup_imm(size, rd_ofs,
+          */
--                                                 vec_size, vec_size, 0);
+         if (arm_feature(env, ARM_FEATURE_M_SECURITY)) {
--                        } else {
+-            if (!targets_secure) {
--                            tcg_gen_gvec_shli(size, rd_ofs, rm_ofs, shift,
++            if (!targets_secure || arm_feature(env, ARM_FEATURE_V8_1M)) {
--                                              vec_size, vec_size);
+                 /*
--                        }
+                  * Always clear the caller-saved registers (they have been
-+                        tcg_gen_gvec_shli(size, rd_ofs, rm_ofs, shift,
+                  * pushed to the stack earlier in v7m_push_stack()).
-+                                          vec_size, vec_size);
+@@ -XXX,XX +XXX,XX @@ static void v7m_exception_taken(ARMCPU *cpu, uint32_t lr, bool dotailchain,
                   * v7m_push_callee_stack()).
                   */
                  int i;
 +                /*
 +                 * r4..r11 are callee-saves, zero only if background
 +                 * state was Secure (EXCRET.S == 1) and exception
 +                 * targets Non-secure state
 +                 */
 +                bool zero_callee_saves = !targets_secure &&
 +                    (lr & R_V7M_EXCRET_S_MASK);
                  for (i = 0; i < 13; i++) {
 -                    /* r4..r11 are callee-saves, zero only if EXCRET.S == 1 */
 -                    if (i < 4 || i > 11 || (lr & R_V7M_EXCRET_S_MASK)) {
 +                    if (i < 4 || i > 11 || zero_callee_saves) {
                          env->regs[i] = 0;
                      }
-                     return 0;
                  }
 --
 .20.1

-[PULL 08/45] target/arm: Create gen_gvec_{mla,mls}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-8-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |   7 +-
- target/arm/translate-a64.c      |   4 +-
- target/arm/translate-neon.inc.c |  16 +----
- target/arm/translate.c          | 117 +++++++++++++++++---------------
-files changed, 71 insertions(+), 73 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_cle0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
- void gen_gvec_cge0(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                    uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen3 mla_op[4];
--extern const GVecGen3 mls_op[4];
-+void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- extern const GVecGen3 cmtst_op[4];
- extern const GVecGen3 sshl_op[4];
- extern const GVecGen3 ushl_op[4];
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-         return;
-     case 0x12: /* MLA, MLS */
-         if (u) {
--            gen_gvec_op3(s, is_q, rd, rn, rm, &mls_op[size]);
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mls, size);
-         } else {
--            gen_gvec_op3(s, is_q, rd, rn, rm, &mla_op[size]);
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mla, size);
-         }
-         return;
-     case 0x11:
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMAX_U, tcg_gen_gvec_umax)
- DO_3SAME_NO_SZ_3(VMIN_S, tcg_gen_gvec_smin)
- DO_3SAME_NO_SZ_3(VMIN_U, tcg_gen_gvec_umin)
- DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
-+DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
-+DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
- #define DO_3SAME_CMP(INSN, COND)                                        \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-     return do_3same(s, a, gen_VMUL_p_3s);
- }
--#define DO_3SAME_GVEC3_NO_SZ_3(INSN, OPARRAY)                           \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
--                       oprsz, maxsz, &OPARRAY[vece]);                   \
--    }                                                                   \
--    DO_3SAME_NO_SZ_3(INSN, gen_##INSN##_3s)
--
--
--DO_3SAME_GVEC3_NO_SZ_3(VMLA, mla_op)
--DO_3SAME_GVEC3_NO_SZ_3(VMLS, mls_op)
--
- #define DO_3SAME_GVEC3_SHIFT(INSN, OPARRAY)                             \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-                                 uint32_t rn_ofs, uint32_t rm_ofs,       \
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_mls_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
- /* Note that while NEON does not support VMLA and VMLS as 64-bit ops,
-  * these tables are shared with AArch64 which does support them.
-  */
-+void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_mul_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fni4 = gen_mla8_i32,
-+          .fniv = gen_mla_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni4 = gen_mla16_i32,
-+          .fniv = gen_mla_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_mla32_i32,
-+          .fniv = gen_mla_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_mla64_i64,
-+          .fniv = gen_mla_vec,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
--static const TCGOpcode vecop_list_mla[] = {
--    INDEX_op_mul_vec, INDEX_op_add_vec, 0
--};
--
--static const TCGOpcode vecop_list_mls[] = {
--    INDEX_op_mul_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen3 mla_op[4] = {
--    { .fni4 = gen_mla8_i32,
--      .fniv = gen_mla_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_8 },
--    { .fni4 = gen_mla16_i32,
--      .fniv = gen_mla_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_16 },
--    { .fni4 = gen_mla32_i32,
--      .fniv = gen_mla_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_32 },
--    { .fni8 = gen_mla64_i64,
--      .fniv = gen_mla_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_mla,
--      .vece = MO_64 },
--};
--
--const GVecGen3 mls_op[4] = {
--    { .fni4 = gen_mls8_i32,
--      .fniv = gen_mls_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_8 },
--    { .fni4 = gen_mls16_i32,
--      .fniv = gen_mls_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_16 },
--    { .fni4 = gen_mls32_i32,
--      .fniv = gen_mls_vec,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_32 },
--    { .fni8 = gen_mls64_i64,
--      .fniv = gen_mls_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .load_dest = true,
--      .opt_opc = vecop_list_mls,
--      .vece = MO_64 },
--};
-+void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                  uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_mul_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fni4 = gen_mls8_i32,
-+          .fniv = gen_mls_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni4 = gen_mls16_i32,
-+          .fniv = gen_mls_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_mls32_i32,
-+          .fniv = gen_mls_vec,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_mls64_i64,
-+          .fniv = gen_mls_vec,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .load_dest = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- /* CMTST : test is "if (X & Y != 0)". */
- static void gen_cmtst_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
---
-.20.1

-[PULL 09/45] target/arm: Swap argument order for VSHL during decode
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Rather than perform the argument swap during code generation,
-perform it during decode.  This means it doesn't have to be
-special cased later, and we can share code with aarch64 code
-generation.  Hopefully the decode comment addresses any confusion
-that might arise in between.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-9-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/neon-dp.decode       | 17 +++++++++++++++--
- target/arm/translate-neon.inc.c |  3 +--
-files changed, 16 insertions(+), 4 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
-+++ b/target/arm/neon-dp.decode
-@@ -XXX,XX +XXX,XX @@ VCGT_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 0 .... @3same
- VCGE_S_3s        1111 001 0 0 . .. .... .... 0011 . . . 1 .... @3same
- VCGE_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 1 .... @3same
--VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same
--VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same
-+# The _rev suffix indicates that Vn and Vm are reversed. This is
-+# the case for shifts. In the Arm ARM these insns are documented
-+# with the Vm and Vn fields in their usual places, but in the
-+# assembly the operands are listed "backwards", ie in the order
-+# Dd, Dm, Dn where other insns use Dd, Dn, Dm. For QEMU we choose
-+# to consider Vm and Vn as being in different fields in the insn,
-+# which allows us to avoid special-casing shifts in the trans_
-+# function code. We would otherwise need to manually swap the operands
-+# over to call Neon helper functions that are shared with AArch64,
-+# which does not have this odd reversed-operand situation.
-+@3same_rev       .... ... . . . size:2 .... .... .... . q:1 . . .... \
-+                 &3same vn=%vm_dp vm=%vn_dp vd=%vd_dp
-+
-+VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same_rev
-+VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
- VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
- VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-                                 uint32_t rn_ofs, uint32_t rm_ofs,       \
-                                 uint32_t oprsz, uint32_t maxsz)         \
-     {                                                                   \
--        /* Note the operation is vshl vd,vm,vn */                       \
--        tcg_gen_gvec_3(rd_ofs, rm_ofs, rn_ofs,                          \
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
-                        oprsz, maxsz, &OPARRAY[vece]);                   \
-     }                                                                   \
-     DO_3SAME(INSN, gen_##INSN##_3s)
---
-.20.1

-[PULL 10/45] target/arm: Create gen_gvec_{cmtst,ushl,sshl}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-10-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |  10 ++-
- target/arm/translate-a64.c      |  18 ++--
- target/arm/translate-neon.inc.c |  23 +----
- target/arm/translate.c          | 146 +++++++++++++++++---------------
-files changed, 95 insertions(+), 102 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_mla(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_mls(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen3 cmtst_op[4];
--extern const GVecGen3 sshl_op[4];
--extern const GVecGen3 ushl_op[4];
-+void gen_gvec_cmtst(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- extern const GVecGen4 uqadd_op[4];
- extern const GVecGen4 sqadd_op[4];
- extern const GVecGen4 uqsub_op[4];
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn4(DisasContext *s, bool is_q, int rd, int rn, int rm,
-             is_q ? 16 : 8, vec_full_reg_size(s));
- }
--/* Expand a 3-operand AdvSIMD vector operation using an op descriptor.  */
--static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
--                         int rn, int rm, const GVecGen3 *gvec_op)
--{
--    tcg_gen_gvec_3(vec_full_reg_offset(s, rd), vec_full_reg_offset(s, rn),
--                   vec_full_reg_offset(s, rm), is_q ? 16 : 8,
--                   vec_full_reg_size(s), gvec_op);
--}
--
- /* Expand a 3-operand operation using an out-of-line helper.  */
- static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
-                              int rn, int rm, int data, gen_helper_gvec_3 *fn)
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-                        (u ? uqsub_op : sqsub_op) + size);
-         return;
-     case 0x08: /* SSHL, USHL */
--        gen_gvec_op3(s, is_q, rd, rn, rm,
--                     u ? &ushl_op[size] : &sshl_op[size]);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_ushl, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sshl, size);
-+        }
-         return;
-     case 0x0c: /* SMAX, UMAX */
-         if (u) {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-         return;
-     case 0x11:
-         if (!u) { /* CMTST */
--            gen_gvec_op3(s, is_q, rd, rn, rm, &cmtst_op[size]);
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_cmtst, size);
-             return;
-         }
-         /* else CMEQ */
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME(VBIC, tcg_gen_gvec_andc)
- DO_3SAME(VORR, tcg_gen_gvec_or)
- DO_3SAME(VORN, tcg_gen_gvec_orc)
- DO_3SAME(VEOR, tcg_gen_gvec_xor)
-+DO_3SAME(VSHL_S, gen_gvec_sshl)
-+DO_3SAME(VSHL_U, gen_gvec_ushl)
- /* These insns are all gvec_bitsel but with the inputs in various orders. */
- #define DO_3SAME_BITSEL(INSN, O1, O2, O3)                               \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMIN_U, tcg_gen_gvec_umin)
- DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
- DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
- DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
-+DO_3SAME_NO_SZ_3(VTST, gen_gvec_cmtst)
- #define DO_3SAME_CMP(INSN, COND)                                        \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_CMP(VCGE_S, TCG_COND_GE)
- DO_3SAME_CMP(VCGE_U, TCG_COND_GEU)
- DO_3SAME_CMP(VCEQ, TCG_COND_EQ)
--static void gen_VTST_3s(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
--                         uint32_t rm_ofs, uint32_t oprsz, uint32_t maxsz)
--{
--    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &cmtst_op[vece]);
--}
--DO_3SAME_NO_SZ_3(VTST, gen_VTST_3s)
--
- #define DO_3SAME_GVEC4(INSN, OPARRAY)                                   \
-     static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-                                 uint32_t rn_ofs, uint32_t rm_ofs,       \
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
-     }
-     return do_3same(s, a, gen_VMUL_p_3s);
- }
--
--#define DO_3SAME_GVEC3_SHIFT(INSN, OPARRAY)                             \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs,                          \
--                       oprsz, maxsz, &OPARRAY[vece]);                   \
--    }                                                                   \
--    DO_3SAME(INSN, gen_##INSN##_3s)
--
--DO_3SAME_GVEC3_SHIFT(VSHL_S, sshl_op)
--DO_3SAME_GVEC3_SHIFT(VSHL_U, ushl_op)
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_cmtst_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-     tcg_gen_cmp_vec(TCG_COND_NE, vece, d, d, a);
- }
--static const TCGOpcode vecop_list_cmtst[] = { INDEX_op_cmp_vec, 0 };
--
--const GVecGen3 cmtst_op[4] = {
--    { .fni4 = gen_helper_neon_tst_u8,
--      .fniv = gen_cmtst_vec,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_8 },
--    { .fni4 = gen_helper_neon_tst_u16,
--      .fniv = gen_cmtst_vec,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_16 },
--    { .fni4 = gen_cmtst_i32,
--      .fniv = gen_cmtst_vec,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_32 },
--    { .fni8 = gen_cmtst_i64,
--      .fniv = gen_cmtst_vec,
--      .prefer_i64 = TCG_TARGET_REG_BITS == 64,
--      .opt_opc = vecop_list_cmtst,
--      .vece = MO_64 },
--};
-+void gen_gvec_cmtst(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = { INDEX_op_cmp_vec, 0 };
-+    static const GVecGen3 ops[4] = {
-+        { .fni4 = gen_helper_neon_tst_u8,
-+          .fniv = gen_cmtst_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fni4 = gen_helper_neon_tst_u16,
-+          .fniv = gen_cmtst_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_cmtst_i32,
-+          .fniv = gen_cmtst_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_cmtst_i64,
-+          .fniv = gen_cmtst_vec,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- void gen_ushl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_ushl_vec(unsigned vece, TCGv_vec dst,
-     tcg_temp_free_vec(rsh);
- }
--static const TCGOpcode ushl_list[] = {
--    INDEX_op_neg_vec, INDEX_op_shlv_vec,
--    INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
--};
--
--const GVecGen3 ushl_op[4] = {
--    { .fniv = gen_ushl_vec,
--      .fno = gen_helper_gvec_ushl_b,
--      .opt_opc = ushl_list,
--      .vece = MO_8 },
--    { .fniv = gen_ushl_vec,
--      .fno = gen_helper_gvec_ushl_h,
--      .opt_opc = ushl_list,
--      .vece = MO_16 },
--    { .fni4 = gen_ushl_i32,
--      .fniv = gen_ushl_vec,
--      .opt_opc = ushl_list,
--      .vece = MO_32 },
--    { .fni8 = gen_ushl_i64,
--      .fniv = gen_ushl_vec,
--      .opt_opc = ushl_list,
--      .vece = MO_64 },
--};
-+void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_neg_vec, INDEX_op_shlv_vec,
-+        INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_ushl_vec,
-+          .fno = gen_helper_gvec_ushl_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_ushl_vec,
-+          .fno = gen_helper_gvec_ushl_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_ushl_i32,
-+          .fniv = gen_ushl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_ushl_i64,
-+          .fniv = gen_ushl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- void gen_sshl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
- {
-@@ -XXX,XX +XXX,XX @@ static void gen_sshl_vec(unsigned vece, TCGv_vec dst,
-     tcg_temp_free_vec(tmp);
- }
--static const TCGOpcode sshl_list[] = {
--    INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
--    INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
--};
--
--const GVecGen3 sshl_op[4] = {
--    { .fniv = gen_sshl_vec,
--      .fno = gen_helper_gvec_sshl_b,
--      .opt_opc = sshl_list,
--      .vece = MO_8 },
--    { .fniv = gen_sshl_vec,
--      .fno = gen_helper_gvec_sshl_h,
--      .opt_opc = sshl_list,
--      .vece = MO_16 },
--    { .fni4 = gen_sshl_i32,
--      .fniv = gen_sshl_vec,
--      .opt_opc = sshl_list,
--      .vece = MO_32 },
--    { .fni8 = gen_sshl_i64,
--      .fniv = gen_sshl_vec,
--      .opt_opc = sshl_list,
--      .vece = MO_64 },
--};
-+void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
-+        INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_sshl_vec,
-+          .fno = gen_helper_gvec_sshl_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_sshl_vec,
-+          .fno = gen_helper_gvec_sshl_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_sshl_i32,
-+          .fniv = gen_sshl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_sshl_i64,
-+          .fniv = gen_sshl_vec,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
---
-.20.1

-[PULL 11/45] target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Provide a functional interface for the vector expansion.
-This fits better with the existing set of helpers that
-we provide for other operations.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-11-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate.h          |  13 +-
- target/arm/translate-a64.c      |  22 ++-
- target/arm/translate-neon.inc.c |  19 +--
- target/arm/translate.c          | 228 +++++++++++++++++---------------
-files changed, 147 insertions(+), 135 deletions(-)
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sshl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_ushl(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
--extern const GVecGen4 uqadd_op[4];
--extern const GVecGen4 sqadd_op[4];
--extern const GVecGen4 uqsub_op[4];
--extern const GVecGen4 sqsub_op[4];
- void gen_cmtst_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_ushl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
- void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_gvec_uqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_uqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- void gen_gvec_ssra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-                    int64_t shift, uint32_t opr_sz, uint32_t max_sz);
- void gen_gvec_usra(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-     switch (opcode) {
-     case 0x01: /* SQADD, UQADD */
--        tcg_gen_gvec_4(vec_full_reg_offset(s, rd),
--                       offsetof(CPUARMState, vfp.qc),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm),
--                       is_q ? 16 : 8, vec_full_reg_size(s),
--                       (u ? uqadd_op : sqadd_op) + size);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uqadd_qc, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqadd_qc, size);
-+        }
-         return;
-     case 0x05: /* SQSUB, UQSUB */
--        tcg_gen_gvec_4(vec_full_reg_offset(s, rd),
--                       offsetof(CPUARMState, vfp.qc),
--                       vec_full_reg_offset(s, rn),
--                       vec_full_reg_offset(s, rm),
--                       is_q ? 16 : 8, vec_full_reg_size(s),
--                       (u ? uqsub_op : sqsub_op) + size);
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uqsub_qc, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sqsub_qc, size);
-+        }
-         return;
-     case 0x08: /* SSHL, USHL */
-         if (u) {
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.inc.c
-+++ b/target/arm/translate-neon.inc.c
-@@ -XXX,XX +XXX,XX @@ DO_3SAME(VORN, tcg_gen_gvec_orc)
- DO_3SAME(VEOR, tcg_gen_gvec_xor)
- DO_3SAME(VSHL_S, gen_gvec_sshl)
- DO_3SAME(VSHL_U, gen_gvec_ushl)
-+DO_3SAME(VQADD_S, gen_gvec_sqadd_qc)
-+DO_3SAME(VQADD_U, gen_gvec_uqadd_qc)
-+DO_3SAME(VQSUB_S, gen_gvec_sqsub_qc)
-+DO_3SAME(VQSUB_U, gen_gvec_uqsub_qc)
- /* These insns are all gvec_bitsel but with the inputs in various orders. */
- #define DO_3SAME_BITSEL(INSN, O1, O2, O3)                               \
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_CMP(VCGE_S, TCG_COND_GE)
- DO_3SAME_CMP(VCGE_U, TCG_COND_GEU)
- DO_3SAME_CMP(VCEQ, TCG_COND_EQ)
--#define DO_3SAME_GVEC4(INSN, OPARRAY)                                   \
--    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
--                                uint32_t rn_ofs, uint32_t rm_ofs,       \
--                                uint32_t oprsz, uint32_t maxsz)         \
--    {                                                                   \
--        tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),           \
--                       rn_ofs, rm_ofs, oprsz, maxsz, &OPARRAY[vece]);   \
--    }                                                                   \
--    DO_3SAME(INSN, gen_##INSN##_3s)
--
--DO_3SAME_GVEC4(VQADD_S, sqadd_op)
--DO_3SAME_GVEC4(VQADD_U, uqadd_op)
--DO_3SAME_GVEC4(VQSUB_S, sqsub_op)
--DO_3SAME_GVEC4(VQSUB_U, uqsub_op)
--
- static void gen_VMUL_p_3s(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                            uint32_t rm_ofs, uint32_t oprsz, uint32_t maxsz)
- {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_uqadd[] = {
--    INDEX_op_usadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
--};
--
--const GVecGen4 uqadd_op[4] = {
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_b,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_8 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_h,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_16 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_s,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_32 },
--    { .fniv = gen_uqadd_vec,
--      .fno = gen_helper_gvec_uqadd_d,
--      .write_aofs = true,
--      .opt_opc = vecop_list_uqadd,
--      .vece = MO_64 },
--};
-+void gen_gvec_uqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_usadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_b,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_h,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_s,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fniv = gen_uqadd_vec,
-+          .fno = gen_helper_gvec_uqadd_d,
-+          .write_aofs = true,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_sqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_sqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_sqadd[] = {
--    INDEX_op_ssadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
--};
--
--const GVecGen4 sqadd_op[4] = {
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_b,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_h,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_s,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_sqadd_vec,
--      .fno = gen_helper_gvec_sqadd_d,
--      .opt_opc = vecop_list_sqadd,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_sqadd_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_ssadd_vec, INDEX_op_cmp_vec, INDEX_op_add_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_sqadd_vec,
-+          .fno = gen_helper_gvec_sqadd_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_uqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_uqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_uqsub[] = {
--    INDEX_op_ussub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen4 uqsub_op[4] = {
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_b,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_h,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_s,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_uqsub_vec,
--      .fno = gen_helper_gvec_uqsub_d,
--      .opt_opc = vecop_list_uqsub,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_uqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_ussub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_uqsub_vec,
-+          .fno = gen_helper_gvec_uqsub_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- static void gen_sqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
-@@ -XXX,XX +XXX,XX @@ static void gen_sqsub_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-     tcg_temp_free_vec(x);
- }
--static const TCGOpcode vecop_list_sqsub[] = {
--    INDEX_op_sssub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
--};
--
--const GVecGen4 sqsub_op[4] = {
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_b,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_8 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_h,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_16 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_s,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_32 },
--    { .fniv = gen_sqsub_vec,
--      .fno = gen_helper_gvec_sqsub_d,
--      .opt_opc = vecop_list_sqsub,
--      .write_aofs = true,
--      .vece = MO_64 },
--};
-+void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                       uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sssub_vec, INDEX_op_cmp_vec, INDEX_op_sub_vec, 0
-+    };
-+    static const GVecGen4 ops[4] = {
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_b,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_h,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_16 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_s,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_32 },
-+        { .fniv = gen_sqsub_vec,
-+          .fno = gen_helper_gvec_sqsub_d,
-+          .opt_opc = vecop_list,
-+          .write_aofs = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_4(rd_ofs, offsetof(CPUARMState, vfp.qc),
-+                   rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
- /* Translate a NEON data processing instruction.  Return nonzero if the
-    instruction is invalid.
---
-.20.1

-[PULL 34/45] target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
+[PULL 27/36] target/arm: In v8.1M, don't set HFSR.FORCED on vector table fetch failures
-Convert the Neon VRHADD and VHSUB 3-reg-same insns to decodetree.
+In v8.1M, vector table fetch failures don't set HFSR.FORCED (see rule
-(These are all the other insns in 3-reg-same which were using
+R_LLRP).  (In previous versions of the architecture this was either
-GEN_NEON_INTEGER_OP() and which are not pairwise or
+required or IMPDEF.)
 reversed-operands.)
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-7-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-18-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       | 6 ++++++
+ target/arm/m_helper.c | 6 +++++-
- target/arm/translate-neon.inc.c | 4 ++++
+file changed, 5 insertions(+), 1 deletion(-)
  target/arm/translate.c          | 8 ++------
 files changed, 12 insertions(+), 6 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/m_helper.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/m_helper.c
-@@ -XXX,XX +XXX,XX @@ VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@ load_fail:
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
+      * The HardFault is Secure if BFHFNMINS is 0 (meaning that all HFs are
- VQADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 1 .... @3same
+      * secure); otherwise it targets the same security state as the
+      * underlying exception.
-+VRHADD_S_3s      1111 001 0 0 . .. .... .... 0001 . . . 0 .... @3same
++     * In v8.1M HardFaults from vector table fetch fails don't set FORCED.
-+VRHADD_U_3s      1111 001 1 0 . .. .... .... 0001 . . . 0 .... @3same
+      */
-+
+     if (!(cpu->env.v7m.aircr & R_V7M_AIRCR_BFHFNMINS_MASK)) {
- @3same_logic     .... ... . . . .. .... .... .... . q:1 .. .... \
+         exc_secure = true;
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp size=0
+     }
+-    env->v7m.hfsr |= R_V7M_HFSR_VECTTBL_MASK | R_V7M_HFSR_FORCED_MASK;
-@@ -XXX,XX +XXX,XX @@ VBSL_3s          1111 001 1 0 . 01 .... .... 0001 ... 1 .... @3same_logic
++    env->v7m.hfsr |= R_V7M_HFSR_VECTTBL_MASK;
- VBIT_3s          1111 001 1 0 . 10 .... .... 0001 ... 1 .... @3same_logic
++    if (!arm_feature(env, ARM_FEATURE_V8_1M)) {
- VBIF_3s          1111 001 1 0 . 11 .... .... 0001 ... 1 .... @3same_logic
++        env->v7m.hfsr |= R_V7M_HFSR_FORCED_MASK;
++    }
-+VHSUB_S_3s       1111 001 0 0 . .. .... .... 0010 . . . 0 .... @3same
+     armv7m_nvic_set_pending_derived(env->nvic, ARMV7M_EXCP_HARD, exc_secure);
-+VHSUB_U_3s       1111 001 1 0 . .. .... .... 0010 . . . 0 .... @3same
+     return false;
-+
+ }
  VQSUB_S_3s       1111 001 0 0 . .. .... .... 0010 . . . 1 .... @3same
  VQSUB_U_3s       1111 001 1 0 . .. .... .... 0010 . . . 1 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
  DO_3SAME_32(VHADD_S, hadd_s)
  DO_3SAME_32(VHADD_U, hadd_u)
 +DO_3SAME_32(VHSUB_S, hsub_s)
 +DO_3SAME_32(VHSUB_U, hsub_u)
 +DO_3SAME_32(VRHADD_S, rhadd_s)
 +DO_3SAME_32(VRHADD_U, rhadd_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
          case NEON_3R_VHADD:
 +        case NEON_3R_VRHADD:
 +        case NEON_3R_VHSUB:
          case NEON_3R_VABD:
          case NEON_3R_VABA:
              /* Already handled by decodetree */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
          switch (op) {
 -        case NEON_3R_VRHADD:
 -            GEN_NEON_INTEGER_OP(rhadd);
 -            break;
 -        case NEON_3R_VHSUB:
 -            GEN_NEON_INTEGER_OP(hsub);
 -            break;
          case NEON_3R_VQSHL:
              GEN_NEON_INTEGER_OP_ENV(qshl);
              break;
 --
 .20.1

-[PULL 33/45] target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
+[PULL 28/36] target/arm: Implement v8.1M REVIDR register
-Convert the Neon VABA and VABD insns in the 3-reg-same group to
+In v8.1M a REVIDR register is defined, which is at address 0xe00ecfc
-decodetree.
+and is a read-only IMPDEF register providing implementation specific
 minor revision information, like the v8A REVIDR_EL1. Implement this.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-6-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-19-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  6 ++++++
+ hw/intc/armv7m_nvic.c | 5 +++++
- target/arm/translate-neon.inc.c |  4 ++++
+file changed, 5 insertions(+)
  target/arm/translate.c          | 22 ++--------------------
 files changed, 12 insertions(+), 20 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/intc/armv7m_nvic.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/intc/armv7m_nvic.c
-@@ -XXX,XX +XXX,XX @@ VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
  VMIN_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 1 .... @3same
  VMIN_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 1 .... @3same
 +VABD_S_3s        1111 001 0 0 . .. .... .... 0111 . . . 0 .... @3same
 +VABD_U_3s        1111 001 1 0 . .. .... .... 0111 . . . 0 .... @3same
 +
 +VABA_S_3s        1111 001 0 0 . .. .... .... 0111 . . . 1 .... @3same
 +VABA_U_3s        1111 001 1 0 . .. .... .... 0111 . . . 1 .... @3same
 +
  VADD_3s          1111 001 0 0 . .. .... .... 1000 . . . 0 .... @3same
  VSUB_3s          1111 001 1 0 . .. .... .... 1000 . . . 0 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_NO_SZ_3(VMUL, tcg_gen_gvec_mul)
  DO_3SAME_NO_SZ_3(VMLA, gen_gvec_mla)
  DO_3SAME_NO_SZ_3(VMLS, gen_gvec_mls)
  DO_3SAME_NO_SZ_3(VTST, gen_gvec_cmtst)
 +DO_3SAME_NO_SZ_3(VABD_S, gen_gvec_sabd)
 +DO_3SAME_NO_SZ_3(VABA_S, gen_gvec_saba)
 +DO_3SAME_NO_SZ_3(VABD_U, gen_gvec_uabd)
 +DO_3SAME_NO_SZ_3(VABA_U, gen_gvec_uaba)
  #define DO_3SAME_CMP(INSN, COND)                                        \
      static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              /* VQRDMLSH : handled by decodetree */
              return 1;
 -        case NEON_3R_VABD:
 -            if (u) {
 -                gen_gvec_uabd(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            } else {
 -                gen_gvec_sabd(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            }
 -            return 0;
 -
 -        case NEON_3R_VABA:
 -            if (u) {
 -                gen_gvec_uaba(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            } else {
 -                gen_gvec_saba(size, rd_ofs, rn_ofs, rm_ofs,
 -                              vec_size, vec_size);
 -            }
 -            return 0;
 -
          case NEON_3R_VADD_VSUB:
          case NEON_3R_LOGIC:
          case NEON_3R_VMAX:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
          case NEON_3R_VHADD:
 +        case NEON_3R_VABD:
 +        case NEON_3R_VABA:
              /* Already handled by decodetree */
              return 1;
          }
+         return val;
+     }
++    case 0xcfc:
++        if (!arm_feature(&cpu->env, ARM_FEATURE_V8_1M)) {
++            goto bad_offset;
++        }
++        return cpu->revidr;
+     case 0xd00: /* CPUID Base.  */
+         return cpu->midr;
+     case 0xd04: /* Interrupt Control State (ICSR) */
 --
 .20.1

-[PULL 32/45] target/arm: Convert Neon VHADD 3-reg-same insns
+[PULL 29/36] target/arm: Implement new v8.1M NOCP check for exception return
-Convert the Neon VHADD insns in the 3-reg-same group to decodetree.
+In v8.1M a new exception return check is added which may cause a NOCP
 UsageFault (see rule R_XLTP): before we clear s0..s15 and the FPSCR
 we must check whether access to CP10 from the Security state of the
 returning exception is disabled; if it is then we must take a fault.
 (Note that for our implementation CPPWR is always RAZ/WI and so can
 never cause CP10 accesses to fail.)
 The other v8.1M change to this register-clearing code is that if MVE
 is implemented VPR must also be cleared, so add a TODO comment to
 that effect.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-5-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-20-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  2 ++
+ target/arm/m_helper.c | 22 +++++++++++++++++++++-
- target/arm/translate-neon.inc.c | 24 ++++++++++++++++++++++++
+file changed, 21 insertions(+), 1 deletion(-)
  target/arm/translate.c          |  4 +---
 files changed, 27 insertions(+), 3 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/m_helper.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/m_helper.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void do_v7m_exception_exit(ARMCPU *cpu)
- @3same           .... ... . . . size:2 .... .... .... . q:1 . . .... \
+             v7m_exception_taken(cpu, excret, true, false);
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
+             return;
+         } else {
-+VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
+-            /* Clear s0..s15 and FPSCR */
-+VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
++            if (arm_feature(env, ARM_FEATURE_V8_1M)) {
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
++                /* v8.1M adds this NOCP check */
- VQADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 1 .... @3same
++                bool nsacr_pass = exc_secure ||
++                    extract32(env->v7m.nsacr, 10, 1);
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++                bool cpacr_pass = v7m_cpacr_pass(env, exc_secure, true);
-index XXXXXXX..XXXXXXX 100644
++                if (!nsacr_pass) {
---- a/target/arm/translate-neon.inc.c
++                    armv7m_nvic_set_pending(env->nvic, ARMV7M_EXCP_USAGE, true);
-+++ b/target/arm/translate-neon.inc.c
++                    env->v7m.cfsr[M_REG_S] |= R_V7M_CFSR_NOCP_MASK;
-@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQSHL_S64, gen_helper_neon_qshl_s64)
++                    qemu_log_mask(CPU_LOG_INT, "...taking UsageFault on existing "
- DO_3SAME_64_ENV(VQSHL_U64, gen_helper_neon_qshl_u64)
++                        "stackframe: NSACR prevents clearing FPU registers\n");
- DO_3SAME_64_ENV(VQRSHL_S64, gen_helper_neon_qrshl_s64)
++                    v7m_exception_taken(cpu, excret, true, false);
- DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
++                } else if (!cpacr_pass) {
-+
++                    armv7m_nvic_set_pending(env->nvic, ARMV7M_EXCP_USAGE,
-+#define DO_3SAME_32(INSN, FUNC)                                         \
++                                            exc_secure);
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
++                    env->v7m.cfsr[exc_secure] |= R_V7M_CFSR_NOCP_MASK;
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
++                    qemu_log_mask(CPU_LOG_INT, "...taking UsageFault on existing "
-+                                uint32_t oprsz, uint32_t maxsz)         \
++                        "stackframe: CPACR prevents clearing FPU registers\n");
-+    {                                                                   \
++                    v7m_exception_taken(cpu, excret, true, false);
-+        static const GVecGen3 ops[4] = {                                \
++                }
-+            { .fni4 = gen_helper_neon_##FUNC##8 },                      \
++            }
-+            { .fni4 = gen_helper_neon_##FUNC##16 },                     \
++            /* Clear s0..s15 and FPSCR; TODO also VPR when MVE is implemented */
-+            { .fni4 = gen_helper_neon_##FUNC##32 },                     \
+             int i;
-+            { 0 },                                                      \
-+        };                                                              \
+             for (i = 0; i < 16; i += 2) {
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece]); \
 +    }                                                                   \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        if (a->size > 2) {                                              \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
 +DO_3SAME_32(VHADD_S, hadd_s)
 +DO_3SAME_32(VHADD_U, hadd_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VML:
          case NEON_3R_VSHL:
          case NEON_3R_SHA:
 +        case NEON_3R_VHADD:
              /* Already handled by decodetree */
              return 1;
          }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
          switch (op) {
 -        case NEON_3R_VHADD:
 -            GEN_NEON_INTEGER_OP(hadd);
 -            break;
          case NEON_3R_VRHADD:
              GEN_NEON_INTEGER_OP(rhadd);
              break;
 --
 .20.1

-[PULL 29/45] target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
+[PULL 30/36] target/arm: Implement new v8.1M VLLDM and VLSTM encodings
-Convert the Neon VQRDMLAH and VQRDMLSH insns in the 3-reg-same group
+v8.1M adds new encodings of VLLDM and VLSTM (where bit 7 is set).
-to decodetree.  These don't use do_3same() because they want to
+The only difference is that:
-operate on VFP double registers, whose offsets are different from the
+ * the old T1 encodings UNDEF if the implementation implements 32
-neon_reg_offset() calculations do_3same does.
+   Dregs (this is currently architecturally impossible for M-profile)
  * the new T2 encodings have the implementation-defined option to
    read from memory (discarding the data) or write UNKNOWN values to
    memory for the stack slots that would be D16-D31
 We choose not to make those accesses, so for us the two
 instructions behave identically assuming they don't UNDEF.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-2-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-21-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  3 +++
+ target/arm/m-nocp.decode       |  2 +-
- target/arm/translate-neon.inc.c | 15 +++++++++++++++
+ target/arm/translate-vfp.c.inc | 25 +++++++++++++++++++++++++
- target/arm/translate.c          | 14 ++------------
+files changed, 26 insertions(+), 1 deletion(-)
 files changed, 20 insertions(+), 12 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/m-nocp.decode b/target/arm/m-nocp.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/m-nocp.decode
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/m-nocp.decode
-@@ -XXX,XX +XXX,XX @@ VMLS_3s          1111 001 1 0 . .. .... .... 1001 . . . 0 .... @3same
+@@ -XXX,XX +XXX,XX @@
- VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
+ {
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
+   # Special cases which do not take an early NOCP: VLLDM and VLSTM
 -  VLLDM_VLSTM  1110 1100 001 l:1 rn:4 0000 1010 0000 0000
 +  VLLDM_VLSTM  1110 1100 001 l:1 rn:4 0000 1010 op:1 000 0000
    # VSCCLRM (new in v8.1M) is similar:
    VSCCLRM      1110 1100 1.01 1111 .... 1011 imm:7 0   vd=%vd_dp size=3
    VSCCLRM      1110 1100 1.01 1111 .... 1010 imm:8     vd=%vd_sp size=2
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VLLDM_VLSTM(DisasContext *s, arg_VLLDM_VLSTM *a)
          !arm_dc_feature(s, ARM_FEATURE_V8)) {
          return false;
      }
 +
-+VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
++    if (a->op) {
-+VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
++        /*
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++         * T2 encoding ({D0-D31} reglist): v8.1M and up. We choose not
-index XXXXXXX..XXXXXXX 100644
++         * to take the IMPDEF option to make memory accesses to the stack
---- a/target/arm/translate-neon.inc.c
++         * slots that correspond to the D16-D31 registers (discarding
-+++ b/target/arm/translate-neon.inc.c
++         * read data and writing UNKNOWN values), so for us the T2
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
++         * encoding behaves identically to the T1 encoding.
-     }
++         */
-     return do_3same(s, a, gen_VMUL_p_3s);
++        if (!arm_dc_feature(s, ARM_FEATURE_V8_1M)) {
- }
++            return false;
-+
++        }
-+#define DO_VQRDMLAH(INSN, FUNC)                                         \
++    } else {
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
++        /*
-+    {                                                                   \
++         * T1 encoding ({D0-D15} reglist); undef if we have 32 Dregs.
-+        if (!dc_isar_feature(aa32_rdm, s)) {                            \
++         * This is currently architecturally impossible, but we add the
-+            return false;                                               \
++         * check to stay in line with the pseudocode. Note that we must
-+        }                                                               \
++         * emit code for the UNDEF so it takes precedence over the NOCP.
-+        if (a->size != 1 && a->size != 2) {                             \
++         */
-+            return false;                                               \
++        if (dc_isar_feature(aa32_simd_r32, s)) {
-+        }                                                               \
++            unallocated_encoding(s);
-+        return do_3same(s, a, FUNC);                                    \
++            return true;
 +        }
 +    }
 +
-+DO_VQRDMLAH(VQRDMLAH, gen_gvec_sqrdmlah_qc)
+     /*
-+DO_VQRDMLAH(VQRDMLSH, gen_gvec_sqrdmlsh_qc)
+      * If not secure, UNDEF. We must emit code for this
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+      * rather than returning false so that this takes
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              if (!u) {
                  break;  /* VPADD */
              }
 -            /* VQRDMLAH */
 -            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
 -                gen_gvec_sqrdmlah_qc(size, rd_ofs, rn_ofs, rm_ofs,
 -                                     vec_size, vec_size);
 -                return 0;
 -            }
 +            /* VQRDMLAH : handled by decodetree */
              return 1;
          case NEON_3R_VFM_VQRDMLSH:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  }
                  break;
              }
 -            /* VQRDMLSH */
 -            if (dc_isar_feature(aa32_rdm, s) && (size == 1 || size == 2)) {
 -                gen_gvec_sqrdmlsh_qc(size, rd_ofs, rn_ofs, rm_ofs,
 -                                     vec_size, vec_size);
 -                return 0;
 -            }
 +            /* VQRDMLSH : handled by decodetree */
              return 1;
          case NEON_3R_VABD:
 --
 .20.1

-[PULL 31/45] target/arm: Convert Neon 64-bit element 3-reg-same insns
+[PULL 31/36] hw/intc/armv7m_nvic: Support v8.1M CCR.TRD bit
-Convert the 64-bit element insns in the 3-reg-same group
+v8.1M introduces a new TRD flag in the CCR register, which enables
-to decodetree. This covers VQSHL, VRSHL and VQRSHL where
+checking for stack frame integrity signatures on SG instructions.
-size==0b11.
+This bit is not banked, and is always RAZ/WI to Non-secure code.
 Adjust the code for handling CCR reads and writes to handle this.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-4-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-23-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       | 13 +++++++++++
+ target/arm/cpu.h      |  2 ++
- target/arm/translate-neon.inc.c | 24 +++++++++++++++++++++
+ hw/intc/armv7m_nvic.c | 26 ++++++++++++++++++--------
- target/arm/translate.c          | 38 ++-------------------------------
+files changed, 20 insertions(+), 8 deletions(-)
 files changed, 39 insertions(+), 36 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/cpu.h
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ VCGE_U_3s        1111 001 1 0 . .. .... .... 0011 . . . 1 .... @3same
+@@ -XXX,XX +XXX,XX @@ FIELD(V7M_CCR, STKOFHFNMIGN, 10, 1)
- VSHL_S_3s        1111 001 0 0 . .. .... .... 0100 . . . 0 .... @3same_rev
+ FIELD(V7M_CCR, DC, 16, 1)
- VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
+ FIELD(V7M_CCR, IC, 17, 1)
+ FIELD(V7M_CCR, BP, 18, 1)
-+# Insns operating on 64-bit elements (size!=0b11 handled elsewhere)
++FIELD(V7M_CCR, LOB, 19, 1)
-+# The _rev suffix indicates that Vn and Vm are reversed (as explained
++FIELD(V7M_CCR, TRD, 20, 1)
-+# by the comment for the @3same_rev format).
-+@3same_64_rev    .... ... . . . 11 .... .... .... . q:1 . . .... \
+ /* V7M SCR bits */
-+                 &3same vm=%vn_dp vn=%vm_dp vd=%vd_dp size=3
+ FIELD(V7M_SCR, SLEEPONEXIT, 1, 1)
 diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/armv7m_nvic.c
 +++ b/hw/intc/armv7m_nvic.c
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
          }
          return cpu->env.v7m.scr[attrs.secure];
      case 0xd14: /* Configuration Control.  */
 -        /* The BFHFNMIGN bit is the only non-banked bit; we
 -         * keep it in the non-secure copy of the register.
 +        /*
 +         * Non-banked bits: BFHFNMIGN (stored in the NS copy of the register)
 +         * and TRD (stored in the S copy of the register)
           */
          val = cpu->env.v7m.ccr[attrs.secure];
          val |= cpu->env.v7m.ccr[M_REG_NS] & R_V7M_CCR_BFHFNMIGN_MASK;
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
          cpu->env.v7m.scr[attrs.secure] = value;
          break;
      case 0xd14: /* Configuration Control.  */
 +    {
 +        uint32_t mask;
 +
-+VQSHL_S64_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+         if (!arm_feature(&cpu->env, ARM_FEATURE_M_MAIN)) {
-+VQSHL_U64_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+             goto bad_offset;
 +VRSHL_S64_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
 +VRSHL_U64_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
 +VQRSHL_S64_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
 +VQRSHL_U64_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
 +
  VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
  VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
  VMIN_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 1 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_SHA256SU1_3s(DisasContext *s, arg_SHA256SU1_3s *a)
      return true;
  }
 +
 +#define DO_3SAME_64(INSN, FUNC)                                         \
 +    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 +                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 +                                uint32_t oprsz, uint32_t maxsz)         \
 +    {                                                                   \
 +        static const GVecGen3 op = { .fni8 = FUNC };                    \
 +        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &op);      \
 +    }                                                                   \
 +    DO_3SAME(INSN, gen_##INSN##_3s)
 +
 +#define DO_3SAME_64_ENV(INSN, FUNC)                                     \
 +    static void gen_##INSN##_elt(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m)    \
 +    {                                                                   \
 +        FUNC(d, cpu_env, n, m);                                         \
 +    }                                                                   \
 +    DO_3SAME_64(INSN, gen_##INSN##_elt)
 +
 +DO_3SAME_64(VRSHL_S64, gen_helper_neon_rshl_s64)
 +DO_3SAME_64(VRSHL_U64, gen_helper_neon_rshl_u64)
 +DO_3SAME_64_ENV(VQSHL_S64, gen_helper_neon_qshl_s64)
 +DO_3SAME_64_ENV(VQSHL_U64, gen_helper_neon_qshl_u64)
 +DO_3SAME_64_ENV(VQRSHL_S64, gen_helper_neon_qrshl_s64)
 +DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          }
-         if (size == 3) {
+         /* Enforce RAZ/WI on reserved and must-RAZ/WI bits */
--            /* 64-bit element instructions. */
+-        value &= (R_V7M_CCR_STKALIGN_MASK |
--            for (pass = 0; pass < (q ? 2 : 1); pass++) {
+-                  R_V7M_CCR_BFHFNMIGN_MASK |
--                neon_load_reg64(cpu_V0, rn + pass);
+-                  R_V7M_CCR_DIV_0_TRP_MASK |
--                neon_load_reg64(cpu_V1, rm + pass);
+-                  R_V7M_CCR_UNALIGN_TRP_MASK |
--                switch (op) {
+-                  R_V7M_CCR_USERSETMPEND_MASK |
--                case NEON_3R_VQSHL:
+-                  R_V7M_CCR_NONBASETHRDENA_MASK);
--                    if (u) {
++        mask = R_V7M_CCR_STKALIGN_MASK |
--                        gen_helper_neon_qshl_u64(cpu_V0, cpu_env,
++            R_V7M_CCR_BFHFNMIGN_MASK |
--                                                 cpu_V1, cpu_V0);
++            R_V7M_CCR_DIV_0_TRP_MASK |
--                    } else {
++            R_V7M_CCR_UNALIGN_TRP_MASK |
--                        gen_helper_neon_qshl_s64(cpu_V0, cpu_env,
++            R_V7M_CCR_USERSETMPEND_MASK |
--                                                 cpu_V1, cpu_V0);
++            R_V7M_CCR_NONBASETHRDENA_MASK;
--                    }
++        if (arm_feature(&cpu->env, ARM_FEATURE_V8_1M) && attrs.secure) {
--                    break;
++            /* TRD is always RAZ/WI from NS */
--                case NEON_3R_VRSHL:
++            mask |= R_V7M_CCR_TRD_MASK;
--                    if (u) {
++        }
--                        gen_helper_neon_rshl_u64(cpu_V0, cpu_V1, cpu_V0);
++        value &= mask;
--                    } else {
--                        gen_helper_neon_rshl_s64(cpu_V0, cpu_V1, cpu_V0);
+         if (arm_feature(&cpu->env, ARM_FEATURE_V8)) {
--                    }
+             /* v8M makes NONBASETHRDENA and STKALIGN be RES1 */
--                    break;
+@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
--                case NEON_3R_VQRSHL:
--                    if (u) {
+         cpu->env.v7m.ccr[attrs.secure] = value;
--                        gen_helper_neon_qrshl_u64(cpu_V0, cpu_env,
+         break;
--                                                  cpu_V1, cpu_V0);
++    }
--                    } else {
+     case 0xd24: /* System Handler Control and State (SHCSR) */
--                        gen_helper_neon_qrshl_s64(cpu_V0, cpu_env,
+         if (!arm_feature(&cpu->env, ARM_FEATURE_V7)) {
--                                                  cpu_V1, cpu_V0);
+             goto bad_offset;
 -                    }
 -                    break;
 -                default:
 -                    abort();
 -                }
 -                neon_store_reg64(cpu_V0, rd + pass);
 -            }
 -            return 0;
 +            /* 64-bit element instructions: handled by decodetree */
 +            return 1;
          }
          pairwise = 0;
          switch (op) {
 --
 .20.1

-[PULL 30/45] target/arm: Convert Neon 3-reg-same SHA to decodetree
+[PULL 32/36] target/arm: Implement CCR_S.TRD behaviour for SG insns
-Convert the Neon SHA instructions in the 3-reg-same group
+v8.1M introduces a new TRD flag in the CCR register, which enables
-to decodetree.
+checking for stack frame integrity signatures on SG instructions.
 Add the code in the SG insn implementation for the new behaviour.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-3-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-24-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  10 +++
+ target/arm/m_helper.c | 86 +++++++++++++++++++++++++++++++++++++++++++
- target/arm/translate-neon.inc.c | 139 ++++++++++++++++++++++++++++++++
+file changed, 86 insertions(+)
  target/arm/translate.c          |  46 +----------
 files changed, 151 insertions(+), 44 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/target/arm/m_helper.c
-+++ b/target/arm/neon-dp.decode
++++ b/target/arm/m_helper.c
-@@ -XXX,XX +XXX,XX @@ VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
+@@ -XXX,XX +XXX,XX @@ static bool v7m_read_half_insn(ARMCPU *cpu, ARMMMUIdx mmu_idx,
- VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
+     return true;
+ }
- VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
 +static bool v7m_read_sg_stack_word(ARMCPU *cpu, ARMMMUIdx mmu_idx,
 +                                   uint32_t addr, uint32_t *spdata)
 +{
 +    /*
 +     * Read a word of data from the stack for the SG instruction,
 +     * writing the value into *spdata. If the load succeeds, return
 +     * true; otherwise pend an appropriate exception and return false.
 +     * (We can't use data load helpers here that throw an exception
 +     * because of the context we're called in, which is halfway through
 +     * arm_v7m_cpu_do_interrupt().)
 +     */
 +    CPUState *cs = CPU(cpu);
 +    CPUARMState *env = &cpu->env;
 +    MemTxAttrs attrs = {};
 +    MemTxResult txres;
 +    target_ulong page_size;
 +    hwaddr physaddr;
 +    int prot;
 +    ARMMMUFaultInfo fi = {};
 +    ARMCacheAttrs cacheattrs = {};
 +    uint32_t value;
 +
-+SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
++    if (get_phys_addr(env, addr, MMU_DATA_LOAD, mmu_idx, &physaddr,
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
++                      &attrs, &prot, &page_size, &fi, &cacheattrs)) {
-+SHA256H_3s       1111 001 1 0 . 00 .... .... 1100 . 1 . 0 .... \
++        /* MPU/SAU lookup failed */
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
++        if (fi.type == ARMFault_QEMU_SFault) {
-+SHA256H2_3s      1111 001 1 0 . 01 .... .... 1100 . 1 . 0 .... \
++            qemu_log_mask(CPU_LOG_INT,
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
++                          "...SecureFault during stack word read\n");
-+SHA256SU1_3s     1111 001 1 0 . 10 .... .... 1100 . 1 . 0 .... \
++            env->v7m.sfsr |= R_V7M_SFSR_AUVIOL_MASK | R_V7M_SFSR_SFARVALID_MASK;
-+                 vm=%vm_dp vn=%vn_dp vd=%vd_dp
++            env->v7m.sfar = addr;
-+
++            armv7m_nvic_set_pending(env->nvic, ARMV7M_EXCP_SECURE, false);
- VQRDMLSH_3s      1111 001 1 0 . .. .... .... 1100 ... 1 .... @3same
++        } else {
-diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
++            qemu_log_mask(CPU_LOG_INT,
-index XXXXXXX..XXXXXXX 100644
++                          "...MemManageFault during stack word read\n");
---- a/target/arm/translate-neon.inc.c
++            env->v7m.cfsr[M_REG_S] |= R_V7M_CFSR_DACCVIOL_MASK |
-+++ b/target/arm/translate-neon.inc.c
++                R_V7M_CFSR_MMARVALID_MASK;
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_p_3s(DisasContext *s, arg_3same *a)
++            env->v7m.mmfar[M_REG_S] = addr;
++            armv7m_nvic_set_pending(env->nvic, ARMV7M_EXCP_MEM, false);
- DO_VQRDMLAH(VQRDMLAH, gen_gvec_sqrdmlah_qc)
++        }
- DO_VQRDMLAH(VQRDMLSH, gen_gvec_sqrdmlsh_qc)
++        return false;
-+
++    }
-+static bool trans_SHA1_3s(DisasContext *s, arg_SHA1_3s *a)
++    value = address_space_ldl(arm_addressspace(cs, attrs), physaddr,
-+{
++                              attrs, &txres);
-+    TCGv_ptr ptr1, ptr2, ptr3;
++    if (txres != MEMTX_OK) {
-+    TCGv_i32 tmp;
++        /* BusFault trying to read the data */
-+
++        qemu_log_mask(CPU_LOG_INT,
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
++                      "...BusFault during stack word read\n");
-+        !dc_isar_feature(aa32_sha1, s)) {
++        env->v7m.cfsr[M_REG_NS] |=
 +            (R_V7M_CFSR_PRECISERR_MASK | R_V7M_CFSR_BFARVALID_MASK);
 +        env->v7m.bfar = addr;
 +        armv7m_nvic_set_pending(env->nvic, ARMV7M_EXCP_BUS, false);
 +        return false;
 +    }
 +
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
++    *spdata = value;
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    ptr1 = vfp_reg_ptr(true, a->vd);
 +    ptr2 = vfp_reg_ptr(true, a->vn);
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    tmp = tcg_const_i32(a->optype);
 +    gen_helper_crypto_sha1_3reg(ptr1, ptr2, ptr3, tmp);
 +    tcg_temp_free_i32(tmp);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 +
-+static bool trans_SHA256H_3s(DisasContext *s, arg_SHA256H_3s *a)
+ static bool v7m_handle_execute_nsc(ARMCPU *cpu)
-+{
+ {
-+    TCGv_ptr ptr1, ptr2, ptr3;
+     /*
@@ -XXX,XX +XXX,XX @@ static bool v7m_handle_execute_nsc(ARMCPU *cpu)
       */
      qemu_log_mask(CPU_LOG_INT, "...really an SG instruction at 0x%08" PRIx32
                    ", executing it\n", env->regs[15]);
 +
-+    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
++    if (cpu_isar_feature(aa32_m_sec_state, cpu) &&
-+        !dc_isar_feature(aa32_sha2, s)) {
++        !arm_v7m_is_handler_mode(env)) {
-+        return false;
++        /*
 +         * v8.1M exception stack frame integrity check. Note that we
 +         * must perform the memory access even if CCR_S.TRD is zero
 +         * and we aren't going to check what the data loaded is.
 +         */
 +        uint32_t spdata, sp;
 +
 +        /*
 +         * We know we are currently NS, so the S stack pointers must be
 +         * in other_ss_{psp,msp}, not in regs[13]/other_sp.
 +         */
 +        sp = v7m_using_psp(env) ? env->v7m.other_ss_psp : env->v7m.other_ss_msp;
 +        if (!v7m_read_sg_stack_word(cpu, mmu_idx, sp, &spdata)) {
 +            /* Stack access failed and an exception has been pended */
 +            return false;
 +        }
 +
 +        if (env->v7m.ccr[M_REG_S] & R_V7M_CCR_TRD_MASK) {
 +            if (((spdata & ~1) == 0xfefa125a) ||
 +                !(env->v7m.control[M_REG_S] & 1)) {
 +                goto gen_invep;
 +            }
 +        }
 +    }
 +
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
+     env->regs[14] &= ~1;
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+     env->v7m.control[M_REG_S] &= ~R_V7M_CONTROL_SFPA_MASK;
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
+     switch_v7m_security_state(env, true);
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    ptr1 = vfp_reg_ptr(true, a->vd);
 +    ptr2 = vfp_reg_ptr(true, a->vn);
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    gen_helper_crypto_sha256h(ptr1, ptr2, ptr3);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 +
 +static bool trans_SHA256H2_3s(DisasContext *s, arg_SHA256H2_3s *a)
 +{
 +    TCGv_ptr ptr1, ptr2, ptr3;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 +        !dc_isar_feature(aa32_sha2, s)) {
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    ptr1 = vfp_reg_ptr(true, a->vd);
 +    ptr2 = vfp_reg_ptr(true, a->vn);
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    gen_helper_crypto_sha256h2(ptr1, ptr2, ptr3);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 +
 +static bool trans_SHA256SU1_3s(DisasContext *s, arg_SHA256SU1_3s *a)
 +{
 +    TCGv_ptr ptr1, ptr2, ptr3;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 +        !dc_isar_feature(aa32_sha2, s)) {
 +        return false;
 +    }
 +
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
 +        return false;
 +    }
 +
 +    if ((a->vn | a->vm | a->vd) & 1) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    ptr1 = vfp_reg_ptr(true, a->vd);
 +    ptr2 = vfp_reg_ptr(true, a->vn);
 +    ptr3 = vfp_reg_ptr(true, a->vm);
 +    gen_helper_crypto_sha256su1(ptr1, ptr2, ptr3);
 +    tcg_temp_free_ptr(ptr1);
 +    tcg_temp_free_ptr(ptr2);
 +    tcg_temp_free_ptr(ptr3);
 +
 +    return true;
 +}
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
      int vec_size;
      uint32_t imm;
      TCGv_i32 tmp, tmp2, tmp3, tmp4, tmp5;
 -    TCGv_ptr ptr1, ptr2, ptr3;
 +    TCGv_ptr ptr1, ptr2;
      TCGv_i64 tmp64;
      if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              return 1;
          }
          switch (op) {
 -        case NEON_3R_SHA:
 -            /* The SHA-1/SHA-256 3-register instructions require special
 -             * treatment here, as their size field is overloaded as an
 -             * op type selector, and they all consume their input in a
 -             * single pass.
 -             */
 -            if (!q) {
 -                return 1;
 -            }
 -            if (!u) { /* SHA-1 */
 -                if (!dc_isar_feature(aa32_sha1, s)) {
 -                    return 1;
 -                }
 -                ptr1 = vfp_reg_ptr(true, rd);
 -                ptr2 = vfp_reg_ptr(true, rn);
 -                ptr3 = vfp_reg_ptr(true, rm);
 -                tmp4 = tcg_const_i32(size);
 -                gen_helper_crypto_sha1_3reg(ptr1, ptr2, ptr3, tmp4);
 -                tcg_temp_free_i32(tmp4);
 -            } else { /* SHA-256 */
 -                if (!dc_isar_feature(aa32_sha2, s) || size == 3) {
 -                    return 1;
 -                }
 -                ptr1 = vfp_reg_ptr(true, rd);
 -                ptr2 = vfp_reg_ptr(true, rn);
 -                ptr3 = vfp_reg_ptr(true, rm);
 -                switch (size) {
 -                case 0:
 -                    gen_helper_crypto_sha256h(ptr1, ptr2, ptr3);
 -                    break;
 -                case 1:
 -                    gen_helper_crypto_sha256h2(ptr1, ptr2, ptr3);
 -                    break;
 -                case 2:
 -                    gen_helper_crypto_sha256su1(ptr1, ptr2, ptr3);
 -                    break;
 -                }
 -            }
 -            tcg_temp_free_ptr(ptr1);
 -            tcg_temp_free_ptr(ptr2);
 -            tcg_temp_free_ptr(ptr3);
 -            return 0;
 -
          case NEON_3R_VPADD_VQRDMLAH:
              if (!u) {
                  break;  /* VPADD */
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VMUL:
          case NEON_3R_VML:
          case NEON_3R_VSHL:
 +        case NEON_3R_SHA:
              /* Already handled by decodetree */
              return 1;
          }
 --
 .20.1

-[PULL 35/45] target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
+[PULL 33/36] hw/intc/armv7m_nvic: Fix "return from inactive handler" check
-Convert the VQSHL, VRSHL and VQRSHL insns in the 3-reg-same
+In commit 077d7449100d824a4 we added code to handle the v8M
-group to decodetree. We have already implemented the size==0b11
+requirement that returns from NMI or HardFault forcibly deactivate
-case of these insns; this commit handles the remaining sizes.
+those exceptions regardless of what interrupt the guest is trying to
 deactivate.  Unfortunately this broke the handling of the "illegal
 exception return because the returning exception number is not
 active" check for those cases.  In the pseudocode this test is done
 on the exception the guest asks to return from, but because our
 implementation was doing this in armv7m_nvic_complete_irq() after the
 new "deactivate NMI/HardFault regardless" code we ended up doing the
 test on the VecInfo for that exception instead, which usually meant
 failing to raise the illegal exception return fault.
 In the case for "configurable exception targeting the opposite
 security state" we detected the illegal-return case but went ahead
 and deactivated the VecInfo anyway, which is wrong because that is
 the VecInfo for the other security state.
 Rearrange the code so that we first identify the illegal return
 cases, then see if we really need to deactivate NMI or HardFault
 instead, and finally do the deactivation.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-8-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-25-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       | 30 ++++++++++++++++++-----
+ hw/intc/armv7m_nvic.c | 59 +++++++++++++++++++++++--------------------
- target/arm/translate-neon.inc.c | 43 +++++++++++++++++++++++++++++++++
+file changed, 32 insertions(+), 27 deletions(-)
  target/arm/translate.c          | 22 +++--------------
 files changed, 70 insertions(+), 25 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/hw/intc/armv7m_nvic.c
-+++ b/target/arm/neon-dp.decode
++++ b/hw/intc/armv7m_nvic.c
-@@ -XXX,XX +XXX,XX @@ VSHL_U_3s        1111 001 1 0 . .. .... .... 0100 . . . 0 .... @3same_rev
+@@ -XXX,XX +XXX,XX @@ int armv7m_nvic_complete_irq(void *opaque, int irq, bool secure)
- @3same_64_rev    .... ... . . . 11 .... .... .... . q:1 . . .... \
+ {
-                  &3same vm=%vn_dp vn=%vm_dp vd=%vd_dp size=3
+     NVICState *s = (NVICState *)opaque;
+     VecInfo *vec = NULL;
--VQSHL_S64_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
+-    int ret;
--VQSHL_U64_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
++    int ret = 0;
--VRSHL_S64_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
--VRSHL_U64_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
+     assert(irq > ARMV7M_EXCP_RESET && irq < s->num_irq);
--VQRSHL_S64_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
--VQRSHL_U64_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
++    trace_nvic_complete_irq(irq, secure);
-+{
++
-+  VQSHL_S64_3s   1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
++    if (secure && exc_is_banked(irq)) {
-+  VQSHL_S_3s     1111 001 0 0 . .. .... .... 0100 . . . 1 .... @3same_rev
++        vec = &s->sec_vectors[irq];
-+}
++    } else {
-+{
++        vec = &s->vectors[irq];
 +  VQSHL_U64_3s   1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_64_rev
 +  VQSHL_U_3s     1111 001 1 0 . .. .... .... 0100 . . . 1 .... @3same_rev
 +}
 +{
 +  VRSHL_S64_3s   1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
 +  VRSHL_S_3s     1111 001 0 0 . .. .... .... 0101 . . . 0 .... @3same_rev
 +}
 +{
 +  VRSHL_U64_3s   1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_64_rev
 +  VRSHL_U_3s     1111 001 1 0 . .. .... .... 0101 . . . 0 .... @3same_rev
 +}
 +{
 +  VQRSHL_S64_3s  1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
 +  VQRSHL_S_3s    1111 001 0 0 . .. .... .... 0101 . . . 1 .... @3same_rev
 +}
 +{
 +  VQRSHL_U64_3s  1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_64_rev
 +  VQRSHL_U_3s    1111 001 1 0 . .. .... .... 0101 . . . 1 .... @3same_rev
 +}
  VMAX_S_3s        1111 001 0 0 . .. .... .... 0110 . . . 0 .... @3same
  VMAX_U_3s        1111 001 1 0 . .. .... .... 0110 . . . 0 .... @3same
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_64_ENV(VQRSHL_U64, gen_helper_neon_qrshl_u64)
          return do_3same(s, a, gen_##INSN##_3s);                         \
      }
 +/*
 + * Some helper functions need to be passed the cpu_env. In order
 + * to use those with the gvec APIs like tcg_gen_gvec_3() we need
 + * to create wrapper functions whose prototype is a NeonGenTwoOpFn()
 + * and which call a NeonGenTwoOpEnvFn().
 + */
 +#define WRAP_ENV_FN(WRAPNAME, FUNC)                                     \
 +    static void WRAPNAME(TCGv_i32 d, TCGv_i32 n, TCGv_i32 m)            \
 +    {                                                                   \
 +        FUNC(d, cpu_env, n, m);                                         \
 +    }
 +
-+#define DO_3SAME_32_ENV(INSN, FUNC)                                     \
++    /*
-+    WRAP_ENV_FN(gen_##INSN##_tramp8, gen_helper_neon_##FUNC##8);        \
++     * Identify illegal exception return cases. We can't immediately
-+    WRAP_ENV_FN(gen_##INSN##_tramp16, gen_helper_neon_##FUNC##16);      \
++     * return at this point because we still need to deactivate
-+    WRAP_ENV_FN(gen_##INSN##_tramp32, gen_helper_neon_##FUNC##32);      \
++     * (either this exception or NMI/HardFault) first.
-+    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
++     */
-+                                uint32_t rn_ofs, uint32_t rm_ofs,       \
++    if (!exc_is_banked(irq) && exc_targets_secure(s, irq) != secure) {
-+                                uint32_t oprsz, uint32_t maxsz)         \
++        /*
-+    {                                                                   \
++         * Return from a configurable exception targeting the opposite
-+        static const GVecGen3 ops[4] = {                                \
++         * security state from the one we're trying to complete it for.
-+            { .fni4 = gen_##INSN##_tramp8 },                            \
++         * Clear vec because it's not really the VecInfo for this
-+            { .fni4 = gen_##INSN##_tramp16 },                           \
++         * (irq, secstate) so we mustn't deactivate it.
-+            { .fni4 = gen_##INSN##_tramp32 },                           \
++         */
-+            { 0 },                                                      \
++        ret = -1;
-+        };                                                              \
++        vec = NULL;
-+        tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops[vece]); \
++    } else if (!vec->active) {
-+    }                                                                   \
++        /* Return from an inactive interrupt */
-+    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
++        ret = -1;
-+    {                                                                   \
++    } else {
-+        if (a->size > 2) {                                              \
++        /* Legal return, we will return the RETTOBASE bit value to the caller */
-+            return false;                                               \
++        ret = nvic_rettobase(s);
 +        }                                                               \
 +        return do_3same(s, a, gen_##INSN##_3s);                         \
 +    }
 +
- DO_3SAME_32(VHADD_S, hadd_s)
+     /*
- DO_3SAME_32(VHADD_U, hadd_u)
+      * For negative priorities, v8M will forcibly deactivate the appropriate
- DO_3SAME_32(VHSUB_S, hsub_s)
+      * NMI or HardFault regardless of what interrupt we're being asked to
- DO_3SAME_32(VHSUB_U, hsub_u)
+@@ -XXX,XX +XXX,XX @@ int armv7m_nvic_complete_irq(void *opaque, int irq, bool secure)
- DO_3SAME_32(VRHADD_S, rhadd_s)
+     }
- DO_3SAME_32(VRHADD_U, rhadd_u)
-+DO_3SAME_32(VRSHL_S, rshl_s)
+     if (!vec) {
-+DO_3SAME_32(VRSHL_U, rshl_u)
+-        if (secure && exc_is_banked(irq)) {
-+
+-            vec = &s->sec_vectors[irq];
-+DO_3SAME_32_ENV(VQSHL_S, qshl_s)
+-        } else {
-+DO_3SAME_32_ENV(VQSHL_U, qshl_u)
+-            vec = &s->vectors[irq];
-+DO_3SAME_32_ENV(VQRSHL_S, qrshl_s)
+-        }
-+DO_3SAME_32_ENV(VQRSHL_U, qrshl_u)
+-    }
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+-
-index XXXXXXX..XXXXXXX 100644
+-    trace_nvic_complete_irq(irq, secure);
---- a/target/arm/translate.c
+-
-+++ b/target/arm/translate.c
+-    if (!vec->active) {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+-        /* Tell the caller this was an illegal exception return */
-         case NEON_3R_VHSUB:
+-        return -1;
-         case NEON_3R_VABD:
+-    }
-         case NEON_3R_VABA:
+-
-+        case NEON_3R_VQSHL:
+-    /*
-+        case NEON_3R_VRSHL:
+-     * If this is a configurable exception and it is currently
-+        case NEON_3R_VQRSHL:
+-     * targeting the opposite security state from the one we're trying
-             /* Already handled by decodetree */
+-     * to complete it for, this counts as an illegal exception return.
-             return 1;
+-     * We still need to deactivate whatever vector the logic above has
-         }
+-     * selected, though, as it might not be the same as the one for the
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+-     * requested exception number.
-         }
+-     */
-         pairwise = 0;
+-    if (!exc_is_banked(irq) && exc_targets_secure(s, irq) != secure) {
-         switch (op) {
+-        ret = -1;
--        case NEON_3R_VQSHL:
+-    } else {
--        case NEON_3R_VRSHL:
+-        ret = nvic_rettobase(s);
--        case NEON_3R_VQRSHL:
++        return ret;
--            {
+     }
--                int rtmp;
--                /* Shift instruction operands are reversed.  */
+     vec->active = 0;
 -                rtmp = rn;
 -                rn = rm;
 -                rm = rtmp;
 -            }
 -            break;
          case NEON_3R_VPADD_VQRDMLAH:
          case NEON_3R_VPMAX:
          case NEON_3R_VPMIN:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rm, pass);
          }
          switch (op) {
 -        case NEON_3R_VQSHL:
 -            GEN_NEON_INTEGER_OP_ENV(qshl);
 -            break;
 -        case NEON_3R_VRSHL:
 -            GEN_NEON_INTEGER_OP(rshl);
 -            break;
 -        case NEON_3R_VQRSHL:
 -            GEN_NEON_INTEGER_OP_ENV(qrshl);
              break;
          case NEON_3R_VPMAX:
              GEN_NEON_INTEGER_OP(pmax);
 --
 .20.1

-[PULL 27/45] target-arm: kvm64: handle SIGBUS signal from kernel or KVM
+[PULL 34/36] target/arm: Implement M-profile "minimal RAS implementation"
-From: Dongjiu Geng <gengdongjiu@huawei.com>
+For v8.1M the architecture mandates that CPUs must provide at
 least the "minimal RAS implementation" from the Reliability,
 Availability and Serviceability extension. This consists of:
  * an ESB instruction which is a NOP
    -- since it is in the HINT space we need only add a comment
  * an RFSR register which will RAZ/WI
  * a RAZ/WI AIRCR.IESB bit
    -- the code which handles writes to AIRCR does not allow setting
       of RES0 bits, so we already treat this as RAZ/WI; add a comment
       noting that this is deliberate
  * minimal implementation of the RAS register block at 0xe0005000
    -- this will be in a subsequent commit
  * setting the ID_PFR0.RAS field to 0b0010
    -- we will do this when we add the Cortex-M55 CPU model
-Add a SIGBUS signal handler. In this handler, it checks the SIGBUS type,
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-translates the host VA delivered by host to guest PA, then fills this PA
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-to guest APEI GHES memory, then notifies guest according to the SIGBUS
+Message-id: 20201119215617.29887-26-peter.maydell@linaro.org
-type.
+---
  target/arm/cpu.h      | 14 ++++++++++++++
  target/arm/t32.decode |  4 ++++
  hw/intc/armv7m_nvic.c | 13 +++++++++++++
 files changed, 31 insertions(+)
-When guest accesses the poisoned memory, it will generate a Synchronous
-External Abort(SEA). Then host kernel gets an APEI notification and calls
-memory_failure() to unmapped the affected page in stage 2, finally
-returns to guest.
-Guest continues to access the PG_hwpoison page, it will trap to KVM as
-stage2 fault, then a SIGBUS_MCEERR_AR synchronous signal is delivered to
-Qemu, Qemu records this error address into guest APEI GHES memory and
-notifes guest using Synchronous-External-Abort(SEA).
-In order to inject a vSEA, we introduce the kvm_inject_arm_sea() function
-in which we can setup the type of exception and the syndrome information.
-When switching to guest, the target vcpu will jump to the synchronous
-external abort vector table entry.
-The ESR_ELx.DFSC is set to synchronous external abort(0x10), and the
-ESR_ELx.FnV is set to not valid(0x1), which will tell guest that FAR is
-not valid and hold an UNKNOWN value. These values will be set to KVM
-register structures through KVM_SET_ONE_REG IOCTL.
-Signed-off-by: Dongjiu Geng <gengdongjiu@huawei.com>
-Signed-off-by: Xiang Zheng <zhengxiang9@huawei.com>
-Reviewed-by: Michael S. Tsirkin <mst@redhat.com>
-Acked-by: Xiang Zheng <zhengxiang9@huawei.com>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Igor Mammedov <imammedo@redhat.com>
-Message-id: 20200512030609.19593-10-gengdongjiu@huawei.com
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- include/sysemu/kvm.h    |  3 +-
- target/arm/cpu.h        |  4 +++
- target/arm/internals.h  |  5 +--
- target/i386/cpu.h       |  2 ++
- target/arm/helper.c     |  2 +-
- target/arm/kvm64.c      | 77 +++++++++++++++++++++++++++++++++++++++++
- target/arm/tlb_helper.c |  2 +-
-files changed, 89 insertions(+), 6 deletions(-)
-diff --git a/include/sysemu/kvm.h b/include/sysemu/kvm.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/kvm.h
-+++ b/include/sysemu/kvm.h
-@@ -XXX,XX +XXX,XX @@ bool kvm_vcpu_id_is_valid(int vcpu_id);
- /* Returns VCPU ID to be used on KVM_CREATE_VCPU ioctl() */
- unsigned long kvm_arch_vcpu_id(CPUState *cpu);
--#ifdef TARGET_I386
--#define KVM_HAVE_MCE_INJECTION 1
-+#ifdef KVM_HAVE_MCE_INJECTION
- void kvm_arch_on_sigbus_vcpu(CPUState *cpu, int code, void *addr);
- #endif
 diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.h
 +++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ FIELD(ID_MMFR4, LSM, 20, 4)
- /* ARM processors have a weak memory model */
+ FIELD(ID_MMFR4, CCIDX, 24, 4)
- #define TCG_GUEST_DEFAULT_MO      (0)
+ FIELD(ID_MMFR4, EVT, 28, 4)
-+#ifdef TARGET_AARCH64
++FIELD(ID_PFR0, STATE0, 0, 4)
-+#define KVM_HAVE_MCE_INJECTION 1
++FIELD(ID_PFR0, STATE1, 4, 4)
-+#endif
++FIELD(ID_PFR0, STATE2, 8, 4)
 +FIELD(ID_PFR0, STATE3, 12, 4)
 +FIELD(ID_PFR0, CSV2, 16, 4)
 +FIELD(ID_PFR0, AMU, 20, 4)
 +FIELD(ID_PFR0, DIT, 24, 4)
 +FIELD(ID_PFR0, RAS, 28, 4)
 +
- #define EXCP_UDEF            1   /* undefined instruction */
+ FIELD(ID_PFR1, PROGMOD, 0, 4)
- #define EXCP_SWI             2   /* software interrupt */
+ FIELD(ID_PFR1, SECURITY, 4, 4)
- #define EXCP_PREFETCH_ABORT  3
+ FIELD(ID_PFR1, MPROGMOD, 8, 4)
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_predinv(const ARMISARegisters *id)
-index XXXXXXX..XXXXXXX 100644
+     return FIELD_EX32(id->id_isar6, ID_ISAR6, SPECRES) != 0;
 --- a/target/arm/internals.h
 +++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline uint32_t syn_insn_abort(int same_el, int ea, int s1ptw, int fsc)
          | ARM_EL_IL | (ea << 9) | (s1ptw << 7) | fsc;
  }
--static inline uint32_t syn_data_abort_no_iss(int same_el,
++static inline bool isar_feature_aa32_ras(const ARMISARegisters *id)
 +static inline uint32_t syn_data_abort_no_iss(int same_el, int fnv,
                                               int ea, int cm, int s1ptw,
                                               int wnr, int fsc)
  {
      return (EC_DATAABORT << ARM_EL_EC_SHIFT) | (same_el << ARM_EL_EC_SHIFT)
             | ARM_EL_IL
 -           | (ea << 9) | (cm << 8) | (s1ptw << 7) | (wnr << 6) | fsc;
 +           | (fnv << 10) | (ea << 9) | (cm << 8) | (s1ptw << 7)
 +           | (wnr << 6) | fsc;
  }
  static inline uint32_t syn_data_abort_with_iss(int same_el,
 diff --git a/target/i386/cpu.h b/target/i386/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/cpu.h
 +++ b/target/i386/cpu.h
@@ -XXX,XX +XXX,XX @@
  /* The x86 has a strong memory model with some store-after-load re-ordering */
  #define TCG_GUEST_DEFAULT_MO      (TCG_MO_ALL & ~TCG_MO_ST_LD)
 +#define KVM_HAVE_MCE_INJECTION 1
 +
  /* Maximum instruction code size */
  #define TARGET_MAX_INSN_SIZE 16
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t do_ats_write(CPUARMState *env, uint64_t value,
               * Report exception with ESR indicating a fault due to a
               * translation table walk for a cache maintenance instruction.
               */
 -            syn = syn_data_abort_no_iss(current_el == target_el,
 +            syn = syn_data_abort_no_iss(current_el == target_el, 0,
                                          fi.ea, 1, fi.s1ptw, 1, fsc);
              env->exception.vaddress = value;
              env->exception.fsr = fsr;
 diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/kvm64.c
 +++ b/target/arm/kvm64.c
@@ -XXX,XX +XXX,XX @@
  #include "sysemu/kvm_int.h"
  #include "kvm_arm.h"
  #include "internals.h"
 +#include "hw/acpi/acpi.h"
 +#include "hw/acpi/ghes.h"
 +#include "hw/arm/virt.h"
  static bool have_guest_debug;
@@ -XXX,XX +XXX,XX @@ int kvm_arm_cpreg_level(uint64_t regidx)
      return KVM_PUT_RUNTIME_STATE;
  }
 +/* Callers must hold the iothread mutex lock */
 +static void kvm_inject_arm_sea(CPUState *c)
 +{
-+    ARMCPU *cpu = ARM_CPU(c);
++    return FIELD_EX32(id->id_pfr0, ID_PFR0, RAS) != 0;
 +    CPUARMState *env = &cpu->env;
 +    CPUClass *cc = CPU_GET_CLASS(c);
 +    uint32_t esr;
 +    bool same_el;
 +
 +    c->exception_index = EXCP_DATA_ABORT;
 +    env->exception.target_el = 1;
 +
 +    /*
 +     * Set the DFSC to synchronous external abort and set FnV to not valid,
 +     * this will tell guest the FAR_ELx is UNKNOWN for this abort.
 +     */
 +    same_el = arm_current_el(env) == env->exception.target_el;
 +    esr = syn_data_abort_no_iss(same_el, 1, 0, 0, 0, 0, 0x10);
 +
 +    env->exception.syndrome = esr;
 +
 +    cc->do_interrupt(c);
 +}
 +
- #define AARCH64_CORE_REG(x)   (KVM_REG_ARM64 | KVM_REG_SIZE_U64 | \
+ static inline bool isar_feature_aa32_mprofile(const ARMISARegisters *id)
-                  KVM_REG_ARM_CORE | KVM_REG_ARM_CORE_REG(x))
+ {
+     return FIELD_EX32(id->id_pfr1, ID_PFR1, MPROGMOD) != 0;
-@@ -XXX,XX +XXX,XX @@ int kvm_arch_get_registers(CPUState *cs)
+diff --git a/target/arm/t32.decode b/target/arm/t32.decode
-     return ret;
+index XXXXXXX..XXXXXXX 100644
- }
+--- a/target/arm/t32.decode
++++ b/target/arm/t32.decode
-+void kvm_arch_on_sigbus_vcpu(CPUState *c, int code, void *addr)
+@@ -XXX,XX +XXX,XX @@ CLZ              1111 1010 1011 ---- 1111 .... 1000 ....      @rdm
-+{
+       # SEV      1111 0011 1010 1111 1000 0000 0000 0100
-+    ram_addr_t ram_addr;
+       # SEVL     1111 0011 1010 1111 1000 0000 0000 0101
-+    hwaddr paddr;
-+    Object *obj = qdev_get_machine();
++      # For M-profile minimal-RAS ESB can be a NOP, which is the
-+    VirtMachineState *vms = VIRT_MACHINE(obj);
++      # default behaviour since it is in the hint space.
-+    bool acpi_enabled = virt_is_acpi_enabled(vms);
++      # ESB      1111 0011 1010 1111 1000 0000 0001 0000
 +
-+    assert(code == BUS_MCEERR_AR || code == BUS_MCEERR_AO);
+       # The canonical nop ends in 0000 0000, but the whole rest
-+
+       # of the space is "reserved hint, behaves as nop".
-+    if (acpi_enabled && addr &&
+       NOP        1111 0011 1010 1111 1000 0000 ---- ----
-+            object_property_get_bool(obj, "ras", NULL)) {
+diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
-+        ram_addr = qemu_ram_addr_from_host(addr);
+index XXXXXXX..XXXXXXX 100644
-+        if (ram_addr != RAM_ADDR_INVALID &&
+--- a/hw/intc/armv7m_nvic.c
-+            kvm_physical_memory_addr_from_host(c->kvm_state, addr, &paddr)) {
++++ b/hw/intc/armv7m_nvic.c
-+            kvm_hwpoison_page_add(ram_addr);
+@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
-+            /*
+             return 0;
-+             * If this is a BUS_MCEERR_AR, we know we have been called
+         }
-+             * synchronously from the vCPU thread, so we can easily
+         return cpu->env.v7m.sfar;
-+             * synchronize the state and inject an error.
++    case 0xf04: /* RFSR */
-+             *
++        if (!cpu_isar_feature(aa32_ras, cpu)) {
-+             * TODO: we currently don't tell the guest at all about
++            goto bad_offset;
 +             * BUS_MCEERR_AO. In that case we might either be being
 +             * called synchronously from the vCPU thread, or a bit
 +             * later from the main thread, so doing the injection of
 +             * the error would be more complicated.
 +             */
 +            if (code == BUS_MCEERR_AR) {
 +                kvm_cpu_synchronize_state(c);
 +                if (!acpi_ghes_record_errors(ACPI_HEST_SRC_ID_SEA, paddr)) {
 +                    kvm_inject_arm_sea(c);
 +                } else {
 +                    error_report("failed to record the error");
 +                    abort();
 +                }
 +            }
 +            return;
 +        }
-+        if (code == BUS_MCEERR_AO) {
++        /* We provide minimal-RAS only: RFSR is RAZ/WI */
-+            error_report("Hardware memory error at addr %p for memory used by "
++        return 0;
-+                "QEMU itself instead of guest system!", addr);
+     case 0xf34: /* FPCCR */
          if (!cpu_isar_feature(aa32_vfp_simd, cpu)) {
              return 0;
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
                                R_V7M_AIRCR_PRIGROUP_SHIFT,
                                R_V7M_AIRCR_PRIGROUP_LENGTH);
              }
 +            /* AIRCR.IESB is RAZ/WI because we implement only minimal RAS */
              if (attrs.secure) {
                  /* These bits are only writable by secure */
                  cpu->env.v7m.aircr = value &
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
          }
          break;
      }
 +    case 0xf04: /* RFSR */
 +        if (!cpu_isar_feature(aa32_ras, cpu)) {
 +            goto bad_offset;
 +        }
-+    }
++        /* We provide minimal-RAS only: RFSR is RAZ/WI */
-+
++        break;
-+    if (code == BUS_MCEERR_AR) {
+     case 0xf34: /* FPCCR */
-+        error_report("Hardware memory error!");
+         if (cpu_isar_feature(aa32_vfp_simd, cpu)) {
-+        exit(1);
+             /* Not all bits here are banked. */
 +    }
 +}
 +
  /* C6.6.29 BRK instruction */
  static const uint32_t brk_insn = 0xd4200000;
 diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tlb_helper.c
 +++ b/target/arm/tlb_helper.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
       * ISV field.
       */
      if (!(template_syn & ARM_EL_ISV) || target_el != 2 || s1ptw) {
 -        syn = syn_data_abort_no_iss(same_el,
 +        syn = syn_data_abort_no_iss(same_el, 0,
                                      ea, 0, s1ptw, is_write, fsc);
      } else {
          /*
 --
 .20.1

-[PULL 36/45] target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
+[PULL 35/36] hw/intc/armv7m_nvic: Implement read/write for RAS register block
-Convert the Neon integer VPMAX and VPMIN 3-reg-same insns to
+The RAS feature has a block of memory-mapped registers at offset
-decodetree. These are 'pairwise' operations.
+x5000 within the PPB.  For a "minimal RAS" implementation we provide
 no error records and so the only registers that exist in the block
 are ERRIIDR and ERRDEVID.
 The "RAZ/WI for privileged, BusFault for nonprivileged" behaviour
 of the "nvic-default" region is actually valid for minimal-RAS,
 so the main benefit of providing an explicit implementation of
 the register block is more accurate LOG_UNIMP messages, and a
 framework for where we could add a real RAS implementation later
 if necessary.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200512163904.10918-9-peter.maydell@linaro.org
+Message-id: 20201119215617.29887-27-peter.maydell@linaro.org
 ---
- target/arm/neon-dp.decode       |  9 +++++
+ include/hw/intc/armv7m_nvic.h |  1 +
- target/arm/translate-neon.inc.c | 71 +++++++++++++++++++++++++++++++++
+ hw/intc/armv7m_nvic.c         | 56 +++++++++++++++++++++++++++++++++++
- target/arm/translate.c          | 17 +-------
+files changed, 57 insertions(+)
 files changed, 82 insertions(+), 15 deletions(-)
-diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
+diff --git a/include/hw/intc/armv7m_nvic.h b/include/hw/intc/armv7m_nvic.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon-dp.decode
+--- a/include/hw/intc/armv7m_nvic.h
-+++ b/target/arm/neon-dp.decode
++++ b/include/hw/intc/armv7m_nvic.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ struct NVICState {
- @3same           .... ... . . . size:2 .... .... .... . q:1 . . .... \
+     MemoryRegion sysreg_ns_mem;
-                  &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp
+     MemoryRegion systickmem;
+     MemoryRegion systick_ns_mem;
-+@3same_q0        .... ... . . . size:2 .... .... .... . 0 . . .... \
++    MemoryRegion ras_mem;
-+                 &3same vm=%vm_dp vn=%vn_dp vd=%vd_dp q=0
+     MemoryRegion container;
      MemoryRegion defaultmem;
 diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/armv7m_nvic.c
 +++ b/hw/intc/armv7m_nvic.c
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps nvic_systick_ops = {
      .endianness = DEVICE_NATIVE_ENDIAN,
  };
 +
- VHADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 0 .... @3same
++static MemTxResult ras_read(void *opaque, hwaddr addr,
- VHADD_U_3s       1111 001 1 0 . .. .... .... 0000 . . . 0 .... @3same
++                            uint64_t *data, unsigned size,
- VQADD_S_3s       1111 001 0 0 . .. .... .... 0000 . . . 1 .... @3same
++                            MemTxAttrs attrs)
@@ -XXX,XX +XXX,XX @@ VMLS_3s          1111 001 1 0 . .. .... .... 1001 . . . 0 .... @3same
  VMUL_3s          1111 001 0 0 . .. .... .... 1001 . . . 1 .... @3same
  VMUL_p_3s        1111 001 1 0 . .. .... .... 1001 . . . 1 .... @3same
 +VPMAX_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 0 .... @3same_q0
 +VPMAX_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 0 .... @3same_q0
 +
 +VPMIN_S_3s       1111 001 0 0 . .. .... .... 1010 . . . 1 .... @3same_q0
 +VPMIN_U_3s       1111 001 1 0 . .. .... .... 1010 . . . 1 .... @3same_q0
 +
  VQRDMLAH_3s      1111 001 1 0 . .. .... .... 1011 ... 1 .... @3same
  SHA1_3s          1111 001 0 0 . optype:2 .... .... 1100 . 1 . 0 .... \
 diff --git a/target/arm/translate-neon.inc.c b/target/arm/translate-neon.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.inc.c
 +++ b/target/arm/translate-neon.inc.c
@@ -XXX,XX +XXX,XX @@ DO_3SAME_32_ENV(VQSHL_S, qshl_s)
  DO_3SAME_32_ENV(VQSHL_U, qshl_u)
  DO_3SAME_32_ENV(VQRSHL_S, qrshl_s)
  DO_3SAME_32_ENV(VQRSHL_U, qrshl_u)
 +
 +static bool do_3same_pair(DisasContext *s, arg_3same *a, NeonGenTwoOpFn *fn)
 +{
-+    /* Operations handled pairwise 32 bits at a time */
++    if (attrs.user) {
-+    TCGv_i32 tmp, tmp2, tmp3;
++        return MEMTX_ERROR;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
 +        return false;
 +    }
 +
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
++    switch (addr) {
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
++    case 0xe10: /* ERRIIDR */
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
++        /* architect field = Arm; product/variant/revision 0 */
-+        return false;
++        *data = 0x43b;
 +        break;
 +    case 0xfc8: /* ERRDEVID */
 +        /* Minimal RAS: we implement 0 error record indexes */
 +        *data = 0;
 +        break;
 +    default:
 +        qemu_log_mask(LOG_UNIMP, "Read RAS register offset 0x%x\n",
 +                      (uint32_t)addr);
 +        *data = 0;
 +        break;
 +    }
 +    return MEMTX_OK;
 +}
 +
 +static MemTxResult ras_write(void *opaque, hwaddr addr,
 +                             uint64_t value, unsigned size,
 +                             MemTxAttrs attrs)
 +{
 +    if (attrs.user) {
 +        return MEMTX_ERROR;
 +    }
 +
-+    if (a->size == 3) {
++    switch (addr) {
-+        return false;
++    default:
 +        qemu_log_mask(LOG_UNIMP, "Write to RAS register offset 0x%x\n",
 +                      (uint32_t)addr);
 +        break;
 +    }
 +    return MEMTX_OK;
 +}
 +
 +static const MemoryRegionOps ras_ops = {
 +    .read_with_attrs = ras_read,
 +    .write_with_attrs = ras_write,
 +    .endianness = DEVICE_NATIVE_ENDIAN,
 +};
 +
  /*
   * Unassigned portions of the PPB space are RAZ/WI for privileged
   * accesses, and fault for non-privileged accesses.
@@ -XXX,XX +XXX,XX @@ static void armv7m_nvic_realize(DeviceState *dev, Error **errp)
                                              &s->systick_ns_mem, 1);
      }
 +    if (cpu_isar_feature(aa32_ras, s->cpu)) {
 +        memory_region_init_io(&s->ras_mem, OBJECT(s),
 +                              &ras_ops, s, "nvic_ras", 0x1000);
 +        memory_region_add_subregion(&s->container, 0x5000, &s->ras_mem);
 +    }
 +
-+    if (!vfp_access_check(s)) {
+     sysbus_init_mmio(SYS_BUS_DEVICE(dev), &s->container);
 +        return true;
 +    }
 +
 +    assert(a->q == 0); /* enforced by decode patterns */
 +
 +    /*
 +     * Note that we have to be careful not to clobber the source operands
 +     * in the "vm == vd" case by storing the result of the first pass too
 +     * early. Since Q is 0 there are always just two passes, so instead
 +     * of a complicated loop over each pass we just unroll.
 +     */
 +    tmp = neon_load_reg(a->vn, 0);
 +    tmp2 = neon_load_reg(a->vn, 1);
 +    fn(tmp, tmp, tmp2);
 +    tcg_temp_free_i32(tmp2);
 +
 +    tmp3 = neon_load_reg(a->vm, 0);
 +    tmp2 = neon_load_reg(a->vm, 1);
 +    fn(tmp3, tmp3, tmp2);
 +    tcg_temp_free_i32(tmp2);
 +
 +    neon_store_reg(a->vd, 0, tmp);
 +    neon_store_reg(a->vd, 1, tmp3);
 +    return true;
 +}
 +
 +#define DO_3SAME_PAIR(INSN, func)                                       \
 +    static bool trans_##INSN##_3s(DisasContext *s, arg_3same *a)        \
 +    {                                                                   \
 +        static NeonGenTwoOpFn * const fns[] = {                         \
 +            gen_helper_neon_##func##8,                                  \
 +            gen_helper_neon_##func##16,                                 \
 +            gen_helper_neon_##func##32,                                 \
 +        };                                                              \
 +        if (a->size > 2) {                                              \
 +            return false;                                               \
 +        }                                                               \
 +        return do_3same_pair(s, a, fns[a->size]);                       \
 +    }
 +
 +/* 32-bit pairwise ops end up the same as the elementwise versions.  */
 +#define gen_helper_neon_pmax_s32  tcg_gen_smax_i32
 +#define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
 +#define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
 +#define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
 +
 +DO_3SAME_PAIR(VPMAX_S, pmax_s)
 +DO_3SAME_PAIR(VPMIN_S, pmin_s)
 +DO_3SAME_PAIR(VPMAX_U, pmax_u)
 +DO_3SAME_PAIR(VPMIN_U, pmin_u)
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline void gen_neon_rsb(int size, TCGv_i32 t0, TCGv_i32 t1)
      }
  }
--/* 32-bit pairwise ops end up the same as the elementwise versions.  */
--#define gen_helper_neon_pmax_s32  tcg_gen_smax_i32
--#define gen_helper_neon_pmax_u32  tcg_gen_umax_i32
--#define gen_helper_neon_pmin_s32  tcg_gen_smin_i32
--#define gen_helper_neon_pmin_u32  tcg_gen_umin_i32
--
- #define GEN_NEON_INTEGER_OP_ENV(name) do { \
-     switch ((size << 1) | u) { \
-     case 0: \
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VQSHL:
-         case NEON_3R_VRSHL:
-         case NEON_3R_VQRSHL:
-+        case NEON_3R_VPMAX:
-+        case NEON_3R_VPMIN:
-             /* Already handled by decodetree */
-             return 1;
-         }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         pairwise = 0;
-         switch (op) {
-         case NEON_3R_VPADD_VQRDMLAH:
--        case NEON_3R_VPMAX:
--        case NEON_3R_VPMIN:
-             pairwise = 1;
-             break;
-         case NEON_3R_FLOAT_ARITH:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             tmp2 = neon_load_reg(rm, pass);
-         }
-         switch (op) {
--            break;
--        case NEON_3R_VPMAX:
--            GEN_NEON_INTEGER_OP(pmax);
--            break;
--        case NEON_3R_VPMIN:
--            GEN_NEON_INTEGER_OP(pmin);
--            break;
-         case NEON_3R_VQDMULH_VQRDMULH: /* Multiply high.  */
-             if (!u) { /* VQDMULH */
-                 switch (size) {
 --
 .20.1

-[PULL 12/45] target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
+[PULL 36/36] hw/arm/armv7m: Correct typo in QOM object name
-From: Richard Henderson <richard.henderson@linaro.org>
+Correct a typo in the name we give the NVIC object.
-These operations do not touch fp_status.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20201119215617.29887-28-peter.maydell@linaro.org
 ---
  hw/arm/armv7m.c | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+diff --git a/hw/arm/armv7m.c b/hw/arm/armv7m.c
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200513163245.17915-12-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/helper.h        |  4 ++--
  target/arm/translate-a64.c |  5 ++---
  target/arm/translate.c     | 12 ++----------
  target/arm/vfp_helper.c    |  5 ++---
 files changed, 8 insertions(+), 18 deletions(-)
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/armv7m.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/armv7m.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@ static void armv7m_instance_init(Object *obj)
- DEF_HELPER_FLAGS_2(rsqrte_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
- DEF_HELPER_FLAGS_2(rsqrte_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+     memory_region_init(&s->container, obj, "armv7m-container", UINT64_MAX);
- DEF_HELPER_FLAGS_2(rsqrte_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
--DEF_HELPER_2(recpe_u32, i32, i32, ptr)
+-    object_initialize_child(obj, "nvnic", &s->nvic, TYPE_NVIC);
--DEF_HELPER_FLAGS_2(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32, ptr)
++    object_initialize_child(obj, "nvic", &s->nvic, TYPE_NVIC);
-+DEF_HELPER_FLAGS_1(recpe_u32, TCG_CALL_NO_RWG, i32, i32)
+     object_property_add_alias(obj, "num-irq",
-+DEF_HELPER_FLAGS_1(rsqrte_u32, TCG_CALL_NO_RWG, i32, i32)
+                               OBJECT(&s->nvic), "num-irq");
  DEF_HELPER_FLAGS_4(neon_tbl, TCG_CALL_NO_RWG, i32, i32, i32, ptr, i32)
  DEF_HELPER_3(shl_cc, i32, env, i32, i32)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_2misc_reciprocal(DisasContext *s, int opcode,
              switch (opcode) {
              case 0x3c: /* URECPE */
 -                gen_helper_recpe_u32(tcg_res, tcg_op, fpst);
 +                gen_helper_recpe_u32(tcg_res, tcg_op);
                  break;
              case 0x3d: /* FRECPE */
                  gen_helper_recpe_f32(tcg_res, tcg_op, fpst);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                  unallocated_encoding(s);
                  return;
              }
 -            need_fpstatus = true;
              break;
          case 0x1e: /* FRINT32Z */
          case 0x1f: /* FRINT64Z */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_two_reg_misc(DisasContext *s, uint32_t insn)
                      gen_helper_rints_exact(tcg_res, tcg_op, tcg_fpstatus);
                      break;
                  case 0x7c: /* URSQRTE */
 -                    gen_helper_rsqrte_u32(tcg_res, tcg_op, tcg_fpstatus);
 +                    gen_helper_rsqrte_u32(tcg_res, tcg_op);
                      break;
                  case 0x1e: /* FRINT32Z */
                  case 0x5e: /* FRINT32X */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                              break;
                          }
                          case NEON_2RM_VRECPE:
 -                        {
 -                            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                            gen_helper_recpe_u32(tmp, tmp, fpstatus);
 -                            tcg_temp_free_ptr(fpstatus);
 +                            gen_helper_recpe_u32(tmp, tmp);
                              break;
 -                        }
                          case NEON_2RM_VRSQRTE:
 -                        {
 -                            TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 -                            gen_helper_rsqrte_u32(tmp, tmp, fpstatus);
 -                            tcg_temp_free_ptr(fpstatus);
 +                            gen_helper_rsqrte_u32(tmp, tmp);
                              break;
 -                        }
                          case NEON_2RM_VRECPE_F:
                          {
                              TCGv_ptr fpstatus = get_fpstatus_ptr(1);
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rsqrte_f64)(float64 input, void *fpstp)
      return make_float64(val);
  }
 -uint32_t HELPER(recpe_u32)(uint32_t a, void *fpstp)
 +uint32_t HELPER(recpe_u32)(uint32_t a)
  {
 -    /* float_status *s = fpstp; */
      int input, estimate;
      if ((a & 0x80000000) == 0) {
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(recpe_u32)(uint32_t a, void *fpstp)
      return deposit32(0, (32 - 9), 9, estimate);
  }
 -uint32_t HELPER(rsqrte_u32)(uint32_t a, void *fpstp)
 +uint32_t HELPER(rsqrte_u32)(uint32_t a)
  {
      int estimate;
 --
 .20.1

-[PULL 15/45] target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Must clear the tail for AdvSIMD when SVE is enabled.
-Fixes: ca40a6e6e39
-Cc: qemu-stable@nongnu.org
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-15-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/vec_helper.c | 2 ++
-file changed, 2 insertions(+)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
-             d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
-         }                                                                  \
-     }                                                                      \
-+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
- }
- DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
-                                      mm, a[i + j], 0, stat);               \
-         }                                                                  \
-     }                                                                      \
-+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
- }
- DO_FMLA_IDX(gvec_fmla_idx_h, float16, H2)
---
-.20.1

-[PULL 16/45] target/arm: Vectorize SABD/UABD
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Include 64-bit element size in preparation for SVE2.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-16-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  10 +++
- target/arm/translate.h     |   5 ++
- target/arm/translate-a64.c |   8 ++-
- target/arm/translate.c     | 133 ++++++++++++++++++++++++++++++++++++-
- target/arm/vec_helper.c    |  24 +++++++
-files changed, 176 insertions(+), 4 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(gvec_sli_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
- DEF_HELPER_FLAGS_3(gvec_sli_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
- DEF_HELPER_FLAGS_3(gvec_sli_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_sabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(gvec_uabd_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
- #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqrdmlah_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_sqrdmlsh_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                           uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_smin, size);
-         }
-         return;
-+    case 0xe: /* SABD, UABD */
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uabd, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sabd, size);
-+        }
-+        return;
-     case 0x10: /* ADD, SUB */
-         if (u) {
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_sub, size);
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-                 genenvfn = fns[size][u];
-                 break;
-             }
--            case 0xe: /* SABD, UABD */
-             case 0xf: /* SABA, UABA */
-             {
-                 static NeonGenTwoOpFn * const fns[3][2] = {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sqsub_qc(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                    rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
- }
-+static void gen_sabd_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
-+{
-+    TCGv_i32 t = tcg_temp_new_i32();
-+
-+    tcg_gen_sub_i32(t, a, b);
-+    tcg_gen_sub_i32(d, b, a);
-+    tcg_gen_movcond_i32(TCG_COND_LT, d, a, b, d, t);
-+    tcg_temp_free_i32(t);
-+}
-+
-+static void gen_sabd_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
-+
-+    tcg_gen_sub_i64(t, a, b);
-+    tcg_gen_sub_i64(d, b, a);
-+    tcg_gen_movcond_i64(TCG_COND_LT, d, a, b, d, t);
-+    tcg_temp_free_i64(t);
-+}
-+
-+static void gen_sabd_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-+{
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+
-+    tcg_gen_smin_vec(vece, t, a, b);
-+    tcg_gen_smax_vec(vece, d, a, b);
-+    tcg_gen_sub_vec(vece, d, d, t);
-+    tcg_temp_free_vec(t);
-+}
-+
-+void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sub_vec, INDEX_op_smin_vec, INDEX_op_smax_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_sabd_i32,
-+          .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_s,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_sabd_i64,
-+          .fniv = gen_sabd_vec,
-+          .fno = gen_helper_gvec_sabd_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
-+
-+static void gen_uabd_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
-+{
-+    TCGv_i32 t = tcg_temp_new_i32();
-+
-+    tcg_gen_sub_i32(t, a, b);
-+    tcg_gen_sub_i32(d, b, a);
-+    tcg_gen_movcond_i32(TCG_COND_LTU, d, a, b, d, t);
-+    tcg_temp_free_i32(t);
-+}
-+
-+static void gen_uabd_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
-+
-+    tcg_gen_sub_i64(t, a, b);
-+    tcg_gen_sub_i64(d, b, a);
-+    tcg_gen_movcond_i64(TCG_COND_LTU, d, a, b, d, t);
-+    tcg_temp_free_i64(t);
-+}
-+
-+static void gen_uabd_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-+{
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+
-+    tcg_gen_umin_vec(vece, t, a, b);
-+    tcg_gen_umax_vec(vece, d, a, b);
-+    tcg_gen_sub_vec(vece, d, d, t);
-+    tcg_temp_free_vec(t);
-+}
-+
-+void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sub_vec, INDEX_op_umin_vec, INDEX_op_umax_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_b,
-+          .opt_opc = vecop_list,
-+          .vece = MO_8 },
-+        { .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_h,
-+          .opt_opc = vecop_list,
-+          .vece = MO_16 },
-+        { .fni4 = gen_uabd_i32,
-+          .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_s,
-+          .opt_opc = vecop_list,
-+          .vece = MO_32 },
-+        { .fni8 = gen_uabd_i64,
-+          .fniv = gen_uabd_vec,
-+          .fno = gen_helper_gvec_uabd_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
-+
- /* Translate a NEON data processing instruction.  Return nonzero if the
-    instruction is invalid.
-    We process data in a mixture of 32-bit and 64-bit chunks.
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             }
-             return 1;
-+        case NEON_3R_VABD:
-+            if (u) {
-+                gen_gvec_uabd(size, rd_ofs, rn_ofs, rm_ofs,
-+                              vec_size, vec_size);
-+            } else {
-+                gen_gvec_sabd(size, rd_ofs, rn_ofs, rm_ofs,
-+                              vec_size, vec_size);
-+            }
-+            return 0;
-+
-         case NEON_3R_VADD_VSUB:
-         case NEON_3R_LOGIC:
-         case NEON_3R_VMAX:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VQRSHL:
-             GEN_NEON_INTEGER_OP_ENV(qrshl);
-             break;
--        case NEON_3R_VABD:
--            GEN_NEON_INTEGER_OP(abd);
--            break;
-         case NEON_3R_VABA:
-             GEN_NEON_INTEGER_OP(abd);
-             tcg_temp_free_i32(tmp2);
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_CMP0(gvec_cgt0_h, int16_t, >)
- DO_CMP0(gvec_cge0_h, int16_t, >=)
- #undef DO_CMP0
-+
-+#define DO_ABD(NAME, TYPE)                                      \
-+void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc)  \
-+{                                                               \
-+    intptr_t i, opr_sz = simd_oprsz(desc);                      \
-+    TYPE *d = vd, *n = vn, *m = vm;                             \
-+                                                                \
-+    for (i = 0; i < opr_sz / sizeof(TYPE); ++i) {               \
-+        d[i] = n[i] < m[i] ? m[i] - n[i] : n[i] - m[i];         \
-+    }                                                           \
-+    clear_tail(d, opr_sz, simd_maxsz(desc));                    \
-+}
-+
-+DO_ABD(gvec_sabd_b, int8_t)
-+DO_ABD(gvec_sabd_h, int16_t)
-+DO_ABD(gvec_sabd_s, int32_t)
-+DO_ABD(gvec_sabd_d, int64_t)
-+
-+DO_ABD(gvec_uabd_b, uint8_t)
-+DO_ABD(gvec_uabd_h, uint16_t)
-+DO_ABD(gvec_uabd_s, uint32_t)
-+DO_ABD(gvec_uabd_d, uint64_t)
-+
-+#undef DO_ABD
---
-.20.1

-[PULL 17/45] target/arm: Vectorize SABA/UABA
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Include 64-bit element size in preparation for SVE2.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200513163245.17915-17-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  17 +++--
- target/arm/translate.h     |   5 ++
- target/arm/neon_helper.c   |  10 ---
- target/arm/translate-a64.c |  17 ++---
- target/arm/translate.c     | 134 +++++++++++++++++++++++++++++++++++--
- target/arm/vec_helper.c    |  24 +++++++
-files changed, 174 insertions(+), 33 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_pmax_s8, i32, i32, i32)
- DEF_HELPER_2(neon_pmax_u16, i32, i32, i32)
- DEF_HELPER_2(neon_pmax_s16, i32, i32, i32)
--DEF_HELPER_2(neon_abd_u8, i32, i32, i32)
--DEF_HELPER_2(neon_abd_s8, i32, i32, i32)
--DEF_HELPER_2(neon_abd_u16, i32, i32, i32)
--DEF_HELPER_2(neon_abd_s16, i32, i32, i32)
--DEF_HELPER_2(neon_abd_u32, i32, i32, i32)
--DEF_HELPER_2(neon_abd_s32, i32, i32, i32)
--
- DEF_HELPER_2(neon_shl_u16, i32, i32, i32)
- DEF_HELPER_2(neon_shl_s16, i32, i32, i32)
- DEF_HELPER_2(neon_rshl_u8, i32, i32, i32)
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_uabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_uabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_uabd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_saba_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_saba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_saba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_saba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(gvec_uaba_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uaba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uaba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_uaba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
- #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_sabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
- void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-                    uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz);
-+
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-  */
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon_helper.c
-+++ b/target/arm/neon_helper.c
-@@ -XXX,XX +XXX,XX @@ NEON_POP(pmax_s16, neon_s16, 2)
- NEON_POP(pmax_u16, neon_u16, 2)
- #undef NEON_FN
--#define NEON_FN(dest, src1, src2) \
--    dest = (src1 > src2) ? (src1 - src2) : (src2 - src1)
--NEON_VOP(abd_s8, neon_s8, 4)
--NEON_VOP(abd_u8, neon_u8, 4)
--NEON_VOP(abd_s16, neon_s16, 2)
--NEON_VOP(abd_u16, neon_u16, 2)
--NEON_VOP(abd_s32, neon_s32, 1)
--NEON_VOP(abd_u32, neon_u32, 1)
--#undef NEON_FN
--
- #define NEON_FN(dest, src1, src2) do { \
-     int8_t tmp; \
-     tmp = (int8_t)src2; \
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-             gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_sabd, size);
-         }
-         return;
-+    case 0xf: /* SABA, UABA */
-+        if (u) {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_uaba, size);
-+        } else {
-+            gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_saba, size);
-+        }
-+        return;
-     case 0x10: /* ADD, SUB */
-         if (u) {
-             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_sub, size);
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-                 genenvfn = fns[size][u];
-                 break;
-             }
--            case 0xf: /* SABA, UABA */
--            {
--                static NeonGenTwoOpFn * const fns[3][2] = {
--                    { gen_helper_neon_abd_s8, gen_helper_neon_abd_u8 },
--                    { gen_helper_neon_abd_s16, gen_helper_neon_abd_u16 },
--                    { gen_helper_neon_abd_s32, gen_helper_neon_abd_u32 },
--                };
--                genfn = fns[size][u];
--                break;
--            }
-             case 0x16: /* SQDMULH, SQRDMULH */
-             {
-                 static NeonGenTwoOpEnvFn * const fns[2][2] = {
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ void gen_gvec_uabd(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-     tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
- }
-+static void gen_saba_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
-+{
-+    TCGv_i32 t = tcg_temp_new_i32();
-+    gen_sabd_i32(t, a, b);
-+    tcg_gen_add_i32(d, d, t);
-+    tcg_temp_free_i32(t);
-+}
-+
-+static void gen_saba_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
-+    gen_sabd_i64(t, a, b);
-+    tcg_gen_add_i64(d, d, t);
-+    tcg_temp_free_i64(t);
-+}
-+
-+static void gen_saba_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-+{
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+    gen_sabd_vec(vece, t, a, b);
-+    tcg_gen_add_vec(vece, d, d, t);
-+    tcg_temp_free_vec(t);
-+}
-+
-+void gen_gvec_saba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sub_vec, INDEX_op_add_vec,
-+        INDEX_op_smin_vec, INDEX_op_smax_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_saba_vec,
-+          .fno = gen_helper_gvec_saba_b,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_saba_vec,
-+          .fno = gen_helper_gvec_saba_h,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_16 },
-+        { .fni4 = gen_saba_i32,
-+          .fniv = gen_saba_vec,
-+          .fno = gen_helper_gvec_saba_s,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_32 },
-+        { .fni8 = gen_saba_i64,
-+          .fniv = gen_saba_vec,
-+          .fno = gen_helper_gvec_saba_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
-+
-+static void gen_uaba_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b)
-+{
-+    TCGv_i32 t = tcg_temp_new_i32();
-+    gen_uabd_i32(t, a, b);
-+    tcg_gen_add_i32(d, d, t);
-+    tcg_temp_free_i32(t);
-+}
-+
-+static void gen_uaba_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
-+{
-+    TCGv_i64 t = tcg_temp_new_i64();
-+    gen_uabd_i64(t, a, b);
-+    tcg_gen_add_i64(d, d, t);
-+    tcg_temp_free_i64(t);
-+}
-+
-+static void gen_uaba_vec(unsigned vece, TCGv_vec d, TCGv_vec a, TCGv_vec b)
-+{
-+    TCGv_vec t = tcg_temp_new_vec_matching(d);
-+    gen_uabd_vec(vece, t, a, b);
-+    tcg_gen_add_vec(vece, d, d, t);
-+    tcg_temp_free_vec(t);
-+}
-+
-+void gen_gvec_uaba(unsigned vece, uint32_t rd_ofs, uint32_t rn_ofs,
-+                   uint32_t rm_ofs, uint32_t opr_sz, uint32_t max_sz)
-+{
-+    static const TCGOpcode vecop_list[] = {
-+        INDEX_op_sub_vec, INDEX_op_add_vec,
-+        INDEX_op_umin_vec, INDEX_op_umax_vec, 0
-+    };
-+    static const GVecGen3 ops[4] = {
-+        { .fniv = gen_uaba_vec,
-+          .fno = gen_helper_gvec_uaba_b,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_8 },
-+        { .fniv = gen_uaba_vec,
-+          .fno = gen_helper_gvec_uaba_h,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_16 },
-+        { .fni4 = gen_uaba_i32,
-+          .fniv = gen_uaba_vec,
-+          .fno = gen_helper_gvec_uaba_s,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_32 },
-+        { .fni8 = gen_uaba_i64,
-+          .fniv = gen_uaba_vec,
-+          .fno = gen_helper_gvec_uaba_d,
-+          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-+          .opt_opc = vecop_list,
-+          .load_dest = true,
-+          .vece = MO_64 },
-+    };
-+    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, opr_sz, max_sz, &ops[vece]);
-+}
-+
- /* Translate a NEON data processing instruction.  Return nonzero if the
-    instruction is invalid.
-    We process data in a mixture of 32-bit and 64-bit chunks.
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-             }
-             return 0;
-+        case NEON_3R_VABA:
-+            if (u) {
-+                gen_gvec_uaba(size, rd_ofs, rn_ofs, rm_ofs,
-+                              vec_size, vec_size);
-+            } else {
-+                gen_gvec_saba(size, rd_ofs, rn_ofs, rm_ofs,
-+                              vec_size, vec_size);
-+            }
-+            return 0;
-+
-         case NEON_3R_VADD_VSUB:
-         case NEON_3R_LOGIC:
-         case NEON_3R_VMAX:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VQRSHL:
-             GEN_NEON_INTEGER_OP_ENV(qrshl);
-             break;
--        case NEON_3R_VABA:
--            GEN_NEON_INTEGER_OP(abd);
--            tcg_temp_free_i32(tmp2);
--            tmp2 = neon_load_reg(rd, pass);
--            gen_neon_add(size, tmp, tmp2);
--            break;
-         case NEON_3R_VPMAX:
-             GEN_NEON_INTEGER_OP(pmax);
-             break;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_ABD(gvec_uabd_s, uint32_t)
- DO_ABD(gvec_uabd_d, uint64_t)
- #undef DO_ABD
-+
-+#define DO_ABA(NAME, TYPE)                                      \
-+void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc)  \
-+{                                                               \
-+    intptr_t i, opr_sz = simd_oprsz(desc);                      \
-+    TYPE *d = vd, *n = vn, *m = vm;                             \
-+                                                                \
-+    for (i = 0; i < opr_sz / sizeof(TYPE); ++i) {               \
-+        d[i] += n[i] < m[i] ? m[i] - n[i] : n[i] - m[i];        \
-+    }                                                           \
-+    clear_tail(d, opr_sz, simd_maxsz(desc));                    \
-+}
-+
-+DO_ABA(gvec_saba_b, int8_t)
-+DO_ABA(gvec_saba_h, int16_t)
-+DO_ABA(gvec_saba_s, int32_t)
-+DO_ABA(gvec_saba_d, int64_t)
-+
-+DO_ABA(gvec_uaba_b, uint8_t)
-+DO_ABA(gvec_uaba_h, uint16_t)
-+DO_ABA(gvec_uaba_s, uint32_t)
-+DO_ABA(gvec_uaba_d, uint64_t)
-+
-+#undef DO_ABA
---
-.20.1

Mostly this is patches from me and RTH cleaning up and doing
more decodetree conversion for AArch32 Neon. The major new feature
is Dongjiu Geng's patchset to report host memory errors to KVM guests;
also a new aspeed board from Patrick Williams.

thanks
-- PMM

The following changes since commit 035b448b84f3557206abc44d786c5d3db2638f7d:

Merge remote-tracking branch 'remotes/gkurz/tags/9p-next-2020-05-14' into staging (2020-05-14 10:58:30 +0100)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200514

for you to fetch changes up to e95485f85657be21135c17a9226e297c21e73360:

target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree (2020-05-14 15:03:09 +0100)

----------------------------------------------------------------
target-arm queue:
 * target/arm: Use correct GDB XML for M-profile cores
 * target/arm: Code cleanup to use gvec APIs better
 * aspeed: Add support for the sonorapass-bmc board
 * target/arm: Support reporting KVM host memory errors
   to the guest via ACPI notifications
 * target/arm: Finish conversion of Neon 3-reg-same insns to decodetree

----------------------------------------------------------------
Dongjiu Geng (10):
      acpi: nvdimm: change NVDIMM_UUID_LE to a common macro
      hw/arm/virt: Introduce a RAS machine option
      docs: APEI GHES generation and CPER record description
      ACPI: Build related register address fields via hardware error fw_cfg blob
      ACPI: Build Hardware Error Source Table
      ACPI: Record the Generic Error Status Block address
      KVM: Move hwpoison page related functions into kvm-all.c
      ACPI: Record Generic Error Status Block(GESB) table
      target-arm: kvm64: handle SIGBUS signal from kernel or KVM
      MAINTAINERS: Add ACPI/HEST/GHES entries

Patrick Williams (1):
      aspeed: Add support for the sonorapass-bmc board

Peter Maydell (18):
      target/arm: Use correct GDB XML for M-profile cores
      target/arm: Convert Neon 3-reg-same VQRDMLAH/VQRDMLSH to decodetree
      target/arm: Convert Neon 3-reg-same SHA to decodetree
      target/arm: Convert Neon 64-bit element 3-reg-same insns
      target/arm: Convert Neon VHADD 3-reg-same insns
      target/arm: Convert Neon VABA/VABD 3-reg-same to decodetree
      target/arm: Convert Neon VRHADD, VHSUB 3-reg-same insns to decodetree
      target/arm: Convert Neon VQSHL, VRSHL, VQRSHL 3-reg-same insns to decodetree
      target/arm: Convert Neon VPMAX/VPMIN 3-reg-same insns to decodetree
      target/arm: Convert Neon VPADD 3-reg-same insns to decodetree
      target/arm: Convert Neon VQDMULH/VQRDMULH 3-reg-same to decodetree
      target/arm: Convert Neon VADD, VSUB, VABD 3-reg-same insns to decodetree
      target/arm: Convert Neon VPMIN/VPMAX/VPADD float 3-reg-same insns to decodetree
      target/arm: Convert Neon fp VMUL, VMLA, VMLS 3-reg-same insns to decodetree
      target/arm: Convert Neon 3-reg-same compare insns to decodetree
      target/arm: Move 'env' argument of recps_f32 and rsqrts_f32 helpers to usual place
      target/arm: Convert Neon fp VMAX/VMIN/VMAXNM/VMINNM/VRECPS/VRSQRTS to decodetree
      target/arm: Convert NEON VFMA, VFMS 3-reg-same insns to decodetree

Richard Henderson (16):
      target/arm: Create gen_gvec_[us]sra
      target/arm: Create gen_gvec_{u,s}{rshr,rsra}
      target/arm: Create gen_gvec_{sri,sli}
      target/arm: Remove unnecessary range check for VSHL
      target/arm: Tidy handle_vec_simd_shri
      target/arm: Create gen_gvec_{ceq,clt,cle,cgt,cge}0
      target/arm: Create gen_gvec_{mla,mls}
      target/arm: Swap argument order for VSHL during decode
      target/arm: Create gen_gvec_{cmtst,ushl,sshl}
      target/arm: Create gen_gvec_{uqadd, sqadd, uqsub, sqsub}
      target/arm: Remove fp_status from helper_{recpe, rsqrte}_u32
      target/arm: Create gen_gvec_{qrdmla,qrdmls}
      target/arm: Pass pointer to qc to qrdmla/qrdmls
      target/arm: Clear tail in gvec_fmul_idx_*, gvec_fmla_idx_*
      target/arm: Vectorize SABD/UABD
      target/arm: Vectorize SABA/UABA

GDB's remote protocol requires M-profile cores to use the feature
name 'org.gnu.gdb.arm.m-profile' instead of the 'org.gnu.gdb.arm.core'
feature used for A- and R-profile cores. We weren't doing this, which
meant GDB treated our M-profile cores like A-profile ones. This mostly
doesn't matter, but for instance means that it doesn't correctly
handle backtraces where an M-profile exception frame is involved.

Ship a copy of GDB's arm-m-profile.xml and use it on the M-profile
cores.  The integer registers have the same offsets as the
arm-core.xml, but register 25 is the M-profile XPSR rather than the
A-profile CPSR, so we need to update arm_cpu_gdb_read_register() and
arm_cpu_gdb_write_register() to handle XSPR reads and writes.

Fixes: https://bugs.launchpad.net/qemu/+bug/1877136
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200507134755.13997-1-peter.maydell@linaro.org
---
 configure                 |  4 ++--
 target/arm/cpu_tcg.c      |  1 +
 target/arm/gdbstub.c      | 22 ++++++++++++++++++----
 gdb-xml/arm-m-profile.xml | 27 +++++++++++++++++++++++++++
 4 files changed, 48 insertions(+), 6 deletions(-)
 create mode 100644 gdb-xml/arm-m-profile.xml

diff --git a/configure b/configure
index XXXXXXX..XXXXXXX 100755
--- a/configure
+++ b/configure
@@ -XXX,XX +XXX,XX @@ case "$target_name" in
     TARGET_SYSTBL_ABI=common,oabi
     bflt="yes"
     mttcg="yes"
-    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
+    gdb_xml_files="arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
   ;;
   aarch64|aarch64_be)
     TARGET_ARCH=aarch64
     TARGET_BASE_ARCH=arm
     bflt="yes"
     mttcg="yes"
-    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml"
+    gdb_xml_files="aarch64-core.xml aarch64-fpu.xml arm-core.xml arm-vfp.xml arm-vfp3.xml arm-neon.xml arm-m-profile.xml"
   ;;
   cris)
   ;;
diff --git a/target/arm/cpu_tcg.c b/target/arm/cpu_tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu_tcg.c
+++ b/target/arm/cpu_tcg.c
@@ -XXX,XX +XXX,XX @@ static void arm_v7m_class_init(ObjectClass *oc, void *data)
 #endif
 
     cc->cpu_exec_interrupt = arm_v7m_cpu_exec_interrupt;
+    cc->gdb_core_xml_file = "arm-m-profile.xml";
 }
 
 static const ARMCPUInfo arm_tcg_cpus[] = {
diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/gdbstub.c
+++ b/target/arm/gdbstub.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_read_register(CPUState *cs, GByteArray *mem_buf, int n)
         }
         return gdb_get_reg32(mem_buf, 0);
     case 25:
-        /* CPSR */
-        return gdb_get_reg32(mem_buf, cpsr_read(env));
+        /* CPSR, or XPSR for M-profile */
+        if (arm_feature(env, ARM_FEATURE_M)) {
+            return gdb_get_reg32(mem_buf, xpsr_read(env));
+        } else {
+            return gdb_get_reg32(mem_buf, cpsr_read(env));
+        }
     }
     /* Unknown register.  */
     return 0;
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
         }
         return 4;
     case 25:
-        /* CPSR */
-        cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
+        /* CPSR, or XPSR for M-profile */
+        if (arm_feature(env, ARM_FEATURE_M)) {
+            /*
+             * Don't allow writing to XPSR.Exception as it can cause
+             * a transition into or out of handler mode (it's not
+             * writeable via the MSR insn so this is a reasonable
+             * restriction). Other fields are safe to update.
+             */
+            xpsr_write(env, tmp, ~XPSR_EXCP);
+        } else {
+            cpsr_write(env, tmp, 0xffffffff, CPSRWriteByGDBStub);
+        }
         return 4;
     }
     /* Unknown register.  */
diff --git a/gdb-xml/arm-m-profile.xml b/gdb-xml/arm-m-profile.xml
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/gdb-xml/arm-m-profile.xml
@@ -XXX,XX +XXX,XX @@
+<?xml version="1.0"?>
+
+
+<!DOCTYPE feature SYSTEM "gdb-target.dtd">
+<feature name="org.gnu.gdb.arm.m-profile">
+  <reg name="r0" bitsize="32"/>
+  <reg name="r1" bitsize="32"/>
+  <reg name="r2" bitsize="32"/>
+  <reg name="r3" bitsize="32"/>
+  <reg name="r4" bitsize="32"/>
+  <reg name="r5" bitsize="32"/>
+  <reg name="r6" bitsize="32"/>
+  <reg name="r7" bitsize="32"/>
+  <reg name="r8" bitsize="32"/>
+  <reg name="r9" bitsize="32"/>
+  <reg name="r10" bitsize="32"/>
+  <reg name="r11" bitsize="32"/>
+  <reg name="r12" bitsize="32"/>
+  <reg name="sp" bitsize="32" type="data_ptr"/>
+  <reg name="lr" bitsize="32"/>
+  <reg name="pc" bitsize="32" type="code_ptr"/>
+  <reg name="xpsr" bitsize="32" regnum="25"/>
+</feature>
-- 
2.20.1