Series comparison

-[PULL 00/52] target-arm queue
+[PULL 00/35] target-arm queue
-Big pullreq this week, though none of the new features are
+Nothing earth-shaking in here, just a lot of refactoring and cleanup
-particularly earthshaking. Most of the bulk is from code cleanup
+and a few bugfixes. I suspect I'll have another pullreq to come in
-patches from me or rth.
+the early part of next week...
-thanks
+The following changes since commit 19591e9e0938ea5066984553c256a043bd5d822f:
 -- PMM
-The following changes since commit b651b80822fa8cb66ca30087ac7fbc75507ae5d2:
+  Merge remote-tracking branch 'remotes/mst/tags/for_upstream' into staging (2020-08-27 16:59:02 +0100)
   Merge remote-tracking branch 'remotes/vivier2/tags/linux-user-for-5.0-pull-request' into staging (2020-02-20 17:35:42 +0000)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200221
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200828
-for you to fetch changes up to 270a679b3f950d7c4c600f324aab8bff292d0971:
+for you to fetch changes up to ed78849d9711805bda37ee026018d6ee7a606d0e:
-  target/arm: Add missing checks for fpsp_v2 (2020-02-21 12:54:25 +0000)
+  target/arm: Convert sq{, r}dmulh to gvec for aa64 advsimd (2020-08-28 10:02:50 +0100)
 ----------------------------------------------------------------
 target-arm queue:
- * aspeed/scu: Implement chip ID register
+ * target/arm: Cleanup and refactoring preparatory to SVE2
- * hw/misc/iotkit-secctl: Fix writing to 'PPC Interrupt Clear' register
+ * armsse: Define ARMSSEClass correctly
- * mainstone: Make providing flash images non-mandatory
+ * hw/misc/unimp: Improve information provided in log messages
- * z2: Make providing flash images non-mandatory
+ * hw/qdev-clock: Avoid calling qdev_connect_clock_in after DeviceRealize
- * Fix failures to flush SVE high bits after AdvSIMD INS/ZIP/UZP/TRN/TBL/TBX/EXT
+ * hw/arm/xilinx_zynq: Call qdev_connect_clock_in() before DeviceRealize
- * Minor performance improvement: spend less time recalculating hflags values
+ * hw/net/allwinner-sun8i-emac: Use AddressSpace for DMA transfers
- * Code cleanup to isar_feature function tests
+ * hw/sd/allwinner-sdhost: Use AddressSpace for DMA transfers
- * Implement ARMv8.1-PMU and ARMv8.4-PMU extensions
+ * target/arm: Fill in the WnR syndrome bit in mte_check_fail
- * Bugfix: correct handling of PMCR_EL0.LC bit
+ * target/arm: Clarify HCR_EL2 ARMCPRegInfo type
- * Bugfix: correct definition of PMCRDP
+ * hw/arm/musicpal: Use AddressSpace for DMA transfers
- * Correctly implement ACTLR2, HACTLR2
+ * hw/clock: Minor cleanups
- * allwinner: Wire up USB ports
+ * hw/arm/sbsa-ref: fix typo breaking PCIe IRQs
  * Vectorize emulation of USHL, SSHL, PMUL*
  * xilinx_spips: Correct the number of dummy cycles for the FAST_READ_4 cmd
  * sh4: Fix PCI ISA IO memory subregion
  * Code cleanup to use more isar_feature tests and fewer ARM_FEATURE_* tests
 ----------------------------------------------------------------
-Francisco Iglesias (1):
+Eduardo Habkost (1):
-      xilinx_spips: Correct the number of dummy cycles for the FAST_READ_4 cmd
+      armsse: Define ARMSSEClass correctly
-Guenter Roeck (6):
+Graeme Gregory (1):
-      mainstone: Make providing flash images non-mandatory
+      hw/arm/sbsa-ref: fix typo breaking PCIe IRQs
       z2: Make providing flash images non-mandatory
       hw: usb: hcd-ohci: Move OHCISysBusState and TYPE_SYSBUS_OHCI to include file
       hcd-ehci: Introduce "companion-enable" sysbus property
       arm: allwinner: Wire up USB ports
       sh4: Fix PCI ISA IO memory subregion
-Joel Stanley (2):
+Philippe Mathieu-Daudé (14):
-      aspeed/scu: Create separate write callbacks
+      hw/clock: Remove unused clock_init*() functions
-      aspeed/scu: Implement chip ID register
+      hw/clock: Let clock_set() return boolean value
       hw/clock: Only propagate clock changes if the clock is changed
       hw/arm/musicpal: Use AddressSpace for DMA transfers
       target/arm: Clarify HCR_EL2 ARMCPRegInfo type
       hw/sd/allwinner-sdhost: Use AddressSpace for DMA transfers
       hw/net/allwinner-sun8i-emac: Use AddressSpace for DMA transfers
       hw/arm/xilinx_zynq: Uninline cadence_uart_create()
       hw/arm/xilinx_zynq: Call qdev_connect_clock_in() before DeviceRealize
       hw/qdev-clock: Uninline qdev_connect_clock_in()
       hw/qdev-clock: Avoid calling qdev_connect_clock_in after DeviceRealize
       hw/misc/unimp: Display value after offset
       hw/misc/unimp: Display the value with width of the access size
       hw/misc/unimp: Display the offset with width of the region size
-Peter Maydell (21):
+Richard Henderson (19):
-      target/arm: Add _aa32_ to isar_feature functions testing 32-bit ID registers
+      target/arm: Pass the entire mte descriptor to mte_check_fail
-      target/arm: Check aa32_pan in take_aarch32_exception(), not aa64_pan
+      target/arm: Fill in the WnR syndrome bit in mte_check_fail
-      target/arm: Add isar_feature_any_fp16 and document naming/usage conventions
+      qemu/int128: Add int128_lshift
-      target/arm: Define and use any_predinv isar_feature test
+      target/arm: Split out gen_gvec_fn_zz
-      target/arm: Factor out PMU register definitions
+      target/arm: Split out gen_gvec_fn_zzz, do_zzz_fn
-      target/arm: Add and use FIELD definitions for ID_AA64DFR0_EL1
+      target/arm: Rearrange {sve,fp}_check_access assert
-      target/arm: Use FIELD macros for clearing ID_DFR0 PERFMON field
+      target/arm: Merge do_vector2_p into do_mov_p
-      target/arm: Define an aa32_pmu_8_1 isar feature test function
+      target/arm: Clean up 4-operand predicate expansion
-      target/arm: Add _aa64_ and _any_ versions of pmu_8_1 isar checks
+      target/arm: Use tcg_gen_gvec_bitsel for trans_SEL_pppp
-      target/arm: Stop assuming DBGDIDR always exists
+      target/arm: Split out gen_gvec_ool_zzzp
-      target/arm: Move DBGDIDR into ARMISARegisters
+      target/arm: Merge helper_sve_clr_* and helper_sve_movz_*
-      target/arm: Read debug-related ID registers from KVM
+      target/arm: Split out gen_gvec_ool_zzp
-      target/arm: Implement ARMv8.1-PMU extension
+      target/arm: Split out gen_gvec_ool_zzz
-      target/arm: Implement ARMv8.4-PMU extension
+      target/arm: Split out gen_gvec_ool_zz
-      target/arm: Provide ARMv8.4-PMU in '-cpu max'
+      target/arm: Tidy SVE tszimm shift formats
-      target/arm: Correct definition of PMCRDP
+      target/arm: Generalize inl_qrdmlah_* helper functions
-      target/arm: Correct handling of PMCR_EL0.LC bit
+      target/arm: Convert integer multiply (indexed) to gvec for aa64 advsimd
-      target/arm: Test correct register in aa32_pan and aa32_ats1e1 checks
+      target/arm: Convert integer multiply-add (indexed) to gvec for aa64 advsimd
-      target/arm: Use isar_feature function for testing AA32HPD feature
+      target/arm: Convert sq{, r}dmulh to gvec for aa64 advsimd
       target/arm: Use FIELD_EX32 for testing 32-bit fields
       target/arm: Correctly implement ACTLR2, HACTLR2
-Philippe Mathieu-Daudé (1):
+ include/hw/arm/armsse.h               |   2 +-
-      hw/misc/iotkit-secctl: Fix writing to 'PPC Interrupt Clear' register
+ include/hw/char/cadence_uart.h        |  17 --
  include/hw/clock.h                    |  30 +--
  include/hw/misc/unimp.h               |   1 +
  include/hw/net/allwinner-sun8i-emac.h |   6 +
  include/hw/qdev-clock.h               |   8 +-
  include/hw/sd/allwinner-sdhost.h      |   6 +
  include/qemu/int128.h                 |  16 ++
  target/arm/helper-sve.h               |   5 -
  target/arm/helper.h                   |  28 +++
  target/arm/translate.h                |   1 +
  target/arm/sve.decode                 |  35 ++-
  hw/arm/allwinner-a10.c                |   2 +
  hw/arm/allwinner-h3.c                 |   4 +
  hw/arm/armsse.c                       |   1 +
  hw/arm/musicpal.c                     |  45 ++--
  hw/arm/sbsa-ref.c                     |   2 +-
  hw/arm/xilinx_zynq.c                  |  24 +-
  hw/core/clock.c                       |   7 +-
  hw/core/qdev-clock.c                  |   6 +
  hw/misc/unimp.c                       |  14 +-
  hw/net/allwinner-sun8i-emac.c         |  46 ++--
  hw/sd/allwinner-sdhost.c              |  37 +++-
  target/arm/helper.c                   |   1 -
  target/arm/mte_helper.c               |  19 +-
  target/arm/sve_helper.c               |  70 ++----
  target/arm/translate-a64.c            | 110 ++++++++--
  target/arm/translate-sve.c            | 399 ++++++++++++++--------------------
  target/arm/vec_helper.c               | 182 +++++++++++-----
 files changed, 629 insertions(+), 495 deletions(-)
-Richard Henderson (21):
-      target/arm: Flush high bits of sve register after AdvSIMD EXT
-      target/arm: Flush high bits of sve register after AdvSIMD TBL/TBX
-      target/arm: Flush high bits of sve register after AdvSIMD ZIP/UZP/TRN
-      target/arm: Flush high bits of sve register after AdvSIMD INS
-      target/arm: Use bit 55 explicitly for pauth
-      target/arm: Fix select for aa64_va_parameters_both
-      target/arm: Remove ttbr1_valid check from get_phys_addr_lpae
-      target/arm: Split out aa64_va_parameter_tbi, aa64_va_parameter_tbid
-      target/arm: Vectorize USHL and SSHL
-      target/arm: Convert PMUL.8 to gvec
-      target/arm: Convert PMULL.64 to gvec
-      target/arm: Convert PMULL.8 to gvec
-      target/arm: Rename isar_feature_aa32_simd_r32
-      target/arm: Use isar_feature_aa32_simd_r32 more places
-      target/arm: Set MVFR0.FPSP for ARMv5 cpus
-      target/arm: Add isar_feature_aa32_simd_r16
-      target/arm: Rename isar_feature_aa32_fpdp_v2
-      target/arm: Add isar_feature_aa32_{fpsp_v2, fpsp_v3, fpdp_v3}
-      target/arm: Perform fpdp_v2 check first
-      target/arm: Replace ARM_FEATURE_VFP3 checks with fp{sp, dp}_v3
-      target/arm: Add missing checks for fpsp_v2
- hw/usb/hcd-ohci.h              |  16 ++
- include/hw/arm/allwinner-a10.h |   6 +
- target/arm/cpu.h               | 173 ++++++++++++---
- target/arm/helper-sve.h        |   2 +
- target/arm/helper.h            |  21 +-
- target/arm/internals.h         |  47 +++-
- target/arm/translate.h         |   6 +
- hw/arm/allwinner-a10.c         |  43 ++++
- hw/arm/mainstone.c             |  11 +-
- hw/arm/z2.c                    |   6 -
- hw/intc/armv7m_nvic.c          |  30 +--
- hw/misc/aspeed_scu.c           |  93 ++++++--
- hw/misc/iotkit-secctl.c        |   2 +-
- hw/sh4/sh_pci.c                |  11 +-
- hw/ssi/xilinx_spips.c          |   2 +-
- hw/usb/hcd-ehci-sysbus.c       |   2 +
- hw/usb/hcd-ohci.c              |  15 --
- linux-user/arm/signal.c        |   4 +-
- linux-user/elfload.c           |   4 +-
- target/arm/arch_dump.c         |  11 +-
- target/arm/cpu.c               | 175 +++++++--------
- target/arm/cpu64.c             |  58 +++--
- target/arm/debug_helper.c      |   6 +-
- target/arm/helper.c            | 472 +++++++++++++++++++++++------------------
- target/arm/kvm32.c             |  25 +++
- target/arm/kvm64.c             |  46 ++++
- target/arm/m_helper.c          |  11 +-
- target/arm/machine.c           |   3 +-
- target/arm/neon_helper.c       | 117 ----------
- target/arm/pauth_helper.c      |   3 +-
- target/arm/translate-a64.c     |  92 ++++----
- target/arm/translate-vfp.inc.c | 263 ++++++++++++++---------
- target/arm/translate.c         | 356 ++++++++++++++++++++++++++-----
- target/arm/vec_helper.c        | 211 ++++++++++++++++++
- target/arm/vfp_helper.c        |   2 +-
-files changed, 1564 insertions(+), 781 deletions(-)

-[PULL 42/52] xilinx_spips: Correct the number of dummy cycles for the FAST_READ_4 cmd
+[PULL 01/35] hw/arm/sbsa-ref: fix typo breaking PCIe IRQs
-From: Francisco Iglesias <francisco.iglesias@xilinx.com>
+From: Graeme Gregory <graeme@nuviainc.com>
-Correct the number of dummy cycles required by the FAST_READ_4 command (to
+Fixing a typo in a previous patch that translated an "i" to a 1
-be eight, one dummy byte).
+and therefore breaking the allocation of PCIe interrupts. This was
 discovered when virtio-net-pci devices ceased to function correctly.
-Fixes: ef06ca3946 ("xilinx_spips: Add support for RX discard and RX drain")
+Cc: qemu-stable@nongnu.org
-Suggested-by: Cédric Le Goater <clg@kaod.org>
+Fixes: 48ba18e6d3f3 ("hw/arm/sbsa-ref: Simplify by moving the gic in the machine state")
-Signed-off-by: Francisco Iglesias <frasse.iglesias@gmail.com>
+Signed-off-by: Graeme Gregory <graeme@nuviainc.com>
-Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200218113350.6090-1-frasse.iglesias@gmail.com
+Message-id: 20200821083853.356490-1-graeme@nuviainc.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/ssi/xilinx_spips.c | 2 +-
+ hw/arm/sbsa-ref.c | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/hw/ssi/xilinx_spips.c b/hw/ssi/xilinx_spips.c
+diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/ssi/xilinx_spips.c
+--- a/hw/arm/sbsa-ref.c
-+++ b/hw/ssi/xilinx_spips.c
++++ b/hw/arm/sbsa-ref.c
-@@ -XXX,XX +XXX,XX @@ static int xilinx_spips_num_dummies(XilinxQSPIPS *qs, uint8_t command)
+@@ -XXX,XX +XXX,XX @@ static void create_pcie(SBSAMachineState *sms)
-     case FAST_READ:
-     case DOR:
+     for (i = 0; i < GPEX_NUM_IRQS; i++) {
-     case QOR:
+         sysbus_connect_irq(SYS_BUS_DEVICE(dev), i,
-+    case FAST_READ_4:
+-                           qdev_get_gpio_in(sms->gic, irq + 1));
-     case DOR_4:
++                           qdev_get_gpio_in(sms->gic, irq + i));
-     case QOR_4:
+         gpex_set_irq_num(GPEX_HOST(dev), i, irq + i);
-         return 1;
+     }
-     case DIOR:
 -    case FAST_READ_4:
      case DIOR_4:
          return 2;
      case QIOR:
 --
 .20.1

-[PULL 35/52] hw: usb: hcd-ohci: Move OHCISysBusState and TYPE_SYSBUS_OHCI to include file
+[PULL 02/35] hw/clock: Remove unused clock_init*() functions
-From: Guenter Roeck <linux@roeck-us.net>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-We need to be able to use OHCISysBusState outside hcd-ohci.c, so move it
+clock_init*() inlined funtions are simple wrappers around
-to its include file.
+clock_set*() and are not used. Remove them in favor of clock_set*().
-Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Signed-off-by: Guenter Roeck <linux@roeck-us.net>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
+Message-id: 20200806123858.30058-2-f4bug@amsat.org
 Message-id: 20200217204812.9857-2-linux@roeck-us.net
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/usb/hcd-ohci.h | 16 ++++++++++++++++
+ include/hw/clock.h | 13 -------------
- hw/usb/hcd-ohci.c | 15 ---------------
+file changed, 13 deletions(-)
 files changed, 16 insertions(+), 15 deletions(-)
-diff --git a/hw/usb/hcd-ohci.h b/hw/usb/hcd-ohci.h
+diff --git a/include/hw/clock.h b/include/hw/clock.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/usb/hcd-ohci.h
+--- a/include/hw/clock.h
-+++ b/hw/usb/hcd-ohci.h
++++ b/include/hw/clock.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static inline bool clock_is_enabled(const Clock *clk)
- #define HCD_OHCI_H
+     return clock_get(clk) != 0;
  #include "sysemu/dma.h"
 +#include "hw/usb.h"
  /* Number of Downstream Ports on the root hub: */
  #define OHCI_MAX_PORTS 15
@@ -XXX,XX +XXX,XX @@ typedef struct OHCIState {
      void (*ohci_die)(struct OHCIState *ohci);
  } OHCIState;
 +#define TYPE_SYSBUS_OHCI "sysbus-ohci"
 +#define SYSBUS_OHCI(obj) OBJECT_CHECK(OHCISysBusState, (obj), TYPE_SYSBUS_OHCI)
 +
 +typedef struct {
 +    /*< private >*/
 +    SysBusDevice parent_obj;
 +    /*< public >*/
 +
 +    OHCIState ohci;
 +    char *masterbus;
 +    uint32_t num_ports;
 +    uint32_t firstport;
 +    dma_addr_t dma_offset;
 +} OHCISysBusState;
 +
  extern const VMStateDescription vmstate_ohci_state;
  void usb_ohci_init(OHCIState *ohci, DeviceState *dev, uint32_t num_ports,
 diff --git a/hw/usb/hcd-ohci.c b/hw/usb/hcd-ohci.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/usb/hcd-ohci.c
 +++ b/hw/usb/hcd-ohci.c
@@ -XXX,XX +XXX,XX @@ void ohci_sysbus_die(struct OHCIState *ohci)
      ohci_bus_stop(ohci);
  }
--#define TYPE_SYSBUS_OHCI "sysbus-ohci"
+-static inline void clock_init(Clock *clk, uint64_t value)
--#define SYSBUS_OHCI(obj) OBJECT_CHECK(OHCISysBusState, (obj), TYPE_SYSBUS_OHCI)
+-{
 -    clock_set(clk, value);
 -}
 -static inline void clock_init_hz(Clock *clk, uint64_t value)
 -{
 -    clock_set_hz(clk, value);
 -}
 -static inline void clock_init_ns(Clock *clk, uint64_t value)
 -{
 -    clock_set_ns(clk, value);
 -}
 -
--typedef struct {
+ #endif /* QEMU_HW_CLOCK_H */
 -    /*< private >*/
 -    SysBusDevice parent_obj;
 -    /*< public >*/
 -
 -    OHCIState ohci;
 -    char *masterbus;
 -    uint32_t num_ports;
 -    uint32_t firstport;
 -    dma_addr_t dma_offset;
 -} OHCISysBusState;
 -
  static void ohci_realize_pxa(DeviceState *dev, Error **errp)
  {
      OHCISysBusState *s = SYSBUS_OHCI(dev);
 --
 .20.1

-[PULL 52/52] target/arm: Add missing checks for fpsp_v2
+[PULL 03/35] hw/clock: Let clock_set() return boolean value
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-We will eventually remove the early ARM_FEATURE_VFP test,
+Let clock_set() return a boolean value whether the clock
-so add a proper test for each trans_* that does not already
+has been updated or not.
 have another ISA test.
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200214181547.21408-11-richard.henderson@linaro.org
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200806123858.30058-3-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-vfp.inc.c | 78 ++++++++++++++++++++++++++++++----
+ include/hw/clock.h | 12 +++++++-----
-file changed, 69 insertions(+), 9 deletions(-)
+ hw/core/clock.c    |  7 ++++++-
 files changed, 13 insertions(+), 6 deletions(-)
-diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
+diff --git a/include/hw/clock.h b/include/hw/clock.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.inc.c
+--- a/include/hw/clock.h
-+++ b/target/arm/translate-vfp.inc.c
++++ b/include/hw/clock.h
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_to_gp(DisasContext *s, arg_VMOV_to_gp *a)
+@@ -XXX,XX +XXX,XX @@ void clock_set_source(Clock *clk, Clock *src);
-     int pass;
+  * @value: the clock's value, 0 means unclocked
-     uint32_t offset;
+  *
+  * Set the local cached period value of @clk to @value.
-+    /* SIZE == 2 is a VFP instruction; otherwise NEON.  */
++ *
-+    if (a->size == 2
++ * @return: true if the clock is changed.
-+        ? !dc_isar_feature(aa32_fpsp_v2, s)
+  */
-+        : !arm_dc_feature(s, ARM_FEATURE_NEON)) {
+-void clock_set(Clock *clk, uint64_t value);
 +bool clock_set(Clock *clk, uint64_t value);
 -static inline void clock_set_hz(Clock *clk, unsigned hz)
 +static inline bool clock_set_hz(Clock *clk, unsigned hz)
  {
 -    clock_set(clk, CLOCK_PERIOD_FROM_HZ(hz));
 +    return clock_set(clk, CLOCK_PERIOD_FROM_HZ(hz));
  }
 -static inline void clock_set_ns(Clock *clk, unsigned ns)
 +static inline bool clock_set_ns(Clock *clk, unsigned ns)
  {
 -    clock_set(clk, CLOCK_PERIOD_FROM_NS(ns));
 +    return clock_set(clk, CLOCK_PERIOD_FROM_NS(ns));
  }
  /**
 diff --git a/hw/core/clock.c b/hw/core/clock.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/core/clock.c
 +++ b/hw/core/clock.c
@@ -XXX,XX +XXX,XX @@ void clock_clear_callback(Clock *clk)
      clock_set_callback(clk, NULL, NULL);
  }
 -void clock_set(Clock *clk, uint64_t period)
 +bool clock_set(Clock *clk, uint64_t period)
  {
 +    if (clk->period == period) {
 +        return false;
 +    }
+     trace_clock_set(CLOCK_PATH(clk), CLOCK_PERIOD_TO_NS(clk->period),
+                     CLOCK_PERIOD_TO_NS(period));
+     clk->period = period;
 +
-     /* UNDEF accesses to D16-D31 if they don't exist */
++    return true;
-     if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
+ }
-         return false;
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_to_gp(DisasContext *s, arg_VMOV_to_gp *a)
+ static void clock_propagate_period(Clock *clk, bool call_callbacks)
      pass = extract32(offset, 2, 1);
      offset = extract32(offset, 0, 2) * 8;
 -    if (a->size != 2 && !arm_dc_feature(s, ARM_FEATURE_NEON)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_from_gp(DisasContext *s, arg_VMOV_from_gp *a)
      int pass;
      uint32_t offset;
 +    /* SIZE == 2 is a VFP instruction; otherwise NEON.  */
 +    if (a->size == 2
 +        ? !dc_isar_feature(aa32_fpsp_v2, s)
 +        : !arm_dc_feature(s, ARM_FEATURE_NEON)) {
 +        return false;
 +    }
 +
      /* UNDEF accesses to D16-D31 if they don't exist */
      if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
          return false;
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_from_gp(DisasContext *s, arg_VMOV_from_gp *a)
      pass = extract32(offset, 2, 1);
      offset = extract32(offset, 0, 2) * 8;
 -    if (a->size != 2 && !arm_dc_feature(s, ARM_FEATURE_NEON)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
      TCGv_i32 tmp;
      bool ignore_vfp_enabled = false;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (arm_dc_feature(s, ARM_FEATURE_M)) {
          /*
           * The only M-profile VFP vmrs/vmsr sysreg is FPSCR.
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_single(DisasContext *s, arg_VMOV_single *a)
  {
      TCGv_i32 tmp;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_64_sp(DisasContext *s, arg_VMOV_64_sp *a)
  {
      TCGv_i32 tmp;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      /*
       * VMOV between two general-purpose registers and two single precision
       * floating point registers
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_64_dp(DisasContext *s, arg_VMOV_64_dp *a)
      /*
       * VMOV between two general-purpose registers and one double precision
 -     * floating point register
 +     * floating point register.  Note that this does not require support
 +     * for double precision arithmetic.
       */
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
      /* UNDEF accesses to D16-D31 if they don't exist */
      if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDR_VSTR_sp(DisasContext *s, arg_VLDR_VSTR_sp *a)
      uint32_t offset;
      TCGv_i32 addr, tmp;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDR_VSTR_dp(DisasContext *s, arg_VLDR_VSTR_dp *a)
      TCGv_i32 addr;
      TCGv_i64 tmp;
 +    /* Note that this does not require support for double arithmetic.  */
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      /* UNDEF accesses to D16-D31 if they don't exist */
      if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDM_VSTM_sp(DisasContext *s, arg_VLDM_VSTM_sp *a)
      TCGv_i32 addr, tmp;
      int i, n;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      n = a->imm;
      if (n == 0 || (a->vd + n) > 32) {
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDM_VSTM_dp(DisasContext *s, arg_VLDM_VSTM_dp *a)
      TCGv_i64 tmp;
      int i, n;
 +    /* Note that this does not require support for double arithmetic.  */
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      n = a->imm >> 1;
      if (n == 0 || (a->vd + n) > 32 || n > 16) {
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_sp(DisasContext *s, VFPGen3OpSPFn *fn,
      TCGv_i32 f0, f1, fd;
      TCGv_ptr fpst;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_fpshvec, s) &&
          (veclen != 0 || s->vec_stride != 0)) {
          return false;
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_sp(DisasContext *s, VFPGen2OpSPFn *fn, int vd, int vm)
      int veclen = s->vec_len;
      TCGv_i32 f0, fd;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_fpshvec, s) &&
          (veclen != 0 || s->vec_stride != 0)) {
          return false;
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_sp(DisasContext *s, arg_VCMP_sp *a)
  {
      TCGv_i32 vd, vm;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      /* Vm/M bits must be zero for the Z variant */
      if (a->z && a->vm != 0) {
          return false;
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_int_sp(DisasContext *s, arg_VCVT_int_sp *a)
      TCGv_i32 vm;
      TCGv_ptr fpst;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp_int(DisasContext *s, arg_VCVT_sp_int *a)
      TCGv_i32 vm;
      TCGv_ptr fpst;
 +    if (!dc_isar_feature(aa32_fpsp_v2, s)) {
 +        return false;
 +    }
 +
      if (!vfp_access_check(s)) {
          return true;
      }
 --
 .20.1

-[PULL 37/52] arm: allwinner: Wire up USB ports
+[PULL 04/35] hw/clock: Only propagate clock changes if the clock is changed
-From: Guenter Roeck <linux@roeck-us.net>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Instantiate EHCI and OHCI controllers on Allwinner A10. OHCI ports are
+Avoid propagating the clock change when the clock does not change.
 modeled as companions of the respective EHCI ports.
-With this patch applied, USB controllers are discovered and instantiated
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-when booting the cubieboard machine with a recent Linux kernel.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20200806123858.30058-4-f4bug@amsat.org
 ehci-platform 1c14000.usb: EHCI Host Controller
 ehci-platform 1c14000.usb: new USB bus registered, assigned bus number 1
 ehci-platform 1c14000.usb: irq 26, io mem 0x01c14000
 ehci-platform 1c14000.usb: USB 2.0 started, EHCI 1.00
 ehci-platform 1c1c000.usb: EHCI Host Controller
 ehci-platform 1c1c000.usb: new USB bus registered, assigned bus number 2
 ehci-platform 1c1c000.usb: irq 31, io mem 0x01c1c000
 ehci-platform 1c1c000.usb: USB 2.0 started, EHCI 1.00
 ohci-platform 1c14400.usb: Generic Platform OHCI controller
 ohci-platform 1c14400.usb: new USB bus registered, assigned bus number 3
 ohci-platform 1c14400.usb: irq 27, io mem 0x01c14400
 ohci-platform 1c1c400.usb: Generic Platform OHCI controller
 ohci-platform 1c1c400.usb: new USB bus registered, assigned bus number 4
 ohci-platform 1c1c400.usb: irq 32, io mem 0x01c1c400
 usb 2-1: new high-speed USB device number 2 using ehci-platform
 usb-storage 2-1:1.0: USB Mass Storage device detected
 scsi host1: usb-storage 2-1:1.0
 usb 3-1: new full-speed USB device number 2 using ohci-platform
 input: QEMU QEMU USB Mouse as /devices/platform/soc/1c14400.usb/usb3/3-1/3-1:1.0/0003:0627:0001.0001/input/input0
 Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
 Signed-off-by: Guenter Roeck <linux@roeck-us.net>
 Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
 Message-id: 20200217204812.9857-4-linux@roeck-us.net
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/arm/allwinner-a10.h |  6 +++++
+ include/hw/clock.h | 5 +++--
- hw/arm/allwinner-a10.c         | 43 ++++++++++++++++++++++++++++++++++
+file changed, 3 insertions(+), 2 deletions(-)
 files changed, 49 insertions(+)
-diff --git a/include/hw/arm/allwinner-a10.h b/include/hw/arm/allwinner-a10.h
+diff --git a/include/hw/clock.h b/include/hw/clock.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/allwinner-a10.h
+--- a/include/hw/clock.h
-+++ b/include/hw/arm/allwinner-a10.h
++++ b/include/hw/clock.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void clock_propagate(Clock *clk);
- #include "hw/intc/allwinner-a10-pic.h"
+  */
- #include "hw/net/allwinner_emac.h"
+ static inline void clock_update(Clock *clk, uint64_t value)
- #include "hw/ide/ahci.h"
+ {
-+#include "hw/usb/hcd-ohci.h"
+-    clock_set(clk, value);
-+#include "hw/usb/hcd-ehci.h"
+-    clock_propagate(clk);
++    if (clock_set(clk, value)) {
- #include "target/arm/cpu.h"
++        clock_propagate(clk);
  #define AW_A10_SDRAM_BASE       0x40000000
 +#define AW_A10_NUM_USB          2
 +
  #define TYPE_AW_A10 "allwinner-a10"
  #define AW_A10(obj) OBJECT_CHECK(AwA10State, (obj), TYPE_AW_A10)
@@ -XXX,XX +XXX,XX @@ typedef struct AwA10State {
      AwEmacState emac;
      AllwinnerAHCIState sata;
      MemoryRegion sram_a;
 +    EHCISysBusState ehci[AW_A10_NUM_USB];
 +    OHCISysBusState ohci[AW_A10_NUM_USB];
  } AwA10State;
  #endif
 diff --git a/hw/arm/allwinner-a10.c b/hw/arm/allwinner-a10.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/allwinner-a10.c
 +++ b/hw/arm/allwinner-a10.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/arm/allwinner-a10.h"
  #include "hw/misc/unimp.h"
  #include "sysemu/sysemu.h"
 +#include "hw/boards.h"
 +#include "hw/usb/hcd-ohci.h"
  #define AW_A10_PIC_REG_BASE     0x01c20400
  #define AW_A10_PIT_REG_BASE     0x01c20c00
  #define AW_A10_UART0_REG_BASE   0x01c28000
  #define AW_A10_EMAC_BASE        0x01c0b000
 +#define AW_A10_EHCI_BASE        0x01c14000
 +#define AW_A10_OHCI_BASE        0x01c14400
  #define AW_A10_SATA_BASE        0x01c18000
  static void aw_a10_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void aw_a10_init(Object *obj)
      sysbus_init_child_obj(obj, "sata", &s->sata, sizeof(s->sata),
                            TYPE_ALLWINNER_AHCI);
 +
 +    if (machine_usb(current_machine)) {
 +        int i;
 +
 +        for (i = 0; i < AW_A10_NUM_USB; i++) {
 +            sysbus_init_child_obj(obj, "ehci[*]", OBJECT(&s->ehci[i]),
 +                                  sizeof(s->ehci[i]), TYPE_PLATFORM_EHCI);
 +            sysbus_init_child_obj(obj, "ohci[*]", OBJECT(&s->ohci[i]),
 +                                  sizeof(s->ohci[i]), TYPE_SYSBUS_OHCI);
 +        }
 +    }
  }
- static void aw_a10_realize(DeviceState *dev, Error **errp)
+ static inline void clock_update_hz(Clock *clk, unsigned hz)
@@ -XXX,XX +XXX,XX @@ static void aw_a10_realize(DeviceState *dev, Error **errp)
      serial_mm_init(get_system_memory(), AW_A10_UART0_REG_BASE, 2,
                     qdev_get_gpio_in(dev, 1),
 , serial_hd(0), DEVICE_NATIVE_ENDIAN);
 +
 +    if (machine_usb(current_machine)) {
 +        int i;
 +
 +        for (i = 0; i < AW_A10_NUM_USB; i++) {
 +            char bus[16];
 +
 +            sprintf(bus, "usb-bus.%d", i);
 +
 +            object_property_set_bool(OBJECT(&s->ehci[i]), true,
 +                                     "companion-enable", &error_fatal);
 +            object_property_set_bool(OBJECT(&s->ehci[i]), true, "realized",
 +                                     &error_fatal);
 +            sysbus_mmio_map(SYS_BUS_DEVICE(&s->ehci[i]), 0,
 +                            AW_A10_EHCI_BASE + i * 0x8000);
 +            sysbus_connect_irq(SYS_BUS_DEVICE(&s->ehci[i]), 0,
 +                               qdev_get_gpio_in(dev, 39 + i));
 +
 +            object_property_set_str(OBJECT(&s->ohci[i]), bus, "masterbus",
 +                                    &error_fatal);
 +            object_property_set_bool(OBJECT(&s->ohci[i]), true, "realized",
 +                                     &error_fatal);
 +            sysbus_mmio_map(SYS_BUS_DEVICE(&s->ohci[i]), 0,
 +                            AW_A10_OHCI_BASE + i * 0x8000);
 +            sysbus_connect_irq(SYS_BUS_DEVICE(&s->ohci[i]), 0,
 +                               qdev_get_gpio_in(dev, 64 + i));
 +        }
 +    }
  }
  static void aw_a10_class_init(ObjectClass *oc, void *data)
 --
 .20.1

-[PULL 31/52] target/arm: Test correct register in aa32_pan and aa32_ats1e1 checks
+[PULL 05/35] hw/arm/musicpal: Use AddressSpace for DMA transfers
-The isar_feature_aa32_pan and isar_feature_aa32_ats1e1 functions
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 are supposed to be testing fields in ID_MMFR3; but a cut-and-paste
 error meant we were looking at MVFR0 instead.
-Fix the functions to look at the right register; this requires
+Allow the device to execute the DMA transfers in a different
-us to move at least id_mmfr3 to the ARMISARegisters struct; we
+AddressSpace.
 choose to move all the ID_MMFRn registers for consistency.
-Fixes: 3d6ad6bb466f
+We keep using the system_memory address space, but via the
 proper dma_memory_access() API.
 Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200814125533.4047-1-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-19-peter.maydell@linaro.org
 ---
- target/arm/cpu.h      |  14 +++---
+ hw/arm/musicpal.c | 45 +++++++++++++++++++++++++++++++--------------
- hw/intc/armv7m_nvic.c |   8 ++--
+file changed, 31 insertions(+), 14 deletions(-)
  target/arm/cpu.c      | 104 +++++++++++++++++++++---------------------
  target/arm/cpu64.c    |  28 ++++++------
  target/arm/helper.c   |  12 ++---
  target/arm/kvm32.c    |  17 +++++++
  target/arm/kvm64.c    |  10 ++++
 files changed, 110 insertions(+), 83 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/hw/arm/musicpal.c b/hw/arm/musicpal.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/hw/arm/musicpal.c
-+++ b/target/arm/cpu.h
++++ b/hw/arm/musicpal.c
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
+@@ -XXX,XX +XXX,XX @@
-         uint32_t id_isar4;
+ #include "hw/audio/wm8750.h"
-         uint32_t id_isar5;
+ #include "sysemu/block-backend.h"
-         uint32_t id_isar6;
+ #include "sysemu/runstate.h"
-+        uint32_t id_mmfr0;
++#include "sysemu/dma.h"
-+        uint32_t id_mmfr1;
+ #include "exec/address-spaces.h"
-+        uint32_t id_mmfr2;
+ #include "ui/pixel_ops.h"
-+        uint32_t id_mmfr3;
+ #include "qemu/cutils.h"
-+        uint32_t id_mmfr4;
+@@ -XXX,XX +XXX,XX @@ typedef struct mv88w8618_eth_state {
-         uint32_t mvfr0;
-         uint32_t mvfr1;
+     MemoryRegion iomem;
-         uint32_t mvfr2;
+     qemu_irq irq;
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
++    MemoryRegion *dma_mr;
-     uint64_t pmceid0;
++    AddressSpace dma_as;
-     uint64_t pmceid1;
+     uint32_t smir;
-     uint32_t id_afr0;
+     uint32_t icr;
--    uint32_t id_mmfr0;
+     uint32_t imr;
--    uint32_t id_mmfr1;
+@@ -XXX,XX +XXX,XX @@ typedef struct mv88w8618_eth_state {
--    uint32_t id_mmfr2;
+     NICConf conf;
--    uint32_t id_mmfr3;
+ } mv88w8618_eth_state;
--    uint32_t id_mmfr4;
-     uint64_t id_aa64afr0;
+-static void eth_rx_desc_put(uint32_t addr, mv88w8618_rx_desc *desc)
-     uint64_t id_aa64afr1;
++static void eth_rx_desc_put(AddressSpace *dma_as, uint32_t addr,
-     uint32_t clidr;
++                            mv88w8618_rx_desc *desc)
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_vminmaxnm(const ARMISARegisters *id)
  static inline bool isar_feature_aa32_pan(const ARMISARegisters *id)
  {
--    return FIELD_EX64(id->mvfr0, ID_MMFR3, PAN) != 0;
+     cpu_to_le32s(&desc->cmdstat);
-+    return FIELD_EX32(id->id_mmfr3, ID_MMFR3, PAN) != 0;
+     cpu_to_le16s(&desc->bytes);
      cpu_to_le16s(&desc->buffer_size);
      cpu_to_le32s(&desc->buffer);
      cpu_to_le32s(&desc->next);
 -    cpu_physical_memory_write(addr, desc, sizeof(*desc));
 +    dma_memory_write(dma_as, addr, desc, sizeof(*desc));
  }
- static inline bool isar_feature_aa32_ats1e1(const ARMISARegisters *id)
+-static void eth_rx_desc_get(uint32_t addr, mv88w8618_rx_desc *desc)
 +static void eth_rx_desc_get(AddressSpace *dma_as, uint32_t addr,
 +                            mv88w8618_rx_desc *desc)
  {
--    return FIELD_EX64(id->mvfr0, ID_MMFR3, PAN) >= 2;
+-    cpu_physical_memory_read(addr, desc, sizeof(*desc));
-+    return FIELD_EX32(id->id_mmfr3, ID_MMFR3, PAN) >= 2;
++    dma_memory_read(dma_as, addr, desc, sizeof(*desc));
      le32_to_cpus(&desc->cmdstat);
      le16_to_cpus(&desc->bytes);
      le16_to_cpus(&desc->buffer_size);
@@ -XXX,XX +XXX,XX @@ static ssize_t eth_receive(NetClientState *nc, const uint8_t *buf, size_t size)
              continue;
          }
          do {
 -            eth_rx_desc_get(desc_addr, &desc);
 +            eth_rx_desc_get(&s->dma_as, desc_addr, &desc);
              if ((desc.cmdstat & MP_ETH_RX_OWN) && desc.buffer_size >= size) {
 -                cpu_physical_memory_write(desc.buffer + s->vlan_header,
 +                dma_memory_write(&s->dma_as, desc.buffer + s->vlan_header,
                                            buf, size);
                  desc.bytes = size + s->vlan_header;
                  desc.cmdstat &= ~MP_ETH_RX_OWN;
@@ -XXX,XX +XXX,XX @@ static ssize_t eth_receive(NetClientState *nc, const uint8_t *buf, size_t size)
                  if (s->icr & s->imr) {
                      qemu_irq_raise(s->irq);
                  }
 -                eth_rx_desc_put(desc_addr, &desc);
 +                eth_rx_desc_put(&s->dma_as, desc_addr, &desc);
                  return size;
              }
              desc_addr = desc.next;
@@ -XXX,XX +XXX,XX @@ static ssize_t eth_receive(NetClientState *nc, const uint8_t *buf, size_t size)
      return size;
  }
- static inline bool isar_feature_aa32_pmu_8_1(const ARMISARegisters *id)
+-static void eth_tx_desc_put(uint32_t addr, mv88w8618_tx_desc *desc)
-diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
++static void eth_tx_desc_put(AddressSpace *dma_as, uint32_t addr,
-index XXXXXXX..XXXXXXX 100644
++                            mv88w8618_tx_desc *desc)
---- a/hw/intc/armv7m_nvic.c
+ {
-+++ b/hw/intc/armv7m_nvic.c
+     cpu_to_le32s(&desc->cmdstat);
-@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
+     cpu_to_le16s(&desc->res);
-     case 0xd4c: /* AFR0.  */
+     cpu_to_le16s(&desc->bytes);
-         return cpu->id_afr0;
+     cpu_to_le32s(&desc->buffer);
-     case 0xd50: /* MMFR0.  */
+     cpu_to_le32s(&desc->next);
--        return cpu->id_mmfr0;
+-    cpu_physical_memory_write(addr, desc, sizeof(*desc));
-+        return cpu->isar.id_mmfr0;
++    dma_memory_write(dma_as, addr, desc, sizeof(*desc));
-     case 0xd54: /* MMFR1.  */
+ }
--        return cpu->id_mmfr1;
-+        return cpu->isar.id_mmfr1;
+-static void eth_tx_desc_get(uint32_t addr, mv88w8618_tx_desc *desc)
-     case 0xd58: /* MMFR2.  */
++static void eth_tx_desc_get(AddressSpace *dma_as, uint32_t addr,
--        return cpu->id_mmfr2;
++                            mv88w8618_tx_desc *desc)
-+        return cpu->isar.id_mmfr2;
+ {
-     case 0xd5c: /* MMFR3.  */
+-    cpu_physical_memory_read(addr, desc, sizeof(*desc));
--        return cpu->id_mmfr3;
++    dma_memory_read(dma_as, addr, desc, sizeof(*desc));
-+        return cpu->isar.id_mmfr3;
+     le32_to_cpus(&desc->cmdstat);
-     case 0xd60: /* ISAR0.  */
+     le16_to_cpus(&desc->res);
-         return cpu->isar.id_isar0;
+     le16_to_cpus(&desc->bytes);
-     case 0xd64: /* ISAR1.  */
+@@ -XXX,XX +XXX,XX @@ static void eth_send(mv88w8618_eth_state *s, int queue_index)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+     int len;
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+     do {
-+++ b/target/arm/cpu.c
+-        eth_tx_desc_get(desc_addr, &desc);
-@@ -XXX,XX +XXX,XX @@ static void arm1136_r2_initfn(Object *obj)
++        eth_tx_desc_get(&s->dma_as, desc_addr, &desc);
-     cpu->id_pfr1 = 0x1;
+         next_desc = desc.next;
-     cpu->isar.id_dfr0 = 0x2;
+         if (desc.cmdstat & MP_ETH_TX_OWN) {
-     cpu->id_afr0 = 0x3;
+             len = desc.bytes;
--    cpu->id_mmfr0 = 0x01130003;
+             if (len < 2048) {
--    cpu->id_mmfr1 = 0x10030302;
+-                cpu_physical_memory_read(desc.buffer, buf, len);
--    cpu->id_mmfr2 = 0x01222110;
++                dma_memory_read(&s->dma_as, desc.buffer, buf, len);
-+    cpu->isar.id_mmfr0 = 0x01130003;
+                 qemu_send_packet(qemu_get_queue(s->nic), buf, len);
-+    cpu->isar.id_mmfr1 = 0x10030302;
+             }
-+    cpu->isar.id_mmfr2 = 0x01222110;
+             desc.cmdstat &= ~MP_ETH_TX_OWN;
-     cpu->isar.id_isar0 = 0x00140011;
+             s->icr |= 1 << (MP_ETH_IRQ_TXLO_BIT - queue_index);
-     cpu->isar.id_isar1 = 0x12002111;
+-            eth_tx_desc_put(desc_addr, &desc);
-     cpu->isar.id_isar2 = 0x11231111;
++            eth_tx_desc_put(&s->dma_as, desc_addr, &desc);
@@ -XXX,XX +XXX,XX @@ static void arm1136_initfn(Object *obj)
      cpu->id_pfr1 = 0x1;
      cpu->isar.id_dfr0 = 0x2;
      cpu->id_afr0 = 0x3;
 -    cpu->id_mmfr0 = 0x01130003;
 -    cpu->id_mmfr1 = 0x10030302;
 -    cpu->id_mmfr2 = 0x01222110;
 +    cpu->isar.id_mmfr0 = 0x01130003;
 +    cpu->isar.id_mmfr1 = 0x10030302;
 +    cpu->isar.id_mmfr2 = 0x01222110;
      cpu->isar.id_isar0 = 0x00140011;
      cpu->isar.id_isar1 = 0x12002111;
      cpu->isar.id_isar2 = 0x11231111;
@@ -XXX,XX +XXX,XX @@ static void arm1176_initfn(Object *obj)
      cpu->id_pfr1 = 0x11;
      cpu->isar.id_dfr0 = 0x33;
      cpu->id_afr0 = 0;
 -    cpu->id_mmfr0 = 0x01130003;
 -    cpu->id_mmfr1 = 0x10030302;
 -    cpu->id_mmfr2 = 0x01222100;
 +    cpu->isar.id_mmfr0 = 0x01130003;
 +    cpu->isar.id_mmfr1 = 0x10030302;
 +    cpu->isar.id_mmfr2 = 0x01222100;
      cpu->isar.id_isar0 = 0x0140011;
      cpu->isar.id_isar1 = 0x12002111;
      cpu->isar.id_isar2 = 0x11231121;
@@ -XXX,XX +XXX,XX @@ static void arm11mpcore_initfn(Object *obj)
      cpu->id_pfr1 = 0x1;
      cpu->isar.id_dfr0 = 0;
      cpu->id_afr0 = 0x2;
 -    cpu->id_mmfr0 = 0x01100103;
 -    cpu->id_mmfr1 = 0x10020302;
 -    cpu->id_mmfr2 = 0x01222000;
 +    cpu->isar.id_mmfr0 = 0x01100103;
 +    cpu->isar.id_mmfr1 = 0x10020302;
 +    cpu->isar.id_mmfr2 = 0x01222000;
      cpu->isar.id_isar0 = 0x00100011;
      cpu->isar.id_isar1 = 0x12002111;
      cpu->isar.id_isar2 = 0x11221011;
@@ -XXX,XX +XXX,XX @@ static void cortex_m3_initfn(Object *obj)
      cpu->id_pfr1 = 0x00000200;
      cpu->isar.id_dfr0 = 0x00100000;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x00000030;
 -    cpu->id_mmfr1 = 0x00000000;
 -    cpu->id_mmfr2 = 0x00000000;
 -    cpu->id_mmfr3 = 0x00000000;
 +    cpu->isar.id_mmfr0 = 0x00000030;
 +    cpu->isar.id_mmfr1 = 0x00000000;
 +    cpu->isar.id_mmfr2 = 0x00000000;
 +    cpu->isar.id_mmfr3 = 0x00000000;
      cpu->isar.id_isar0 = 0x01141110;
      cpu->isar.id_isar1 = 0x02111000;
      cpu->isar.id_isar2 = 0x21112231;
@@ -XXX,XX +XXX,XX @@ static void cortex_m4_initfn(Object *obj)
      cpu->id_pfr1 = 0x00000200;
      cpu->isar.id_dfr0 = 0x00100000;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x00000030;
 -    cpu->id_mmfr1 = 0x00000000;
 -    cpu->id_mmfr2 = 0x00000000;
 -    cpu->id_mmfr3 = 0x00000000;
 +    cpu->isar.id_mmfr0 = 0x00000030;
 +    cpu->isar.id_mmfr1 = 0x00000000;
 +    cpu->isar.id_mmfr2 = 0x00000000;
 +    cpu->isar.id_mmfr3 = 0x00000000;
      cpu->isar.id_isar0 = 0x01141110;
      cpu->isar.id_isar1 = 0x02111000;
      cpu->isar.id_isar2 = 0x21112231;
@@ -XXX,XX +XXX,XX @@ static void cortex_m7_initfn(Object *obj)
      cpu->id_pfr1 = 0x00000200;
      cpu->isar.id_dfr0 = 0x00100000;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x00100030;
 -    cpu->id_mmfr1 = 0x00000000;
 -    cpu->id_mmfr2 = 0x01000000;
 -    cpu->id_mmfr3 = 0x00000000;
 +    cpu->isar.id_mmfr0 = 0x00100030;
 +    cpu->isar.id_mmfr1 = 0x00000000;
 +    cpu->isar.id_mmfr2 = 0x01000000;
 +    cpu->isar.id_mmfr3 = 0x00000000;
      cpu->isar.id_isar0 = 0x01101110;
      cpu->isar.id_isar1 = 0x02112000;
      cpu->isar.id_isar2 = 0x20232231;
@@ -XXX,XX +XXX,XX @@ static void cortex_m33_initfn(Object *obj)
      cpu->id_pfr1 = 0x00000210;
      cpu->isar.id_dfr0 = 0x00200000;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x00101F40;
 -    cpu->id_mmfr1 = 0x00000000;
 -    cpu->id_mmfr2 = 0x01000000;
 -    cpu->id_mmfr3 = 0x00000000;
 +    cpu->isar.id_mmfr0 = 0x00101F40;
 +    cpu->isar.id_mmfr1 = 0x00000000;
 +    cpu->isar.id_mmfr2 = 0x01000000;
 +    cpu->isar.id_mmfr3 = 0x00000000;
      cpu->isar.id_isar0 = 0x01101110;
      cpu->isar.id_isar1 = 0x02212000;
      cpu->isar.id_isar2 = 0x20232232;
@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
      cpu->id_pfr1 = 0x001;
      cpu->isar.id_dfr0 = 0x010400;
      cpu->id_afr0 = 0x0;
 -    cpu->id_mmfr0 = 0x0210030;
 -    cpu->id_mmfr1 = 0x00000000;
 -    cpu->id_mmfr2 = 0x01200000;
 -    cpu->id_mmfr3 = 0x0211;
 +    cpu->isar.id_mmfr0 = 0x0210030;
 +    cpu->isar.id_mmfr1 = 0x00000000;
 +    cpu->isar.id_mmfr2 = 0x01200000;
 +    cpu->isar.id_mmfr3 = 0x0211;
      cpu->isar.id_isar0 = 0x02101111;
      cpu->isar.id_isar1 = 0x13112111;
      cpu->isar.id_isar2 = 0x21232141;
@@ -XXX,XX +XXX,XX @@ static void cortex_a8_initfn(Object *obj)
      cpu->id_pfr1 = 0x11;
      cpu->isar.id_dfr0 = 0x400;
      cpu->id_afr0 = 0;
 -    cpu->id_mmfr0 = 0x31100003;
 -    cpu->id_mmfr1 = 0x20000000;
 -    cpu->id_mmfr2 = 0x01202000;
 -    cpu->id_mmfr3 = 0x11;
 +    cpu->isar.id_mmfr0 = 0x31100003;
 +    cpu->isar.id_mmfr1 = 0x20000000;
 +    cpu->isar.id_mmfr2 = 0x01202000;
 +    cpu->isar.id_mmfr3 = 0x11;
      cpu->isar.id_isar0 = 0x00101111;
      cpu->isar.id_isar1 = 0x12112111;
      cpu->isar.id_isar2 = 0x21232031;
@@ -XXX,XX +XXX,XX @@ static void cortex_a9_initfn(Object *obj)
      cpu->id_pfr1 = 0x11;
      cpu->isar.id_dfr0 = 0x000;
      cpu->id_afr0 = 0;
 -    cpu->id_mmfr0 = 0x00100103;
 -    cpu->id_mmfr1 = 0x20000000;
 -    cpu->id_mmfr2 = 0x01230000;
 -    cpu->id_mmfr3 = 0x00002111;
 +    cpu->isar.id_mmfr0 = 0x00100103;
 +    cpu->isar.id_mmfr1 = 0x20000000;
 +    cpu->isar.id_mmfr2 = 0x01230000;
 +    cpu->isar.id_mmfr3 = 0x00002111;
      cpu->isar.id_isar0 = 0x00101111;
      cpu->isar.id_isar1 = 0x13112111;
      cpu->isar.id_isar2 = 0x21232041;
@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
      cpu->id_pfr1 = 0x00011011;
      cpu->isar.id_dfr0 = 0x02010555;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x10101105;
 -    cpu->id_mmfr1 = 0x40000000;
 -    cpu->id_mmfr2 = 0x01240000;
 -    cpu->id_mmfr3 = 0x02102211;
 +    cpu->isar.id_mmfr0 = 0x10101105;
 +    cpu->isar.id_mmfr1 = 0x40000000;
 +    cpu->isar.id_mmfr2 = 0x01240000;
 +    cpu->isar.id_mmfr3 = 0x02102211;
      /* a7_mpcore_r0p5_trm, page 4-4 gives 0x01101110; but
       * table 4-41 gives 0x02101110, which includes the arm div insns.
       */
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
      cpu->id_pfr1 = 0x00011011;
      cpu->isar.id_dfr0 = 0x02010555;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x10201105;
 -    cpu->id_mmfr1 = 0x20000000;
 -    cpu->id_mmfr2 = 0x01240000;
 -    cpu->id_mmfr3 = 0x02102211;
 +    cpu->isar.id_mmfr0 = 0x10201105;
 +    cpu->isar.id_mmfr1 = 0x20000000;
 +    cpu->isar.id_mmfr2 = 0x01240000;
 +    cpu->isar.id_mmfr3 = 0x02102211;
      cpu->isar.id_isar0 = 0x02101110;
      cpu->isar.id_isar1 = 0x13112111;
      cpu->isar.id_isar2 = 0x21232041;
@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
              t = FIELD_DP32(t, MVFR2, FPMISC, 4);   /* FP MaxNum */
              cpu->isar.mvfr2 = t;
 -            t = cpu->id_mmfr3;
 +            t = cpu->isar.id_mmfr3;
              t = FIELD_DP32(t, ID_MMFR3, PAN, 2); /* ATS1E1 */
 -            cpu->id_mmfr3 = t;
 +            cpu->isar.id_mmfr3 = t;
 -            t = cpu->id_mmfr4;
 +            t = cpu->isar.id_mmfr4;
              t = FIELD_DP32(t, ID_MMFR4, HPDS, 1); /* AA32HPD */
 -            cpu->id_mmfr4 = t;
 +            cpu->isar.id_mmfr4 = t;
          }
- #endif
+         desc_addr = next_desc;
-     }
+     } while (desc_addr != s->tx_queue[queue_index]);
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
+@@ -XXX,XX +XXX,XX @@ static void mv88w8618_eth_realize(DeviceState *dev, Error **errp)
-index XXXXXXX..XXXXXXX 100644
+ {
---- a/target/arm/cpu64.c
+     mv88w8618_eth_state *s = MV88W8618_ETH(dev);
-+++ b/target/arm/cpu64.c
-@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
++    if (!s->dma_mr) {
-     cpu->id_pfr1 = 0x00011011;
++        error_setg(errp, TYPE_MV88W8618_ETH " 'dma-memory' link not set");
-     cpu->isar.id_dfr0 = 0x03010066;
++        return;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x10101105;
 -    cpu->id_mmfr1 = 0x40000000;
 -    cpu->id_mmfr2 = 0x01260000;
 -    cpu->id_mmfr3 = 0x02102211;
 +    cpu->isar.id_mmfr0 = 0x10101105;
 +    cpu->isar.id_mmfr1 = 0x40000000;
 +    cpu->isar.id_mmfr2 = 0x01260000;
 +    cpu->isar.id_mmfr3 = 0x02102211;
      cpu->isar.id_isar0 = 0x02101110;
      cpu->isar.id_isar1 = 0x13112111;
      cpu->isar.id_isar2 = 0x21232042;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
      cpu->id_pfr1 = 0x00011011;
      cpu->isar.id_dfr0 = 0x03010066;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x10101105;
 -    cpu->id_mmfr1 = 0x40000000;
 -    cpu->id_mmfr2 = 0x01260000;
 -    cpu->id_mmfr3 = 0x02102211;
 +    cpu->isar.id_mmfr0 = 0x10101105;
 +    cpu->isar.id_mmfr1 = 0x40000000;
 +    cpu->isar.id_mmfr2 = 0x01260000;
 +    cpu->isar.id_mmfr3 = 0x02102211;
      cpu->isar.id_isar0 = 0x02101110;
      cpu->isar.id_isar1 = 0x13112111;
      cpu->isar.id_isar2 = 0x21232042;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
      cpu->id_pfr1 = 0x00011011;
      cpu->isar.id_dfr0 = 0x03010066;
      cpu->id_afr0 = 0x00000000;
 -    cpu->id_mmfr0 = 0x10201105;
 -    cpu->id_mmfr1 = 0x40000000;
 -    cpu->id_mmfr2 = 0x01260000;
 -    cpu->id_mmfr3 = 0x02102211;
 +    cpu->isar.id_mmfr0 = 0x10201105;
 +    cpu->isar.id_mmfr1 = 0x40000000;
 +    cpu->isar.id_mmfr2 = 0x01260000;
 +    cpu->isar.id_mmfr3 = 0x02102211;
      cpu->isar.id_isar0 = 0x02101110;
      cpu->isar.id_isar1 = 0x13112111;
      cpu->isar.id_isar2 = 0x21232042;
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
          u = FIELD_DP32(u, ID_ISAR6, SPECRES, 1);
          cpu->isar.id_isar6 = u;
 -        u = cpu->id_mmfr3;
 +        u = cpu->isar.id_mmfr3;
          u = FIELD_DP32(u, ID_MMFR3, PAN, 2); /* ATS1E1 */
 -        cpu->id_mmfr3 = u;
 +        cpu->isar.id_mmfr3 = u;
          u = cpu->isar.id_aa64dfr0;
          u = FIELD_DP64(u, ID_AA64DFR0, PMUVER, 5); /* v8.4-PMU */
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 4,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
 -              .resetvalue = cpu->id_mmfr0 },
 +              .resetvalue = cpu->isar.id_mmfr0 },
              { .name = "ID_MMFR1", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 5,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
 -              .resetvalue = cpu->id_mmfr1 },
 +              .resetvalue = cpu->isar.id_mmfr1 },
              { .name = "ID_MMFR2", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 6,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
 -              .resetvalue = cpu->id_mmfr2 },
 +              .resetvalue = cpu->isar.id_mmfr2 },
              { .name = "ID_MMFR3", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 7,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
 -              .resetvalue = cpu->id_mmfr3 },
 +              .resetvalue = cpu->isar.id_mmfr3 },
              { .name = "ID_ISAR0", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 0,
                .access = PL1_R, .type = ARM_CP_CONST,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 6,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
 -              .resetvalue = cpu->id_mmfr4 },
 +              .resetvalue = cpu->isar.id_mmfr4 },
              { .name = "ID_ISAR6", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 7,
                .access = PL1_R, .type = ARM_CP_CONST,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
          define_arm_cp_regs(cpu, vmsa_pmsa_cp_reginfo);
          define_arm_cp_regs(cpu, vmsa_cp_reginfo);
          /* TTCBR2 is introduced with ARMv8.2-A32HPD.  */
 -        if (FIELD_EX32(cpu->id_mmfr4, ID_MMFR4, HPDS) != 0) {
 +        if (FIELD_EX32(cpu->isar.id_mmfr4, ID_MMFR4, HPDS) != 0) {
              define_one_arm_cp_reg(cpu, &ttbcr2_reginfo);
          }
      }
 diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/kvm32.c
 +++ b/target/arm/kvm32.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
       * Fortunately there is not yet anything in there that affects migration.
       */
 +    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr0,
 +                          ARM_CP15_REG32(0, 0, 1, 4));
 +    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr1,
 +                          ARM_CP15_REG32(0, 0, 1, 5));
 +    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr2,
 +                          ARM_CP15_REG32(0, 0, 1, 6));
 +    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr3,
 +                          ARM_CP15_REG32(0, 0, 1, 7));
 +    if (read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr4,
 +                       ARM_CP15_REG32(0, 0, 2, 6))) {
 +        /*
 +         * Older kernels don't support reading ID_MMFR4 (a new in v8
 +         * register); assume it's zero.
 +         */
 +        ahcf->isar.id_mmfr4 = 0;
 +    }
 +
-     /*
++    address_space_init(&s->dma_as, s->dma_mr, "emac-dma");
-      * There is no way to read DBGDIDR, because currently 32-bit KVM
+     s->nic = qemu_new_nic(&net_mv88w8618_info, &s->conf,
-      * doesn't implement debug at all. Leave it at zero.
+                           object_get_typename(OBJECT(dev)), dev->id, s);
-diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
+ }
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription mv88w8618_eth_vmsd = {
---- a/target/arm/kvm64.c
-+++ b/target/arm/kvm64.c
+ static Property mv88w8618_eth_properties[] = {
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
+     DEFINE_NIC_PROPERTIES(mv88w8618_eth_state, conf),
-          */
++    DEFINE_PROP_LINK("dma-memory", mv88w8618_eth_state, dma_mr,
-         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_dfr0,
++                     TYPE_MEMORY_REGION, MemoryRegion *),
-                               ARM64_SYS_REG(3, 0, 0, 1, 2));
+     DEFINE_PROP_END_OF_LIST(),
-+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr0,
+ };
-+                              ARM64_SYS_REG(3, 0, 0, 1, 4));
-+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr1,
+@@ -XXX,XX +XXX,XX @@ static void musicpal_init(MachineState *machine)
-+                              ARM64_SYS_REG(3, 0, 0, 1, 5));
+     qemu_check_nic_model(&nd_table[0], "mv88w8618");
-+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr2,
+     dev = qdev_new(TYPE_MV88W8618_ETH);
-+                              ARM64_SYS_REG(3, 0, 0, 1, 6));
+     qdev_set_nic_properties(dev, &nd_table[0]);
-+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr3,
++    object_property_set_link(OBJECT(dev), "dma-memory",
-+                              ARM64_SYS_REG(3, 0, 0, 1, 7));
++                             OBJECT(get_system_memory()), &error_fatal);
-         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar0,
+     sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
-                               ARM64_SYS_REG(3, 0, 0, 2, 0));
+     sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, MP_ETH_BASE);
-         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar1,
+     sysbus_connect_irq(SYS_BUS_DEVICE(dev), 0, pic[MP_ETH_IRQ]);
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
                                ARM64_SYS_REG(3, 0, 0, 2, 4));
          err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar5,
                                ARM64_SYS_REG(3, 0, 0, 2, 5));
 +        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr4,
 +                              ARM64_SYS_REG(3, 0, 0, 2, 6));
          err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar6,
                                ARM64_SYS_REG(3, 0, 0, 2, 7));
 --
 .20.1

-[PULL 11/52] target/arm: Fix select for aa64_va_parameters_both
+[PULL 06/35] target/arm: Clarify HCR_EL2 ARMCPRegInfo type
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Select should always be 0 for a regime with one range.
+In commit ce4afed839 ("target/arm: Implement AArch32 HCR and HCR2")
 the HCR_EL2 register has been changed from type NO_RAW (no underlying
 state and does not support raw access for state saving/loading) to
 type CONST (TCG can assume the value to be constant), removing the
 read/write accessors.
 We forgot to remove the previous type ARM_CP_NO_RAW. This is not
 really a problem since the field is overwritten. However it makes
 code review confuse, so remove it.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
-Message-id: 20200216194343.21331-3-richard.henderson@linaro.org
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200812111223.7787-1-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 46 +++++++++++++++++++++++----------------------
+ target/arm/helper.c | 1 -
-file changed, 24 insertions(+), 22 deletions(-)
+file changed, 1 deletion(-)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_no_el2_cp_reginfo[] = {
-     bool tbi, tbid, epd, hpd, using16k, using64k;
+       .access = PL2_RW,
-     int select, tsz;
+       .readfn = arm_cp_read_zero, .writefn = arm_cp_write_ignore },
+     { .name = "HCR_EL2", .state = ARM_CP_STATE_BOTH,
--    /*
+-      .type = ARM_CP_NO_RAW,
--     * Bit 55 is always between the two regions, and is canonical for
+       .opc0 = 3, .opc1 = 4, .crn = 1, .crm = 1, .opc2 = 0,
--     * determining if address tagging is enabled.
+       .access = PL2_RW,
--     */
+       .type = ARM_CP_CONST, .resetvalue = 0 },
 -    select = extract64(va, 55, 1);
 -
      if (!regime_has_2_ranges(mmu_idx)) {
 +        select = 0;
          tsz = extract32(tcr, 0, 6);
          using64k = extract32(tcr, 14, 1);
          using16k = extract32(tcr, 15, 1);
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
              tbid = extract32(tcr, 29, 1);
          }
          epd = false;
 -    } else if (!select) {
 -        tsz = extract32(tcr, 0, 6);
 -        epd = extract32(tcr, 7, 1);
 -        using64k = extract32(tcr, 14, 1);
 -        using16k = extract32(tcr, 15, 1);
 -        tbi = extract64(tcr, 37, 1);
 -        hpd = extract64(tcr, 41, 1);
 -        tbid = extract64(tcr, 51, 1);
      } else {
 -        int tg = extract32(tcr, 30, 2);
 -        using16k = tg == 1;
 -        using64k = tg == 3;
 -        tsz = extract32(tcr, 16, 6);
 -        epd = extract32(tcr, 23, 1);
 -        tbi = extract64(tcr, 38, 1);
 -        hpd = extract64(tcr, 42, 1);
 -        tbid = extract64(tcr, 52, 1);
 +        /*
 +         * Bit 55 is always between the two regions, and is canonical for
 +         * determining if address tagging is enabled.
 +         */
 +        select = extract64(va, 55, 1);
 +        if (!select) {
 +            tsz = extract32(tcr, 0, 6);
 +            epd = extract32(tcr, 7, 1);
 +            using64k = extract32(tcr, 14, 1);
 +            using16k = extract32(tcr, 15, 1);
 +            tbi = extract64(tcr, 37, 1);
 +            hpd = extract64(tcr, 41, 1);
 +            tbid = extract64(tcr, 51, 1);
 +        } else {
 +            int tg = extract32(tcr, 30, 2);
 +            using16k = tg == 1;
 +            using64k = tg == 3;
 +            tsz = extract32(tcr, 16, 6);
 +            epd = extract32(tcr, 23, 1);
 +            tbi = extract64(tcr, 38, 1);
 +            hpd = extract64(tcr, 42, 1);
 +            tbid = extract64(tcr, 52, 1);
 +        }
      }
      tsz = MIN(tsz, 39);  /* TODO: ARMv8.4-TTST */
      tsz = MAX(tsz, 16);  /* TODO: ARMv8.2-LVA  */
 --
 .20.1

-[PULL 51/52] target/arm: Replace ARM_FEATURE_VFP3 checks with fp{sp, dp}_v3
+[PULL 07/35] target/arm: Pass the entire mte descriptor to mte_check_fail
 From: Richard Henderson <richard.henderson@linaro.org>
-Sort this check to the start of a trans_* function.
+We need more information than just the mmu_idx in order
-Merge this with any existing test for fpdp_v2.
+to create the proper exception syndrome.  Only change the
 function signature so far.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214181547.21408-10-richard.henderson@linaro.org
+Message-id: 20200813200816.3037186-2-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-vfp.inc.c | 24 ++++++++----------------
+ target/arm/mte_helper.c | 10 +++++-----
-file changed, 8 insertions(+), 16 deletions(-)
+file changed, 5 insertions(+), 5 deletions(-)
-diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
+diff --git a/target/arm/mte_helper.c b/target/arm/mte_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.inc.c
+--- a/target/arm/mte_helper.c
-+++ b/target/arm/translate-vfp.inc.c
++++ b/target/arm/mte_helper.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
+@@ -XXX,XX +XXX,XX @@ void HELPER(stzgm_tags)(CPUARMState *env, uint64_t ptr, uint64_t val)
-          * VFPv2 allows access to FPSID from userspace; VFPv3 restricts
+ }
-          * all ID registers to privileged access only.
-          */
+ /* Record a tag check failure.  */
--        if (IS_USER(s) && arm_dc_feature(s, ARM_FEATURE_VFP3)) {
+-static void mte_check_fail(CPUARMState *env, int mmu_idx,
-+        if (IS_USER(s) && dc_isar_feature(aa32_fpsp_v3, s)) {
++static void mte_check_fail(CPUARMState *env, uint32_t desc,
-             return false;
+                            uint64_t dirty_ptr, uintptr_t ra)
-         }
+ {
-         ignore_vfp_enabled = true;
++    int mmu_idx = FIELD_EX32(desc, MTEDESC, MIDX);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
+     ARMMMUIdx arm_mmu_idx = core_to_aa64_mmu_idx(mmu_idx);
-     case ARM_VFP_FPINST:
+     int el, reg_el, tcf, select;
-     case ARM_VFP_FPINST2:
+     uint64_t sctlr;
-         /* Not present in VFPv3 */
+@@ -XXX,XX +XXX,XX @@ uint64_t mte_check1(CPUARMState *env, uint32_t desc,
 -        if (IS_USER(s) || arm_dc_feature(s, ARM_FEATURE_VFP3)) {
 +        if (IS_USER(s) || dc_isar_feature(aa32_fpsp_v3, s)) {
              return false;
          }
          break;
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_sp(DisasContext *s, arg_VMOV_imm_sp *a)
      vd = a->vd;
 -    if (!dc_isar_feature(aa32_fpshvec, s) &&
 -        (veclen != 0 || s->vec_stride != 0)) {
 +    if (!dc_isar_feature(aa32_fpsp_v3, s)) {
          return false;
      }
--    if (!arm_dc_feature(s, ARM_FEATURE_VFP3)) {
+     if (unlikely(!mte_probe1_int(env, desc, ptr, ra, bit55))) {
-+    if (!dc_isar_feature(aa32_fpshvec, s) &&
+-        int mmu_idx = FIELD_EX32(desc, MTEDESC, MIDX);
-+        (veclen != 0 || s->vec_stride != 0)) {
+-        mte_check_fail(env, mmu_idx, ptr, ra);
-         return false;
++        mte_check_fail(env, desc, ptr, ra);
      }
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
+     return useronly_clean_ptr(ptr);
+@@ -XXX,XX +XXX,XX @@ uint64_t mte_checkN(CPUARMState *env, uint32_t desc,
-     vd = a->vd;
+         fail_ofs = tag_first + n * TAG_GRANULE - ptr;
--    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+         fail_ofs = ROUND_UP(fail_ofs, esize);
-+    if (!dc_isar_feature(aa32_fpdp_v3, s)) {
+-        mte_check_fail(env, mmu_idx, ptr + fail_ofs, ra);
-         return false;
++        mte_check_fail(env, desc, ptr + fail_ofs, ra);
      }
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
+  done:
-         return false;
+@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(mte_check_zva)(CPUARMState *env, uint32_t desc, uint64_t ptr)
-     }
+  fail:
+     /* Locate the first nibble that differs. */
--    if (!arm_dc_feature(s, ARM_FEATURE_VFP3)) {
+     i = ctz64(mem_tag ^ ptr_tag) >> 4;
--        return false;
+-    mte_check_fail(env, mmu_idx, align_ptr + i * TAG_GRANULE, ra);
--    }
++    mte_check_fail(env, desc, align_ptr + i * TAG_GRANULE, ra);
--
-     if (!vfp_access_check(s)) {
+  done:
-         return true;
+     return useronly_clean_ptr(ptr);
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_sp(DisasContext *s, arg_VCVT_fix_sp *a)
      TCGv_ptr fpst;
      int frac_bits;
 -    if (!arm_dc_feature(s, ARM_FEATURE_VFP3)) {
 +    if (!dc_isar_feature(aa32_fpsp_v3, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
      TCGv_ptr fpst;
      int frac_bits;
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
 -    if (!arm_dc_feature(s, ARM_FEATURE_VFP3)) {
 +    if (!dc_isar_feature(aa32_fpdp_v3, s)) {
          return false;
      }
 --
 .20.1

-[PULL 45/52] target/arm: Use isar_feature_aa32_simd_r32 more places
+[PULL 08/35] target/arm: Fill in the WnR syndrome bit in mte_check_fail
 From: Richard Henderson <richard.henderson@linaro.org>
-Many uses of ARM_FEATURE_VFP3 are testing for the number of simd
+According to AArch64.TagCheckFault, none of the other ISS values are
-registers implemented.  Use the proper test vs MVFR0.SIMDReg.
+provided, so we do not need to go so far as merge_syn_data_abort.
 But we were missing the WnR bit.
+Tested-by: Andrey Konovalov <andreyknvl@google.com>
+Reported-by: Andrey Konovalov <andreyknvl@google.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214181547.21408-4-richard.henderson@linaro.org
+Message-id: 20200813200816.3037186-3-richard.henderson@linaro.org
 [PMM: fix typo in commit message]
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.c       |  9 ++++-----
+ target/arm/mte_helper.c | 9 +++++----
- target/arm/helper.c    | 13 ++++++-------
+file changed, 5 insertions(+), 4 deletions(-)
  target/arm/translate.c |  2 +-
 files changed, 11 insertions(+), 13 deletions(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/target/arm/mte_helper.c b/target/arm/mte_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/target/arm/mte_helper.c
-+++ b/target/arm/cpu.c
++++ b/target/arm/mte_helper.c
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_dump_state(CPUState *cs, FILE *f, int flags)
+@@ -XXX,XX +XXX,XX @@ static void mte_check_fail(CPUARMState *env, uint32_t desc,
      if (flags & CPU_DUMP_FPU) {
          int numvfpregs = 0;
 -        if (arm_feature(env, ARM_FEATURE_VFP)) {
 -            numvfpregs += 16;
 -        }
 -        if (arm_feature(env, ARM_FEATURE_VFP3)) {
 -            numvfpregs += 16;
 +        if (cpu_isar_feature(aa32_simd_r32, cpu)) {
 +            numvfpregs = 32;
 +        } else if (arm_feature(env, ARM_FEATURE_VFP)) {
 +            numvfpregs = 16;
          }
          for (i = 0; i < numvfpregs; i++) {
              uint64_t v = *aa32_vfp_dreg(env, i);
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void switch_mode(CPUARMState *env, int mode);
  static int vfp_gdb_get_reg(CPUARMState *env, uint8_t *buf, int reg)
  {
--    int nregs;
+     int mmu_idx = FIELD_EX32(desc, MTEDESC, MIDX);
-+    ARMCPU *cpu = env_archcpu(env);
+     ARMMMUIdx arm_mmu_idx = core_to_aa64_mmu_idx(mmu_idx);
-+    int nregs = cpu_isar_feature(aa32_simd_r32, cpu) ? 32 : 16;
+-    int el, reg_el, tcf, select;
++    int el, reg_el, tcf, select, is_write, syn;
-     /* VFP data registers are always little-endian.  */
+     uint64_t sctlr;
--    nregs = arm_feature(env, ARM_FEATURE_VFP3) ? 32 : 16;
-     if (reg < nregs) {
+     reg_el = regime_el(env, arm_mmu_idx);
-         stq_le_p(buf, *aa32_vfp_dreg(env, reg));
+@@ -XXX,XX +XXX,XX @@ static void mte_check_fail(CPUARMState *env, uint32_t desc,
-         return 8;
+          */
-@@ -XXX,XX +XXX,XX @@ static int vfp_gdb_get_reg(CPUARMState *env, uint8_t *buf, int reg)
+         cpu_restore_state(env_cpu(env), ra, true);
+         env->exception.vaddress = dirty_ptr;
- static int vfp_gdb_set_reg(CPUARMState *env, uint8_t *buf, int reg)
+-        raise_exception(env, EXCP_DATA_ABORT,
- {
+-                        syn_data_abort_no_iss(el != 0, 0, 0, 0, 0, 0, 0x11),
--    int nregs;
+-                        exception_target_el(env));
-+    ARMCPU *cpu = env_archcpu(env);
++
-+    int nregs = cpu_isar_feature(aa32_simd_r32, cpu) ? 32 : 16;
++        is_write = FIELD_EX32(desc, MTEDESC, WRITE);
++        syn = syn_data_abort_no_iss(el != 0, 0, 0, 0, 0, is_write, 0x11);
--    nregs = arm_feature(env, ARM_FEATURE_VFP3) ? 32 : 16;
++        raise_exception(env, EXCP_DATA_ABORT, syn, exception_target_el(env));
-     if (reg < nregs) {
+         /* noreturn, but fall through to the assert anyway */
-         *aa32_vfp_dreg(env, reg) = ldq_le_p(buf);
-         return 8;
+     case 0:
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
              /* VFPv3 and upwards with NEON implement 32 double precision
               * registers (D0-D31).
               */
 -            if (!arm_feature(env, ARM_FEATURE_NEON) ||
 -                    !arm_feature(env, ARM_FEATURE_VFP3)) {
 +            if (!cpu_isar_feature(aa32_simd_r32, env_archcpu(env))) {
                  /* D32DIS [30] is RAO/WI if D16-31 are not implemented. */
                  value |= (1 << 30);
              }
@@ -XXX,XX +XXX,XX @@ void arm_cpu_register_gdb_regs_for_features(ARMCPU *cpu)
      } else if (arm_feature(env, ARM_FEATURE_NEON)) {
          gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
 , "arm-neon.xml", 0);
 -    } else if (arm_feature(env, ARM_FEATURE_VFP3)) {
 +    } else if (cpu_isar_feature(aa32_simd_r32, cpu)) {
          gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
 , "arm-vfp3.xml", 0);
      } else if (arm_feature(env, ARM_FEATURE_VFP)) {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_dsp_insn(DisasContext *s, uint32_t insn)
  #define VFP_SREG(insn, bigbit, smallbit) \
    ((VFP_REG_SHR(insn, bigbit - 1) & 0x1e) | (((insn) >> (smallbit)) & 1))
  #define VFP_DREG(reg, insn, bigbit, smallbit) do { \
 -    if (arm_dc_feature(s, ARM_FEATURE_VFP3)) { \
 +    if (dc_isar_feature(aa32_simd_r32, s)) { \
          reg = (((insn) >> (bigbit)) & 0x0f) \
                | (((insn) >> ((smallbit) - 4)) & 0x10); \
      } else { \
 --
 .20.1

-[PULL 01/52] aspeed/scu: Create separate write callbacks
+[PULL 09/35] hw/sd/allwinner-sdhost: Use AddressSpace for DMA transfers
-From: Joel Stanley <joel@jms.id.au>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-This splits the common write callback into separate ast2400 and ast2500
+Allow the device to execute the DMA transfers in a different
-implementations. This makes it clearer when implementing differing
+AddressSpace.
 behaviour.
-Signed-off-by: Joel Stanley <joel@jms.id.au>
+The A10 and H3 SoC keep using the system_memory address space,
-Reviewed-by: Andrew Jeffery <andrew@aj.id.au>
+but via the proper dma_memory_access() API.
-Reviewed-by: Cédric Le Goater <clg@kaod.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200121013302.43839-2-joel@jms.id.au
+Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
 Reviewed-by: Niek Linnenbank <nieklinnenbank@gmail.com>
 Message-id: 20200814110057.307-1-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/misc/aspeed_scu.c | 80 +++++++++++++++++++++++++++++++-------------
+ include/hw/sd/allwinner-sdhost.h |  6 ++++++
-file changed, 57 insertions(+), 23 deletions(-)
+ hw/arm/allwinner-a10.c           |  2 ++
  hw/arm/allwinner-h3.c            |  2 ++
  hw/sd/allwinner-sdhost.c         | 37 ++++++++++++++++++++++++++------
 files changed, 41 insertions(+), 6 deletions(-)
-diff --git a/hw/misc/aspeed_scu.c b/hw/misc/aspeed_scu.c
+diff --git a/include/hw/sd/allwinner-sdhost.h b/include/hw/sd/allwinner-sdhost.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/aspeed_scu.c
+--- a/include/hw/sd/allwinner-sdhost.h
-+++ b/hw/misc/aspeed_scu.c
++++ b/include/hw/sd/allwinner-sdhost.h
-@@ -XXX,XX +XXX,XX @@ static uint64_t aspeed_scu_read(void *opaque, hwaddr offset, unsigned size)
+@@ -XXX,XX +XXX,XX @@ typedef struct AwSdHostState {
-     return s->regs[reg];
+     /** Interrupt output signal to notify CPU */
      qemu_irq irq;
 +    /** Memory region where DMA transfers are done */
 +    MemoryRegion *dma_mr;
 +
 +    /** Address space used internally for DMA transfers */
 +    AddressSpace dma_as;
 +
      /** Number of bytes left in current DMA transfer */
      uint32_t transfer_cnt;
 diff --git a/hw/arm/allwinner-a10.c b/hw/arm/allwinner-a10.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/allwinner-a10.c
 +++ b/hw/arm/allwinner-a10.c
@@ -XXX,XX +XXX,XX @@ static void aw_a10_realize(DeviceState *dev, Error **errp)
      }
      /* SD/MMC */
 +    object_property_set_link(OBJECT(&s->mmc0), "dma-memory",
 +                             OBJECT(get_system_memory()), &error_fatal);
      sysbus_realize(SYS_BUS_DEVICE(&s->mmc0), &error_fatal);
      sysbus_mmio_map(SYS_BUS_DEVICE(&s->mmc0), 0, AW_A10_MMC0_BASE);
      sysbus_connect_irq(SYS_BUS_DEVICE(&s->mmc0), 0, qdev_get_gpio_in(dev, 32));
 diff --git a/hw/arm/allwinner-h3.c b/hw/arm/allwinner-h3.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/allwinner-h3.c
 +++ b/hw/arm/allwinner-h3.c
@@ -XXX,XX +XXX,XX @@ static void allwinner_h3_realize(DeviceState *dev, Error **errp)
      sysbus_mmio_map(SYS_BUS_DEVICE(&s->sid), 0, s->memmap[AW_H3_SID]);
      /* SD/MMC */
 +    object_property_set_link(OBJECT(&s->mmc0), "dma-memory",
 +                             OBJECT(get_system_memory()), &error_fatal);
      sysbus_realize(SYS_BUS_DEVICE(&s->mmc0), &error_fatal);
      sysbus_mmio_map(SYS_BUS_DEVICE(&s->mmc0), 0, s->memmap[AW_H3_MMC0]);
      sysbus_connect_irq(SYS_BUS_DEVICE(&s->mmc0), 0,
 diff --git a/hw/sd/allwinner-sdhost.c b/hw/sd/allwinner-sdhost.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/sd/allwinner-sdhost.c
 +++ b/hw/sd/allwinner-sdhost.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/log.h"
  #include "qemu/module.h"
  #include "qemu/units.h"
 +#include "qapi/error.h"
  #include "sysemu/blockdev.h"
 +#include "sysemu/dma.h"
 +#include "hw/qdev-properties.h"
  #include "hw/irq.h"
  #include "hw/sd/allwinner-sdhost.h"
  #include "migration/vmstate.h"
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sdhost_process_desc(AwSdHostState *s,
      uint8_t buf[1024];
      /* Read descriptor */
 -    cpu_physical_memory_read(desc_addr, desc, sizeof(*desc));
 +    dma_memory_read(&s->dma_as, desc_addr, desc, sizeof(*desc));
      if (desc->size == 0) {
          desc->size = klass->max_desc_size;
      } else if (desc->size > klass->max_desc_size) {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sdhost_process_desc(AwSdHostState *s,
          /* Write to SD bus */
          if (is_write) {
 -            cpu_physical_memory_read((desc->addr & DESC_SIZE_MASK) + num_done,
 -                                      buf, buf_bytes);
 +            dma_memory_read(&s->dma_as,
 +                            (desc->addr & DESC_SIZE_MASK) + num_done,
 +                            buf, buf_bytes);
              sdbus_write_data(&s->sdbus, buf, buf_bytes);
          /* Read from SD bus */
          } else {
              sdbus_read_data(&s->sdbus, buf, buf_bytes);
 -            cpu_physical_memory_write((desc->addr & DESC_SIZE_MASK) + num_done,
 -                                       buf, buf_bytes);
 +            dma_memory_write(&s->dma_as,
 +                             (desc->addr & DESC_SIZE_MASK) + num_done,
 +                             buf, buf_bytes);
          }
          num_done += buf_bytes;
      }
      /* Clear hold flag and flush descriptor */
      desc->status &= ~DESC_STATUS_HOLD;
 -    cpu_physical_memory_write(desc_addr, desc, sizeof(*desc));
 +    dma_memory_write(&s->dma_as, desc_addr, desc, sizeof(*desc));
      return num_done;
  }
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_allwinner_sdhost = {
--static void aspeed_scu_write(void *opaque, hwaddr offset, uint64_t data,
+     }
--                             unsigned size)
+ };
-+static void aspeed_ast2400_scu_write(void *opaque, hwaddr offset,
-+                                     uint64_t data, unsigned size)
++static Property allwinner_sdhost_properties[] = {
 +    DEFINE_PROP_LINK("dma-memory", AwSdHostState, dma_mr,
 +                     TYPE_MEMORY_REGION, MemoryRegion *),
 +    DEFINE_PROP_END_OF_LIST(),
 +};
 +
  static void allwinner_sdhost_init(Object *obj)
  {
      AwSdHostState *s = AW_SDHOST(obj);
@@ -XXX,XX +XXX,XX @@ static void allwinner_sdhost_init(Object *obj)
      sysbus_init_irq(SYS_BUS_DEVICE(s), &s->irq);
  }
 +static void allwinner_sdhost_realize(DeviceState *dev, Error **errp)
 +{
-+    AspeedSCUState *s = ASPEED_SCU(opaque);
++    AwSdHostState *s = AW_SDHOST(dev);
 +    int reg = TO_REG(offset);
 +
-+    if (reg >= ASPEED_SCU_NR_REGS) {
++    if (!s->dma_mr) {
-+        qemu_log_mask(LOG_GUEST_ERROR,
++        error_setg(errp, TYPE_AW_SDHOST " 'dma-memory' link not set");
 +                      "%s: Out-of-bounds write at offset 0x%" HWADDR_PRIx "\n",
 +                      __func__, offset);
 +        return;
 +    }
 +
-+    if (reg > PROT_KEY && reg < CPU2_BASE_SEG1 &&
++    address_space_init(&s->dma_as, s->dma_mr, "sdhost-dma");
 +            !s->regs[PROT_KEY]) {
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: SCU is locked!\n", __func__);
 +    }
 +
 +    trace_aspeed_scu_write(offset, size, data);
 +
 +    switch (reg) {
 +    case PROT_KEY:
 +        s->regs[reg] = (data == ASPEED_SCU_PROT_KEY) ? 1 : 0;
 +        return;
 +    case SILICON_REV:
 +    case FREQ_CNTR_EVAL:
 +    case VGA_SCRATCH1 ... VGA_SCRATCH8:
 +    case RNG_DATA:
 +    case FREE_CNTR4:
 +    case FREE_CNTR4_EXT:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
 +                      __func__, offset);
 +        return;
 +    }
 +
 +    s->regs[reg] = data;
 +}
 +
-+static void aspeed_ast2500_scu_write(void *opaque, hwaddr offset,
+ static void allwinner_sdhost_reset(DeviceState *dev)
 +                                     uint64_t data, unsigned size)
  {
-     AspeedSCUState *s = ASPEED_SCU(opaque);
+     AwSdHostState *s = AW_SDHOST(dev);
-     int reg = TO_REG(offset);
+@@ -XXX,XX +XXX,XX @@ static void allwinner_sdhost_class_init(ObjectClass *klass, void *data)
-@@ -XXX,XX +XXX,XX @@ static void aspeed_scu_write(void *opaque, hwaddr offset, uint64_t data,
-     case PROT_KEY:
+     dc->reset = allwinner_sdhost_reset;
-         s->regs[reg] = (data == ASPEED_SCU_PROT_KEY) ? 1 : 0;
+     dc->vmsd = &vmstate_allwinner_sdhost;
-         return;
++    dc->realize = allwinner_sdhost_realize;
--    case CLK_SEL:
++    device_class_set_props(dc, allwinner_sdhost_properties);
 -        s->regs[reg] = data;
 -        break;
      case HW_STRAP1:
 -        if (ASPEED_IS_AST2500(s->regs[SILICON_REV])) {
 -            s->regs[HW_STRAP1] |= data;
 -            return;
 -        }
 -        /* Jump to assignment below */
 -        break;
 +        s->regs[HW_STRAP1] |= data;
 +        return;
      case SILICON_REV:
 -        if (ASPEED_IS_AST2500(s->regs[SILICON_REV])) {
 -            s->regs[HW_STRAP1] &= ~data;
 -        } else {
 -            qemu_log_mask(LOG_GUEST_ERROR,
 -                          "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
 -                          __func__, offset);
 -        }
 -        /* Avoid assignment below, we've handled everything */
 +        s->regs[HW_STRAP1] &= ~data;
          return;
      case FREQ_CNTR_EVAL:
      case VGA_SCRATCH1 ... VGA_SCRATCH8:
@@ -XXX,XX +XXX,XX @@ static void aspeed_scu_write(void *opaque, hwaddr offset, uint64_t data,
      s->regs[reg] = data;
  }
--static const MemoryRegionOps aspeed_scu_ops = {
+ static void allwinner_sdhost_sun4i_class_init(ObjectClass *klass, void *data)
 +static const MemoryRegionOps aspeed_ast2400_scu_ops = {
      .read = aspeed_scu_read,
 -    .write = aspeed_scu_write,
 +    .write = aspeed_ast2400_scu_write,
 +    .endianness = DEVICE_LITTLE_ENDIAN,
 +    .valid.min_access_size = 4,
 +    .valid.max_access_size = 4,
 +    .valid.unaligned = false,
 +};
 +
 +static const MemoryRegionOps aspeed_ast2500_scu_ops = {
 +    .read = aspeed_scu_read,
 +    .write = aspeed_ast2500_scu_write,
      .endianness = DEVICE_LITTLE_ENDIAN,
      .valid.min_access_size = 4,
      .valid.max_access_size = 4,
@@ -XXX,XX +XXX,XX @@ static void aspeed_2400_scu_class_init(ObjectClass *klass, void *data)
      asc->calc_hpll = aspeed_2400_scu_calc_hpll;
      asc->apb_divider = 2;
      asc->nr_regs = ASPEED_SCU_NR_REGS;
 -    asc->ops = &aspeed_scu_ops;
 +    asc->ops = &aspeed_ast2400_scu_ops;
  }
  static const TypeInfo aspeed_2400_scu_info = {
@@ -XXX,XX +XXX,XX @@ static void aspeed_2500_scu_class_init(ObjectClass *klass, void *data)
      asc->calc_hpll = aspeed_2500_scu_calc_hpll;
      asc->apb_divider = 4;
      asc->nr_regs = ASPEED_SCU_NR_REGS;
 -    asc->ops = &aspeed_scu_ops;
 +    asc->ops = &aspeed_ast2500_scu_ops;
  }
  static const TypeInfo aspeed_2500_scu_info = {
 --
 .20.1

-[PULL 02/52] aspeed/scu: Implement chip ID register
+Deleted patch
-From: Joel Stanley <joel@jms.id.au>
-This returns a fixed but non-zero value for the chip id.
-Signed-off-by: Joel Stanley <joel@jms.id.au>
-Reviewed-by: Andrew Jeffery <andrew@aj.id.au>
-Reviewed-by: Cédric Le Goater <clg@kaod.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200121013302.43839-3-joel@jms.id.au
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- hw/misc/aspeed_scu.c | 13 +++++++++++++
-file changed, 13 insertions(+)
-diff --git a/hw/misc/aspeed_scu.c b/hw/misc/aspeed_scu.c
-index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/aspeed_scu.c
-+++ b/hw/misc/aspeed_scu.c
-@@ -XXX,XX +XXX,XX @@
- #define CPU2_BASE_SEG4       TO_REG(0x110)
- #define CPU2_BASE_SEG5       TO_REG(0x114)
- #define CPU2_CACHE_CTRL      TO_REG(0x118)
-+#define CHIP_ID0             TO_REG(0x150)
-+#define CHIP_ID1             TO_REG(0x154)
- #define UART_HPLL_CLK        TO_REG(0x160)
- #define PCIE_CTRL            TO_REG(0x180)
- #define BMC_MMIO_CTRL        TO_REG(0x184)
-@@ -XXX,XX +XXX,XX @@
- #define AST2600_HW_STRAP2_PROT    TO_REG(0x518)
- #define AST2600_RNG_CTRL          TO_REG(0x524)
- #define AST2600_RNG_DATA          TO_REG(0x540)
-+#define AST2600_CHIP_ID0          TO_REG(0x5B0)
-+#define AST2600_CHIP_ID1          TO_REG(0x5B4)
- #define AST2600_CLK TO_REG(0x40)
-@@ -XXX,XX +XXX,XX @@ static const uint32_t ast2500_a1_resets[ASPEED_SCU_NR_REGS] = {
-      [CPU2_BASE_SEG1]  = 0x80000000U,
-      [CPU2_BASE_SEG4]  = 0x1E600000U,
-      [CPU2_BASE_SEG5]  = 0xC0000000U,
-+     [CHIP_ID0]        = 0x1234ABCDU,
-+     [CHIP_ID1]        = 0x88884444U,
-      [UART_HPLL_CLK]   = 0x00001903U,
-      [PCIE_CTRL]       = 0x0000007BU,
-      [BMC_DEV_ID]      = 0x00002402U
-@@ -XXX,XX +XXX,XX @@ static void aspeed_ast2500_scu_write(void *opaque, hwaddr offset,
-     case RNG_DATA:
-     case FREE_CNTR4:
-     case FREE_CNTR4_EXT:
-+    case CHIP_ID0:
-+    case CHIP_ID1:
-         qemu_log_mask(LOG_GUEST_ERROR,
-                       "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
-                       __func__, offset);
-@@ -XXX,XX +XXX,XX @@ static void aspeed_ast2600_scu_write(void *opaque, hwaddr offset,
-     case AST2600_RNG_DATA:
-     case AST2600_SILICON_REV:
-     case AST2600_SILICON_REV2:
-+    case AST2600_CHIP_ID0:
-+    case AST2600_CHIP_ID1:
-         /* Add read only registers here */
-         qemu_log_mask(LOG_GUEST_ERROR,
-                       "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
-@@ -XXX,XX +XXX,XX @@ static const uint32_t ast2600_a0_resets[ASPEED_AST2600_SCU_NR_REGS] = {
-     [AST2600_CLK_STOP_CTRL2]    = 0xFFF0FFF0,
-     [AST2600_SDRAM_HANDSHAKE]   = 0x00000040,  /* SoC completed DRAM init */
-     [AST2600_HPLL_PARAM]        = 0x1000405F,
-+    [AST2600_CHIP_ID0]          = 0x1234ABCD,
-+    [AST2600_CHIP_ID1]          = 0x88884444,
-+
- };
- static void aspeed_ast2600_scu_reset(DeviceState *dev)
---
-.20.1

-[PULL 36/52] hcd-ehci: Introduce "companion-enable" sysbus property
+[PULL 10/35] hw/net/allwinner-sun8i-emac: Use AddressSpace for DMA transfers
-From: Guenter Roeck <linux@roeck-us.net>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-We'll use this property in a follow-up patch to insantiate an EHCI
+Allow the device to execute the DMA transfers in a different
-bus with companion support.
+AddressSpace.
-Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
+The H3 SoC keeps using the system_memory address space,
-Signed-off-by: Guenter Roeck <linux@roeck-us.net>
+but via the proper dma_memory_access() API.
 Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Niek Linnenbank <nieklinnenbank@gmail.com>
 Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
-Message-id: 20200217204812.9857-3-linux@roeck-us.net
+Message-id: 20200814122907.27732-1-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/usb/hcd-ehci-sysbus.c | 2 ++
+ include/hw/net/allwinner-sun8i-emac.h |  6 ++++
-file changed, 2 insertions(+)
+ hw/arm/allwinner-h3.c                 |  2 ++
+ hw/net/allwinner-sun8i-emac.c         | 46 +++++++++++++++++----------
-diff --git a/hw/usb/hcd-ehci-sysbus.c b/hw/usb/hcd-ehci-sysbus.c
+files changed, 38 insertions(+), 16 deletions(-)
 diff --git a/include/hw/net/allwinner-sun8i-emac.h b/include/hw/net/allwinner-sun8i-emac.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/usb/hcd-ehci-sysbus.c
+--- a/include/hw/net/allwinner-sun8i-emac.h
-+++ b/hw/usb/hcd-ehci-sysbus.c
++++ b/include/hw/net/allwinner-sun8i-emac.h
-@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_ehci_sysbus = {
+@@ -XXX,XX +XXX,XX @@ typedef struct AwSun8iEmacState {
+     /** Interrupt output signal to notify CPU */
- static Property ehci_sysbus_properties[] = {
+     qemu_irq     irq;
-     DEFINE_PROP_UINT32("maxframes", EHCISysBusState, ehci.maxframes, 128),
-+    DEFINE_PROP_BOOL("companion-enable", EHCISysBusState, ehci.companion_enable,
++    /** Memory region where DMA transfers are done */
-+                     false),
++    MemoryRegion *dma_mr;
 +
 +    /** Address space used internally for DMA transfers */
 +    AddressSpace dma_as;
 +
      /** Generic Network Interface Controller (NIC) for networking API */
      NICState     *nic;
 diff --git a/hw/arm/allwinner-h3.c b/hw/arm/allwinner-h3.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/allwinner-h3.c
 +++ b/hw/arm/allwinner-h3.c
@@ -XXX,XX +XXX,XX @@ static void allwinner_h3_realize(DeviceState *dev, Error **errp)
          qemu_check_nic_model(&nd_table[0], TYPE_AW_SUN8I_EMAC);
          qdev_set_nic_properties(DEVICE(&s->emac), &nd_table[0]);
      }
 +    object_property_set_link(OBJECT(&s->emac), "dma-memory",
 +                             OBJECT(get_system_memory()), &error_fatal);
      sysbus_realize(SYS_BUS_DEVICE(&s->emac), &error_fatal);
      sysbus_mmio_map(SYS_BUS_DEVICE(&s->emac), 0, s->memmap[AW_H3_EMAC]);
      sysbus_connect_irq(SYS_BUS_DEVICE(&s->emac), 0,
 diff --git a/hw/net/allwinner-sun8i-emac.c b/hw/net/allwinner-sun8i-emac.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/net/allwinner-sun8i-emac.c
 +++ b/hw/net/allwinner-sun8i-emac.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "qemu/units.h"
 +#include "qapi/error.h"
  #include "hw/sysbus.h"
  #include "migration/vmstate.h"
  #include "net/net.h"
@@ -XXX,XX +XXX,XX @@
  #include "net/checksum.h"
  #include "qemu/module.h"
  #include "exec/cpu-common.h"
 +#include "sysemu/dma.h"
  #include "hw/net/allwinner-sun8i-emac.h"
  /* EMAC register offsets */
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_update_irq(AwSun8iEmacState *s)
      qemu_set_irq(s->irq, (s->int_sta & s->int_en) != 0);
  }
 -static uint32_t allwinner_sun8i_emac_next_desc(FrameDescriptor *desc,
 +static uint32_t allwinner_sun8i_emac_next_desc(AwSun8iEmacState *s,
 +                                               FrameDescriptor *desc,
                                                 size_t min_size)
  {
      uint32_t paddr = desc->next;
 -    cpu_physical_memory_read(paddr, desc, sizeof(*desc));
 +    dma_memory_read(&s->dma_as, paddr, desc, sizeof(*desc));
      if ((desc->status & DESC_STATUS_CTL) &&
          (desc->status2 & DESC_STATUS2_BUF_SIZE_MASK) >= min_size) {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sun8i_emac_next_desc(FrameDescriptor *desc,
      }
  }
 -static uint32_t allwinner_sun8i_emac_get_desc(FrameDescriptor *desc,
 +static uint32_t allwinner_sun8i_emac_get_desc(AwSun8iEmacState *s,
 +                                              FrameDescriptor *desc,
                                                uint32_t start_addr,
                                                size_t min_size)
  {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sun8i_emac_get_desc(FrameDescriptor *desc,
      /* Note that the list is a cycle. Last entry points back to the head. */
      while (desc_addr != 0) {
 -        cpu_physical_memory_read(desc_addr, desc, sizeof(*desc));
 +        dma_memory_read(&s->dma_as, desc_addr, desc, sizeof(*desc));
          if ((desc->status & DESC_STATUS_CTL) &&
              (desc->status2 & DESC_STATUS2_BUF_SIZE_MASK) >= min_size) {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sun8i_emac_rx_desc(AwSun8iEmacState *s,
                                               FrameDescriptor *desc,
                                               size_t min_size)
  {
 -    return allwinner_sun8i_emac_get_desc(desc, s->rx_desc_curr, min_size);
 +    return allwinner_sun8i_emac_get_desc(s, desc, s->rx_desc_curr, min_size);
  }
  static uint32_t allwinner_sun8i_emac_tx_desc(AwSun8iEmacState *s,
                                               FrameDescriptor *desc,
                                               size_t min_size)
  {
 -    return allwinner_sun8i_emac_get_desc(desc, s->tx_desc_head, min_size);
 +    return allwinner_sun8i_emac_get_desc(s, desc, s->tx_desc_head, min_size);
  }
 -static void allwinner_sun8i_emac_flush_desc(FrameDescriptor *desc,
 +static void allwinner_sun8i_emac_flush_desc(AwSun8iEmacState *s,
 +                                            FrameDescriptor *desc,
                                              uint32_t phys_addr)
  {
 -    cpu_physical_memory_write(phys_addr, desc, sizeof(*desc));
 +    dma_memory_write(&s->dma_as, phys_addr, desc, sizeof(*desc));
  }
  static bool allwinner_sun8i_emac_can_receive(NetClientState *nc)
@@ -XXX,XX +XXX,XX @@ static ssize_t allwinner_sun8i_emac_receive(NetClientState *nc,
                              << RX_DESC_STATUS_FRM_LEN_SHIFT;
          }
 -        cpu_physical_memory_write(desc.addr, buf, desc_bytes);
 -        allwinner_sun8i_emac_flush_desc(&desc, s->rx_desc_curr);
 +        dma_memory_write(&s->dma_as, desc.addr, buf, desc_bytes);
 +        allwinner_sun8i_emac_flush_desc(s, &desc, s->rx_desc_curr);
          trace_allwinner_sun8i_emac_receive(s->rx_desc_curr, desc.addr,
                                             desc_bytes);
@@ -XXX,XX +XXX,XX @@ static ssize_t allwinner_sun8i_emac_receive(NetClientState *nc,
          bytes_left -= desc_bytes;
          /* Move to the next descriptor */
 -        s->rx_desc_curr = allwinner_sun8i_emac_next_desc(&desc, 64);
 +        s->rx_desc_curr = allwinner_sun8i_emac_next_desc(s, &desc, 64);
          if (!s->rx_desc_curr) {
              /* Not enough buffer space available */
              s->int_sta |= INT_STA_RX_BUF_UA;
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_transmit(AwSun8iEmacState *s)
              desc.status |= TX_DESC_STATUS_LENGTH_ERR;
              break;
          }
 -        cpu_physical_memory_read(desc.addr, packet_buf + packet_bytes, bytes);
 +        dma_memory_read(&s->dma_as, desc.addr, packet_buf + packet_bytes, bytes);
          packet_bytes += bytes;
          desc.status &= ~DESC_STATUS_CTL;
 -        allwinner_sun8i_emac_flush_desc(&desc, s->tx_desc_curr);
 +        allwinner_sun8i_emac_flush_desc(s, &desc, s->tx_desc_curr);
          /* After the last descriptor, send the packet */
          if (desc.status2 & TX_DESC_STATUS2_LAST_DESC) {
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_transmit(AwSun8iEmacState *s)
              packet_bytes = 0;
              transmitted++;
          }
 -        s->tx_desc_curr = allwinner_sun8i_emac_next_desc(&desc, 0);
 +        s->tx_desc_curr = allwinner_sun8i_emac_next_desc(s, &desc, 0);
      }
      /* Raise transmit completed interrupt */
@@ -XXX,XX +XXX,XX @@ static uint64_t allwinner_sun8i_emac_read(void *opaque, hwaddr offset,
          break;
      case REG_TX_CUR_BUF:        /* Transmit Current Buffer */
          if (s->tx_desc_curr != 0) {
 -            cpu_physical_memory_read(s->tx_desc_curr, &desc, sizeof(desc));
 +            dma_memory_read(&s->dma_as, s->tx_desc_curr, &desc, sizeof(desc));
              value = desc.addr;
          } else {
              value = 0;
@@ -XXX,XX +XXX,XX @@ static uint64_t allwinner_sun8i_emac_read(void *opaque, hwaddr offset,
          break;
      case REG_RX_CUR_BUF:        /* Receive Current Buffer */
          if (s->rx_desc_curr != 0) {
 -            cpu_physical_memory_read(s->rx_desc_curr, &desc, sizeof(desc));
 +            dma_memory_read(&s->dma_as, s->rx_desc_curr, &desc, sizeof(desc));
              value = desc.addr;
          } else {
              value = 0;
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_realize(DeviceState *dev, Error **errp)
  {
      AwSun8iEmacState *s = AW_SUN8I_EMAC(dev);
 +    if (!s->dma_mr) {
 +        error_setg(errp, TYPE_AW_SUN8I_EMAC " 'dma-memory' link not set");
 +        return;
 +    }
 +
 +    address_space_init(&s->dma_as, s->dma_mr, "emac-dma");
 +
      qemu_macaddr_default_if_unset(&s->conf.macaddr);
      s->nic = qemu_new_nic(&net_allwinner_sun8i_emac_info, &s->conf,
                             object_get_typename(OBJECT(dev)), dev->id, s);
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_realize(DeviceState *dev, Error **errp)
  static Property allwinner_sun8i_emac_properties[] = {
      DEFINE_NIC_PROPERTIES(AwSun8iEmacState, conf),
      DEFINE_PROP_UINT8("phy-addr", AwSun8iEmacState, mii_phy_addr, 0),
 +    DEFINE_PROP_LINK("dma-memory", AwSun8iEmacState, dma_mr,
 +                     TYPE_MEMORY_REGION, MemoryRegion *),
      DEFINE_PROP_END_OF_LIST(),
  };
 --
 .20.1

-[PULL 13/52] target/arm: Split out aa64_va_parameter_tbi, aa64_va_parameter_tbid
+[PULL 11/35] hw/arm/xilinx_zynq: Uninline cadence_uart_create()
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-For the purpose of rebuild_hflags_a64, we do not need to compute
+As we want to call qdev_connect_clock_in() before the device
-all of the va parameters, only tbi.  Moreover, we can compute them
+is realized, we need to uninline cadence_uart_create() first.
 in a form that is more useful to storing in hflags.
-This eliminates the need for aa64_va_parameter_both, so fold that
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-in to aa64_va_parameter.  The remaining calls to aa64_va_parameter
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-are in get_phys_addr_lpae and in pauth_helper.c.
+Message-id: 20200803105647.22223-2-f4bug@amsat.org
 This reduces the total cpu consumption of aa64_va_parameter in a
 kernel boot plus a kvm guest kernel boot from 3% to 0.5%.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200216194343.21331-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/internals.h |  3 --
+ include/hw/char/cadence_uart.h | 17 -----------------
- target/arm/helper.c    | 68 +++++++++++++++++++++++-------------------
+ hw/arm/xilinx_zynq.c           | 14 ++++++++++++--
-files changed, 37 insertions(+), 34 deletions(-)
+files changed, 12 insertions(+), 19 deletions(-)
-diff --git a/target/arm/internals.h b/target/arm/internals.h
+diff --git a/include/hw/char/cadence_uart.h b/include/hw/char/cadence_uart.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
+--- a/include/hw/char/cadence_uart.h
-+++ b/target/arm/internals.h
++++ b/include/hw/char/cadence_uart.h
-@@ -XXX,XX +XXX,XX @@ typedef struct ARMVAParameters {
+@@ -XXX,XX +XXX,XX @@ typedef struct {
-     unsigned tsz    : 8;
+     Clock *refclk;
-     unsigned select : 1;
+ } CadenceUARTState;
-     bool tbi        : 1;
--    bool tbid       : 1;
+-static inline DeviceState *cadence_uart_create(hwaddr addr,
-     bool epd        : 1;
+-                                        qemu_irq irq,
-     bool hpd        : 1;
+-                                        Chardev *chr)
      bool using16k   : 1;
      bool using64k   : 1;
  } ARMVAParameters;
 -ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
 -                                        ARMMMUIdx mmu_idx);
  ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
                                     ARMMMUIdx mmu_idx, bool data);
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint8_t convert_stage2_attrs(CPUARMState *env, uint8_t s2attrs)
  }
  #endif /* !CONFIG_USER_ONLY */
 -ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
 -                                        ARMMMUIdx mmu_idx)
 +static int aa64_va_parameter_tbi(uint64_t tcr, ARMMMUIdx mmu_idx)
 +{
 +    if (regime_has_2_ranges(mmu_idx)) {
 +        return extract64(tcr, 37, 2);
 +    } else if (mmu_idx == ARMMMUIdx_Stage2) {
 +        return 0; /* VTCR_EL2 */
 +    } else {
 +        return extract32(tcr, 20, 1);
 +    }
 +}
 +
 +static int aa64_va_parameter_tbid(uint64_t tcr, ARMMMUIdx mmu_idx)
 +{
 +    if (regime_has_2_ranges(mmu_idx)) {
 +        return extract64(tcr, 51, 2);
 +    } else if (mmu_idx == ARMMMUIdx_Stage2) {
 +        return 0; /* VTCR_EL2 */
 +    } else {
 +        return extract32(tcr, 29, 1);
 +    }
 +}
 +
 +ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
 +                                   ARMMMUIdx mmu_idx, bool data)
  {
      uint64_t tcr = regime_tcr(env, mmu_idx)->raw_tcr;
 -    bool tbi, tbid, epd, hpd, using16k, using64k;
 -    int select, tsz;
 +    bool epd, hpd, using16k, using64k;
 +    int select, tsz, tbi;
      if (!regime_has_2_ranges(mmu_idx)) {
          select = 0;
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
          using16k = extract32(tcr, 15, 1);
          if (mmu_idx == ARMMMUIdx_Stage2) {
              /* VTCR_EL2 */
 -            tbi = tbid = hpd = false;
 +            hpd = false;
          } else {
 -            tbi = extract32(tcr, 20, 1);
              hpd = extract32(tcr, 24, 1);
 -            tbid = extract32(tcr, 29, 1);
          }
          epd = false;
      } else {
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
              epd = extract32(tcr, 7, 1);
              using64k = extract32(tcr, 14, 1);
              using16k = extract32(tcr, 15, 1);
 -            tbi = extract64(tcr, 37, 1);
              hpd = extract64(tcr, 41, 1);
 -            tbid = extract64(tcr, 51, 1);
          } else {
              int tg = extract32(tcr, 30, 2);
              using16k = tg == 1;
              using64k = tg == 3;
              tsz = extract32(tcr, 16, 6);
              epd = extract32(tcr, 23, 1);
 -            tbi = extract64(tcr, 38, 1);
              hpd = extract64(tcr, 42, 1);
 -            tbid = extract64(tcr, 52, 1);
          }
      }
      tsz = MIN(tsz, 39);  /* TODO: ARMv8.4-TTST */
      tsz = MAX(tsz, 16);  /* TODO: ARMv8.2-LVA  */
 +    /* Present TBI as a composite with TBID.  */
 +    tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
 +    if (!data) {
 +        tbi &= ~aa64_va_parameter_tbid(tcr, mmu_idx);
 +    }
 +    tbi = (tbi >> select) & 1;
 +
      return (ARMVAParameters) {
          .tsz = tsz,
          .select = select,
          .tbi = tbi,
 -        .tbid = tbid,
          .epd = epd,
          .hpd = hpd,
          .using16k = using16k,
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
      };
  }
 -ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
 -                                   ARMMMUIdx mmu_idx, bool data)
 -{
--    ARMVAParameters ret = aa64_va_parameters_both(env, va, mmu_idx);
+-    DeviceState *dev;
 -    SysBusDevice *s;
 -
--    /* Present TBI as a composite with TBID.  */
+-    dev = qdev_new(TYPE_CADENCE_UART);
--    ret.tbi &= (data || !ret.tbid);
+-    s = SYS_BUS_DEVICE(dev);
--    return ret;
+-    qdev_prop_set_chr(dev, "chardev", chr);
 -    sysbus_realize_and_unref(s, &error_fatal);
 -    sysbus_mmio_map(s, 0, addr);
 -    sysbus_connect_irq(s, 0, irq);
 -
 -    return dev;
 -}
 -
- #ifndef CONFIG_USER_ONLY
+ #endif
- static ARMVAParameters aa32_va_parameters(CPUARMState *env, uint32_t va,
+diff --git a/hw/arm/xilinx_zynq.c b/hw/arm/xilinx_zynq.c
-                                           ARMMMUIdx mmu_idx)
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
+--- a/hw/arm/xilinx_zynq.c
- {
++++ b/hw/arm/xilinx_zynq.c
-     uint32_t flags = rebuild_hflags_aprofile(env);
+@@ -XXX,XX +XXX,XX @@ static void zynq_init(MachineState *machine)
-     ARMMMUIdx stage1 = stage_1_mmu_idx(mmu_idx);
+     sysbus_create_simple(TYPE_CHIPIDEA, 0xE0002000, pic[53 - IRQ_OFFSET]);
--    ARMVAParameters p0 = aa64_va_parameters_both(env, 0, stage1);
+     sysbus_create_simple(TYPE_CHIPIDEA, 0xE0003000, pic[76 - IRQ_OFFSET]);
-+    uint64_t tcr = regime_tcr(env, mmu_idx)->raw_tcr;
-     uint64_t sctlr;
+-    dev = cadence_uart_create(0xE0000000, pic[59 - IRQ_OFFSET], serial_hd(0));
-     int tbii, tbid;
++    dev = qdev_new(TYPE_CADENCE_UART);
++    busdev = SYS_BUS_DEVICE(dev);
-     flags = FIELD_DP32(flags, TBFLAG_ANY, AARCH64_STATE, 1);
++    qdev_prop_set_chr(dev, "chardev", serial_hd(0));
++    sysbus_realize_and_unref(busdev, &error_fatal);
-     /* Get control bits for tagged addresses.  */
++    sysbus_mmio_map(busdev, 0, 0xE0000000);
--    if (regime_has_2_ranges(mmu_idx)) {
++    sysbus_connect_irq(busdev, 0, pic[59 - IRQ_OFFSET]);
--        ARMVAParameters p1 = aa64_va_parameters_both(env, -1, stage1);
+     qdev_connect_clock_in(dev, "refclk",
--        tbid = (p1.tbi << 1) | p0.tbi;
+                           qdev_get_clock_out(slcr, "uart0_ref_clk"));
--        tbii = tbid & ~((p1.tbid << 1) | p0.tbid);
+-    dev = cadence_uart_create(0xE0001000, pic[82 - IRQ_OFFSET], serial_hd(1));
--    } else {
++    dev = qdev_new(TYPE_CADENCE_UART);
--        tbid = p0.tbi;
++    busdev = SYS_BUS_DEVICE(dev);
--        tbii = tbid & !p0.tbid;
++    qdev_prop_set_chr(dev, "chardev", serial_hd(1));
--    }
++    sysbus_realize_and_unref(busdev, &error_fatal);
-+    tbid = aa64_va_parameter_tbi(tcr, mmu_idx);
++    sysbus_mmio_map(busdev, 0, 0xE0001000);
-+    tbii = tbid & ~aa64_va_parameter_tbid(tcr, mmu_idx);
++    sysbus_connect_irq(busdev, 0, pic[82 - IRQ_OFFSET]);
+     qdev_connect_clock_in(dev, "refclk",
-     flags = FIELD_DP32(flags, TBFLAG_A64, TBII, tbii);
+                           qdev_get_clock_out(slcr, "uart1_ref_clk"));
-     flags = FIELD_DP32(flags, TBFLAG_A64, TBID, tbid);
 --
 .20.1

-[PULL 05/52] z2: Make providing flash images non-mandatory
+[PULL 12/35] hw/arm/xilinx_zynq: Call qdev_connect_clock_in() before DeviceRealize
-From: Guenter Roeck <linux@roeck-us.net>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Up to now, the z2 machine only boots if a flash image is provided.
+Clock canonical name is set in device_set_realized (see the block
-This is not really necessary; the machine can boot from initrd or from
+added to hw/core/qdev.c in commit 0e6934f264).
-SD without it. At the same time, having to provide dummy flash images
+If we connect a clock after the device is realized, this code is
-is a nuisance and does not add any real value. Make it optional.
+not executed. This is currently not a problem as this name is only
 used for trace events, however this disrupt tracing.
-Signed-off-by: Guenter Roeck <linux@roeck-us.net>
+Fix by calling qdev_connect_clock_in() before realizing.
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200217210903.18602-1-linux@roeck-us.net
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-id: 20200803105647.22223-3-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/z2.c | 6 ------
+ hw/arm/xilinx_zynq.c | 18 +++++++++---------
-file changed, 6 deletions(-)
+file changed, 9 insertions(+), 9 deletions(-)
-diff --git a/hw/arm/z2.c b/hw/arm/z2.c
+diff --git a/hw/arm/xilinx_zynq.c b/hw/arm/xilinx_zynq.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/z2.c
+--- a/hw/arm/xilinx_zynq.c
-+++ b/hw/arm/z2.c
++++ b/hw/arm/xilinx_zynq.c
-@@ -XXX,XX +XXX,XX @@ static void z2_init(MachineState *machine)
+@@ -XXX,XX +XXX,XX @@ static void zynq_init(MachineState *machine)
-     be = 0;
+, 0x0066, 0x0022, 0x0000, 0x0000, 0x0555, 0x2aa,
- #endif
+);
-     dinfo = drive_get(IF_PFLASH, 0, 0);
--    if (!dinfo && !qtest_enabled()) {
+-    /* Create slcr, keep a pointer to connect clocks */
--        error_report("Flash image must be given with the "
+-    slcr = qdev_new("xilinx,zynq_slcr");
--                     "'pflash' parameter");
+-    sysbus_realize_and_unref(SYS_BUS_DEVICE(slcr), &error_fatal);
--        exit(1);
+-    sysbus_mmio_map(SYS_BUS_DEVICE(slcr), 0, 0xF8000000);
 -    }
 -
-     if (!pflash_cfi01_register(Z2_FLASH_BASE, "z2.flash0", Z2_FLASH_SIZE,
+     /* Create the main clock source, and feed slcr with it */
-                                dinfo ? blk_by_legacy_dinfo(dinfo) : NULL,
+     zynq_machine->ps_clk = CLOCK(object_new(TYPE_CLOCK));
-                                sector_len, 4, 0, 0, 0, 0, be)) {
+     object_property_add_child(OBJECT(zynq_machine), "ps_clk",
                                OBJECT(zynq_machine->ps_clk));
      object_unref(OBJECT(zynq_machine->ps_clk));
      clock_set_hz(zynq_machine->ps_clk, PS_CLK_FREQUENCY);
 +
 +    /* Create slcr, keep a pointer to connect clocks */
 +    slcr = qdev_new("xilinx,zynq_slcr");
      qdev_connect_clock_in(slcr, "ps_clk", zynq_machine->ps_clk);
 +    sysbus_realize_and_unref(SYS_BUS_DEVICE(slcr), &error_fatal);
 +    sysbus_mmio_map(SYS_BUS_DEVICE(slcr), 0, 0xF8000000);
      dev = qdev_new(TYPE_A9MPCORE_PRIV);
      qdev_prop_set_uint32(dev, "num-cpu", 1);
@@ -XXX,XX +XXX,XX @@ static void zynq_init(MachineState *machine)
      dev = qdev_new(TYPE_CADENCE_UART);
      busdev = SYS_BUS_DEVICE(dev);
      qdev_prop_set_chr(dev, "chardev", serial_hd(0));
 +    qdev_connect_clock_in(dev, "refclk",
 +                          qdev_get_clock_out(slcr, "uart0_ref_clk"));
      sysbus_realize_and_unref(busdev, &error_fatal);
      sysbus_mmio_map(busdev, 0, 0xE0000000);
      sysbus_connect_irq(busdev, 0, pic[59 - IRQ_OFFSET]);
 -    qdev_connect_clock_in(dev, "refclk",
 -                          qdev_get_clock_out(slcr, "uart0_ref_clk"));
      dev = qdev_new(TYPE_CADENCE_UART);
      busdev = SYS_BUS_DEVICE(dev);
      qdev_prop_set_chr(dev, "chardev", serial_hd(1));
 +    qdev_connect_clock_in(dev, "refclk",
 +                          qdev_get_clock_out(slcr, "uart1_ref_clk"));
      sysbus_realize_and_unref(busdev, &error_fatal);
      sysbus_mmio_map(busdev, 0, 0xE0001000);
      sysbus_connect_irq(busdev, 0, pic[82 - IRQ_OFFSET]);
 -    qdev_connect_clock_in(dev, "refclk",
 -                          qdev_get_clock_out(slcr, "uart1_ref_clk"));
      sysbus_create_varargs("cadence_ttc", 0xF8001000,
              pic[42-IRQ_OFFSET], pic[43-IRQ_OFFSET], pic[44-IRQ_OFFSET], NULL);
 --
 .20.1

-[PULL 03/52] hw/misc/iotkit-secctl: Fix writing to 'PPC Interrupt Clear' register
+[PULL 13/35] hw/qdev-clock: Uninline qdev_connect_clock_in()
 From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Fix warning reported by Clang static code analyzer:
+We want to assert the device is not realized. To avoid overloading
 this header including "hw/qdev-core.h", uninline the function first.
-    CC      hw/misc/iotkit-secctl.o
-  hw/misc/iotkit-secctl.c:343:9: warning: Value stored to 'value' is never read
-          value &= 0x00f000f3;
-          ^        ~~~~~~~~~~
-Fixes: b3717c23e1c
-Reported-by: Clang Static Analyzer
 Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200217132922.24607-1-f4bug@amsat.org
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200803105647.22223-4-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/misc/iotkit-secctl.c | 2 +-
+ include/hw/qdev-clock.h | 6 +-----
-file changed, 1 insertion(+), 1 deletion(-)
+ hw/core/qdev-clock.c    | 5 +++++
 files changed, 6 insertions(+), 5 deletions(-)
-diff --git a/hw/misc/iotkit-secctl.c b/hw/misc/iotkit-secctl.c
+diff --git a/include/hw/qdev-clock.h b/include/hw/qdev-clock.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/iotkit-secctl.c
+--- a/include/hw/qdev-clock.h
-+++ b/hw/misc/iotkit-secctl.c
++++ b/include/hw/qdev-clock.h
-@@ -XXX,XX +XXX,XX @@ static MemTxResult iotkit_secctl_s_write(void *opaque, hwaddr addr,
+@@ -XXX,XX +XXX,XX @@ Clock *qdev_get_clock_out(DeviceState *dev, const char *name);
-         qemu_set_irq(s->sec_resp_cfg, s->secrespcfg);
+  * Set the source clock of input clock @name of device @dev to @source.
-         break;
+  * @source period update will be propagated to @name clock.
-     case A_SECPPCINTCLR:
+  */
--        value &= 0x00f000f3;
+-static inline void qdev_connect_clock_in(DeviceState *dev, const char *name,
-+        s->secppcintstat &= ~(value & 0x00f000f3);
+-                                         Clock *source)
-         foreach_ppc(s, iotkit_secctl_ppc_update_irq_clear);
+-{
-         break;
+-    clock_set_source(qdev_get_clock_in(dev, name), source);
-     case A_SECPPCINTEN:
+-}
 +void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source);
  /**
   * qdev_alias_clock:
 diff --git a/hw/core/qdev-clock.c b/hw/core/qdev-clock.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/core/qdev-clock.c
 +++ b/hw/core/qdev-clock.c
@@ -XXX,XX +XXX,XX @@ Clock *qdev_alias_clock(DeviceState *dev, const char *name,
      return ncl->clock;
  }
 +
 +void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source)
 +{
 +    clock_set_source(qdev_get_clock_in(dev, name), source);
 +}
 --
 .20.1

-[PULL 04/52] mainstone: Make providing flash images non-mandatory
+Deleted patch
-From: Guenter Roeck <linux@roeck-us.net>
-Up to now, the mainstone machine only boots if two flash images are
-provided. This is not really necessary; the machine can boot from initrd
-or from SD without it. At the same time, having to provide dummy flash
-images is a nuisance and does not add any real value. Make it optional.
-Signed-off-by: Guenter Roeck <linux@roeck-us.net>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200217210824.18513-1-linux@roeck-us.net
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- hw/arm/mainstone.c | 11 +----------
-file changed, 1 insertion(+), 10 deletions(-)
-diff --git a/hw/arm/mainstone.c b/hw/arm/mainstone.c
-index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/mainstone.c
-+++ b/hw/arm/mainstone.c
-@@ -XXX,XX +XXX,XX @@ static void mainstone_common_init(MemoryRegion *address_space_mem,
-     /* There are two 32MiB flash devices on the board */
-     for (i = 0; i < 2; i ++) {
-         dinfo = drive_get(IF_PFLASH, 0, i);
--        if (!dinfo) {
--            if (qtest_enabled()) {
--                break;
--            }
--            error_report("Two flash images must be given with the "
--                         "'pflash' parameter");
--            exit(1);
--        }
--
-         if (!pflash_cfi01_register(mainstone_flash_base[i],
-                                    i ? "mainstone.flash1" : "mainstone.flash0",
-                                    MAINSTONE_FLASH,
--                                   blk_by_legacy_dinfo(dinfo),
-+                                   dinfo ? blk_by_legacy_dinfo(dinfo) : NULL,
-                                    sector_len, 4, 0, 0, 0, 0, be)) {
-             error_report("Error registering flash memory");
-             exit(1);
---
-.20.1

-[PULL 43/52] sh4: Fix PCI ISA IO memory subregion
+[PULL 14/35] hw/qdev-clock: Avoid calling qdev_connect_clock_in after DeviceRealize
-From: Guenter Roeck <linux@roeck-us.net>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Booting the r2d machine from flash fails because flash is not discovered.
+Clock canonical name is set in device_set_realized (see the block
-Looking at the flattened memory tree, we see the following.
+added to hw/core/qdev.c in commit 0e6934f264).
 If we connect a clock after the device is realized, this code is
 not executed. This is currently not a problem as this name is only
 used for trace events, however this disrupt tracing.
-FlatView #1
+Add a comment to document qdev_connect_clock_in() must be called
- AS "memory", root: system
+before the device is realized, and assert this condition.
  AS "cpu-memory-0", root: system
  AS "sh_pci_host", root: bus master container
  Root memory region: system
   0000000000000000-000000000000ffff (prio 0, i/o): io
   0000000000010000-0000000000ffffff (prio 0, i/o): r2d.flash @0000000000010000
-The overlapping memory region is sh_pci.isa, ie the ISA I/O region bridge.
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-This region is initially assigned to address 0xfe240000, but overwritten
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-with a write into the PCIIOBR register. This write is expected to adjust
+Message-id: 20200803105647.22223-5-f4bug@amsat.org
 the PCI memory window, but not to change the region's base adddress.
 Peter Maydell provided the following detailed explanation.
 "Section 22.3.7 and in particular figure 22.3 (of "SSH7751R user's manual:
 hardware") are clear about how this is supposed to work: there is a window
 at 0xfe240000 in the system register space for PCI I/O space. When the CPU
 makes an access into that area, the PCI controller calculates the PCI
 address to use by combining bits 0..17 of the system address with the
 bits 31..18 value that the guest has put into the PCIIOBR. That is, writing
 to the PCIIOBR changes which section of the IO address space is visible in
 the 0xfe240000 window. Instead what QEMU's implementation does is move the
 window to whatever value the guest writes to the PCIIOBR register -- so if
 the guest writes 0 we put the window at 0 in system address space."
 Fix the problem by calling memory_region_set_alias_offset() instead of
 removing and re-adding the PCI ISA subregion on writes into PCIIOBR.
 At the same time, in sh_pci_device_realize(), don't set iobr since
 it is overwritten later anyway. Instead, pass the base address to
 memory_region_add_subregion() directly.
 Many thanks to Peter Maydell for the detailed problem analysis, and for
 providing suggestions on how to fix the problem.
 Signed-off-by: Guenter Roeck <linux@roeck-us.net>
 Message-id: 20200218201050.15273-1-linux@roeck-us.net
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/sh4/sh_pci.c | 11 +++--------
+ include/hw/qdev-clock.h | 2 ++
-file changed, 3 insertions(+), 8 deletions(-)
+ hw/core/qdev-clock.c    | 1 +
 files changed, 3 insertions(+)
-diff --git a/hw/sh4/sh_pci.c b/hw/sh4/sh_pci.c
+diff --git a/include/hw/qdev-clock.h b/include/hw/qdev-clock.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/sh4/sh_pci.c
+--- a/include/hw/qdev-clock.h
-+++ b/hw/sh4/sh_pci.c
++++ b/include/hw/qdev-clock.h
-@@ -XXX,XX +XXX,XX @@ static void sh_pci_reg_write (void *p, hwaddr addr, uint64_t val,
+@@ -XXX,XX +XXX,XX @@ Clock *qdev_get_clock_out(DeviceState *dev, const char *name);
-         pcic->mbr = val & 0xff000001;
+  *
-         break;
+  * Set the source clock of input clock @name of device @dev to @source.
-     case 0x1c8:
+  * @source period update will be propagated to @name clock.
--        if ((val & 0xfffc0000) != (pcic->iobr & 0xfffc0000)) {
++ *
--            memory_region_del_subregion(get_system_memory(), &pcic->isa);
++ * Must be called before @dev is realized.
--            pcic->iobr = val & 0xfffc0001;
+  */
--            memory_region_add_subregion(get_system_memory(),
+ void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source);
--                                        pcic->iobr & 0xfffc0000, &pcic->isa);
--        }
+diff --git a/hw/core/qdev-clock.c b/hw/core/qdev-clock.c
-+        pcic->iobr = val & 0xfffc0001;
+index XXXXXXX..XXXXXXX 100644
-+        memory_region_set_alias_offset(&pcic->isa, val & 0xfffc0000);
+--- a/hw/core/qdev-clock.c
-         break;
++++ b/hw/core/qdev-clock.c
-     case 0x220:
+@@ -XXX,XX +XXX,XX @@ Clock *qdev_alias_clock(DeviceState *dev, const char *name,
-         pci_data_write(phb->bus, pcic->par, val, 4);
-@@ -XXX,XX +XXX,XX @@ static void sh_pci_device_realize(DeviceState *dev, Error **errp)
+ void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source)
-                              get_system_io(), 0, 0x40000);
+ {
-     sysbus_init_mmio(sbd, &s->memconfig_p4);
++    assert(!dev->realized);
-     sysbus_init_mmio(sbd, &s->memconfig_a7);
+     clock_set_source(qdev_get_clock_in(dev, name), source);
 -    s->iobr = 0xfe240000;
 -    memory_region_add_subregion(get_system_memory(), s->iobr, &s->isa);
 +    memory_region_add_subregion(get_system_memory(), 0xfe240000, &s->isa);
      s->dev = pci_create_simple(phb->bus, PCI_DEVFN(0, 0), "sh_pci_host");
  }
 --
 .20.1

-[PULL 27/52] target/arm: Implement ARMv8.4-PMU extension
+[PULL 15/35] hw/misc/unimp: Display value after offset
-The ARMv8.4-PMU extension adds:
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
  * one new required event, STALL
  * one new system register PMMIR_EL1
-(There are also some more L1-cache related events, but since
+To better align the read/write accesses, display the value after
-we don't implement any cache we don't provide these, in the
+the offset (read accesses only display the offset).
 same way we don't provide the base-PMUv3 cache events.)
 The STALL event "counts every attributable cycle on which no
 attributable instruction or operation was sent for execution on this
 PE".  QEMU doesn't stall in this sense, so this is another
 always-reads-zero event.
 The PMMIR_EL1 register is a read-only register providing
 implementation-specific information about the PMU; currently it has
 only one field, SLOTS, which defines behaviour of the STALL_SLOT PMU
 event.  Since QEMU doesn't implement the STALL_SLOT event, we can
 validly make the register read zero.
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20200812190206.31595-2-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-15-peter.maydell@linaro.org
 ---
- target/arm/cpu.h    | 18 ++++++++++++++++++
+ hw/misc/unimp.c | 8 ++++----
- target/arm/helper.c | 22 +++++++++++++++++++++-
+file changed, 4 insertions(+), 4 deletions(-)
 files changed, 39 insertions(+), 1 deletion(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/hw/misc/unimp.c b/hw/misc/unimp.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/hw/misc/unimp.c
-+++ b/target/arm/cpu.h
++++ b/hw/misc/unimp.c
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_pmu_8_1(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static uint64_t unimp_read(void *opaque, hwaddr offset, unsigned size)
-         FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) != 0xf;
+ {
      UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
 -    qemu_log_mask(LOG_UNIMP, "%s: unimplemented device read "
 +    qemu_log_mask(LOG_UNIMP, "%s: unimplemented device read  "
                    "(size %d, offset 0x%" HWADDR_PRIx ")\n",
                    s->name, size, offset);
      return 0;
@@ -XXX,XX +XXX,XX @@ static void unimp_write(void *opaque, hwaddr offset,
      UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
      qemu_log_mask(LOG_UNIMP, "%s: unimplemented device write "
 -                  "(size %d, value 0x%" PRIx64
 -                  ", offset 0x%" HWADDR_PRIx ")\n",
 -                  s->name, size, value, offset);
 +                  "(size %d, offset 0x%" HWADDR_PRIx
 +                  ", value 0x%" PRIx64 ")\n",
 +                  s->name, size, offset, value);
  }
-+static inline bool isar_feature_aa32_pmu_8_4(const ARMISARegisters *id)
+ static const MemoryRegionOps unimp_ops = {
 +{
 +    /* 0xf means "non-standard IMPDEF PMU" */
 +    return FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) >= 5 &&
 +        FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) != 0xf;
 +}
 +
  /*
   * 64-bit feature tests via id registers.
   */
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_pmu_8_1(const ARMISARegisters *id)
          FIELD_EX64(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) != 0xf;
  }
 +static inline bool isar_feature_aa64_pmu_8_4(const ARMISARegisters *id)
 +{
 +    return FIELD_EX32(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) >= 5 &&
 +        FIELD_EX32(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) != 0xf;
 +}
 +
  /*
   * Feature tests for "does this exist in either 32-bit or 64-bit?"
   */
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_any_pmu_8_1(const ARMISARegisters *id)
      return isar_feature_aa64_pmu_8_1(id) || isar_feature_aa32_pmu_8_1(id);
  }
 +static inline bool isar_feature_any_pmu_8_4(const ARMISARegisters *id)
 +{
 +    return isar_feature_aa64_pmu_8_4(id) || isar_feature_aa32_pmu_8_4(id);
 +}
 +
  /*
   * Forward to the above feature tests given an ARMCPU pointer.
   */
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static bool pmu_8_1_events_supported(CPUARMState *env)
      return cpu_isar_feature(any_pmu_8_1, env_archcpu(env));
  }
 +static bool pmu_8_4_events_supported(CPUARMState *env)
 +{
 +    /* For events which are supported in any v8.1 PMU */
 +    return cpu_isar_feature(any_pmu_8_4, env_archcpu(env));
 +}
 +
  static uint64_t zero_event_get_count(CPUARMState *env)
  {
      /* For events which on QEMU never fire, so their count is always zero */
@@ -XXX,XX +XXX,XX @@ static const pm_event pm_events[] = {
        .get_count = zero_event_get_count,
        .ns_per_count = zero_event_ns_per,
      },
 +    { .number = 0x03c, /* STALL */
 +      .supported = pmu_8_4_events_supported,
 +      .get_count = zero_event_get_count,
 +      .ns_per_count = zero_event_ns_per,
 +    },
  };
  /*
@@ -XXX,XX +XXX,XX @@ static const pm_event pm_events[] = {
   * should first be updated to something sparse instead of the current
   * supported_event_map[] array.
   */
 -#define MAX_EVENT_ID 0x24
 +#define MAX_EVENT_ID 0x3c
  #define UNSUPPORTED_EVENT UINT16_MAX
  static uint16_t supported_event_map[MAX_EVENT_ID + 1];
@@ -XXX,XX +XXX,XX @@ static void define_pmu_regs(ARMCPU *cpu)
          };
          define_arm_cp_regs(cpu, v81_pmu_regs);
      }
 +    if (cpu_isar_feature(any_pmu_8_4, cpu)) {
 +        static const ARMCPRegInfo v84_pmmir = {
 +            .name = "PMMIR_EL1", .state = ARM_CP_STATE_BOTH,
 +            .opc0 = 3, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 6,
 +            .access = PL1_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
 +            .resetvalue = 0
 +        };
 +        define_one_arm_cp_reg(cpu, &v84_pmmir);
 +    }
  }
  /* We don't know until after realize whether there's a GICv3
 --
 .20.1

-[PULL 22/52] target/arm: Add _aa64_ and _any_ versions of pmu_8_1 isar checks
+[PULL 16/35] hw/misc/unimp: Display the value with width of the access size
-Add the 64-bit version of the "is this a v8.1 PMUv3?"
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 ID register check function, and the _any_ version that
 checks for either AArch32 or AArch64 support. We'll use
 this in a later commit.
-We don't (yet) do any isar_feature checks on ID_AA64DFR1_EL1,
+To quickly notice the access size, display the value with the
-but we move id_aa64dfr1 into the ARMISARegisters struct with
+width of the access (i.e. 16-bit access is displayed 0x0000,
-id_aa64dfr0, for consistency.
+while 8-bit access 0x00).
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20200812190206.31595-3-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-10-peter.maydell@linaro.org
 ---
- target/arm/cpu.h    | 15 +++++++++++++--
+ hw/misc/unimp.c | 4 ++--
- target/arm/cpu.c    |  3 ++-
+file changed, 2 insertions(+), 2 deletions(-)
  target/arm/cpu64.c  |  6 +++---
  target/arm/helper.c | 12 +++++++-----
 files changed, 25 insertions(+), 11 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/hw/misc/unimp.c b/hw/misc/unimp.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/hw/misc/unimp.c
-+++ b/target/arm/cpu.h
++++ b/hw/misc/unimp.c
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
+@@ -XXX,XX +XXX,XX @@ static void unimp_write(void *opaque, hwaddr offset,
-         uint64_t id_aa64mmfr0;
-         uint64_t id_aa64mmfr1;
+     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device write "
-         uint64_t id_aa64mmfr2;
+                   "(size %d, offset 0x%" HWADDR_PRIx
-+        uint64_t id_aa64dfr0;
+-                  ", value 0x%" PRIx64 ")\n",
-+        uint64_t id_aa64dfr1;
+-                  s->name, size, offset, value);
-     } isar;
++                  ", value 0x%0*" PRIx64 ")\n",
-     uint32_t midr;
++                  s->name, size, offset, size << 1, value);
      uint32_t revidr;
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
      uint32_t id_mmfr2;
      uint32_t id_mmfr3;
      uint32_t id_mmfr4;
 -    uint64_t id_aa64dfr0;
 -    uint64_t id_aa64dfr1;
      uint64_t id_aa64afr0;
      uint64_t id_aa64afr1;
      uint32_t dbgdidr;
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_bti(const ARMISARegisters *id)
      return FIELD_EX64(id->id_aa64pfr1, ID_AA64PFR1, BT) != 0;
  }
-+static inline bool isar_feature_aa64_pmu_8_1(const ARMISARegisters *id)
+ static const MemoryRegionOps unimp_ops = {
 +{
 +    return FIELD_EX64(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) >= 4 &&
 +        FIELD_EX64(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) != 0xf;
 +}
 +
  /*
   * Feature tests for "does this exist in either 32-bit or 64-bit?"
   */
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_any_predinv(const ARMISARegisters *id)
      return isar_feature_aa64_predinv(id) || isar_feature_aa32_predinv(id);
  }
 +static inline bool isar_feature_any_pmu_8_1(const ARMISARegisters *id)
 +{
 +    return isar_feature_aa64_pmu_8_1(id) || isar_feature_aa32_pmu_8_1(id);
 +}
 +
  /*
   * Forward to the above feature tests given an ARMCPU pointer.
   */
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
                  cpu);
  #endif
      } else {
 -        cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
 +        cpu->isar.id_aa64dfr0 =
 +            FIELD_DP64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
          cpu->isar.id_dfr0 = FIELD_DP32(cpu->isar.id_dfr0, ID_DFR0, PERFMON, 0);
          cpu->pmceid0 = 0;
          cpu->pmceid1 = 0;
 diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu64.c
 +++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
      cpu->isar.id_isar5 = 0x00011121;
      cpu->isar.id_isar6 = 0;
      cpu->isar.id_aa64pfr0 = 0x00002222;
 -    cpu->id_aa64dfr0 = 0x10305106;
 +    cpu->isar.id_aa64dfr0 = 0x10305106;
      cpu->isar.id_aa64isar0 = 0x00011120;
      cpu->isar.id_aa64mmfr0 = 0x00001124;
      cpu->dbgdidr = 0x3516d000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
      cpu->isar.id_isar5 = 0x00011121;
      cpu->isar.id_isar6 = 0;
      cpu->isar.id_aa64pfr0 = 0x00002222;
 -    cpu->id_aa64dfr0 = 0x10305106;
 +    cpu->isar.id_aa64dfr0 = 0x10305106;
      cpu->isar.id_aa64isar0 = 0x00011120;
      cpu->isar.id_aa64mmfr0 = 0x00001122; /* 40 bit physical addr */
      cpu->dbgdidr = 0x3516d000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
      cpu->isar.id_isar4 = 0x00011142;
      cpu->isar.id_isar5 = 0x00011121;
      cpu->isar.id_aa64pfr0 = 0x00002222;
 -    cpu->id_aa64dfr0 = 0x10305106;
 +    cpu->isar.id_aa64dfr0 = 0x10305106;
      cpu->isar.id_aa64isar0 = 0x00011120;
      cpu->isar.id_aa64mmfr0 = 0x00001124;
      cpu->dbgdidr = 0x3516d000;
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/semihosting/semihost.h"
  #include "sysemu/cpus.h"
  #include "sysemu/kvm.h"
 +#include "sysemu/tcg.h"
  #include "qemu/range.h"
  #include "qapi/qapi-commands-machine-target.h"
  #include "qapi/error.h"
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
       * check that if they both exist then they agree.
       */
      if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
 -        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
 -        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
 -        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) == ctx_cmps);
 +        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
 +        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
 +        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS)
 +               == ctx_cmps);
      }
      define_one_arm_cp_reg(cpu, &dbgdidr);
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 5, .opc2 = 0,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa64_tid3,
 -              .resetvalue = cpu->id_aa64dfr0 },
 +              .resetvalue = cpu->isar.id_aa64dfr0 },
              { .name = "ID_AA64DFR1_EL1", .state = ARM_CP_STATE_AA64,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 5, .opc2 = 1,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa64_tid3,
 -              .resetvalue = cpu->id_aa64dfr1 },
 +              .resetvalue = cpu->isar.id_aa64dfr1 },
              { .name = "ID_AA64DFR2_EL1_RESERVED", .state = ARM_CP_STATE_AA64,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 5, .opc2 = 2,
                .access = PL1_R, .type = ARM_CP_CONST,
 --
 .20.1

-[PULL 21/52] target/arm: Define an aa32_pmu_8_1 isar feature test function
+[PULL 17/35] hw/misc/unimp: Display the offset with width of the region size
-Instead of open-coding a check on the ID_DFR0 PerfMon ID register
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 field, create a standardly-named isar_feature for "does AArch32 have
 a v8.1 PMUv3" and use it.
-This entails moving the id_dfr0 field into the ARMISARegisters struct.
+To have a better idea of how big is the region where the offset
 belongs, display the value with the width of the region size
 (i.e. a region of 0x1000 bytes uses 0x000 format).
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20200812190206.31595-4-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-9-peter.maydell@linaro.org
 ---
- target/arm/cpu.h      |  9 ++++++++-
+ include/hw/misc/unimp.h |  1 +
- hw/intc/armv7m_nvic.c |  2 +-
+ hw/misc/unimp.c         | 10 ++++++----
- target/arm/cpu.c      | 28 ++++++++++++++--------------
+files changed, 7 insertions(+), 4 deletions(-)
  target/arm/cpu64.c    |  6 +++---
  target/arm/helper.c   |  5 ++---
 files changed, 28 insertions(+), 22 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/include/hw/misc/unimp.h b/include/hw/misc/unimp.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/include/hw/misc/unimp.h
-+++ b/target/arm/cpu.h
++++ b/include/hw/misc/unimp.h
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
+@@ -XXX,XX +XXX,XX @@
-         uint32_t mvfr0;
+ typedef struct {
-         uint32_t mvfr1;
+     SysBusDevice parent_obj;
-         uint32_t mvfr2;
+     MemoryRegion iomem;
-+        uint32_t id_dfr0;
++    unsigned offset_fmt_width;
-         uint64_t id_aa64isar0;
+     char *name;
-         uint64_t id_aa64isar1;
+     uint64_t size;
-         uint64_t id_aa64pfr0;
+ } UnimplementedDeviceState;
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
+diff --git a/hw/misc/unimp.c b/hw/misc/unimp.c
-     uint32_t reset_sctlr;
+index XXXXXXX..XXXXXXX 100644
-     uint32_t id_pfr0;
+--- a/hw/misc/unimp.c
-     uint32_t id_pfr1;
++++ b/hw/misc/unimp.c
--    uint32_t id_dfr0;
+@@ -XXX,XX +XXX,XX @@ static uint64_t unimp_read(void *opaque, hwaddr offset, unsigned size)
-     uint64_t pmceid0;
+     UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
-     uint64_t pmceid1;
-     uint32_t id_afr0;
+     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device read  "
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_ats1e1(const ARMISARegisters *id)
+-                  "(size %d, offset 0x%" HWADDR_PRIx ")\n",
-     return FIELD_EX64(id->mvfr0, ID_MMFR3, PAN) >= 2;
+-                  s->name, size, offset);
 +                  "(size %d, offset 0x%0*" HWADDR_PRIx ")\n",
 +                  s->name, size, s->offset_fmt_width, offset);
      return 0;
  }
-+static inline bool isar_feature_aa32_pmu_8_1(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static void unimp_write(void *opaque, hwaddr offset,
-+{
+     UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
-+    /* 0xf means "non-standard IMPDEF PMU" */
-+    return FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
+     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device write "
-+        FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) != 0xf;
+-                  "(size %d, offset 0x%" HWADDR_PRIx
-+}
++                  "(size %d, offset 0x%0*" HWADDR_PRIx
                    ", value 0x%0*" PRIx64 ")\n",
 -                  s->name, size, offset, size << 1, value);
 +                  s->name, size, s->offset_fmt_width, offset, size << 1, value);
  }
  static const MemoryRegionOps unimp_ops = {
@@ -XXX,XX +XXX,XX @@ static void unimp_realize(DeviceState *dev, Error **errp)
          return;
      }
 +    s->offset_fmt_width = DIV_ROUND_UP(64 - clz64(s->size - 1), 4);
 +
- /*
+     memory_region_init_io(&s->iomem, OBJECT(s), &unimp_ops, s,
-  * 64-bit feature tests via id registers.
+                           s->name, s->size);
-  */
+     sysbus_init_mmio(SYS_BUS_DEVICE(s), &s->iomem);
 diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/armv7m_nvic.c
 +++ b/hw/intc/armv7m_nvic.c
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
      case 0xd44: /* PFR1.  */
          return cpu->id_pfr1;
      case 0xd48: /* DFR0.  */
 -        return cpu->id_dfr0;
 +        return cpu->isar.id_dfr0;
      case 0xd4c: /* AFR0.  */
          return cpu->id_afr0;
      case 0xd50: /* MMFR0.  */
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
  #endif
      } else {
          cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
 -        cpu->id_dfr0 = FIELD_DP32(cpu->id_dfr0, ID_DFR0, PERFMON, 0);
 +        cpu->isar.id_dfr0 = FIELD_DP32(cpu->isar.id_dfr0, ID_DFR0, PERFMON, 0);
          cpu->pmceid0 = 0;
          cpu->pmceid1 = 0;
      }
@@ -XXX,XX +XXX,XX @@ static void arm1136_r2_initfn(Object *obj)
      cpu->reset_sctlr = 0x00050078;
      cpu->id_pfr0 = 0x111;
      cpu->id_pfr1 = 0x1;
 -    cpu->id_dfr0 = 0x2;
 +    cpu->isar.id_dfr0 = 0x2;
      cpu->id_afr0 = 0x3;
      cpu->id_mmfr0 = 0x01130003;
      cpu->id_mmfr1 = 0x10030302;
@@ -XXX,XX +XXX,XX @@ static void arm1136_initfn(Object *obj)
      cpu->reset_sctlr = 0x00050078;
      cpu->id_pfr0 = 0x111;
      cpu->id_pfr1 = 0x1;
 -    cpu->id_dfr0 = 0x2;
 +    cpu->isar.id_dfr0 = 0x2;
      cpu->id_afr0 = 0x3;
      cpu->id_mmfr0 = 0x01130003;
      cpu->id_mmfr1 = 0x10030302;
@@ -XXX,XX +XXX,XX @@ static void arm1176_initfn(Object *obj)
      cpu->reset_sctlr = 0x00050078;
      cpu->id_pfr0 = 0x111;
      cpu->id_pfr1 = 0x11;
 -    cpu->id_dfr0 = 0x33;
 +    cpu->isar.id_dfr0 = 0x33;
      cpu->id_afr0 = 0;
      cpu->id_mmfr0 = 0x01130003;
      cpu->id_mmfr1 = 0x10030302;
@@ -XXX,XX +XXX,XX @@ static void arm11mpcore_initfn(Object *obj)
      cpu->ctr = 0x1d192992; /* 32K icache 32K dcache */
      cpu->id_pfr0 = 0x111;
      cpu->id_pfr1 = 0x1;
 -    cpu->id_dfr0 = 0;
 +    cpu->isar.id_dfr0 = 0;
      cpu->id_afr0 = 0x2;
      cpu->id_mmfr0 = 0x01100103;
      cpu->id_mmfr1 = 0x10020302;
@@ -XXX,XX +XXX,XX @@ static void cortex_m3_initfn(Object *obj)
      cpu->pmsav7_dregion = 8;
      cpu->id_pfr0 = 0x00000030;
      cpu->id_pfr1 = 0x00000200;
 -    cpu->id_dfr0 = 0x00100000;
 +    cpu->isar.id_dfr0 = 0x00100000;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x00000030;
      cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_m4_initfn(Object *obj)
      cpu->isar.mvfr2 = 0x00000000;
      cpu->id_pfr0 = 0x00000030;
      cpu->id_pfr1 = 0x00000200;
 -    cpu->id_dfr0 = 0x00100000;
 +    cpu->isar.id_dfr0 = 0x00100000;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x00000030;
      cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_m7_initfn(Object *obj)
      cpu->isar.mvfr2 = 0x00000040;
      cpu->id_pfr0 = 0x00000030;
      cpu->id_pfr1 = 0x00000200;
 -    cpu->id_dfr0 = 0x00100000;
 +    cpu->isar.id_dfr0 = 0x00100000;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x00100030;
      cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_m33_initfn(Object *obj)
      cpu->isar.mvfr2 = 0x00000040;
      cpu->id_pfr0 = 0x00000030;
      cpu->id_pfr1 = 0x00000210;
 -    cpu->id_dfr0 = 0x00200000;
 +    cpu->isar.id_dfr0 = 0x00200000;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x00101F40;
      cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
      cpu->midr = 0x411fc153; /* r1p3 */
      cpu->id_pfr0 = 0x0131;
      cpu->id_pfr1 = 0x001;
 -    cpu->id_dfr0 = 0x010400;
 +    cpu->isar.id_dfr0 = 0x010400;
      cpu->id_afr0 = 0x0;
      cpu->id_mmfr0 = 0x0210030;
      cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a8_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50078;
      cpu->id_pfr0 = 0x1031;
      cpu->id_pfr1 = 0x11;
 -    cpu->id_dfr0 = 0x400;
 +    cpu->isar.id_dfr0 = 0x400;
      cpu->id_afr0 = 0;
      cpu->id_mmfr0 = 0x31100003;
      cpu->id_mmfr1 = 0x20000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a9_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50078;
      cpu->id_pfr0 = 0x1031;
      cpu->id_pfr1 = 0x11;
 -    cpu->id_dfr0 = 0x000;
 +    cpu->isar.id_dfr0 = 0x000;
      cpu->id_afr0 = 0;
      cpu->id_mmfr0 = 0x00100103;
      cpu->id_mmfr1 = 0x20000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50078;
      cpu->id_pfr0 = 0x00001131;
      cpu->id_pfr1 = 0x00011011;
 -    cpu->id_dfr0 = 0x02010555;
 +    cpu->isar.id_dfr0 = 0x02010555;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x10101105;
      cpu->id_mmfr1 = 0x40000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50078;
      cpu->id_pfr0 = 0x00001131;
      cpu->id_pfr1 = 0x00011011;
 -    cpu->id_dfr0 = 0x02010555;
 +    cpu->isar.id_dfr0 = 0x02010555;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x10201105;
      cpu->id_mmfr1 = 0x20000000;
 diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu64.c
 +++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50838;
      cpu->id_pfr0 = 0x00000131;
      cpu->id_pfr1 = 0x00011011;
 -    cpu->id_dfr0 = 0x03010066;
 +    cpu->isar.id_dfr0 = 0x03010066;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x10101105;
      cpu->id_mmfr1 = 0x40000000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50838;
      cpu->id_pfr0 = 0x00000131;
      cpu->id_pfr1 = 0x00011011;
 -    cpu->id_dfr0 = 0x03010066;
 +    cpu->isar.id_dfr0 = 0x03010066;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x10101105;
      cpu->id_mmfr1 = 0x40000000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
      cpu->reset_sctlr = 0x00c50838;
      cpu->id_pfr0 = 0x00000131;
      cpu->id_pfr1 = 0x00011011;
 -    cpu->id_dfr0 = 0x03010066;
 +    cpu->isar.id_dfr0 = 0x03010066;
      cpu->id_afr0 = 0x00000000;
      cpu->id_mmfr0 = 0x10201105;
      cpu->id_mmfr1 = 0x40000000;
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void define_pmu_regs(ARMCPU *cpu)
          g_free(pmevtyper_name);
          g_free(pmevtyper_el0_name);
      }
 -    if (FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
 -            FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) != 0xf) {
 +    if (cpu_isar_feature(aa32_pmu_8_1, cpu)) {
          ARMCPRegInfo v81_pmu_regs[] = {
              { .name = "PMCEID2", .state = ARM_CP_STATE_AA32,
                .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 4,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 2,
                .access = PL1_R, .type = ARM_CP_CONST,
                .accessfn = access_aa32_tid3,
 -              .resetvalue = cpu->id_dfr0 },
 +              .resetvalue = cpu->isar.id_dfr0 },
              { .name = "ID_AFR0", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 3,
                .access = PL1_R, .type = ARM_CP_CONST,
 --
 .20.1

-[PULL 06/52] target/arm: Flush high bits of sve register after AdvSIMD EXT
+[PULL 18/35] armsse: Define ARMSSEClass correctly
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Eduardo Habkost <ehabkost@redhat.com>
-Writes to AdvSIMD registers flush the bits above 128.
+TYPE_ARM_SSE is a TYPE_SYS_BUS_DEVICE subclass, but
 ARMSSEClass::parent_class is declared as DeviceClass.
-Buglink: https://bugs.launchpad.net/bugs/1863247
+It never caused any problems by pure luck:
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214194643.23317-2-richard.henderson@linaro.org
+We were not setting class_size for TYPE_ARM_SSE, so class_size of
 TYPE_SYS_BUS_DEVICE was being used (sizeof(SysBusDeviceClass)).
 This made the system allocate enough memory for TYPE_ARM_SSE
 devices even though ARMSSEClass was too small for a sysbus
 device.
 Additionally, the ARMSSEClass::info field ended up at the same
 offset as SysBusDeviceClass::explicit_ofw_unit_address.  This
 would make sysbus_get_fw_dev_path() crash for the device.
 Luckily, sysbus_get_fw_dev_path() never gets called for
 TYPE_ARM_SSE devices, because qdev_get_fw_dev_path() is only used
 by the boot device code, and TYPE_ARM_SSE devices don't appear at
 the fw_boot_order list.
 Signed-off-by: Eduardo Habkost <ehabkost@redhat.com>
 Message-id: 20200826181006.4097163-1-ehabkost@redhat.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 1 +
+ include/hw/arm/armsse.h | 2 +-
-file changed, 1 insertion(+)
+ hw/arm/armsse.c         | 1 +
 files changed, 2 insertions(+), 1 deletion(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/include/hw/arm/armsse.h b/include/hw/arm/armsse.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/include/hw/arm/armsse.h
-+++ b/target/arm/translate-a64.c
++++ b/include/hw/arm/armsse.h
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_ext(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ typedef struct ARMSSE {
-     tcg_temp_free_i64(tcg_resl);
+ typedef struct ARMSSEInfo ARMSSEInfo;
-     write_vec_element(s, tcg_resh, rd, 1, MO_64);
-     tcg_temp_free_i64(tcg_resh);
+ typedef struct ARMSSEClass {
-+    clear_vec_high(s, true, rd);
+-    DeviceClass parent_class;
- }
++    SysBusDeviceClass parent_class;
+     const ARMSSEInfo *info;
- /* TBL/TBX
+ } ARMSSEClass;
 diff --git a/hw/arm/armsse.c b/hw/arm/armsse.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/armsse.c
 +++ b/hw/arm/armsse.c
@@ -XXX,XX +XXX,XX @@ static const TypeInfo armsse_info = {
      .name = TYPE_ARMSSE,
      .parent = TYPE_SYS_BUS_DEVICE,
      .instance_size = sizeof(ARMSSE),
 +    .class_size = sizeof(ARMSSEClass),
      .instance_init = armsse_init,
      .abstract = true,
      .interfaces = (InterfaceInfo[]) {
 --
 .20.1

-[PULL 49/52] target/arm: Add isar_feature_aa32_{fpsp_v2, fpsp_v3, fpdp_v3}
+[PULL 19/35] qemu/int128: Add int128_lshift
 From: Richard Henderson <richard.henderson@linaro.org>
-We will shortly use these to test for VFPv2 and VFPv3
+Add left-shift to match the existing right-shift.
 in different situations.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214181547.21408-8-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-2-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h | 18 ++++++++++++++++++
+ include/qemu/int128.h | 16 ++++++++++++++++
-file changed, 18 insertions(+)
+file changed, 16 insertions(+)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/include/qemu/int128.h b/include/qemu/int128.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/include/qemu/int128.h
-+++ b/target/arm/cpu.h
++++ b/include/qemu/int128.h
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fpshvec(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static inline Int128 int128_rshift(Int128 a, int n)
-     return FIELD_EX32(id->mvfr0, MVFR0, FPSHVEC) > 0;
+     return a >> n;
  }
-+static inline bool isar_feature_aa32_fpsp_v2(const ARMISARegisters *id)
++static inline Int128 int128_lshift(Int128 a, int n)
 +{
-+    /* Return true if CPU supports single precision floating point, VFPv2 */
++    return a << n;
 +    return FIELD_EX32(id->mvfr0, MVFR0, FPSP) > 0;
 +}
 +
-+static inline bool isar_feature_aa32_fpsp_v3(const ARMISARegisters *id)
+ static inline Int128 int128_add(Int128 a, Int128 b)
  {
      return a + b;
@@ -XXX,XX +XXX,XX @@ static inline Int128 int128_rshift(Int128 a, int n)
      }
  }
 +static inline Int128 int128_lshift(Int128 a, int n)
 +{
-+    /* Return true if CPU supports single precision floating point, VFPv3 */
++    uint64_t l = a.lo << (n & 63);
-+    return FIELD_EX32(id->mvfr0, MVFR0, FPSP) >= 2;
++    if (n >= 64) {
 +        return int128_make128(0, l);
 +    } else if (n > 0) {
 +        return int128_make128(l, (a.hi << n) | (a.lo >> (64 - n)));
 +    }
 +    return a;
 +}
 +
- static inline bool isar_feature_aa32_fpdp_v2(const ARMISARegisters *id)
+ static inline Int128 int128_add(Int128 a, Int128 b)
  {
-     /* Return true if CPU supports double precision floating point, VFPv2 */
+     uint64_t lo = a.lo + b.lo;
      return FIELD_EX32(id->mvfr0, MVFR0, FPDP) > 0;
  }
 +static inline bool isar_feature_aa32_fpdp_v3(const ARMISARegisters *id)
 +{
 +    /* Return true if CPU supports double precision floating point, VFPv3 */
 +    return FIELD_EX32(id->mvfr0, MVFR0, FPDP) >= 2;
 +}
 +
  /*
   * We always set the FP and SIMD FP16 fields to indicate identical
   * levels of support (assuming SIMD is implemented at all), so
 --
 .20.1

-[PULL 48/52] target/arm: Rename isar_feature_aa32_fpdp_v2
+[PULL 20/35] target/arm: Split out gen_gvec_fn_zz
 From: Richard Henderson <richard.henderson@linaro.org>
-The old name, isar_feature_aa32_fpdp, does not reflect
+Model the new function on gen_gvec_fn2 in translate-a64.c, but
-that the test includes VFPv2.  We will introduce further
+indicating which kind of register and in which order.  Since there
-feature tests for VFPv3.
+is only one user of do_vector2_z, fold it into do_mov_z.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200214181547.21408-7-richard.henderson@linaro.org
-[PMM: fixed grammar in commit message]
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-3-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h               |  4 ++--
+ target/arm/translate-sve.c | 19 ++++++++++---------
- target/arm/translate-vfp.inc.c | 40 +++++++++++++++++-----------------
+file changed, 10 insertions(+), 9 deletions(-)
 files changed, 22 insertions(+), 22 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fpshvec(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
      return FIELD_EX32(id->mvfr0, MVFR0, FPSHVEC) > 0;
  }
--static inline bool isar_feature_aa32_fpdp(const ARMISARegisters *id)
+ /* Invoke a vector expander on two Zregs.  */
-+static inline bool isar_feature_aa32_fpdp_v2(const ARMISARegisters *id)
+-static bool do_vector2_z(DisasContext *s, GVecGen2Fn *gvec_fn,
 -                         int esz, int rd, int rn)
 +
 +static void gen_gvec_fn_zz(DisasContext *s, GVecGen2Fn *gvec_fn,
 +                           int esz, int rd, int rn)
  {
--    /* Return true if CPU supports double precision floating point */
+-    if (sve_access_check(s)) {
-+    /* Return true if CPU supports double precision floating point, VFPv2 */
+-        unsigned vsz = vec_full_reg_size(s);
-     return FIELD_EX32(id->mvfr0, MVFR0, FPDP) > 0;
+-        gvec_fn(esz, vec_full_reg_offset(s, rd),
 -                vec_full_reg_offset(s, rn), vsz, vsz);
 -    }
 -    return true;
 +    unsigned vsz = vec_full_reg_size(s);
 +    gvec_fn(esz, vec_full_reg_offset(s, rd),
 +            vec_full_reg_offset(s, rn), vsz, vsz);
  }
-diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
+ /* Invoke a vector expander on three Zregs.  */
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static bool do_vector3_z(DisasContext *s, GVecGen3Fn *gvec_fn,
---- a/target/arm/translate-vfp.inc.c
+ /* Invoke a vector move on two Zregs.  */
-+++ b/target/arm/translate-vfp.inc.c
+ static bool do_mov_z(DisasContext *s, int rd, int rn)
-@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
+ {
-         return false;
+-    return do_vector2_z(s, tcg_gen_gvec_mov, 0, rd, rn);
-     }
++    if (sve_access_check(s)) {
++        gen_gvec_fn_zz(s, tcg_gen_gvec_mov, MO_8, rd, rn);
--    if (dp && !dc_isar_feature(aa32_fpdp, s)) {
++    }
-+    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
++    return true;
-         return false;
+ }
-     }
+ /* Initialize a Zreg with replications of a 64-bit immediate.  */
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINMAXNM(DisasContext *s, arg_VMINMAXNM *a)
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp, s)) {
 +    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp, s)) {
 +    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp, s)) {
 +    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VFM_dp(DisasContext *s, arg_VFM_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp(DisasContext *s, arg_VCVT_sp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_int_dp(DisasContext *s, arg_VCVT_int_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp_int(DisasContext *s, arg_VCVT_dp_int *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp, s)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 --
 .20.1

-[PULL 33/52] target/arm: Use FIELD_EX32 for testing 32-bit fields
+[PULL 21/35] target/arm: Split out gen_gvec_fn_zzz, do_zzz_fn
-Cut-and-paste errors mean we're using FIELD_EX64() to extract fields from
+From: Richard Henderson <richard.henderson@linaro.org>
 some 32-bit ID register fields. Use FIELD_EX32() instead. (This makes
 no difference in behaviour, it's just more consistent.)
+Model gen_gvec_fn_zzz on gen_gvec_fn3 in translate-a64.c, but
+indicating which kind of register and in which order.
+Model do_zzz_fn on the other do_foo functions that take an
+argument set and verify sve enabled.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-21-peter.maydell@linaro.org
 ---
- target/arm/cpu.h | 18 +++++++++---------
+ target/arm/translate-sve.c | 43 +++++++++++++++++++++-----------------
-file changed, 9 insertions(+), 9 deletions(-)
+file changed, 24 insertions(+), 19 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static void gen_gvec_fn_zz(DisasContext *s, GVecGen2Fn *gvec_fn,
- static inline bool isar_feature_aa32_fp_d32(const ARMISARegisters *id)
+ }
  /* Invoke a vector expander on three Zregs.  */
 -static bool do_vector3_z(DisasContext *s, GVecGen3Fn *gvec_fn,
 -                         int esz, int rd, int rn, int rm)
 +static void gen_gvec_fn_zzz(DisasContext *s, GVecGen3Fn *gvec_fn,
 +                            int esz, int rd, int rn, int rm)
  {
-     /* Return true if D16-D31 are implemented */
+-    if (sve_access_check(s)) {
--    return FIELD_EX64(id->mvfr0, MVFR0, SIMDREG) >= 2;
+-        unsigned vsz = vec_full_reg_size(s);
-+    return FIELD_EX32(id->mvfr0, MVFR0, SIMDREG) >= 2;
+-        gvec_fn(esz, vec_full_reg_offset(s, rd),
 -                vec_full_reg_offset(s, rn),
 -                vec_full_reg_offset(s, rm), vsz, vsz);
 -    }
 -    return true;
 +    unsigned vsz = vec_full_reg_size(s);
 +    gvec_fn(esz, vec_full_reg_offset(s, rd),
 +            vec_full_reg_offset(s, rn),
 +            vec_full_reg_offset(s, rm), vsz, vsz);
  }
- static inline bool isar_feature_aa32_fpshvec(const ARMISARegisters *id)
+ /* Invoke a vector move on two Zregs.  */
@@ -XXX,XX +XXX,XX @@ const uint64_t pred_esz_masks[4] = {
   *** SVE Logical - Unpredicated Group
   */
 +static bool do_zzz_fn(DisasContext *s, arg_rrr_esz *a, GVecGen3Fn *gvec_fn)
 +{
 +    if (sve_access_check(s)) {
 +        gen_gvec_fn_zzz(s, gvec_fn, a->esz, a->rd, a->rn, a->rm);
 +    }
 +    return true;
 +}
 +
  static bool trans_AND_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr0, MVFR0, FPSHVEC) > 0;
+-    return do_vector3_z(s, tcg_gen_gvec_and, 0, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr0, MVFR0, FPSHVEC) > 0;
++    return do_zzz_fn(s, a, tcg_gen_gvec_and);
  }
- static inline bool isar_feature_aa32_fpdp(const ARMISARegisters *id)
+ static bool trans_ORR_zzz(DisasContext *s, arg_rrr_esz *a)
  {
-     /* Return true if CPU supports double precision floating point */
+-    return do_vector3_z(s, tcg_gen_gvec_or, 0, a->rd, a->rn, a->rm);
--    return FIELD_EX64(id->mvfr0, MVFR0, FPDP) > 0;
++    return do_zzz_fn(s, a, tcg_gen_gvec_or);
 +    return FIELD_EX32(id->mvfr0, MVFR0, FPDP) > 0;
  }
+ static bool trans_EOR_zzz(DisasContext *s, arg_rrr_esz *a)
+ {
+-    return do_vector3_z(s, tcg_gen_gvec_xor, 0, a->rd, a->rn, a->rm);
++    return do_zzz_fn(s, a, tcg_gen_gvec_xor);
+ }
+ static bool trans_BIC_zzz(DisasContext *s, arg_rrr_esz *a)
+ {
+-    return do_vector3_z(s, tcg_gen_gvec_andc, 0, a->rd, a->rn, a->rm);
++    return do_zzz_fn(s, a, tcg_gen_gvec_andc);
+ }
  /*
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fpdp(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static bool trans_BIC_zzz(DisasContext *s, arg_rrr_esz *a)
-  */
- static inline bool isar_feature_aa32_fp16_spconv(const ARMISARegisters *id)
+ static bool trans_ADD_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr1, MVFR1, FPHP) > 0;
+-    return do_vector3_z(s, tcg_gen_gvec_add, a->esz, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr1, MVFR1, FPHP) > 0;
++    return do_zzz_fn(s, a, tcg_gen_gvec_add);
  }
- static inline bool isar_feature_aa32_fp16_dpconv(const ARMISARegisters *id)
+ static bool trans_SUB_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr1, MVFR1, FPHP) > 1;
+-    return do_vector3_z(s, tcg_gen_gvec_sub, a->esz, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr1, MVFR1, FPHP) > 1;
++    return do_zzz_fn(s, a, tcg_gen_gvec_sub);
  }
- static inline bool isar_feature_aa32_vsel(const ARMISARegisters *id)
+ static bool trans_SQADD_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 1;
+-    return do_vector3_z(s, tcg_gen_gvec_ssadd, a->esz, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 1;
++    return do_zzz_fn(s, a, tcg_gen_gvec_ssadd);
  }
- static inline bool isar_feature_aa32_vcvt_dr(const ARMISARegisters *id)
+ static bool trans_SQSUB_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 2;
+-    return do_vector3_z(s, tcg_gen_gvec_sssub, a->esz, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 2;
++    return do_zzz_fn(s, a, tcg_gen_gvec_sssub);
  }
- static inline bool isar_feature_aa32_vrint(const ARMISARegisters *id)
+ static bool trans_UQADD_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 3;
+-    return do_vector3_z(s, tcg_gen_gvec_usadd, a->esz, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 3;
++    return do_zzz_fn(s, a, tcg_gen_gvec_usadd);
  }
- static inline bool isar_feature_aa32_vminmaxnm(const ARMISARegisters *id)
+ static bool trans_UQSUB_zzz(DisasContext *s, arg_rrr_esz *a)
  {
--    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 4;
+-    return do_vector3_z(s, tcg_gen_gvec_ussub, a->esz, a->rd, a->rn, a->rm);
-+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 4;
++    return do_zzz_fn(s, a, tcg_gen_gvec_ussub);
  }
- static inline bool isar_feature_aa32_pan(const ARMISARegisters *id)
+ /*
 --
 .20.1

-[PULL 07/52] target/arm: Flush high bits of sve register after AdvSIMD TBL/TBX
+[PULL 22/35] target/arm: Rearrange {sve,fp}_check_access assert
 From: Richard Henderson <richard.henderson@linaro.org>
-Writes to AdvSIMD registers flush the bits above 128.
+We want to ensure that access is checked by the time we ask
 for a specific fp/vector register.  We want to ensure that
 we do not emit two lots of code to raise an exception.
 But sometimes it's difficult to cleanly organize the code
 such that we never pass through sve_check_access exactly once.
 Allow multiple calls so long as the result is true, that is,
 no exception to be raised.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214194643.23317-3-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 1 +
+ target/arm/translate.h     |  1 +
-file changed, 1 insertion(+)
+ target/arm/translate-a64.c | 27 ++++++++++++++++-----------
 files changed, 17 insertions(+), 11 deletions(-)
+diff --git a/target/arm/translate.h b/target/arm/translate.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/translate.h
++++ b/target/arm/translate.h
+@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
+      * that it is set at the point where we actually touch the FP regs.
+      */
+     bool fp_access_checked;
++    bool sve_access_checked;
+     /* ARMv8 single-step state (this is distinct from the QEMU gdbstub
+      * single-step support).
+      */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_tb(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void do_vec_ld(DisasContext *s, int destidx, int element,
-     tcg_temp_free_i64(tcg_resl);
+  * unallocated-encoding checks (otherwise the syndrome information
-     write_vec_element(s, tcg_resh, rd, 1, MO_64);
+  * for the resulting exception will be incorrect).
-     tcg_temp_free_i64(tcg_resh);
+  */
-+    clear_vec_high(s, true, rd);
+-static inline bool fp_access_check(DisasContext *s)
 +static bool fp_access_check(DisasContext *s)
  {
 -    assert(!s->fp_access_checked);
 -    s->fp_access_checked = true;
 +    if (s->fp_excp_el) {
 +        assert(!s->fp_access_checked);
 +        s->fp_access_checked = true;
 -    if (!s->fp_excp_el) {
 -        return true;
 +        gen_exception_insn(s, s->pc_curr, EXCP_UDEF,
 +                           syn_fp_access_trap(1, 0xe, false), s->fp_excp_el);
 +        return false;
      }
 -
 -    gen_exception_insn(s, s->pc_curr, EXCP_UDEF,
 -                       syn_fp_access_trap(1, 0xe, false), s->fp_excp_el);
 -    return false;
 +    s->fp_access_checked = true;
 +    return true;
  }
- /* ZIP/UZP/TRN
+ /* Check that SVE access is enabled.  If it is, return true.
@@ -XXX,XX +XXX,XX @@ static inline bool fp_access_check(DisasContext *s)
  bool sve_access_check(DisasContext *s)
  {
      if (s->sve_excp_el) {
 -        gen_exception_insn(s, s->pc_curr, EXCP_UDEF, syn_sve_access_trap(),
 -                           s->sve_excp_el);
 +        assert(!s->sve_access_checked);
 +        s->sve_access_checked = true;
 +
 +        gen_exception_insn(s, s->pc_curr, EXCP_UDEF,
 +                           syn_sve_access_trap(), s->sve_excp_el);
          return false;
      }
 +    s->sve_access_checked = true;
      return fp_access_check(s);
  }
@@ -XXX,XX +XXX,XX @@ static void disas_a64_insn(CPUARMState *env, DisasContext *s)
      s->base.pc_next += 4;
      s->fp_access_checked = false;
 +    s->sve_access_checked = false;
      if (dc_isar_feature(aa64_bti, s)) {
          if (s->base.num_insns == 1) {
 --
 .20.1

-[PULL 09/52] target/arm: Flush high bits of sve register after AdvSIMD INS
+[PULL 23/35] target/arm: Merge do_vector2_p into do_mov_p
 From: Richard Henderson <richard.henderson@linaro.org>
-Writes to AdvSIMD registers flush the bits above 128.
+This is the only user of the function.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214194643.23317-5-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-6-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 6 ++++++
+ target/arm/translate-sve.c | 19 ++++++-------------
-file changed, 6 insertions(+)
+file changed, 6 insertions(+), 13 deletions(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-a64.c
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_inse(DisasContext *s, int rd, int rn,
+@@ -XXX,XX +XXX,XX @@ static void do_dupi_z(DisasContext *s, int rd, uint64_t word)
-     write_vec_element(s, tmp, rd, dst_index, size);
+     tcg_gen_gvec_dup_imm(MO_64, vec_full_reg_offset(s, rd), vsz, vsz, word);
      tcg_temp_free_i64(tmp);
 +
 +    /* INS is considered a 128-bit write for SVE. */
 +    clear_vec_high(s, true, rd);
  }
+-/* Invoke a vector expander on two Pregs.  */
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_insg(DisasContext *s, int rd, int rn, int imm5)
+-static bool do_vector2_p(DisasContext *s, GVecGen2Fn *gvec_fn,
+-                         int esz, int rd, int rn)
-     idx = extract32(imm5, 1 + size, 4 - size);
+-{
-     write_vec_element(s, cpu_reg(s, rn), rd, idx, size);
+-    if (sve_access_check(s)) {
-+
+-        unsigned psz = pred_gvec_reg_size(s);
-+    /* INS is considered a 128-bit write for SVE. */
+-        gvec_fn(esz, pred_full_reg_offset(s, rd),
-+    clear_vec_high(s, true, rd);
+-                pred_full_reg_offset(s, rn), psz, psz);
 -    }
 -    return true;
 -}
 -
  /* Invoke a vector expander on three Pregs.  */
  static bool do_vector3_p(DisasContext *s, GVecGen3Fn *gvec_fn,
                           int esz, int rd, int rn, int rm)
@@ -XXX,XX +XXX,XX @@ static bool do_vecop4_p(DisasContext *s, const GVecGen4 *gvec_op,
  /* Invoke a vector move on two Pregs.  */
  static bool do_mov_p(DisasContext *s, int rd, int rn)
  {
 -    return do_vector2_p(s, tcg_gen_gvec_mov, 0, rd, rn);
 +    if (sve_access_check(s)) {
 +        unsigned psz = pred_gvec_reg_size(s);
 +        tcg_gen_gvec_mov(MO_8, pred_full_reg_offset(s, rd),
 +                         pred_full_reg_offset(s, rn), psz, psz);
 +    }
 +    return true;
  }
- /*
+ /* Set the cpu flags as per a return from an SVE helper.  */
 --
 .20.1

-[PULL 08/52] target/arm: Flush high bits of sve register after AdvSIMD ZIP/UZP/TRN
+[PULL 24/35] target/arm: Clean up 4-operand predicate expansion
 From: Richard Henderson <richard.henderson@linaro.org>
-Writes to AdvSIMD registers flush the bits above 128.
+Move the check for !S into do_pppp_flags, which allows to merge in
 do_vecop4_p.  Split out gen_gvec_fn_ppp without sve_access_check,
 to mirror gen_gvec_fn_zzz.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214194643.23317-4-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-7-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 1 +
+ target/arm/translate-sve.c | 111 ++++++++++++++-----------------------
-file changed, 1 insertion(+)
+file changed, 43 insertions(+), 68 deletions(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-a64.c
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_zip_trn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void do_dupi_z(DisasContext *s, int rd, uint64_t word)
-     tcg_temp_free_i64(tcg_resl);
+ }
-     write_vec_element(s, tcg_resh, rd, 1, MO_64);
-     tcg_temp_free_i64(tcg_resh);
+ /* Invoke a vector expander on three Pregs.  */
-+    clear_vec_high(s, true, rd);
+-static bool do_vector3_p(DisasContext *s, GVecGen3Fn *gvec_fn,
- }
+-                         int esz, int rd, int rn, int rm)
 +static void gen_gvec_fn_ppp(DisasContext *s, GVecGen3Fn *gvec_fn,
 +                            int rd, int rn, int rm)
  {
 -    if (sve_access_check(s)) {
 -        unsigned psz = pred_gvec_reg_size(s);
 -        gvec_fn(esz, pred_full_reg_offset(s, rd),
 -                pred_full_reg_offset(s, rn),
 -                pred_full_reg_offset(s, rm), psz, psz);
 -    }
 -    return true;
 -}
 -
 -/* Invoke a vector operation on four Pregs.  */
 -static bool do_vecop4_p(DisasContext *s, const GVecGen4 *gvec_op,
 -                        int rd, int rn, int rm, int rg)
 -{
 -    if (sve_access_check(s)) {
 -        unsigned psz = pred_gvec_reg_size(s);
 -        tcg_gen_gvec_4(pred_full_reg_offset(s, rd),
 -                       pred_full_reg_offset(s, rn),
 -                       pred_full_reg_offset(s, rm),
 -                       pred_full_reg_offset(s, rg),
 -                       psz, psz, gvec_op);
 -    }
 -    return true;
 +    unsigned psz = pred_gvec_reg_size(s);
 +    gvec_fn(MO_64, pred_full_reg_offset(s, rd),
 +            pred_full_reg_offset(s, rn),
 +            pred_full_reg_offset(s, rm), psz, psz);
  }
  /* Invoke a vector move on two Pregs.  */
@@ -XXX,XX +XXX,XX @@ static bool do_pppp_flags(DisasContext *s, arg_rprr_s *a,
      int mofs = pred_full_reg_offset(s, a->rm);
      int gofs = pred_full_reg_offset(s, a->pg);
 +    if (!a->s) {
 +        tcg_gen_gvec_4(dofs, nofs, mofs, gofs, psz, psz, gvec_op);
 +        return true;
 +    }
 +
      if (psz == 8) {
          /* Do the operation and the flags generation in temps.  */
          TCGv_i64 pd = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_AND_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_and_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else if (a->rn == a->rm) {
 -        if (a->pg == a->rn) {
 -            return do_mov_p(s, a->rd, a->rn);
 -        } else {
 -            return do_vector3_p(s, tcg_gen_gvec_and, 0, a->rd, a->rn, a->pg);
 +
 +    if (!a->s) {
 +        if (!sve_access_check(s)) {
 +            return true;
 +        }
 +        if (a->rn == a->rm) {
 +            if (a->pg == a->rn) {
 +                do_mov_p(s, a->rd, a->rn);
 +            } else {
 +                gen_gvec_fn_ppp(s, tcg_gen_gvec_and, a->rd, a->rn, a->pg);
 +            }
 +            return true;
 +        } else if (a->pg == a->rn || a->pg == a->rm) {
 +            gen_gvec_fn_ppp(s, tcg_gen_gvec_and, a->rd, a->rn, a->rm);
 +            return true;
          }
 -    } else if (a->pg == a->rn || a->pg == a->rm) {
 -        return do_vector3_p(s, tcg_gen_gvec_and, 0, a->rd, a->rn, a->rm);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
      }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_bic_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_BIC_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_bic_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else if (a->pg == a->rn) {
 -        return do_vector3_p(s, tcg_gen_gvec_andc, 0, a->rd, a->rn, a->rm);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
 +
 +    if (!a->s && a->pg == a->rn) {
 +        if (sve_access_check(s)) {
 +            gen_gvec_fn_ppp(s, tcg_gen_gvec_andc, a->rd, a->rn, a->rm);
 +        }
 +        return true;
      }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_eor_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_EOR_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_eor_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
 -    }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_sel_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_SEL_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_sel_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 +
      if (a->s) {
          return false;
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
      }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_orr_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_ORR_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_orr_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else if (a->pg == a->rn && a->rn == a->rm) {
 +
 +    if (!a->s && a->pg == a->rn && a->rn == a->rm) {
          return do_mov_p(s, a->rd, a->rn);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
      }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_orn_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_ORN_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_orn_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
 -    }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_nor_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_NOR_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_nor_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
 -    }
 +    return do_pppp_flags(s, a, &op);
  }
  static void gen_nand_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_NAND_pppp(DisasContext *s, arg_rprr_s *a)
          .fno = gen_helper_sve_nand_pppp,
          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
      };
 -    if (a->s) {
 -        return do_pppp_flags(s, a, &op);
 -    } else {
 -        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
 -    }
 +    return do_pppp_flags(s, a, &op);
  }
  /*
 --
 .20.1

-[PULL 50/52] target/arm: Perform fpdp_v2 check first
+[PULL 25/35] target/arm: Use tcg_gen_gvec_bitsel for trans_SEL_pppp
 From: Richard Henderson <richard.henderson@linaro.org>
-Shuffle the order of the checks so that we test the ISA
+The gvec operation was added after the initial implementation
-before we test anything else, such as the register arguments.
+of the SEL instruction and was missed in the conversion.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214181547.21408-9-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-8-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-vfp.inc.c | 144 ++++++++++++++++-----------------
+ target/arm/translate-sve.c | 31 ++++++++-----------------------
-file changed, 72 insertions(+), 72 deletions(-)
+file changed, 8 insertions(+), 23 deletions(-)
-diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.inc.c
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-vfp.inc.c
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
+@@ -XXX,XX +XXX,XX @@ static bool trans_EOR_pppp(DisasContext *s, arg_rprr_s *a)
      return do_pppp_flags(s, a, &op);
  }
 -static void gen_sel_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
 -{
 -    tcg_gen_and_i64(pn, pn, pg);
 -    tcg_gen_andc_i64(pm, pm, pg);
 -    tcg_gen_or_i64(pd, pn, pm);
 -}
 -
 -static void gen_sel_pg_vec(unsigned vece, TCGv_vec pd, TCGv_vec pn,
 -                           TCGv_vec pm, TCGv_vec pg)
 -{
 -    tcg_gen_and_vec(vece, pn, pn, pg);
 -    tcg_gen_andc_vec(vece, pm, pm, pg);
 -    tcg_gen_or_vec(vece, pd, pn, pm);
 -}
 -
  static bool trans_SEL_pppp(DisasContext *s, arg_rprr_s *a)
  {
 -    static const GVecGen4 op = {
 -        .fni8 = gen_sel_pg_i64,
 -        .fniv = gen_sel_pg_vec,
 -        .fno = gen_helper_sve_sel_pppp,
 -        .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 -    };
 -
      if (a->s) {
          return false;
      }
+-    return do_pppp_flags(s, a, &op);
--    /* UNDEF accesses to D16-D31 if they don't exist */
++    if (sve_access_check(s)) {
--    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
++        unsigned psz = pred_gvec_reg_size(s);
--        ((a->vm | a->vn | a->vd) & 0x10)) {
++        tcg_gen_gvec_bitsel(MO_8, pred_full_reg_offset(s, a->rd),
-+    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
++                            pred_full_reg_offset(s, a->pg),
-         return false;
++                            pred_full_reg_offset(s, a->rn),
-     }
++                            pred_full_reg_offset(s, a->rm), psz, psz);
 -    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist */
 +    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vm | a->vn | a->vd) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINMAXNM(DisasContext *s, arg_VMINMAXNM *a)
          return false;
      }
 -    /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vm | a->vn | a->vd) & 0x10)) {
 +    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist */
 +    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vm | a->vn | a->vd) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
          return false;
      }
 -    /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vm | a->vd) & 0x10)) {
 +    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist */
 +    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vm | a->vd) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
          return false;
      }
 -    /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
 +    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist */
 +    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
      TCGv_i64 f0, f1, fd;
      TCGv_ptr fpst;
 -    /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vn | vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vn | vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
      int veclen = s->vec_len;
      TCGv_i64 f0, fd;
 -    /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VFM_dp(DisasContext *s, arg_VFM_dp *a)
          return false;
      }
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vd | a->vn | a->vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
      vd = a->vd;
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && (vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
  {
      TCGv_i64 vd, vm;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
-+
++    return true;
-     /* Vm/M bits must be zero for the Z variant */
+ }
-     if (a->z && a->vm != 0) {
-         return false;
+ static void gen_orr_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
      TCGv_i32 tmp;
      TCGv_i64 vd;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_fp16_dpconv, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
      TCGv_i32 tmp;
      TCGv_i64 vm;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_fp16_dpconv, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
      TCGv_ptr fpst;
      TCGv_i64 tmp;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_vrint, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
      TCGv_i64 tmp;
      TCGv_i32 tcg_rmode;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_vrint, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
      TCGv_ptr fpst;
      TCGv_i64 tmp;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_vrint, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp(DisasContext *s, arg_VCVT_sp *a)
      TCGv_i64 vd;
      TCGv_i32 vm;
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
      TCGv_i64 vm;
      TCGv_i32 vd;
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_int_dp(DisasContext *s, arg_VCVT_int_dp *a)
      TCGv_i64 vd;
      TCGv_ptr fpst;
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
      TCGv_i32 vd;
      TCGv_i64 vm;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!dc_isar_feature(aa32_jscvt, s)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
      TCGv_ptr fpst;
      int frac_bits;
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
      if (!arm_dc_feature(s, ARM_FEATURE_VFP3)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 -        return false;
 -    }
 -
      if (!vfp_access_check(s)) {
          return true;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp_int(DisasContext *s, arg_VCVT_dp_int *a)
      TCGv_i64 vm;
      TCGv_ptr fpst;
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
 +    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
          return false;
      }
 -    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
 +    /* UNDEF accesses to D16-D31 if they don't exist. */
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
 --
 .20.1

-[PULL 46/52] target/arm: Set MVFR0.FPSP for ARMv5 cpus
+[PULL 26/35] target/arm: Split out gen_gvec_ool_zzzp
 From: Richard Henderson <richard.henderson@linaro.org>
-We are going to convert FEATURE tests to ISAR tests,
+Model after gen_gvec_fn_zzz et al.
 so FPSP needs to be set for these cpus, like we have
 already for FPDP.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214181547.21408-5-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-9-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.c | 10 ++++++----
+ target/arm/translate-sve.c | 35 ++++++++++++++++-------------------
-file changed, 6 insertions(+), 4 deletions(-)
+file changed, 16 insertions(+), 19 deletions(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/cpu.c
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static void arm926_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
-      */
+     return size_for_gvec(pred_full_reg_size(s));
      cpu->isar.id_isar1 = FIELD_DP32(cpu->isar.id_isar1, ID_ISAR1, JAZELLE, 1);
      /*
 -     * Similarly, we need to set MVFR0 fields to enable double precision
 -     * and short vector support even though ARMv5 doesn't have this register.
 +     * Similarly, we need to set MVFR0 fields to enable vfp and short vector
 +     * support even though ARMv5 doesn't have this register.
       */
      cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSHVEC, 1);
 +    cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSP, 1);
      cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPDP, 1);
  }
-@@ -XXX,XX +XXX,XX @@ static void arm1026_initfn(Object *obj)
+-/* Invoke a vector expander on two Zregs.  */
-      */
++/* Invoke an out-of-line helper on 3 Zregs and a predicate. */
-     cpu->isar.id_isar1 = FIELD_DP32(cpu->isar.id_isar1, ID_ISAR1, JAZELLE, 1);
++static void gen_gvec_ool_zzzp(DisasContext *s, gen_helper_gvec_4 *fn,
-     /*
++                              int rd, int rn, int rm, int pg, int data)
--     * Similarly, we need to set MVFR0 fields to enable double precision
++{
--     * and short vector support even though ARMv5 doesn't have this register.
++    unsigned vsz = vec_full_reg_size(s);
-+     * Similarly, we need to set MVFR0 fields to enable vfp and short vector
++    tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
-+     * support even though ARMv5 doesn't have this register.
++                       vec_full_reg_offset(s, rn),
-      */
++                       vec_full_reg_offset(s, rm),
-     cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSHVEC, 1);
++                       pred_full_reg_offset(s, pg),
-+    cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSP, 1);
++                       vsz, vsz, data, fn);
-     cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPDP, 1);
++}
-     {
++/* Invoke a vector expander on two Zregs.  */
  static void gen_gvec_fn_zz(DisasContext *s, GVecGen2Fn *gvec_fn,
                             int esz, int rd, int rn)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_UQSUB_zzz(DisasContext *s, arg_rrr_esz *a)
  static bool do_zpzz_ool(DisasContext *s, arg_rprr_esz *a, gen_helper_gvec_4 *fn)
  {
 -    unsigned vsz = vec_full_reg_size(s);
      if (fn == NULL) {
          return false;
      }
      if (sve_access_check(s)) {
 -        tcg_gen_gvec_4_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           pred_full_reg_offset(s, a->pg),
 -                           vsz, vsz, 0, fn);
 +        gen_gvec_ool_zzzp(s, fn, a->rd, a->rn, a->rm, a->pg, 0);
      }
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static void do_sel_z(DisasContext *s, int rd, int rn, int rm, int pg, int esz)
          gen_helper_sve_sel_zpzz_b, gen_helper_sve_sel_zpzz_h,
          gen_helper_sve_sel_zpzz_s, gen_helper_sve_sel_zpzz_d
      };
 -    unsigned vsz = vec_full_reg_size(s);
 -    tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
 -                       vec_full_reg_offset(s, rn),
 -                       vec_full_reg_offset(s, rm),
 -                       pred_full_reg_offset(s, pg),
 -                       vsz, vsz, 0, fns[esz]);
 +    gen_gvec_ool_zzzp(s, fns[esz], rd, rn, rm, pg, 0);
  }
  #define DO_ZPZZ(NAME, name) \
@@ -XXX,XX +XXX,XX @@ static bool trans_RBIT(DisasContext *s, arg_rpr_esz *a)
  static bool trans_SPLICE(DisasContext *s, arg_rprr_esz *a)
  {
      if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_4_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           pred_full_reg_offset(s, a->pg),
 -                           vsz, vsz, a->esz, gen_helper_sve_splice);
 +        gen_gvec_ool_zzzp(s, gen_helper_sve_splice,
 +                          a->rd, a->rn, a->rm, a->pg, 0);
      }
      return true;
  }
 --
 .20.1

-[PULL 12/52] target/arm: Remove ttbr1_valid check from get_phys_addr_lpae
+[PULL 27/35] target/arm: Merge helper_sve_clr_* and helper_sve_movz_*
 From: Richard Henderson <richard.henderson@linaro.org>
-Now that aa64_va_parameters_both sets select based on the number
+The existing clr functions have only one vector argument, and so
-of ranges in the regime, the ttbr1_valid check is redundant.
+can only clear in place.  The existing movz functions have two
 vector arguments, and so can clear while moving.  Merge them, with
 a flag that controls the sense of active vs inactive elements
 being cleared.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200216194343.21331-4-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-10-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 6 +-----
+ target/arm/helper-sve.h    |  5 ---
-file changed, 1 insertion(+), 5 deletions(-)
+ target/arm/sve_helper.c    | 70 ++++++++------------------------------
+ target/arm/translate-sve.c | 53 +++++++++++------------------
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+files changed, 34 insertions(+), 94 deletions(-)
 diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/target/arm/helper-sve.h
-+++ b/target/arm/helper.c
++++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sve_uminv_h, TCG_CALL_NO_RWG, i64, ptr, ptr, i32)
-     TCR *tcr = regime_tcr(env, mmu_idx);
+ DEF_HELPER_FLAGS_3(sve_uminv_s, TCG_CALL_NO_RWG, i64, ptr, ptr, i32)
-     int ap, ns, xn, pxn;
+ DEF_HELPER_FLAGS_3(sve_uminv_d, TCG_CALL_NO_RWG, i64, ptr, ptr, i32)
-     uint32_t el = regime_el(env, mmu_idx);
--    bool ttbr1_valid;
+-DEF_HELPER_FLAGS_3(sve_clr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-     uint64_t descaddrmask;
+-DEF_HELPER_FLAGS_3(sve_clr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-     bool aarch64 = arm_el_is_aa64(env, el);
+-DEF_HELPER_FLAGS_3(sve_clr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-     bool guarded = false;
+-DEF_HELPER_FLAGS_3(sve_clr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
+-
-         param = aa64_va_parameters(env, address, mmu_idx,
+ DEF_HELPER_FLAGS_4(sve_movz_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-                                    access_type != MMU_INST_FETCH);
+ DEF_HELPER_FLAGS_4(sve_movz_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-         level = 0;
+ DEF_HELPER_FLAGS_4(sve_movz_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
--        ttbr1_valid = regime_has_2_ranges(mmu_idx);
+diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-         addrsize = 64 - 8 * param.tbi;
+index XXXXXXX..XXXXXXX 100644
-         inputsize = 64 - param.tsz;
+--- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_pnext)(void *vd, void *vg, uint32_t pred_desc)
      return flags;
  }
 -/* Store zero into every active element of Zd.  We will use this for two
 - * and three-operand predicated instructions for which logic dictates a
 - * zero result.  In particular, logical shift by element size, which is
 - * otherwise undefined on the host.
 - *
 - * For element sizes smaller than uint64_t, we use tables to expand
 - * the N bits of the controlling predicate to a byte mask, and clear
 - * those bytes.
 +/*
 + * Copy Zn into Zd, and store zero into inactive elements.
 + * If inv, store zeros into the active elements.
   */
 -void HELPER(sve_clr_b)(void *vd, void *vg, uint32_t desc)
 -{
 -    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 -    uint64_t *d = vd;
 -    uint8_t *pg = vg;
 -    for (i = 0; i < opr_sz; i += 1) {
 -        d[i] &= ~expand_pred_b(pg[H1(i)]);
 -    }
 -}
 -
 -void HELPER(sve_clr_h)(void *vd, void *vg, uint32_t desc)
 -{
 -    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 -    uint64_t *d = vd;
 -    uint8_t *pg = vg;
 -    for (i = 0; i < opr_sz; i += 1) {
 -        d[i] &= ~expand_pred_h(pg[H1(i)]);
 -    }
 -}
 -
 -void HELPER(sve_clr_s)(void *vd, void *vg, uint32_t desc)
 -{
 -    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 -    uint64_t *d = vd;
 -    uint8_t *pg = vg;
 -    for (i = 0; i < opr_sz; i += 1) {
 -        d[i] &= ~expand_pred_s(pg[H1(i)]);
 -    }
 -}
 -
 -void HELPER(sve_clr_d)(void *vd, void *vg, uint32_t desc)
 -{
 -    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 -    uint64_t *d = vd;
 -    uint8_t *pg = vg;
 -    for (i = 0; i < opr_sz; i += 1) {
 -        if (pg[H1(i)] & 1) {
 -            d[i] = 0;
 -        }
 -    }
 -}
 -
 -/* Copy Zn into Zd, and store zero into inactive elements.  */
  void HELPER(sve_movz_b)(void *vd, void *vn, void *vg, uint32_t desc)
  {
      intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 +    uint64_t inv = -(uint64_t)(simd_data(desc) & 1);
      uint64_t *d = vd, *n = vn;
      uint8_t *pg = vg;
 +
      for (i = 0; i < opr_sz; i += 1) {
 -        d[i] = n[i] & expand_pred_b(pg[H1(i)]);
 +        d[i] = n[i] & (expand_pred_b(pg[H1(i)]) ^ inv);
      }
  }
  void HELPER(sve_movz_h)(void *vd, void *vn, void *vg, uint32_t desc)
  {
      intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 +    uint64_t inv = -(uint64_t)(simd_data(desc) & 1);
      uint64_t *d = vd, *n = vn;
      uint8_t *pg = vg;
 +
      for (i = 0; i < opr_sz; i += 1) {
 -        d[i] = n[i] & expand_pred_h(pg[H1(i)]);
 +        d[i] = n[i] & (expand_pred_h(pg[H1(i)]) ^ inv);
      }
  }
  void HELPER(sve_movz_s)(void *vd, void *vn, void *vg, uint32_t desc)
  {
      intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 +    uint64_t inv = -(uint64_t)(simd_data(desc) & 1);
      uint64_t *d = vd, *n = vn;
      uint8_t *pg = vg;
 +
      for (i = 0; i < opr_sz; i += 1) {
 -        d[i] = n[i] & expand_pred_s(pg[H1(i)]);
 +        d[i] = n[i] & (expand_pred_s(pg[H1(i)]) ^ inv);
      }
  }
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_movz_d)(void *vd, void *vn, void *vg, uint32_t desc)
      intptr_t i, opr_sz = simd_oprsz(desc) / 8;
      uint64_t *d = vd, *n = vn;
      uint8_t *pg = vg;
 +    uint8_t inv = simd_data(desc);
 +
      for (i = 0; i < opr_sz; i += 1) {
 -        d[i] = n[i] & -(uint64_t)(pg[H1(i)] & 1);
 +        d[i] = n[i] & -(uint64_t)((pg[H1(i)] ^ inv) & 1);
      }
  }
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_SADDV(DisasContext *s, arg_rpr_esz *a)
   *** SVE Shift by Immediate - Predicated Group
   */
 -/* Store zero into every active element of Zd.  We will use this for two
 - * and three-operand predicated instructions for which logic dictates a
 - * zero result.
 +/*
 + * Copy Zn into Zd, storing zeros into inactive elements.
 + * If invert, store zeros into the active elements.
   */
 -static bool do_clr_zp(DisasContext *s, int rd, int pg, int esz)
 -{
 -    static gen_helper_gvec_2 * const fns[4] = {
 -        gen_helper_sve_clr_b, gen_helper_sve_clr_h,
 -        gen_helper_sve_clr_s, gen_helper_sve_clr_d,
 -    };
 -    if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_2_ool(vec_full_reg_offset(s, rd),
 -                           pred_full_reg_offset(s, pg),
 -                           vsz, vsz, 0, fns[esz]);
 -    }
 -    return true;
 -}
 -
 -/* Copy Zn into Zd, storing zeros into inactive elements.  */
 -static void do_movz_zpz(DisasContext *s, int rd, int rn, int pg, int esz)
 +static bool do_movz_zpz(DisasContext *s, int rd, int rn, int pg,
 +                        int esz, bool invert)
  {
      static gen_helper_gvec_3 * const fns[4] = {
          gen_helper_sve_movz_b, gen_helper_sve_movz_h,
          gen_helper_sve_movz_s, gen_helper_sve_movz_d,
      };
 -    unsigned vsz = vec_full_reg_size(s);
 -    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
 -                       vec_full_reg_offset(s, rn),
 -                       pred_full_reg_offset(s, pg),
 -                       vsz, vsz, 0, fns[esz]);
 +
 +    if (sve_access_check(s)) {
 +        unsigned vsz = vec_full_reg_size(s);
 +        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
 +                           vec_full_reg_offset(s, rn),
 +                           pred_full_reg_offset(s, pg),
 +                           vsz, vsz, invert, fns[esz]);
 +    }
 +    return true;
  }
  static bool do_zpzi_ool(DisasContext *s, arg_rpri_esz *a,
@@ -XXX,XX +XXX,XX @@ static bool trans_LSR_zpzi(DisasContext *s, arg_rpri_esz *a)
      /* Shift by element size is architecturally valid.
         For logical shifts, it is a zeroing operation.  */
      if (a->imm >= (8 << a->esz)) {
 -        return do_clr_zp(s, a->rd, a->pg, a->esz);
 +        return do_movz_zpz(s, a->rd, a->rd, a->pg, a->esz, true);
      } else {
-         param = aa32_va_parameters(env, address, mmu_idx);
+         return do_zpzi_ool(s, a, fns[a->esz]);
-         level = 1;
+     }
--        /* There is no TTBR1 for EL2 */
+@@ -XXX,XX +XXX,XX @@ static bool trans_LSL_zpzi(DisasContext *s, arg_rpri_esz *a)
--        ttbr1_valid = (el != 2);
+     /* Shift by element size is architecturally valid.
-         addrsize = (mmu_idx == ARMMMUIdx_Stage2 ? 40 : 32);
+        For logical shifts, it is a zeroing operation.  */
-         inputsize = addrsize - param.tsz;
+     if (a->imm >= (8 << a->esz)) {
-     }
+-        return do_clr_zp(s, a->rd, a->pg, a->esz);
-@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
++        return do_movz_zpz(s, a->rd, a->rd, a->pg, a->esz, true);
-     if (inputsize < addrsize) {
+     } else {
-         target_ulong top_bits = sextract64(address, inputsize,
+         return do_zpzi_ool(s, a, fns[a->esz]);
-                                            addrsize - inputsize);
+     }
--        if (-top_bits != param.select || (param.select && !ttbr1_valid)) {
+@@ -XXX,XX +XXX,XX @@ static bool trans_ASRD(DisasContext *s, arg_rpri_esz *a)
-+        if (-top_bits != param.select) {
+     /* Shift by element size is architecturally valid.  For arithmetic
-             /* The gap between the two regions is a Translation fault */
+        right shift for division, it is a zeroing operation.  */
-             fault_type = ARMFault_Translation;
+     if (a->imm >= (8 << a->esz)) {
-             goto do_fault;
+-        return do_clr_zp(s, a->rd, a->pg, a->esz);
 +        return do_movz_zpz(s, a->rd, a->rd, a->pg, a->esz, true);
      } else {
          return do_zpzi_ool(s, a, fns[a->esz]);
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_LD1R_zpri(DisasContext *s, arg_rpri_load *a)
      /* Zero the inactive elements.  */
      gen_set_label(over);
 -    do_movz_zpz(s, a->rd, a->rd, a->pg, esz);
 -    return true;
 +    return do_movz_zpz(s, a->rd, a->rd, a->pg, esz, false);
  }
  static void do_st_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
@@ -XXX,XX +XXX,XX @@ static bool trans_MOVPRFX_m(DisasContext *s, arg_rpr_esz *a)
  static bool trans_MOVPRFX_z(DisasContext *s, arg_rpr_esz *a)
  {
 -    if (sve_access_check(s)) {
 -        do_movz_zpz(s, a->rd, a->rn, a->pg, a->esz);
 -    }
 -    return true;
 +    return do_movz_zpz(s, a->rd, a->rn, a->pg, a->esz, false);
  }
 --
 .20.1

-[PULL 47/52] target/arm: Add isar_feature_aa32_simd_r16
+[PULL 28/35] target/arm: Split out gen_gvec_ool_zzp
 From: Richard Henderson <richard.henderson@linaro.org>
-Use this in the places that were checking ARM_FEATURE_VFP, and
+Model after gen_gvec_fn_zzz et al.
 are obviously testing for the existance of the register set
 as opposed to testing for some particular instruction extension.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214181547.21408-6-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20200815013145.539409-11-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h        |  6 ++++++
+ target/arm/translate-sve.c | 29 ++++++++++++++---------------
- hw/intc/armv7m_nvic.c   | 20 ++++++++++----------
+file changed, 14 insertions(+), 15 deletions(-)
  linux-user/arm/signal.c |  4 ++--
  target/arm/arch_dump.c  | 11 ++++++-----
  target/arm/cpu.c        |  8 ++++----
  target/arm/helper.c     |  4 ++--
  target/arm/m_helper.c   | 11 ++++++-----
  target/arm/machine.c    |  3 +--
 files changed, 37 insertions(+), 30 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
-     return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, FP) == 1;
+     return size_for_gvec(pred_full_reg_size(s));
  }
-+static inline bool isar_feature_aa32_simd_r16(const ARMISARegisters *id)
++/* Invoke an out-of-line helper on 2 Zregs and a predicate. */
 +static void gen_gvec_ool_zzp(DisasContext *s, gen_helper_gvec_3 *fn,
 +                             int rd, int rn, int pg, int data)
 +{
-+    /* Return true if D0-D15 are implemented */
++    unsigned vsz = vec_full_reg_size(s);
-+    return FIELD_EX32(id->mvfr0, MVFR0, SIMDREG) > 0;
++    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
 +                       vec_full_reg_offset(s, rn),
 +                       pred_full_reg_offset(s, pg),
 +                       vsz, vsz, data, fn);
 +}
 +
- static inline bool isar_feature_aa32_simd_r32(const ARMISARegisters *id)
+ /* Invoke an out-of-line helper on 3 Zregs and a predicate. */
  static void gen_gvec_ool_zzzp(DisasContext *s, gen_helper_gvec_4 *fn,
                                int rd, int rn, int rm, int pg, int data)
@@ -XXX,XX +XXX,XX @@ static bool do_zpz_ool(DisasContext *s, arg_rpr_esz *a, gen_helper_gvec_3 *fn)
          return false;
      }
      if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           pred_full_reg_offset(s, a->pg),
 -                           vsz, vsz, 0, fn);
 +        gen_gvec_ool_zzp(s, fn, a->rd, a->rn, a->pg, 0);
      }
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool do_movz_zpz(DisasContext *s, int rd, int rn, int pg,
      };
      if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
 -                           vec_full_reg_offset(s, rn),
 -                           pred_full_reg_offset(s, pg),
 -                           vsz, vsz, invert, fns[esz]);
 +        gen_gvec_ool_zzp(s, fns[esz], rd, rn, pg, invert);
      }
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool do_zpzi_ool(DisasContext *s, arg_rpri_esz *a,
                          gen_helper_gvec_3 *fn)
  {
-     /* Return true if D16-D31 are implemented */
+     if (sve_access_check(s)) {
-diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
+-        unsigned vsz = vec_full_reg_size(s);
-index XXXXXXX..XXXXXXX 100644
+-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
---- a/hw/intc/armv7m_nvic.c
+-                           vec_full_reg_offset(s, a->rn),
-+++ b/hw/intc/armv7m_nvic.c
+-                           pred_full_reg_offset(s, a->pg),
-@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
+-                           vsz, vsz, a->imm, fn);
-     case 0xd84: /* CSSELR */
++        gen_gvec_ool_zzp(s, fn, a->rd, a->rn, a->pg, a->imm);
          return cpu->env.v7m.csselr[attrs.secure];
      case 0xd88: /* CPACR */
 -        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
              return 0;
          }
          return cpu->env.v7m.cpacr[attrs.secure];
      case 0xd8c: /* NSACR */
 -        if (!attrs.secure || !arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (!attrs.secure || !cpu_isar_feature(aa32_simd_r16, cpu)) {
              return 0;
          }
          return cpu->env.v7m.nsacr;
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
          }
          return cpu->env.v7m.sfar;
      case 0xf34: /* FPCCR */
 -        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
              return 0;
          }
          if (attrs.secure) {
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
              return value;
          }
      case 0xf38: /* FPCAR */
 -        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
              return 0;
          }
          return cpu->env.v7m.fpcar[attrs.secure];
      case 0xf3c: /* FPDSCR */
 -        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
              return 0;
          }
          return cpu->env.v7m.fpdscr[attrs.secure];
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
          }
          break;
      case 0xd88: /* CPACR */
 -        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              /* We implement only the Floating Point extension's CP10/CP11 */
              cpu->env.v7m.cpacr[attrs.secure] = value & (0xf << 20);
          }
          break;
      case 0xd8c: /* NSACR */
 -        if (attrs.secure && arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (attrs.secure && cpu_isar_feature(aa32_simd_r16, cpu)) {
              /* We implement only the Floating Point extension's CP10/CP11 */
              cpu->env.v7m.nsacr = value & (3 << 10);
          }
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
          break;
      }
-     case 0xf34: /* FPCCR */
+     return true;
 -        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              /* Not all bits here are banked. */
              uint32_t fpccr_s;
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
          }
          break;
      case 0xf38: /* FPCAR */
 -        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              value &= ~7;
              cpu->env.v7m.fpcar[attrs.secure] = value;
          }
          break;
      case 0xf3c: /* FPDSCR */
 -        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              value &= 0x07c00000;
              cpu->env.v7m.fpdscr[attrs.secure] = value;
          }
 diff --git a/linux-user/arm/signal.c b/linux-user/arm/signal.c
 index XXXXXXX..XXXXXXX 100644
 --- a/linux-user/arm/signal.c
 +++ b/linux-user/arm/signal.c
@@ -XXX,XX +XXX,XX @@ static void setup_sigframe_v2(struct target_ucontext_v2 *uc,
      setup_sigcontext(&uc->tuc_mcontext, env, set->sig[0]);
      /* Save coprocessor signal frame.  */
      regspace = uc->tuc_regspace;
 -    if (arm_feature(env, ARM_FEATURE_VFP)) {
 +    if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
          regspace = setup_sigframe_v2_vfp(regspace, env);
      }
      if (arm_feature(env, ARM_FEATURE_IWMMXT)) {
@@ -XXX,XX +XXX,XX @@ static int do_sigframe_return_v2(CPUARMState *env,
      /* Restore coprocessor signal frame */
      regspace = uc->tuc_regspace;
 -    if (arm_feature(env, ARM_FEATURE_VFP)) {
 +    if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
          regspace = restore_sigframe_v2_vfp(env, regspace);
          if (!regspace) {
              return 1;
 diff --git a/target/arm/arch_dump.c b/target/arm/arch_dump.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/arch_dump.c
 +++ b/target/arm/arch_dump.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_write_elf32_note(WriteCoreDumpFunction f, CPUState *cs,
                               int cpuid, void *opaque)
  {
      struct arm_note note;
 -    CPUARMState *env = &ARM_CPU(cs)->env;
 +    ARMCPU *cpu = ARM_CPU(cs);
 +    CPUARMState *env = &cpu->env;
      DumpState *s = opaque;
 -    int ret, i, fpvalid = !!arm_feature(env, ARM_FEATURE_VFP);
 +    int ret, i;
 +    bool fpvalid = cpu_isar_feature(aa32_simd_r16, cpu);
      arm_note_init(&note, s, "CORE", 5, NT_PRSTATUS, sizeof(note.prstatus));
@@ -XXX,XX +XXX,XX @@ int cpu_get_dump_info(ArchDumpInfo *info,
  ssize_t cpu_get_note_size(int class, int machine, int nr_cpus)
  {
      ARMCPU *cpu = ARM_CPU(first_cpu);
 -    CPUARMState *env = &cpu->env;
      size_t note_size;
      if (class == ELFCLASS64) {
@@ -XXX,XX +XXX,XX @@ ssize_t cpu_get_note_size(int class, int machine, int nr_cpus)
          note_size += AARCH64_PRFPREG_NOTE_SIZE;
  #ifdef TARGET_AARCH64
          if (cpu_isar_feature(aa64_sve, cpu)) {
 -            note_size += AARCH64_SVE_NOTE_SIZE(env);
 +            note_size += AARCH64_SVE_NOTE_SIZE(&cpu->env);
          }
  #endif
      } else {
          note_size = ARM_PRSTATUS_NOTE_SIZE;
 -        if (arm_feature(env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              note_size += ARM_VFP_NOTE_SIZE;
          }
      }
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
              env->v7m.ccr[M_REG_S] |= R_V7M_CCR_UNALIGN_TRP_MASK;
          }
 -        if (arm_feature(env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              env->v7m.fpccr[M_REG_NS] = R_V7M_FPCCR_ASPEN_MASK;
              env->v7m.fpccr[M_REG_S] = R_V7M_FPCCR_ASPEN_MASK |
                  R_V7M_FPCCR_LSPEN_MASK | R_V7M_FPCCR_S_MASK;
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_dump_state(CPUState *cs, FILE *f, int flags)
          int numvfpregs = 0;
          if (cpu_isar_feature(aa32_simd_r32, cpu)) {
              numvfpregs = 32;
 -        } else if (arm_feature(env, ARM_FEATURE_VFP)) {
 +        } else if (cpu_isar_feature(aa32_simd_r16, cpu)) {
              numvfpregs = 16;
          }
          for (i = 0; i < numvfpregs; i++) {
@@ -XXX,XX +XXX,XX @@ void arm_cpu_post_init(Object *obj)
       * KVM does not currently allow us to lie to the guest about its
       * ID/feature registers, so the guest always sees what the host has.
       */
 -    if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
 +    if (cpu_isar_feature(aa32_simd_r16, cpu)) {
          cpu->has_vfp = true;
          if (!kvm_enabled()) {
              qdev_property_add_static(DEVICE(obj), &arm_cpu_has_vfp_property);
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
       * We rely on no XScale CPU having VFP so we can use the same bits in the
       * TB flags field for VECSTRIDE and XSCALE_CPAR.
       */
 -    assert(!(arm_feature(env, ARM_FEATURE_VFP) &&
 +    assert(!(cpu_isar_feature(aa32_simd_r16, cpu) &&
               arm_feature(env, ARM_FEATURE_XSCALE)));
      if (arm_feature(env, ARM_FEATURE_V7) &&
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
           * ASEDIS [31] and D32DIS [30] are both UNK/SBZP without VFP.
           * TRCDIS [28] is RAZ/WI since we do not implement a trace macrocell.
           */
 -        if (arm_feature(env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
              /* VFP coprocessor: cp10 & cp11 [23:20] */
              mask |= (1 << 31) | (1 << 30) | (0xf << 20);
@@ -XXX,XX +XXX,XX @@ void arm_cpu_register_gdb_regs_for_features(ARMCPU *cpu)
      } else if (cpu_isar_feature(aa32_simd_r32, cpu)) {
          gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
 , "arm-vfp3.xml", 0);
 -    } else if (arm_feature(env, ARM_FEATURE_VFP)) {
 +    } else if (cpu_isar_feature(aa32_simd_r16, cpu)) {
          gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
 , "arm-vfp.xml", 0);
      }
 diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/m_helper.c
 +++ b/target/arm/m_helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t v7m_integrity_sig(CPUARMState *env, uint32_t lr)
       */
      uint32_t sig = 0xfefa125a;
 -    if (!arm_feature(env, ARM_FEATURE_VFP) || (lr & R_V7M_EXCRET_FTYPE_MASK)) {
 +    if (!cpu_isar_feature(aa32_simd_r16, env_archcpu(env))
 +        || (lr & R_V7M_EXCRET_FTYPE_MASK)) {
          sig |= 1;
      }
      return sig;
@@ -XXX,XX +XXX,XX @@ static void v7m_exception_taken(ARMCPU *cpu, uint32_t lr, bool dotailchain,
      if (dotailchain) {
          /* Sanitize LR FType and PREFIX bits */
 -        if (!arm_feature(env, ARM_FEATURE_VFP)) {
 +        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
              lr |= R_V7M_EXCRET_FTYPE_MASK;
          }
          lr = deposit32(lr, 24, 8, 0xff);
@@ -XXX,XX +XXX,XX @@ static void do_v7m_exception_exit(ARMCPU *cpu)
      ftype = excret & R_V7M_EXCRET_FTYPE_MASK;
 -    if (!arm_feature(env, ARM_FEATURE_VFP) && !ftype) {
 +    if (!ftype && !cpu_isar_feature(aa32_simd_r16, cpu)) {
          qemu_log_mask(LOG_GUEST_ERROR, "M profile: zero FTYPE in exception "
                        "exit PC value 0x%" PRIx32 " is UNPREDICTABLE "
                        "if FPU not present\n",
@@ -XXX,XX +XXX,XX @@ void HELPER(v7m_msr)(CPUARMState *env, uint32_t maskreg, uint32_t val)
               * SFPA is RAZ/WI from NS. FPCA is RO if NSACR.CP10 == 0,
               * RES0 if the FPU is not present, and is stored in the S bank
               */
 -            if (arm_feature(env, ARM_FEATURE_VFP) &&
 +            if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env)) &&
                  extract32(env->v7m.nsacr, 10, 1)) {
                  env->v7m.control[M_REG_S] &= ~R_V7M_CONTROL_FPCA_MASK;
                  env->v7m.control[M_REG_S] |= val & R_V7M_CONTROL_FPCA_MASK;
@@ -XXX,XX +XXX,XX @@ void HELPER(v7m_msr)(CPUARMState *env, uint32_t maskreg, uint32_t val)
              env->v7m.control[env->v7m.secure] &= ~R_V7M_CONTROL_NPRIV_MASK;
              env->v7m.control[env->v7m.secure] |= val & R_V7M_CONTROL_NPRIV_MASK;
          }
 -        if (arm_feature(env, ARM_FEATURE_VFP)) {
 +        if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
              /*
               * SFPA is RAZ/WI from NS or if no FPU.
               * FPCA is RO if NSACR.CP10 == 0, RES0 if the FPU is not present.
 diff --git a/target/arm/machine.c b/target/arm/machine.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/machine.c
 +++ b/target/arm/machine.c
@@ -XXX,XX +XXX,XX @@
  static bool vfp_needed(void *opaque)
  {
      ARMCPU *cpu = opaque;
 -    CPUARMState *env = &cpu->env;
 -    return arm_feature(env, ARM_FEATURE_VFP);
 +    return cpu_isar_feature(aa32_simd_r16, cpu);
  }
- static int get_fpscr(QEMUFile *f, void *opaque, size_t size,
 --
 .20.1

-[PULL 44/52] target/arm: Rename isar_feature_aa32_simd_r32
+[PULL 29/35] target/arm: Split out gen_gvec_ool_zzz
 From: Richard Henderson <richard.henderson@linaro.org>
-The old name, isar_feature_aa32_fp_d32, does not reflect
-the MVFR0 field name, SIMDReg.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200214181547.21408-3-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-[PMM: wrapped one long line]
+Message-id: 20200815013145.539409-12-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h               |  2 +-
+ target/arm/translate-sve.c | 53 +++++++++++++-------------------------
- target/arm/translate-vfp.inc.c | 53 +++++++++++++++++-----------------
+file changed, 18 insertions(+), 35 deletions(-)
 files changed, 28 insertions(+), 27 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
-     return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, FP) == 1;
+     return size_for_gvec(pred_full_reg_size(s));
  }
--static inline bool isar_feature_aa32_fp_d32(const ARMISARegisters *id)
++/* Invoke an out-of-line helper on 3 Zregs. */
-+static inline bool isar_feature_aa32_simd_r32(const ARMISARegisters *id)
++static void gen_gvec_ool_zzz(DisasContext *s, gen_helper_gvec_3 *fn,
- {
++                             int rd, int rn, int rm, int data)
-     /* Return true if D16-D31 are implemented */
++{
-     return FIELD_EX32(id->mvfr0, MVFR0, SIMDREG) >= 2;
++    unsigned vsz = vec_full_reg_size(s);
-diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
++    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
-index XXXXXXX..XXXXXXX 100644
++                       vec_full_reg_offset(s, rn),
---- a/target/arm/translate-vfp.inc.c
++                       vec_full_reg_offset(s, rm),
-+++ b/target/arm/translate-vfp.inc.c
++                       vsz, vsz, data, fn);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
++}
-     }
++
+ /* Invoke an out-of-line helper on 2 Zregs and a predicate. */
-     /* UNDEF accesses to D16-D31 if they don't exist */
+ static void gen_gvec_ool_zzp(DisasContext *s, gen_helper_gvec_3 *fn,
--    if (dp && !dc_isar_feature(aa32_fp_d32, s) &&
+                              int rd, int rn, int pg, int data)
-+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+@@ -XXX,XX +XXX,XX @@ static bool do_zzw_ool(DisasContext *s, arg_rrr_esz *a, gen_helper_gvec_3 *fn)
          ((a->vm | a->vn | a->vd) & 0x10)) {
          return false;
      }
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMINMAXNM(DisasContext *s, arg_VMINMAXNM *a)
+     if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, 0, fn);
 +        gen_gvec_ool_zzz(s, fn, a->rd, a->rn, a->rm, 0);
      }
+     return true;
-     /* UNDEF accesses to D16-D31 if they don't exist */
+ }
--    if (dp && !dc_isar_feature(aa32_fp_d32, s) &&
+@@ -XXX,XX +XXX,XX @@ static bool trans_RDVL(DisasContext *s, arg_RDVL *a)
-+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+ static bool do_adr(DisasContext *s, arg_rrri *a, gen_helper_gvec_3 *fn)
-         ((a->vm | a->vn | a->vd) & 0x10)) {
+ {
      if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, a->imm, fn);
 +        gen_gvec_ool_zzz(s, fn, a->rd, a->rn, a->rm, a->imm);
      }
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool trans_FTSSEL(DisasContext *s, arg_rrr_esz *a)
          return false;
      }
-@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
+     if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, 0, fns[a->esz]);
 +        gen_gvec_ool_zzz(s, fns[a->esz], a->rd, a->rn, a->rm, 0);
      }
+     return true;
-     /* UNDEF accesses to D16-D31 if they don't exist */
+ }
--    if (dp && !dc_isar_feature(aa32_fp_d32, s) &&
+@@ -XXX,XX +XXX,XX @@ static bool trans_TBL(DisasContext *s, arg_rrr_esz *a)
-+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+     };
-         ((a->vm | a->vd) & 0x10)) {
-         return false;
+     if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, 0, fns[a->esz]);
 +        gen_gvec_ool_zzz(s, fns[a->esz], a->rd, a->rn, a->rm, 0);
      }
-@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
+     return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool do_zzz_data_ool(DisasContext *s, arg_rrr_esz *a, int data,
                              gen_helper_gvec_3 *fn)
  {
      if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, data, fn);
 +        gen_gvec_ool_zzz(s, fn, a->rd, a->rn, a->rm, data);
      }
+     return true;
-     /* UNDEF accesses to D16-D31 if they don't exist */
+ }
--    if (dp && !dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
+@@ -XXX,XX +XXX,XX @@ static bool trans_DOT_zzz(DisasContext *s, arg_DOT_zzz *a)
-+    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
+     };
-         return false;
      if (sve_access_check(s)) {
 -        unsigned vsz = vec_full_reg_size(s);
 -        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, 0, fns[a->u][a->sz]);
 +        gen_gvec_ool_zzz(s, fns[a->u][a->sz], a->rd, a->rn, a->rm, 0);
      }
+     return true;
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_to_gp(DisasContext *s, arg_VMOV_to_gp *a)
+ }
-     uint32_t offset;
+@@ -XXX,XX +XXX,XX @@ static bool trans_DOT_zzx(DisasContext *s, arg_DOT_zzx *a)
+     };
-     /* UNDEF accesses to D16-D31 if they don't exist */
--    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vn & 0x10)) {
+     if (sve_access_check(s)) {
-+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
+-        unsigned vsz = vec_full_reg_size(s);
-         return false;
+-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 -                           vec_full_reg_offset(s, a->rn),
 -                           vec_full_reg_offset(s, a->rm),
 -                           vsz, vsz, a->index, fns[a->u][a->sz]);
 +        gen_gvec_ool_zzz(s, fns[a->u][a->sz], a->rd, a->rn, a->rm, a->index);
      }
+     return true;
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_from_gp(DisasContext *s, arg_VMOV_from_gp *a)
+ }
      uint32_t offset;
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vn & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP(DisasContext *s, arg_VDUP *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vn & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_64_dp(DisasContext *s, arg_VMOV_64_dp *a)
       */
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDR_VSTR_dp(DisasContext *s, arg_VLDR_VSTR_dp *a)
      TCGv_i64 tmp;
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDM_VSTM_dp(DisasContext *s, arg_VLDM_VSTM_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd + n) > 16) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd + n) > 16) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
      TCGv_ptr fpst;
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((vd | vn | vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vn | vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
      TCGv_i64 f0, fd;
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((vd | vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VFM_dp(DisasContext *s, arg_VFM_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vn | a->vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) &&
 +        ((a->vd | a->vn | a->vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
      vd = a->vd;
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd  & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd  & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm  & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm  & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp(DisasContext *s, arg_VCVT_sp *a)
      TCGv_i32 vm;
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
      TCGv_i32 vd;
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_int_dp(DisasContext *s, arg_VCVT_int_dp *a)
      TCGv_ptr fpst;
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
      }
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp_int(DisasContext *s, arg_VCVT_dp_int *a)
      TCGv_ptr fpst;
      /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
 +    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
 --
 .20.1

-[PULL 23/52] target/arm: Stop assuming DBGDIDR always exists
+[PULL 30/35] target/arm: Split out gen_gvec_ool_zz
-The AArch32 DBGDIDR defines properties like the number of
+From: Richard Henderson <richard.henderson@linaro.org>
 breakpoints, watchpoints and context-matching comparators.  On an
 AArch64 CPU, the register may not even exist if AArch32 is not
 supported at EL1.
-Currently we hard-code use of DBGDIDR to identify the number of
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-breakpoints etc; this works for all our TCG CPUs, but will break if
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-we ever add an AArch64-only CPU.  We also have an assert() that the
+Message-id: 20200815013145.539409-13-richard.henderson@linaro.org
-AArch32 and AArch64 registers match, which currently works only by
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-luck for KVM because we don't populate either of these ID registers
+---
-from the KVM vCPU and so they are both zero.
+ target/arm/translate-sve.c | 20 ++++++++++++--------
 file changed, 12 insertions(+), 8 deletions(-)
-Clean this up so we have functions for finding the number
+diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 of breakpoints, watchpoints and context comparators which look
 in the appropriate ID register.
 This allows us to drop the "check that AArch64 and AArch32 agree
 on the number of breakpoints etc" asserts:
  * we no longer look at the AArch32 versions unless that's the
    right place to be looking
  * it's valid to have a CPU (eg AArch64-only) where they don't match
  * we shouldn't have been asserting the validity of ID registers
    in a codepath used with KVM anyway
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200214175116.9164-11-peter.maydell@linaro.org
 ---
  target/arm/cpu.h          |  7 +++++++
  target/arm/internals.h    | 42 +++++++++++++++++++++++++++++++++++++++
  target/arm/debug_helper.c |  6 +++---
  target/arm/helper.c       | 21 +++++---------------
 files changed, 57 insertions(+), 19 deletions(-)
 diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/translate-sve.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ FIELD(ID_DFR0, MPROFDBG, 20, 4)
+@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
- FIELD(ID_DFR0, PERFMON, 24, 4)
+     return size_for_gvec(pred_full_reg_size(s));
  FIELD(ID_DFR0, TRACEFILT, 28, 4)
 +FIELD(DBGDIDR, SE_IMP, 12, 1)
 +FIELD(DBGDIDR, NSUHD_IMP, 14, 1)
 +FIELD(DBGDIDR, VERSION, 16, 4)
 +FIELD(DBGDIDR, CTX_CMPS, 20, 4)
 +FIELD(DBGDIDR, BRPS, 24, 4)
 +FIELD(DBGDIDR, WRPS, 28, 4)
 +
  FIELD(MVFR0, SIMDREG, 0, 4)
  FIELD(MVFR0, FPSP, 4, 4)
  FIELD(MVFR0, FPDP, 8, 4)
 diff --git a/target/arm/internals.h b/target/arm/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/internals.h
 +++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline uint32_t arm_debug_exception_fsr(CPUARMState *env)
      }
  }
-+/**
++/* Invoke an out-of-line helper on 2 Zregs. */
-+ * arm_num_brps: Return number of implemented breakpoints.
++static void gen_gvec_ool_zz(DisasContext *s, gen_helper_gvec_2 *fn,
-+ * Note that the ID register BRPS field is "number of bps - 1",
++                            int rd, int rn, int data)
 + * and we return the actual number of breakpoints.
 + */
 +static inline int arm_num_brps(ARMCPU *cpu)
 +{
-+    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
++    unsigned vsz = vec_full_reg_size(s);
-+        return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) + 1;
++    tcg_gen_gvec_2_ool(vec_full_reg_offset(s, rd),
-+    } else {
++                       vec_full_reg_offset(s, rn),
-+        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, BRPS) + 1;
++                       vsz, vsz, data, fn);
 +    }
 +}
 +
-+/**
+ /* Invoke an out-of-line helper on 3 Zregs. */
-+ * arm_num_wrps: Return number of implemented watchpoints.
+ static void gen_gvec_ool_zzz(DisasContext *s, gen_helper_gvec_3 *fn,
-+ * Note that the ID register WRPS field is "number of wps - 1",
+                              int rd, int rn, int rm, int data)
-+ * and we return the actual number of watchpoints.
+@@ -XXX,XX +XXX,XX @@ static bool trans_FEXPA(DisasContext *s, arg_rr_esz *a)
 + */
 +static inline int arm_num_wrps(ARMCPU *cpu)
 +{
 +    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
 +        return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) + 1;
 +    } else {
 +        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, WRPS) + 1;
 +    }
 +}
 +
 +/**
 + * arm_num_ctx_cmps: Return number of implemented context comparators.
 + * Note that the ID register CTX_CMPS field is "number of cmps - 1",
 + * and we return the actual number of comparators.
 + */
 +static inline int arm_num_ctx_cmps(ARMCPU *cpu)
 +{
 +    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
 +        return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) + 1;
 +    } else {
 +        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, CTX_CMPS) + 1;
 +    }
 +}
 +
  /* Note make_memop_idx reserves 4 bits for mmu_idx, and MO_BSWAP is bit 3.
   * Thus a TCGMemOpIdx, without any MO_ALIGN bits, fits in 8 bits.
   */
 diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/debug_helper.c
 +++ b/target/arm/debug_helper.c
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
  {
      CPUARMState *env = &cpu->env;
      uint64_t bcr = env->cp15.dbgbcr[lbn];
 -    int brps = extract32(cpu->dbgdidr, 24, 4);
 -    int ctx_cmps = extract32(cpu->dbgdidr, 20, 4);
 +    int brps = arm_num_brps(cpu);
 +    int ctx_cmps = arm_num_ctx_cmps(cpu);
      int bt;
      uint32_t contextidr;
      uint64_t hcr_el2;
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
       * case DBGWCR<n>_EL1.LBN must indicate that breakpoint).
       * We choose the former.
       */
 -    if (lbn > brps || lbn < (brps - ctx_cmps)) {
 +    if (lbn >= brps || lbn < (brps - ctx_cmps)) {
          return false;
      }
+     if (sve_access_check(s)) {
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+-        unsigned vsz = vec_full_reg_size(s);
-index XXXXXXX..XXXXXXX 100644
+-        tcg_gen_gvec_2_ool(vec_full_reg_offset(s, a->rd),
---- a/target/arm/helper.c
+-                           vec_full_reg_offset(s, a->rn),
-+++ b/target/arm/helper.c
+-                           vsz, vsz, 0, fns[a->esz]);
-@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
++        gen_gvec_ool_zz(s, fns[a->esz], a->rd, a->rn, 0);
      }
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool trans_REV_v(DisasContext *s, arg_rr_esz *a)
      };
-     /* Note that all these register fields hold "number of Xs minus 1". */
+     if (sve_access_check(s)) {
--    brps = extract32(cpu->dbgdidr, 24, 4);
+-        unsigned vsz = vec_full_reg_size(s);
--    wrps = extract32(cpu->dbgdidr, 28, 4);
+-        tcg_gen_gvec_2_ool(vec_full_reg_offset(s, a->rd),
--    ctx_cmps = extract32(cpu->dbgdidr, 20, 4);
+-                           vec_full_reg_offset(s, a->rn),
-+    brps = arm_num_brps(cpu);
+-                           vsz, vsz, 0, fns[a->esz]);
-+    wrps = arm_num_wrps(cpu);
++        gen_gvec_ool_zz(s, fns[a->esz], a->rd, a->rn, 0);
 +    ctx_cmps = arm_num_ctx_cmps(cpu);
      assert(ctx_cmps <= brps);
 -    /* The DBGDIDR and ID_AA64DFR0_EL1 define various properties
 -     * of the debug registers such as number of breakpoints;
 -     * check that if they both exist then they agree.
 -     */
 -    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
 -        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
 -        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
 -        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS)
 -               == ctx_cmps);
 -    }
 -
      define_one_arm_cp_reg(cpu, &dbgdidr);
      define_arm_cp_regs(cpu, debug_cp_reginfo);
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
          define_arm_cp_regs(cpu, debug_lpae_cp_reginfo);
      }
+     return true;
--    for (i = 0; i < brps + 1; i++) {
+ }
 +    for (i = 0; i < brps; i++) {
          ARMCPRegInfo dbgregs[] = {
              { .name = "DBGBVR", .state = ARM_CP_STATE_BOTH,
                .cp = 14, .opc0 = 2, .opc1 = 0, .crn = 0, .crm = i, .opc2 = 4,
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
          define_arm_cp_regs(cpu, dbgregs);
      }
 -    for (i = 0; i < wrps + 1; i++) {
 +    for (i = 0; i < wrps; i++) {
          ARMCPRegInfo dbgregs[] = {
              { .name = "DBGWVR", .state = ARM_CP_STATE_BOTH,
                .cp = 14, .opc0 = 2, .opc1 = 0, .crn = 0, .crm = i, .opc2 = 6,
 --
 .20.1

-[PULL 10/52] target/arm: Use bit 55 explicitly for pauth
+[PULL 31/35] target/arm: Tidy SVE tszimm shift formats
 From: Richard Henderson <richard.henderson@linaro.org>
-The psuedocode in aarch64/functions/pac/auth/Auth and
+Rather than require the user to fill in the immediate (shl or shr),
-aarch64/functions/pac/strip/Strip always uses bit 55 for
+create full formats that include the immediate.
 extfield and do not consider if the current regime has 2 ranges.
-Suggested-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200216194343.21331-2-richard.henderson@linaro.org
+Message-id: 20200815013145.539409-14-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/pauth_helper.c | 3 ++-
+ target/arm/sve.decode | 35 ++++++++++++++++-------------------
-file changed, 2 insertions(+), 1 deletion(-)
+file changed, 16 insertions(+), 19 deletions(-)
-diff --git a/target/arm/pauth_helper.c b/target/arm/pauth_helper.c
+diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/pauth_helper.c
+--- a/target/arm/sve.decode
-+++ b/target/arm/pauth_helper.c
++++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ static uint64_t pauth_addpac(CPUARMState *env, uint64_t ptr, uint64_t modifier,
+@@ -XXX,XX +XXX,XX @@
+ @rd_rn_i6       ........ ... rn:5 ..... imm:s6 rd:5             &rri
- static uint64_t pauth_original_ptr(uint64_t ptr, ARMVAParameters param)
- {
+ # Two register operand, one immediate operand, with predicate,
--    uint64_t extfield = -param.select;
+-# element size encoded as TSZHL.  User must fill in imm.
-+    /* Note that bit 55 is used whether or not the regime has 2 ranges. */
+-@rdn_pg_tszimm  ........ .. ... ... ... pg:3 ..... rd:5 \
-+    uint64_t extfield = sextract64(ptr, 55, 1);
+-                &rpri_esz rn=%reg_movprfx esz=%tszimm_esz
-     int bot_pac_bit = 64 - param.tsz;
++# element size encoded as TSZHL.
-     int top_pac_bit = 64 - 8 * param.tbi;
++@rdn_pg_tszimm_shl  ........ .. ... ... ... pg:3 ..... rd:5 \
++                    &rpri_esz rn=%reg_movprfx esz=%tszimm_esz imm=%tszimm_shl
 +@rdn_pg_tszimm_shr  ........ .. ... ... ... pg:3 ..... rd:5 \
 +                    &rpri_esz rn=%reg_movprfx esz=%tszimm_esz imm=%tszimm_shr
  # Similarly without predicate.
 -@rd_rn_tszimm   ........ .. ... ... ...... rn:5 rd:5 \
 -                &rri_esz esz=%tszimm16_esz
 +@rd_rn_tszimm_shl   ........ .. ... ... ...... rn:5 rd:5 \
 +                    &rri_esz esz=%tszimm16_esz imm=%tszimm16_shl
 +@rd_rn_tszimm_shr   ........ .. ... ... ...... rn:5 rd:5 \
 +                    &rri_esz esz=%tszimm16_esz imm=%tszimm16_shr
  # Two register operand, one immediate operand, with 4-bit predicate.
  # User must fill in imm.
@@ -XXX,XX +XXX,XX @@ UMINV           00000100 .. 001 011 001 ... ..... .....         @rd_pg_rn
  ### SVE Shift by Immediate - Predicated Group
  # SVE bitwise shift by immediate (predicated)
 -ASR_zpzi        00000100 .. 000 000 100 ... .. ... ..... \
 -                @rdn_pg_tszimm imm=%tszimm_shr
 -LSR_zpzi        00000100 .. 000 001 100 ... .. ... ..... \
 -                @rdn_pg_tszimm imm=%tszimm_shr
 -LSL_zpzi        00000100 .. 000 011 100 ... .. ... ..... \
 -                @rdn_pg_tszimm imm=%tszimm_shl
 -ASRD            00000100 .. 000 100 100 ... .. ... ..... \
 -                @rdn_pg_tszimm imm=%tszimm_shr
 +ASR_zpzi        00000100 .. 000 000 100 ... .. ... .....  @rdn_pg_tszimm_shr
 +LSR_zpzi        00000100 .. 000 001 100 ... .. ... .....  @rdn_pg_tszimm_shr
 +LSL_zpzi        00000100 .. 000 011 100 ... .. ... .....  @rdn_pg_tszimm_shl
 +ASRD            00000100 .. 000 100 100 ... .. ... .....  @rdn_pg_tszimm_shr
  # SVE bitwise shift by vector (predicated)
  ASR_zpzz        00000100 .. 010 000 100 ... ..... .....   @rdn_pg_rm
@@ -XXX,XX +XXX,XX @@ RDVL            00000100 101 11111 01010 imm:s6 rd:5
  ### SVE Bitwise Shift - Unpredicated Group
  # SVE bitwise shift by immediate (unpredicated)
 -ASR_zzi         00000100 .. 1 ..... 1001 00 ..... ..... \
 -                @rd_rn_tszimm imm=%tszimm16_shr
 -LSR_zzi         00000100 .. 1 ..... 1001 01 ..... ..... \
 -                @rd_rn_tszimm imm=%tszimm16_shr
 -LSL_zzi         00000100 .. 1 ..... 1001 11 ..... ..... \
 -                @rd_rn_tszimm imm=%tszimm16_shl
 +ASR_zzi         00000100 .. 1 ..... 1001 00 ..... .....  @rd_rn_tszimm_shr
 +LSR_zzi         00000100 .. 1 ..... 1001 01 ..... .....  @rd_rn_tszimm_shr
 +LSL_zzi         00000100 .. 1 ..... 1001 11 ..... .....  @rd_rn_tszimm_shl
  # SVE bitwise shift by wide elements (unpredicated)
  # Note esz != 3
 --
 .20.1

-[PULL 14/52] target/arm: Add _aa32_ to isar_feature functions testing 32-bit ID registers
+Deleted patch
-Enforce a convention that an isar_feature function that tests a
--bit ID register always has _aa32_ in its name, and one that
-tests a 64-bit ID register always has _aa64_ in its name.
-We already follow this except for three cases: thumb_div,
-arm_div and jazelle, which all need _aa32_ adding.
-(As noted in the comment, isar_feature_aa32_fp16_arith()
-is an exception in that it currently tests ID_AA64PFR0_EL1,
-but will switch to MVFR1 once we've properly implemented
-FP16 for AArch32.)
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-2-peter.maydell@linaro.org
----
- target/arm/cpu.h       | 13 ++++++++++---
- target/arm/internals.h |  2 +-
- linux-user/elfload.c   |  4 ++--
- target/arm/cpu.c       |  6 ++++--
- target/arm/helper.c    |  2 +-
- target/arm/translate.c |  6 +++---
-files changed, 21 insertions(+), 12 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ static inline uint64_t *aa64_vfp_qreg(CPUARMState *env, unsigned regno)
- /* Shared between translate-sve.c and sve_helper.c.  */
- extern const uint64_t pred_esz_masks[4];
-+/*
-+ * Naming convention for isar_feature functions:
-+ * Functions which test 32-bit ID registers should have _aa32_ in
-+ * their name. Functions which test 64-bit ID registers should have
-+ * _aa64_ in their name.
-+ */
-+
- /*
-  * 32-bit feature tests via id registers.
-  */
--static inline bool isar_feature_thumb_div(const ARMISARegisters *id)
-+static inline bool isar_feature_aa32_thumb_div(const ARMISARegisters *id)
- {
-     return FIELD_EX32(id->id_isar0, ID_ISAR0, DIVIDE) != 0;
- }
--static inline bool isar_feature_arm_div(const ARMISARegisters *id)
-+static inline bool isar_feature_aa32_arm_div(const ARMISARegisters *id)
- {
-     return FIELD_EX32(id->id_isar0, ID_ISAR0, DIVIDE) > 1;
- }
--static inline bool isar_feature_jazelle(const ARMISARegisters *id)
-+static inline bool isar_feature_aa32_jazelle(const ARMISARegisters *id)
- {
-     return FIELD_EX32(id->id_isar1, ID_ISAR1, JAZELLE) != 0;
- }
-diff --git a/target/arm/internals.h b/target/arm/internals.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
-+++ b/target/arm/internals.h
-@@ -XXX,XX +XXX,XX @@ static inline uint32_t aarch32_cpsr_valid_mask(uint64_t features,
-     if ((features >> ARM_FEATURE_THUMB2) & 1) {
-         valid |= CPSR_IT;
-     }
--    if (isar_feature_jazelle(id)) {
-+    if (isar_feature_aa32_jazelle(id)) {
-         valid |= CPSR_J;
-     }
-     if (isar_feature_aa32_pan(id)) {
-diff --git a/linux-user/elfload.c b/linux-user/elfload.c
-index XXXXXXX..XXXXXXX 100644
---- a/linux-user/elfload.c
-+++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
-     GET_FEATURE(ARM_FEATURE_VFP3, ARM_HWCAP_ARM_VFPv3);
-     GET_FEATURE(ARM_FEATURE_V6K, ARM_HWCAP_ARM_TLS);
-     GET_FEATURE(ARM_FEATURE_VFP4, ARM_HWCAP_ARM_VFPv4);
--    GET_FEATURE_ID(arm_div, ARM_HWCAP_ARM_IDIVA);
--    GET_FEATURE_ID(thumb_div, ARM_HWCAP_ARM_IDIVT);
-+    GET_FEATURE_ID(aa32_arm_div, ARM_HWCAP_ARM_IDIVA);
-+    GET_FEATURE_ID(aa32_thumb_div, ARM_HWCAP_ARM_IDIVT);
-     /* All QEMU's VFPv3 CPUs have 32 registers, see VFP_DREG in translate.c.
-      * Note that the ARM_HWCAP_ARM_VFPv3D16 bit is always the inverse of
-      * ARM_HWCAP_ARM_VFPD32 (and so always clear for QEMU); it is unrelated
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
-+++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
-          * Presence of EL2 itself is ARM_FEATURE_EL2, and of the
-          * Security Extensions is ARM_FEATURE_EL3.
-          */
--        assert(!tcg_enabled() || no_aa32 || cpu_isar_feature(arm_div, cpu));
-+        assert(!tcg_enabled() || no_aa32 ||
-+               cpu_isar_feature(aa32_arm_div, cpu));
-         set_feature(env, ARM_FEATURE_LPAE);
-         set_feature(env, ARM_FEATURE_V7);
-     }
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
-     if (arm_feature(env, ARM_FEATURE_V6)) {
-         set_feature(env, ARM_FEATURE_V5);
-         if (!arm_feature(env, ARM_FEATURE_M)) {
--            assert(!tcg_enabled() || no_aa32 || cpu_isar_feature(jazelle, cpu));
-+            assert(!tcg_enabled() || no_aa32 ||
-+                   cpu_isar_feature(aa32_jazelle, cpu));
-             set_feature(env, ARM_FEATURE_AUXCR);
-         }
-     }
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-     if (arm_feature(env, ARM_FEATURE_LPAE)) {
-         define_arm_cp_regs(cpu, lpae_cp_reginfo);
-     }
--    if (cpu_isar_feature(jazelle, cpu)) {
-+    if (cpu_isar_feature(aa32_jazelle, cpu)) {
-         define_arm_cp_regs(cpu, jazelle_regs);
-     }
-     /* Slightly awkwardly, the OMAP and StrongARM cores need all of
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@
- #define ENABLE_ARCH_5     arm_dc_feature(s, ARM_FEATURE_V5)
- /* currently all emulated v5 cores are also v5TE, so don't bother */
- #define ENABLE_ARCH_5TE   arm_dc_feature(s, ARM_FEATURE_V5)
--#define ENABLE_ARCH_5J    dc_isar_feature(jazelle, s)
-+#define ENABLE_ARCH_5J    dc_isar_feature(aa32_jazelle, s)
- #define ENABLE_ARCH_6     arm_dc_feature(s, ARM_FEATURE_V6)
- #define ENABLE_ARCH_6K    arm_dc_feature(s, ARM_FEATURE_V6K)
- #define ENABLE_ARCH_6T2   arm_dc_feature(s, ARM_FEATURE_THUMB2)
-@@ -XXX,XX +XXX,XX @@ static bool op_div(DisasContext *s, arg_rrr *a, bool u)
-     TCGv_i32 t1, t2;
-     if (s->thumb
--        ? !dc_isar_feature(thumb_div, s)
--        : !dc_isar_feature(arm_div, s)) {
-+        ? !dc_isar_feature(aa32_thumb_div, s)
-+        : !dc_isar_feature(aa32_arm_div, s)) {
-         return false;
-     }
---
-.20.1

-[PULL 15/52] target/arm: Check aa32_pan in take_aarch32_exception(), not aa64_pan
+Deleted patch
-In take_aarch32_exception(), we know we are dealing with a CPU that
-has AArch32, so the right isar_feature test is aa32_pan, not aa64_pan.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-3-peter.maydell@linaro.org
----
- target/arm/helper.c | 2 +-
-file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void take_aarch32_exception(CPUARMState *env, int new_mode,
-         env->elr_el[2] = env->regs[15];
-     } else {
-         /* CPSR.PAN is normally preserved preserved unless...  */
--        if (cpu_isar_feature(aa64_pan, env_archcpu(env))) {
-+        if (cpu_isar_feature(aa32_pan, env_archcpu(env))) {
-             switch (new_el) {
-             case 3:
-                 if (!arm_is_secure_below_el3(env)) {
---
-.20.1

-[PULL 16/52] target/arm: Add isar_feature_any_fp16 and document naming/usage conventions
+Deleted patch
-Our current usage of the isar_feature feature tests almost always
-uses an _aa32_ test when the code path is known to be AArch32
-specific and an _aa64_ test when the code path is known to be
-AArch64 specific. There is just one exception: in the vfp_set_fpscr
-helper we check aa64_fp16 to determine whether the FZ16 bit in
-the FP(S)CR exists, but this code is also used for AArch32.
-There are other places in future where we're likely to want
-a general "does this feature exist for either AArch32 or
-AArch64" check (typically where architecturally the feature exists
-for both CPU states if it exists at all, but the CPU might be
-AArch32-only or AArch64-only, and so only have one set of ID
-registers).
-Introduce a new category of isar_feature_* functions:
-isar_feature_any_foo() should be tested when what we want to
-know is "does this feature exist for either AArch32 or AArch64",
-and always returns the logical OR of isar_feature_aa32_foo()
-and isar_feature_aa64_foo().
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-4-peter.maydell@linaro.org
----
- target/arm/cpu.h        | 19 ++++++++++++++++++-
- target/arm/vfp_helper.c |  2 +-
-files changed, 19 insertions(+), 2 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ extern const uint64_t pred_esz_masks[4];
-  * Naming convention for isar_feature functions:
-  * Functions which test 32-bit ID registers should have _aa32_ in
-  * their name. Functions which test 64-bit ID registers should have
-- * _aa64_ in their name.
-+ * _aa64_ in their name. These must only be used in code where we
-+ * know for certain that the CPU has AArch32 or AArch64 respectively
-+ * or where the correct answer for a CPU which doesn't implement that
-+ * CPU state is "false" (eg when generating A32 or A64 code, if adding
-+ * system registers that are specific to that CPU state, for "should
-+ * we let this system register bit be set" tests where the 32-bit
-+ * flavour of the register doesn't have the bit, and so on).
-+ * Functions which simply ask "does this feature exist at all" have
-+ * _any_ in their name, and always return the logical OR of the _aa64_
-+ * and the _aa32_ function.
-  */
- /*
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_bti(const ARMISARegisters *id)
-     return FIELD_EX64(id->id_aa64pfr1, ID_AA64PFR1, BT) != 0;
- }
-+/*
-+ * Feature tests for "does this exist in either 32-bit or 64-bit?"
-+ */
-+static inline bool isar_feature_any_fp16(const ARMISARegisters *id)
-+{
-+    return isar_feature_aa64_fp16(id) || isar_feature_aa32_fp16_arith(id);
-+}
-+
- /*
-  * Forward to the above feature tests given an ARMCPU pointer.
-  */
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp_helper.c
-+++ b/target/arm/vfp_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t vfp_get_fpscr(CPUARMState *env)
- void HELPER(vfp_set_fpscr)(CPUARMState *env, uint32_t val)
- {
-     /* When ARMv8.2-FP16 is not supported, FZ16 is RES0.  */
--    if (!cpu_isar_feature(aa64_fp16, env_archcpu(env))) {
-+    if (!cpu_isar_feature(any_fp16, env_archcpu(env))) {
-         val &= ~FPCR_FZ16;
-     }
---
-.20.1

-[PULL 17/52] target/arm: Define and use any_predinv isar_feature test
+Deleted patch
-Instead of open-coding "ARM_FEATURE_AARCH64 ? aa64_predinv: aa32_predinv",
-define and use an any_predinv isar_feature test function.
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-5-peter.maydell@linaro.org
----
- target/arm/cpu.h    | 5 +++++
- target/arm/helper.c | 9 +--------
-files changed, 6 insertions(+), 8 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_any_fp16(const ARMISARegisters *id)
-     return isar_feature_aa64_fp16(id) || isar_feature_aa32_fp16_arith(id);
- }
-+static inline bool isar_feature_any_predinv(const ARMISARegisters *id)
-+{
-+    return isar_feature_aa64_predinv(id) || isar_feature_aa32_predinv(id);
-+}
-+
- /*
-  * Forward to the above feature tests given an ARMCPU pointer.
-  */
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
- #endif /*CONFIG_USER_ONLY*/
- #endif
--    /*
--     * While all v8.0 cpus support aarch64, QEMU does have configurations
--     * that do not set ID_AA64ISAR1, e.g. user-only qemu-arm -cpu max,
--     * which will set ID_ISAR6.
--     */
--    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)
--        ? cpu_isar_feature(aa64_predinv, cpu)
--        : cpu_isar_feature(aa32_predinv, cpu)) {
-+    if (cpu_isar_feature(any_predinv, cpu)) {
-         define_arm_cp_regs(cpu, predinv_reginfo);
-     }
---
-.20.1

-[PULL 18/52] target/arm: Factor out PMU register definitions
+Deleted patch
-Pull the code that defines the various PMU registers out
-into its own function, matching the pattern we have
-already for the debug registers.
-Apart from one style fix to a multi-line comment, this
-is purely movement of code with no changes to it.
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-6-peter.maydell@linaro.org
----
- target/arm/helper.c | 158 +++++++++++++++++++++++---------------------
-file changed, 82 insertions(+), 76 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
-     }
- }
-+static void define_pmu_regs(ARMCPU *cpu)
-+{
-+    /*
-+     * v7 performance monitor control register: same implementor
-+     * field as main ID register, and we implement four counters in
-+     * addition to the cycle count register.
-+     */
-+    unsigned int i, pmcrn = 4;
-+    ARMCPRegInfo pmcr = {
-+        .name = "PMCR", .cp = 15, .crn = 9, .crm = 12, .opc1 = 0, .opc2 = 0,
-+        .access = PL0_RW,
-+        .type = ARM_CP_IO | ARM_CP_ALIAS,
-+        .fieldoffset = offsetoflow32(CPUARMState, cp15.c9_pmcr),
-+        .accessfn = pmreg_access, .writefn = pmcr_write,
-+        .raw_writefn = raw_write,
-+    };
-+    ARMCPRegInfo pmcr64 = {
-+        .name = "PMCR_EL0", .state = ARM_CP_STATE_AA64,
-+        .opc0 = 3, .opc1 = 3, .crn = 9, .crm = 12, .opc2 = 0,
-+        .access = PL0_RW, .accessfn = pmreg_access,
-+        .type = ARM_CP_IO,
-+        .fieldoffset = offsetof(CPUARMState, cp15.c9_pmcr),
-+        .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT),
-+        .writefn = pmcr_write, .raw_writefn = raw_write,
-+    };
-+    define_one_arm_cp_reg(cpu, &pmcr);
-+    define_one_arm_cp_reg(cpu, &pmcr64);
-+    for (i = 0; i < pmcrn; i++) {
-+        char *pmevcntr_name = g_strdup_printf("PMEVCNTR%d", i);
-+        char *pmevcntr_el0_name = g_strdup_printf("PMEVCNTR%d_EL0", i);
-+        char *pmevtyper_name = g_strdup_printf("PMEVTYPER%d", i);
-+        char *pmevtyper_el0_name = g_strdup_printf("PMEVTYPER%d_EL0", i);
-+        ARMCPRegInfo pmev_regs[] = {
-+            { .name = pmevcntr_name, .cp = 15, .crn = 14,
-+              .crm = 8 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
-+              .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
-+              .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
-+              .accessfn = pmreg_access },
-+            { .name = pmevcntr_el0_name, .state = ARM_CP_STATE_AA64,
-+              .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 8 | (3 & (i >> 3)),
-+              .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
-+              .type = ARM_CP_IO,
-+              .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
-+              .raw_readfn = pmevcntr_rawread,
-+              .raw_writefn = pmevcntr_rawwrite },
-+            { .name = pmevtyper_name, .cp = 15, .crn = 14,
-+              .crm = 12 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
-+              .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
-+              .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
-+              .accessfn = pmreg_access },
-+            { .name = pmevtyper_el0_name, .state = ARM_CP_STATE_AA64,
-+              .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 12 | (3 & (i >> 3)),
-+              .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
-+              .type = ARM_CP_IO,
-+              .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
-+              .raw_writefn = pmevtyper_rawwrite },
-+            REGINFO_SENTINEL
-+        };
-+        define_arm_cp_regs(cpu, pmev_regs);
-+        g_free(pmevcntr_name);
-+        g_free(pmevcntr_el0_name);
-+        g_free(pmevtyper_name);
-+        g_free(pmevtyper_el0_name);
-+    }
-+    if (FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
-+            FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) != 0xf) {
-+        ARMCPRegInfo v81_pmu_regs[] = {
-+            { .name = "PMCEID2", .state = ARM_CP_STATE_AA32,
-+              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 4,
-+              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
-+              .resetvalue = extract64(cpu->pmceid0, 32, 32) },
-+            { .name = "PMCEID3", .state = ARM_CP_STATE_AA32,
-+              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 5,
-+              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
-+              .resetvalue = extract64(cpu->pmceid1, 32, 32) },
-+            REGINFO_SENTINEL
-+        };
-+        define_arm_cp_regs(cpu, v81_pmu_regs);
-+    }
-+}
-+
- /* We don't know until after realize whether there's a GICv3
-  * attached, and that is what registers the gicv3 sysregs.
-  * So we have to fill in the GIC fields in ID_PFR/ID_PFR1_EL1/ID_AA64PFR0_EL1
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-         define_arm_cp_regs(cpu, pmovsset_cp_reginfo);
-     }
-     if (arm_feature(env, ARM_FEATURE_V7)) {
--        /* v7 performance monitor control register: same implementor
--         * field as main ID register, and we implement four counters in
--         * addition to the cycle count register.
--         */
--        unsigned int i, pmcrn = 4;
--        ARMCPRegInfo pmcr = {
--            .name = "PMCR", .cp = 15, .crn = 9, .crm = 12, .opc1 = 0, .opc2 = 0,
--            .access = PL0_RW,
--            .type = ARM_CP_IO | ARM_CP_ALIAS,
--            .fieldoffset = offsetoflow32(CPUARMState, cp15.c9_pmcr),
--            .accessfn = pmreg_access, .writefn = pmcr_write,
--            .raw_writefn = raw_write,
--        };
--        ARMCPRegInfo pmcr64 = {
--            .name = "PMCR_EL0", .state = ARM_CP_STATE_AA64,
--            .opc0 = 3, .opc1 = 3, .crn = 9, .crm = 12, .opc2 = 0,
--            .access = PL0_RW, .accessfn = pmreg_access,
--            .type = ARM_CP_IO,
--            .fieldoffset = offsetof(CPUARMState, cp15.c9_pmcr),
--            .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT),
--            .writefn = pmcr_write, .raw_writefn = raw_write,
--        };
--        define_one_arm_cp_reg(cpu, &pmcr);
--        define_one_arm_cp_reg(cpu, &pmcr64);
--        for (i = 0; i < pmcrn; i++) {
--            char *pmevcntr_name = g_strdup_printf("PMEVCNTR%d", i);
--            char *pmevcntr_el0_name = g_strdup_printf("PMEVCNTR%d_EL0", i);
--            char *pmevtyper_name = g_strdup_printf("PMEVTYPER%d", i);
--            char *pmevtyper_el0_name = g_strdup_printf("PMEVTYPER%d_EL0", i);
--            ARMCPRegInfo pmev_regs[] = {
--                { .name = pmevcntr_name, .cp = 15, .crn = 14,
--                  .crm = 8 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
--                  .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
--                  .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
--                  .accessfn = pmreg_access },
--                { .name = pmevcntr_el0_name, .state = ARM_CP_STATE_AA64,
--                  .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 8 | (3 & (i >> 3)),
--                  .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
--                  .type = ARM_CP_IO,
--                  .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
--                  .raw_readfn = pmevcntr_rawread,
--                  .raw_writefn = pmevcntr_rawwrite },
--                { .name = pmevtyper_name, .cp = 15, .crn = 14,
--                  .crm = 12 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
--                  .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
--                  .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
--                  .accessfn = pmreg_access },
--                { .name = pmevtyper_el0_name, .state = ARM_CP_STATE_AA64,
--                  .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 12 | (3 & (i >> 3)),
--                  .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
--                  .type = ARM_CP_IO,
--                  .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
--                  .raw_writefn = pmevtyper_rawwrite },
--                REGINFO_SENTINEL
--            };
--            define_arm_cp_regs(cpu, pmev_regs);
--            g_free(pmevcntr_name);
--            g_free(pmevcntr_el0_name);
--            g_free(pmevtyper_name);
--            g_free(pmevtyper_el0_name);
--        }
-         ARMCPRegInfo clidr = {
-             .name = "CLIDR", .state = ARM_CP_STATE_BOTH,
-             .opc0 = 3, .crn = 0, .crm = 0, .opc1 = 1, .opc2 = 1,
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-         define_one_arm_cp_reg(cpu, &clidr);
-         define_arm_cp_regs(cpu, v7_cp_reginfo);
-         define_debug_regs(cpu);
-+        define_pmu_regs(cpu);
-     } else {
-         define_arm_cp_regs(cpu, not_v7_cp_reginfo);
-     }
--    if (FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
--            FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) != 0xf) {
--        ARMCPRegInfo v81_pmu_regs[] = {
--            { .name = "PMCEID2", .state = ARM_CP_STATE_AA32,
--              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 4,
--              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
--              .resetvalue = extract64(cpu->pmceid0, 32, 32) },
--            { .name = "PMCEID3", .state = ARM_CP_STATE_AA32,
--              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 5,
--              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
--              .resetvalue = extract64(cpu->pmceid1, 32, 32) },
--            REGINFO_SENTINEL
--        };
--        define_arm_cp_regs(cpu, v81_pmu_regs);
--    }
-     if (arm_feature(env, ARM_FEATURE_V8)) {
-         /* AArch64 ID registers, which all have impdef reset values.
-          * Note that within the ID register ranges the unused slots
---
-.20.1

-[PULL 19/52] target/arm: Add and use FIELD definitions for ID_AA64DFR0_EL1
+Deleted patch
-Add FIELD() definitions for the ID_AA64DFR0_EL1 and use them
-where we currently have hard-coded bit values.
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-7-peter.maydell@linaro.org
----
- target/arm/cpu.h    | 10 ++++++++++
- target/arm/cpu.c    |  2 +-
- target/arm/helper.c |  6 +++---
-files changed, 14 insertions(+), 4 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ FIELD(ID_AA64MMFR2, BBM, 52, 4)
- FIELD(ID_AA64MMFR2, EVT, 56, 4)
- FIELD(ID_AA64MMFR2, E0PD, 60, 4)
-+FIELD(ID_AA64DFR0, DEBUGVER, 0, 4)
-+FIELD(ID_AA64DFR0, TRACEVER, 4, 4)
-+FIELD(ID_AA64DFR0, PMUVER, 8, 4)
-+FIELD(ID_AA64DFR0, BRPS, 12, 4)
-+FIELD(ID_AA64DFR0, WRPS, 20, 4)
-+FIELD(ID_AA64DFR0, CTX_CMPS, 28, 4)
-+FIELD(ID_AA64DFR0, PMSVER, 32, 4)
-+FIELD(ID_AA64DFR0, DOUBLELOCK, 36, 4)
-+FIELD(ID_AA64DFR0, TRACEFILT, 40, 4)
-+
- FIELD(ID_DFR0, COPDBG, 0, 4)
- FIELD(ID_DFR0, COPSDBG, 4, 4)
- FIELD(ID_DFR0, MMAPDBG, 8, 4)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
-+++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
-                 cpu);
- #endif
-     } else {
--        cpu->id_aa64dfr0 &= ~0xf00;
-+        cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
-         cpu->id_dfr0 &= ~(0xf << 24);
-         cpu->pmceid0 = 0;
-         cpu->pmceid1 = 0;
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
-      * check that if they both exist then they agree.
-      */
-     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
--        assert(extract32(cpu->id_aa64dfr0, 12, 4) == brps);
--        assert(extract32(cpu->id_aa64dfr0, 20, 4) == wrps);
--        assert(extract32(cpu->id_aa64dfr0, 28, 4) == ctx_cmps);
-+        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
-+        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
-+        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) == ctx_cmps);
-     }
-     define_one_arm_cp_reg(cpu, &dbgdidr);
---
-.20.1

-[PULL 20/52] target/arm: Use FIELD macros for clearing ID_DFR0 PERFMON field
+Deleted patch
-We already define FIELD macros for ID_DFR0, so use them in the
-one place where we're doing direct bit value manipulation.
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-8-peter.maydell@linaro.org
----
- target/arm/cpu.c | 2 +-
-file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
-+++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
- #endif
-     } else {
-         cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
--        cpu->id_dfr0 &= ~(0xf << 24);
-+        cpu->id_dfr0 = FIELD_DP32(cpu->id_dfr0, ID_DFR0, PERFMON, 0);
-         cpu->pmceid0 = 0;
-         cpu->pmceid1 = 0;
-     }
---
-.20.1

-[PULL 24/52] target/arm: Move DBGDIDR into ARMISARegisters
+Deleted patch
-We're going to want to read the DBGDIDR register from KVM in
-a subsequent commit, which means it needs to be in the
-ARMISARegisters sub-struct. Move it.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-12-peter.maydell@linaro.org
----
- target/arm/cpu.h       | 2 +-
- target/arm/internals.h | 6 +++---
- target/arm/cpu.c       | 8 ++++----
- target/arm/cpu64.c     | 6 +++---
- target/arm/helper.c    | 2 +-
-files changed, 12 insertions(+), 12 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
-         uint32_t mvfr1;
-         uint32_t mvfr2;
-         uint32_t id_dfr0;
-+        uint32_t dbgdidr;
-         uint64_t id_aa64isar0;
-         uint64_t id_aa64isar1;
-         uint64_t id_aa64pfr0;
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
-     uint32_t id_mmfr4;
-     uint64_t id_aa64afr0;
-     uint64_t id_aa64afr1;
--    uint32_t dbgdidr;
-     uint32_t clidr;
-     uint64_t mp_affinity; /* MP ID without feature bits */
-     /* The elements of this array are the CCSIDR values for each cache,
-diff --git a/target/arm/internals.h b/target/arm/internals.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/internals.h
-+++ b/target/arm/internals.h
-@@ -XXX,XX +XXX,XX @@ static inline int arm_num_brps(ARMCPU *cpu)
-     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-         return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) + 1;
-     } else {
--        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, BRPS) + 1;
-+        return FIELD_EX32(cpu->isar.dbgdidr, DBGDIDR, BRPS) + 1;
-     }
- }
-@@ -XXX,XX +XXX,XX @@ static inline int arm_num_wrps(ARMCPU *cpu)
-     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-         return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) + 1;
-     } else {
--        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, WRPS) + 1;
-+        return FIELD_EX32(cpu->isar.dbgdidr, DBGDIDR, WRPS) + 1;
-     }
- }
-@@ -XXX,XX +XXX,XX @@ static inline int arm_num_ctx_cmps(ARMCPU *cpu)
-     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-         return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) + 1;
-     } else {
--        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, CTX_CMPS) + 1;
-+        return FIELD_EX32(cpu->isar.dbgdidr, DBGDIDR, CTX_CMPS) + 1;
-     }
- }
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
-+++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void cortex_a8_initfn(Object *obj)
-     cpu->isar.id_isar2 = 0x21232031;
-     cpu->isar.id_isar3 = 0x11112131;
-     cpu->isar.id_isar4 = 0x00111142;
--    cpu->dbgdidr = 0x15141000;
-+    cpu->isar.dbgdidr = 0x15141000;
-     cpu->clidr = (1 << 27) | (2 << 24) | 3;
-     cpu->ccsidr[0] = 0xe007e01a; /* 16k L1 dcache. */
-     cpu->ccsidr[1] = 0x2007e01a; /* 16k L1 icache. */
-@@ -XXX,XX +XXX,XX @@ static void cortex_a9_initfn(Object *obj)
-     cpu->isar.id_isar2 = 0x21232041;
-     cpu->isar.id_isar3 = 0x11112131;
-     cpu->isar.id_isar4 = 0x00111142;
--    cpu->dbgdidr = 0x35141000;
-+    cpu->isar.dbgdidr = 0x35141000;
-     cpu->clidr = (1 << 27) | (1 << 24) | 3;
-     cpu->ccsidr[0] = 0xe00fe019; /* 16k L1 dcache. */
-     cpu->ccsidr[1] = 0x200fe019; /* 16k L1 icache. */
-@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
-     cpu->isar.id_isar2 = 0x21232041;
-     cpu->isar.id_isar3 = 0x11112131;
-     cpu->isar.id_isar4 = 0x10011142;
--    cpu->dbgdidr = 0x3515f005;
-+    cpu->isar.dbgdidr = 0x3515f005;
-     cpu->clidr = 0x0a200023;
-     cpu->ccsidr[0] = 0x701fe00a; /* 32K L1 dcache */
-     cpu->ccsidr[1] = 0x201fe00a; /* 32K L1 icache */
-@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
-     cpu->isar.id_isar2 = 0x21232041;
-     cpu->isar.id_isar3 = 0x11112131;
-     cpu->isar.id_isar4 = 0x10011142;
--    cpu->dbgdidr = 0x3515f021;
-+    cpu->isar.dbgdidr = 0x3515f021;
-     cpu->clidr = 0x0a200023;
-     cpu->ccsidr[0] = 0x701fe00a; /* 32K L1 dcache */
-     cpu->ccsidr[1] = 0x201fe00a; /* 32K L1 icache */
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
-+++ b/target/arm/cpu64.c
-@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
-     cpu->isar.id_aa64dfr0 = 0x10305106;
-     cpu->isar.id_aa64isar0 = 0x00011120;
-     cpu->isar.id_aa64mmfr0 = 0x00001124;
--    cpu->dbgdidr = 0x3516d000;
-+    cpu->isar.dbgdidr = 0x3516d000;
-     cpu->clidr = 0x0a200023;
-     cpu->ccsidr[0] = 0x701fe00a; /* 32KB L1 dcache */
-     cpu->ccsidr[1] = 0x201fe012; /* 48KB L1 icache */
-@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
-     cpu->isar.id_aa64dfr0 = 0x10305106;
-     cpu->isar.id_aa64isar0 = 0x00011120;
-     cpu->isar.id_aa64mmfr0 = 0x00001122; /* 40 bit physical addr */
--    cpu->dbgdidr = 0x3516d000;
-+    cpu->isar.dbgdidr = 0x3516d000;
-     cpu->clidr = 0x0a200023;
-     cpu->ccsidr[0] = 0x700fe01a; /* 32KB L1 dcache */
-     cpu->ccsidr[1] = 0x201fe00a; /* 32KB L1 icache */
-@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
-     cpu->isar.id_aa64dfr0 = 0x10305106;
-     cpu->isar.id_aa64isar0 = 0x00011120;
-     cpu->isar.id_aa64mmfr0 = 0x00001124;
--    cpu->dbgdidr = 0x3516d000;
-+    cpu->isar.dbgdidr = 0x3516d000;
-     cpu->clidr = 0x0a200023;
-     cpu->ccsidr[0] = 0x701fe00a; /* 32KB L1 dcache */
-     cpu->ccsidr[1] = 0x201fe012; /* 48KB L1 icache */
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
-     ARMCPRegInfo dbgdidr = {
-         .name = "DBGDIDR", .cp = 14, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 0,
-         .access = PL0_R, .accessfn = access_tda,
--        .type = ARM_CP_CONST, .resetvalue = cpu->dbgdidr,
-+        .type = ARM_CP_CONST, .resetvalue = cpu->isar.dbgdidr,
-     };
-     /* Note that all these register fields hold "number of Xs minus 1". */
---
-.20.1

-[PULL 25/52] target/arm: Read debug-related ID registers from KVM
+Deleted patch
-Now we have isar_feature test functions that look at fields in the
-ID_AA64DFR0_EL1 and ID_DFR0 ID registers, add the code that reads
-these register values from KVM so that the checks behave correctly
-when we're using KVM.
-No isar_feature function tests ID_AA64DFR1_EL1 or DBGDIDR yet, but we
-add it to maintain the invariant that every field in the
-ARMISARegisters struct is populated for a KVM CPU and can be relied
-on.  This requirement isn't actually written down yet, so add a note
-to the relevant comment.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-13-peter.maydell@linaro.org
----
- target/arm/cpu.h   |  5 +++++
- target/arm/kvm32.c |  8 ++++++++
- target/arm/kvm64.c | 36 ++++++++++++++++++++++++++++++++++++
-files changed, 49 insertions(+)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
-      * prefix means a constant register.
-      * Some of these registers are split out into a substructure that
-      * is shared with the translators to control the ISA.
-+     *
-+     * Note that if you add an ID register to the ARMISARegisters struct
-+     * you need to also update the 32-bit and 64-bit versions of the
-+     * kvm_arm_get_host_cpu_features() function to correctly populate the
-+     * field by reading the value from the KVM vCPU.
-      */
-     struct ARMISARegisters {
-         uint32_t id_isar0;
-diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/kvm32.c
-+++ b/target/arm/kvm32.c
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
-         ahcf->isar.id_isar6 = 0;
-     }
-+    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_dfr0,
-+                          ARM_CP15_REG32(0, 0, 1, 2));
-+
-     err |= read_sys_reg32(fdarray[2], &ahcf->isar.mvfr0,
-                           KVM_REG_ARM | KVM_REG_SIZE_U32 |
-                           KVM_REG_ARM_VFP | KVM_REG_ARM_VFP_MVFR0);
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
-      * Fortunately there is not yet anything in there that affects migration.
-      */
-+    /*
-+     * There is no way to read DBGDIDR, because currently 32-bit KVM
-+     * doesn't implement debug at all. Leave it at zero.
-+     */
-+
-     kvm_arm_destroy_scratch_host_vcpu(fdarray);
-     if (err < 0) {
-diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/kvm64.c
-+++ b/target/arm/kvm64.c
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
-     } else {
-         err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64pfr1,
-                               ARM64_SYS_REG(3, 0, 0, 4, 1));
-+        err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64dfr0,
-+                              ARM64_SYS_REG(3, 0, 0, 5, 0));
-+        err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64dfr1,
-+                              ARM64_SYS_REG(3, 0, 0, 5, 1));
-         err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64isar0,
-                               ARM64_SYS_REG(3, 0, 0, 6, 0));
-         err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64isar1,
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
-          * than skipping the reads and leaving 0, as we must avoid
-          * considering the values in every case.
-          */
-+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_dfr0,
-+                              ARM64_SYS_REG(3, 0, 0, 1, 2));
-         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar0,
-                               ARM64_SYS_REG(3, 0, 0, 2, 0));
-         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar1,
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
-                               ARM64_SYS_REG(3, 0, 0, 3, 1));
-         err |= read_sys_reg32(fdarray[2], &ahcf->isar.mvfr2,
-                               ARM64_SYS_REG(3, 0, 0, 3, 2));
-+
-+        /*
-+         * DBGDIDR is a bit complicated because the kernel doesn't
-+         * provide an accessor for it in 64-bit mode, which is what this
-+         * scratch VM is in, and there's no architected "64-bit sysreg
-+         * which reads the same as the 32-bit register" the way there is
-+         * for other ID registers. Instead we synthesize a value from the
-+         * AArch64 ID_AA64DFR0, the same way the kernel code in
-+         * arch/arm64/kvm/sys_regs.c:trap_dbgidr() does.
-+         * We only do this if the CPU supports AArch32 at EL1.
-+         */
-+        if (FIELD_EX32(ahcf->isar.id_aa64pfr0, ID_AA64PFR0, EL1) >= 2) {
-+            int wrps = FIELD_EX64(ahcf->isar.id_aa64dfr0, ID_AA64DFR0, WRPS);
-+            int brps = FIELD_EX64(ahcf->isar.id_aa64dfr0, ID_AA64DFR0, BRPS);
-+            int ctx_cmps =
-+                FIELD_EX64(ahcf->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS);
-+            int version = 6; /* ARMv8 debug architecture */
-+            bool has_el3 =
-+                !!FIELD_EX32(ahcf->isar.id_aa64pfr0, ID_AA64PFR0, EL3);
-+            uint32_t dbgdidr = 0;
-+
-+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, WRPS, wrps);
-+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, BRPS, brps);
-+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, CTX_CMPS, ctx_cmps);
-+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, VERSION, version);
-+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, NSUHD_IMP, has_el3);
-+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, SE_IMP, has_el3);
-+            dbgdidr |= (1 << 15); /* RES1 bit */
-+            ahcf->isar.dbgdidr = dbgdidr;
-+        }
-     }
-     sve_supported = ioctl(fdarray[0], KVM_CHECK_EXTENSION, KVM_CAP_ARM_SVE) > 0;
---
-.20.1

-[PULL 26/52] target/arm: Implement ARMv8.1-PMU extension
+Deleted patch
-The ARMv8.1-PMU extension requires:
- * the evtCount field in PMETYPER<n>_EL0 is 16 bits, not 10
- * MDCR_EL2.HPMD allows event counting to be disabled at EL2
- * two new required events, STALL_FRONTEND and STALL_BACKEND
- * ID register bits in ID_AA64DFR0_EL1 and ID_DFR0
-We already implement the 16-bit evtCount field and the
-HPMD bit, so all that is missing is the two new events:
-  STALL_FRONTEND
-   "counts every cycle counted by the CPU_CYCLES event on which no
-    operation was issued because there are no operations available
-    to issue to this PE from the frontend"
-  STALL_BACKEND
-   "counts every cycle counted by the CPU_CYCLES event on which no
-    operation was issued because the backend is unable to accept
-    any available operations from the frontend"
-QEMU never stalls in this sense, so our implementation is trivial:
-always return a zero count.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-14-peter.maydell@linaro.org
----
- target/arm/helper.c | 32 ++++++++++++++++++++++++++++++--
-file changed, 30 insertions(+), 2 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static int64_t instructions_ns_per(uint64_t icount)
- }
- #endif
-+static bool pmu_8_1_events_supported(CPUARMState *env)
-+{
-+    /* For events which are supported in any v8.1 PMU */
-+    return cpu_isar_feature(any_pmu_8_1, env_archcpu(env));
-+}
-+
-+static uint64_t zero_event_get_count(CPUARMState *env)
-+{
-+    /* For events which on QEMU never fire, so their count is always zero */
-+    return 0;
-+}
-+
-+static int64_t zero_event_ns_per(uint64_t cycles)
-+{
-+    /* An event which never fires can never overflow */
-+    return -1;
-+}
-+
- static const pm_event pm_events[] = {
-     { .number = 0x000, /* SW_INCR */
-       .supported = event_always_supported,
-@@ -XXX,XX +XXX,XX @@ static const pm_event pm_events[] = {
-       .supported = event_always_supported,
-       .get_count = cycles_get_count,
-       .ns_per_count = cycles_ns_per,
--    }
-+    },
- #endif
-+    { .number = 0x023, /* STALL_FRONTEND */
-+      .supported = pmu_8_1_events_supported,
-+      .get_count = zero_event_get_count,
-+      .ns_per_count = zero_event_ns_per,
-+    },
-+    { .number = 0x024, /* STALL_BACKEND */
-+      .supported = pmu_8_1_events_supported,
-+      .get_count = zero_event_get_count,
-+      .ns_per_count = zero_event_ns_per,
-+    },
- };
- /*
-@@ -XXX,XX +XXX,XX @@ static const pm_event pm_events[] = {
-  * should first be updated to something sparse instead of the current
-  * supported_event_map[] array.
-  */
--#define MAX_EVENT_ID 0x11
-+#define MAX_EVENT_ID 0x24
- #define UNSUPPORTED_EVENT UINT16_MAX
- static uint16_t supported_event_map[MAX_EVENT_ID + 1];
---
-.20.1

-[PULL 28/52] target/arm: Provide ARMv8.4-PMU in '-cpu max'
+Deleted patch
-Set the ID register bits to provide ARMv8.4-PMU (and implicitly
-also ARMv8.1-PMU) in the 'max' CPU.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-16-peter.maydell@linaro.org
----
- target/arm/cpu64.c | 8 ++++++++
-file changed, 8 insertions(+)
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
-+++ b/target/arm/cpu64.c
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
-         u = FIELD_DP32(u, ID_MMFR3, PAN, 2); /* ATS1E1 */
-         cpu->id_mmfr3 = u;
-+        u = cpu->isar.id_aa64dfr0;
-+        u = FIELD_DP64(u, ID_AA64DFR0, PMUVER, 5); /* v8.4-PMU */
-+        cpu->isar.id_aa64dfr0 = u;
-+
-+        u = cpu->isar.id_dfr0;
-+        u = FIELD_DP32(u, ID_DFR0, PERFMON, 5); /* v8.4-PMU */
-+        cpu->isar.id_dfr0 = u;
-+
-         /*
-          * FIXME: We do not yet support ARMv8.2-fp16 for AArch32 yet,
-          * so do not set MVFR1.FPHP.  Strictly speaking this is not legal,
---
-.20.1

-[PULL 29/52] target/arm: Correct definition of PMCRDP
+Deleted patch
-The PMCR_EL0.DP bit is bit 5, which is 0x20, not 0x10.  0x10 is 'X'.
-Correct our #define of PMCRDP and add the missing PMCRX.
-We do have the correct behaviour for handling the DP bit being
-set, so this fixes a guest-visible bug.
-Fixes: 033614c47de
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-17-peter.maydell@linaro.org
----
- target/arm/helper.c | 3 ++-
-file changed, 2 insertions(+), 1 deletion(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
- #define PMCRN_MASK  0xf800
- #define PMCRN_SHIFT 11
- #define PMCRLC  0x40
--#define PMCRDP  0x10
-+#define PMCRDP  0x20
-+#define PMCRX   0x10
- #define PMCRD   0x8
- #define PMCRC   0x4
- #define PMCRP   0x2
---
-.20.1

-[PULL 30/52] target/arm: Correct handling of PMCR_EL0.LC bit
+Deleted patch
-The LC bit in the PMCR_EL0 register is supposed to be:
- * read/write
- * RES1 on an AArch64-only implementation
- * an architecturally UNKNOWN value on reset
-(and use of LC==0 by software is deprecated).
-We were implementing it incorrectly as read-only always zero,
-though we do have all the code needed to test it and behave
-accordingly.
-Instead make it a read-write bit which resets to 1 always, which
-satisfies all the architectural requirements above.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200214175116.9164-18-peter.maydell@linaro.org
----
- target/arm/helper.c | 13 +++++++++----
-file changed, 9 insertions(+), 4 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
- #define PMCRC   0x4
- #define PMCRP   0x2
- #define PMCRE   0x1
-+/*
-+ * Mask of PMCR bits writeable by guest (not including WO bits like C, P,
-+ * which can be written as 1 to trigger behaviour but which stay RAZ).
-+ */
-+#define PMCR_WRITEABLE_MASK (PMCRLC | PMCRDP | PMCRX | PMCRD | PMCRE)
- #define PMXEVTYPER_P          0x80000000
- #define PMXEVTYPER_U          0x40000000
-@@ -XXX,XX +XXX,XX @@ static void pmcr_write(CPUARMState *env, const ARMCPRegInfo *ri,
-         }
-     }
--    /* only the DP, X, D and E bits are writable */
--    env->cp15.c9_pmcr &= ~0x39;
--    env->cp15.c9_pmcr |= (value & 0x39);
-+    env->cp15.c9_pmcr &= ~PMCR_WRITEABLE_MASK;
-+    env->cp15.c9_pmcr |= (value & PMCR_WRITEABLE_MASK);
-     pmu_op_finish(env);
- }
-@@ -XXX,XX +XXX,XX @@ static void define_pmu_regs(ARMCPU *cpu)
-         .access = PL0_RW, .accessfn = pmreg_access,
-         .type = ARM_CP_IO,
-         .fieldoffset = offsetof(CPUARMState, cp15.c9_pmcr),
--        .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT),
-+        .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT) |
-+                      PMCRLC,
-         .writefn = pmcr_write, .raw_writefn = raw_write,
-     };
-     define_one_arm_cp_reg(cpu, &pmcr);
---
-.20.1

-[PULL 32/52] target/arm: Use isar_feature function for testing AA32HPD feature
+Deleted patch
-Now we have moved ID_MMFR4 into the ARMISARegisters struct, we
-can define and use an isar_feature for the presence of the
-ARMv8.2-AA32HPD feature, rather than open-coding the test.
-While we're here, correct a comment typo which missed an 'A'
-from the feature name.
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-20-peter.maydell@linaro.org
----
- target/arm/cpu.h    | 5 +++++
- target/arm/helper.c | 4 ++--
-files changed, 7 insertions(+), 2 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_pmu_8_4(const ARMISARegisters *id)
-         FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) != 0xf;
- }
-+static inline bool isar_feature_aa32_hpd(const ARMISARegisters *id)
-+{
-+    return FIELD_EX32(id->id_mmfr4, ID_MMFR4, HPDS) != 0;
-+}
-+
- /*
-  * 64-bit feature tests via id registers.
-  */
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-     } else {
-         define_arm_cp_regs(cpu, vmsa_pmsa_cp_reginfo);
-         define_arm_cp_regs(cpu, vmsa_cp_reginfo);
--        /* TTCBR2 is introduced with ARMv8.2-A32HPD.  */
--        if (FIELD_EX32(cpu->isar.id_mmfr4, ID_MMFR4, HPDS) != 0) {
-+        /* TTCBR2 is introduced with ARMv8.2-AA32HPD.  */
-+        if (cpu_isar_feature(aa32_hpd, cpu)) {
-             define_one_arm_cp_reg(cpu, &ttbcr2_reginfo);
-         }
-     }
---
-.20.1

-[PULL 34/52] target/arm: Correctly implement ACTLR2, HACTLR2
+Deleted patch
-The ACTLR2 and HACTLR2 AArch32 system registers didn't exist in ARMv7
-or the original ARMv8.  They were later added as optional registers,
-whose presence is signaled by the ID_MMFR4.AC2 field.  From ARMv8.2
-they are mandatory (ie ID_MMFR4.AC2 must be non-zero).
-We implemented HACTLR2 in commit 0e0456ab8895a5e85, but we
-incorrectly made it exist for all v8 CPUs, and we didn't implement
-ACTLR2 at all.
-Sort this out by implementing both registers only when they are
-supposed to exist, and setting the ID_MMFR4 bit for -cpu max.
-Note that this removes HACTLR2 from our Cortex-A53, -A47 and -A72
-CPU models; this is correct, because those CPUs do not implement
-this register.
-Fixes: 0e0456ab8895a5e85
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200214175116.9164-22-peter.maydell@linaro.org
----
- target/arm/cpu.h    |  5 +++++
- target/arm/cpu.c    |  1 +
- target/arm/cpu64.c  |  4 ++++
- target/arm/helper.c | 32 +++++++++++++++++++++++---------
-files changed, 33 insertions(+), 9 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
-+++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_hpd(const ARMISARegisters *id)
-     return FIELD_EX32(id->id_mmfr4, ID_MMFR4, HPDS) != 0;
- }
-+static inline bool isar_feature_aa32_ac2(const ARMISARegisters *id)
-+{
-+    return FIELD_EX32(id->id_mmfr4, ID_MMFR4, AC2) != 0;
-+}
-+
- /*
-  * 64-bit feature tests via id registers.
-  */
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
-+++ b/target/arm/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
-             t = cpu->isar.id_mmfr4;
-             t = FIELD_DP32(t, ID_MMFR4, HPDS, 1); /* AA32HPD */
-+            t = FIELD_DP32(t, ID_MMFR4, AC2, 1); /* ACTLR2, HACTLR2 */
-             cpu->isar.id_mmfr4 = t;
-         }
- #endif
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
-+++ b/target/arm/cpu64.c
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
-         u = FIELD_DP32(u, ID_MMFR3, PAN, 2); /* ATS1E1 */
-         cpu->isar.id_mmfr3 = u;
-+        u = cpu->isar.id_mmfr4;
-+        u = FIELD_DP32(u, ID_MMFR4, AC2, 1); /* ACTLR2, HACTLR2 */
-+        cpu->isar.id_mmfr4 = u;
-+
-         u = cpu->isar.id_aa64dfr0;
-         u = FIELD_DP64(u, ID_AA64DFR0, PMUVER, 5); /* v8.4-PMU */
-         cpu->isar.id_aa64dfr0 = u;
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo ats1cp_reginfo[] = {
- };
- #endif
-+/*
-+ * ACTLR2 and HACTLR2 map to ACTLR_EL1[63:32] and
-+ * ACTLR_EL2[63:32]. They exist only if the ID_MMFR4.AC2 field
-+ * is non-zero, which is never for ARMv7, optionally in ARMv8
-+ * and mandatorily for ARMv8.2 and up.
-+ * ACTLR2 is banked for S and NS if EL3 is AArch32. Since QEMU's
-+ * implementation is RAZ/WI we can ignore this detail, as we
-+ * do for ACTLR.
-+ */
-+static const ARMCPRegInfo actlr2_hactlr2_reginfo[] = {
-+    { .name = "ACTLR2", .state = ARM_CP_STATE_AA32,
-+      .cp = 15, .opc1 = 0, .crn = 1, .crm = 0, .opc2 = 3,
-+      .access = PL1_RW, .type = ARM_CP_CONST,
-+      .resetvalue = 0 },
-+    { .name = "HACTLR2", .state = ARM_CP_STATE_AA32,
-+      .cp = 15, .opc1 = 4, .crn = 1, .crm = 0, .opc2 = 3,
-+      .access = PL2_RW, .type = ARM_CP_CONST,
-+      .resetvalue = 0 },
-+    REGINFO_SENTINEL
-+};
-+
- void register_cp_regs_for_features(ARMCPU *cpu)
- {
-     /* Register all the coprocessor registers based on feature bits */
-@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
-             REGINFO_SENTINEL
-         };
-         define_arm_cp_regs(cpu, auxcr_reginfo);
--        if (arm_feature(env, ARM_FEATURE_V8)) {
--            /* HACTLR2 maps to ACTLR_EL2[63:32] and is not in ARMv7 */
--            ARMCPRegInfo hactlr2_reginfo = {
--                .name = "HACTLR2", .state = ARM_CP_STATE_AA32,
--                .cp = 15, .opc1 = 4, .crn = 1, .crm = 0, .opc2 = 3,
--                .access = PL2_RW, .type = ARM_CP_CONST,
--                .resetvalue = 0
--            };
--            define_one_arm_cp_reg(cpu, &hactlr2_reginfo);
-+        if (cpu_isar_feature(aa32_ac2, cpu)) {
-+            define_arm_cp_regs(cpu, actlr2_hactlr2_reginfo);
-         }
-     }
---
-.20.1

-[PULL 40/52] target/arm: Convert PMULL.64 to gvec
+[PULL 32/35] target/arm: Generalize inl_qrdmlah_* helper functions
 From: Richard Henderson <richard.henderson@linaro.org>
-The gvec form will be needed for implementing SVE2.
+Unify add/sub helpers and add a parameter for rounding.
 This will allow saturating non-rounding to reuse this code.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200216214232.4230-4-richard.henderson@linaro.org
+[PMM: fixed accidental use of '=' rather than '+=' in do_sqrdmlah_s]
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20200815013145.539409-15-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  4 +---
+ target/arm/vec_helper.c | 80 +++++++++++++++--------------------------
- target/arm/neon_helper.c   | 30 ------------------------------
+file changed, 29 insertions(+), 51 deletions(-)
  target/arm/translate-a64.c | 28 +++-------------------------
  target/arm/translate.c     | 16 ++--------------
  target/arm/vec_helper.c    | 33 +++++++++++++++++++++++++++++++++
 files changed, 39 insertions(+), 72 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(crc32, TCG_CALL_NO_RWG_SE, i32, i32, i32, i32)
- DEF_HELPER_FLAGS_3(crc32c, TCG_CALL_NO_RWG_SE, i32, i32, i32, i32)
- DEF_HELPER_2(dc_zva, void, env, i64)
--DEF_HELPER_FLAGS_2(neon_pmull_64_lo, TCG_CALL_NO_RWG_SE, i64, i64, i64)
--DEF_HELPER_FLAGS_2(neon_pmull_64_hi, TCG_CALL_NO_RWG_SE, i64, i64, i64)
--
- DEF_HELPER_FLAGS_5(gvec_qrdmlah_s16, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_qrdmlsh_s16, TCG_CALL_NO_RWG,
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_ushl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_pmul_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- #ifdef TARGET_AARCH64
- #include "helper-a64.h"
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon_helper.c
-+++ b/target/arm/neon_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(neon_zip16)(void *vd, void *vm)
-     rm[0] = m0;
-     rd[0] = d0;
- }
--
--/* Helper function for 64 bit polynomial multiply case:
-- * perform PolynomialMult(op1, op2) and return either the top or
-- * bottom half of the 128 bit result.
-- */
--uint64_t HELPER(neon_pmull_64_lo)(uint64_t op1, uint64_t op2)
--{
--    int bitnum;
--    uint64_t res = 0;
--
--    for (bitnum = 0; bitnum < 64; bitnum++) {
--        if (op1 & (1ULL << bitnum)) {
--            res ^= op2 << bitnum;
--        }
--    }
--    return res;
--}
--uint64_t HELPER(neon_pmull_64_hi)(uint64_t op1, uint64_t op2)
--{
--    int bitnum;
--    uint64_t res = 0;
--
--    /* bit 0 of op1 can't influence the high 64 bits at all */
--    for (bitnum = 1; bitnum < 64; bitnum++) {
--        if (op1 & (1ULL << bitnum)) {
--            res ^= op2 >> (64 - bitnum);
--        }
--    }
--    return res;
--}
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_3rd_narrowing(DisasContext *s, int is_q, int is_u, int size,
-     clear_vec_high(s, is_q, rd);
- }
--static void handle_pmull_64(DisasContext *s, int is_q, int rd, int rn, int rm)
--{
--    /* PMULL of 64 x 64 -> 128 is an odd special case because it
--     * is the only three-reg-diff instruction which produces a
--     * 128-bit wide result from a single operation. However since
--     * it's possible to calculate the two halves more or less
--     * separately we just use two helper calls.
--     */
--    TCGv_i64 tcg_op1 = tcg_temp_new_i64();
--    TCGv_i64 tcg_op2 = tcg_temp_new_i64();
--    TCGv_i64 tcg_res = tcg_temp_new_i64();
--
--    read_vec_element(s, tcg_op1, rn, is_q, MO_64);
--    read_vec_element(s, tcg_op2, rm, is_q, MO_64);
--    gen_helper_neon_pmull_64_lo(tcg_res, tcg_op1, tcg_op2);
--    write_vec_element(s, tcg_res, rd, 0, MO_64);
--    gen_helper_neon_pmull_64_hi(tcg_res, tcg_op1, tcg_op2);
--    write_vec_element(s, tcg_res, rd, 1, MO_64);
--
--    tcg_temp_free_i64(tcg_op1);
--    tcg_temp_free_i64(tcg_op2);
--    tcg_temp_free_i64(tcg_res);
--}
--
- /* AdvSIMD three different
-  *   31  30  29 28       24 23  22  21 20  16 15    12 11 10 9    5 4    0
-  * +---+---+---+-----------+------+---+------+--------+-----+------+------+
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
-             if (!fp_access_check(s)) {
-                 return;
-             }
--            handle_pmull_64(s, is_q, rd, rn, rm);
-+            /* The Q field specifies lo/hi half input for this insn.  */
-+            gen_gvec_op3_ool(s, true, rd, rn, rm, is_q,
-+                             gen_helper_gvec_pmull_q);
-             return;
-         }
-         goto is_widening;
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                  * outside the loop below as it only performs a single pass.
-                  */
-                 if (op == 14 && size == 2) {
--                    TCGv_i64 tcg_rn, tcg_rm, tcg_rd;
--
-                     if (!dc_isar_feature(aa32_pmull, s)) {
-                         return 1;
-                     }
--                    tcg_rn = tcg_temp_new_i64();
--                    tcg_rm = tcg_temp_new_i64();
--                    tcg_rd = tcg_temp_new_i64();
--                    neon_load_reg64(tcg_rn, rn);
--                    neon_load_reg64(tcg_rm, rm);
--                    gen_helper_neon_pmull_64_lo(tcg_rd, tcg_rn, tcg_rm);
--                    neon_store_reg64(tcg_rd, rd);
--                    gen_helper_neon_pmull_64_hi(tcg_rd, tcg_rn, tcg_rm);
--                    neon_store_reg64(tcg_rd, rd + 1);
--                    tcg_temp_free_i64(tcg_rn);
--                    tcg_temp_free_i64(tcg_rm);
--                    tcg_temp_free_i64(tcg_rd);
-+                    tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
-+                                       0, gen_helper_gvec_pmull_q);
-                     return 0;
-                 }
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_pmul_b)(void *vd, void *vn, void *vm, uint32_t desc)
+@@ -XXX,XX +XXX,XX @@
  #endif
  /* Signed saturating rounding doubling multiply-accumulate high half, 16-bit */
 -static int16_t inl_qrdmlah_s16(int16_t src1, int16_t src2,
 -                               int16_t src3, uint32_t *sat)
 +static int16_t do_sqrdmlah_h(int16_t src1, int16_t src2, int16_t src3,
 +                             bool neg, bool round, uint32_t *sat)
  {
 -    /* Simplify:
 +    /*
 +     * Simplify:
       * = ((a3 << 16) + ((e1 * e2) << 1) + (1 << 15)) >> 16
       * = ((a3 << 15) + (e1 * e2) + (1 << 14)) >> 15
       */
      int32_t ret = (int32_t)src1 * src2;
 -    ret = ((int32_t)src3 << 15) + ret + (1 << 14);
 +    if (neg) {
 +        ret = -ret;
 +    }
 +    ret += ((int32_t)src3 << 15) + (round << 14);
      ret >>= 15;
 +
      if (ret != (int16_t)ret) {
          *sat = 1;
 -        ret = (ret < 0 ? -0x8000 : 0x7fff);
 +        ret = (ret < 0 ? INT16_MIN : INT16_MAX);
      }
      return ret;
  }
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(neon_qrdmlah_s16)(CPUARMState *env, uint32_t src1,
                                    uint32_t src2, uint32_t src3)
  {
      uint32_t *sat = &env->vfp.qc[0];
 -    uint16_t e1 = inl_qrdmlah_s16(src1, src2, src3, sat);
 -    uint16_t e2 = inl_qrdmlah_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
 +    uint16_t e1 = do_sqrdmlah_h(src1, src2, src3, false, true, sat);
 +    uint16_t e2 = do_sqrdmlah_h(src1 >> 16, src2 >> 16, src3 >> 16,
 +                                false, true, sat);
      return deposit32(e1, 16, 16, e2);
  }
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlah_s16)(void *vd, void *vn, void *vm,
      uintptr_t i;
      for (i = 0; i < opr_sz / 2; ++i) {
 -        d[i] = inl_qrdmlah_s16(n[i], m[i], d[i], vq);
 +        d[i] = do_sqrdmlah_h(n[i], m[i], d[i], false, true, vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
+-/* Signed saturating rounding doubling multiply-subtract high half, 16-bit */
+-static int16_t inl_qrdmlsh_s16(int16_t src1, int16_t src2,
+-                               int16_t src3, uint32_t *sat)
+-{
+-    /* Similarly, using subtraction:
+-     * = ((a3 << 16) - ((e1 * e2) << 1) + (1 << 15)) >> 16
+-     * = ((a3 << 15) - (e1 * e2) + (1 << 14)) >> 15
+-     */
+-    int32_t ret = (int32_t)src1 * src2;
+-    ret = ((int32_t)src3 << 15) - ret + (1 << 14);
+-    ret >>= 15;
+-    if (ret != (int16_t)ret) {
+-        *sat = 1;
+-        ret = (ret < 0 ? -0x8000 : 0x7fff);
+-    }
+-    return ret;
+-}
+-
+ uint32_t HELPER(neon_qrdmlsh_s16)(CPUARMState *env, uint32_t src1,
+                                   uint32_t src2, uint32_t src3)
+ {
+     uint32_t *sat = &env->vfp.qc[0];
+-    uint16_t e1 = inl_qrdmlsh_s16(src1, src2, src3, sat);
+-    uint16_t e2 = inl_qrdmlsh_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
++    uint16_t e1 = do_sqrdmlah_h(src1, src2, src3, true, true, sat);
++    uint16_t e2 = do_sqrdmlah_h(src1 >> 16, src2 >> 16, src3 >> 16,
++                                true, true, sat);
+     return deposit32(e1, 16, 16, e2);
+ }
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
+     uintptr_t i;
+     for (i = 0; i < opr_sz / 2; ++i) {
+-        d[i] = inl_qrdmlsh_s16(n[i], m[i], d[i], vq);
++        d[i] = do_sqrdmlah_h(n[i], m[i], d[i], true, true, vq);
+     }
+     clear_tail(d, opr_sz, simd_maxsz(desc));
+ }
+ /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
+-static int32_t inl_qrdmlah_s32(int32_t src1, int32_t src2,
+-                               int32_t src3, uint32_t *sat)
++static int32_t do_sqrdmlah_s(int32_t src1, int32_t src2, int32_t src3,
++                             bool neg, bool round, uint32_t *sat)
+ {
+     /* Simplify similarly to int_qrdmlah_s16 above.  */
+     int64_t ret = (int64_t)src1 * src2;
+-    ret = ((int64_t)src3 << 31) + ret + (1 << 30);
++    if (neg) {
++        ret = -ret;
++    }
++    ret += ((int64_t)src3 << 31) + (round << 30);
+     ret >>= 31;
 +
-+/*
+     if (ret != (int32_t)ret) {
-+ * 64x64->128 polynomial multiply.
+         *sat = 1;
-+ * Because of the lanes are not accessed in strict columns,
+         ret = (ret < 0 ? INT32_MIN : INT32_MAX);
-+ * this probably cannot be turned into a generic helper.
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
-+ */
+                                   int32_t src2, int32_t src3)
-+void HELPER(gvec_pmull_q)(void *vd, void *vn, void *vm, uint32_t desc)
+ {
-+{
+     uint32_t *sat = &env->vfp.qc[0];
-+    intptr_t i, j, opr_sz = simd_oprsz(desc);
+-    return inl_qrdmlah_s32(src1, src2, src3, sat);
-+    intptr_t hi = simd_data(desc);
++    return do_sqrdmlah_s(src1, src2, src3, false, true, sat);
-+    uint64_t *d = vd, *n = vn, *m = vm;
+ }
-+
-+    for (i = 0; i < opr_sz / 8; i += 2) {
+ void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
-+        uint64_t nn = n[i + hi];
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
-+        uint64_t mm = m[i + hi];
+     uintptr_t i;
-+        uint64_t rhi = 0;
-+        uint64_t rlo = 0;
+     for (i = 0; i < opr_sz / 4; ++i) {
-+
+-        d[i] = inl_qrdmlah_s32(n[i], m[i], d[i], vq);
-+        /* Bit 0 can only influence the low 64-bit result.  */
++        d[i] = do_sqrdmlah_s(n[i], m[i], d[i], false, true, vq);
-+        if (nn & 1) {
+     }
-+            rlo = mm;
+     clear_tail(d, opr_sz, simd_maxsz(desc));
-+        }
+ }
-+
-+        for (j = 1; j < 64; ++j) {
+-/* Signed saturating rounding doubling multiply-subtract high half, 32-bit */
-+            uint64_t mask = -((nn >> j) & 1);
+-static int32_t inl_qrdmlsh_s32(int32_t src1, int32_t src2,
-+            rlo ^= (mm << j) & mask;
+-                               int32_t src3, uint32_t *sat)
-+            rhi ^= (mm >> (64 - j)) & mask;
+-{
-+        }
+-    /* Simplify similarly to int_qrdmlsh_s16 above.  */
-+        d[i] = rlo;
+-    int64_t ret = (int64_t)src1 * src2;
-+        d[i + 1] = rhi;
+-    ret = ((int64_t)src3 << 31) - ret + (1 << 30);
-+    }
+-    ret >>= 31;
-+    clear_tail(d, opr_sz, simd_maxsz(desc));
+-    if (ret != (int32_t)ret) {
-+}
+-        *sat = 1;
 -        ret = (ret < 0 ? INT32_MIN : INT32_MAX);
 -    }
 -    return ret;
 -}
 -
  uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
                                    int32_t src2, int32_t src3)
  {
      uint32_t *sat = &env->vfp.qc[0];
 -    return inl_qrdmlsh_s32(src1, src2, src3, sat);
 +    return do_sqrdmlah_s(src1, src2, src3, true, true, sat);
  }
  void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
      uintptr_t i;
      for (i = 0; i < opr_sz / 4; ++i) {
 -        d[i] = inl_qrdmlsh_s32(n[i], m[i], d[i], vq);
 +        d[i] = do_sqrdmlah_s(n[i], m[i], d[i], true, true, vq);
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
 --
 .20.1

-[PULL 39/52] target/arm: Convert PMUL.8 to gvec
+[PULL 33/35] target/arm: Convert integer multiply (indexed) to gvec for aa64 advsimd
 From: Richard Henderson <richard.henderson@linaro.org>
-The gvec form will be needed for implementing SVE2.
-Extend the implementation to operate on uint64_t instead of uint32_t.
-Use a counted inner loop instead of terminating when op1 goes to zero,
-looking toward the required implementation for ARMv8.4-DIT.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200216214232.4230-3-richard.henderson@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20200815013145.539409-19-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  3 ++-
+ target/arm/helper.h        |  4 ++++
- target/arm/neon_helper.c   | 22 ----------------------
+ target/arm/translate-a64.c | 16 ++++++++++++++++
- target/arm/translate-a64.c | 10 +++-------
+ target/arm/vec_helper.c    | 29 +++++++++++++++++++++++++----
- target/arm/translate.c     | 11 ++++-------
+files changed, 45 insertions(+), 4 deletions(-)
  target/arm/vec_helper.c    | 30 ++++++++++++++++++++++++++++++
 files changed, 39 insertions(+), 37 deletions(-)
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.h
 +++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_sub_u8, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_uaba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_sub_u16, i32, i32, i32)
+ DEF_HELPER_FLAGS_4(gvec_uaba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_mul_u8, i32, i32, i32)
+ DEF_HELPER_FLAGS_4(gvec_uaba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_mul_u16, i32, i32, i32)
--DEF_HELPER_2(neon_mul_p8, i32, i32, i32)
++DEF_HELPER_FLAGS_4(gvec_mul_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_mull_p8, i64, i32, i32)
++DEF_HELPER_FLAGS_4(gvec_mul_idx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_4(gvec_mul_idx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_2(neon_tst_u8, i32, i32, i32)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_sshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_ushl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_pmul_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon_helper.c
-+++ b/target/arm/neon_helper.c
-@@ -XXX,XX +XXX,XX @@ NEON_VOP(mul_u16, neon_u16, 2)
- /* Polynomial multiplication is like integer multiplication except the
-    partial products are XORed, not added.  */
--uint32_t HELPER(neon_mul_p8)(uint32_t op1, uint32_t op2)
--{
--    uint32_t mask;
--    uint32_t result;
--    result = 0;
--    while (op1) {
--        mask = 0;
--        if (op1 & 1)
--            mask |= 0xff;
--        if (op1 & (1 << 8))
--            mask |= (0xff << 8);
--        if (op1 & (1 << 16))
--            mask |= (0xff << 16);
--        if (op1 & (1 << 24))
--            mask |= (0xff << 24);
--        result ^= op2 & mask;
--        op1 = (op1 >> 1) & 0x7f7f7f7f;
--        op2 = (op2 << 1) & 0xfefefefe;
--    }
--    return result;
--}
--
- uint64_t HELPER(neon_mull_p8)(uint32_t op1, uint32_t op2)
- {
-     uint64_t result = 0;
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
-     case 0x13: /* MUL, PMUL */
+                                data, gen_helper_gvec_fmlal_idx_a64);
          if (!u) { /* MUL */
              gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_mul, size);
 -            return;
 +        } else {  /* PMUL */
 +            gen_gvec_op3_ool(s, is_q, rd, rn, rm, 0, gen_helper_gvec_pmul_b);
          }
--        break;
+         return;
-+        return;
++
-     case 0x12: /* MLA, MLS */
++    case 0x08: /* MUL */
-         if (u) {
++        if (!is_long && !is_scalar) {
-             gen_gvec_op3(s, is_q, rd, rn, rm, &mls_op[size]);
++            static gen_helper_gvec_3 * const fns[3] = {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
++                gen_helper_gvec_mul_idx_h,
-                 genfn = fns[size][u];
++                gen_helper_gvec_mul_idx_s,
-                 break;
++                gen_helper_gvec_mul_idx_d,
-             }
++            };
--            case 0x13: /* MUL, PMUL */
++            tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
--                assert(u); /* PMUL */
++                               vec_full_reg_offset(s, rn),
--                assert(size == 0);
++                               vec_full_reg_offset(s, rm),
--                genfn = gen_helper_neon_mul_p8;
++                               is_q ? 16 : 8, vec_full_reg_size(s),
--                break;
++                               index, fns[size - 1]);
-             case 0x16: /* SQDMULH, SQRDMULH */
++            return;
-             {
++        }
-                 static NeonGenTwoOpEnvFn * const fns[2][2] = {
++        break;
-diff --git a/target/arm/translate.c b/target/arm/translate.c
+     }
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
+     if (size == 3) {
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
          case NEON_3R_VMUL: /* VMUL */
              if (u) {
 -                /* Polynomial case allows only P8 and is handled below.  */
 +                /* Polynomial case allows only P8.  */
                  if (size != 0) {
                      return 1;
                  }
 +                tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, vec_size, vec_size,
 +                                   0, gen_helper_gvec_pmul_b);
              } else {
                  tcg_gen_gvec_mul(size, rd_ofs, rn_ofs, rm_ofs,
                                   vec_size, vec_size);
 -                return 0;
              }
 -            break;
 +            return 0;
          case NEON_3R_VML: /* VMLA, VMLS */
              tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, vec_size, vec_size,
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
              tmp2 = neon_load_reg(rd, pass);
              gen_neon_add(size, tmp, tmp2);
              break;
 -        case NEON_3R_VMUL:
 -            /* VMUL.P8; other cases already eliminated.  */
 -            gen_helper_neon_mul_p8(tmp, tmp, tmp2);
 -            break;
          case NEON_3R_VPMAX:
              GEN_NEON_INTEGER_OP(pmax);
              break;
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_ushl_h)(void *vd, void *vn, void *vm, uint32_t desc)
+@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_rsqrts_d, helper_rsqrtsf_f64, float64)
-     }
+  */
-     clear_tail(d, opr_sz, simd_maxsz(desc));
  #define DO_MUL_IDX(NAME, TYPE, H) \
 +void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc) \
 +{                                                                          \
 +    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
 +    intptr_t idx = simd_data(desc);                                        \
 +    TYPE *d = vd, *n = vn, *m = vm;                                        \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
 +        TYPE mm = m[H(i + idx)];                                           \
 +        for (j = 0; j < segment; j++) {                                    \
 +            d[i + j] = n[i + j] * mm;                                      \
 +        }                                                                  \
 +    }                                                                      \
 +    clear_tail(d, oprsz, simd_maxsz(desc));                                \
 +}
 +
 +DO_MUL_IDX(gvec_mul_idx_h, uint16_t, H2)
 +DO_MUL_IDX(gvec_mul_idx_s, uint32_t, H4)
 +DO_MUL_IDX(gvec_mul_idx_d, uint64_t, )
 +
 +#undef DO_MUL_IDX
 +
 +#define DO_FMUL_IDX(NAME, TYPE, H) \
  void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
  {                                                                          \
      intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
      clear_tail(d, oprsz, simd_maxsz(desc));                                \
  }
-+
-+/*
+-DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
-+ * 8x8->8 polynomial multiply.
+-DO_MUL_IDX(gvec_fmul_idx_s, float32, H4)
-+ *
+-DO_MUL_IDX(gvec_fmul_idx_d, float64, )
-+ * Polynomial multiplication is like integer multiplication except the
++DO_FMUL_IDX(gvec_fmul_idx_h, float16, H2)
-+ * partial products are XORed, not added.
++DO_FMUL_IDX(gvec_fmul_idx_s, float32, H4)
-+ *
++DO_FMUL_IDX(gvec_fmul_idx_d, float64, )
-+ * TODO: expose this as a generic vector operation, as it is a common
-+ * crypto building block.
+-#undef DO_MUL_IDX
-+ */
++#undef DO_FMUL_IDX
-+void HELPER(gvec_pmul_b)(void *vd, void *vn, void *vm, uint32_t desc)
-+{
+ #define DO_FMLA_IDX(NAME, TYPE, H)                                         \
-+    intptr_t i, j, opr_sz = simd_oprsz(desc);
+ void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
 +    uint64_t *d = vd, *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz / 8; ++i) {
 +        uint64_t nn = n[i];
 +        uint64_t mm = m[i];
 +        uint64_t rr = 0;
 +
 +        for (j = 0; j < 8; ++j) {
 +            uint64_t mask = (nn & 0x0101010101010101ull) * 0xff;
 +            rr ^= mm & mask;
 +            mm = (mm << 1) & 0xfefefefefefefefeull;
 +            nn >>= 1;
 +        }
 +        d[i] = rr;
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 --
 .20.1

-[PULL 41/52] target/arm: Convert PMULL.8 to gvec
+[PULL 34/35] target/arm: Convert integer multiply-add (indexed) to gvec for aa64 advsimd
 From: Richard Henderson <richard.henderson@linaro.org>
-We still need two different helpers, since NEON and SVE2 get the
-inputs from different locations within the source vector.  However,
-we can convert both to the same internal form for computation.
-The sve2 helper is not used yet, but adding it with this patch
-helps illustrate why the neon changes are helpful.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200216214232.4230-5-richard.henderson@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20200815013145.539409-20-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    |  2 ++
+ target/arm/helper.h        | 14 ++++++++++++++
- target/arm/helper.h        |  3 +-
+ target/arm/translate-a64.c | 34 ++++++++++++++++++++++++++++++++++
- target/arm/neon_helper.c   | 32 --------------------
+ target/arm/vec_helper.c    | 25 +++++++++++++++++++++++++
- target/arm/translate-a64.c | 27 +++++++++++------
+files changed, 73 insertions(+)
  target/arm/translate.c     | 26 ++++++++---------
  target/arm/vec_helper.c    | 60 ++++++++++++++++++++++++++++++++++++++
 files changed, 95 insertions(+), 55 deletions(-)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(sve_stdd_le_zd, TCG_CALL_NO_WG,
-                    void, env, ptr, ptr, ptr, tl, i32)
- DEF_HELPER_FLAGS_6(sve_stdd_be_zd, TCG_CALL_NO_WG,
-                    void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve2_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.h
 +++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_sub_u8, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_mul_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_sub_u16, i32, i32, i32)
+ DEF_HELPER_FLAGS_4(gvec_mul_idx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_mul_u8, i32, i32, i32)
+ DEF_HELPER_FLAGS_4(gvec_mul_idx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_mul_u16, i32, i32, i32)
--DEF_HELPER_2(neon_mull_p8, i64, i32, i32)
++DEF_HELPER_FLAGS_5(gvec_mla_idx_h, TCG_CALL_NO_RWG,
++                   void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_tst_u8, i32, i32, i32)
++DEF_HELPER_FLAGS_5(gvec_mla_idx_s, TCG_CALL_NO_RWG,
- DEF_HELPER_2(neon_tst_u16, i32, i32, i32)
++                   void, ptr, ptr, ptr, ptr, i32)
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_FLAGS_5(gvec_mla_idx_d, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_4(gvec_pmul_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++
++DEF_HELPER_FLAGS_5(gvec_mls_idx_h, TCG_CALL_NO_RWG,
-+DEF_HELPER_FLAGS_4(neon_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(gvec_mls_idx_s, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(gvec_mls_idx_d, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon_helper.c
-+++ b/target/arm/neon_helper.c
-@@ -XXX,XX +XXX,XX @@ NEON_VOP(mul_u8, neon_u8, 4)
- NEON_VOP(mul_u16, neon_u16, 2)
- #undef NEON_FN
--/* Polynomial multiplication is like integer multiplication except the
--   partial products are XORed, not added.  */
--uint64_t HELPER(neon_mull_p8)(uint32_t op1, uint32_t op2)
--{
--    uint64_t result = 0;
--    uint64_t mask;
--    uint64_t op2ex = op2;
--    op2ex = (op2ex & 0xff) |
--        ((op2ex & 0xff00) << 8) |
--        ((op2ex & 0xff0000) << 16) |
--        ((op2ex & 0xff000000) << 24);
--    while (op1) {
--        mask = 0;
--        if (op1 & 1) {
--            mask |= 0xffff;
--        }
--        if (op1 & (1 << 8)) {
--            mask |= (0xffffU << 16);
--        }
--        if (op1 & (1 << 16)) {
--            mask |= (0xffffULL << 32);
--        }
--        if (op1 & (1 << 24)) {
--            mask |= (0xffffULL << 48);
--        }
--        result ^= op2ex & mask;
--        op1 = (op1 >> 1) & 0x7f7f7f7f;
--        op2ex <<= 1;
--    }
--    return result;
--}
--
- #define NEON_FN(dest, src1, src2) dest = (src1 & src2) ? -1 : 0
- NEON_VOP(tst_u8, neon_u8, 4)
- NEON_VOP(tst_u16, neon_u16, 2)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_3rd_widening(DisasContext *s, int is_q, int is_u, int size,
+@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
                  gen_helper_neon_addl_saturate_s32(tcg_passres, cpu_env,
                                                    tcg_passres, tcg_passres);
                  break;
 -            case 14: /* PMULL */
 -                assert(size == 0);
 -                gen_helper_neon_mull_p8(tcg_passres, tcg_op1, tcg_op2);
 -                break;
              default:
                  g_assert_not_reached();
              }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
          handle_3rd_narrowing(s, is_q, is_u, size, opcode, rd, rn, rm);
          break;
      case 14: /* PMULL, PMULL2 */
 -        if (is_u || size == 1 || size == 2) {
 +        if (is_u) {
              unallocated_encoding(s);
              return;
          }
--        if (size == 3) {
+         break;
 +        switch (size) {
 +        case 0: /* PMULL.P8 */
 +            if (!fp_access_check(s)) {
 +                return;
 +            }
 +            /* The Q field specifies lo/hi half input for this insn.  */
 +            gen_gvec_op3_ool(s, true, rd, rn, rm, is_q,
 +                             gen_helper_neon_pmull_h);
 +            break;
 +
-+        case 3: /* PMULL.P64 */
++    case 0x10: /* MLA */
-             if (!dc_isar_feature(aa64_pmull, s)) {
++        if (!is_long && !is_scalar) {
-                 unallocated_encoding(s);
++            static gen_helper_gvec_4 * const fns[3] = {
-                 return;
++                gen_helper_gvec_mla_idx_h,
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
++                gen_helper_gvec_mla_idx_s,
-             /* The Q field specifies lo/hi half input for this insn.  */
++                gen_helper_gvec_mla_idx_d,
-             gen_gvec_op3_ool(s, true, rd, rn, rm, is_q,
++            };
-                              gen_helper_gvec_pmull_q);
++            tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
--            return;
++                               vec_full_reg_offset(s, rn),
-+            break;
++                               vec_full_reg_offset(s, rm),
 +                               vec_full_reg_offset(s, rd),
 +                               is_q ? 16 : 8, vec_full_reg_size(s),
 +                               index, fns[size - 1]);
 +            return;
 +        }
 +        break;
 +
-+        default:
++    case 0x14: /* MLS */
-+            unallocated_encoding(s);
++        if (!is_long && !is_scalar) {
-+            break;
++            static gen_helper_gvec_4 * const fns[3] = {
-         }
++                gen_helper_gvec_mls_idx_h,
--        goto is_widening;
++                gen_helper_gvec_mls_idx_s,
-+        return;
++                gen_helper_gvec_mls_idx_d,
-     case 9: /* SQDMLAL, SQDMLAL2 */
++            };
-     case 11: /* SQDMLSL, SQDMLSL2 */
++            tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
-     case 13: /* SQDMULL, SQDMULL2 */
++                               vec_full_reg_offset(s, rn),
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
++                               vec_full_reg_offset(s, rm),
-             unallocated_encoding(s);
++                               vec_full_reg_offset(s, rd),
-             return;
++                               is_q ? 16 : 8, vec_full_reg_size(s),
-         }
++                               index, fns[size - 1]);
--    is_widening:
++            return;
-         if (!fp_access_check(s)) {
++        }
-             return;
++        break;
-         }
+     }
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
+     if (size == 3) {
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                      return 1;
                  }
 -                /* Handle VMULL.P64 (Polynomial 64x64 to 128 bit multiply)
 -                 * outside the loop below as it only performs a single pass.
 -                 */
 -                if (op == 14 && size == 2) {
 -                    if (!dc_isar_feature(aa32_pmull, s)) {
 -                        return 1;
 +                /* Handle polynomial VMULL in a single pass.  */
 +                if (op == 14) {
 +                    if (size == 0) {
 +                        /* VMULL.P8 */
 +                        tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
 +                                           0, gen_helper_neon_pmull_h);
 +                    } else {
 +                        /* VMULL.P64 */
 +                        if (!dc_isar_feature(aa32_pmull, s)) {
 +                            return 1;
 +                        }
 +                        tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
 +                                           0, gen_helper_gvec_pmull_q);
                      }
 -                    tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
 -                                       0, gen_helper_gvec_pmull_q);
                      return 0;
                  }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                          /* VMLAL, VQDMLAL, VMLSL, VQDMLSL, VMULL, VQDMULL */
                          gen_neon_mull(cpu_V0, tmp, tmp2, size, u);
                          break;
 -                    case 14: /* Polynomial VMULL */
 -                        gen_helper_neon_mull_p8(cpu_V0, tmp, tmp2);
 -                        tcg_temp_free_i32(tmp2);
 -                        tcg_temp_free_i32(tmp);
 -                        break;
                      default: /* 15 is RESERVED: caught earlier  */
                          abort();
                      }
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_pmull_q)(void *vd, void *vn, void *vm, uint32_t desc)
+@@ -XXX,XX +XXX,XX @@ DO_MUL_IDX(gvec_mul_idx_d, uint64_t, )
-     }
-     clear_tail(d, opr_sz, simd_maxsz(desc));
+ #undef DO_MUL_IDX
- }
-+
++#define DO_MLA_IDX(NAME, TYPE, OP, H) \
-+/*
++void HELPER(NAME)(void *vd, void *vn, void *vm, void *va, uint32_t desc)   \
-+ * 8x8->16 polynomial multiply.
++{                                                                          \
-+ *
++    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
-+ * The byte inputs are expanded to (or extracted from) half-words.
++    intptr_t idx = simd_data(desc);                                        \
-+ * Note that neon and sve2 get the inputs from different positions.
++    TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
-+ * This allows 4 bytes to be processed in parallel with uint64_t.
++    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
-+ */
++        TYPE mm = m[H(i + idx)];                                           \
-+
++        for (j = 0; j < segment; j++) {                                    \
-+static uint64_t expand_byte_to_half(uint64_t x)
++            d[i + j] = a[i + j] OP n[i + j] * mm;                          \
-+{
++        }                                                                  \
-+    return  (x & 0x000000ff)
++    }                                                                      \
-+         | ((x & 0x0000ff00) << 8)
++    clear_tail(d, oprsz, simd_maxsz(desc));                                \
 +         | ((x & 0x00ff0000) << 16)
 +         | ((x & 0xff000000) << 24);
 +}
 +
-+static uint64_t pmull_h(uint64_t op1, uint64_t op2)
++DO_MLA_IDX(gvec_mla_idx_h, uint16_t, +, H2)
-+{
++DO_MLA_IDX(gvec_mla_idx_s, uint32_t, +, H4)
-+    uint64_t result = 0;
++DO_MLA_IDX(gvec_mla_idx_d, uint64_t, +,   )
 +    int i;
 +
-+    for (i = 0; i < 8; ++i) {
++DO_MLA_IDX(gvec_mls_idx_h, uint16_t, -, H2)
-+        uint64_t mask = (op1 & 0x0001000100010001ull) * 0xffff;
++DO_MLA_IDX(gvec_mls_idx_s, uint32_t, -, H4)
-+        result ^= op2 & mask;
++DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -,   )
 +        op1 >>= 1;
 +        op2 <<= 1;
 +    }
 +    return result;
 +}
 +
-+void HELPER(neon_pmull_h)(void *vd, void *vn, void *vm, uint32_t desc)
++#undef DO_MLA_IDX
 +{
 +    int hi = simd_data(desc);
 +    uint64_t *d = vd, *n = vn, *m = vm;
 +    uint64_t nn = n[hi], mm = m[hi];
 +
-+    d[0] = pmull_h(expand_byte_to_half(nn), expand_byte_to_half(mm));
+ #define DO_FMUL_IDX(NAME, TYPE, H) \
-+    nn >>= 32;
+ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
-+    mm >>= 32;
+ {                                                                          \
 +    d[1] = pmull_h(expand_byte_to_half(nn), expand_byte_to_half(mm));
 +
 +    clear_tail(d, 16, simd_maxsz(desc));
 +}
 +
 +#ifdef TARGET_AARCH64
 +void HELPER(sve2_pmull_h)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    int shift = simd_data(desc) * 8;
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    uint64_t *d = vd, *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz / 8; ++i) {
 +        uint64_t nn = (n[i] >> shift) & 0x00ff00ff00ff00ffull;
 +        uint64_t mm = (m[i] >> shift) & 0x00ff00ff00ff00ffull;
 +
 +        d[i] = pmull_h(nn, mm);
 +    }
 +}
 +#endif
 --
 .20.1

-[PULL 38/52] target/arm: Vectorize USHL and SSHL
+[PULL 35/35] target/arm: Convert sq{, r}dmulh to gvec for aa64 advsimd
 From: Richard Henderson <richard.henderson@linaro.org>
-These instructions shift left or right depending on the sign
-of the input, and 7 bits are significant to the shift.  This
-requires several masks and selects in addition to the actual
-shifts to form the complete answer.
-That said, the operation is still a small improvement even for
-two 64-bit elements -- 13 vector operations instead of 2 * 7
-integer operations.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200216214232.4230-2-richard.henderson@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20200815013145.539409-21-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  11 +-
+ target/arm/helper.h        | 10 ++++++++
- target/arm/translate.h     |   6 +
+ target/arm/translate-a64.c | 33 ++++++++++++++++++--------
- target/arm/neon_helper.c   |  33 ----
+ target/arm/vec_helper.c    | 48 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-a64.c |  18 +--
+files changed, 81 insertions(+), 10 deletions(-)
  target/arm/translate.c     | 299 +++++++++++++++++++++++++++++++++++--
  target/arm/vec_helper.c    |  88 +++++++++++
 files changed, 389 insertions(+), 66 deletions(-)
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.h
 +++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_abd_s16, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_mls_idx_s, TCG_CALL_NO_RWG,
- DEF_HELPER_2(neon_abd_u32, i32, i32, i32)
+ DEF_HELPER_FLAGS_5(gvec_mls_idx_d, TCG_CALL_NO_RWG,
- DEF_HELPER_2(neon_abd_s32, i32, i32, i32)
+                    void, ptr, ptr, ptr, ptr, i32)
--DEF_HELPER_2(neon_shl_u8, i32, i32, i32)
++DEF_HELPER_FLAGS_5(neon_sqdmulh_h, TCG_CALL_NO_RWG,
--DEF_HELPER_2(neon_shl_s8, i32, i32, i32)
++                   void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_2(neon_shl_u16, i32, i32, i32)
++DEF_HELPER_FLAGS_5(neon_sqdmulh_s, TCG_CALL_NO_RWG,
- DEF_HELPER_2(neon_shl_s16, i32, i32, i32)
++                   void, ptr, ptr, ptr, ptr, i32)
--DEF_HELPER_2(neon_shl_u32, i32, i32, i32)
++
--DEF_HELPER_2(neon_shl_s32, i32, i32, i32)
++DEF_HELPER_FLAGS_5(neon_sqrdmulh_h, TCG_CALL_NO_RWG,
--DEF_HELPER_2(neon_shl_u64, i64, i64, i64)
++                   void, ptr, ptr, ptr, ptr, i32)
--DEF_HELPER_2(neon_shl_s64, i64, i64, i64)
++DEF_HELPER_FLAGS_5(neon_sqrdmulh_s, TCG_CALL_NO_RWG,
- DEF_HELPER_2(neon_rshl_u8, i32, i32, i32)
++                   void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_2(neon_rshl_s8, i32, i32, i32)
  DEF_HELPER_2(neon_rshl_u16, i32, i32, i32)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(frint64_s, TCG_CALL_NO_RWG, f32, f32, ptr)
  DEF_HELPER_FLAGS_2(frint32_d, TCG_CALL_NO_RWG, f64, f64, ptr)
  DEF_HELPER_FLAGS_2(frint64_d, TCG_CALL_NO_RWG, f64, f64, ptr)
 +DEF_HELPER_FLAGS_4(gvec_sshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_ushl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
-diff --git a/target/arm/translate.h b/target/arm/translate.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.h
-+++ b/target/arm/translate.h
-@@ -XXX,XX +XXX,XX @@ uint64_t vfp_expand_imm(int size, uint8_t imm8);
- extern const GVecGen3 mla_op[4];
- extern const GVecGen3 mls_op[4];
- extern const GVecGen3 cmtst_op[4];
-+extern const GVecGen3 sshl_op[4];
-+extern const GVecGen3 ushl_op[4];
- extern const GVecGen2i ssra_op[4];
- extern const GVecGen2i usra_op[4];
- extern const GVecGen2i sri_op[4];
-@@ -XXX,XX +XXX,XX @@ extern const GVecGen4 sqadd_op[4];
- extern const GVecGen4 uqsub_op[4];
- extern const GVecGen4 sqsub_op[4];
- void gen_cmtst_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_ushl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
-+void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
-+void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
-+void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
- /*
-  * Forward to the isar_feature_* tests given a DisasContext pointer.
-diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/neon_helper.c
-+++ b/target/arm/neon_helper.c
-@@ -XXX,XX +XXX,XX @@ NEON_VOP(abd_u32, neon_u32, 1)
-     } else { \
-         dest = src1 << tmp; \
-     }} while (0)
--NEON_VOP(shl_u8, neon_u8, 4)
- NEON_VOP(shl_u16, neon_u16, 2)
--NEON_VOP(shl_u32, neon_u32, 1)
- #undef NEON_FN
--uint64_t HELPER(neon_shl_u64)(uint64_t val, uint64_t shiftop)
--{
--    int8_t shift = (int8_t)shiftop;
--    if (shift >= 64 || shift <= -64) {
--        val = 0;
--    } else if (shift < 0) {
--        val >>= -shift;
--    } else {
--        val <<= shift;
--    }
--    return val;
--}
--
- #define NEON_FN(dest, src1, src2) do { \
-     int8_t tmp; \
-     tmp = (int8_t)src2; \
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_shl_u64)(uint64_t val, uint64_t shiftop)
-     } else { \
-         dest = src1 << tmp; \
-     }} while (0)
--NEON_VOP(shl_s8, neon_s8, 4)
- NEON_VOP(shl_s16, neon_s16, 2)
--NEON_VOP(shl_s32, neon_s32, 1)
- #undef NEON_FN
--uint64_t HELPER(neon_shl_s64)(uint64_t valop, uint64_t shiftop)
--{
--    int8_t shift = (int8_t)shiftop;
--    int64_t val = valop;
--    if (shift >= 64) {
--        val = 0;
--    } else if (shift <= -64) {
--        val >>= 63;
--    } else if (shift < 0) {
--        val >>= -shift;
--    } else {
--        val <<= shift;
--    }
--    return val;
--}
--
- #define NEON_FN(dest, src1, src2) do { \
-     int8_t tmp; \
-     tmp = (int8_t)src2; \
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_3same_64(DisasContext *s, int opcode, bool u,
+@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3_fpst(DisasContext *s, bool is_q, int rd, int rn,
-         break;
+     tcg_temp_free_ptr(fpst);
-     case 0x8: /* SSHL, USHL */
+ }
-         if (u) {
--            gen_helper_neon_shl_u64(tcg_rd, tcg_rn, tcg_rm);
++/* Expand a 3-operand + qc + operation using an out-of-line helper.  */
-+            gen_ushl_i64(tcg_rd, tcg_rn, tcg_rm);
++static void gen_gvec_op3_qc(DisasContext *s, bool is_q, int rd, int rn,
-         } else {
++                            int rm, gen_helper_gvec_3_ptr *fn)
--            gen_helper_neon_shl_s64(tcg_rd, tcg_rn, tcg_rm);
++{
-+            gen_sshl_i64(tcg_rd, tcg_rn, tcg_rm);
++    TCGv_ptr qc_ptr = tcg_temp_new_ptr();
 +
 +    tcg_gen_addi_ptr(qc_ptr, cpu_env, offsetof(CPUARMState, vfp.qc));
 +    tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
 +                       vec_full_reg_offset(s, rn),
 +                       vec_full_reg_offset(s, rm), qc_ptr,
 +                       is_q ? 16 : 8, vec_full_reg_size(s), 0, fn);
 +    tcg_temp_free_ptr(qc_ptr);
 +}
 +
  /* Set ZF and NF based on a 64 bit result. This is alas fiddlier
   * than the 32 bit equivalent.
   */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
              gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mla, size);
          }
-         break;
+         return;
-     case 0x9: /* SQSHL, UQSHL */
++    case 0x16: /* SQDMULH, SQRDMULH */
 +        {
 +            static gen_helper_gvec_3_ptr * const fns[2][2] = {
 +                { gen_helper_neon_sqdmulh_h, gen_helper_neon_sqrdmulh_h },
 +                { gen_helper_neon_sqdmulh_s, gen_helper_neon_sqrdmulh_s },
 +            };
 +            gen_gvec_op3_qc(s, is_q, rd, rn, rm, fns[size - 1][u]);
 +        }
 +        return;
      case 0x11:
          if (!u) { /* CMTST */
              gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_cmtst, size);
 @@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
-                        is_q ? 16 : 8, vec_full_reg_size(s),
+                 genenvfn = fns[size][u];
                         (u ? uqsub_op : sqsub_op) + size);
          return;
 +    case 0x08: /* SSHL, USHL */
 +        gen_gvec_op3(s, is_q, rd, rn, rm,
 +                     u ? &ushl_op[size] : &sshl_op[size]);
 +        return;
      case 0x0c: /* SMAX, UMAX */
          if (u) {
              gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_umax, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                  genfn = fns[size][u];
                  break;
              }
--            case 0x8: /* SSHL, USHL */
+-            case 0x16: /* SQDMULH, SQRDMULH */
 -            {
--                static NeonGenTwoOpFn * const fns[3][2] = {
+-                static NeonGenTwoOpEnvFn * const fns[2][2] = {
--                    { gen_helper_neon_shl_s8, gen_helper_neon_shl_u8 },
+-                    { gen_helper_neon_qdmulh_s16, gen_helper_neon_qrdmulh_s16 },
--                    { gen_helper_neon_shl_s16, gen_helper_neon_shl_u16 },
+-                    { gen_helper_neon_qdmulh_s32, gen_helper_neon_qrdmulh_s32 },
 -                    { gen_helper_neon_shl_s32, gen_helper_neon_shl_u32 },
 -                };
--                genfn = fns[size][u];
+-                assert(size == 1 || size == 2);
 -                genenvfn = fns[size - 1][u];
 -                break;
 -            }
-             case 0x9: /* SQSHL, UQSHL */
+             default:
-             {
+                 g_assert_not_reached();
                  static NeonGenTwoOpEnvFn * const fns[3][2] = {
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline void gen_neon_shift_narrow(int size, TCGv_i32 var, TCGv_i32 shift,
          if (u) {
              switch (size) {
              case 1: gen_helper_neon_shl_u16(var, var, shift); break;
 -            case 2: gen_helper_neon_shl_u32(var, var, shift); break;
 +            case 2: gen_ushl_i32(var, var, shift); break;
              default: abort();
              }
-         } else {
-             switch (size) {
-             case 1: gen_helper_neon_shl_s16(var, var, shift); break;
--            case 2: gen_helper_neon_shl_s32(var, var, shift); break;
-+            case 2: gen_sshl_i32(var, var, shift); break;
-             default: abort();
-             }
-         }
-@@ -XXX,XX +XXX,XX @@ const GVecGen3 cmtst_op[4] = {
-       .vece = MO_64 },
- };
-+void gen_ushl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
-+{
-+    TCGv_i32 lval = tcg_temp_new_i32();
-+    TCGv_i32 rval = tcg_temp_new_i32();
-+    TCGv_i32 lsh = tcg_temp_new_i32();
-+    TCGv_i32 rsh = tcg_temp_new_i32();
-+    TCGv_i32 zero = tcg_const_i32(0);
-+    TCGv_i32 max = tcg_const_i32(32);
-+
-+    /*
-+     * Rely on the TCG guarantee that out of range shifts produce
-+     * unspecified results, not undefined behaviour (i.e. no trap).
-+     * Discard out-of-range results after the fact.
-+     */
-+    tcg_gen_ext8s_i32(lsh, shift);
-+    tcg_gen_neg_i32(rsh, lsh);
-+    tcg_gen_shl_i32(lval, src, lsh);
-+    tcg_gen_shr_i32(rval, src, rsh);
-+    tcg_gen_movcond_i32(TCG_COND_LTU, dst, lsh, max, lval, zero);
-+    tcg_gen_movcond_i32(TCG_COND_LTU, dst, rsh, max, rval, dst);
-+
-+    tcg_temp_free_i32(lval);
-+    tcg_temp_free_i32(rval);
-+    tcg_temp_free_i32(lsh);
-+    tcg_temp_free_i32(rsh);
-+    tcg_temp_free_i32(zero);
-+    tcg_temp_free_i32(max);
-+}
-+
-+void gen_ushl_i64(TCGv_i64 dst, TCGv_i64 src, TCGv_i64 shift)
-+{
-+    TCGv_i64 lval = tcg_temp_new_i64();
-+    TCGv_i64 rval = tcg_temp_new_i64();
-+    TCGv_i64 lsh = tcg_temp_new_i64();
-+    TCGv_i64 rsh = tcg_temp_new_i64();
-+    TCGv_i64 zero = tcg_const_i64(0);
-+    TCGv_i64 max = tcg_const_i64(64);
-+
-+    /*
-+     * Rely on the TCG guarantee that out of range shifts produce
-+     * unspecified results, not undefined behaviour (i.e. no trap).
-+     * Discard out-of-range results after the fact.
-+     */
-+    tcg_gen_ext8s_i64(lsh, shift);
-+    tcg_gen_neg_i64(rsh, lsh);
-+    tcg_gen_shl_i64(lval, src, lsh);
-+    tcg_gen_shr_i64(rval, src, rsh);
-+    tcg_gen_movcond_i64(TCG_COND_LTU, dst, lsh, max, lval, zero);
-+    tcg_gen_movcond_i64(TCG_COND_LTU, dst, rsh, max, rval, dst);
-+
-+    tcg_temp_free_i64(lval);
-+    tcg_temp_free_i64(rval);
-+    tcg_temp_free_i64(lsh);
-+    tcg_temp_free_i64(rsh);
-+    tcg_temp_free_i64(zero);
-+    tcg_temp_free_i64(max);
-+}
-+
-+static void gen_ushl_vec(unsigned vece, TCGv_vec dst,
-+                         TCGv_vec src, TCGv_vec shift)
-+{
-+    TCGv_vec lval = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec rval = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec lsh = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec rsh = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec msk, max;
-+
-+    tcg_gen_neg_vec(vece, rsh, shift);
-+    if (vece == MO_8) {
-+        tcg_gen_mov_vec(lsh, shift);
-+    } else {
-+        msk = tcg_temp_new_vec_matching(dst);
-+        tcg_gen_dupi_vec(vece, msk, 0xff);
-+        tcg_gen_and_vec(vece, lsh, shift, msk);
-+        tcg_gen_and_vec(vece, rsh, rsh, msk);
-+        tcg_temp_free_vec(msk);
-+    }
-+
-+    /*
-+     * Rely on the TCG guarantee that out of range shifts produce
-+     * unspecified results, not undefined behaviour (i.e. no trap).
-+     * Discard out-of-range results after the fact.
-+     */
-+    tcg_gen_shlv_vec(vece, lval, src, lsh);
-+    tcg_gen_shrv_vec(vece, rval, src, rsh);
-+
-+    max = tcg_temp_new_vec_matching(dst);
-+    tcg_gen_dupi_vec(vece, max, 8 << vece);
-+
-+    /*
-+     * The choice of LT (signed) and GEU (unsigned) are biased toward
-+     * the instructions of the x86_64 host.  For MO_8, the whole byte
-+     * is significant so we must use an unsigned compare; otherwise we
-+     * have already masked to a byte and so a signed compare works.
-+     * Other tcg hosts have a full set of comparisons and do not care.
-+     */
-+    if (vece == MO_8) {
-+        tcg_gen_cmp_vec(TCG_COND_GEU, vece, lsh, lsh, max);
-+        tcg_gen_cmp_vec(TCG_COND_GEU, vece, rsh, rsh, max);
-+        tcg_gen_andc_vec(vece, lval, lval, lsh);
-+        tcg_gen_andc_vec(vece, rval, rval, rsh);
-+    } else {
-+        tcg_gen_cmp_vec(TCG_COND_LT, vece, lsh, lsh, max);
-+        tcg_gen_cmp_vec(TCG_COND_LT, vece, rsh, rsh, max);
-+        tcg_gen_and_vec(vece, lval, lval, lsh);
-+        tcg_gen_and_vec(vece, rval, rval, rsh);
-+    }
-+    tcg_gen_or_vec(vece, dst, lval, rval);
-+
-+    tcg_temp_free_vec(max);
-+    tcg_temp_free_vec(lval);
-+    tcg_temp_free_vec(rval);
-+    tcg_temp_free_vec(lsh);
-+    tcg_temp_free_vec(rsh);
-+}
-+
-+static const TCGOpcode ushl_list[] = {
-+    INDEX_op_neg_vec, INDEX_op_shlv_vec,
-+    INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
-+};
-+
-+const GVecGen3 ushl_op[4] = {
-+    { .fniv = gen_ushl_vec,
-+      .fno = gen_helper_gvec_ushl_b,
-+      .opt_opc = ushl_list,
-+      .vece = MO_8 },
-+    { .fniv = gen_ushl_vec,
-+      .fno = gen_helper_gvec_ushl_h,
-+      .opt_opc = ushl_list,
-+      .vece = MO_16 },
-+    { .fni4 = gen_ushl_i32,
-+      .fniv = gen_ushl_vec,
-+      .opt_opc = ushl_list,
-+      .vece = MO_32 },
-+    { .fni8 = gen_ushl_i64,
-+      .fniv = gen_ushl_vec,
-+      .opt_opc = ushl_list,
-+      .vece = MO_64 },
-+};
-+
-+void gen_sshl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
-+{
-+    TCGv_i32 lval = tcg_temp_new_i32();
-+    TCGv_i32 rval = tcg_temp_new_i32();
-+    TCGv_i32 lsh = tcg_temp_new_i32();
-+    TCGv_i32 rsh = tcg_temp_new_i32();
-+    TCGv_i32 zero = tcg_const_i32(0);
-+    TCGv_i32 max = tcg_const_i32(31);
-+
-+    /*
-+     * Rely on the TCG guarantee that out of range shifts produce
-+     * unspecified results, not undefined behaviour (i.e. no trap).
-+     * Discard out-of-range results after the fact.
-+     */
-+    tcg_gen_ext8s_i32(lsh, shift);
-+    tcg_gen_neg_i32(rsh, lsh);
-+    tcg_gen_shl_i32(lval, src, lsh);
-+    tcg_gen_umin_i32(rsh, rsh, max);
-+    tcg_gen_sar_i32(rval, src, rsh);
-+    tcg_gen_movcond_i32(TCG_COND_LEU, lval, lsh, max, lval, zero);
-+    tcg_gen_movcond_i32(TCG_COND_LT, dst, lsh, zero, rval, lval);
-+
-+    tcg_temp_free_i32(lval);
-+    tcg_temp_free_i32(rval);
-+    tcg_temp_free_i32(lsh);
-+    tcg_temp_free_i32(rsh);
-+    tcg_temp_free_i32(zero);
-+    tcg_temp_free_i32(max);
-+}
-+
-+void gen_sshl_i64(TCGv_i64 dst, TCGv_i64 src, TCGv_i64 shift)
-+{
-+    TCGv_i64 lval = tcg_temp_new_i64();
-+    TCGv_i64 rval = tcg_temp_new_i64();
-+    TCGv_i64 lsh = tcg_temp_new_i64();
-+    TCGv_i64 rsh = tcg_temp_new_i64();
-+    TCGv_i64 zero = tcg_const_i64(0);
-+    TCGv_i64 max = tcg_const_i64(63);
-+
-+    /*
-+     * Rely on the TCG guarantee that out of range shifts produce
-+     * unspecified results, not undefined behaviour (i.e. no trap).
-+     * Discard out-of-range results after the fact.
-+     */
-+    tcg_gen_ext8s_i64(lsh, shift);
-+    tcg_gen_neg_i64(rsh, lsh);
-+    tcg_gen_shl_i64(lval, src, lsh);
-+    tcg_gen_umin_i64(rsh, rsh, max);
-+    tcg_gen_sar_i64(rval, src, rsh);
-+    tcg_gen_movcond_i64(TCG_COND_LEU, lval, lsh, max, lval, zero);
-+    tcg_gen_movcond_i64(TCG_COND_LT, dst, lsh, zero, rval, lval);
-+
-+    tcg_temp_free_i64(lval);
-+    tcg_temp_free_i64(rval);
-+    tcg_temp_free_i64(lsh);
-+    tcg_temp_free_i64(rsh);
-+    tcg_temp_free_i64(zero);
-+    tcg_temp_free_i64(max);
-+}
-+
-+static void gen_sshl_vec(unsigned vece, TCGv_vec dst,
-+                         TCGv_vec src, TCGv_vec shift)
-+{
-+    TCGv_vec lval = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec rval = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec lsh = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec rsh = tcg_temp_new_vec_matching(dst);
-+    TCGv_vec tmp = tcg_temp_new_vec_matching(dst);
-+
-+    /*
-+     * Rely on the TCG guarantee that out of range shifts produce
-+     * unspecified results, not undefined behaviour (i.e. no trap).
-+     * Discard out-of-range results after the fact.
-+     */
-+    tcg_gen_neg_vec(vece, rsh, shift);
-+    if (vece == MO_8) {
-+        tcg_gen_mov_vec(lsh, shift);
-+    } else {
-+        tcg_gen_dupi_vec(vece, tmp, 0xff);
-+        tcg_gen_and_vec(vece, lsh, shift, tmp);
-+        tcg_gen_and_vec(vece, rsh, rsh, tmp);
-+    }
-+
-+    /* Bound rsh so out of bound right shift gets -1.  */
-+    tcg_gen_dupi_vec(vece, tmp, (8 << vece) - 1);
-+    tcg_gen_umin_vec(vece, rsh, rsh, tmp);
-+    tcg_gen_cmp_vec(TCG_COND_GT, vece, tmp, lsh, tmp);
-+
-+    tcg_gen_shlv_vec(vece, lval, src, lsh);
-+    tcg_gen_sarv_vec(vece, rval, src, rsh);
-+
-+    /* Select in-bound left shift.  */
-+    tcg_gen_andc_vec(vece, lval, lval, tmp);
-+
-+    /* Select between left and right shift.  */
-+    if (vece == MO_8) {
-+        tcg_gen_dupi_vec(vece, tmp, 0);
-+        tcg_gen_cmpsel_vec(TCG_COND_LT, vece, dst, lsh, tmp, rval, lval);
-+    } else {
-+        tcg_gen_dupi_vec(vece, tmp, 0x80);
-+        tcg_gen_cmpsel_vec(TCG_COND_LT, vece, dst, lsh, tmp, lval, rval);
-+    }
-+
-+    tcg_temp_free_vec(lval);
-+    tcg_temp_free_vec(rval);
-+    tcg_temp_free_vec(lsh);
-+    tcg_temp_free_vec(rsh);
-+    tcg_temp_free_vec(tmp);
-+}
-+
-+static const TCGOpcode sshl_list[] = {
-+    INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
-+    INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
-+};
-+
-+const GVecGen3 sshl_op[4] = {
-+    { .fniv = gen_sshl_vec,
-+      .fno = gen_helper_gvec_sshl_b,
-+      .opt_opc = sshl_list,
-+      .vece = MO_8 },
-+    { .fniv = gen_sshl_vec,
-+      .fno = gen_helper_gvec_sshl_h,
-+      .opt_opc = sshl_list,
-+      .vece = MO_16 },
-+    { .fni4 = gen_sshl_i32,
-+      .fniv = gen_sshl_vec,
-+      .opt_opc = sshl_list,
-+      .vece = MO_32 },
-+    { .fni8 = gen_sshl_i64,
-+      .fniv = gen_sshl_vec,
-+      .opt_opc = sshl_list,
-+      .vece = MO_64 },
-+};
-+
- static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
-                           TCGv_vec a, TCGv_vec b)
- {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                                   vec_size, vec_size);
-             }
-             return 0;
-+
-+        case NEON_3R_VSHL:
-+            /* Note the operation is vshl vd,vm,vn */
-+            tcg_gen_gvec_3(rd_ofs, rm_ofs, rn_ofs, vec_size, vec_size,
-+                           u ? &ushl_op[size] : &sshl_op[size]);
-+            return 0;
-         }
-         if (size == 3) {
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                 neon_load_reg64(cpu_V0, rn + pass);
-                 neon_load_reg64(cpu_V1, rm + pass);
-                 switch (op) {
--                case NEON_3R_VSHL:
--                    if (u) {
--                        gen_helper_neon_shl_u64(cpu_V0, cpu_V1, cpu_V0);
--                    } else {
--                        gen_helper_neon_shl_s64(cpu_V0, cpu_V1, cpu_V0);
--                    }
--                    break;
-                 case NEON_3R_VQSHL:
-                     if (u) {
-                         gen_helper_neon_qshl_u64(cpu_V0, cpu_env,
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         }
-         pairwise = 0;
-         switch (op) {
--        case NEON_3R_VSHL:
-         case NEON_3R_VQSHL:
-         case NEON_3R_VRSHL:
-         case NEON_3R_VQRSHL:
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-         case NEON_3R_VHSUB:
-             GEN_NEON_INTEGER_OP(hsub);
-             break;
--        case NEON_3R_VSHL:
--            GEN_NEON_INTEGER_OP(shl);
--            break;
-         case NEON_3R_VQSHL:
-             GEN_NEON_INTEGER_OP_ENV(qshl);
-             break;
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
-                             }
-                         } else {
-                             if (input_unsigned) {
--                                gen_helper_neon_shl_u64(cpu_V0, in, tmp64);
-+                                gen_ushl_i64(cpu_V0, in, tmp64);
-                             } else {
--                                gen_helper_neon_shl_s64(cpu_V0, in, tmp64);
-+                                gen_sshl_i64(cpu_V0, in, tmp64);
-                             }
-                         }
-                         tmp = tcg_temp_new_i32();
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fmlal_idx_a64)(void *vd, void *vn, void *vm,
+@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
-     do_fmlal_idx(vd, vn, vm, &env->vfp.fp_status, desc,
+     clear_tail(d, opr_sz, simd_maxsz(desc));
                   get_flush_inputs_to_zero(&env->vfp.fp_status_f16));
  }
-+
-+void HELPER(gvec_sshl_b)(void *vd, void *vn, void *vm, uint32_t desc)
++void HELPER(neon_sqdmulh_h)(void *vd, void *vn, void *vm,
-+{
++                            void *vq, uint32_t desc)
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    int8_t *d = vd, *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz; ++i) {
 +        int8_t mm = m[i];
 +        int8_t nn = n[i];
 +        int8_t res = 0;
 +        if (mm >= 0) {
 +            if (mm < 8) {
 +                res = nn << mm;
 +            }
 +        } else {
 +            res = nn >> (mm > -8 ? -mm : 7);
 +        }
 +        d[i] = res;
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_sshl_h)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    int16_t *d = vd, *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz / 2; ++i) {
-+        int8_t mm = m[i];   /* only 8 bits of shift are significant */
++        d[i] = do_sqrdmlah_h(n[i], m[i], 0, false, false, vq);
 +        int16_t nn = n[i];
 +        int16_t res = 0;
 +        if (mm >= 0) {
 +            if (mm < 16) {
 +                res = nn << mm;
 +            }
 +        } else {
 +            res = nn >> (mm > -16 ? -mm : 15);
 +        }
 +        d[i] = res;
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
-+void HELPER(gvec_ushl_b)(void *vd, void *vn, void *vm, uint32_t desc)
++void HELPER(neon_sqrdmulh_h)(void *vd, void *vn, void *vm,
 +                             void *vq, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
-+    uint8_t *d = vd, *n = vn, *m = vm;
++    int16_t *d = vd, *n = vn, *m = vm;
 +
-+    for (i = 0; i < opr_sz; ++i) {
++    for (i = 0; i < opr_sz / 2; ++i) {
-+        int8_t mm = m[i];
++        d[i] = do_sqrdmlah_h(n[i], m[i], 0, false, true, vq);
 +        uint8_t nn = n[i];
 +        uint8_t res = 0;
 +        if (mm >= 0) {
 +            if (mm < 8) {
 +                res = nn << mm;
 +            }
 +        } else {
 +            if (mm > -8) {
 +                res = nn >> -mm;
 +            }
 +        }
 +        d[i] = res;
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
-+void HELPER(gvec_ushl_h)(void *vd, void *vn, void *vm, uint32_t desc)
+ /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
  static int32_t do_sqrdmlah_s(int32_t src1, int32_t src2, int32_t src3,
                               bool neg, bool round, uint32_t *sat)
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
 +void HELPER(neon_sqdmulh_s)(void *vd, void *vn, void *vm,
 +                            void *vq, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
-+    uint16_t *d = vd, *n = vn, *m = vm;
++    int32_t *d = vd, *n = vn, *m = vm;
 +
-+    for (i = 0; i < opr_sz / 2; ++i) {
++    for (i = 0; i < opr_sz / 4; ++i) {
-+        int8_t mm = m[i];   /* only 8 bits of shift are significant */
++        d[i] = do_sqrdmlah_s(n[i], m[i], 0, false, false, vq);
 +        uint16_t nn = n[i];
 +        uint16_t res = 0;
 +        if (mm >= 0) {
 +            if (mm < 16) {
 +                res = nn << mm;
 +            }
 +        } else {
 +            if (mm > -16) {
 +                res = nn >> -mm;
 +            }
 +        }
 +        d[i] = res;
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
++
++void HELPER(neon_sqrdmulh_s)(void *vd, void *vn, void *vm,
++                             void *vq, uint32_t desc)
++{
++    intptr_t i, opr_sz = simd_oprsz(desc);
++    int32_t *d = vd, *n = vn, *m = vm;
++
++    for (i = 0; i < opr_sz / 4; ++i) {
++        d[i] = do_sqrdmlah_s(n[i], m[i], 0, false, true, vq);
++    }
++    clear_tail(d, opr_sz, simd_maxsz(desc));
++}
++
+ /* Integer 8 and 16-bit dot-product.
+  *
+  * Note that for the loops herein, host endianness does not matter
 --
 .20.1

Big pullreq this week, though none of the new features are
particularly earthshaking. Most of the bulk is from code cleanup
patches from me or rth.

thanks
-- PMM

The following changes since commit b651b80822fa8cb66ca30087ac7fbc75507ae5d2:

Merge remote-tracking branch 'remotes/vivier2/tags/linux-user-for-5.0-pull-request' into staging (2020-02-20 17:35:42 +0000)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200221

for you to fetch changes up to 270a679b3f950d7c4c600f324aab8bff292d0971:

target/arm: Add missing checks for fpsp_v2 (2020-02-21 12:54:25 +0000)

----------------------------------------------------------------
target-arm queue:
 * aspeed/scu: Implement chip ID register
 * hw/misc/iotkit-secctl: Fix writing to 'PPC Interrupt Clear' register
 * mainstone: Make providing flash images non-mandatory
 * z2: Make providing flash images non-mandatory
 * Fix failures to flush SVE high bits after AdvSIMD INS/ZIP/UZP/TRN/TBL/TBX/EXT
 * Minor performance improvement: spend less time recalculating hflags values
 * Code cleanup to isar_feature function tests
 * Implement ARMv8.1-PMU and ARMv8.4-PMU extensions
 * Bugfix: correct handling of PMCR_EL0.LC bit
 * Bugfix: correct definition of PMCRDP
 * Correctly implement ACTLR2, HACTLR2
 * allwinner: Wire up USB ports
 * Vectorize emulation of USHL, SSHL, PMUL*
 * xilinx_spips: Correct the number of dummy cycles for the FAST_READ_4 cmd
 * sh4: Fix PCI ISA IO memory subregion
 * Code cleanup to use more isar_feature tests and fewer ARM_FEATURE_* tests

----------------------------------------------------------------
Francisco Iglesias (1):
      xilinx_spips: Correct the number of dummy cycles for the FAST_READ_4 cmd

Guenter Roeck (6):
      mainstone: Make providing flash images non-mandatory
      z2: Make providing flash images non-mandatory
      hw: usb: hcd-ohci: Move OHCISysBusState and TYPE_SYSBUS_OHCI to include file
      hcd-ehci: Introduce "companion-enable" sysbus property
      arm: allwinner: Wire up USB ports
      sh4: Fix PCI ISA IO memory subregion

Joel Stanley (2):
      aspeed/scu: Create separate write callbacks
      aspeed/scu: Implement chip ID register

Peter Maydell (21):
      target/arm: Add _aa32_ to isar_feature functions testing 32-bit ID registers
      target/arm: Check aa32_pan in take_aarch32_exception(), not aa64_pan
      target/arm: Add isar_feature_any_fp16 and document naming/usage conventions
      target/arm: Define and use any_predinv isar_feature test
      target/arm: Factor out PMU register definitions
      target/arm: Add and use FIELD definitions for ID_AA64DFR0_EL1
      target/arm: Use FIELD macros for clearing ID_DFR0 PERFMON field
      target/arm: Define an aa32_pmu_8_1 isar feature test function
      target/arm: Add _aa64_ and _any_ versions of pmu_8_1 isar checks
      target/arm: Stop assuming DBGDIDR always exists
      target/arm: Move DBGDIDR into ARMISARegisters
      target/arm: Read debug-related ID registers from KVM
      target/arm: Implement ARMv8.1-PMU extension
      target/arm: Implement ARMv8.4-PMU extension
      target/arm: Provide ARMv8.4-PMU in '-cpu max'
      target/arm: Correct definition of PMCRDP
      target/arm: Correct handling of PMCR_EL0.LC bit
      target/arm: Test correct register in aa32_pan and aa32_ats1e1 checks
      target/arm: Use isar_feature function for testing AA32HPD feature
      target/arm: Use FIELD_EX32 for testing 32-bit fields
      target/arm: Correctly implement ACTLR2, HACTLR2

Philippe Mathieu-Daudé (1):
      hw/misc/iotkit-secctl: Fix writing to 'PPC Interrupt Clear' register

Richard Henderson (21):
      target/arm: Flush high bits of sve register after AdvSIMD EXT
      target/arm: Flush high bits of sve register after AdvSIMD TBL/TBX
      target/arm: Flush high bits of sve register after AdvSIMD ZIP/UZP/TRN
      target/arm: Flush high bits of sve register after AdvSIMD INS
      target/arm: Use bit 55 explicitly for pauth
      target/arm: Fix select for aa64_va_parameters_both
      target/arm: Remove ttbr1_valid check from get_phys_addr_lpae
      target/arm: Split out aa64_va_parameter_tbi, aa64_va_parameter_tbid
      target/arm: Vectorize USHL and SSHL
      target/arm: Convert PMUL.8 to gvec
      target/arm: Convert PMULL.64 to gvec
      target/arm: Convert PMULL.8 to gvec
      target/arm: Rename isar_feature_aa32_simd_r32
      target/arm: Use isar_feature_aa32_simd_r32 more places
      target/arm: Set MVFR0.FPSP for ARMv5 cpus
      target/arm: Add isar_feature_aa32_simd_r16
      target/arm: Rename isar_feature_aa32_fpdp_v2
      target/arm: Add isar_feature_aa32_{fpsp_v2, fpsp_v3, fpdp_v3}
      target/arm: Perform fpdp_v2 check first
      target/arm: Replace ARM_FEATURE_VFP3 checks with fp{sp, dp}_v3
      target/arm: Add missing checks for fpsp_v2

From: Joel Stanley <joel@jms.id.au>

This splits the common write callback into separate ast2400 and ast2500
implementations. This makes it clearer when implementing differing
behaviour.

Signed-off-by: Joel Stanley <joel@jms.id.au>
Reviewed-by: Andrew Jeffery <andrew@aj.id.au>
Reviewed-by: Cédric Le Goater <clg@kaod.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200121013302.43839-2-joel@jms.id.au
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/aspeed_scu.c | 80 +++++++++++++++++++++++++++++++-------------
 1 file changed, 57 insertions(+), 23 deletions(-)

diff --git a/hw/misc/aspeed_scu.c b/hw/misc/aspeed_scu.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/aspeed_scu.c
+++ b/hw/misc/aspeed_scu.c
@@ -XXX,XX +XXX,XX @@ static uint64_t aspeed_scu_read(void *opaque, hwaddr offset, unsigned size)
     return s->regs[reg];
 }
 
-static void aspeed_scu_write(void *opaque, hwaddr offset, uint64_t data,
-                             unsigned size)
+static void aspeed_ast2400_scu_write(void *opaque, hwaddr offset,
+                                     uint64_t data, unsigned size)
+{
+    AspeedSCUState *s = ASPEED_SCU(opaque);
+    int reg = TO_REG(offset);
+
+    if (reg >= ASPEED_SCU_NR_REGS) {
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Out-of-bounds write at offset 0x%" HWADDR_PRIx "\n",
+                      __func__, offset);
+        return;
+    }
+
+    if (reg > PROT_KEY && reg < CPU2_BASE_SEG1 &&
+            !s->regs[PROT_KEY]) {
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: SCU is locked!\n", __func__);
+    }
+
+    trace_aspeed_scu_write(offset, size, data);
+
+    switch (reg) {
+    case PROT_KEY:
+        s->regs[reg] = (data == ASPEED_SCU_PROT_KEY) ? 1 : 0;
+        return;
+    case SILICON_REV:
+    case FREQ_CNTR_EVAL:
+    case VGA_SCRATCH1 ... VGA_SCRATCH8:
+    case RNG_DATA:
+    case FREE_CNTR4:
+    case FREE_CNTR4_EXT:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
+                      __func__, offset);
+        return;
+    }
+
+    s->regs[reg] = data;
+}
+
+static void aspeed_ast2500_scu_write(void *opaque, hwaddr offset,
+                                     uint64_t data, unsigned size)
 {
     AspeedSCUState *s = ASPEED_SCU(opaque);
     int reg = TO_REG(offset);
@@ -XXX,XX +XXX,XX @@ static void aspeed_scu_write(void *opaque, hwaddr offset, uint64_t data,
     case PROT_KEY:
         s->regs[reg] = (data == ASPEED_SCU_PROT_KEY) ? 1 : 0;
         return;
-    case CLK_SEL:
-        s->regs[reg] = data;
-        break;
     case HW_STRAP1:
-        if (ASPEED_IS_AST2500(s->regs[SILICON_REV])) {
-            s->regs[HW_STRAP1] |= data;
-            return;
-        }
-        /* Jump to assignment below */
-        break;
+        s->regs[HW_STRAP1] |= data;
+        return;
     case SILICON_REV:
-        if (ASPEED_IS_AST2500(s->regs[SILICON_REV])) {
-            s->regs[HW_STRAP1] &= ~data;
-        } else {
-            qemu_log_mask(LOG_GUEST_ERROR,
-                          "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
-                          __func__, offset);
-        }
-        /* Avoid assignment below, we've handled everything */
+        s->regs[HW_STRAP1] &= ~data;
         return;
     case FREQ_CNTR_EVAL:
     case VGA_SCRATCH1 ... VGA_SCRATCH8:
@@ -XXX,XX +XXX,XX @@ static void aspeed_scu_write(void *opaque, hwaddr offset, uint64_t data,
     s->regs[reg] = data;
 }
 
-static const MemoryRegionOps aspeed_scu_ops = {
+static const MemoryRegionOps aspeed_ast2400_scu_ops = {
     .read = aspeed_scu_read,
-    .write = aspeed_scu_write,
+    .write = aspeed_ast2400_scu_write,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    .valid.min_access_size = 4,
+    .valid.max_access_size = 4,
+    .valid.unaligned = false,
+};
+
+static const MemoryRegionOps aspeed_ast2500_scu_ops = {
+    .read = aspeed_scu_read,
+    .write = aspeed_ast2500_scu_write,
     .endianness = DEVICE_LITTLE_ENDIAN,
     .valid.min_access_size = 4,
     .valid.max_access_size = 4,
@@ -XXX,XX +XXX,XX @@ static void aspeed_2400_scu_class_init(ObjectClass *klass, void *data)
     asc->calc_hpll = aspeed_2400_scu_calc_hpll;
     asc->apb_divider = 2;
     asc->nr_regs = ASPEED_SCU_NR_REGS;
-    asc->ops = &aspeed_scu_ops;
+    asc->ops = &aspeed_ast2400_scu_ops;
 }
 
 static const TypeInfo aspeed_2400_scu_info = {
@@ -XXX,XX +XXX,XX @@ static void aspeed_2500_scu_class_init(ObjectClass *klass, void *data)
     asc->calc_hpll = aspeed_2500_scu_calc_hpll;
     asc->apb_divider = 4;
     asc->nr_regs = ASPEED_SCU_NR_REGS;
-    asc->ops = &aspeed_scu_ops;
+    asc->ops = &aspeed_ast2500_scu_ops;
 }
 
 static const TypeInfo aspeed_2500_scu_info = {
-- 
2.20.1

From: Joel Stanley <joel@jms.id.au>

This returns a fixed but non-zero value for the chip id.

Signed-off-by: Joel Stanley <joel@jms.id.au>
Reviewed-by: Andrew Jeffery <andrew@aj.id.au>
Reviewed-by: Cédric Le Goater <clg@kaod.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200121013302.43839-3-joel@jms.id.au
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/aspeed_scu.c | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/hw/misc/aspeed_scu.c b/hw/misc/aspeed_scu.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/aspeed_scu.c
+++ b/hw/misc/aspeed_scu.c
@@ -XXX,XX +XXX,XX @@
 #define CPU2_BASE_SEG4       TO_REG(0x110)
 #define CPU2_BASE_SEG5       TO_REG(0x114)
 #define CPU2_CACHE_CTRL      TO_REG(0x118)
+#define CHIP_ID0             TO_REG(0x150)
+#define CHIP_ID1             TO_REG(0x154)
 #define UART_HPLL_CLK        TO_REG(0x160)
 #define PCIE_CTRL            TO_REG(0x180)
 #define BMC_MMIO_CTRL        TO_REG(0x184)
@@ -XXX,XX +XXX,XX @@
 #define AST2600_HW_STRAP2_PROT    TO_REG(0x518)
 #define AST2600_RNG_CTRL          TO_REG(0x524)
 #define AST2600_RNG_DATA          TO_REG(0x540)
+#define AST2600_CHIP_ID0          TO_REG(0x5B0)
+#define AST2600_CHIP_ID1          TO_REG(0x5B4)
 
 #define AST2600_CLK TO_REG(0x40)
 
@@ -XXX,XX +XXX,XX @@ static const uint32_t ast2500_a1_resets[ASPEED_SCU_NR_REGS] = {
      [CPU2_BASE_SEG1]  = 0x80000000U,
      [CPU2_BASE_SEG4]  = 0x1E600000U,
      [CPU2_BASE_SEG5]  = 0xC0000000U,
+     [CHIP_ID0]        = 0x1234ABCDU,
+     [CHIP_ID1]        = 0x88884444U,
      [UART_HPLL_CLK]   = 0x00001903U,
      [PCIE_CTRL]       = 0x0000007BU,
      [BMC_DEV_ID]      = 0x00002402U
@@ -XXX,XX +XXX,XX @@ static void aspeed_ast2500_scu_write(void *opaque, hwaddr offset,
     case RNG_DATA:
     case FREE_CNTR4:
     case FREE_CNTR4_EXT:
+    case CHIP_ID0:
+    case CHIP_ID1:
         qemu_log_mask(LOG_GUEST_ERROR,
                       "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
                       __func__, offset);
@@ -XXX,XX +XXX,XX @@ static void aspeed_ast2600_scu_write(void *opaque, hwaddr offset,
     case AST2600_RNG_DATA:
     case AST2600_SILICON_REV:
     case AST2600_SILICON_REV2:
+    case AST2600_CHIP_ID0:
+    case AST2600_CHIP_ID1:
         /* Add read only registers here */
         qemu_log_mask(LOG_GUEST_ERROR,
                       "%s: Write to read-only offset 0x%" HWADDR_PRIx "\n",
@@ -XXX,XX +XXX,XX @@ static const uint32_t ast2600_a0_resets[ASPEED_AST2600_SCU_NR_REGS] = {
     [AST2600_CLK_STOP_CTRL2]    = 0xFFF0FFF0,
     [AST2600_SDRAM_HANDSHAKE]   = 0x00000040,  /* SoC completed DRAM init */
     [AST2600_HPLL_PARAM]        = 0x1000405F,
+    [AST2600_CHIP_ID0]          = 0x1234ABCD,
+    [AST2600_CHIP_ID1]          = 0x88884444,
+
 };
 
 static void aspeed_ast2600_scu_reset(DeviceState *dev)
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Fix warning reported by Clang static code analyzer:

CC      hw/misc/iotkit-secctl.o
  hw/misc/iotkit-secctl.c:343:9: warning: Value stored to 'value' is never read
          value &= 0x00f000f3;
          ^        ~~~~~~~~~~

Fixes: b3717c23e1c
Reported-by: Clang Static Analyzer
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200217132922.24607-1-f4bug@amsat.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/iotkit-secctl.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/hw/misc/iotkit-secctl.c b/hw/misc/iotkit-secctl.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/iotkit-secctl.c
+++ b/hw/misc/iotkit-secctl.c
@@ -XXX,XX +XXX,XX @@ static MemTxResult iotkit_secctl_s_write(void *opaque, hwaddr addr,
         qemu_set_irq(s->sec_resp_cfg, s->secrespcfg);
         break;
     case A_SECPPCINTCLR:
-        value &= 0x00f000f3;
+        s->secppcintstat &= ~(value & 0x00f000f3);
         foreach_ppc(s, iotkit_secctl_ppc_update_irq_clear);
         break;
     case A_SECPPCINTEN:
-- 
2.20.1

From: Guenter Roeck <linux@roeck-us.net>

Up to now, the mainstone machine only boots if two flash images are
provided. This is not really necessary; the machine can boot from initrd
or from SD without it. At the same time, having to provide dummy flash
images is a nuisance and does not add any real value. Make it optional.

Signed-off-by: Guenter Roeck <linux@roeck-us.net>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200217210824.18513-1-linux@roeck-us.net
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/mainstone.c | 11 +----------
 1 file changed, 1 insertion(+), 10 deletions(-)

diff --git a/hw/arm/mainstone.c b/hw/arm/mainstone.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/mainstone.c
+++ b/hw/arm/mainstone.c
@@ -XXX,XX +XXX,XX @@ static void mainstone_common_init(MemoryRegion *address_space_mem,
     /* There are two 32MiB flash devices on the board */
     for (i = 0; i < 2; i ++) {
         dinfo = drive_get(IF_PFLASH, 0, i);
-        if (!dinfo) {
-            if (qtest_enabled()) {
-                break;
-            }
-            error_report("Two flash images must be given with the "
-                         "'pflash' parameter");
-            exit(1);
-        }
-
         if (!pflash_cfi01_register(mainstone_flash_base[i],
                                    i ? "mainstone.flash1" : "mainstone.flash0",
                                    MAINSTONE_FLASH,
-                                   blk_by_legacy_dinfo(dinfo),
+                                   dinfo ? blk_by_legacy_dinfo(dinfo) : NULL,
                                    sector_len, 4, 0, 0, 0, 0, be)) {
             error_report("Error registering flash memory");
             exit(1);
-- 
2.20.1

From: Guenter Roeck <linux@roeck-us.net>

Up to now, the z2 machine only boots if a flash image is provided.
This is not really necessary; the machine can boot from initrd or from
SD without it. At the same time, having to provide dummy flash images
is a nuisance and does not add any real value. Make it optional.

Signed-off-by: Guenter Roeck <linux@roeck-us.net>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200217210903.18602-1-linux@roeck-us.net
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/z2.c | 6 ------
 1 file changed, 6 deletions(-)

diff --git a/hw/arm/z2.c b/hw/arm/z2.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/z2.c
+++ b/hw/arm/z2.c
@@ -XXX,XX +XXX,XX @@ static void z2_init(MachineState *machine)
     be = 0;
 #endif
     dinfo = drive_get(IF_PFLASH, 0, 0);
-    if (!dinfo && !qtest_enabled()) {
-        error_report("Flash image must be given with the "
-                     "'pflash' parameter");
-        exit(1);
-    }
-
     if (!pflash_cfi01_register(Z2_FLASH_BASE, "z2.flash0", Z2_FLASH_SIZE,
                                dinfo ? blk_by_legacy_dinfo(dinfo) : NULL,
                                sector_len, 4, 0, 0, 0, 0, be)) {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Writes to AdvSIMD registers flush the bits above 128.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214194643.23317-5-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_simd_inse(DisasContext *s, int rd, int rn,
     write_vec_element(s, tmp, rd, dst_index, size);
 
     tcg_temp_free_i64(tmp);
+
+    /* INS is considered a 128-bit write for SVE. */
+    clear_vec_high(s, true, rd);
 }
 
 
@@ -XXX,XX +XXX,XX @@ static void handle_simd_insg(DisasContext *s, int rd, int rn, int imm5)
 
     idx = extract32(imm5, 1 + size, 4 - size);
     write_vec_element(s, cpu_reg(s, rn), rd, idx, size);
+
+    /* INS is considered a 128-bit write for SVE. */
+    clear_vec_high(s, true, rd);
 }
 
 /*
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The psuedocode in aarch64/functions/pac/auth/Auth and
aarch64/functions/pac/strip/Strip always uses bit 55 for
extfield and do not consider if the current regime has 2 ranges.

Suggested-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200216194343.21331-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/pauth_helper.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/target/arm/pauth_helper.c b/target/arm/pauth_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/pauth_helper.c
+++ b/target/arm/pauth_helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t pauth_addpac(CPUARMState *env, uint64_t ptr, uint64_t modifier,
 
 static uint64_t pauth_original_ptr(uint64_t ptr, ARMVAParameters param)
 {
-    uint64_t extfield = -param.select;
+    /* Note that bit 55 is used whether or not the regime has 2 ranges. */
+    uint64_t extfield = sextract64(ptr, 55, 1);
     int bot_pac_bit = 64 - param.tsz;
     int top_pac_bit = 64 - 8 * param.tbi;
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Select should always be 0 for a regime with one range.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216194343.21331-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 46 +++++++++++++++++++++++----------------------
 1 file changed, 24 insertions(+), 22 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
     bool tbi, tbid, epd, hpd, using16k, using64k;
     int select, tsz;
 
-    /*
-     * Bit 55 is always between the two regions, and is canonical for
-     * determining if address tagging is enabled.
-     */
-    select = extract64(va, 55, 1);
-
     if (!regime_has_2_ranges(mmu_idx)) {
+        select = 0;
         tsz = extract32(tcr, 0, 6);
         using64k = extract32(tcr, 14, 1);
         using16k = extract32(tcr, 15, 1);
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
             tbid = extract32(tcr, 29, 1);
         }
         epd = false;
-    } else if (!select) {
-        tsz = extract32(tcr, 0, 6);
-        epd = extract32(tcr, 7, 1);
-        using64k = extract32(tcr, 14, 1);
-        using16k = extract32(tcr, 15, 1);
-        tbi = extract64(tcr, 37, 1);
-        hpd = extract64(tcr, 41, 1);
-        tbid = extract64(tcr, 51, 1);
     } else {
-        int tg = extract32(tcr, 30, 2);
-        using16k = tg == 1;
-        using64k = tg == 3;
-        tsz = extract32(tcr, 16, 6);
-        epd = extract32(tcr, 23, 1);
-        tbi = extract64(tcr, 38, 1);
-        hpd = extract64(tcr, 42, 1);
-        tbid = extract64(tcr, 52, 1);
+        /*
+         * Bit 55 is always between the two regions, and is canonical for
+         * determining if address tagging is enabled.
+         */
+        select = extract64(va, 55, 1);
+        if (!select) {
+            tsz = extract32(tcr, 0, 6);
+            epd = extract32(tcr, 7, 1);
+            using64k = extract32(tcr, 14, 1);
+            using16k = extract32(tcr, 15, 1);
+            tbi = extract64(tcr, 37, 1);
+            hpd = extract64(tcr, 41, 1);
+            tbid = extract64(tcr, 51, 1);
+        } else {
+            int tg = extract32(tcr, 30, 2);
+            using16k = tg == 1;
+            using64k = tg == 3;
+            tsz = extract32(tcr, 16, 6);
+            epd = extract32(tcr, 23, 1);
+            tbi = extract64(tcr, 38, 1);
+            hpd = extract64(tcr, 42, 1);
+            tbid = extract64(tcr, 52, 1);
+        }
     }
     tsz = MIN(tsz, 39);  /* TODO: ARMv8.4-TTST */
     tsz = MAX(tsz, 16);  /* TODO: ARMv8.2-LVA  */
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Now that aa64_va_parameters_both sets select based on the number
of ranges in the regime, the ttbr1_valid check is redundant.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216194343.21331-4-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 6 +-----
 1 file changed, 1 insertion(+), 5 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
     TCR *tcr = regime_tcr(env, mmu_idx);
     int ap, ns, xn, pxn;
     uint32_t el = regime_el(env, mmu_idx);
-    bool ttbr1_valid;
     uint64_t descaddrmask;
     bool aarch64 = arm_el_is_aa64(env, el);
     bool guarded = false;
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
         param = aa64_va_parameters(env, address, mmu_idx,
                                    access_type != MMU_INST_FETCH);
         level = 0;
-        ttbr1_valid = regime_has_2_ranges(mmu_idx);
         addrsize = 64 - 8 * param.tbi;
         inputsize = 64 - param.tsz;
     } else {
         param = aa32_va_parameters(env, address, mmu_idx);
         level = 1;
-        /* There is no TTBR1 for EL2 */
-        ttbr1_valid = (el != 2);
         addrsize = (mmu_idx == ARMMMUIdx_Stage2 ? 40 : 32);
         inputsize = addrsize - param.tsz;
     }
@@ -XXX,XX +XXX,XX @@ static bool get_phys_addr_lpae(CPUARMState *env, target_ulong address,
     if (inputsize < addrsize) {
         target_ulong top_bits = sextract64(address, inputsize,
                                            addrsize - inputsize);
-        if (-top_bits != param.select || (param.select && !ttbr1_valid)) {
+        if (-top_bits != param.select) {
             /* The gap between the two regions is a Translation fault */
             fault_type = ARMFault_Translation;
             goto do_fault;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

For the purpose of rebuild_hflags_a64, we do not need to compute
all of the va parameters, only tbi.  Moreover, we can compute them
in a form that is more useful to storing in hflags.

This eliminates the need for aa64_va_parameter_both, so fold that
in to aa64_va_parameter.  The remaining calls to aa64_va_parameter
are in get_phys_addr_lpae and in pauth_helper.c.

This reduces the total cpu consumption of aa64_va_parameter in a
kernel boot plus a kvm guest kernel boot from 3% to 0.5%.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216194343.21331-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/internals.h |  3 --
 target/arm/helper.c    | 68 +++++++++++++++++++++++-------------------
 2 files changed, 37 insertions(+), 34 deletions(-)

diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ typedef struct ARMVAParameters {
     unsigned tsz    : 8;
     unsigned select : 1;
     bool tbi        : 1;
-    bool tbid       : 1;
     bool epd        : 1;
     bool hpd        : 1;
     bool using16k   : 1;
     bool using64k   : 1;
 } ARMVAParameters;
 
-ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
-                                        ARMMMUIdx mmu_idx);
 ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
                                    ARMMMUIdx mmu_idx, bool data);
 
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint8_t convert_stage2_attrs(CPUARMState *env, uint8_t s2attrs)
 }
 #endif /* !CONFIG_USER_ONLY */
 
-ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
-                                        ARMMMUIdx mmu_idx)
+static int aa64_va_parameter_tbi(uint64_t tcr, ARMMMUIdx mmu_idx)
+{
+    if (regime_has_2_ranges(mmu_idx)) {
+        return extract64(tcr, 37, 2);
+    } else if (mmu_idx == ARMMMUIdx_Stage2) {
+        return 0; /* VTCR_EL2 */
+    } else {
+        return extract32(tcr, 20, 1);
+    }
+}
+
+static int aa64_va_parameter_tbid(uint64_t tcr, ARMMMUIdx mmu_idx)
+{
+    if (regime_has_2_ranges(mmu_idx)) {
+        return extract64(tcr, 51, 2);
+    } else if (mmu_idx == ARMMMUIdx_Stage2) {
+        return 0; /* VTCR_EL2 */
+    } else {
+        return extract32(tcr, 29, 1);
+    }
+}
+
+ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
+                                   ARMMMUIdx mmu_idx, bool data)
 {
     uint64_t tcr = regime_tcr(env, mmu_idx)->raw_tcr;
-    bool tbi, tbid, epd, hpd, using16k, using64k;
-    int select, tsz;
+    bool epd, hpd, using16k, using64k;
+    int select, tsz, tbi;
 
     if (!regime_has_2_ranges(mmu_idx)) {
         select = 0;
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
         using16k = extract32(tcr, 15, 1);
         if (mmu_idx == ARMMMUIdx_Stage2) {
             /* VTCR_EL2 */
-            tbi = tbid = hpd = false;
+            hpd = false;
         } else {
-            tbi = extract32(tcr, 20, 1);
             hpd = extract32(tcr, 24, 1);
-            tbid = extract32(tcr, 29, 1);
         }
         epd = false;
     } else {
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
             epd = extract32(tcr, 7, 1);
             using64k = extract32(tcr, 14, 1);
             using16k = extract32(tcr, 15, 1);
-            tbi = extract64(tcr, 37, 1);
             hpd = extract64(tcr, 41, 1);
-            tbid = extract64(tcr, 51, 1);
         } else {
             int tg = extract32(tcr, 30, 2);
             using16k = tg == 1;
             using64k = tg == 3;
             tsz = extract32(tcr, 16, 6);
             epd = extract32(tcr, 23, 1);
-            tbi = extract64(tcr, 38, 1);
             hpd = extract64(tcr, 42, 1);
-            tbid = extract64(tcr, 52, 1);
         }
     }
     tsz = MIN(tsz, 39);  /* TODO: ARMv8.4-TTST */
     tsz = MAX(tsz, 16);  /* TODO: ARMv8.2-LVA  */
 
+    /* Present TBI as a composite with TBID.  */
+    tbi = aa64_va_parameter_tbi(tcr, mmu_idx);
+    if (!data) {
+        tbi &= ~aa64_va_parameter_tbid(tcr, mmu_idx);
+    }
+    tbi = (tbi >> select) & 1;
+
     return (ARMVAParameters) {
         .tsz = tsz,
         .select = select,
         .tbi = tbi,
-        .tbid = tbid,
         .epd = epd,
         .hpd = hpd,
         .using16k = using16k,
@@ -XXX,XX +XXX,XX @@ ARMVAParameters aa64_va_parameters_both(CPUARMState *env, uint64_t va,
     };
 }
 
-ARMVAParameters aa64_va_parameters(CPUARMState *env, uint64_t va,
-                                   ARMMMUIdx mmu_idx, bool data)
-{
-    ARMVAParameters ret = aa64_va_parameters_both(env, va, mmu_idx);
-
-    /* Present TBI as a composite with TBID.  */
-    ret.tbi &= (data || !ret.tbid);
-    return ret;
-}
-
 #ifndef CONFIG_USER_ONLY
 static ARMVAParameters aa32_va_parameters(CPUARMState *env, uint32_t va,
                                           ARMMMUIdx mmu_idx)
@@ -XXX,XX +XXX,XX @@ static uint32_t rebuild_hflags_a64(CPUARMState *env, int el, int fp_el,
 {
     uint32_t flags = rebuild_hflags_aprofile(env);
     ARMMMUIdx stage1 = stage_1_mmu_idx(mmu_idx);
-    ARMVAParameters p0 = aa64_va_parameters_both(env, 0, stage1);
+    uint64_t tcr = regime_tcr(env, mmu_idx)->raw_tcr;
     uint64_t sctlr;
     int tbii, tbid;
 
     flags = FIELD_DP32(flags, TBFLAG_ANY, AARCH64_STATE, 1);
 
     /* Get control bits for tagged addresses.  */
-    if (regime_has_2_ranges(mmu_idx)) {
-        ARMVAParameters p1 = aa64_va_parameters_both(env, -1, stage1);
-        tbid = (p1.tbi << 1) | p0.tbi;
-        tbii = tbid & ~((p1.tbid << 1) | p0.tbid);
-    } else {
-        tbid = p0.tbi;
-        tbii = tbid & !p0.tbid;
-    }
+    tbid = aa64_va_parameter_tbi(tcr, mmu_idx);
+    tbii = tbid & ~aa64_va_parameter_tbid(tcr, mmu_idx);
 
     flags = FIELD_DP32(flags, TBFLAG_A64, TBII, tbii);
     flags = FIELD_DP32(flags, TBFLAG_A64, TBID, tbid);
-- 
2.20.1

Enforce a convention that an isar_feature function that tests a
32-bit ID register always has _aa32_ in its name, and one that
tests a 64-bit ID register always has _aa64_ in its name.
We already follow this except for three cases: thumb_div,
arm_div and jazelle, which all need _aa32_ adding.

(As noted in the comment, isar_feature_aa32_fp16_arith()
is an exception in that it currently tests ID_AA64PFR0_EL1,
but will switch to MVFR1 once we've properly implemented
FP16 for AArch32.)

Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-2-peter.maydell@linaro.org
---
 target/arm/cpu.h       | 13 ++++++++++---
 target/arm/internals.h |  2 +-
 linux-user/elfload.c   |  4 ++--
 target/arm/cpu.c       |  6 ++++--
 target/arm/helper.c    |  2 +-
 target/arm/translate.c |  6 +++---
 6 files changed, 21 insertions(+), 12 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline uint64_t *aa64_vfp_qreg(CPUARMState *env, unsigned regno)
 /* Shared between translate-sve.c and sve_helper.c.  */
 extern const uint64_t pred_esz_masks[4];
 
+/*
+ * Naming convention for isar_feature functions:
+ * Functions which test 32-bit ID registers should have _aa32_ in
+ * their name. Functions which test 64-bit ID registers should have
+ * _aa64_ in their name.
+ */
+
 /*
  * 32-bit feature tests via id registers.
  */
-static inline bool isar_feature_thumb_div(const ARMISARegisters *id)
+static inline bool isar_feature_aa32_thumb_div(const ARMISARegisters *id)
 {
     return FIELD_EX32(id->id_isar0, ID_ISAR0, DIVIDE) != 0;
 }
 
-static inline bool isar_feature_arm_div(const ARMISARegisters *id)
+static inline bool isar_feature_aa32_arm_div(const ARMISARegisters *id)
 {
     return FIELD_EX32(id->id_isar0, ID_ISAR0, DIVIDE) > 1;
 }
 
-static inline bool isar_feature_jazelle(const ARMISARegisters *id)
+static inline bool isar_feature_aa32_jazelle(const ARMISARegisters *id)
 {
     return FIELD_EX32(id->id_isar1, ID_ISAR1, JAZELLE) != 0;
 }
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline uint32_t aarch32_cpsr_valid_mask(uint64_t features,
     if ((features >> ARM_FEATURE_THUMB2) & 1) {
         valid |= CPSR_IT;
     }
-    if (isar_feature_jazelle(id)) {
+    if (isar_feature_aa32_jazelle(id)) {
         valid |= CPSR_J;
     }
     if (isar_feature_aa32_pan(id)) {
diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
     GET_FEATURE(ARM_FEATURE_VFP3, ARM_HWCAP_ARM_VFPv3);
     GET_FEATURE(ARM_FEATURE_V6K, ARM_HWCAP_ARM_TLS);
     GET_FEATURE(ARM_FEATURE_VFP4, ARM_HWCAP_ARM_VFPv4);
-    GET_FEATURE_ID(arm_div, ARM_HWCAP_ARM_IDIVA);
-    GET_FEATURE_ID(thumb_div, ARM_HWCAP_ARM_IDIVT);
+    GET_FEATURE_ID(aa32_arm_div, ARM_HWCAP_ARM_IDIVA);
+    GET_FEATURE_ID(aa32_thumb_div, ARM_HWCAP_ARM_IDIVT);
     /* All QEMU's VFPv3 CPUs have 32 registers, see VFP_DREG in translate.c.
      * Note that the ARM_HWCAP_ARM_VFPv3D16 bit is always the inverse of
      * ARM_HWCAP_ARM_VFPD32 (and so always clear for QEMU); it is unrelated
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
          * Presence of EL2 itself is ARM_FEATURE_EL2, and of the
          * Security Extensions is ARM_FEATURE_EL3.
          */
-        assert(!tcg_enabled() || no_aa32 || cpu_isar_feature(arm_div, cpu));
+        assert(!tcg_enabled() || no_aa32 ||
+               cpu_isar_feature(aa32_arm_div, cpu));
         set_feature(env, ARM_FEATURE_LPAE);
         set_feature(env, ARM_FEATURE_V7);
     }
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
     if (arm_feature(env, ARM_FEATURE_V6)) {
         set_feature(env, ARM_FEATURE_V5);
         if (!arm_feature(env, ARM_FEATURE_M)) {
-            assert(!tcg_enabled() || no_aa32 || cpu_isar_feature(jazelle, cpu));
+            assert(!tcg_enabled() || no_aa32 ||
+                   cpu_isar_feature(aa32_jazelle, cpu));
             set_feature(env, ARM_FEATURE_AUXCR);
         }
     }
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
     if (arm_feature(env, ARM_FEATURE_LPAE)) {
         define_arm_cp_regs(cpu, lpae_cp_reginfo);
     }
-    if (cpu_isar_feature(jazelle, cpu)) {
+    if (cpu_isar_feature(aa32_jazelle, cpu)) {
         define_arm_cp_regs(cpu, jazelle_regs);
     }
     /* Slightly awkwardly, the OMAP and StrongARM cores need all of
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@
 #define ENABLE_ARCH_5     arm_dc_feature(s, ARM_FEATURE_V5)
 /* currently all emulated v5 cores are also v5TE, so don't bother */
 #define ENABLE_ARCH_5TE   arm_dc_feature(s, ARM_FEATURE_V5)
-#define ENABLE_ARCH_5J    dc_isar_feature(jazelle, s)
+#define ENABLE_ARCH_5J    dc_isar_feature(aa32_jazelle, s)
 #define ENABLE_ARCH_6     arm_dc_feature(s, ARM_FEATURE_V6)
 #define ENABLE_ARCH_6K    arm_dc_feature(s, ARM_FEATURE_V6K)
 #define ENABLE_ARCH_6T2   arm_dc_feature(s, ARM_FEATURE_THUMB2)
@@ -XXX,XX +XXX,XX @@ static bool op_div(DisasContext *s, arg_rrr *a, bool u)
     TCGv_i32 t1, t2;
 
     if (s->thumb
-        ? !dc_isar_feature(thumb_div, s)
-        : !dc_isar_feature(arm_div, s)) {
+        ? !dc_isar_feature(aa32_thumb_div, s)
+        : !dc_isar_feature(aa32_arm_div, s)) {
         return false;
     }
 
-- 
2.20.1

Our current usage of the isar_feature feature tests almost always
uses an _aa32_ test when the code path is known to be AArch32
specific and an _aa64_ test when the code path is known to be
AArch64 specific. There is just one exception: in the vfp_set_fpscr
helper we check aa64_fp16 to determine whether the FZ16 bit in
the FP(S)CR exists, but this code is also used for AArch32.
There are other places in future where we're likely to want
a general "does this feature exist for either AArch32 or
AArch64" check (typically where architecturally the feature exists
for both CPU states if it exists at all, but the CPU might be
AArch32-only or AArch64-only, and so only have one set of ID
registers).

Introduce a new category of isar_feature_* functions:
isar_feature_any_foo() should be tested when what we want to
know is "does this feature exist for either AArch32 or AArch64",
and always returns the logical OR of isar_feature_aa32_foo()
and isar_feature_aa64_foo().

Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-4-peter.maydell@linaro.org
---
 target/arm/cpu.h        | 19 ++++++++++++++++++-
 target/arm/vfp_helper.c |  2 +-
 2 files changed, 19 insertions(+), 2 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ extern const uint64_t pred_esz_masks[4];
  * Naming convention for isar_feature functions:
  * Functions which test 32-bit ID registers should have _aa32_ in
  * their name. Functions which test 64-bit ID registers should have
- * _aa64_ in their name.
+ * _aa64_ in their name. These must only be used in code where we
+ * know for certain that the CPU has AArch32 or AArch64 respectively
+ * or where the correct answer for a CPU which doesn't implement that
+ * CPU state is "false" (eg when generating A32 or A64 code, if adding
+ * system registers that are specific to that CPU state, for "should
+ * we let this system register bit be set" tests where the 32-bit
+ * flavour of the register doesn't have the bit, and so on).
+ * Functions which simply ask "does this feature exist at all" have
+ * _any_ in their name, and always return the logical OR of the _aa64_
+ * and the _aa32_ function.
  */
 
 /*
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_bti(const ARMISARegisters *id)
     return FIELD_EX64(id->id_aa64pfr1, ID_AA64PFR1, BT) != 0;
 }
 
+/*
+ * Feature tests for "does this exist in either 32-bit or 64-bit?"
+ */
+static inline bool isar_feature_any_fp16(const ARMISARegisters *id)
+{
+    return isar_feature_aa64_fp16(id) || isar_feature_aa32_fp16_arith(id);
+}
+
 /*
  * Forward to the above feature tests given an ARMCPU pointer.
  */
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t vfp_get_fpscr(CPUARMState *env)
 void HELPER(vfp_set_fpscr)(CPUARMState *env, uint32_t val)
 {
     /* When ARMv8.2-FP16 is not supported, FZ16 is RES0.  */
-    if (!cpu_isar_feature(aa64_fp16, env_archcpu(env))) {
+    if (!cpu_isar_feature(any_fp16, env_archcpu(env))) {
         val &= ~FPCR_FZ16;
     }
 
-- 
2.20.1

Instead of open-coding "ARM_FEATURE_AARCH64 ? aa64_predinv: aa32_predinv",
define and use an any_predinv isar_feature test function.

Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-5-peter.maydell@linaro.org
---
 target/arm/cpu.h    | 5 +++++
 target/arm/helper.c | 9 +--------
 2 files changed, 6 insertions(+), 8 deletions(-)

Pull the code that defines the various PMU registers out
into its own function, matching the pattern we have
already for the debug registers.

Apart from one style fix to a multi-line comment, this
is purely movement of code with no changes to it.

Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-6-peter.maydell@linaro.org
---
 target/arm/helper.c | 158 +++++++++++++++++++++++---------------------
 1 file changed, 82 insertions(+), 76 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
     }
 }
 
+static void define_pmu_regs(ARMCPU *cpu)
+{
+    /*
+     * v7 performance monitor control register: same implementor
+     * field as main ID register, and we implement four counters in
+     * addition to the cycle count register.
+     */
+    unsigned int i, pmcrn = 4;
+    ARMCPRegInfo pmcr = {
+        .name = "PMCR", .cp = 15, .crn = 9, .crm = 12, .opc1 = 0, .opc2 = 0,
+        .access = PL0_RW,
+        .type = ARM_CP_IO | ARM_CP_ALIAS,
+        .fieldoffset = offsetoflow32(CPUARMState, cp15.c9_pmcr),
+        .accessfn = pmreg_access, .writefn = pmcr_write,
+        .raw_writefn = raw_write,
+    };
+    ARMCPRegInfo pmcr64 = {
+        .name = "PMCR_EL0", .state = ARM_CP_STATE_AA64,
+        .opc0 = 3, .opc1 = 3, .crn = 9, .crm = 12, .opc2 = 0,
+        .access = PL0_RW, .accessfn = pmreg_access,
+        .type = ARM_CP_IO,
+        .fieldoffset = offsetof(CPUARMState, cp15.c9_pmcr),
+        .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT),
+        .writefn = pmcr_write, .raw_writefn = raw_write,
+    };
+    define_one_arm_cp_reg(cpu, &pmcr);
+    define_one_arm_cp_reg(cpu, &pmcr64);
+    for (i = 0; i < pmcrn; i++) {
+        char *pmevcntr_name = g_strdup_printf("PMEVCNTR%d", i);
+        char *pmevcntr_el0_name = g_strdup_printf("PMEVCNTR%d_EL0", i);
+        char *pmevtyper_name = g_strdup_printf("PMEVTYPER%d", i);
+        char *pmevtyper_el0_name = g_strdup_printf("PMEVTYPER%d_EL0", i);
+        ARMCPRegInfo pmev_regs[] = {
+            { .name = pmevcntr_name, .cp = 15, .crn = 14,
+              .crm = 8 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
+              .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
+              .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
+              .accessfn = pmreg_access },
+            { .name = pmevcntr_el0_name, .state = ARM_CP_STATE_AA64,
+              .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 8 | (3 & (i >> 3)),
+              .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
+              .type = ARM_CP_IO,
+              .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
+              .raw_readfn = pmevcntr_rawread,
+              .raw_writefn = pmevcntr_rawwrite },
+            { .name = pmevtyper_name, .cp = 15, .crn = 14,
+              .crm = 12 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
+              .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
+              .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
+              .accessfn = pmreg_access },
+            { .name = pmevtyper_el0_name, .state = ARM_CP_STATE_AA64,
+              .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 12 | (3 & (i >> 3)),
+              .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
+              .type = ARM_CP_IO,
+              .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
+              .raw_writefn = pmevtyper_rawwrite },
+            REGINFO_SENTINEL
+        };
+        define_arm_cp_regs(cpu, pmev_regs);
+        g_free(pmevcntr_name);
+        g_free(pmevcntr_el0_name);
+        g_free(pmevtyper_name);
+        g_free(pmevtyper_el0_name);
+    }
+    if (FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
+            FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) != 0xf) {
+        ARMCPRegInfo v81_pmu_regs[] = {
+            { .name = "PMCEID2", .state = ARM_CP_STATE_AA32,
+              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 4,
+              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
+              .resetvalue = extract64(cpu->pmceid0, 32, 32) },
+            { .name = "PMCEID3", .state = ARM_CP_STATE_AA32,
+              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 5,
+              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
+              .resetvalue = extract64(cpu->pmceid1, 32, 32) },
+            REGINFO_SENTINEL
+        };
+        define_arm_cp_regs(cpu, v81_pmu_regs);
+    }
+}
+
 /* We don't know until after realize whether there's a GICv3
  * attached, and that is what registers the gicv3 sysregs.
  * So we have to fill in the GIC fields in ID_PFR/ID_PFR1_EL1/ID_AA64PFR0_EL1
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
         define_arm_cp_regs(cpu, pmovsset_cp_reginfo);
     }
     if (arm_feature(env, ARM_FEATURE_V7)) {
-        /* v7 performance monitor control register: same implementor
-         * field as main ID register, and we implement four counters in
-         * addition to the cycle count register.
-         */
-        unsigned int i, pmcrn = 4;
-        ARMCPRegInfo pmcr = {
-            .name = "PMCR", .cp = 15, .crn = 9, .crm = 12, .opc1 = 0, .opc2 = 0,
-            .access = PL0_RW,
-            .type = ARM_CP_IO | ARM_CP_ALIAS,
-            .fieldoffset = offsetoflow32(CPUARMState, cp15.c9_pmcr),
-            .accessfn = pmreg_access, .writefn = pmcr_write,
-            .raw_writefn = raw_write,
-        };
-        ARMCPRegInfo pmcr64 = {
-            .name = "PMCR_EL0", .state = ARM_CP_STATE_AA64,
-            .opc0 = 3, .opc1 = 3, .crn = 9, .crm = 12, .opc2 = 0,
-            .access = PL0_RW, .accessfn = pmreg_access,
-            .type = ARM_CP_IO,
-            .fieldoffset = offsetof(CPUARMState, cp15.c9_pmcr),
-            .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT),
-            .writefn = pmcr_write, .raw_writefn = raw_write,
-        };
-        define_one_arm_cp_reg(cpu, &pmcr);
-        define_one_arm_cp_reg(cpu, &pmcr64);
-        for (i = 0; i < pmcrn; i++) {
-            char *pmevcntr_name = g_strdup_printf("PMEVCNTR%d", i);
-            char *pmevcntr_el0_name = g_strdup_printf("PMEVCNTR%d_EL0", i);
-            char *pmevtyper_name = g_strdup_printf("PMEVTYPER%d", i);
-            char *pmevtyper_el0_name = g_strdup_printf("PMEVTYPER%d_EL0", i);
-            ARMCPRegInfo pmev_regs[] = {
-                { .name = pmevcntr_name, .cp = 15, .crn = 14,
-                  .crm = 8 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
-                  .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
-                  .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
-                  .accessfn = pmreg_access },
-                { .name = pmevcntr_el0_name, .state = ARM_CP_STATE_AA64,
-                  .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 8 | (3 & (i >> 3)),
-                  .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
-                  .type = ARM_CP_IO,
-                  .readfn = pmevcntr_readfn, .writefn = pmevcntr_writefn,
-                  .raw_readfn = pmevcntr_rawread,
-                  .raw_writefn = pmevcntr_rawwrite },
-                { .name = pmevtyper_name, .cp = 15, .crn = 14,
-                  .crm = 12 | (3 & (i >> 3)), .opc1 = 0, .opc2 = i & 7,
-                  .access = PL0_RW, .type = ARM_CP_IO | ARM_CP_ALIAS,
-                  .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
-                  .accessfn = pmreg_access },
-                { .name = pmevtyper_el0_name, .state = ARM_CP_STATE_AA64,
-                  .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 12 | (3 & (i >> 3)),
-                  .opc2 = i & 7, .access = PL0_RW, .accessfn = pmreg_access,
-                  .type = ARM_CP_IO,
-                  .readfn = pmevtyper_readfn, .writefn = pmevtyper_writefn,
-                  .raw_writefn = pmevtyper_rawwrite },
-                REGINFO_SENTINEL
-            };
-            define_arm_cp_regs(cpu, pmev_regs);
-            g_free(pmevcntr_name);
-            g_free(pmevcntr_el0_name);
-            g_free(pmevtyper_name);
-            g_free(pmevtyper_el0_name);
-        }
         ARMCPRegInfo clidr = {
             .name = "CLIDR", .state = ARM_CP_STATE_BOTH,
             .opc0 = 3, .crn = 0, .crm = 0, .opc1 = 1, .opc2 = 1,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
         define_one_arm_cp_reg(cpu, &clidr);
         define_arm_cp_regs(cpu, v7_cp_reginfo);
         define_debug_regs(cpu);
+        define_pmu_regs(cpu);
     } else {
         define_arm_cp_regs(cpu, not_v7_cp_reginfo);
     }
-    if (FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
-            FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) != 0xf) {
-        ARMCPRegInfo v81_pmu_regs[] = {
-            { .name = "PMCEID2", .state = ARM_CP_STATE_AA32,
-              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 4,
-              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
-              .resetvalue = extract64(cpu->pmceid0, 32, 32) },
-            { .name = "PMCEID3", .state = ARM_CP_STATE_AA32,
-              .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 5,
-              .access = PL0_R, .accessfn = pmreg_access, .type = ARM_CP_CONST,
-              .resetvalue = extract64(cpu->pmceid1, 32, 32) },
-            REGINFO_SENTINEL
-        };
-        define_arm_cp_regs(cpu, v81_pmu_regs);
-    }
     if (arm_feature(env, ARM_FEATURE_V8)) {
         /* AArch64 ID registers, which all have impdef reset values.
          * Note that within the ID register ranges the unused slots
-- 
2.20.1

Add FIELD() definitions for the ID_AA64DFR0_EL1 and use them
where we currently have hard-coded bit values.

Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-7-peter.maydell@linaro.org
---
 target/arm/cpu.h    | 10 ++++++++++
 target/arm/cpu.c    |  2 +-
 target/arm/helper.c |  6 +++---
 3 files changed, 14 insertions(+), 4 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ FIELD(ID_AA64MMFR2, BBM, 52, 4)
 FIELD(ID_AA64MMFR2, EVT, 56, 4)
 FIELD(ID_AA64MMFR2, E0PD, 60, 4)
 
+FIELD(ID_AA64DFR0, DEBUGVER, 0, 4)
+FIELD(ID_AA64DFR0, TRACEVER, 4, 4)
+FIELD(ID_AA64DFR0, PMUVER, 8, 4)
+FIELD(ID_AA64DFR0, BRPS, 12, 4)
+FIELD(ID_AA64DFR0, WRPS, 20, 4)
+FIELD(ID_AA64DFR0, CTX_CMPS, 28, 4)
+FIELD(ID_AA64DFR0, PMSVER, 32, 4)
+FIELD(ID_AA64DFR0, DOUBLELOCK, 36, 4)
+FIELD(ID_AA64DFR0, TRACEFILT, 40, 4)
+
 FIELD(ID_DFR0, COPDBG, 0, 4)
 FIELD(ID_DFR0, COPSDBG, 4, 4)
 FIELD(ID_DFR0, MMAPDBG, 8, 4)
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
                 cpu);
 #endif
     } else {
-        cpu->id_aa64dfr0 &= ~0xf00;
+        cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
         cpu->id_dfr0 &= ~(0xf << 24);
         cpu->pmceid0 = 0;
         cpu->pmceid1 = 0;
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
      * check that if they both exist then they agree.
      */
     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-        assert(extract32(cpu->id_aa64dfr0, 12, 4) == brps);
-        assert(extract32(cpu->id_aa64dfr0, 20, 4) == wrps);
-        assert(extract32(cpu->id_aa64dfr0, 28, 4) == ctx_cmps);
+        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
+        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
+        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) == ctx_cmps);
     }
 
     define_one_arm_cp_reg(cpu, &dbgdidr);
-- 
2.20.1

Instead of open-coding a check on the ID_DFR0 PerfMon ID register
field, create a standardly-named isar_feature for "does AArch32 have
a v8.1 PMUv3" and use it.

This entails moving the id_dfr0 field into the ARMISARegisters struct.

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-9-peter.maydell@linaro.org
---
 target/arm/cpu.h      |  9 ++++++++-
 hw/intc/armv7m_nvic.c |  2 +-
 target/arm/cpu.c      | 28 ++++++++++++++--------------
 target/arm/cpu64.c    |  6 +++---
 target/arm/helper.c   |  5 ++---
 5 files changed, 28 insertions(+), 22 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
         uint32_t mvfr0;
         uint32_t mvfr1;
         uint32_t mvfr2;
+        uint32_t id_dfr0;
         uint64_t id_aa64isar0;
         uint64_t id_aa64isar1;
         uint64_t id_aa64pfr0;
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
     uint32_t reset_sctlr;
     uint32_t id_pfr0;
     uint32_t id_pfr1;
-    uint32_t id_dfr0;
     uint64_t pmceid0;
     uint64_t pmceid1;
     uint32_t id_afr0;
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_ats1e1(const ARMISARegisters *id)
     return FIELD_EX64(id->mvfr0, ID_MMFR3, PAN) >= 2;
 }
 
+static inline bool isar_feature_aa32_pmu_8_1(const ARMISARegisters *id)
+{
+    /* 0xf means "non-standard IMPDEF PMU" */
+    return FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
+        FIELD_EX32(id->id_dfr0, ID_DFR0, PERFMON) != 0xf;
+}
+
 /*
  * 64-bit feature tests via id registers.
  */
diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/armv7m_nvic.c
+++ b/hw/intc/armv7m_nvic.c
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
     case 0xd44: /* PFR1.  */
         return cpu->id_pfr1;
     case 0xd48: /* DFR0.  */
-        return cpu->id_dfr0;
+        return cpu->isar.id_dfr0;
     case 0xd4c: /* AFR0.  */
         return cpu->id_afr0;
     case 0xd50: /* MMFR0.  */
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
 #endif
     } else {
         cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
-        cpu->id_dfr0 = FIELD_DP32(cpu->id_dfr0, ID_DFR0, PERFMON, 0);
+        cpu->isar.id_dfr0 = FIELD_DP32(cpu->isar.id_dfr0, ID_DFR0, PERFMON, 0);
         cpu->pmceid0 = 0;
         cpu->pmceid1 = 0;
     }
@@ -XXX,XX +XXX,XX @@ static void arm1136_r2_initfn(Object *obj)
     cpu->reset_sctlr = 0x00050078;
     cpu->id_pfr0 = 0x111;
     cpu->id_pfr1 = 0x1;
-    cpu->id_dfr0 = 0x2;
+    cpu->isar.id_dfr0 = 0x2;
     cpu->id_afr0 = 0x3;
     cpu->id_mmfr0 = 0x01130003;
     cpu->id_mmfr1 = 0x10030302;
@@ -XXX,XX +XXX,XX @@ static void arm1136_initfn(Object *obj)
     cpu->reset_sctlr = 0x00050078;
     cpu->id_pfr0 = 0x111;
     cpu->id_pfr1 = 0x1;
-    cpu->id_dfr0 = 0x2;
+    cpu->isar.id_dfr0 = 0x2;
     cpu->id_afr0 = 0x3;
     cpu->id_mmfr0 = 0x01130003;
     cpu->id_mmfr1 = 0x10030302;
@@ -XXX,XX +XXX,XX @@ static void arm1176_initfn(Object *obj)
     cpu->reset_sctlr = 0x00050078;
     cpu->id_pfr0 = 0x111;
     cpu->id_pfr1 = 0x11;
-    cpu->id_dfr0 = 0x33;
+    cpu->isar.id_dfr0 = 0x33;
     cpu->id_afr0 = 0;
     cpu->id_mmfr0 = 0x01130003;
     cpu->id_mmfr1 = 0x10030302;
@@ -XXX,XX +XXX,XX @@ static void arm11mpcore_initfn(Object *obj)
     cpu->ctr = 0x1d192992; /* 32K icache 32K dcache */
     cpu->id_pfr0 = 0x111;
     cpu->id_pfr1 = 0x1;
-    cpu->id_dfr0 = 0;
+    cpu->isar.id_dfr0 = 0;
     cpu->id_afr0 = 0x2;
     cpu->id_mmfr0 = 0x01100103;
     cpu->id_mmfr1 = 0x10020302;
@@ -XXX,XX +XXX,XX @@ static void cortex_m3_initfn(Object *obj)
     cpu->pmsav7_dregion = 8;
     cpu->id_pfr0 = 0x00000030;
     cpu->id_pfr1 = 0x00000200;
-    cpu->id_dfr0 = 0x00100000;
+    cpu->isar.id_dfr0 = 0x00100000;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x00000030;
     cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_m4_initfn(Object *obj)
     cpu->isar.mvfr2 = 0x00000000;
     cpu->id_pfr0 = 0x00000030;
     cpu->id_pfr1 = 0x00000200;
-    cpu->id_dfr0 = 0x00100000;
+    cpu->isar.id_dfr0 = 0x00100000;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x00000030;
     cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_m7_initfn(Object *obj)
     cpu->isar.mvfr2 = 0x00000040;
     cpu->id_pfr0 = 0x00000030;
     cpu->id_pfr1 = 0x00000200;
-    cpu->id_dfr0 = 0x00100000;
+    cpu->isar.id_dfr0 = 0x00100000;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x00100030;
     cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_m33_initfn(Object *obj)
     cpu->isar.mvfr2 = 0x00000040;
     cpu->id_pfr0 = 0x00000030;
     cpu->id_pfr1 = 0x00000210;
-    cpu->id_dfr0 = 0x00200000;
+    cpu->isar.id_dfr0 = 0x00200000;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x00101F40;
     cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
     cpu->midr = 0x411fc153; /* r1p3 */
     cpu->id_pfr0 = 0x0131;
     cpu->id_pfr1 = 0x001;
-    cpu->id_dfr0 = 0x010400;
+    cpu->isar.id_dfr0 = 0x010400;
     cpu->id_afr0 = 0x0;
     cpu->id_mmfr0 = 0x0210030;
     cpu->id_mmfr1 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a8_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50078;
     cpu->id_pfr0 = 0x1031;
     cpu->id_pfr1 = 0x11;
-    cpu->id_dfr0 = 0x400;
+    cpu->isar.id_dfr0 = 0x400;
     cpu->id_afr0 = 0;
     cpu->id_mmfr0 = 0x31100003;
     cpu->id_mmfr1 = 0x20000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a9_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50078;
     cpu->id_pfr0 = 0x1031;
     cpu->id_pfr1 = 0x11;
-    cpu->id_dfr0 = 0x000;
+    cpu->isar.id_dfr0 = 0x000;
     cpu->id_afr0 = 0;
     cpu->id_mmfr0 = 0x00100103;
     cpu->id_mmfr1 = 0x20000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50078;
     cpu->id_pfr0 = 0x00001131;
     cpu->id_pfr1 = 0x00011011;
-    cpu->id_dfr0 = 0x02010555;
+    cpu->isar.id_dfr0 = 0x02010555;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x10101105;
     cpu->id_mmfr1 = 0x40000000;
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50078;
     cpu->id_pfr0 = 0x00001131;
     cpu->id_pfr1 = 0x00011011;
-    cpu->id_dfr0 = 0x02010555;
+    cpu->isar.id_dfr0 = 0x02010555;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x10201105;
     cpu->id_mmfr1 = 0x20000000;
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50838;
     cpu->id_pfr0 = 0x00000131;
     cpu->id_pfr1 = 0x00011011;
-    cpu->id_dfr0 = 0x03010066;
+    cpu->isar.id_dfr0 = 0x03010066;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x10101105;
     cpu->id_mmfr1 = 0x40000000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50838;
     cpu->id_pfr0 = 0x00000131;
     cpu->id_pfr1 = 0x00011011;
-    cpu->id_dfr0 = 0x03010066;
+    cpu->isar.id_dfr0 = 0x03010066;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x10101105;
     cpu->id_mmfr1 = 0x40000000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
     cpu->reset_sctlr = 0x00c50838;
     cpu->id_pfr0 = 0x00000131;
     cpu->id_pfr1 = 0x00011011;
-    cpu->id_dfr0 = 0x03010066;
+    cpu->isar.id_dfr0 = 0x03010066;
     cpu->id_afr0 = 0x00000000;
     cpu->id_mmfr0 = 0x10201105;
     cpu->id_mmfr1 = 0x40000000;
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void define_pmu_regs(ARMCPU *cpu)
         g_free(pmevtyper_name);
         g_free(pmevtyper_el0_name);
     }
-    if (FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) >= 4 &&
-            FIELD_EX32(cpu->id_dfr0, ID_DFR0, PERFMON) != 0xf) {
+    if (cpu_isar_feature(aa32_pmu_8_1, cpu)) {
         ARMCPRegInfo v81_pmu_regs[] = {
             { .name = "PMCEID2", .state = ARM_CP_STATE_AA32,
               .cp = 15, .opc1 = 0, .crn = 9, .crm = 14, .opc2 = 4,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 2,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa32_tid3,
-              .resetvalue = cpu->id_dfr0 },
+              .resetvalue = cpu->isar.id_dfr0 },
             { .name = "ID_AFR0", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 3,
               .access = PL1_R, .type = ARM_CP_CONST,
-- 
2.20.1

Add the 64-bit version of the "is this a v8.1 PMUv3?"
ID register check function, and the _any_ version that
checks for either AArch32 or AArch64 support. We'll use
this in a later commit.

We don't (yet) do any isar_feature checks on ID_AA64DFR1_EL1,
but we move id_aa64dfr1 into the ARMISARegisters struct with
id_aa64dfr0, for consistency.

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-10-peter.maydell@linaro.org
---
 target/arm/cpu.h    | 15 +++++++++++++--
 target/arm/cpu.c    |  3 ++-
 target/arm/cpu64.c  |  6 +++---
 target/arm/helper.c | 12 +++++++-----
 4 files changed, 25 insertions(+), 11 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
         uint64_t id_aa64mmfr0;
         uint64_t id_aa64mmfr1;
         uint64_t id_aa64mmfr2;
+        uint64_t id_aa64dfr0;
+        uint64_t id_aa64dfr1;
     } isar;
     uint32_t midr;
     uint32_t revidr;
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
     uint32_t id_mmfr2;
     uint32_t id_mmfr3;
     uint32_t id_mmfr4;
-    uint64_t id_aa64dfr0;
-    uint64_t id_aa64dfr1;
     uint64_t id_aa64afr0;
     uint64_t id_aa64afr1;
     uint32_t dbgdidr;
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa64_bti(const ARMISARegisters *id)
     return FIELD_EX64(id->id_aa64pfr1, ID_AA64PFR1, BT) != 0;
 }
 
+static inline bool isar_feature_aa64_pmu_8_1(const ARMISARegisters *id)
+{
+    return FIELD_EX64(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) >= 4 &&
+        FIELD_EX64(id->id_aa64dfr0, ID_AA64DFR0, PMUVER) != 0xf;
+}
+
 /*
  * Feature tests for "does this exist in either 32-bit or 64-bit?"
  */
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_any_predinv(const ARMISARegisters *id)
     return isar_feature_aa64_predinv(id) || isar_feature_aa32_predinv(id);
 }
 
+static inline bool isar_feature_any_pmu_8_1(const ARMISARegisters *id)
+{
+    return isar_feature_aa64_pmu_8_1(id) || isar_feature_aa32_pmu_8_1(id);
+}
+
 /*
  * Forward to the above feature tests given an ARMCPU pointer.
  */
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
                 cpu);
 #endif
     } else {
-        cpu->id_aa64dfr0 = FIELD_DP64(cpu->id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
+        cpu->isar.id_aa64dfr0 =
+            FIELD_DP64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, PMUVER, 0);
         cpu->isar.id_dfr0 = FIELD_DP32(cpu->isar.id_dfr0, ID_DFR0, PERFMON, 0);
         cpu->pmceid0 = 0;
         cpu->pmceid1 = 0;
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
     cpu->isar.id_isar5 = 0x00011121;
     cpu->isar.id_isar6 = 0;
     cpu->isar.id_aa64pfr0 = 0x00002222;
-    cpu->id_aa64dfr0 = 0x10305106;
+    cpu->isar.id_aa64dfr0 = 0x10305106;
     cpu->isar.id_aa64isar0 = 0x00011120;
     cpu->isar.id_aa64mmfr0 = 0x00001124;
     cpu->dbgdidr = 0x3516d000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
     cpu->isar.id_isar5 = 0x00011121;
     cpu->isar.id_isar6 = 0;
     cpu->isar.id_aa64pfr0 = 0x00002222;
-    cpu->id_aa64dfr0 = 0x10305106;
+    cpu->isar.id_aa64dfr0 = 0x10305106;
     cpu->isar.id_aa64isar0 = 0x00011120;
     cpu->isar.id_aa64mmfr0 = 0x00001122; /* 40 bit physical addr */
     cpu->dbgdidr = 0x3516d000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
     cpu->isar.id_isar4 = 0x00011142;
     cpu->isar.id_isar5 = 0x00011121;
     cpu->isar.id_aa64pfr0 = 0x00002222;
-    cpu->id_aa64dfr0 = 0x10305106;
+    cpu->isar.id_aa64dfr0 = 0x10305106;
     cpu->isar.id_aa64isar0 = 0x00011120;
     cpu->isar.id_aa64mmfr0 = 0x00001124;
     cpu->dbgdidr = 0x3516d000;
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/semihosting/semihost.h"
 #include "sysemu/cpus.h"
 #include "sysemu/kvm.h"
+#include "sysemu/tcg.h"
 #include "qemu/range.h"
 #include "qapi/qapi-commands-machine-target.h"
 #include "qapi/error.h"
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
      * check that if they both exist then they agree.
      */
     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
-        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
-        assert(FIELD_EX64(cpu->id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) == ctx_cmps);
+        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
+        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
+        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS)
+               == ctx_cmps);
     }
 
     define_one_arm_cp_reg(cpu, &dbgdidr);
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 5, .opc2 = 0,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa64_tid3,
-              .resetvalue = cpu->id_aa64dfr0 },
+              .resetvalue = cpu->isar.id_aa64dfr0 },
             { .name = "ID_AA64DFR1_EL1", .state = ARM_CP_STATE_AA64,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 5, .opc2 = 1,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa64_tid3,
-              .resetvalue = cpu->id_aa64dfr1 },
+              .resetvalue = cpu->isar.id_aa64dfr1 },
             { .name = "ID_AA64DFR2_EL1_RESERVED", .state = ARM_CP_STATE_AA64,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 5, .opc2 = 2,
               .access = PL1_R, .type = ARM_CP_CONST,
-- 
2.20.1

The AArch32 DBGDIDR defines properties like the number of
breakpoints, watchpoints and context-matching comparators.  On an
AArch64 CPU, the register may not even exist if AArch32 is not
supported at EL1.

Currently we hard-code use of DBGDIDR to identify the number of
breakpoints etc; this works for all our TCG CPUs, but will break if
we ever add an AArch64-only CPU.  We also have an assert() that the
AArch32 and AArch64 registers match, which currently works only by
luck for KVM because we don't populate either of these ID registers
from the KVM vCPU and so they are both zero.

Clean this up so we have functions for finding the number
of breakpoints, watchpoints and context comparators which look
in the appropriate ID register.

This allows us to drop the "check that AArch64 and AArch32 agree
on the number of breakpoints etc" asserts:
 * we no longer look at the AArch32 versions unless that's the
   right place to be looking
 * it's valid to have a CPU (eg AArch64-only) where they don't match
 * we shouldn't have been asserting the validity of ID registers
   in a codepath used with KVM anyway

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-11-peter.maydell@linaro.org
---
 target/arm/cpu.h          |  7 +++++++
 target/arm/internals.h    | 42 +++++++++++++++++++++++++++++++++++++++
 target/arm/debug_helper.c |  6 +++---
 target/arm/helper.c       | 21 +++++---------------
 4 files changed, 57 insertions(+), 19 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ FIELD(ID_DFR0, MPROFDBG, 20, 4)
 FIELD(ID_DFR0, PERFMON, 24, 4)
 FIELD(ID_DFR0, TRACEFILT, 28, 4)
 
+FIELD(DBGDIDR, SE_IMP, 12, 1)
+FIELD(DBGDIDR, NSUHD_IMP, 14, 1)
+FIELD(DBGDIDR, VERSION, 16, 4)
+FIELD(DBGDIDR, CTX_CMPS, 20, 4)
+FIELD(DBGDIDR, BRPS, 24, 4)
+FIELD(DBGDIDR, WRPS, 28, 4)
+
 FIELD(MVFR0, SIMDREG, 0, 4)
 FIELD(MVFR0, FPSP, 4, 4)
 FIELD(MVFR0, FPDP, 8, 4)
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline uint32_t arm_debug_exception_fsr(CPUARMState *env)
     }
 }
 
+/**
+ * arm_num_brps: Return number of implemented breakpoints.
+ * Note that the ID register BRPS field is "number of bps - 1",
+ * and we return the actual number of breakpoints.
+ */
+static inline int arm_num_brps(ARMCPU *cpu)
+{
+    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
+        return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) + 1;
+    } else {
+        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, BRPS) + 1;
+    }
+}
+
+/**
+ * arm_num_wrps: Return number of implemented watchpoints.
+ * Note that the ID register WRPS field is "number of wps - 1",
+ * and we return the actual number of watchpoints.
+ */
+static inline int arm_num_wrps(ARMCPU *cpu)
+{
+    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
+        return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) + 1;
+    } else {
+        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, WRPS) + 1;
+    }
+}
+
+/**
+ * arm_num_ctx_cmps: Return number of implemented context comparators.
+ * Note that the ID register CTX_CMPS field is "number of cmps - 1",
+ * and we return the actual number of comparators.
+ */
+static inline int arm_num_ctx_cmps(ARMCPU *cpu)
+{
+    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
+        return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) + 1;
+    } else {
+        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, CTX_CMPS) + 1;
+    }
+}
+
 /* Note make_memop_idx reserves 4 bits for mmu_idx, and MO_BSWAP is bit 3.
  * Thus a TCGMemOpIdx, without any MO_ALIGN bits, fits in 8 bits.
  */
diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/debug_helper.c
+++ b/target/arm/debug_helper.c
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
 {
     CPUARMState *env = &cpu->env;
     uint64_t bcr = env->cp15.dbgbcr[lbn];
-    int brps = extract32(cpu->dbgdidr, 24, 4);
-    int ctx_cmps = extract32(cpu->dbgdidr, 20, 4);
+    int brps = arm_num_brps(cpu);
+    int ctx_cmps = arm_num_ctx_cmps(cpu);
     int bt;
     uint32_t contextidr;
     uint64_t hcr_el2;
@@ -XXX,XX +XXX,XX @@ static bool linked_bp_matches(ARMCPU *cpu, int lbn)
      * case DBGWCR<n>_EL1.LBN must indicate that breakpoint).
      * We choose the former.
      */
-    if (lbn > brps || lbn < (brps - ctx_cmps)) {
+    if (lbn >= brps || lbn < (brps - ctx_cmps)) {
         return false;
     }
 
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
     };
 
     /* Note that all these register fields hold "number of Xs minus 1". */
-    brps = extract32(cpu->dbgdidr, 24, 4);
-    wrps = extract32(cpu->dbgdidr, 28, 4);
-    ctx_cmps = extract32(cpu->dbgdidr, 20, 4);
+    brps = arm_num_brps(cpu);
+    wrps = arm_num_wrps(cpu);
+    ctx_cmps = arm_num_ctx_cmps(cpu);
 
     assert(ctx_cmps <= brps);
 
-    /* The DBGDIDR and ID_AA64DFR0_EL1 define various properties
-     * of the debug registers such as number of breakpoints;
-     * check that if they both exist then they agree.
-     */
-    if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
-        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) == brps);
-        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) == wrps);
-        assert(FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS)
-               == ctx_cmps);
-    }
-
     define_one_arm_cp_reg(cpu, &dbgdidr);
     define_arm_cp_regs(cpu, debug_cp_reginfo);
 
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
         define_arm_cp_regs(cpu, debug_lpae_cp_reginfo);
     }
 
-    for (i = 0; i < brps + 1; i++) {
+    for (i = 0; i < brps; i++) {
         ARMCPRegInfo dbgregs[] = {
             { .name = "DBGBVR", .state = ARM_CP_STATE_BOTH,
               .cp = 14, .opc0 = 2, .opc1 = 0, .crn = 0, .crm = i, .opc2 = 4,
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
         define_arm_cp_regs(cpu, dbgregs);
     }
 
-    for (i = 0; i < wrps + 1; i++) {
+    for (i = 0; i < wrps; i++) {
         ARMCPRegInfo dbgregs[] = {
             { .name = "DBGWVR", .state = ARM_CP_STATE_BOTH,
               .cp = 14, .opc0 = 2, .opc1 = 0, .crn = 0, .crm = i, .opc2 = 6,
-- 
2.20.1

We're going to want to read the DBGDIDR register from KVM in
a subsequent commit, which means it needs to be in the
ARMISARegisters sub-struct. Move it.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-12-peter.maydell@linaro.org
---
 target/arm/cpu.h       | 2 +-
 target/arm/internals.h | 6 +++---
 target/arm/cpu.c       | 8 ++++----
 target/arm/cpu64.c     | 6 +++---
 target/arm/helper.c    | 2 +-
 5 files changed, 12 insertions(+), 12 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
         uint32_t mvfr1;
         uint32_t mvfr2;
         uint32_t id_dfr0;
+        uint32_t dbgdidr;
         uint64_t id_aa64isar0;
         uint64_t id_aa64isar1;
         uint64_t id_aa64pfr0;
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
     uint32_t id_mmfr4;
     uint64_t id_aa64afr0;
     uint64_t id_aa64afr1;
-    uint32_t dbgdidr;
     uint32_t clidr;
     uint64_t mp_affinity; /* MP ID without feature bits */
     /* The elements of this array are the CCSIDR values for each cache,
diff --git a/target/arm/internals.h b/target/arm/internals.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/internals.h
+++ b/target/arm/internals.h
@@ -XXX,XX +XXX,XX @@ static inline int arm_num_brps(ARMCPU *cpu)
     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
         return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, BRPS) + 1;
     } else {
-        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, BRPS) + 1;
+        return FIELD_EX32(cpu->isar.dbgdidr, DBGDIDR, BRPS) + 1;
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static inline int arm_num_wrps(ARMCPU *cpu)
     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
         return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, WRPS) + 1;
     } else {
-        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, WRPS) + 1;
+        return FIELD_EX32(cpu->isar.dbgdidr, DBGDIDR, WRPS) + 1;
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static inline int arm_num_ctx_cmps(ARMCPU *cpu)
     if (arm_feature(&cpu->env, ARM_FEATURE_AARCH64)) {
         return FIELD_EX64(cpu->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS) + 1;
     } else {
-        return FIELD_EX32(cpu->dbgdidr, DBGDIDR, CTX_CMPS) + 1;
+        return FIELD_EX32(cpu->isar.dbgdidr, DBGDIDR, CTX_CMPS) + 1;
     }
 }
 
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void cortex_a8_initfn(Object *obj)
     cpu->isar.id_isar2 = 0x21232031;
     cpu->isar.id_isar3 = 0x11112131;
     cpu->isar.id_isar4 = 0x00111142;
-    cpu->dbgdidr = 0x15141000;
+    cpu->isar.dbgdidr = 0x15141000;
     cpu->clidr = (1 << 27) | (2 << 24) | 3;
     cpu->ccsidr[0] = 0xe007e01a; /* 16k L1 dcache. */
     cpu->ccsidr[1] = 0x2007e01a; /* 16k L1 icache. */
@@ -XXX,XX +XXX,XX @@ static void cortex_a9_initfn(Object *obj)
     cpu->isar.id_isar2 = 0x21232041;
     cpu->isar.id_isar3 = 0x11112131;
     cpu->isar.id_isar4 = 0x00111142;
-    cpu->dbgdidr = 0x35141000;
+    cpu->isar.dbgdidr = 0x35141000;
     cpu->clidr = (1 << 27) | (1 << 24) | 3;
     cpu->ccsidr[0] = 0xe00fe019; /* 16k L1 dcache. */
     cpu->ccsidr[1] = 0x200fe019; /* 16k L1 icache. */
@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
     cpu->isar.id_isar2 = 0x21232041;
     cpu->isar.id_isar3 = 0x11112131;
     cpu->isar.id_isar4 = 0x10011142;
-    cpu->dbgdidr = 0x3515f005;
+    cpu->isar.dbgdidr = 0x3515f005;
     cpu->clidr = 0x0a200023;
     cpu->ccsidr[0] = 0x701fe00a; /* 32K L1 dcache */
     cpu->ccsidr[1] = 0x201fe00a; /* 32K L1 icache */
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
     cpu->isar.id_isar2 = 0x21232041;
     cpu->isar.id_isar3 = 0x11112131;
     cpu->isar.id_isar4 = 0x10011142;
-    cpu->dbgdidr = 0x3515f021;
+    cpu->isar.dbgdidr = 0x3515f021;
     cpu->clidr = 0x0a200023;
     cpu->ccsidr[0] = 0x701fe00a; /* 32K L1 dcache */
     cpu->ccsidr[1] = 0x201fe00a; /* 32K L1 icache */
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
     cpu->isar.id_aa64dfr0 = 0x10305106;
     cpu->isar.id_aa64isar0 = 0x00011120;
     cpu->isar.id_aa64mmfr0 = 0x00001124;
-    cpu->dbgdidr = 0x3516d000;
+    cpu->isar.dbgdidr = 0x3516d000;
     cpu->clidr = 0x0a200023;
     cpu->ccsidr[0] = 0x701fe00a; /* 32KB L1 dcache */
     cpu->ccsidr[1] = 0x201fe012; /* 48KB L1 icache */
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
     cpu->isar.id_aa64dfr0 = 0x10305106;
     cpu->isar.id_aa64isar0 = 0x00011120;
     cpu->isar.id_aa64mmfr0 = 0x00001122; /* 40 bit physical addr */
-    cpu->dbgdidr = 0x3516d000;
+    cpu->isar.dbgdidr = 0x3516d000;
     cpu->clidr = 0x0a200023;
     cpu->ccsidr[0] = 0x700fe01a; /* 32KB L1 dcache */
     cpu->ccsidr[1] = 0x201fe00a; /* 32KB L1 icache */
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
     cpu->isar.id_aa64dfr0 = 0x10305106;
     cpu->isar.id_aa64isar0 = 0x00011120;
     cpu->isar.id_aa64mmfr0 = 0x00001124;
-    cpu->dbgdidr = 0x3516d000;
+    cpu->isar.dbgdidr = 0x3516d000;
     cpu->clidr = 0x0a200023;
     cpu->ccsidr[0] = 0x701fe00a; /* 32KB L1 dcache */
     cpu->ccsidr[1] = 0x201fe012; /* 48KB L1 icache */
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void define_debug_regs(ARMCPU *cpu)
     ARMCPRegInfo dbgdidr = {
         .name = "DBGDIDR", .cp = 14, .crn = 0, .crm = 0, .opc1 = 0, .opc2 = 0,
         .access = PL0_R, .accessfn = access_tda,
-        .type = ARM_CP_CONST, .resetvalue = cpu->dbgdidr,
+        .type = ARM_CP_CONST, .resetvalue = cpu->isar.dbgdidr,
     };
 
     /* Note that all these register fields hold "number of Xs minus 1". */
-- 
2.20.1

Now we have isar_feature test functions that look at fields in the
ID_AA64DFR0_EL1 and ID_DFR0 ID registers, add the code that reads
these register values from KVM so that the checks behave correctly
when we're using KVM.

No isar_feature function tests ID_AA64DFR1_EL1 or DBGDIDR yet, but we
add it to maintain the invariant that every field in the
ARMISARegisters struct is populated for a KVM CPU and can be relied
on.  This requirement isn't actually written down yet, so add a note
to the relevant comment.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-13-peter.maydell@linaro.org
---
 target/arm/cpu.h   |  5 +++++
 target/arm/kvm32.c |  8 ++++++++
 target/arm/kvm64.c | 36 ++++++++++++++++++++++++++++++++++++
 3 files changed, 49 insertions(+)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
      * prefix means a constant register.
      * Some of these registers are split out into a substructure that
      * is shared with the translators to control the ISA.
+     *
+     * Note that if you add an ID register to the ARMISARegisters struct
+     * you need to also update the 32-bit and 64-bit versions of the
+     * kvm_arm_get_host_cpu_features() function to correctly populate the
+     * field by reading the value from the KVM vCPU.
      */
     struct ARMISARegisters {
         uint32_t id_isar0;
diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/kvm32.c
+++ b/target/arm/kvm32.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
         ahcf->isar.id_isar6 = 0;
     }
 
+    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_dfr0,
+                          ARM_CP15_REG32(0, 0, 1, 2));
+
     err |= read_sys_reg32(fdarray[2], &ahcf->isar.mvfr0,
                           KVM_REG_ARM | KVM_REG_SIZE_U32 |
                           KVM_REG_ARM_VFP | KVM_REG_ARM_VFP_MVFR0);
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
      * Fortunately there is not yet anything in there that affects migration.
      */
 
+    /*
+     * There is no way to read DBGDIDR, because currently 32-bit KVM
+     * doesn't implement debug at all. Leave it at zero.
+     */
+
     kvm_arm_destroy_scratch_host_vcpu(fdarray);
 
     if (err < 0) {
diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/kvm64.c
+++ b/target/arm/kvm64.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
     } else {
         err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64pfr1,
                               ARM64_SYS_REG(3, 0, 0, 4, 1));
+        err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64dfr0,
+                              ARM64_SYS_REG(3, 0, 0, 5, 0));
+        err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64dfr1,
+                              ARM64_SYS_REG(3, 0, 0, 5, 1));
         err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64isar0,
                               ARM64_SYS_REG(3, 0, 0, 6, 0));
         err |= read_sys_reg64(fdarray[2], &ahcf->isar.id_aa64isar1,
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
          * than skipping the reads and leaving 0, as we must avoid
          * considering the values in every case.
          */
+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_dfr0,
+                              ARM64_SYS_REG(3, 0, 0, 1, 2));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar0,
                               ARM64_SYS_REG(3, 0, 0, 2, 0));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar1,
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
                               ARM64_SYS_REG(3, 0, 0, 3, 1));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.mvfr2,
                               ARM64_SYS_REG(3, 0, 0, 3, 2));
+
+        /*
+         * DBGDIDR is a bit complicated because the kernel doesn't
+         * provide an accessor for it in 64-bit mode, which is what this
+         * scratch VM is in, and there's no architected "64-bit sysreg
+         * which reads the same as the 32-bit register" the way there is
+         * for other ID registers. Instead we synthesize a value from the
+         * AArch64 ID_AA64DFR0, the same way the kernel code in
+         * arch/arm64/kvm/sys_regs.c:trap_dbgidr() does.
+         * We only do this if the CPU supports AArch32 at EL1.
+         */
+        if (FIELD_EX32(ahcf->isar.id_aa64pfr0, ID_AA64PFR0, EL1) >= 2) {
+            int wrps = FIELD_EX64(ahcf->isar.id_aa64dfr0, ID_AA64DFR0, WRPS);
+            int brps = FIELD_EX64(ahcf->isar.id_aa64dfr0, ID_AA64DFR0, BRPS);
+            int ctx_cmps =
+                FIELD_EX64(ahcf->isar.id_aa64dfr0, ID_AA64DFR0, CTX_CMPS);
+            int version = 6; /* ARMv8 debug architecture */
+            bool has_el3 =
+                !!FIELD_EX32(ahcf->isar.id_aa64pfr0, ID_AA64PFR0, EL3);
+            uint32_t dbgdidr = 0;
+
+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, WRPS, wrps);
+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, BRPS, brps);
+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, CTX_CMPS, ctx_cmps);
+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, VERSION, version);
+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, NSUHD_IMP, has_el3);
+            dbgdidr = FIELD_DP32(dbgdidr, DBGDIDR, SE_IMP, has_el3);
+            dbgdidr |= (1 << 15); /* RES1 bit */
+            ahcf->isar.dbgdidr = dbgdidr;
+        }
     }
 
     sve_supported = ioctl(fdarray[0], KVM_CHECK_EXTENSION, KVM_CAP_ARM_SVE) > 0;
-- 
2.20.1

The ARMv8.1-PMU extension requires:
 * the evtCount field in PMETYPER<n>_EL0 is 16 bits, not 10
 * MDCR_EL2.HPMD allows event counting to be disabled at EL2
 * two new required events, STALL_FRONTEND and STALL_BACKEND
 * ID register bits in ID_AA64DFR0_EL1 and ID_DFR0

We already implement the 16-bit evtCount field and the
HPMD bit, so all that is missing is the two new events:
  STALL_FRONTEND
   "counts every cycle counted by the CPU_CYCLES event on which no
    operation was issued because there are no operations available
    to issue to this PE from the frontend"
  STALL_BACKEND
   "counts every cycle counted by the CPU_CYCLES event on which no
    operation was issued because the backend is unable to accept
    any available operations from the frontend"

QEMU never stalls in this sense, so our implementation is trivial:
always return a zero count.

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-14-peter.maydell@linaro.org
---
 target/arm/helper.c | 32 ++++++++++++++++++++++++++++++--
 1 file changed, 30 insertions(+), 2 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static int64_t instructions_ns_per(uint64_t icount)
 }
 #endif
 
+static bool pmu_8_1_events_supported(CPUARMState *env)
+{
+    /* For events which are supported in any v8.1 PMU */
+    return cpu_isar_feature(any_pmu_8_1, env_archcpu(env));
+}
+
+static uint64_t zero_event_get_count(CPUARMState *env)
+{
+    /* For events which on QEMU never fire, so their count is always zero */
+    return 0;
+}
+
+static int64_t zero_event_ns_per(uint64_t cycles)
+{
+    /* An event which never fires can never overflow */
+    return -1;
+}
+
 static const pm_event pm_events[] = {
     { .number = 0x000, /* SW_INCR */
       .supported = event_always_supported,
@@ -XXX,XX +XXX,XX @@ static const pm_event pm_events[] = {
       .supported = event_always_supported,
       .get_count = cycles_get_count,
       .ns_per_count = cycles_ns_per,
-    }
+    },
 #endif
+    { .number = 0x023, /* STALL_FRONTEND */
+      .supported = pmu_8_1_events_supported,
+      .get_count = zero_event_get_count,
+      .ns_per_count = zero_event_ns_per,
+    },
+    { .number = 0x024, /* STALL_BACKEND */
+      .supported = pmu_8_1_events_supported,
+      .get_count = zero_event_get_count,
+      .ns_per_count = zero_event_ns_per,
+    },
 };
 
 /*
@@ -XXX,XX +XXX,XX @@ static const pm_event pm_events[] = {
  * should first be updated to something sparse instead of the current
  * supported_event_map[] array.
  */
-#define MAX_EVENT_ID 0x11
+#define MAX_EVENT_ID 0x24
 #define UNSUPPORTED_EVENT UINT16_MAX
 static uint16_t supported_event_map[MAX_EVENT_ID + 1];
 
-- 
2.20.1

The ARMv8.4-PMU extension adds:
 * one new required event, STALL
 * one new system register PMMIR_EL1

(There are also some more L1-cache related events, but since
we don't implement any cache we don't provide these, in the
same way we don't provide the base-PMUv3 cache events.)

The STALL event "counts every attributable cycle on which no
attributable instruction or operation was sent for execution on this
PE".  QEMU doesn't stall in this sense, so this is another
always-reads-zero event.

The PMMIR_EL1 register is a read-only register providing
implementation-specific information about the PMU; currently it has
only one field, SLOTS, which defines behaviour of the STALL_SLOT PMU
event.  Since QEMU doesn't implement the STALL_SLOT event, we can
validly make the register read zero.

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-15-peter.maydell@linaro.org
---
 target/arm/cpu.h    | 18 ++++++++++++++++++
 target/arm/helper.c | 22 +++++++++++++++++++++-
 2 files changed, 39 insertions(+), 1 deletion(-)

Set the ID register bits to provide ARMv8.4-PMU (and implicitly
also ARMv8.1-PMU) in the 'max' CPU.

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-16-peter.maydell@linaro.org
---
 target/arm/cpu64.c | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
         u = FIELD_DP32(u, ID_MMFR3, PAN, 2); /* ATS1E1 */
         cpu->id_mmfr3 = u;
 
+        u = cpu->isar.id_aa64dfr0;
+        u = FIELD_DP64(u, ID_AA64DFR0, PMUVER, 5); /* v8.4-PMU */
+        cpu->isar.id_aa64dfr0 = u;
+
+        u = cpu->isar.id_dfr0;
+        u = FIELD_DP32(u, ID_DFR0, PERFMON, 5); /* v8.4-PMU */
+        cpu->isar.id_dfr0 = u;
+
         /*
          * FIXME: We do not yet support ARMv8.2-fp16 for AArch32 yet,
          * so do not set MVFR1.FPHP.  Strictly speaking this is not legal,
-- 
2.20.1

The LC bit in the PMCR_EL0 register is supposed to be:
 * read/write
 * RES1 on an AArch64-only implementation
 * an architecturally UNKNOWN value on reset
(and use of LC==0 by software is deprecated).

We were implementing it incorrectly as read-only always zero,
though we do have all the code needed to test it and behave
accordingly.

Instead make it a read-write bit which resets to 1 always, which
satisfies all the architectural requirements above.

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200214175116.9164-18-peter.maydell@linaro.org
---
 target/arm/helper.c | 13 +++++++++----
 1 file changed, 9 insertions(+), 4 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
 #define PMCRC   0x4
 #define PMCRP   0x2
 #define PMCRE   0x1
+/*
+ * Mask of PMCR bits writeable by guest (not including WO bits like C, P,
+ * which can be written as 1 to trigger behaviour but which stay RAZ).
+ */
+#define PMCR_WRITEABLE_MASK (PMCRLC | PMCRDP | PMCRX | PMCRD | PMCRE)
 
 #define PMXEVTYPER_P          0x80000000
 #define PMXEVTYPER_U          0x40000000
@@ -XXX,XX +XXX,XX @@ static void pmcr_write(CPUARMState *env, const ARMCPRegInfo *ri,
         }
     }
 
-    /* only the DP, X, D and E bits are writable */
-    env->cp15.c9_pmcr &= ~0x39;
-    env->cp15.c9_pmcr |= (value & 0x39);
+    env->cp15.c9_pmcr &= ~PMCR_WRITEABLE_MASK;
+    env->cp15.c9_pmcr |= (value & PMCR_WRITEABLE_MASK);
 
     pmu_op_finish(env);
 }
@@ -XXX,XX +XXX,XX @@ static void define_pmu_regs(ARMCPU *cpu)
         .access = PL0_RW, .accessfn = pmreg_access,
         .type = ARM_CP_IO,
         .fieldoffset = offsetof(CPUARMState, cp15.c9_pmcr),
-        .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT),
+        .resetvalue = (cpu->midr & 0xff000000) | (pmcrn << PMCRN_SHIFT) |
+                      PMCRLC,
         .writefn = pmcr_write, .raw_writefn = raw_write,
     };
     define_one_arm_cp_reg(cpu, &pmcr);
-- 
2.20.1

The isar_feature_aa32_pan and isar_feature_aa32_ats1e1 functions
are supposed to be testing fields in ID_MMFR3; but a cut-and-paste
error meant we were looking at MVFR0 instead.

Fix the functions to look at the right register; this requires
us to move at least id_mmfr3 to the ARMISARegisters struct; we
choose to move all the ID_MMFRn registers for consistency.

Fixes: 3d6ad6bb466f
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-19-peter.maydell@linaro.org
---
 target/arm/cpu.h      |  14 +++---
 hw/intc/armv7m_nvic.c |   8 ++--
 target/arm/cpu.c      | 104 +++++++++++++++++++++---------------------
 target/arm/cpu64.c    |  28 ++++++------
 target/arm/helper.c   |  12 ++---
 target/arm/kvm32.c    |  17 +++++++
 target/arm/kvm64.c    |  10 ++++
 7 files changed, 110 insertions(+), 83 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
         uint32_t id_isar4;
         uint32_t id_isar5;
         uint32_t id_isar6;
+        uint32_t id_mmfr0;
+        uint32_t id_mmfr1;
+        uint32_t id_mmfr2;
+        uint32_t id_mmfr3;
+        uint32_t id_mmfr4;
         uint32_t mvfr0;
         uint32_t mvfr1;
         uint32_t mvfr2;
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
     uint64_t pmceid0;
     uint64_t pmceid1;
     uint32_t id_afr0;
-    uint32_t id_mmfr0;
-    uint32_t id_mmfr1;
-    uint32_t id_mmfr2;
-    uint32_t id_mmfr3;
-    uint32_t id_mmfr4;
     uint64_t id_aa64afr0;
     uint64_t id_aa64afr1;
     uint32_t clidr;
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_vminmaxnm(const ARMISARegisters *id)
 
 static inline bool isar_feature_aa32_pan(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr0, ID_MMFR3, PAN) != 0;
+    return FIELD_EX32(id->id_mmfr3, ID_MMFR3, PAN) != 0;
 }
 
 static inline bool isar_feature_aa32_ats1e1(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr0, ID_MMFR3, PAN) >= 2;
+    return FIELD_EX32(id->id_mmfr3, ID_MMFR3, PAN) >= 2;
 }
 
 static inline bool isar_feature_aa32_pmu_8_1(const ARMISARegisters *id)
diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/armv7m_nvic.c
+++ b/hw/intc/armv7m_nvic.c
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
     case 0xd4c: /* AFR0.  */
         return cpu->id_afr0;
     case 0xd50: /* MMFR0.  */
-        return cpu->id_mmfr0;
+        return cpu->isar.id_mmfr0;
     case 0xd54: /* MMFR1.  */
-        return cpu->id_mmfr1;
+        return cpu->isar.id_mmfr1;
     case 0xd58: /* MMFR2.  */
-        return cpu->id_mmfr2;
+        return cpu->isar.id_mmfr2;
     case 0xd5c: /* MMFR3.  */
-        return cpu->id_mmfr3;
+        return cpu->isar.id_mmfr3;
     case 0xd60: /* ISAR0.  */
         return cpu->isar.id_isar0;
     case 0xd64: /* ISAR1.  */
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm1136_r2_initfn(Object *obj)
     cpu->id_pfr1 = 0x1;
     cpu->isar.id_dfr0 = 0x2;
     cpu->id_afr0 = 0x3;
-    cpu->id_mmfr0 = 0x01130003;
-    cpu->id_mmfr1 = 0x10030302;
-    cpu->id_mmfr2 = 0x01222110;
+    cpu->isar.id_mmfr0 = 0x01130003;
+    cpu->isar.id_mmfr1 = 0x10030302;
+    cpu->isar.id_mmfr2 = 0x01222110;
     cpu->isar.id_isar0 = 0x00140011;
     cpu->isar.id_isar1 = 0x12002111;
     cpu->isar.id_isar2 = 0x11231111;
@@ -XXX,XX +XXX,XX @@ static void arm1136_initfn(Object *obj)
     cpu->id_pfr1 = 0x1;
     cpu->isar.id_dfr0 = 0x2;
     cpu->id_afr0 = 0x3;
-    cpu->id_mmfr0 = 0x01130003;
-    cpu->id_mmfr1 = 0x10030302;
-    cpu->id_mmfr2 = 0x01222110;
+    cpu->isar.id_mmfr0 = 0x01130003;
+    cpu->isar.id_mmfr1 = 0x10030302;
+    cpu->isar.id_mmfr2 = 0x01222110;
     cpu->isar.id_isar0 = 0x00140011;
     cpu->isar.id_isar1 = 0x12002111;
     cpu->isar.id_isar2 = 0x11231111;
@@ -XXX,XX +XXX,XX @@ static void arm1176_initfn(Object *obj)
     cpu->id_pfr1 = 0x11;
     cpu->isar.id_dfr0 = 0x33;
     cpu->id_afr0 = 0;
-    cpu->id_mmfr0 = 0x01130003;
-    cpu->id_mmfr1 = 0x10030302;
-    cpu->id_mmfr2 = 0x01222100;
+    cpu->isar.id_mmfr0 = 0x01130003;
+    cpu->isar.id_mmfr1 = 0x10030302;
+    cpu->isar.id_mmfr2 = 0x01222100;
     cpu->isar.id_isar0 = 0x0140011;
     cpu->isar.id_isar1 = 0x12002111;
     cpu->isar.id_isar2 = 0x11231121;
@@ -XXX,XX +XXX,XX @@ static void arm11mpcore_initfn(Object *obj)
     cpu->id_pfr1 = 0x1;
     cpu->isar.id_dfr0 = 0;
     cpu->id_afr0 = 0x2;
-    cpu->id_mmfr0 = 0x01100103;
-    cpu->id_mmfr1 = 0x10020302;
-    cpu->id_mmfr2 = 0x01222000;
+    cpu->isar.id_mmfr0 = 0x01100103;
+    cpu->isar.id_mmfr1 = 0x10020302;
+    cpu->isar.id_mmfr2 = 0x01222000;
     cpu->isar.id_isar0 = 0x00100011;
     cpu->isar.id_isar1 = 0x12002111;
     cpu->isar.id_isar2 = 0x11221011;
@@ -XXX,XX +XXX,XX @@ static void cortex_m3_initfn(Object *obj)
     cpu->id_pfr1 = 0x00000200;
     cpu->isar.id_dfr0 = 0x00100000;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x00000030;
-    cpu->id_mmfr1 = 0x00000000;
-    cpu->id_mmfr2 = 0x00000000;
-    cpu->id_mmfr3 = 0x00000000;
+    cpu->isar.id_mmfr0 = 0x00000030;
+    cpu->isar.id_mmfr1 = 0x00000000;
+    cpu->isar.id_mmfr2 = 0x00000000;
+    cpu->isar.id_mmfr3 = 0x00000000;
     cpu->isar.id_isar0 = 0x01141110;
     cpu->isar.id_isar1 = 0x02111000;
     cpu->isar.id_isar2 = 0x21112231;
@@ -XXX,XX +XXX,XX @@ static void cortex_m4_initfn(Object *obj)
     cpu->id_pfr1 = 0x00000200;
     cpu->isar.id_dfr0 = 0x00100000;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x00000030;
-    cpu->id_mmfr1 = 0x00000000;
-    cpu->id_mmfr2 = 0x00000000;
-    cpu->id_mmfr3 = 0x00000000;
+    cpu->isar.id_mmfr0 = 0x00000030;
+    cpu->isar.id_mmfr1 = 0x00000000;
+    cpu->isar.id_mmfr2 = 0x00000000;
+    cpu->isar.id_mmfr3 = 0x00000000;
     cpu->isar.id_isar0 = 0x01141110;
     cpu->isar.id_isar1 = 0x02111000;
     cpu->isar.id_isar2 = 0x21112231;
@@ -XXX,XX +XXX,XX @@ static void cortex_m7_initfn(Object *obj)
     cpu->id_pfr1 = 0x00000200;
     cpu->isar.id_dfr0 = 0x00100000;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x00100030;
-    cpu->id_mmfr1 = 0x00000000;
-    cpu->id_mmfr2 = 0x01000000;
-    cpu->id_mmfr3 = 0x00000000;
+    cpu->isar.id_mmfr0 = 0x00100030;
+    cpu->isar.id_mmfr1 = 0x00000000;
+    cpu->isar.id_mmfr2 = 0x01000000;
+    cpu->isar.id_mmfr3 = 0x00000000;
     cpu->isar.id_isar0 = 0x01101110;
     cpu->isar.id_isar1 = 0x02112000;
     cpu->isar.id_isar2 = 0x20232231;
@@ -XXX,XX +XXX,XX @@ static void cortex_m33_initfn(Object *obj)
     cpu->id_pfr1 = 0x00000210;
     cpu->isar.id_dfr0 = 0x00200000;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x00101F40;
-    cpu->id_mmfr1 = 0x00000000;
-    cpu->id_mmfr2 = 0x01000000;
-    cpu->id_mmfr3 = 0x00000000;
+    cpu->isar.id_mmfr0 = 0x00101F40;
+    cpu->isar.id_mmfr1 = 0x00000000;
+    cpu->isar.id_mmfr2 = 0x01000000;
+    cpu->isar.id_mmfr3 = 0x00000000;
     cpu->isar.id_isar0 = 0x01101110;
     cpu->isar.id_isar1 = 0x02212000;
     cpu->isar.id_isar2 = 0x20232232;
@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
     cpu->id_pfr1 = 0x001;
     cpu->isar.id_dfr0 = 0x010400;
     cpu->id_afr0 = 0x0;
-    cpu->id_mmfr0 = 0x0210030;
-    cpu->id_mmfr1 = 0x00000000;
-    cpu->id_mmfr2 = 0x01200000;
-    cpu->id_mmfr3 = 0x0211;
+    cpu->isar.id_mmfr0 = 0x0210030;
+    cpu->isar.id_mmfr1 = 0x00000000;
+    cpu->isar.id_mmfr2 = 0x01200000;
+    cpu->isar.id_mmfr3 = 0x0211;
     cpu->isar.id_isar0 = 0x02101111;
     cpu->isar.id_isar1 = 0x13112111;
     cpu->isar.id_isar2 = 0x21232141;
@@ -XXX,XX +XXX,XX @@ static void cortex_a8_initfn(Object *obj)
     cpu->id_pfr1 = 0x11;
     cpu->isar.id_dfr0 = 0x400;
     cpu->id_afr0 = 0;
-    cpu->id_mmfr0 = 0x31100003;
-    cpu->id_mmfr1 = 0x20000000;
-    cpu->id_mmfr2 = 0x01202000;
-    cpu->id_mmfr3 = 0x11;
+    cpu->isar.id_mmfr0 = 0x31100003;
+    cpu->isar.id_mmfr1 = 0x20000000;
+    cpu->isar.id_mmfr2 = 0x01202000;
+    cpu->isar.id_mmfr3 = 0x11;
     cpu->isar.id_isar0 = 0x00101111;
     cpu->isar.id_isar1 = 0x12112111;
     cpu->isar.id_isar2 = 0x21232031;
@@ -XXX,XX +XXX,XX @@ static void cortex_a9_initfn(Object *obj)
     cpu->id_pfr1 = 0x11;
     cpu->isar.id_dfr0 = 0x000;
     cpu->id_afr0 = 0;
-    cpu->id_mmfr0 = 0x00100103;
-    cpu->id_mmfr1 = 0x20000000;
-    cpu->id_mmfr2 = 0x01230000;
-    cpu->id_mmfr3 = 0x00002111;
+    cpu->isar.id_mmfr0 = 0x00100103;
+    cpu->isar.id_mmfr1 = 0x20000000;
+    cpu->isar.id_mmfr2 = 0x01230000;
+    cpu->isar.id_mmfr3 = 0x00002111;
     cpu->isar.id_isar0 = 0x00101111;
     cpu->isar.id_isar1 = 0x13112111;
     cpu->isar.id_isar2 = 0x21232041;
@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
     cpu->id_pfr1 = 0x00011011;
     cpu->isar.id_dfr0 = 0x02010555;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x10101105;
-    cpu->id_mmfr1 = 0x40000000;
-    cpu->id_mmfr2 = 0x01240000;
-    cpu->id_mmfr3 = 0x02102211;
+    cpu->isar.id_mmfr0 = 0x10101105;
+    cpu->isar.id_mmfr1 = 0x40000000;
+    cpu->isar.id_mmfr2 = 0x01240000;
+    cpu->isar.id_mmfr3 = 0x02102211;
     /* a7_mpcore_r0p5_trm, page 4-4 gives 0x01101110; but
      * table 4-41 gives 0x02101110, which includes the arm div insns.
      */
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
     cpu->id_pfr1 = 0x00011011;
     cpu->isar.id_dfr0 = 0x02010555;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x10201105;
-    cpu->id_mmfr1 = 0x20000000;
-    cpu->id_mmfr2 = 0x01240000;
-    cpu->id_mmfr3 = 0x02102211;
+    cpu->isar.id_mmfr0 = 0x10201105;
+    cpu->isar.id_mmfr1 = 0x20000000;
+    cpu->isar.id_mmfr2 = 0x01240000;
+    cpu->isar.id_mmfr3 = 0x02102211;
     cpu->isar.id_isar0 = 0x02101110;
     cpu->isar.id_isar1 = 0x13112111;
     cpu->isar.id_isar2 = 0x21232041;
@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
             t = FIELD_DP32(t, MVFR2, FPMISC, 4);   /* FP MaxNum */
             cpu->isar.mvfr2 = t;
 
-            t = cpu->id_mmfr3;
+            t = cpu->isar.id_mmfr3;
             t = FIELD_DP32(t, ID_MMFR3, PAN, 2); /* ATS1E1 */
-            cpu->id_mmfr3 = t;
+            cpu->isar.id_mmfr3 = t;
 
-            t = cpu->id_mmfr4;
+            t = cpu->isar.id_mmfr4;
             t = FIELD_DP32(t, ID_MMFR4, HPDS, 1); /* AA32HPD */
-            cpu->id_mmfr4 = t;
+            cpu->isar.id_mmfr4 = t;
         }
 #endif
     }
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
     cpu->id_pfr1 = 0x00011011;
     cpu->isar.id_dfr0 = 0x03010066;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x10101105;
-    cpu->id_mmfr1 = 0x40000000;
-    cpu->id_mmfr2 = 0x01260000;
-    cpu->id_mmfr3 = 0x02102211;
+    cpu->isar.id_mmfr0 = 0x10101105;
+    cpu->isar.id_mmfr1 = 0x40000000;
+    cpu->isar.id_mmfr2 = 0x01260000;
+    cpu->isar.id_mmfr3 = 0x02102211;
     cpu->isar.id_isar0 = 0x02101110;
     cpu->isar.id_isar1 = 0x13112111;
     cpu->isar.id_isar2 = 0x21232042;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
     cpu->id_pfr1 = 0x00011011;
     cpu->isar.id_dfr0 = 0x03010066;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x10101105;
-    cpu->id_mmfr1 = 0x40000000;
-    cpu->id_mmfr2 = 0x01260000;
-    cpu->id_mmfr3 = 0x02102211;
+    cpu->isar.id_mmfr0 = 0x10101105;
+    cpu->isar.id_mmfr1 = 0x40000000;
+    cpu->isar.id_mmfr2 = 0x01260000;
+    cpu->isar.id_mmfr3 = 0x02102211;
     cpu->isar.id_isar0 = 0x02101110;
     cpu->isar.id_isar1 = 0x13112111;
     cpu->isar.id_isar2 = 0x21232042;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a72_initfn(Object *obj)
     cpu->id_pfr1 = 0x00011011;
     cpu->isar.id_dfr0 = 0x03010066;
     cpu->id_afr0 = 0x00000000;
-    cpu->id_mmfr0 = 0x10201105;
-    cpu->id_mmfr1 = 0x40000000;
-    cpu->id_mmfr2 = 0x01260000;
-    cpu->id_mmfr3 = 0x02102211;
+    cpu->isar.id_mmfr0 = 0x10201105;
+    cpu->isar.id_mmfr1 = 0x40000000;
+    cpu->isar.id_mmfr2 = 0x01260000;
+    cpu->isar.id_mmfr3 = 0x02102211;
     cpu->isar.id_isar0 = 0x02101110;
     cpu->isar.id_isar1 = 0x13112111;
     cpu->isar.id_isar2 = 0x21232042;
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
         u = FIELD_DP32(u, ID_ISAR6, SPECRES, 1);
         cpu->isar.id_isar6 = u;
 
-        u = cpu->id_mmfr3;
+        u = cpu->isar.id_mmfr3;
         u = FIELD_DP32(u, ID_MMFR3, PAN, 2); /* ATS1E1 */
-        cpu->id_mmfr3 = u;
+        cpu->isar.id_mmfr3 = u;
 
         u = cpu->isar.id_aa64dfr0;
         u = FIELD_DP64(u, ID_AA64DFR0, PMUVER, 5); /* v8.4-PMU */
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 4,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa32_tid3,
-              .resetvalue = cpu->id_mmfr0 },
+              .resetvalue = cpu->isar.id_mmfr0 },
             { .name = "ID_MMFR1", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 5,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa32_tid3,
-              .resetvalue = cpu->id_mmfr1 },
+              .resetvalue = cpu->isar.id_mmfr1 },
             { .name = "ID_MMFR2", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 6,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa32_tid3,
-              .resetvalue = cpu->id_mmfr2 },
+              .resetvalue = cpu->isar.id_mmfr2 },
             { .name = "ID_MMFR3", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 1, .opc2 = 7,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa32_tid3,
-              .resetvalue = cpu->id_mmfr3 },
+              .resetvalue = cpu->isar.id_mmfr3 },
             { .name = "ID_ISAR0", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 0,
               .access = PL1_R, .type = ARM_CP_CONST,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 6,
               .access = PL1_R, .type = ARM_CP_CONST,
               .accessfn = access_aa32_tid3,
-              .resetvalue = cpu->id_mmfr4 },
+              .resetvalue = cpu->isar.id_mmfr4 },
             { .name = "ID_ISAR6", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 7,
               .access = PL1_R, .type = ARM_CP_CONST,
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
         define_arm_cp_regs(cpu, vmsa_pmsa_cp_reginfo);
         define_arm_cp_regs(cpu, vmsa_cp_reginfo);
         /* TTCBR2 is introduced with ARMv8.2-A32HPD.  */
-        if (FIELD_EX32(cpu->id_mmfr4, ID_MMFR4, HPDS) != 0) {
+        if (FIELD_EX32(cpu->isar.id_mmfr4, ID_MMFR4, HPDS) != 0) {
             define_one_arm_cp_reg(cpu, &ttbcr2_reginfo);
         }
     }
diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/kvm32.c
+++ b/target/arm/kvm32.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
      * Fortunately there is not yet anything in there that affects migration.
      */
 
+    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr0,
+                          ARM_CP15_REG32(0, 0, 1, 4));
+    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr1,
+                          ARM_CP15_REG32(0, 0, 1, 5));
+    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr2,
+                          ARM_CP15_REG32(0, 0, 1, 6));
+    err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr3,
+                          ARM_CP15_REG32(0, 0, 1, 7));
+    if (read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr4,
+                       ARM_CP15_REG32(0, 0, 2, 6))) {
+        /*
+         * Older kernels don't support reading ID_MMFR4 (a new in v8
+         * register); assume it's zero.
+         */
+        ahcf->isar.id_mmfr4 = 0;
+    }
+
     /*
      * There is no way to read DBGDIDR, because currently 32-bit KVM
      * doesn't implement debug at all. Leave it at zero.
diff --git a/target/arm/kvm64.c b/target/arm/kvm64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/kvm64.c
+++ b/target/arm/kvm64.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
          */
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_dfr0,
                               ARM64_SYS_REG(3, 0, 0, 1, 2));
+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr0,
+                              ARM64_SYS_REG(3, 0, 0, 1, 4));
+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr1,
+                              ARM64_SYS_REG(3, 0, 0, 1, 5));
+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr2,
+                              ARM64_SYS_REG(3, 0, 0, 1, 6));
+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr3,
+                              ARM64_SYS_REG(3, 0, 0, 1, 7));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar0,
                               ARM64_SYS_REG(3, 0, 0, 2, 0));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar1,
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
                               ARM64_SYS_REG(3, 0, 0, 2, 4));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar5,
                               ARM64_SYS_REG(3, 0, 0, 2, 5));
+        err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_mmfr4,
+                              ARM64_SYS_REG(3, 0, 0, 2, 6));
         err |= read_sys_reg32(fdarray[2], &ahcf->isar.id_isar6,
                               ARM64_SYS_REG(3, 0, 0, 2, 7));
 
-- 
2.20.1

Now we have moved ID_MMFR4 into the ARMISARegisters struct, we
can define and use an isar_feature for the presence of the
ARMv8.2-AA32HPD feature, rather than open-coding the test.

While we're here, correct a comment typo which missed an 'A'
from the feature name.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-20-peter.maydell@linaro.org
---
 target/arm/cpu.h    | 5 +++++
 target/arm/helper.c | 4 ++--
 2 files changed, 7 insertions(+), 2 deletions(-)

Cut-and-paste errors mean we're using FIELD_EX64() to extract fields from
some 32-bit ID register fields. Use FIELD_EX32() instead. (This makes
no difference in behaviour, it's just more consistent.)

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-21-peter.maydell@linaro.org
---
 target/arm/cpu.h | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
 static inline bool isar_feature_aa32_fp_d32(const ARMISARegisters *id)
 {
     /* Return true if D16-D31 are implemented */
-    return FIELD_EX64(id->mvfr0, MVFR0, SIMDREG) >= 2;
+    return FIELD_EX32(id->mvfr0, MVFR0, SIMDREG) >= 2;
 }
 
 static inline bool isar_feature_aa32_fpshvec(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr0, MVFR0, FPSHVEC) > 0;
+    return FIELD_EX32(id->mvfr0, MVFR0, FPSHVEC) > 0;
 }
 
 static inline bool isar_feature_aa32_fpdp(const ARMISARegisters *id)
 {
     /* Return true if CPU supports double precision floating point */
-    return FIELD_EX64(id->mvfr0, MVFR0, FPDP) > 0;
+    return FIELD_EX32(id->mvfr0, MVFR0, FPDP) > 0;
 }
 
 /*
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fpdp(const ARMISARegisters *id)
  */
 static inline bool isar_feature_aa32_fp16_spconv(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr1, MVFR1, FPHP) > 0;
+    return FIELD_EX32(id->mvfr1, MVFR1, FPHP) > 0;
 }
 
 static inline bool isar_feature_aa32_fp16_dpconv(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr1, MVFR1, FPHP) > 1;
+    return FIELD_EX32(id->mvfr1, MVFR1, FPHP) > 1;
 }
 
 static inline bool isar_feature_aa32_vsel(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 1;
+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 1;
 }
 
 static inline bool isar_feature_aa32_vcvt_dr(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 2;
+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 2;
 }
 
 static inline bool isar_feature_aa32_vrint(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 3;
+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 3;
 }
 
 static inline bool isar_feature_aa32_vminmaxnm(const ARMISARegisters *id)
 {
-    return FIELD_EX64(id->mvfr2, MVFR2, FPMISC) >= 4;
+    return FIELD_EX32(id->mvfr2, MVFR2, FPMISC) >= 4;
 }
 
 static inline bool isar_feature_aa32_pan(const ARMISARegisters *id)
-- 
2.20.1

The ACTLR2 and HACTLR2 AArch32 system registers didn't exist in ARMv7
or the original ARMv8.  They were later added as optional registers,
whose presence is signaled by the ID_MMFR4.AC2 field.  From ARMv8.2
they are mandatory (ie ID_MMFR4.AC2 must be non-zero).

We implemented HACTLR2 in commit 0e0456ab8895a5e85, but we
incorrectly made it exist for all v8 CPUs, and we didn't implement
ACTLR2 at all.

Sort this out by implementing both registers only when they are
supposed to exist, and setting the ID_MMFR4 bit for -cpu max.

Note that this removes HACTLR2 from our Cortex-A53, -A47 and -A72
CPU models; this is correct, because those CPUs do not implement
this register.

Fixes: 0e0456ab8895a5e85
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214175116.9164-22-peter.maydell@linaro.org
---
 target/arm/cpu.h    |  5 +++++
 target/arm/cpu.c    |  1 +
 target/arm/cpu64.c  |  4 ++++
 target/arm/helper.c | 32 +++++++++++++++++++++++---------
 4 files changed, 33 insertions(+), 9 deletions(-)

From: Guenter Roeck <linux@roeck-us.net>

We need to be able to use OHCISysBusState outside hcd-ohci.c, so move it
to its include file.

Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
Signed-off-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Message-id: 20200217204812.9857-2-linux@roeck-us.net
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/usb/hcd-ohci.h | 16 ++++++++++++++++
 hw/usb/hcd-ohci.c | 15 ---------------
 2 files changed, 16 insertions(+), 15 deletions(-)

diff --git a/hw/usb/hcd-ohci.h b/hw/usb/hcd-ohci.h
index XXXXXXX..XXXXXXX 100644
--- a/hw/usb/hcd-ohci.h
+++ b/hw/usb/hcd-ohci.h
@@ -XXX,XX +XXX,XX @@
 #define HCD_OHCI_H
 
 #include "sysemu/dma.h"
+#include "hw/usb.h"
 
 /* Number of Downstream Ports on the root hub: */
 #define OHCI_MAX_PORTS 15
@@ -XXX,XX +XXX,XX @@ typedef struct OHCIState {
     void (*ohci_die)(struct OHCIState *ohci);
 } OHCIState;
 
+#define TYPE_SYSBUS_OHCI "sysbus-ohci"
+#define SYSBUS_OHCI(obj) OBJECT_CHECK(OHCISysBusState, (obj), TYPE_SYSBUS_OHCI)
+
+typedef struct {
+    /*< private >*/
+    SysBusDevice parent_obj;
+    /*< public >*/
+
+    OHCIState ohci;
+    char *masterbus;
+    uint32_t num_ports;
+    uint32_t firstport;
+    dma_addr_t dma_offset;
+} OHCISysBusState;
+
 extern const VMStateDescription vmstate_ohci_state;
 
 void usb_ohci_init(OHCIState *ohci, DeviceState *dev, uint32_t num_ports,
diff --git a/hw/usb/hcd-ohci.c b/hw/usb/hcd-ohci.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/usb/hcd-ohci.c
+++ b/hw/usb/hcd-ohci.c
@@ -XXX,XX +XXX,XX @@ void ohci_sysbus_die(struct OHCIState *ohci)
     ohci_bus_stop(ohci);
 }
 
-#define TYPE_SYSBUS_OHCI "sysbus-ohci"
-#define SYSBUS_OHCI(obj) OBJECT_CHECK(OHCISysBusState, (obj), TYPE_SYSBUS_OHCI)
-
-typedef struct {
-    /*< private >*/
-    SysBusDevice parent_obj;
-    /*< public >*/
-
-    OHCIState ohci;
-    char *masterbus;
-    uint32_t num_ports;
-    uint32_t firstport;
-    dma_addr_t dma_offset;
-} OHCISysBusState;
-
 static void ohci_realize_pxa(DeviceState *dev, Error **errp)
 {
     OHCISysBusState *s = SYSBUS_OHCI(dev);
-- 
2.20.1

From: Guenter Roeck <linux@roeck-us.net>

Instantiate EHCI and OHCI controllers on Allwinner A10. OHCI ports are
modeled as companions of the respective EHCI ports.

With this patch applied, USB controllers are discovered and instantiated
when booting the cubieboard machine with a recent Linux kernel.

ehci-platform 1c14000.usb: EHCI Host Controller
ehci-platform 1c14000.usb: new USB bus registered, assigned bus number 1
ehci-platform 1c14000.usb: irq 26, io mem 0x01c14000
ehci-platform 1c14000.usb: USB 2.0 started, EHCI 1.00
ehci-platform 1c1c000.usb: EHCI Host Controller
ehci-platform 1c1c000.usb: new USB bus registered, assigned bus number 2
ehci-platform 1c1c000.usb: irq 31, io mem 0x01c1c000
ehci-platform 1c1c000.usb: USB 2.0 started, EHCI 1.00
ohci-platform 1c14400.usb: Generic Platform OHCI controller
ohci-platform 1c14400.usb: new USB bus registered, assigned bus number 3
ohci-platform 1c14400.usb: irq 27, io mem 0x01c14400
ohci-platform 1c1c400.usb: Generic Platform OHCI controller
ohci-platform 1c1c400.usb: new USB bus registered, assigned bus number 4
ohci-platform 1c1c400.usb: irq 32, io mem 0x01c1c400
usb 2-1: new high-speed USB device number 2 using ehci-platform
usb-storage 2-1:1.0: USB Mass Storage device detected
scsi host1: usb-storage 2-1:1.0
usb 3-1: new full-speed USB device number 2 using ohci-platform
input: QEMU QEMU USB Mouse as /devices/platform/soc/1c14400.usb/usb3/3-1/3-1:1.0/0003:0627:0001.0001/input/input0

Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
Signed-off-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Message-id: 20200217204812.9857-4-linux@roeck-us.net
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/allwinner-a10.h |  6 +++++
 hw/arm/allwinner-a10.c         | 43 ++++++++++++++++++++++++++++++++++
 2 files changed, 49 insertions(+)

diff --git a/include/hw/arm/allwinner-a10.h b/include/hw/arm/allwinner-a10.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/allwinner-a10.h
+++ b/include/hw/arm/allwinner-a10.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/intc/allwinner-a10-pic.h"
 #include "hw/net/allwinner_emac.h"
 #include "hw/ide/ahci.h"
+#include "hw/usb/hcd-ohci.h"
+#include "hw/usb/hcd-ehci.h"
 
 #include "target/arm/cpu.h"
 
 
 #define AW_A10_SDRAM_BASE       0x40000000
 
+#define AW_A10_NUM_USB          2
+
 #define TYPE_AW_A10 "allwinner-a10"
 #define AW_A10(obj) OBJECT_CHECK(AwA10State, (obj), TYPE_AW_A10)
 
@@ -XXX,XX +XXX,XX @@ typedef struct AwA10State {
     AwEmacState emac;
     AllwinnerAHCIState sata;
     MemoryRegion sram_a;
+    EHCISysBusState ehci[AW_A10_NUM_USB];
+    OHCISysBusState ohci[AW_A10_NUM_USB];
 } AwA10State;
 
 #endif
diff --git a/hw/arm/allwinner-a10.c b/hw/arm/allwinner-a10.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/allwinner-a10.c
+++ b/hw/arm/allwinner-a10.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/arm/allwinner-a10.h"
 #include "hw/misc/unimp.h"
 #include "sysemu/sysemu.h"
+#include "hw/boards.h"
+#include "hw/usb/hcd-ohci.h"
 
 #define AW_A10_PIC_REG_BASE     0x01c20400
 #define AW_A10_PIT_REG_BASE     0x01c20c00
 #define AW_A10_UART0_REG_BASE   0x01c28000
 #define AW_A10_EMAC_BASE        0x01c0b000
+#define AW_A10_EHCI_BASE        0x01c14000
+#define AW_A10_OHCI_BASE        0x01c14400
 #define AW_A10_SATA_BASE        0x01c18000
 
 static void aw_a10_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void aw_a10_init(Object *obj)
 
     sysbus_init_child_obj(obj, "sata", &s->sata, sizeof(s->sata),
                           TYPE_ALLWINNER_AHCI);
+
+    if (machine_usb(current_machine)) {
+        int i;
+
+        for (i = 0; i < AW_A10_NUM_USB; i++) {
+            sysbus_init_child_obj(obj, "ehci[*]", OBJECT(&s->ehci[i]),
+                                  sizeof(s->ehci[i]), TYPE_PLATFORM_EHCI);
+            sysbus_init_child_obj(obj, "ohci[*]", OBJECT(&s->ohci[i]),
+                                  sizeof(s->ohci[i]), TYPE_SYSBUS_OHCI);
+        }
+    }
 }
 
 static void aw_a10_realize(DeviceState *dev, Error **errp)
@@ -XXX,XX +XXX,XX @@ static void aw_a10_realize(DeviceState *dev, Error **errp)
     serial_mm_init(get_system_memory(), AW_A10_UART0_REG_BASE, 2,
                    qdev_get_gpio_in(dev, 1),
                    115200, serial_hd(0), DEVICE_NATIVE_ENDIAN);
+
+    if (machine_usb(current_machine)) {
+        int i;
+
+        for (i = 0; i < AW_A10_NUM_USB; i++) {
+            char bus[16];
+
+            sprintf(bus, "usb-bus.%d", i);
+
+            object_property_set_bool(OBJECT(&s->ehci[i]), true,
+                                     "companion-enable", &error_fatal);
+            object_property_set_bool(OBJECT(&s->ehci[i]), true, "realized",
+                                     &error_fatal);
+            sysbus_mmio_map(SYS_BUS_DEVICE(&s->ehci[i]), 0,
+                            AW_A10_EHCI_BASE + i * 0x8000);
+            sysbus_connect_irq(SYS_BUS_DEVICE(&s->ehci[i]), 0,
+                               qdev_get_gpio_in(dev, 39 + i));
+
+            object_property_set_str(OBJECT(&s->ohci[i]), bus, "masterbus",
+                                    &error_fatal);
+            object_property_set_bool(OBJECT(&s->ohci[i]), true, "realized",
+                                     &error_fatal);
+            sysbus_mmio_map(SYS_BUS_DEVICE(&s->ohci[i]), 0,
+                            AW_A10_OHCI_BASE + i * 0x8000);
+            sysbus_connect_irq(SYS_BUS_DEVICE(&s->ohci[i]), 0,
+                               qdev_get_gpio_in(dev, 64 + i));
+        }
+    }
 }
 
 static void aw_a10_class_init(ObjectClass *oc, void *data)
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

These instructions shift left or right depending on the sign
of the input, and 7 bits are significant to the shift.  This
requires several masks and selects in addition to the actual
shifts to form the complete answer.

That said, the operation is still a small improvement even for
two 64-bit elements -- 13 vector operations instead of 2 * 7
integer operations.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216214232.4230-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  11 +-
 target/arm/translate.h     |   6 +
 target/arm/neon_helper.c   |  33 ----
 target/arm/translate-a64.c |  18 +--
 target/arm/translate.c     | 299 +++++++++++++++++++++++++++++++++++--
 target/arm/vec_helper.c    |  88 +++++++++++
 6 files changed, 389 insertions(+), 66 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_abd_s16, i32, i32, i32)
 DEF_HELPER_2(neon_abd_u32, i32, i32, i32)
 DEF_HELPER_2(neon_abd_s32, i32, i32, i32)
 
-DEF_HELPER_2(neon_shl_u8, i32, i32, i32)
-DEF_HELPER_2(neon_shl_s8, i32, i32, i32)
 DEF_HELPER_2(neon_shl_u16, i32, i32, i32)
 DEF_HELPER_2(neon_shl_s16, i32, i32, i32)
-DEF_HELPER_2(neon_shl_u32, i32, i32, i32)
-DEF_HELPER_2(neon_shl_s32, i32, i32, i32)
-DEF_HELPER_2(neon_shl_u64, i64, i64, i64)
-DEF_HELPER_2(neon_shl_s64, i64, i64, i64)
 DEF_HELPER_2(neon_rshl_u8, i32, i32, i32)
 DEF_HELPER_2(neon_rshl_s8, i32, i32, i32)
 DEF_HELPER_2(neon_rshl_u16, i32, i32, i32)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(frint64_s, TCG_CALL_NO_RWG, f32, f32, ptr)
 DEF_HELPER_FLAGS_2(frint32_d, TCG_CALL_NO_RWG, f64, f64, ptr)
 DEF_HELPER_FLAGS_2(frint64_d, TCG_CALL_NO_RWG, f64, f64, ptr)
 
+DEF_HELPER_FLAGS_4(gvec_sshl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_sshl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_ushl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
 #include "helper-sve.h"
diff --git a/target/arm/translate.h b/target/arm/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.h
+++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ uint64_t vfp_expand_imm(int size, uint8_t imm8);
 extern const GVecGen3 mla_op[4];
 extern const GVecGen3 mls_op[4];
 extern const GVecGen3 cmtst_op[4];
+extern const GVecGen3 sshl_op[4];
+extern const GVecGen3 ushl_op[4];
 extern const GVecGen2i ssra_op[4];
 extern const GVecGen2i usra_op[4];
 extern const GVecGen2i sri_op[4];
@@ -XXX,XX +XXX,XX @@ extern const GVecGen4 sqadd_op[4];
 extern const GVecGen4 uqsub_op[4];
 extern const GVecGen4 sqsub_op[4];
 void gen_cmtst_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
+void gen_ushl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
+void gen_sshl_i32(TCGv_i32 d, TCGv_i32 a, TCGv_i32 b);
+void gen_ushl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
+void gen_sshl_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b);
 
 /*
  * Forward to the isar_feature_* tests given a DisasContext pointer.
diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/neon_helper.c
+++ b/target/arm/neon_helper.c
@@ -XXX,XX +XXX,XX @@ NEON_VOP(abd_u32, neon_u32, 1)
     } else { \
         dest = src1 << tmp; \
     }} while (0)
-NEON_VOP(shl_u8, neon_u8, 4)
 NEON_VOP(shl_u16, neon_u16, 2)
-NEON_VOP(shl_u32, neon_u32, 1)
 #undef NEON_FN
 
-uint64_t HELPER(neon_shl_u64)(uint64_t val, uint64_t shiftop)
-{
-    int8_t shift = (int8_t)shiftop;
-    if (shift >= 64 || shift <= -64) {
-        val = 0;
-    } else if (shift < 0) {
-        val >>= -shift;
-    } else {
-        val <<= shift;
-    }
-    return val;
-}
-
 #define NEON_FN(dest, src1, src2) do { \
     int8_t tmp; \
     tmp = (int8_t)src2; \
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_shl_u64)(uint64_t val, uint64_t shiftop)
     } else { \
         dest = src1 << tmp; \
     }} while (0)
-NEON_VOP(shl_s8, neon_s8, 4)
 NEON_VOP(shl_s16, neon_s16, 2)
-NEON_VOP(shl_s32, neon_s32, 1)
 #undef NEON_FN
 
-uint64_t HELPER(neon_shl_s64)(uint64_t valop, uint64_t shiftop)
-{
-    int8_t shift = (int8_t)shiftop;
-    int64_t val = valop;
-    if (shift >= 64) {
-        val = 0;
-    } else if (shift <= -64) {
-        val >>= 63;
-    } else if (shift < 0) {
-        val >>= -shift;
-    } else {
-        val <<= shift;
-    }
-    return val;
-}
-
 #define NEON_FN(dest, src1, src2) do { \
     int8_t tmp; \
     tmp = (int8_t)src2; \
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_3same_64(DisasContext *s, int opcode, bool u,
         break;
     case 0x8: /* SSHL, USHL */
         if (u) {
-            gen_helper_neon_shl_u64(tcg_rd, tcg_rn, tcg_rm);
+            gen_ushl_i64(tcg_rd, tcg_rn, tcg_rm);
         } else {
-            gen_helper_neon_shl_s64(tcg_rd, tcg_rn, tcg_rm);
+            gen_sshl_i64(tcg_rd, tcg_rn, tcg_rm);
         }
         break;
     case 0x9: /* SQSHL, UQSHL */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                        is_q ? 16 : 8, vec_full_reg_size(s),
                        (u ? uqsub_op : sqsub_op) + size);
         return;
+    case 0x08: /* SSHL, USHL */
+        gen_gvec_op3(s, is_q, rd, rn, rm,
+                     u ? &ushl_op[size] : &sshl_op[size]);
+        return;
     case 0x0c: /* SMAX, UMAX */
         if (u) {
             gen_gvec_fn3(s, is_q, rd, rn, rm, tcg_gen_gvec_umax, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                 genfn = fns[size][u];
                 break;
             }
-            case 0x8: /* SSHL, USHL */
-            {
-                static NeonGenTwoOpFn * const fns[3][2] = {
-                    { gen_helper_neon_shl_s8, gen_helper_neon_shl_u8 },
-                    { gen_helper_neon_shl_s16, gen_helper_neon_shl_u16 },
-                    { gen_helper_neon_shl_s32, gen_helper_neon_shl_u32 },
-                };
-                genfn = fns[size][u];
-                break;
-            }
             case 0x9: /* SQSHL, UQSHL */
             {
                 static NeonGenTwoOpEnvFn * const fns[3][2] = {
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static inline void gen_neon_shift_narrow(int size, TCGv_i32 var, TCGv_i32 shift,
         if (u) {
             switch (size) {
             case 1: gen_helper_neon_shl_u16(var, var, shift); break;
-            case 2: gen_helper_neon_shl_u32(var, var, shift); break;
+            case 2: gen_ushl_i32(var, var, shift); break;
             default: abort();
             }
         } else {
             switch (size) {
             case 1: gen_helper_neon_shl_s16(var, var, shift); break;
-            case 2: gen_helper_neon_shl_s32(var, var, shift); break;
+            case 2: gen_sshl_i32(var, var, shift); break;
             default: abort();
             }
         }
@@ -XXX,XX +XXX,XX @@ const GVecGen3 cmtst_op[4] = {
       .vece = MO_64 },
 };
 
+void gen_ushl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
+{
+    TCGv_i32 lval = tcg_temp_new_i32();
+    TCGv_i32 rval = tcg_temp_new_i32();
+    TCGv_i32 lsh = tcg_temp_new_i32();
+    TCGv_i32 rsh = tcg_temp_new_i32();
+    TCGv_i32 zero = tcg_const_i32(0);
+    TCGv_i32 max = tcg_const_i32(32);
+
+    /*
+     * Rely on the TCG guarantee that out of range shifts produce
+     * unspecified results, not undefined behaviour (i.e. no trap).
+     * Discard out-of-range results after the fact.
+     */
+    tcg_gen_ext8s_i32(lsh, shift);
+    tcg_gen_neg_i32(rsh, lsh);
+    tcg_gen_shl_i32(lval, src, lsh);
+    tcg_gen_shr_i32(rval, src, rsh);
+    tcg_gen_movcond_i32(TCG_COND_LTU, dst, lsh, max, lval, zero);
+    tcg_gen_movcond_i32(TCG_COND_LTU, dst, rsh, max, rval, dst);
+
+    tcg_temp_free_i32(lval);
+    tcg_temp_free_i32(rval);
+    tcg_temp_free_i32(lsh);
+    tcg_temp_free_i32(rsh);
+    tcg_temp_free_i32(zero);
+    tcg_temp_free_i32(max);
+}
+
+void gen_ushl_i64(TCGv_i64 dst, TCGv_i64 src, TCGv_i64 shift)
+{
+    TCGv_i64 lval = tcg_temp_new_i64();
+    TCGv_i64 rval = tcg_temp_new_i64();
+    TCGv_i64 lsh = tcg_temp_new_i64();
+    TCGv_i64 rsh = tcg_temp_new_i64();
+    TCGv_i64 zero = tcg_const_i64(0);
+    TCGv_i64 max = tcg_const_i64(64);
+
+    /*
+     * Rely on the TCG guarantee that out of range shifts produce
+     * unspecified results, not undefined behaviour (i.e. no trap).
+     * Discard out-of-range results after the fact.
+     */
+    tcg_gen_ext8s_i64(lsh, shift);
+    tcg_gen_neg_i64(rsh, lsh);
+    tcg_gen_shl_i64(lval, src, lsh);
+    tcg_gen_shr_i64(rval, src, rsh);
+    tcg_gen_movcond_i64(TCG_COND_LTU, dst, lsh, max, lval, zero);
+    tcg_gen_movcond_i64(TCG_COND_LTU, dst, rsh, max, rval, dst);
+
+    tcg_temp_free_i64(lval);
+    tcg_temp_free_i64(rval);
+    tcg_temp_free_i64(lsh);
+    tcg_temp_free_i64(rsh);
+    tcg_temp_free_i64(zero);
+    tcg_temp_free_i64(max);
+}
+
+static void gen_ushl_vec(unsigned vece, TCGv_vec dst,
+                         TCGv_vec src, TCGv_vec shift)
+{
+    TCGv_vec lval = tcg_temp_new_vec_matching(dst);
+    TCGv_vec rval = tcg_temp_new_vec_matching(dst);
+    TCGv_vec lsh = tcg_temp_new_vec_matching(dst);
+    TCGv_vec rsh = tcg_temp_new_vec_matching(dst);
+    TCGv_vec msk, max;
+
+    tcg_gen_neg_vec(vece, rsh, shift);
+    if (vece == MO_8) {
+        tcg_gen_mov_vec(lsh, shift);
+    } else {
+        msk = tcg_temp_new_vec_matching(dst);
+        tcg_gen_dupi_vec(vece, msk, 0xff);
+        tcg_gen_and_vec(vece, lsh, shift, msk);
+        tcg_gen_and_vec(vece, rsh, rsh, msk);
+        tcg_temp_free_vec(msk);
+    }
+
+    /*
+     * Rely on the TCG guarantee that out of range shifts produce
+     * unspecified results, not undefined behaviour (i.e. no trap).
+     * Discard out-of-range results after the fact.
+     */
+    tcg_gen_shlv_vec(vece, lval, src, lsh);
+    tcg_gen_shrv_vec(vece, rval, src, rsh);
+
+    max = tcg_temp_new_vec_matching(dst);
+    tcg_gen_dupi_vec(vece, max, 8 << vece);
+
+    /*
+     * The choice of LT (signed) and GEU (unsigned) are biased toward
+     * the instructions of the x86_64 host.  For MO_8, the whole byte
+     * is significant so we must use an unsigned compare; otherwise we
+     * have already masked to a byte and so a signed compare works.
+     * Other tcg hosts have a full set of comparisons and do not care.
+     */
+    if (vece == MO_8) {
+        tcg_gen_cmp_vec(TCG_COND_GEU, vece, lsh, lsh, max);
+        tcg_gen_cmp_vec(TCG_COND_GEU, vece, rsh, rsh, max);
+        tcg_gen_andc_vec(vece, lval, lval, lsh);
+        tcg_gen_andc_vec(vece, rval, rval, rsh);
+    } else {
+        tcg_gen_cmp_vec(TCG_COND_LT, vece, lsh, lsh, max);
+        tcg_gen_cmp_vec(TCG_COND_LT, vece, rsh, rsh, max);
+        tcg_gen_and_vec(vece, lval, lval, lsh);
+        tcg_gen_and_vec(vece, rval, rval, rsh);
+    }
+    tcg_gen_or_vec(vece, dst, lval, rval);
+
+    tcg_temp_free_vec(max);
+    tcg_temp_free_vec(lval);
+    tcg_temp_free_vec(rval);
+    tcg_temp_free_vec(lsh);
+    tcg_temp_free_vec(rsh);
+}
+
+static const TCGOpcode ushl_list[] = {
+    INDEX_op_neg_vec, INDEX_op_shlv_vec,
+    INDEX_op_shrv_vec, INDEX_op_cmp_vec, 0
+};
+
+const GVecGen3 ushl_op[4] = {
+    { .fniv = gen_ushl_vec,
+      .fno = gen_helper_gvec_ushl_b,
+      .opt_opc = ushl_list,
+      .vece = MO_8 },
+    { .fniv = gen_ushl_vec,
+      .fno = gen_helper_gvec_ushl_h,
+      .opt_opc = ushl_list,
+      .vece = MO_16 },
+    { .fni4 = gen_ushl_i32,
+      .fniv = gen_ushl_vec,
+      .opt_opc = ushl_list,
+      .vece = MO_32 },
+    { .fni8 = gen_ushl_i64,
+      .fniv = gen_ushl_vec,
+      .opt_opc = ushl_list,
+      .vece = MO_64 },
+};
+
+void gen_sshl_i32(TCGv_i32 dst, TCGv_i32 src, TCGv_i32 shift)
+{
+    TCGv_i32 lval = tcg_temp_new_i32();
+    TCGv_i32 rval = tcg_temp_new_i32();
+    TCGv_i32 lsh = tcg_temp_new_i32();
+    TCGv_i32 rsh = tcg_temp_new_i32();
+    TCGv_i32 zero = tcg_const_i32(0);
+    TCGv_i32 max = tcg_const_i32(31);
+
+    /*
+     * Rely on the TCG guarantee that out of range shifts produce
+     * unspecified results, not undefined behaviour (i.e. no trap).
+     * Discard out-of-range results after the fact.
+     */
+    tcg_gen_ext8s_i32(lsh, shift);
+    tcg_gen_neg_i32(rsh, lsh);
+    tcg_gen_shl_i32(lval, src, lsh);
+    tcg_gen_umin_i32(rsh, rsh, max);
+    tcg_gen_sar_i32(rval, src, rsh);
+    tcg_gen_movcond_i32(TCG_COND_LEU, lval, lsh, max, lval, zero);
+    tcg_gen_movcond_i32(TCG_COND_LT, dst, lsh, zero, rval, lval);
+
+    tcg_temp_free_i32(lval);
+    tcg_temp_free_i32(rval);
+    tcg_temp_free_i32(lsh);
+    tcg_temp_free_i32(rsh);
+    tcg_temp_free_i32(zero);
+    tcg_temp_free_i32(max);
+}
+
+void gen_sshl_i64(TCGv_i64 dst, TCGv_i64 src, TCGv_i64 shift)
+{
+    TCGv_i64 lval = tcg_temp_new_i64();
+    TCGv_i64 rval = tcg_temp_new_i64();
+    TCGv_i64 lsh = tcg_temp_new_i64();
+    TCGv_i64 rsh = tcg_temp_new_i64();
+    TCGv_i64 zero = tcg_const_i64(0);
+    TCGv_i64 max = tcg_const_i64(63);
+
+    /*
+     * Rely on the TCG guarantee that out of range shifts produce
+     * unspecified results, not undefined behaviour (i.e. no trap).
+     * Discard out-of-range results after the fact.
+     */
+    tcg_gen_ext8s_i64(lsh, shift);
+    tcg_gen_neg_i64(rsh, lsh);
+    tcg_gen_shl_i64(lval, src, lsh);
+    tcg_gen_umin_i64(rsh, rsh, max);
+    tcg_gen_sar_i64(rval, src, rsh);
+    tcg_gen_movcond_i64(TCG_COND_LEU, lval, lsh, max, lval, zero);
+    tcg_gen_movcond_i64(TCG_COND_LT, dst, lsh, zero, rval, lval);
+
+    tcg_temp_free_i64(lval);
+    tcg_temp_free_i64(rval);
+    tcg_temp_free_i64(lsh);
+    tcg_temp_free_i64(rsh);
+    tcg_temp_free_i64(zero);
+    tcg_temp_free_i64(max);
+}
+
+static void gen_sshl_vec(unsigned vece, TCGv_vec dst,
+                         TCGv_vec src, TCGv_vec shift)
+{
+    TCGv_vec lval = tcg_temp_new_vec_matching(dst);
+    TCGv_vec rval = tcg_temp_new_vec_matching(dst);
+    TCGv_vec lsh = tcg_temp_new_vec_matching(dst);
+    TCGv_vec rsh = tcg_temp_new_vec_matching(dst);
+    TCGv_vec tmp = tcg_temp_new_vec_matching(dst);
+
+    /*
+     * Rely on the TCG guarantee that out of range shifts produce
+     * unspecified results, not undefined behaviour (i.e. no trap).
+     * Discard out-of-range results after the fact.
+     */
+    tcg_gen_neg_vec(vece, rsh, shift);
+    if (vece == MO_8) {
+        tcg_gen_mov_vec(lsh, shift);
+    } else {
+        tcg_gen_dupi_vec(vece, tmp, 0xff);
+        tcg_gen_and_vec(vece, lsh, shift, tmp);
+        tcg_gen_and_vec(vece, rsh, rsh, tmp);
+    }
+
+    /* Bound rsh so out of bound right shift gets -1.  */
+    tcg_gen_dupi_vec(vece, tmp, (8 << vece) - 1);
+    tcg_gen_umin_vec(vece, rsh, rsh, tmp);
+    tcg_gen_cmp_vec(TCG_COND_GT, vece, tmp, lsh, tmp);
+
+    tcg_gen_shlv_vec(vece, lval, src, lsh);
+    tcg_gen_sarv_vec(vece, rval, src, rsh);
+
+    /* Select in-bound left shift.  */
+    tcg_gen_andc_vec(vece, lval, lval, tmp);
+
+    /* Select between left and right shift.  */
+    if (vece == MO_8) {
+        tcg_gen_dupi_vec(vece, tmp, 0);
+        tcg_gen_cmpsel_vec(TCG_COND_LT, vece, dst, lsh, tmp, rval, lval);
+    } else {
+        tcg_gen_dupi_vec(vece, tmp, 0x80);
+        tcg_gen_cmpsel_vec(TCG_COND_LT, vece, dst, lsh, tmp, lval, rval);
+    }
+
+    tcg_temp_free_vec(lval);
+    tcg_temp_free_vec(rval);
+    tcg_temp_free_vec(lsh);
+    tcg_temp_free_vec(rsh);
+    tcg_temp_free_vec(tmp);
+}
+
+static const TCGOpcode sshl_list[] = {
+    INDEX_op_neg_vec, INDEX_op_umin_vec, INDEX_op_shlv_vec,
+    INDEX_op_sarv_vec, INDEX_op_cmp_vec, INDEX_op_cmpsel_vec, 0
+};
+
+const GVecGen3 sshl_op[4] = {
+    { .fniv = gen_sshl_vec,
+      .fno = gen_helper_gvec_sshl_b,
+      .opt_opc = sshl_list,
+      .vece = MO_8 },
+    { .fniv = gen_sshl_vec,
+      .fno = gen_helper_gvec_sshl_h,
+      .opt_opc = sshl_list,
+      .vece = MO_16 },
+    { .fni4 = gen_sshl_i32,
+      .fniv = gen_sshl_vec,
+      .opt_opc = sshl_list,
+      .vece = MO_32 },
+    { .fni8 = gen_sshl_i64,
+      .fniv = gen_sshl_vec,
+      .opt_opc = sshl_list,
+      .vece = MO_64 },
+};
+
 static void gen_uqadd_vec(unsigned vece, TCGv_vec t, TCGv_vec sat,
                           TCGv_vec a, TCGv_vec b)
 {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                                   vec_size, vec_size);
             }
             return 0;
+
+        case NEON_3R_VSHL:
+            /* Note the operation is vshl vd,vm,vn */
+            tcg_gen_gvec_3(rd_ofs, rm_ofs, rn_ofs, vec_size, vec_size,
+                           u ? &ushl_op[size] : &sshl_op[size]);
+            return 0;
         }
 
         if (size == 3) {
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                 neon_load_reg64(cpu_V0, rn + pass);
                 neon_load_reg64(cpu_V1, rm + pass);
                 switch (op) {
-                case NEON_3R_VSHL:
-                    if (u) {
-                        gen_helper_neon_shl_u64(cpu_V0, cpu_V1, cpu_V0);
-                    } else {
-                        gen_helper_neon_shl_s64(cpu_V0, cpu_V1, cpu_V0);
-                    }
-                    break;
                 case NEON_3R_VQSHL:
                     if (u) {
                         gen_helper_neon_qshl_u64(cpu_V0, cpu_env,
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
         }
         pairwise = 0;
         switch (op) {
-        case NEON_3R_VSHL:
         case NEON_3R_VQSHL:
         case NEON_3R_VRSHL:
         case NEON_3R_VQRSHL:
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
         case NEON_3R_VHSUB:
             GEN_NEON_INTEGER_OP(hsub);
             break;
-        case NEON_3R_VSHL:
-            GEN_NEON_INTEGER_OP(shl);
-            break;
         case NEON_3R_VQSHL:
             GEN_NEON_INTEGER_OP_ENV(qshl);
             break;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                             }
                         } else {
                             if (input_unsigned) {
-                                gen_helper_neon_shl_u64(cpu_V0, in, tmp64);
+                                gen_ushl_i64(cpu_V0, in, tmp64);
                             } else {
-                                gen_helper_neon_shl_s64(cpu_V0, in, tmp64);
+                                gen_sshl_i64(cpu_V0, in, tmp64);
                             }
                         }
                         tmp = tcg_temp_new_i32();
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fmlal_idx_a64)(void *vd, void *vn, void *vm,
     do_fmlal_idx(vd, vn, vm, &env->vfp.fp_status, desc,
                  get_flush_inputs_to_zero(&env->vfp.fp_status_f16));
 }
+
+void HELPER(gvec_sshl_b)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    int8_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz; ++i) {
+        int8_t mm = m[i];
+        int8_t nn = n[i];
+        int8_t res = 0;
+        if (mm >= 0) {
+            if (mm < 8) {
+                res = nn << mm;
+            }
+        } else {
+            res = nn >> (mm > -8 ? -mm : 7);
+        }
+        d[i] = res;
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_sshl_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    int16_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 2; ++i) {
+        int8_t mm = m[i];   /* only 8 bits of shift are significant */
+        int16_t nn = n[i];
+        int16_t res = 0;
+        if (mm >= 0) {
+            if (mm < 16) {
+                res = nn << mm;
+            }
+        } else {
+            res = nn >> (mm > -16 ? -mm : 15);
+        }
+        d[i] = res;
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_ushl_b)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint8_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz; ++i) {
+        int8_t mm = m[i];
+        uint8_t nn = n[i];
+        uint8_t res = 0;
+        if (mm >= 0) {
+            if (mm < 8) {
+                res = nn << mm;
+            }
+        } else {
+            if (mm > -8) {
+                res = nn >> -mm;
+            }
+        }
+        d[i] = res;
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_ushl_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint16_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 2; ++i) {
+        int8_t mm = m[i];   /* only 8 bits of shift are significant */
+        uint16_t nn = n[i];
+        uint16_t res = 0;
+        if (mm >= 0) {
+            if (mm < 16) {
+                res = nn << mm;
+            }
+        } else {
+            if (mm > -16) {
+                res = nn >> -mm;
+            }
+        }
+        d[i] = res;
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The gvec form will be needed for implementing SVE2.

Extend the implementation to operate on uint64_t instead of uint32_t.
Use a counted inner loop instead of terminating when op1 goes to zero,
looking toward the required implementation for ARMv8.4-DIT.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216214232.4230-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  3 ++-
 target/arm/neon_helper.c   | 22 ----------------------
 target/arm/translate-a64.c | 10 +++-------
 target/arm/translate.c     | 11 ++++-------
 target/arm/vec_helper.c    | 30 ++++++++++++++++++++++++++++++
 5 files changed, 39 insertions(+), 37 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

The gvec form will be needed for implementing SVE2.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216214232.4230-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  4 +---
 target/arm/neon_helper.c   | 30 ------------------------------
 target/arm/translate-a64.c | 28 +++-------------------------
 target/arm/translate.c     | 16 ++--------------
 target/arm/vec_helper.c    | 33 +++++++++++++++++++++++++++++++++
 5 files changed, 39 insertions(+), 72 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(crc32, TCG_CALL_NO_RWG_SE, i32, i32, i32, i32)
 DEF_HELPER_FLAGS_3(crc32c, TCG_CALL_NO_RWG_SE, i32, i32, i32, i32)
 DEF_HELPER_2(dc_zva, void, env, i64)
 
-DEF_HELPER_FLAGS_2(neon_pmull_64_lo, TCG_CALL_NO_RWG_SE, i64, i64, i64)
-DEF_HELPER_FLAGS_2(neon_pmull_64_hi, TCG_CALL_NO_RWG_SE, i64, i64, i64)
-
 DEF_HELPER_FLAGS_5(gvec_qrdmlah_s16, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_qrdmlsh_s16, TCG_CALL_NO_RWG,
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_ushl_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_4(gvec_pmul_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/neon_helper.c
+++ b/target/arm/neon_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(neon_zip16)(void *vd, void *vm)
     rm[0] = m0;
     rd[0] = d0;
 }
-
-/* Helper function for 64 bit polynomial multiply case:
- * perform PolynomialMult(op1, op2) and return either the top or
- * bottom half of the 128 bit result.
- */
-uint64_t HELPER(neon_pmull_64_lo)(uint64_t op1, uint64_t op2)
-{
-    int bitnum;
-    uint64_t res = 0;
-
-    for (bitnum = 0; bitnum < 64; bitnum++) {
-        if (op1 & (1ULL << bitnum)) {
-            res ^= op2 << bitnum;
-        }
-    }
-    return res;
-}
-uint64_t HELPER(neon_pmull_64_hi)(uint64_t op1, uint64_t op2)
-{
-    int bitnum;
-    uint64_t res = 0;
-
-    /* bit 0 of op1 can't influence the high 64 bits at all */
-    for (bitnum = 1; bitnum < 64; bitnum++) {
-        if (op1 & (1ULL << bitnum)) {
-            res ^= op2 >> (64 - bitnum);
-        }
-    }
-    return res;
-}
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_3rd_narrowing(DisasContext *s, int is_q, int is_u, int size,
     clear_vec_high(s, is_q, rd);
 }
 
-static void handle_pmull_64(DisasContext *s, int is_q, int rd, int rn, int rm)
-{
-    /* PMULL of 64 x 64 -> 128 is an odd special case because it
-     * is the only three-reg-diff instruction which produces a
-     * 128-bit wide result from a single operation. However since
-     * it's possible to calculate the two halves more or less
-     * separately we just use two helper calls.
-     */
-    TCGv_i64 tcg_op1 = tcg_temp_new_i64();
-    TCGv_i64 tcg_op2 = tcg_temp_new_i64();
-    TCGv_i64 tcg_res = tcg_temp_new_i64();
-
-    read_vec_element(s, tcg_op1, rn, is_q, MO_64);
-    read_vec_element(s, tcg_op2, rm, is_q, MO_64);
-    gen_helper_neon_pmull_64_lo(tcg_res, tcg_op1, tcg_op2);
-    write_vec_element(s, tcg_res, rd, 0, MO_64);
-    gen_helper_neon_pmull_64_hi(tcg_res, tcg_op1, tcg_op2);
-    write_vec_element(s, tcg_res, rd, 1, MO_64);
-
-    tcg_temp_free_i64(tcg_op1);
-    tcg_temp_free_i64(tcg_op2);
-    tcg_temp_free_i64(tcg_res);
-}
-
 /* AdvSIMD three different
  *   31  30  29 28       24 23  22  21 20  16 15    12 11 10 9    5 4    0
  * +---+---+---+-----------+------+---+------+--------+-----+------+------+
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
             if (!fp_access_check(s)) {
                 return;
             }
-            handle_pmull_64(s, is_q, rd, rn, rm);
+            /* The Q field specifies lo/hi half input for this insn.  */
+            gen_gvec_op3_ool(s, true, rd, rn, rm, is_q,
+                             gen_helper_gvec_pmull_q);
             return;
         }
         goto is_widening;
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                  * outside the loop below as it only performs a single pass.
                  */
                 if (op == 14 && size == 2) {
-                    TCGv_i64 tcg_rn, tcg_rm, tcg_rd;
-
                     if (!dc_isar_feature(aa32_pmull, s)) {
                         return 1;
                     }
-                    tcg_rn = tcg_temp_new_i64();
-                    tcg_rm = tcg_temp_new_i64();
-                    tcg_rd = tcg_temp_new_i64();
-                    neon_load_reg64(tcg_rn, rn);
-                    neon_load_reg64(tcg_rm, rm);
-                    gen_helper_neon_pmull_64_lo(tcg_rd, tcg_rn, tcg_rm);
-                    neon_store_reg64(tcg_rd, rd);
-                    gen_helper_neon_pmull_64_hi(tcg_rd, tcg_rn, tcg_rm);
-                    neon_store_reg64(tcg_rd, rd + 1);
-                    tcg_temp_free_i64(tcg_rn);
-                    tcg_temp_free_i64(tcg_rm);
-                    tcg_temp_free_i64(tcg_rd);
+                    tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
+                                       0, gen_helper_gvec_pmull_q);
                     return 0;
                 }
 
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_pmul_b)(void *vd, void *vn, void *vm, uint32_t desc)
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
+
+/*
+ * 64x64->128 polynomial multiply.
+ * Because of the lanes are not accessed in strict columns,
+ * this probably cannot be turned into a generic helper.
+ */
+void HELPER(gvec_pmull_q)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, j, opr_sz = simd_oprsz(desc);
+    intptr_t hi = simd_data(desc);
+    uint64_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 8; i += 2) {
+        uint64_t nn = n[i + hi];
+        uint64_t mm = m[i + hi];
+        uint64_t rhi = 0;
+        uint64_t rlo = 0;
+
+        /* Bit 0 can only influence the low 64-bit result.  */
+        if (nn & 1) {
+            rlo = mm;
+        }
+
+        for (j = 1; j < 64; ++j) {
+            uint64_t mask = -((nn >> j) & 1);
+            rlo ^= (mm << j) & mask;
+            rhi ^= (mm >> (64 - j)) & mask;
+        }
+        d[i] = rlo;
+        d[i + 1] = rhi;
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

We still need two different helpers, since NEON and SVE2 get the
inputs from different locations within the source vector.  However,
we can convert both to the same internal form for computation.

The sve2 helper is not used yet, but adding it with this patch
helps illustrate why the neon changes are helpful.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200216214232.4230-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  2 ++
 target/arm/helper.h        |  3 +-
 target/arm/neon_helper.c   | 32 --------------------
 target/arm/translate-a64.c | 27 +++++++++++------
 target/arm/translate.c     | 26 ++++++++---------
 target/arm/vec_helper.c    | 60 ++++++++++++++++++++++++++++++++++++++
 6 files changed, 95 insertions(+), 55 deletions(-)

diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-sve.h
+++ b/target/arm/helper-sve.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(sve_stdd_le_zd, TCG_CALL_NO_WG,
                    void, env, ptr, ptr, ptr, tl, i32)
 DEF_HELPER_FLAGS_6(sve_stdd_be_zd, TCG_CALL_NO_WG,
                    void, env, ptr, ptr, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve2_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(neon_sub_u8, i32, i32, i32)
 DEF_HELPER_2(neon_sub_u16, i32, i32, i32)
 DEF_HELPER_2(neon_mul_u8, i32, i32, i32)
 DEF_HELPER_2(neon_mul_u16, i32, i32, i32)
-DEF_HELPER_2(neon_mull_p8, i64, i32, i32)
 
 DEF_HELPER_2(neon_tst_u8, i32, i32, i32)
 DEF_HELPER_2(neon_tst_u16, i32, i32, i32)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_ushl_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_pmul_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_pmull_q, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(neon_pmull_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
 #include "helper-sve.h"
diff --git a/target/arm/neon_helper.c b/target/arm/neon_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/neon_helper.c
+++ b/target/arm/neon_helper.c
@@ -XXX,XX +XXX,XX @@ NEON_VOP(mul_u8, neon_u8, 4)
 NEON_VOP(mul_u16, neon_u16, 2)
 #undef NEON_FN
 
-/* Polynomial multiplication is like integer multiplication except the
-   partial products are XORed, not added.  */
-uint64_t HELPER(neon_mull_p8)(uint32_t op1, uint32_t op2)
-{
-    uint64_t result = 0;
-    uint64_t mask;
-    uint64_t op2ex = op2;
-    op2ex = (op2ex & 0xff) |
-        ((op2ex & 0xff00) << 8) |
-        ((op2ex & 0xff0000) << 16) |
-        ((op2ex & 0xff000000) << 24);
-    while (op1) {
-        mask = 0;
-        if (op1 & 1) {
-            mask |= 0xffff;
-        }
-        if (op1 & (1 << 8)) {
-            mask |= (0xffffU << 16);
-        }
-        if (op1 & (1 << 16)) {
-            mask |= (0xffffULL << 32);
-        }
-        if (op1 & (1 << 24)) {
-            mask |= (0xffffULL << 48);
-        }
-        result ^= op2ex & mask;
-        op1 = (op1 >> 1) & 0x7f7f7f7f;
-        op2ex <<= 1;
-    }
-    return result;
-}
-
 #define NEON_FN(dest, src1, src2) dest = (src1 & src2) ? -1 : 0
 NEON_VOP(tst_u8, neon_u8, 4)
 NEON_VOP(tst_u16, neon_u16, 2)
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_3rd_widening(DisasContext *s, int is_q, int is_u, int size,
                 gen_helper_neon_addl_saturate_s32(tcg_passres, cpu_env,
                                                   tcg_passres, tcg_passres);
                 break;
-            case 14: /* PMULL */
-                assert(size == 0);
-                gen_helper_neon_mull_p8(tcg_passres, tcg_op1, tcg_op2);
-                break;
             default:
                 g_assert_not_reached();
             }
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
         handle_3rd_narrowing(s, is_q, is_u, size, opcode, rd, rn, rm);
         break;
     case 14: /* PMULL, PMULL2 */
-        if (is_u || size == 1 || size == 2) {
+        if (is_u) {
             unallocated_encoding(s);
             return;
         }
-        if (size == 3) {
+        switch (size) {
+        case 0: /* PMULL.P8 */
+            if (!fp_access_check(s)) {
+                return;
+            }
+            /* The Q field specifies lo/hi half input for this insn.  */
+            gen_gvec_op3_ool(s, true, rd, rn, rm, is_q,
+                             gen_helper_neon_pmull_h);
+            break;
+
+        case 3: /* PMULL.P64 */
             if (!dc_isar_feature(aa64_pmull, s)) {
                 unallocated_encoding(s);
                 return;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
             /* The Q field specifies lo/hi half input for this insn.  */
             gen_gvec_op3_ool(s, true, rd, rn, rm, is_q,
                              gen_helper_gvec_pmull_q);
-            return;
+            break;
+
+        default:
+            unallocated_encoding(s);
+            break;
         }
-        goto is_widening;
+        return;
     case 9: /* SQDMLAL, SQDMLAL2 */
     case 11: /* SQDMLSL, SQDMLSL2 */
     case 13: /* SQDMULL, SQDMULL2 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_diff(DisasContext *s, uint32_t insn)
             unallocated_encoding(s);
             return;
         }
-    is_widening:
         if (!fp_access_check(s)) {
             return;
         }
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                     return 1;
                 }
 
-                /* Handle VMULL.P64 (Polynomial 64x64 to 128 bit multiply)
-                 * outside the loop below as it only performs a single pass.
-                 */
-                if (op == 14 && size == 2) {
-                    if (!dc_isar_feature(aa32_pmull, s)) {
-                        return 1;
+                /* Handle polynomial VMULL in a single pass.  */
+                if (op == 14) {
+                    if (size == 0) {
+                        /* VMULL.P8 */
+                        tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
+                                           0, gen_helper_neon_pmull_h);
+                    } else {
+                        /* VMULL.P64 */
+                        if (!dc_isar_feature(aa32_pmull, s)) {
+                            return 1;
+                        }
+                        tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
+                                           0, gen_helper_gvec_pmull_q);
                     }
-                    tcg_gen_gvec_3_ool(rd_ofs, rn_ofs, rm_ofs, 16, 16,
-                                       0, gen_helper_gvec_pmull_q);
                     return 0;
                 }
 
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
                         /* VMLAL, VQDMLAL, VMLSL, VQDMLSL, VMULL, VQDMULL */
                         gen_neon_mull(cpu_V0, tmp, tmp2, size, u);
                         break;
-                    case 14: /* Polynomial VMULL */
-                        gen_helper_neon_mull_p8(cpu_V0, tmp, tmp2);
-                        tcg_temp_free_i32(tmp2);
-                        tcg_temp_free_i32(tmp);
-                        break;
                     default: /* 15 is RESERVED: caught earlier  */
                         abort();
                     }
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_pmull_q)(void *vd, void *vn, void *vm, uint32_t desc)
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
+
+/*
+ * 8x8->16 polynomial multiply.
+ *
+ * The byte inputs are expanded to (or extracted from) half-words.
+ * Note that neon and sve2 get the inputs from different positions.
+ * This allows 4 bytes to be processed in parallel with uint64_t.
+ */
+
+static uint64_t expand_byte_to_half(uint64_t x)
+{
+    return  (x & 0x000000ff)
+         | ((x & 0x0000ff00) << 8)
+         | ((x & 0x00ff0000) << 16)
+         | ((x & 0xff000000) << 24);
+}
+
+static uint64_t pmull_h(uint64_t op1, uint64_t op2)
+{
+    uint64_t result = 0;
+    int i;
+
+    for (i = 0; i < 8; ++i) {
+        uint64_t mask = (op1 & 0x0001000100010001ull) * 0xffff;
+        result ^= op2 & mask;
+        op1 >>= 1;
+        op2 <<= 1;
+    }
+    return result;
+}
+
+void HELPER(neon_pmull_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    int hi = simd_data(desc);
+    uint64_t *d = vd, *n = vn, *m = vm;
+    uint64_t nn = n[hi], mm = m[hi];
+
+    d[0] = pmull_h(expand_byte_to_half(nn), expand_byte_to_half(mm));
+    nn >>= 32;
+    mm >>= 32;
+    d[1] = pmull_h(expand_byte_to_half(nn), expand_byte_to_half(mm));
+
+    clear_tail(d, 16, simd_maxsz(desc));
+}
+
+#ifdef TARGET_AARCH64
+void HELPER(sve2_pmull_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    int shift = simd_data(desc) * 8;
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint64_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 8; ++i) {
+        uint64_t nn = (n[i] >> shift) & 0x00ff00ff00ff00ffull;
+        uint64_t mm = (m[i] >> shift) & 0x00ff00ff00ff00ffull;
+
+        d[i] = pmull_h(nn, mm);
+    }
+}
+#endif
-- 
2.20.1

From: Francisco Iglesias <francisco.iglesias@xilinx.com>

Correct the number of dummy cycles required by the FAST_READ_4 command (to
be eight, one dummy byte).

Fixes: ef06ca3946 ("xilinx_spips: Add support for RX discard and RX drain")
Suggested-by: Cédric Le Goater <clg@kaod.org>
Signed-off-by: Francisco Iglesias <frasse.iglesias@gmail.com>
Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
Message-id: 20200218113350.6090-1-frasse.iglesias@gmail.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/ssi/xilinx_spips.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/hw/ssi/xilinx_spips.c b/hw/ssi/xilinx_spips.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/ssi/xilinx_spips.c
+++ b/hw/ssi/xilinx_spips.c
@@ -XXX,XX +XXX,XX @@ static int xilinx_spips_num_dummies(XilinxQSPIPS *qs, uint8_t command)
     case FAST_READ:
     case DOR:
     case QOR:
+    case FAST_READ_4:
     case DOR_4:
     case QOR_4:
         return 1;
     case DIOR:
-    case FAST_READ_4:
     case DIOR_4:
         return 2;
     case QIOR:
-- 
2.20.1

From: Guenter Roeck <linux@roeck-us.net>

Booting the r2d machine from flash fails because flash is not discovered.
Looking at the flattened memory tree, we see the following.

FlatView #1
 AS "memory", root: system
 AS "cpu-memory-0", root: system
 AS "sh_pci_host", root: bus master container
 Root memory region: system
  0000000000000000-000000000000ffff (prio 0, i/o): io
  0000000000010000-0000000000ffffff (prio 0, i/o): r2d.flash @0000000000010000

The overlapping memory region is sh_pci.isa, ie the ISA I/O region bridge.
This region is initially assigned to address 0xfe240000, but overwritten
with a write into the PCIIOBR register. This write is expected to adjust
the PCI memory window, but not to change the region's base adddress.

Peter Maydell provided the following detailed explanation.

"Section 22.3.7 and in particular figure 22.3 (of "SSH7751R user's manual:
hardware") are clear about how this is supposed to work: there is a window
at 0xfe240000 in the system register space for PCI I/O space. When the CPU
makes an access into that area, the PCI controller calculates the PCI
address to use by combining bits 0..17 of the system address with the
bits 31..18 value that the guest has put into the PCIIOBR. That is, writing
to the PCIIOBR changes which section of the IO address space is visible in
the 0xfe240000 window. Instead what QEMU's implementation does is move the
window to whatever value the guest writes to the PCIIOBR register -- so if
the guest writes 0 we put the window at 0 in system address space."

Fix the problem by calling memory_region_set_alias_offset() instead of
removing and re-adding the PCI ISA subregion on writes into PCIIOBR.
At the same time, in sh_pci_device_realize(), don't set iobr since
it is overwritten later anyway. Instead, pass the base address to
memory_region_add_subregion() directly.

Many thanks to Peter Maydell for the detailed problem analysis, and for
providing suggestions on how to fix the problem.

Signed-off-by: Guenter Roeck <linux@roeck-us.net>
Message-id: 20200218201050.15273-1-linux@roeck-us.net
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/sh4/sh_pci.c | 11 +++--------
 1 file changed, 3 insertions(+), 8 deletions(-)

diff --git a/hw/sh4/sh_pci.c b/hw/sh4/sh_pci.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sh4/sh_pci.c
+++ b/hw/sh4/sh_pci.c
@@ -XXX,XX +XXX,XX @@ static void sh_pci_reg_write (void *p, hwaddr addr, uint64_t val,
         pcic->mbr = val & 0xff000001;
         break;
     case 0x1c8:
-        if ((val & 0xfffc0000) != (pcic->iobr & 0xfffc0000)) {
-            memory_region_del_subregion(get_system_memory(), &pcic->isa);
-            pcic->iobr = val & 0xfffc0001;
-            memory_region_add_subregion(get_system_memory(),
-                                        pcic->iobr & 0xfffc0000, &pcic->isa);
-        }
+        pcic->iobr = val & 0xfffc0001;
+        memory_region_set_alias_offset(&pcic->isa, val & 0xfffc0000);
         break;
     case 0x220:
         pci_data_write(phb->bus, pcic->par, val, 4);
@@ -XXX,XX +XXX,XX @@ static void sh_pci_device_realize(DeviceState *dev, Error **errp)
                              get_system_io(), 0, 0x40000);
     sysbus_init_mmio(sbd, &s->memconfig_p4);
     sysbus_init_mmio(sbd, &s->memconfig_a7);
-    s->iobr = 0xfe240000;
-    memory_region_add_subregion(get_system_memory(), s->iobr, &s->isa);
+    memory_region_add_subregion(get_system_memory(), 0xfe240000, &s->isa);
 
     s->dev = pci_create_simple(phb->bus, PCI_DEVFN(0, 0), "sh_pci_host");
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The old name, isar_feature_aa32_fp_d32, does not reflect
the MVFR0 field name, SIMDReg.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200214181547.21408-3-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
[PMM: wrapped one long line]
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h               |  2 +-
 target/arm/translate-vfp.inc.c | 53 +++++++++++++++++-----------------
 2 files changed, 28 insertions(+), 27 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
     return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, FP) == 1;
 }
 
-static inline bool isar_feature_aa32_fp_d32(const ARMISARegisters *id)
+static inline bool isar_feature_aa32_simd_r32(const ARMISARegisters *id)
 {
     /* Return true if D16-D31 are implemented */
     return FIELD_EX32(id->mvfr0, MVFR0, SIMDREG) >= 2;
diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.inc.c
+++ b/target/arm/translate-vfp.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_fp_d32, s) &&
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
         ((a->vm | a->vn | a->vd) & 0x10)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINMAXNM(DisasContext *s, arg_VMINMAXNM *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_fp_d32, s) &&
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
         ((a->vm | a->vn | a->vd) & 0x10)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_fp_d32, s) &&
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
         ((a->vm | a->vd) & 0x10)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_to_gp(DisasContext *s, arg_VMOV_to_gp *a)
     uint32_t offset;
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vn & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_from_gp(DisasContext *s, arg_VMOV_from_gp *a)
     uint32_t offset;
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vn & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VDUP(DisasContext *s, arg_VDUP *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vn & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vn & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_64_dp(DisasContext *s, arg_VMOV_64_dp *a)
      */
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDR_VSTR_dp(DisasContext *s, arg_VLDR_VSTR_dp *a)
     TCGv_i64 tmp;
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDM_VSTM_dp(DisasContext *s, arg_VLDM_VSTM_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd + n) > 16) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd + n) > 16) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
     TCGv_ptr fpst;
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((vd | vn | vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vn | vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
     TCGv_i64 f0, fd;
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((vd | vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VFM_dp(DisasContext *s, arg_VFM_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vn | a->vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+        ((a->vd | a->vn | a->vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
     vd = a->vd;
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (vd & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd  & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd  & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm  & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm  & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && ((a->vd | a->vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((a->vd | a->vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp(DisasContext *s, arg_VCVT_sp *a)
     TCGv_i32 vm;
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
     TCGv_i32 vd;
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_int_dp(DisasContext *s, arg_VCVT_int_dp *a)
     TCGv_ptr fpst;
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vd & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp_int(DisasContext *s, arg_VCVT_dp_int *a)
     TCGv_ptr fpst;
 
     /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_fp_d32, s) && (a->vm & 0x10)) {
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Many uses of ARM_FEATURE_VFP3 are testing for the number of simd
registers implemented.  Use the proper test vs MVFR0.SIMDReg.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-4-richard.henderson@linaro.org
[PMM: fix typo in commit message]
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.c       |  9 ++++-----
 target/arm/helper.c    | 13 ++++++-------
 target/arm/translate.c |  2 +-
 3 files changed, 11 insertions(+), 13 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_dump_state(CPUState *cs, FILE *f, int flags)
 
     if (flags & CPU_DUMP_FPU) {
         int numvfpregs = 0;
-        if (arm_feature(env, ARM_FEATURE_VFP)) {
-            numvfpregs += 16;
-        }
-        if (arm_feature(env, ARM_FEATURE_VFP3)) {
-            numvfpregs += 16;
+        if (cpu_isar_feature(aa32_simd_r32, cpu)) {
+            numvfpregs = 32;
+        } else if (arm_feature(env, ARM_FEATURE_VFP)) {
+            numvfpregs = 16;
         }
         for (i = 0; i < numvfpregs; i++) {
             uint64_t v = *aa32_vfp_dreg(env, i);
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void switch_mode(CPUARMState *env, int mode);
 
 static int vfp_gdb_get_reg(CPUARMState *env, uint8_t *buf, int reg)
 {
-    int nregs;
+    ARMCPU *cpu = env_archcpu(env);
+    int nregs = cpu_isar_feature(aa32_simd_r32, cpu) ? 32 : 16;
 
     /* VFP data registers are always little-endian.  */
-    nregs = arm_feature(env, ARM_FEATURE_VFP3) ? 32 : 16;
     if (reg < nregs) {
         stq_le_p(buf, *aa32_vfp_dreg(env, reg));
         return 8;
@@ -XXX,XX +XXX,XX @@ static int vfp_gdb_get_reg(CPUARMState *env, uint8_t *buf, int reg)
 
 static int vfp_gdb_set_reg(CPUARMState *env, uint8_t *buf, int reg)
 {
-    int nregs;
+    ARMCPU *cpu = env_archcpu(env);
+    int nregs = cpu_isar_feature(aa32_simd_r32, cpu) ? 32 : 16;
 
-    nregs = arm_feature(env, ARM_FEATURE_VFP3) ? 32 : 16;
     if (reg < nregs) {
         *aa32_vfp_dreg(env, reg) = ldq_le_p(buf);
         return 8;
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
             /* VFPv3 and upwards with NEON implement 32 double precision
              * registers (D0-D31).
              */
-            if (!arm_feature(env, ARM_FEATURE_NEON) ||
-                    !arm_feature(env, ARM_FEATURE_VFP3)) {
+            if (!cpu_isar_feature(aa32_simd_r32, env_archcpu(env))) {
                 /* D32DIS [30] is RAO/WI if D16-31 are not implemented. */
                 value |= (1 << 30);
             }
@@ -XXX,XX +XXX,XX @@ void arm_cpu_register_gdb_regs_for_features(ARMCPU *cpu)
     } else if (arm_feature(env, ARM_FEATURE_NEON)) {
         gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
                                  51, "arm-neon.xml", 0);
-    } else if (arm_feature(env, ARM_FEATURE_VFP3)) {
+    } else if (cpu_isar_feature(aa32_simd_r32, cpu)) {
         gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
                                  35, "arm-vfp3.xml", 0);
     } else if (arm_feature(env, ARM_FEATURE_VFP)) {
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_dsp_insn(DisasContext *s, uint32_t insn)
 #define VFP_SREG(insn, bigbit, smallbit) \
   ((VFP_REG_SHR(insn, bigbit - 1) & 0x1e) | (((insn) >> (smallbit)) & 1))
 #define VFP_DREG(reg, insn, bigbit, smallbit) do { \
-    if (arm_dc_feature(s, ARM_FEATURE_VFP3)) { \
+    if (dc_isar_feature(aa32_simd_r32, s)) { \
         reg = (((insn) >> (bigbit)) & 0x0f) \
               | (((insn) >> ((smallbit) - 4)) & 0x10); \
     } else { \
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

We are going to convert FEATURE tests to ISAR tests,
so FPSP needs to be set for these cpus, like we have
already for FPDP.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-5-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.c | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm926_initfn(Object *obj)
      */
     cpu->isar.id_isar1 = FIELD_DP32(cpu->isar.id_isar1, ID_ISAR1, JAZELLE, 1);
     /*
-     * Similarly, we need to set MVFR0 fields to enable double precision
-     * and short vector support even though ARMv5 doesn't have this register.
+     * Similarly, we need to set MVFR0 fields to enable vfp and short vector
+     * support even though ARMv5 doesn't have this register.
      */
     cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSHVEC, 1);
+    cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSP, 1);
     cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPDP, 1);
 }
 
@@ -XXX,XX +XXX,XX @@ static void arm1026_initfn(Object *obj)
      */
     cpu->isar.id_isar1 = FIELD_DP32(cpu->isar.id_isar1, ID_ISAR1, JAZELLE, 1);
     /*
-     * Similarly, we need to set MVFR0 fields to enable double precision
-     * and short vector support even though ARMv5 doesn't have this register.
+     * Similarly, we need to set MVFR0 fields to enable vfp and short vector
+     * support even though ARMv5 doesn't have this register.
      */
     cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSHVEC, 1);
+    cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPSP, 1);
     cpu->isar.mvfr0 = FIELD_DP32(cpu->isar.mvfr0, MVFR0, FPDP, 1);
 
     {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Use this in the places that were checking ARM_FEATURE_VFP, and
are obviously testing for the existance of the register set
as opposed to testing for some particular instruction extension.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-6-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h        |  6 ++++++
 hw/intc/armv7m_nvic.c   | 20 ++++++++++----------
 linux-user/arm/signal.c |  4 ++--
 target/arm/arch_dump.c  | 11 ++++++-----
 target/arm/cpu.c        |  8 ++++----
 target/arm/helper.c     |  4 ++--
 target/arm/m_helper.c   | 11 ++++++-----
 target/arm/machine.c    |  3 +--
 8 files changed, 37 insertions(+), 30 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
     return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, FP) == 1;
 }
 
+static inline bool isar_feature_aa32_simd_r16(const ARMISARegisters *id)
+{
+    /* Return true if D0-D15 are implemented */
+    return FIELD_EX32(id->mvfr0, MVFR0, SIMDREG) > 0;
+}
+
 static inline bool isar_feature_aa32_simd_r32(const ARMISARegisters *id)
 {
     /* Return true if D16-D31 are implemented */
diff --git a/hw/intc/armv7m_nvic.c b/hw/intc/armv7m_nvic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/armv7m_nvic.c
+++ b/hw/intc/armv7m_nvic.c
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
     case 0xd84: /* CSSELR */
         return cpu->env.v7m.csselr[attrs.secure];
     case 0xd88: /* CPACR */
-        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
             return 0;
         }
         return cpu->env.v7m.cpacr[attrs.secure];
     case 0xd8c: /* NSACR */
-        if (!attrs.secure || !arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (!attrs.secure || !cpu_isar_feature(aa32_simd_r16, cpu)) {
             return 0;
         }
         return cpu->env.v7m.nsacr;
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
         }
         return cpu->env.v7m.sfar;
     case 0xf34: /* FPCCR */
-        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
             return 0;
         }
         if (attrs.secure) {
@@ -XXX,XX +XXX,XX @@ static uint32_t nvic_readl(NVICState *s, uint32_t offset, MemTxAttrs attrs)
             return value;
         }
     case 0xf38: /* FPCAR */
-        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
             return 0;
         }
         return cpu->env.v7m.fpcar[attrs.secure];
     case 0xf3c: /* FPDSCR */
-        if (!arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
             return 0;
         }
         return cpu->env.v7m.fpdscr[attrs.secure];
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
         }
         break;
     case 0xd88: /* CPACR */
-        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             /* We implement only the Floating Point extension's CP10/CP11 */
             cpu->env.v7m.cpacr[attrs.secure] = value & (0xf << 20);
         }
         break;
     case 0xd8c: /* NSACR */
-        if (attrs.secure && arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (attrs.secure && cpu_isar_feature(aa32_simd_r16, cpu)) {
             /* We implement only the Floating Point extension's CP10/CP11 */
             cpu->env.v7m.nsacr = value & (3 << 10);
         }
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
         break;
     }
     case 0xf34: /* FPCCR */
-        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             /* Not all bits here are banked. */
             uint32_t fpccr_s;
 
@@ -XXX,XX +XXX,XX @@ static void nvic_writel(NVICState *s, uint32_t offset, uint32_t value,
         }
         break;
     case 0xf38: /* FPCAR */
-        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             value &= ~7;
             cpu->env.v7m.fpcar[attrs.secure] = value;
         }
         break;
     case 0xf3c: /* FPDSCR */
-        if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             value &= 0x07c00000;
             cpu->env.v7m.fpdscr[attrs.secure] = value;
         }
diff --git a/linux-user/arm/signal.c b/linux-user/arm/signal.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/arm/signal.c
+++ b/linux-user/arm/signal.c
@@ -XXX,XX +XXX,XX @@ static void setup_sigframe_v2(struct target_ucontext_v2 *uc,
     setup_sigcontext(&uc->tuc_mcontext, env, set->sig[0]);
     /* Save coprocessor signal frame.  */
     regspace = uc->tuc_regspace;
-    if (arm_feature(env, ARM_FEATURE_VFP)) {
+    if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
         regspace = setup_sigframe_v2_vfp(regspace, env);
     }
     if (arm_feature(env, ARM_FEATURE_IWMMXT)) {
@@ -XXX,XX +XXX,XX @@ static int do_sigframe_return_v2(CPUARMState *env,
 
     /* Restore coprocessor signal frame */
     regspace = uc->tuc_regspace;
-    if (arm_feature(env, ARM_FEATURE_VFP)) {
+    if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
         regspace = restore_sigframe_v2_vfp(env, regspace);
         if (!regspace) {
             return 1;
diff --git a/target/arm/arch_dump.c b/target/arm/arch_dump.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/arch_dump.c
+++ b/target/arm/arch_dump.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_write_elf32_note(WriteCoreDumpFunction f, CPUState *cs,
                              int cpuid, void *opaque)
 {
     struct arm_note note;
-    CPUARMState *env = &ARM_CPU(cs)->env;
+    ARMCPU *cpu = ARM_CPU(cs);
+    CPUARMState *env = &cpu->env;
     DumpState *s = opaque;
-    int ret, i, fpvalid = !!arm_feature(env, ARM_FEATURE_VFP);
+    int ret, i;
+    bool fpvalid = cpu_isar_feature(aa32_simd_r16, cpu);
 
     arm_note_init(&note, s, "CORE", 5, NT_PRSTATUS, sizeof(note.prstatus));
 
@@ -XXX,XX +XXX,XX @@ int cpu_get_dump_info(ArchDumpInfo *info,
 ssize_t cpu_get_note_size(int class, int machine, int nr_cpus)
 {
     ARMCPU *cpu = ARM_CPU(first_cpu);
-    CPUARMState *env = &cpu->env;
     size_t note_size;
 
     if (class == ELFCLASS64) {
@@ -XXX,XX +XXX,XX @@ ssize_t cpu_get_note_size(int class, int machine, int nr_cpus)
         note_size += AARCH64_PRFPREG_NOTE_SIZE;
 #ifdef TARGET_AARCH64
         if (cpu_isar_feature(aa64_sve, cpu)) {
-            note_size += AARCH64_SVE_NOTE_SIZE(env);
+            note_size += AARCH64_SVE_NOTE_SIZE(&cpu->env);
         }
 #endif
     } else {
         note_size = ARM_PRSTATUS_NOTE_SIZE;
-        if (arm_feature(env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             note_size += ARM_VFP_NOTE_SIZE;
         }
     }
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
             env->v7m.ccr[M_REG_S] |= R_V7M_CCR_UNALIGN_TRP_MASK;
         }
 
-        if (arm_feature(env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             env->v7m.fpccr[M_REG_NS] = R_V7M_FPCCR_ASPEN_MASK;
             env->v7m.fpccr[M_REG_S] = R_V7M_FPCCR_ASPEN_MASK |
                 R_V7M_FPCCR_LSPEN_MASK | R_V7M_FPCCR_S_MASK;
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_dump_state(CPUState *cs, FILE *f, int flags)
         int numvfpregs = 0;
         if (cpu_isar_feature(aa32_simd_r32, cpu)) {
             numvfpregs = 32;
-        } else if (arm_feature(env, ARM_FEATURE_VFP)) {
+        } else if (cpu_isar_feature(aa32_simd_r16, cpu)) {
             numvfpregs = 16;
         }
         for (i = 0; i < numvfpregs; i++) {
@@ -XXX,XX +XXX,XX @@ void arm_cpu_post_init(Object *obj)
      * KVM does not currently allow us to lie to the guest about its
      * ID/feature registers, so the guest always sees what the host has.
      */
-    if (arm_feature(&cpu->env, ARM_FEATURE_VFP)) {
+    if (cpu_isar_feature(aa32_simd_r16, cpu)) {
         cpu->has_vfp = true;
         if (!kvm_enabled()) {
             qdev_property_add_static(DEVICE(obj), &arm_cpu_has_vfp_property);
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
      * We rely on no XScale CPU having VFP so we can use the same bits in the
      * TB flags field for VECSTRIDE and XSCALE_CPAR.
      */
-    assert(!(arm_feature(env, ARM_FEATURE_VFP) &&
+    assert(!(cpu_isar_feature(aa32_simd_r16, cpu) &&
              arm_feature(env, ARM_FEATURE_XSCALE)));
 
     if (arm_feature(env, ARM_FEATURE_V7) &&
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
          * ASEDIS [31] and D32DIS [30] are both UNK/SBZP without VFP.
          * TRCDIS [28] is RAZ/WI since we do not implement a trace macrocell.
          */
-        if (arm_feature(env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
             /* VFP coprocessor: cp10 & cp11 [23:20] */
             mask |= (1 << 31) | (1 << 30) | (0xf << 20);
 
@@ -XXX,XX +XXX,XX @@ void arm_cpu_register_gdb_regs_for_features(ARMCPU *cpu)
     } else if (cpu_isar_feature(aa32_simd_r32, cpu)) {
         gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
                                  35, "arm-vfp3.xml", 0);
-    } else if (arm_feature(env, ARM_FEATURE_VFP)) {
+    } else if (cpu_isar_feature(aa32_simd_r16, cpu)) {
         gdb_register_coprocessor(cs, vfp_gdb_get_reg, vfp_gdb_set_reg,
                                  19, "arm-vfp.xml", 0);
     }
diff --git a/target/arm/m_helper.c b/target/arm/m_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/m_helper.c
+++ b/target/arm/m_helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t v7m_integrity_sig(CPUARMState *env, uint32_t lr)
      */
     uint32_t sig = 0xfefa125a;
 
-    if (!arm_feature(env, ARM_FEATURE_VFP) || (lr & R_V7M_EXCRET_FTYPE_MASK)) {
+    if (!cpu_isar_feature(aa32_simd_r16, env_archcpu(env))
+        || (lr & R_V7M_EXCRET_FTYPE_MASK)) {
         sig |= 1;
     }
     return sig;
@@ -XXX,XX +XXX,XX @@ static void v7m_exception_taken(ARMCPU *cpu, uint32_t lr, bool dotailchain,
 
     if (dotailchain) {
         /* Sanitize LR FType and PREFIX bits */
-        if (!arm_feature(env, ARM_FEATURE_VFP)) {
+        if (!cpu_isar_feature(aa32_simd_r16, cpu)) {
             lr |= R_V7M_EXCRET_FTYPE_MASK;
         }
         lr = deposit32(lr, 24, 8, 0xff);
@@ -XXX,XX +XXX,XX @@ static void do_v7m_exception_exit(ARMCPU *cpu)
 
     ftype = excret & R_V7M_EXCRET_FTYPE_MASK;
 
-    if (!arm_feature(env, ARM_FEATURE_VFP) && !ftype) {
+    if (!ftype && !cpu_isar_feature(aa32_simd_r16, cpu)) {
         qemu_log_mask(LOG_GUEST_ERROR, "M profile: zero FTYPE in exception "
                       "exit PC value 0x%" PRIx32 " is UNPREDICTABLE "
                       "if FPU not present\n",
@@ -XXX,XX +XXX,XX @@ void HELPER(v7m_msr)(CPUARMState *env, uint32_t maskreg, uint32_t val)
              * SFPA is RAZ/WI from NS. FPCA is RO if NSACR.CP10 == 0,
              * RES0 if the FPU is not present, and is stored in the S bank
              */
-            if (arm_feature(env, ARM_FEATURE_VFP) &&
+            if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env)) &&
                 extract32(env->v7m.nsacr, 10, 1)) {
                 env->v7m.control[M_REG_S] &= ~R_V7M_CONTROL_FPCA_MASK;
                 env->v7m.control[M_REG_S] |= val & R_V7M_CONTROL_FPCA_MASK;
@@ -XXX,XX +XXX,XX @@ void HELPER(v7m_msr)(CPUARMState *env, uint32_t maskreg, uint32_t val)
             env->v7m.control[env->v7m.secure] &= ~R_V7M_CONTROL_NPRIV_MASK;
             env->v7m.control[env->v7m.secure] |= val & R_V7M_CONTROL_NPRIV_MASK;
         }
-        if (arm_feature(env, ARM_FEATURE_VFP)) {
+        if (cpu_isar_feature(aa32_simd_r16, env_archcpu(env))) {
             /*
              * SFPA is RAZ/WI from NS or if no FPU.
              * FPCA is RO if NSACR.CP10 == 0, RES0 if the FPU is not present.
diff --git a/target/arm/machine.c b/target/arm/machine.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/machine.c
+++ b/target/arm/machine.c
@@ -XXX,XX +XXX,XX @@
 static bool vfp_needed(void *opaque)
 {
     ARMCPU *cpu = opaque;
-    CPUARMState *env = &cpu->env;
 
-    return arm_feature(env, ARM_FEATURE_VFP);
+    return cpu_isar_feature(aa32_simd_r16, cpu);
 }
 
 static int get_fpscr(QEMUFile *f, void *opaque, size_t size,
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The old name, isar_feature_aa32_fpdp, does not reflect
that the test includes VFPv2.  We will introduce further
feature tests for VFPv3.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20200214181547.21408-7-richard.henderson@linaro.org
[PMM: fixed grammar in commit message]
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h               |  4 ++--
 target/arm/translate-vfp.inc.c | 40 +++++++++++++++++-----------------
 2 files changed, 22 insertions(+), 22 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

We will shortly use these to test for VFPv2 and VFPv3
in different situations.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-8-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h | 18 ++++++++++++++++++
 1 file changed, 18 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Shuffle the order of the checks so that we test the ISA
before we test anything else, such as the register arguments.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-9-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-vfp.inc.c | 144 ++++++++++++++++-----------------
 1 file changed, 72 insertions(+), 72 deletions(-)

diff --git a/target/arm/translate-vfp.inc.c b/target/arm/translate-vfp.inc.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.inc.c
+++ b/target/arm/translate-vfp.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
         return false;
     }
 
-    /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vm | a->vn | a->vd) & 0x10)) {
+    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist */
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+        ((a->vm | a->vn | a->vd) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINMAXNM(DisasContext *s, arg_VMINMAXNM *a)
         return false;
     }
 
-    /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vm | a->vn | a->vd) & 0x10)) {
+    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist */
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+        ((a->vm | a->vn | a->vd) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
         return false;
     }
 
-    /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vm | a->vd) & 0x10)) {
+    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist */
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+        ((a->vm | a->vd) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
         return false;
     }
 
-    /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
+    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist */
+    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
     TCGv_i64 f0, f1, fd;
     TCGv_ptr fpst;
 
-    /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vn | vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist */
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vn | vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
     int veclen = s->vec_len;
     TCGv_i64 f0, fd;
 
-    /* UNDEF accesses to D16-D31 if they don't exist */
-    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist */
+    if (!dc_isar_feature(aa32_simd_r32, s) && ((vd | vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VFM_dp(DisasContext *s, arg_VFM_dp *a)
         return false;
     }
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vn | a->vm) & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+        ((a->vd | a->vn | a->vm) & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
 
     vd = a->vd;
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) && (vd & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) && (vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
 {
     TCGv_i64 vd, vm;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     /* Vm/M bits must be zero for the Z variant */
     if (a->z && a->vm != 0) {
         return false;
@@ -XXX,XX +XXX,XX @@ static bool trans_VCMP_dp(DisasContext *s, arg_VCMP_dp *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
     TCGv_i32 tmp;
     TCGv_i64 vd;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!dc_isar_feature(aa32_fp16_dpconv, s)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f64_f16(DisasContext *s, arg_VCVT_f64_f16 *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
     TCGv_i32 tmp;
     TCGv_i64 vm;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!dc_isar_feature(aa32_fp16_dpconv, s)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
     TCGv_ptr fpst;
     TCGv_i64 tmp;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!dc_isar_feature(aa32_vrint, s)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
     TCGv_i64 tmp;
     TCGv_i32 tcg_rmode;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!dc_isar_feature(aa32_vrint, s)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
     TCGv_ptr fpst;
     TCGv_i64 tmp;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!dc_isar_feature(aa32_vrint, s)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX_dp(DisasContext *s, arg_VRINTX_dp *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_sp(DisasContext *s, arg_VCVT_sp *a)
     TCGv_i64 vd;
     TCGv_i32 vm;
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
     TCGv_i64 vm;
     TCGv_i32 vd;
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_int_dp(DisasContext *s, arg_VCVT_int_dp *a)
     TCGv_i64 vd;
     TCGv_ptr fpst;
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vd & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
     TCGv_i32 vd;
     TCGv_i64 vm;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!dc_isar_feature(aa32_jscvt, s)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
     TCGv_ptr fpst;
     int frac_bits;
 
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
     if (!arm_dc_feature(s, ARM_FEATURE_VFP3)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
-        return false;
-    }
-
     if (!vfp_access_check(s)) {
         return true;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp_int(DisasContext *s, arg_VCVT_dp_int *a)
     TCGv_i64 vm;
     TCGv_ptr fpst;
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
+    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
         return false;
     }
 
-    if (!dc_isar_feature(aa32_fpdp_v2, s)) {
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Sort this check to the start of a trans_* function.
Merge this with any existing test for fpdp_v2.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-10-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-vfp.inc.c | 24 ++++++++----------------
 1 file changed, 8 insertions(+), 16 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

We will eventually remove the early ARM_FEATURE_VFP test,
so add a proper test for each trans_* that does not already
have another ISA test.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200214181547.21408-11-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-vfp.inc.c | 78 ++++++++++++++++++++++++++++++----
 1 file changed, 69 insertions(+), 9 deletions(-)

Nothing earth-shaking in here, just a lot of refactoring and cleanup
and a few bugfixes. I suspect I'll have another pullreq to come in
the early part of next week...

The following changes since commit 19591e9e0938ea5066984553c256a043bd5d822f:

Merge remote-tracking branch 'remotes/mst/tags/for_upstream' into staging (2020-08-27 16:59:02 +0100)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200828

for you to fetch changes up to ed78849d9711805bda37ee026018d6ee7a606d0e:

target/arm: Convert sq{, r}dmulh to gvec for aa64 advsimd (2020-08-28 10:02:50 +0100)

----------------------------------------------------------------
target-arm queue:
 * target/arm: Cleanup and refactoring preparatory to SVE2
 * armsse: Define ARMSSEClass correctly
 * hw/misc/unimp: Improve information provided in log messages
 * hw/qdev-clock: Avoid calling qdev_connect_clock_in after DeviceRealize
 * hw/arm/xilinx_zynq: Call qdev_connect_clock_in() before DeviceRealize
 * hw/net/allwinner-sun8i-emac: Use AddressSpace for DMA transfers
 * hw/sd/allwinner-sdhost: Use AddressSpace for DMA transfers
 * target/arm: Fill in the WnR syndrome bit in mte_check_fail
 * target/arm: Clarify HCR_EL2 ARMCPRegInfo type
 * hw/arm/musicpal: Use AddressSpace for DMA transfers
 * hw/clock: Minor cleanups
 * hw/arm/sbsa-ref: fix typo breaking PCIe IRQs

----------------------------------------------------------------
Eduardo Habkost (1):
      armsse: Define ARMSSEClass correctly

Graeme Gregory (1):
      hw/arm/sbsa-ref: fix typo breaking PCIe IRQs

Philippe Mathieu-Daudé (14):
      hw/clock: Remove unused clock_init*() functions
      hw/clock: Let clock_set() return boolean value
      hw/clock: Only propagate clock changes if the clock is changed
      hw/arm/musicpal: Use AddressSpace for DMA transfers
      target/arm: Clarify HCR_EL2 ARMCPRegInfo type
      hw/sd/allwinner-sdhost: Use AddressSpace for DMA transfers
      hw/net/allwinner-sun8i-emac: Use AddressSpace for DMA transfers
      hw/arm/xilinx_zynq: Uninline cadence_uart_create()
      hw/arm/xilinx_zynq: Call qdev_connect_clock_in() before DeviceRealize
      hw/qdev-clock: Uninline qdev_connect_clock_in()
      hw/qdev-clock: Avoid calling qdev_connect_clock_in after DeviceRealize
      hw/misc/unimp: Display value after offset
      hw/misc/unimp: Display the value with width of the access size
      hw/misc/unimp: Display the offset with width of the region size

Richard Henderson (19):
      target/arm: Pass the entire mte descriptor to mte_check_fail
      target/arm: Fill in the WnR syndrome bit in mte_check_fail
      qemu/int128: Add int128_lshift
      target/arm: Split out gen_gvec_fn_zz
      target/arm: Split out gen_gvec_fn_zzz, do_zzz_fn
      target/arm: Rearrange {sve,fp}_check_access assert
      target/arm: Merge do_vector2_p into do_mov_p
      target/arm: Clean up 4-operand predicate expansion
      target/arm: Use tcg_gen_gvec_bitsel for trans_SEL_pppp
      target/arm: Split out gen_gvec_ool_zzzp
      target/arm: Merge helper_sve_clr_* and helper_sve_movz_*
      target/arm: Split out gen_gvec_ool_zzp
      target/arm: Split out gen_gvec_ool_zzz
      target/arm: Split out gen_gvec_ool_zz
      target/arm: Tidy SVE tszimm shift formats
      target/arm: Generalize inl_qrdmlah_* helper functions
      target/arm: Convert integer multiply (indexed) to gvec for aa64 advsimd
      target/arm: Convert integer multiply-add (indexed) to gvec for aa64 advsimd
      target/arm: Convert sq{, r}dmulh to gvec for aa64 advsimd

From: Graeme Gregory <graeme@nuviainc.com>

Fixing a typo in a previous patch that translated an "i" to a 1
and therefore breaking the allocation of PCIe interrupts. This was
discovered when virtio-net-pci devices ceased to function correctly.

Cc: qemu-stable@nongnu.org
Fixes: 48ba18e6d3f3 ("hw/arm/sbsa-ref: Simplify by moving the gic in the machine state")
Signed-off-by: Graeme Gregory <graeme@nuviainc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200821083853.356490-1-graeme@nuviainc.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/sbsa-ref.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sbsa-ref.c
+++ b/hw/arm/sbsa-ref.c
@@ -XXX,XX +XXX,XX @@ static void create_pcie(SBSAMachineState *sms)
 
     for (i = 0; i < GPEX_NUM_IRQS; i++) {
         sysbus_connect_irq(SYS_BUS_DEVICE(dev), i,
-                           qdev_get_gpio_in(sms->gic, irq + 1));
+                           qdev_get_gpio_in(sms->gic, irq + i));
         gpex_set_irq_num(GPEX_HOST(dev), i, irq + i);
     }
 
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

clock_init*() inlined funtions are simple wrappers around
clock_set*() and are not used. Remove them in favor of clock_set*().

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200806123858.30058-2-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/clock.h | 13 -------------
 1 file changed, 13 deletions(-)

diff --git a/include/hw/clock.h b/include/hw/clock.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/clock.h
+++ b/include/hw/clock.h
@@ -XXX,XX +XXX,XX @@ static inline bool clock_is_enabled(const Clock *clk)
     return clock_get(clk) != 0;
 }
 
-static inline void clock_init(Clock *clk, uint64_t value)
-{
-    clock_set(clk, value);
-}
-static inline void clock_init_hz(Clock *clk, uint64_t value)
-{
-    clock_set_hz(clk, value);
-}
-static inline void clock_init_ns(Clock *clk, uint64_t value)
-{
-    clock_set_ns(clk, value);
-}
-
 #endif /* QEMU_HW_CLOCK_H */
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Let clock_set() return a boolean value whether the clock
has been updated or not.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200806123858.30058-3-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/clock.h | 12 +++++++-----
 hw/core/clock.c    |  7 ++++++-
 2 files changed, 13 insertions(+), 6 deletions(-)

diff --git a/include/hw/clock.h b/include/hw/clock.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/clock.h
+++ b/include/hw/clock.h
@@ -XXX,XX +XXX,XX @@ void clock_set_source(Clock *clk, Clock *src);
  * @value: the clock's value, 0 means unclocked
  *
  * Set the local cached period value of @clk to @value.
+ *
+ * @return: true if the clock is changed.
  */
-void clock_set(Clock *clk, uint64_t value);
+bool clock_set(Clock *clk, uint64_t value);
 
-static inline void clock_set_hz(Clock *clk, unsigned hz)
+static inline bool clock_set_hz(Clock *clk, unsigned hz)
 {
-    clock_set(clk, CLOCK_PERIOD_FROM_HZ(hz));
+    return clock_set(clk, CLOCK_PERIOD_FROM_HZ(hz));
 }
 
-static inline void clock_set_ns(Clock *clk, unsigned ns)
+static inline bool clock_set_ns(Clock *clk, unsigned ns)
 {
-    clock_set(clk, CLOCK_PERIOD_FROM_NS(ns));
+    return clock_set(clk, CLOCK_PERIOD_FROM_NS(ns));
 }
 
 /**
diff --git a/hw/core/clock.c b/hw/core/clock.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/clock.c
+++ b/hw/core/clock.c
@@ -XXX,XX +XXX,XX @@ void clock_clear_callback(Clock *clk)
     clock_set_callback(clk, NULL, NULL);
 }
 
-void clock_set(Clock *clk, uint64_t period)
+bool clock_set(Clock *clk, uint64_t period)
 {
+    if (clk->period == period) {
+        return false;
+    }
     trace_clock_set(CLOCK_PATH(clk), CLOCK_PERIOD_TO_NS(clk->period),
                     CLOCK_PERIOD_TO_NS(period));
     clk->period = period;
+
+    return true;
 }
 
 static void clock_propagate_period(Clock *clk, bool call_callbacks)
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Allow the device to execute the DMA transfers in a different
AddressSpace.

We keep using the system_memory address space, but via the
proper dma_memory_access() API.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200814125533.4047-1-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/musicpal.c | 45 +++++++++++++++++++++++++++++++--------------
 1 file changed, 31 insertions(+), 14 deletions(-)

diff --git a/hw/arm/musicpal.c b/hw/arm/musicpal.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/musicpal.c
+++ b/hw/arm/musicpal.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/audio/wm8750.h"
 #include "sysemu/block-backend.h"
 #include "sysemu/runstate.h"
+#include "sysemu/dma.h"
 #include "exec/address-spaces.h"
 #include "ui/pixel_ops.h"
 #include "qemu/cutils.h"
@@ -XXX,XX +XXX,XX @@ typedef struct mv88w8618_eth_state {
 
     MemoryRegion iomem;
     qemu_irq irq;
+    MemoryRegion *dma_mr;
+    AddressSpace dma_as;
     uint32_t smir;
     uint32_t icr;
     uint32_t imr;
@@ -XXX,XX +XXX,XX @@ typedef struct mv88w8618_eth_state {
     NICConf conf;
 } mv88w8618_eth_state;
 
-static void eth_rx_desc_put(uint32_t addr, mv88w8618_rx_desc *desc)
+static void eth_rx_desc_put(AddressSpace *dma_as, uint32_t addr,
+                            mv88w8618_rx_desc *desc)
 {
     cpu_to_le32s(&desc->cmdstat);
     cpu_to_le16s(&desc->bytes);
     cpu_to_le16s(&desc->buffer_size);
     cpu_to_le32s(&desc->buffer);
     cpu_to_le32s(&desc->next);
-    cpu_physical_memory_write(addr, desc, sizeof(*desc));
+    dma_memory_write(dma_as, addr, desc, sizeof(*desc));
 }
 
-static void eth_rx_desc_get(uint32_t addr, mv88w8618_rx_desc *desc)
+static void eth_rx_desc_get(AddressSpace *dma_as, uint32_t addr,
+                            mv88w8618_rx_desc *desc)
 {
-    cpu_physical_memory_read(addr, desc, sizeof(*desc));
+    dma_memory_read(dma_as, addr, desc, sizeof(*desc));
     le32_to_cpus(&desc->cmdstat);
     le16_to_cpus(&desc->bytes);
     le16_to_cpus(&desc->buffer_size);
@@ -XXX,XX +XXX,XX @@ static ssize_t eth_receive(NetClientState *nc, const uint8_t *buf, size_t size)
             continue;
         }
         do {
-            eth_rx_desc_get(desc_addr, &desc);
+            eth_rx_desc_get(&s->dma_as, desc_addr, &desc);
             if ((desc.cmdstat & MP_ETH_RX_OWN) && desc.buffer_size >= size) {
-                cpu_physical_memory_write(desc.buffer + s->vlan_header,
+                dma_memory_write(&s->dma_as, desc.buffer + s->vlan_header,
                                           buf, size);
                 desc.bytes = size + s->vlan_header;
                 desc.cmdstat &= ~MP_ETH_RX_OWN;
@@ -XXX,XX +XXX,XX @@ static ssize_t eth_receive(NetClientState *nc, const uint8_t *buf, size_t size)
                 if (s->icr & s->imr) {
                     qemu_irq_raise(s->irq);
                 }
-                eth_rx_desc_put(desc_addr, &desc);
+                eth_rx_desc_put(&s->dma_as, desc_addr, &desc);
                 return size;
             }
             desc_addr = desc.next;
@@ -XXX,XX +XXX,XX @@ static ssize_t eth_receive(NetClientState *nc, const uint8_t *buf, size_t size)
     return size;
 }
 
-static void eth_tx_desc_put(uint32_t addr, mv88w8618_tx_desc *desc)
+static void eth_tx_desc_put(AddressSpace *dma_as, uint32_t addr,
+                            mv88w8618_tx_desc *desc)
 {
     cpu_to_le32s(&desc->cmdstat);
     cpu_to_le16s(&desc->res);
     cpu_to_le16s(&desc->bytes);
     cpu_to_le32s(&desc->buffer);
     cpu_to_le32s(&desc->next);
-    cpu_physical_memory_write(addr, desc, sizeof(*desc));
+    dma_memory_write(dma_as, addr, desc, sizeof(*desc));
 }
 
-static void eth_tx_desc_get(uint32_t addr, mv88w8618_tx_desc *desc)
+static void eth_tx_desc_get(AddressSpace *dma_as, uint32_t addr,
+                            mv88w8618_tx_desc *desc)
 {
-    cpu_physical_memory_read(addr, desc, sizeof(*desc));
+    dma_memory_read(dma_as, addr, desc, sizeof(*desc));
     le32_to_cpus(&desc->cmdstat);
     le16_to_cpus(&desc->res);
     le16_to_cpus(&desc->bytes);
@@ -XXX,XX +XXX,XX @@ static void eth_send(mv88w8618_eth_state *s, int queue_index)
     int len;
 
     do {
-        eth_tx_desc_get(desc_addr, &desc);
+        eth_tx_desc_get(&s->dma_as, desc_addr, &desc);
         next_desc = desc.next;
         if (desc.cmdstat & MP_ETH_TX_OWN) {
             len = desc.bytes;
             if (len < 2048) {
-                cpu_physical_memory_read(desc.buffer, buf, len);
+                dma_memory_read(&s->dma_as, desc.buffer, buf, len);
                 qemu_send_packet(qemu_get_queue(s->nic), buf, len);
             }
             desc.cmdstat &= ~MP_ETH_TX_OWN;
             s->icr |= 1 << (MP_ETH_IRQ_TXLO_BIT - queue_index);
-            eth_tx_desc_put(desc_addr, &desc);
+            eth_tx_desc_put(&s->dma_as, desc_addr, &desc);
         }
         desc_addr = next_desc;
     } while (desc_addr != s->tx_queue[queue_index]);
@@ -XXX,XX +XXX,XX @@ static void mv88w8618_eth_realize(DeviceState *dev, Error **errp)
 {
     mv88w8618_eth_state *s = MV88W8618_ETH(dev);
 
+    if (!s->dma_mr) {
+        error_setg(errp, TYPE_MV88W8618_ETH " 'dma-memory' link not set");
+        return;
+    }
+
+    address_space_init(&s->dma_as, s->dma_mr, "emac-dma");
     s->nic = qemu_new_nic(&net_mv88w8618_info, &s->conf,
                           object_get_typename(OBJECT(dev)), dev->id, s);
 }
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription mv88w8618_eth_vmsd = {
 
 static Property mv88w8618_eth_properties[] = {
     DEFINE_NIC_PROPERTIES(mv88w8618_eth_state, conf),
+    DEFINE_PROP_LINK("dma-memory", mv88w8618_eth_state, dma_mr,
+                     TYPE_MEMORY_REGION, MemoryRegion *),
     DEFINE_PROP_END_OF_LIST(),
 };
 
@@ -XXX,XX +XXX,XX @@ static void musicpal_init(MachineState *machine)
     qemu_check_nic_model(&nd_table[0], "mv88w8618");
     dev = qdev_new(TYPE_MV88W8618_ETH);
     qdev_set_nic_properties(dev, &nd_table[0]);
+    object_property_set_link(OBJECT(dev), "dma-memory",
+                             OBJECT(get_system_memory()), &error_fatal);
     sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
     sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, MP_ETH_BASE);
     sysbus_connect_irq(SYS_BUS_DEVICE(dev), 0, pic[MP_ETH_IRQ]);
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

In commit ce4afed839 ("target/arm: Implement AArch32 HCR and HCR2")
the HCR_EL2 register has been changed from type NO_RAW (no underlying
state and does not support raw access for state saving/loading) to
type CONST (TCG can assume the value to be constant), removing the
read/write accessors.
We forgot to remove the previous type ARM_CP_NO_RAW. This is not
really a problem since the field is overwritten. However it makes
code review confuse, so remove it.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200812111223.7787-1-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 1 -
 1 file changed, 1 deletion(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo el3_no_el2_cp_reginfo[] = {
       .access = PL2_RW,
       .readfn = arm_cp_read_zero, .writefn = arm_cp_write_ignore },
     { .name = "HCR_EL2", .state = ARM_CP_STATE_BOTH,
-      .type = ARM_CP_NO_RAW,
       .opc0 = 3, .opc1 = 4, .crn = 1, .crm = 1, .opc2 = 0,
       .access = PL2_RW,
       .type = ARM_CP_CONST, .resetvalue = 0 },
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

We need more information than just the mmu_idx in order
to create the proper exception syndrome.  Only change the
function signature so far.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200813200816.3037186-2-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/mte_helper.c | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/target/arm/mte_helper.c b/target/arm/mte_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/mte_helper.c
+++ b/target/arm/mte_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(stzgm_tags)(CPUARMState *env, uint64_t ptr, uint64_t val)
 }
 
 /* Record a tag check failure.  */
-static void mte_check_fail(CPUARMState *env, int mmu_idx,
+static void mte_check_fail(CPUARMState *env, uint32_t desc,
                            uint64_t dirty_ptr, uintptr_t ra)
 {
+    int mmu_idx = FIELD_EX32(desc, MTEDESC, MIDX);
     ARMMMUIdx arm_mmu_idx = core_to_aa64_mmu_idx(mmu_idx);
     int el, reg_el, tcf, select;
     uint64_t sctlr;
@@ -XXX,XX +XXX,XX @@ uint64_t mte_check1(CPUARMState *env, uint32_t desc,
     }
 
     if (unlikely(!mte_probe1_int(env, desc, ptr, ra, bit55))) {
-        int mmu_idx = FIELD_EX32(desc, MTEDESC, MIDX);
-        mte_check_fail(env, mmu_idx, ptr, ra);
+        mte_check_fail(env, desc, ptr, ra);
     }
 
     return useronly_clean_ptr(ptr);
@@ -XXX,XX +XXX,XX @@ uint64_t mte_checkN(CPUARMState *env, uint32_t desc,
 
         fail_ofs = tag_first + n * TAG_GRANULE - ptr;
         fail_ofs = ROUND_UP(fail_ofs, esize);
-        mte_check_fail(env, mmu_idx, ptr + fail_ofs, ra);
+        mte_check_fail(env, desc, ptr + fail_ofs, ra);
     }
 
  done:
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(mte_check_zva)(CPUARMState *env, uint32_t desc, uint64_t ptr)
  fail:
     /* Locate the first nibble that differs. */
     i = ctz64(mem_tag ^ ptr_tag) >> 4;
-    mte_check_fail(env, mmu_idx, align_ptr + i * TAG_GRANULE, ra);
+    mte_check_fail(env, desc, align_ptr + i * TAG_GRANULE, ra);
 
  done:
     return useronly_clean_ptr(ptr);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

According to AArch64.TagCheckFault, none of the other ISS values are
provided, so we do not need to go so far as merge_syn_data_abort.
But we were missing the WnR bit.

Tested-by: Andrey Konovalov <andreyknvl@google.com>
Reported-by: Andrey Konovalov <andreyknvl@google.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200813200816.3037186-3-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/mte_helper.c | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/target/arm/mte_helper.c b/target/arm/mte_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/mte_helper.c
+++ b/target/arm/mte_helper.c
@@ -XXX,XX +XXX,XX @@ static void mte_check_fail(CPUARMState *env, uint32_t desc,
 {
     int mmu_idx = FIELD_EX32(desc, MTEDESC, MIDX);
     ARMMMUIdx arm_mmu_idx = core_to_aa64_mmu_idx(mmu_idx);
-    int el, reg_el, tcf, select;
+    int el, reg_el, tcf, select, is_write, syn;
     uint64_t sctlr;
 
     reg_el = regime_el(env, arm_mmu_idx);
@@ -XXX,XX +XXX,XX @@ static void mte_check_fail(CPUARMState *env, uint32_t desc,
          */
         cpu_restore_state(env_cpu(env), ra, true);
         env->exception.vaddress = dirty_ptr;
-        raise_exception(env, EXCP_DATA_ABORT,
-                        syn_data_abort_no_iss(el != 0, 0, 0, 0, 0, 0, 0x11),
-                        exception_target_el(env));
+
+        is_write = FIELD_EX32(desc, MTEDESC, WRITE);
+        syn = syn_data_abort_no_iss(el != 0, 0, 0, 0, 0, is_write, 0x11);
+        raise_exception(env, EXCP_DATA_ABORT, syn, exception_target_el(env));
         /* noreturn, but fall through to the assert anyway */
 
     case 0:
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Allow the device to execute the DMA transfers in a different
AddressSpace.

The A10 and H3 SoC keep using the system_memory address space,
but via the proper dma_memory_access() API.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Reviewed-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Message-id: 20200814110057.307-1-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/sd/allwinner-sdhost.h |  6 ++++++
 hw/arm/allwinner-a10.c           |  2 ++
 hw/arm/allwinner-h3.c            |  2 ++
 hw/sd/allwinner-sdhost.c         | 37 ++++++++++++++++++++++++++------
 4 files changed, 41 insertions(+), 6 deletions(-)

diff --git a/include/hw/sd/allwinner-sdhost.h b/include/hw/sd/allwinner-sdhost.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/sd/allwinner-sdhost.h
+++ b/include/hw/sd/allwinner-sdhost.h
@@ -XXX,XX +XXX,XX @@ typedef struct AwSdHostState {
     /** Interrupt output signal to notify CPU */
     qemu_irq irq;
 
+    /** Memory region where DMA transfers are done */
+    MemoryRegion *dma_mr;
+
+    /** Address space used internally for DMA transfers */
+    AddressSpace dma_as;
+
     /** Number of bytes left in current DMA transfer */
     uint32_t transfer_cnt;
 
diff --git a/hw/arm/allwinner-a10.c b/hw/arm/allwinner-a10.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/allwinner-a10.c
+++ b/hw/arm/allwinner-a10.c
@@ -XXX,XX +XXX,XX @@ static void aw_a10_realize(DeviceState *dev, Error **errp)
     }
 
     /* SD/MMC */
+    object_property_set_link(OBJECT(&s->mmc0), "dma-memory",
+                             OBJECT(get_system_memory()), &error_fatal);
     sysbus_realize(SYS_BUS_DEVICE(&s->mmc0), &error_fatal);
     sysbus_mmio_map(SYS_BUS_DEVICE(&s->mmc0), 0, AW_A10_MMC0_BASE);
     sysbus_connect_irq(SYS_BUS_DEVICE(&s->mmc0), 0, qdev_get_gpio_in(dev, 32));
diff --git a/hw/arm/allwinner-h3.c b/hw/arm/allwinner-h3.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/allwinner-h3.c
+++ b/hw/arm/allwinner-h3.c
@@ -XXX,XX +XXX,XX @@ static void allwinner_h3_realize(DeviceState *dev, Error **errp)
     sysbus_mmio_map(SYS_BUS_DEVICE(&s->sid), 0, s->memmap[AW_H3_SID]);
 
     /* SD/MMC */
+    object_property_set_link(OBJECT(&s->mmc0), "dma-memory",
+                             OBJECT(get_system_memory()), &error_fatal);
     sysbus_realize(SYS_BUS_DEVICE(&s->mmc0), &error_fatal);
     sysbus_mmio_map(SYS_BUS_DEVICE(&s->mmc0), 0, s->memmap[AW_H3_MMC0]);
     sysbus_connect_irq(SYS_BUS_DEVICE(&s->mmc0), 0,
diff --git a/hw/sd/allwinner-sdhost.c b/hw/sd/allwinner-sdhost.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/allwinner-sdhost.c
+++ b/hw/sd/allwinner-sdhost.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/log.h"
 #include "qemu/module.h"
 #include "qemu/units.h"
+#include "qapi/error.h"
 #include "sysemu/blockdev.h"
+#include "sysemu/dma.h"
+#include "hw/qdev-properties.h"
 #include "hw/irq.h"
 #include "hw/sd/allwinner-sdhost.h"
 #include "migration/vmstate.h"
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sdhost_process_desc(AwSdHostState *s,
     uint8_t buf[1024];
 
     /* Read descriptor */
-    cpu_physical_memory_read(desc_addr, desc, sizeof(*desc));
+    dma_memory_read(&s->dma_as, desc_addr, desc, sizeof(*desc));
     if (desc->size == 0) {
         desc->size = klass->max_desc_size;
     } else if (desc->size > klass->max_desc_size) {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sdhost_process_desc(AwSdHostState *s,
 
         /* Write to SD bus */
         if (is_write) {
-            cpu_physical_memory_read((desc->addr & DESC_SIZE_MASK) + num_done,
-                                      buf, buf_bytes);
+            dma_memory_read(&s->dma_as,
+                            (desc->addr & DESC_SIZE_MASK) + num_done,
+                            buf, buf_bytes);
             sdbus_write_data(&s->sdbus, buf, buf_bytes);
 
         /* Read from SD bus */
         } else {
             sdbus_read_data(&s->sdbus, buf, buf_bytes);
-            cpu_physical_memory_write((desc->addr & DESC_SIZE_MASK) + num_done,
-                                       buf, buf_bytes);
+            dma_memory_write(&s->dma_as,
+                             (desc->addr & DESC_SIZE_MASK) + num_done,
+                             buf, buf_bytes);
         }
         num_done += buf_bytes;
     }
 
     /* Clear hold flag and flush descriptor */
     desc->status &= ~DESC_STATUS_HOLD;
-    cpu_physical_memory_write(desc_addr, desc, sizeof(*desc));
+    dma_memory_write(&s->dma_as, desc_addr, desc, sizeof(*desc));
 
     return num_done;
 }
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_allwinner_sdhost = {
     }
 };
 
+static Property allwinner_sdhost_properties[] = {
+    DEFINE_PROP_LINK("dma-memory", AwSdHostState, dma_mr,
+                     TYPE_MEMORY_REGION, MemoryRegion *),
+    DEFINE_PROP_END_OF_LIST(),
+};
+
 static void allwinner_sdhost_init(Object *obj)
 {
     AwSdHostState *s = AW_SDHOST(obj);
@@ -XXX,XX +XXX,XX @@ static void allwinner_sdhost_init(Object *obj)
     sysbus_init_irq(SYS_BUS_DEVICE(s), &s->irq);
 }
 
+static void allwinner_sdhost_realize(DeviceState *dev, Error **errp)
+{
+    AwSdHostState *s = AW_SDHOST(dev);
+
+    if (!s->dma_mr) {
+        error_setg(errp, TYPE_AW_SDHOST " 'dma-memory' link not set");
+        return;
+    }
+
+    address_space_init(&s->dma_as, s->dma_mr, "sdhost-dma");
+}
+
 static void allwinner_sdhost_reset(DeviceState *dev)
 {
     AwSdHostState *s = AW_SDHOST(dev);
@@ -XXX,XX +XXX,XX @@ static void allwinner_sdhost_class_init(ObjectClass *klass, void *data)
 
     dc->reset = allwinner_sdhost_reset;
     dc->vmsd = &vmstate_allwinner_sdhost;
+    dc->realize = allwinner_sdhost_realize;
+    device_class_set_props(dc, allwinner_sdhost_properties);
 }
 
 static void allwinner_sdhost_sun4i_class_init(ObjectClass *klass, void *data)
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Allow the device to execute the DMA transfers in a different
AddressSpace.

The H3 SoC keeps using the system_memory address space,
but via the proper dma_memory_access() API.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Tested-by: Niek Linnenbank <nieklinnenbank@gmail.com>
Message-id: 20200814122907.27732-1-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/net/allwinner-sun8i-emac.h |  6 ++++
 hw/arm/allwinner-h3.c                 |  2 ++
 hw/net/allwinner-sun8i-emac.c         | 46 +++++++++++++++++----------
 3 files changed, 38 insertions(+), 16 deletions(-)

diff --git a/include/hw/net/allwinner-sun8i-emac.h b/include/hw/net/allwinner-sun8i-emac.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/net/allwinner-sun8i-emac.h
+++ b/include/hw/net/allwinner-sun8i-emac.h
@@ -XXX,XX +XXX,XX @@ typedef struct AwSun8iEmacState {
     /** Interrupt output signal to notify CPU */
     qemu_irq     irq;
 
+    /** Memory region where DMA transfers are done */
+    MemoryRegion *dma_mr;
+
+    /** Address space used internally for DMA transfers */
+    AddressSpace dma_as;
+
     /** Generic Network Interface Controller (NIC) for networking API */
     NICState     *nic;
 
diff --git a/hw/arm/allwinner-h3.c b/hw/arm/allwinner-h3.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/allwinner-h3.c
+++ b/hw/arm/allwinner-h3.c
@@ -XXX,XX +XXX,XX @@ static void allwinner_h3_realize(DeviceState *dev, Error **errp)
         qemu_check_nic_model(&nd_table[0], TYPE_AW_SUN8I_EMAC);
         qdev_set_nic_properties(DEVICE(&s->emac), &nd_table[0]);
     }
+    object_property_set_link(OBJECT(&s->emac), "dma-memory",
+                             OBJECT(get_system_memory()), &error_fatal);
     sysbus_realize(SYS_BUS_DEVICE(&s->emac), &error_fatal);
     sysbus_mmio_map(SYS_BUS_DEVICE(&s->emac), 0, s->memmap[AW_H3_EMAC]);
     sysbus_connect_irq(SYS_BUS_DEVICE(&s->emac), 0,
diff --git a/hw/net/allwinner-sun8i-emac.c b/hw/net/allwinner-sun8i-emac.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/net/allwinner-sun8i-emac.c
+++ b/hw/net/allwinner-sun8i-emac.c
@@ -XXX,XX +XXX,XX @@
 
 #include "qemu/osdep.h"
 #include "qemu/units.h"
+#include "qapi/error.h"
 #include "hw/sysbus.h"
 #include "migration/vmstate.h"
 #include "net/net.h"
@@ -XXX,XX +XXX,XX @@
 #include "net/checksum.h"
 #include "qemu/module.h"
 #include "exec/cpu-common.h"
+#include "sysemu/dma.h"
 #include "hw/net/allwinner-sun8i-emac.h"
 
 /* EMAC register offsets */
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_update_irq(AwSun8iEmacState *s)
     qemu_set_irq(s->irq, (s->int_sta & s->int_en) != 0);
 }
 
-static uint32_t allwinner_sun8i_emac_next_desc(FrameDescriptor *desc,
+static uint32_t allwinner_sun8i_emac_next_desc(AwSun8iEmacState *s,
+                                               FrameDescriptor *desc,
                                                size_t min_size)
 {
     uint32_t paddr = desc->next;
 
-    cpu_physical_memory_read(paddr, desc, sizeof(*desc));
+    dma_memory_read(&s->dma_as, paddr, desc, sizeof(*desc));
 
     if ((desc->status & DESC_STATUS_CTL) &&
         (desc->status2 & DESC_STATUS2_BUF_SIZE_MASK) >= min_size) {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sun8i_emac_next_desc(FrameDescriptor *desc,
     }
 }
 
-static uint32_t allwinner_sun8i_emac_get_desc(FrameDescriptor *desc,
+static uint32_t allwinner_sun8i_emac_get_desc(AwSun8iEmacState *s,
+                                              FrameDescriptor *desc,
                                               uint32_t start_addr,
                                               size_t min_size)
 {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sun8i_emac_get_desc(FrameDescriptor *desc,
 
     /* Note that the list is a cycle. Last entry points back to the head. */
     while (desc_addr != 0) {
-        cpu_physical_memory_read(desc_addr, desc, sizeof(*desc));
+        dma_memory_read(&s->dma_as, desc_addr, desc, sizeof(*desc));
 
         if ((desc->status & DESC_STATUS_CTL) &&
             (desc->status2 & DESC_STATUS2_BUF_SIZE_MASK) >= min_size) {
@@ -XXX,XX +XXX,XX @@ static uint32_t allwinner_sun8i_emac_rx_desc(AwSun8iEmacState *s,
                                              FrameDescriptor *desc,
                                              size_t min_size)
 {
-    return allwinner_sun8i_emac_get_desc(desc, s->rx_desc_curr, min_size);
+    return allwinner_sun8i_emac_get_desc(s, desc, s->rx_desc_curr, min_size);
 }
 
 static uint32_t allwinner_sun8i_emac_tx_desc(AwSun8iEmacState *s,
                                              FrameDescriptor *desc,
                                              size_t min_size)
 {
-    return allwinner_sun8i_emac_get_desc(desc, s->tx_desc_head, min_size);
+    return allwinner_sun8i_emac_get_desc(s, desc, s->tx_desc_head, min_size);
 }
 
-static void allwinner_sun8i_emac_flush_desc(FrameDescriptor *desc,
+static void allwinner_sun8i_emac_flush_desc(AwSun8iEmacState *s,
+                                            FrameDescriptor *desc,
                                             uint32_t phys_addr)
 {
-    cpu_physical_memory_write(phys_addr, desc, sizeof(*desc));
+    dma_memory_write(&s->dma_as, phys_addr, desc, sizeof(*desc));
 }
 
 static bool allwinner_sun8i_emac_can_receive(NetClientState *nc)
@@ -XXX,XX +XXX,XX @@ static ssize_t allwinner_sun8i_emac_receive(NetClientState *nc,
                             << RX_DESC_STATUS_FRM_LEN_SHIFT;
         }
 
-        cpu_physical_memory_write(desc.addr, buf, desc_bytes);
-        allwinner_sun8i_emac_flush_desc(&desc, s->rx_desc_curr);
+        dma_memory_write(&s->dma_as, desc.addr, buf, desc_bytes);
+        allwinner_sun8i_emac_flush_desc(s, &desc, s->rx_desc_curr);
         trace_allwinner_sun8i_emac_receive(s->rx_desc_curr, desc.addr,
                                            desc_bytes);
 
@@ -XXX,XX +XXX,XX @@ static ssize_t allwinner_sun8i_emac_receive(NetClientState *nc,
         bytes_left -= desc_bytes;
 
         /* Move to the next descriptor */
-        s->rx_desc_curr = allwinner_sun8i_emac_next_desc(&desc, 64);
+        s->rx_desc_curr = allwinner_sun8i_emac_next_desc(s, &desc, 64);
         if (!s->rx_desc_curr) {
             /* Not enough buffer space available */
             s->int_sta |= INT_STA_RX_BUF_UA;
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_transmit(AwSun8iEmacState *s)
             desc.status |= TX_DESC_STATUS_LENGTH_ERR;
             break;
         }
-        cpu_physical_memory_read(desc.addr, packet_buf + packet_bytes, bytes);
+        dma_memory_read(&s->dma_as, desc.addr, packet_buf + packet_bytes, bytes);
         packet_bytes += bytes;
         desc.status &= ~DESC_STATUS_CTL;
-        allwinner_sun8i_emac_flush_desc(&desc, s->tx_desc_curr);
+        allwinner_sun8i_emac_flush_desc(s, &desc, s->tx_desc_curr);
 
         /* After the last descriptor, send the packet */
         if (desc.status2 & TX_DESC_STATUS2_LAST_DESC) {
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_transmit(AwSun8iEmacState *s)
             packet_bytes = 0;
             transmitted++;
         }
-        s->tx_desc_curr = allwinner_sun8i_emac_next_desc(&desc, 0);
+        s->tx_desc_curr = allwinner_sun8i_emac_next_desc(s, &desc, 0);
     }
 
     /* Raise transmit completed interrupt */
@@ -XXX,XX +XXX,XX @@ static uint64_t allwinner_sun8i_emac_read(void *opaque, hwaddr offset,
         break;
     case REG_TX_CUR_BUF:        /* Transmit Current Buffer */
         if (s->tx_desc_curr != 0) {
-            cpu_physical_memory_read(s->tx_desc_curr, &desc, sizeof(desc));
+            dma_memory_read(&s->dma_as, s->tx_desc_curr, &desc, sizeof(desc));
             value = desc.addr;
         } else {
             value = 0;
@@ -XXX,XX +XXX,XX @@ static uint64_t allwinner_sun8i_emac_read(void *opaque, hwaddr offset,
         break;
     case REG_RX_CUR_BUF:        /* Receive Current Buffer */
         if (s->rx_desc_curr != 0) {
-            cpu_physical_memory_read(s->rx_desc_curr, &desc, sizeof(desc));
+            dma_memory_read(&s->dma_as, s->rx_desc_curr, &desc, sizeof(desc));
             value = desc.addr;
         } else {
             value = 0;
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_realize(DeviceState *dev, Error **errp)
 {
     AwSun8iEmacState *s = AW_SUN8I_EMAC(dev);
 
+    if (!s->dma_mr) {
+        error_setg(errp, TYPE_AW_SUN8I_EMAC " 'dma-memory' link not set");
+        return;
+    }
+
+    address_space_init(&s->dma_as, s->dma_mr, "emac-dma");
+
     qemu_macaddr_default_if_unset(&s->conf.macaddr);
     s->nic = qemu_new_nic(&net_allwinner_sun8i_emac_info, &s->conf,
                            object_get_typename(OBJECT(dev)), dev->id, s);
@@ -XXX,XX +XXX,XX @@ static void allwinner_sun8i_emac_realize(DeviceState *dev, Error **errp)
 static Property allwinner_sun8i_emac_properties[] = {
     DEFINE_NIC_PROPERTIES(AwSun8iEmacState, conf),
     DEFINE_PROP_UINT8("phy-addr", AwSun8iEmacState, mii_phy_addr, 0),
+    DEFINE_PROP_LINK("dma-memory", AwSun8iEmacState, dma_mr,
+                     TYPE_MEMORY_REGION, MemoryRegion *),
     DEFINE_PROP_END_OF_LIST(),
 };
 
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

As we want to call qdev_connect_clock_in() before the device
is realized, we need to uninline cadence_uart_create() first.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200803105647.22223-2-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/char/cadence_uart.h | 17 -----------------
 hw/arm/xilinx_zynq.c           | 14 ++++++++++++--
 2 files changed, 12 insertions(+), 19 deletions(-)

diff --git a/include/hw/char/cadence_uart.h b/include/hw/char/cadence_uart.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/char/cadence_uart.h
+++ b/include/hw/char/cadence_uart.h
@@ -XXX,XX +XXX,XX @@ typedef struct {
     Clock *refclk;
 } CadenceUARTState;
 
-static inline DeviceState *cadence_uart_create(hwaddr addr,
-                                        qemu_irq irq,
-                                        Chardev *chr)
-{
-    DeviceState *dev;
-    SysBusDevice *s;
-
-    dev = qdev_new(TYPE_CADENCE_UART);
-    s = SYS_BUS_DEVICE(dev);
-    qdev_prop_set_chr(dev, "chardev", chr);
-    sysbus_realize_and_unref(s, &error_fatal);
-    sysbus_mmio_map(s, 0, addr);
-    sysbus_connect_irq(s, 0, irq);
-
-    return dev;
-}
-
 #endif
diff --git a/hw/arm/xilinx_zynq.c b/hw/arm/xilinx_zynq.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/xilinx_zynq.c
+++ b/hw/arm/xilinx_zynq.c
@@ -XXX,XX +XXX,XX @@ static void zynq_init(MachineState *machine)
     sysbus_create_simple(TYPE_CHIPIDEA, 0xE0002000, pic[53 - IRQ_OFFSET]);
     sysbus_create_simple(TYPE_CHIPIDEA, 0xE0003000, pic[76 - IRQ_OFFSET]);
 
-    dev = cadence_uart_create(0xE0000000, pic[59 - IRQ_OFFSET], serial_hd(0));
+    dev = qdev_new(TYPE_CADENCE_UART);
+    busdev = SYS_BUS_DEVICE(dev);
+    qdev_prop_set_chr(dev, "chardev", serial_hd(0));
+    sysbus_realize_and_unref(busdev, &error_fatal);
+    sysbus_mmio_map(busdev, 0, 0xE0000000);
+    sysbus_connect_irq(busdev, 0, pic[59 - IRQ_OFFSET]);
     qdev_connect_clock_in(dev, "refclk",
                           qdev_get_clock_out(slcr, "uart0_ref_clk"));
-    dev = cadence_uart_create(0xE0001000, pic[82 - IRQ_OFFSET], serial_hd(1));
+    dev = qdev_new(TYPE_CADENCE_UART);
+    busdev = SYS_BUS_DEVICE(dev);
+    qdev_prop_set_chr(dev, "chardev", serial_hd(1));
+    sysbus_realize_and_unref(busdev, &error_fatal);
+    sysbus_mmio_map(busdev, 0, 0xE0001000);
+    sysbus_connect_irq(busdev, 0, pic[82 - IRQ_OFFSET]);
     qdev_connect_clock_in(dev, "refclk",
                           qdev_get_clock_out(slcr, "uart1_ref_clk"));
 
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Clock canonical name is set in device_set_realized (see the block
added to hw/core/qdev.c in commit 0e6934f264).
If we connect a clock after the device is realized, this code is
not executed. This is currently not a problem as this name is only
used for trace events, however this disrupt tracing.

Fix by calling qdev_connect_clock_in() before realizing.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200803105647.22223-3-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/xilinx_zynq.c | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/hw/arm/xilinx_zynq.c b/hw/arm/xilinx_zynq.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/xilinx_zynq.c
+++ b/hw/arm/xilinx_zynq.c
@@ -XXX,XX +XXX,XX @@ static void zynq_init(MachineState *machine)
                           1, 0x0066, 0x0022, 0x0000, 0x0000, 0x0555, 0x2aa,
                           0);
 
-    /* Create slcr, keep a pointer to connect clocks */
-    slcr = qdev_new("xilinx,zynq_slcr");
-    sysbus_realize_and_unref(SYS_BUS_DEVICE(slcr), &error_fatal);
-    sysbus_mmio_map(SYS_BUS_DEVICE(slcr), 0, 0xF8000000);
-
     /* Create the main clock source, and feed slcr with it */
     zynq_machine->ps_clk = CLOCK(object_new(TYPE_CLOCK));
     object_property_add_child(OBJECT(zynq_machine), "ps_clk",
                               OBJECT(zynq_machine->ps_clk));
     object_unref(OBJECT(zynq_machine->ps_clk));
     clock_set_hz(zynq_machine->ps_clk, PS_CLK_FREQUENCY);
+
+    /* Create slcr, keep a pointer to connect clocks */
+    slcr = qdev_new("xilinx,zynq_slcr");
     qdev_connect_clock_in(slcr, "ps_clk", zynq_machine->ps_clk);
+    sysbus_realize_and_unref(SYS_BUS_DEVICE(slcr), &error_fatal);
+    sysbus_mmio_map(SYS_BUS_DEVICE(slcr), 0, 0xF8000000);
 
     dev = qdev_new(TYPE_A9MPCORE_PRIV);
     qdev_prop_set_uint32(dev, "num-cpu", 1);
@@ -XXX,XX +XXX,XX @@ static void zynq_init(MachineState *machine)
     dev = qdev_new(TYPE_CADENCE_UART);
     busdev = SYS_BUS_DEVICE(dev);
     qdev_prop_set_chr(dev, "chardev", serial_hd(0));
+    qdev_connect_clock_in(dev, "refclk",
+                          qdev_get_clock_out(slcr, "uart0_ref_clk"));
     sysbus_realize_and_unref(busdev, &error_fatal);
     sysbus_mmio_map(busdev, 0, 0xE0000000);
     sysbus_connect_irq(busdev, 0, pic[59 - IRQ_OFFSET]);
-    qdev_connect_clock_in(dev, "refclk",
-                          qdev_get_clock_out(slcr, "uart0_ref_clk"));
     dev = qdev_new(TYPE_CADENCE_UART);
     busdev = SYS_BUS_DEVICE(dev);
     qdev_prop_set_chr(dev, "chardev", serial_hd(1));
+    qdev_connect_clock_in(dev, "refclk",
+                          qdev_get_clock_out(slcr, "uart1_ref_clk"));
     sysbus_realize_and_unref(busdev, &error_fatal);
     sysbus_mmio_map(busdev, 0, 0xE0001000);
     sysbus_connect_irq(busdev, 0, pic[82 - IRQ_OFFSET]);
-    qdev_connect_clock_in(dev, "refclk",
-                          qdev_get_clock_out(slcr, "uart1_ref_clk"));
 
     sysbus_create_varargs("cadence_ttc", 0xF8001000,
             pic[42-IRQ_OFFSET], pic[43-IRQ_OFFSET], pic[44-IRQ_OFFSET], NULL);
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

We want to assert the device is not realized. To avoid overloading
this header including "hw/qdev-core.h", uninline the function first.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200803105647.22223-4-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/qdev-clock.h | 6 +-----
 hw/core/qdev-clock.c    | 5 +++++
 2 files changed, 6 insertions(+), 5 deletions(-)

diff --git a/include/hw/qdev-clock.h b/include/hw/qdev-clock.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/qdev-clock.h
+++ b/include/hw/qdev-clock.h
@@ -XXX,XX +XXX,XX @@ Clock *qdev_get_clock_out(DeviceState *dev, const char *name);
  * Set the source clock of input clock @name of device @dev to @source.
  * @source period update will be propagated to @name clock.
  */
-static inline void qdev_connect_clock_in(DeviceState *dev, const char *name,
-                                         Clock *source)
-{
-    clock_set_source(qdev_get_clock_in(dev, name), source);
-}
+void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source);
 
 /**
  * qdev_alias_clock:
diff --git a/hw/core/qdev-clock.c b/hw/core/qdev-clock.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/qdev-clock.c
+++ b/hw/core/qdev-clock.c
@@ -XXX,XX +XXX,XX @@ Clock *qdev_alias_clock(DeviceState *dev, const char *name,
 
     return ncl->clock;
 }
+
+void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source)
+{
+    clock_set_source(qdev_get_clock_in(dev, name), source);
+}
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Add a comment to document qdev_connect_clock_in() must be called
before the device is realized, and assert this condition.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200803105647.22223-5-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/qdev-clock.h | 2 ++
 hw/core/qdev-clock.c    | 1 +
 2 files changed, 3 insertions(+)

diff --git a/include/hw/qdev-clock.h b/include/hw/qdev-clock.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/qdev-clock.h
+++ b/include/hw/qdev-clock.h
@@ -XXX,XX +XXX,XX @@ Clock *qdev_get_clock_out(DeviceState *dev, const char *name);
  *
  * Set the source clock of input clock @name of device @dev to @source.
  * @source period update will be propagated to @name clock.
+ *
+ * Must be called before @dev is realized.
  */
 void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source);
 
diff --git a/hw/core/qdev-clock.c b/hw/core/qdev-clock.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/qdev-clock.c
+++ b/hw/core/qdev-clock.c
@@ -XXX,XX +XXX,XX @@ Clock *qdev_alias_clock(DeviceState *dev, const char *name,
 
 void qdev_connect_clock_in(DeviceState *dev, const char *name, Clock *source)
 {
+    assert(!dev->realized);
     clock_set_source(qdev_get_clock_in(dev, name), source);
 }
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

To better align the read/write accesses, display the value after
the offset (read accesses only display the offset).

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200812190206.31595-2-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/unimp.c | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/hw/misc/unimp.c b/hw/misc/unimp.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/unimp.c
+++ b/hw/misc/unimp.c
@@ -XXX,XX +XXX,XX @@ static uint64_t unimp_read(void *opaque, hwaddr offset, unsigned size)
 {
     UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
 
-    qemu_log_mask(LOG_UNIMP, "%s: unimplemented device read "
+    qemu_log_mask(LOG_UNIMP, "%s: unimplemented device read  "
                   "(size %d, offset 0x%" HWADDR_PRIx ")\n",
                   s->name, size, offset);
     return 0;
@@ -XXX,XX +XXX,XX @@ static void unimp_write(void *opaque, hwaddr offset,
     UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
 
     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device write "
-                  "(size %d, value 0x%" PRIx64
-                  ", offset 0x%" HWADDR_PRIx ")\n",
-                  s->name, size, value, offset);
+                  "(size %d, offset 0x%" HWADDR_PRIx
+                  ", value 0x%" PRIx64 ")\n",
+                  s->name, size, offset, value);
 }
 
 static const MemoryRegionOps unimp_ops = {
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

To quickly notice the access size, display the value with the
width of the access (i.e. 16-bit access is displayed 0x0000,
while 8-bit access 0x00).

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200812190206.31595-3-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/unimp.c | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/hw/misc/unimp.c b/hw/misc/unimp.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/unimp.c
+++ b/hw/misc/unimp.c
@@ -XXX,XX +XXX,XX @@ static void unimp_write(void *opaque, hwaddr offset,
 
     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device write "
                   "(size %d, offset 0x%" HWADDR_PRIx
-                  ", value 0x%" PRIx64 ")\n",
-                  s->name, size, offset, value);
+                  ", value 0x%0*" PRIx64 ")\n",
+                  s->name, size, offset, size << 1, value);
 }
 
 static const MemoryRegionOps unimp_ops = {
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

To have a better idea of how big is the region where the offset
belongs, display the value with the width of the region size
(i.e. a region of 0x1000 bytes uses 0x000 format).

Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200812190206.31595-4-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/misc/unimp.h |  1 +
 hw/misc/unimp.c         | 10 ++++++----
 2 files changed, 7 insertions(+), 4 deletions(-)

diff --git a/include/hw/misc/unimp.h b/include/hw/misc/unimp.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/unimp.h
+++ b/include/hw/misc/unimp.h
@@ -XXX,XX +XXX,XX @@
 typedef struct {
     SysBusDevice parent_obj;
     MemoryRegion iomem;
+    unsigned offset_fmt_width;
     char *name;
     uint64_t size;
 } UnimplementedDeviceState;
diff --git a/hw/misc/unimp.c b/hw/misc/unimp.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/unimp.c
+++ b/hw/misc/unimp.c
@@ -XXX,XX +XXX,XX @@ static uint64_t unimp_read(void *opaque, hwaddr offset, unsigned size)
     UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
 
     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device read  "
-                  "(size %d, offset 0x%" HWADDR_PRIx ")\n",
-                  s->name, size, offset);
+                  "(size %d, offset 0x%0*" HWADDR_PRIx ")\n",
+                  s->name, size, s->offset_fmt_width, offset);
     return 0;
 }
 
@@ -XXX,XX +XXX,XX @@ static void unimp_write(void *opaque, hwaddr offset,
     UnimplementedDeviceState *s = UNIMPLEMENTED_DEVICE(opaque);
 
     qemu_log_mask(LOG_UNIMP, "%s: unimplemented device write "
-                  "(size %d, offset 0x%" HWADDR_PRIx
+                  "(size %d, offset 0x%0*" HWADDR_PRIx
                   ", value 0x%0*" PRIx64 ")\n",
-                  s->name, size, offset, size << 1, value);
+                  s->name, size, s->offset_fmt_width, offset, size << 1, value);
 }
 
 static const MemoryRegionOps unimp_ops = {
@@ -XXX,XX +XXX,XX @@ static void unimp_realize(DeviceState *dev, Error **errp)
         return;
     }
 
+    s->offset_fmt_width = DIV_ROUND_UP(64 - clz64(s->size - 1), 4);
+
     memory_region_init_io(&s->iomem, OBJECT(s), &unimp_ops, s,
                           s->name, s->size);
     sysbus_init_mmio(SYS_BUS_DEVICE(s), &s->iomem);
-- 
2.20.1

From: Eduardo Habkost <ehabkost@redhat.com>

TYPE_ARM_SSE is a TYPE_SYS_BUS_DEVICE subclass, but
ARMSSEClass::parent_class is declared as DeviceClass.

It never caused any problems by pure luck:

We were not setting class_size for TYPE_ARM_SSE, so class_size of
TYPE_SYS_BUS_DEVICE was being used (sizeof(SysBusDeviceClass)).
This made the system allocate enough memory for TYPE_ARM_SSE
devices even though ARMSSEClass was too small for a sysbus
device.

Additionally, the ARMSSEClass::info field ended up at the same
offset as SysBusDeviceClass::explicit_ofw_unit_address.  This
would make sysbus_get_fw_dev_path() crash for the device.
Luckily, sysbus_get_fw_dev_path() never gets called for
TYPE_ARM_SSE devices, because qdev_get_fw_dev_path() is only used
by the boot device code, and TYPE_ARM_SSE devices don't appear at
the fw_boot_order list.

Signed-off-by: Eduardo Habkost <ehabkost@redhat.com>
Message-id: 20200826181006.4097163-1-ehabkost@redhat.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/armsse.h | 2 +-
 hw/arm/armsse.c         | 1 +
 2 files changed, 2 insertions(+), 1 deletion(-)

diff --git a/include/hw/arm/armsse.h b/include/hw/arm/armsse.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/armsse.h
+++ b/include/hw/arm/armsse.h
@@ -XXX,XX +XXX,XX @@ typedef struct ARMSSE {
 typedef struct ARMSSEInfo ARMSSEInfo;
 
 typedef struct ARMSSEClass {
-    DeviceClass parent_class;
+    SysBusDeviceClass parent_class;
     const ARMSSEInfo *info;
 } ARMSSEClass;
 
diff --git a/hw/arm/armsse.c b/hw/arm/armsse.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/armsse.c
+++ b/hw/arm/armsse.c
@@ -XXX,XX +XXX,XX @@ static const TypeInfo armsse_info = {
     .name = TYPE_ARMSSE,
     .parent = TYPE_SYS_BUS_DEVICE,
     .instance_size = sizeof(ARMSSE),
+    .class_size = sizeof(ARMSSEClass),
     .instance_init = armsse_init,
     .abstract = true,
     .interfaces = (InterfaceInfo[]) {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Add left-shift to match the existing right-shift.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/qemu/int128.h | 16 ++++++++++++++++
 1 file changed, 16 insertions(+)

diff --git a/include/qemu/int128.h b/include/qemu/int128.h
index XXXXXXX..XXXXXXX 100644
--- a/include/qemu/int128.h
+++ b/include/qemu/int128.h
@@ -XXX,XX +XXX,XX @@ static inline Int128 int128_rshift(Int128 a, int n)
     return a >> n;
 }
 
+static inline Int128 int128_lshift(Int128 a, int n)
+{
+    return a << n;
+}
+
 static inline Int128 int128_add(Int128 a, Int128 b)
 {
     return a + b;
@@ -XXX,XX +XXX,XX @@ static inline Int128 int128_rshift(Int128 a, int n)
     }
 }
 
+static inline Int128 int128_lshift(Int128 a, int n)
+{
+    uint64_t l = a.lo << (n & 63);
+    if (n >= 64) {
+        return int128_make128(0, l);
+    } else if (n > 0) {
+        return int128_make128(l, (a.hi << n) | (a.lo >> (64 - n)));
+    }
+    return a;
+}
+
 static inline Int128 int128_add(Int128 a, Int128 b)
 {
     uint64_t lo = a.lo + b.lo;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Model the new function on gen_gvec_fn2 in translate-a64.c, but
indicating which kind of register and in which order.  Since there
is only one user of do_vector2_z, fold it into do_mov_z.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 19 ++++++++++---------
 1 file changed, 10 insertions(+), 9 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Model gen_gvec_fn_zzz on gen_gvec_fn3 in translate-a64.c, but
indicating which kind of register and in which order.

Model do_zzz_fn on the other do_foo functions that take an
argument set and verify sve enabled.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 43 +++++++++++++++++++++-----------------
 1 file changed, 24 insertions(+), 19 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

We want to ensure that access is checked by the time we ask
for a specific fp/vector register.  We want to ensure that
we do not emit two lots of code to raise an exception.

But sometimes it's difficult to cleanly organize the code
such that we never pass through sve_check_access exactly once.
Allow multiple calls so long as the result is true, that is,
no exception to be raised.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate.h     |  1 +
 target/arm/translate-a64.c | 27 ++++++++++++++++-----------
 2 files changed, 17 insertions(+), 11 deletions(-)

diff --git a/target/arm/translate.h b/target/arm/translate.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.h
+++ b/target/arm/translate.h
@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
      * that it is set at the point where we actually touch the FP regs.
      */
     bool fp_access_checked;
+    bool sve_access_checked;
     /* ARMv8 single-step state (this is distinct from the QEMU gdbstub
      * single-step support).
      */
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void do_vec_ld(DisasContext *s, int destidx, int element,
  * unallocated-encoding checks (otherwise the syndrome information
  * for the resulting exception will be incorrect).
  */
-static inline bool fp_access_check(DisasContext *s)
+static bool fp_access_check(DisasContext *s)
 {
-    assert(!s->fp_access_checked);
-    s->fp_access_checked = true;
+    if (s->fp_excp_el) {
+        assert(!s->fp_access_checked);
+        s->fp_access_checked = true;
 
-    if (!s->fp_excp_el) {
-        return true;
+        gen_exception_insn(s, s->pc_curr, EXCP_UDEF,
+                           syn_fp_access_trap(1, 0xe, false), s->fp_excp_el);
+        return false;
     }
-
-    gen_exception_insn(s, s->pc_curr, EXCP_UDEF,
-                       syn_fp_access_trap(1, 0xe, false), s->fp_excp_el);
-    return false;
+    s->fp_access_checked = true;
+    return true;
 }
 
 /* Check that SVE access is enabled.  If it is, return true.
@@ -XXX,XX +XXX,XX @@ static inline bool fp_access_check(DisasContext *s)
 bool sve_access_check(DisasContext *s)
 {
     if (s->sve_excp_el) {
-        gen_exception_insn(s, s->pc_curr, EXCP_UDEF, syn_sve_access_trap(),
-                           s->sve_excp_el);
+        assert(!s->sve_access_checked);
+        s->sve_access_checked = true;
+
+        gen_exception_insn(s, s->pc_curr, EXCP_UDEF,
+                           syn_sve_access_trap(), s->sve_excp_el);
         return false;
     }
+    s->sve_access_checked = true;
     return fp_access_check(s);
 }
 
@@ -XXX,XX +XXX,XX @@ static void disas_a64_insn(CPUARMState *env, DisasContext *s)
     s->base.pc_next += 4;
 
     s->fp_access_checked = false;
+    s->sve_access_checked = false;
 
     if (dc_isar_feature(aa64_bti, s)) {
         if (s->base.num_insns == 1) {
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is the only user of the function.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-6-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 19 ++++++-------------
 1 file changed, 6 insertions(+), 13 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Move the check for !S into do_pppp_flags, which allows to merge in
do_vecop4_p.  Split out gen_gvec_fn_ppp without sve_access_check,
to mirror gen_gvec_fn_zzz.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-7-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 111 ++++++++++++++-----------------------
 1 file changed, 43 insertions(+), 68 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void do_dupi_z(DisasContext *s, int rd, uint64_t word)
 }
 
 /* Invoke a vector expander on three Pregs.  */
-static bool do_vector3_p(DisasContext *s, GVecGen3Fn *gvec_fn,
-                         int esz, int rd, int rn, int rm)
+static void gen_gvec_fn_ppp(DisasContext *s, GVecGen3Fn *gvec_fn,
+                            int rd, int rn, int rm)
 {
-    if (sve_access_check(s)) {
-        unsigned psz = pred_gvec_reg_size(s);
-        gvec_fn(esz, pred_full_reg_offset(s, rd),
-                pred_full_reg_offset(s, rn),
-                pred_full_reg_offset(s, rm), psz, psz);
-    }
-    return true;
-}
-
-/* Invoke a vector operation on four Pregs.  */
-static bool do_vecop4_p(DisasContext *s, const GVecGen4 *gvec_op,
-                        int rd, int rn, int rm, int rg)
-{
-    if (sve_access_check(s)) {
-        unsigned psz = pred_gvec_reg_size(s);
-        tcg_gen_gvec_4(pred_full_reg_offset(s, rd),
-                       pred_full_reg_offset(s, rn),
-                       pred_full_reg_offset(s, rm),
-                       pred_full_reg_offset(s, rg),
-                       psz, psz, gvec_op);
-    }
-    return true;
+    unsigned psz = pred_gvec_reg_size(s);
+    gvec_fn(MO_64, pred_full_reg_offset(s, rd),
+            pred_full_reg_offset(s, rn),
+            pred_full_reg_offset(s, rm), psz, psz);
 }
 
 /* Invoke a vector move on two Pregs.  */
@@ -XXX,XX +XXX,XX @@ static bool do_pppp_flags(DisasContext *s, arg_rprr_s *a,
     int mofs = pred_full_reg_offset(s, a->rm);
     int gofs = pred_full_reg_offset(s, a->pg);
 
+    if (!a->s) {
+        tcg_gen_gvec_4(dofs, nofs, mofs, gofs, psz, psz, gvec_op);
+        return true;
+    }
+
     if (psz == 8) {
         /* Do the operation and the flags generation in temps.  */
         TCGv_i64 pd = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_AND_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_and_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else if (a->rn == a->rm) {
-        if (a->pg == a->rn) {
-            return do_mov_p(s, a->rd, a->rn);
-        } else {
-            return do_vector3_p(s, tcg_gen_gvec_and, 0, a->rd, a->rn, a->pg);
+
+    if (!a->s) {
+        if (!sve_access_check(s)) {
+            return true;
+        }
+        if (a->rn == a->rm) {
+            if (a->pg == a->rn) {
+                do_mov_p(s, a->rd, a->rn);
+            } else {
+                gen_gvec_fn_ppp(s, tcg_gen_gvec_and, a->rd, a->rn, a->pg);
+            }
+            return true;
+        } else if (a->pg == a->rn || a->pg == a->rm) {
+            gen_gvec_fn_ppp(s, tcg_gen_gvec_and, a->rd, a->rn, a->rm);
+            return true;
         }
-    } else if (a->pg == a->rn || a->pg == a->rm) {
-        return do_vector3_p(s, tcg_gen_gvec_and, 0, a->rd, a->rn, a->rm);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
     }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_bic_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_BIC_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_bic_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else if (a->pg == a->rn) {
-        return do_vector3_p(s, tcg_gen_gvec_andc, 0, a->rd, a->rn, a->rm);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
+
+    if (!a->s && a->pg == a->rn) {
+        if (sve_access_check(s)) {
+            gen_gvec_fn_ppp(s, tcg_gen_gvec_andc, a->rd, a->rn, a->rm);
+        }
+        return true;
     }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_eor_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_EOR_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_eor_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
-    }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_sel_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_SEL_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_sel_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
+
     if (a->s) {
         return false;
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
     }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_orr_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_ORR_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_orr_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else if (a->pg == a->rn && a->rn == a->rm) {
+
+    if (!a->s && a->pg == a->rn && a->rn == a->rm) {
         return do_mov_p(s, a->rd, a->rn);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
     }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_orn_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_ORN_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_orn_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
-    }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_nor_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_NOR_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_nor_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
-    }
+    return do_pppp_flags(s, a, &op);
 }
 
 static void gen_nand_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
@@ -XXX,XX +XXX,XX @@ static bool trans_NAND_pppp(DisasContext *s, arg_rprr_s *a)
         .fno = gen_helper_sve_nand_pppp,
         .prefer_i64 = TCG_TARGET_REG_BITS == 64,
     };
-    if (a->s) {
-        return do_pppp_flags(s, a, &op);
-    } else {
-        return do_vecop4_p(s, &op, a->rd, a->rn, a->rm, a->pg);
-    }
+    return do_pppp_flags(s, a, &op);
 }
 
 /*
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The gvec operation was added after the initial implementation
of the SEL instruction and was missed in the conversion.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-8-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 31 ++++++++-----------------------
 1 file changed, 8 insertions(+), 23 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_EOR_pppp(DisasContext *s, arg_rprr_s *a)
     return do_pppp_flags(s, a, &op);
 }
 
-static void gen_sel_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
-{
-    tcg_gen_and_i64(pn, pn, pg);
-    tcg_gen_andc_i64(pm, pm, pg);
-    tcg_gen_or_i64(pd, pn, pm);
-}
-
-static void gen_sel_pg_vec(unsigned vece, TCGv_vec pd, TCGv_vec pn,
-                           TCGv_vec pm, TCGv_vec pg)
-{
-    tcg_gen_and_vec(vece, pn, pn, pg);
-    tcg_gen_andc_vec(vece, pm, pm, pg);
-    tcg_gen_or_vec(vece, pd, pn, pm);
-}
-
 static bool trans_SEL_pppp(DisasContext *s, arg_rprr_s *a)
 {
-    static const GVecGen4 op = {
-        .fni8 = gen_sel_pg_i64,
-        .fniv = gen_sel_pg_vec,
-        .fno = gen_helper_sve_sel_pppp,
-        .prefer_i64 = TCG_TARGET_REG_BITS == 64,
-    };
-
     if (a->s) {
         return false;
     }
-    return do_pppp_flags(s, a, &op);
+    if (sve_access_check(s)) {
+        unsigned psz = pred_gvec_reg_size(s);
+        tcg_gen_gvec_bitsel(MO_8, pred_full_reg_offset(s, a->rd),
+                            pred_full_reg_offset(s, a->pg),
+                            pred_full_reg_offset(s, a->rn),
+                            pred_full_reg_offset(s, a->rm), psz, psz);
+    }
+    return true;
 }
 
 static void gen_orr_pg_i64(TCGv_i64 pd, TCGv_i64 pn, TCGv_i64 pm, TCGv_i64 pg)
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Model after gen_gvec_fn_zzz et al.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-9-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 35 ++++++++++++++++-------------------
 1 file changed, 16 insertions(+), 19 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
     return size_for_gvec(pred_full_reg_size(s));
 }
 
-/* Invoke a vector expander on two Zregs.  */
+/* Invoke an out-of-line helper on 3 Zregs and a predicate. */
+static void gen_gvec_ool_zzzp(DisasContext *s, gen_helper_gvec_4 *fn,
+                              int rd, int rn, int rm, int pg, int data)
+{
+    unsigned vsz = vec_full_reg_size(s);
+    tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       vec_full_reg_offset(s, rm),
+                       pred_full_reg_offset(s, pg),
+                       vsz, vsz, data, fn);
+}
 
+/* Invoke a vector expander on two Zregs.  */
 static void gen_gvec_fn_zz(DisasContext *s, GVecGen2Fn *gvec_fn,
                            int esz, int rd, int rn)
 {
@@ -XXX,XX +XXX,XX @@ static bool trans_UQSUB_zzz(DisasContext *s, arg_rrr_esz *a)
 
 static bool do_zpzz_ool(DisasContext *s, arg_rprr_esz *a, gen_helper_gvec_4 *fn)
 {
-    unsigned vsz = vec_full_reg_size(s);
     if (fn == NULL) {
         return false;
     }
     if (sve_access_check(s)) {
-        tcg_gen_gvec_4_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           pred_full_reg_offset(s, a->pg),
-                           vsz, vsz, 0, fn);
+        gen_gvec_ool_zzzp(s, fn, a->rd, a->rn, a->rm, a->pg, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static void do_sel_z(DisasContext *s, int rd, int rn, int rm, int pg, int esz)
         gen_helper_sve_sel_zpzz_b, gen_helper_sve_sel_zpzz_h,
         gen_helper_sve_sel_zpzz_s, gen_helper_sve_sel_zpzz_d
     };
-    unsigned vsz = vec_full_reg_size(s);
-    tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
-                       vec_full_reg_offset(s, rn),
-                       vec_full_reg_offset(s, rm),
-                       pred_full_reg_offset(s, pg),
-                       vsz, vsz, 0, fns[esz]);
+    gen_gvec_ool_zzzp(s, fns[esz], rd, rn, rm, pg, 0);
 }
 
 #define DO_ZPZZ(NAME, name) \
@@ -XXX,XX +XXX,XX @@ static bool trans_RBIT(DisasContext *s, arg_rpr_esz *a)
 static bool trans_SPLICE(DisasContext *s, arg_rprr_esz *a)
 {
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_4_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           pred_full_reg_offset(s, a->pg),
-                           vsz, vsz, a->esz, gen_helper_sve_splice);
+        gen_gvec_ool_zzzp(s, gen_helper_sve_splice,
+                          a->rd, a->rn, a->rm, a->pg, 0);
     }
     return true;
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The existing clr functions have only one vector argument, and so
can only clear in place.  The existing movz functions have two
vector arguments, and so can clear while moving.  Merge them, with
a flag that controls the sense of active vs inactive elements
being cleared.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-10-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  5 ---
 target/arm/sve_helper.c    | 70 ++++++++------------------------------
 target/arm/translate-sve.c | 53 +++++++++++------------------
 3 files changed, 34 insertions(+), 94 deletions(-)

diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-sve.h
+++ b/target/arm/helper-sve.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sve_uminv_h, TCG_CALL_NO_RWG, i64, ptr, ptr, i32)
 DEF_HELPER_FLAGS_3(sve_uminv_s, TCG_CALL_NO_RWG, i64, ptr, ptr, i32)
 DEF_HELPER_FLAGS_3(sve_uminv_d, TCG_CALL_NO_RWG, i64, ptr, ptr, i32)
 
-DEF_HELPER_FLAGS_3(sve_clr_b, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-DEF_HELPER_FLAGS_3(sve_clr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-DEF_HELPER_FLAGS_3(sve_clr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-DEF_HELPER_FLAGS_3(sve_clr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
-
 DEF_HELPER_FLAGS_4(sve_movz_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(sve_movz_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(sve_movz_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve_helper.c
+++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_pnext)(void *vd, void *vg, uint32_t pred_desc)
     return flags;
 }
 
-/* Store zero into every active element of Zd.  We will use this for two
- * and three-operand predicated instructions for which logic dictates a
- * zero result.  In particular, logical shift by element size, which is
- * otherwise undefined on the host.
- *
- * For element sizes smaller than uint64_t, we use tables to expand
- * the N bits of the controlling predicate to a byte mask, and clear
- * those bytes.
+/*
+ * Copy Zn into Zd, and store zero into inactive elements.
+ * If inv, store zeros into the active elements.
  */
-void HELPER(sve_clr_b)(void *vd, void *vg, uint32_t desc)
-{
-    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
-    uint64_t *d = vd;
-    uint8_t *pg = vg;
-    for (i = 0; i < opr_sz; i += 1) {
-        d[i] &= ~expand_pred_b(pg[H1(i)]);
-    }
-}
-
-void HELPER(sve_clr_h)(void *vd, void *vg, uint32_t desc)
-{
-    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
-    uint64_t *d = vd;
-    uint8_t *pg = vg;
-    for (i = 0; i < opr_sz; i += 1) {
-        d[i] &= ~expand_pred_h(pg[H1(i)]);
-    }
-}
-
-void HELPER(sve_clr_s)(void *vd, void *vg, uint32_t desc)
-{
-    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
-    uint64_t *d = vd;
-    uint8_t *pg = vg;
-    for (i = 0; i < opr_sz; i += 1) {
-        d[i] &= ~expand_pred_s(pg[H1(i)]);
-    }
-}
-
-void HELPER(sve_clr_d)(void *vd, void *vg, uint32_t desc)
-{
-    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
-    uint64_t *d = vd;
-    uint8_t *pg = vg;
-    for (i = 0; i < opr_sz; i += 1) {
-        if (pg[H1(i)] & 1) {
-            d[i] = 0;
-        }
-    }
-}
-
-/* Copy Zn into Zd, and store zero into inactive elements.  */
 void HELPER(sve_movz_b)(void *vd, void *vn, void *vg, uint32_t desc)
 {
     intptr_t i, opr_sz = simd_oprsz(desc) / 8;
+    uint64_t inv = -(uint64_t)(simd_data(desc) & 1);
     uint64_t *d = vd, *n = vn;
     uint8_t *pg = vg;
+
     for (i = 0; i < opr_sz; i += 1) {
-        d[i] = n[i] & expand_pred_b(pg[H1(i)]);
+        d[i] = n[i] & (expand_pred_b(pg[H1(i)]) ^ inv);
     }
 }
 
 void HELPER(sve_movz_h)(void *vd, void *vn, void *vg, uint32_t desc)
 {
     intptr_t i, opr_sz = simd_oprsz(desc) / 8;
+    uint64_t inv = -(uint64_t)(simd_data(desc) & 1);
     uint64_t *d = vd, *n = vn;
     uint8_t *pg = vg;
+
     for (i = 0; i < opr_sz; i += 1) {
-        d[i] = n[i] & expand_pred_h(pg[H1(i)]);
+        d[i] = n[i] & (expand_pred_h(pg[H1(i)]) ^ inv);
     }
 }
 
 void HELPER(sve_movz_s)(void *vd, void *vn, void *vg, uint32_t desc)
 {
     intptr_t i, opr_sz = simd_oprsz(desc) / 8;
+    uint64_t inv = -(uint64_t)(simd_data(desc) & 1);
     uint64_t *d = vd, *n = vn;
     uint8_t *pg = vg;
+
     for (i = 0; i < opr_sz; i += 1) {
-        d[i] = n[i] & expand_pred_s(pg[H1(i)]);
+        d[i] = n[i] & (expand_pred_s(pg[H1(i)]) ^ inv);
     }
 }
 
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_movz_d)(void *vd, void *vn, void *vg, uint32_t desc)
     intptr_t i, opr_sz = simd_oprsz(desc) / 8;
     uint64_t *d = vd, *n = vn;
     uint8_t *pg = vg;
+    uint8_t inv = simd_data(desc);
+
     for (i = 0; i < opr_sz; i += 1) {
-        d[i] = n[i] & -(uint64_t)(pg[H1(i)] & 1);
+        d[i] = n[i] & -(uint64_t)((pg[H1(i)] ^ inv) & 1);
     }
 }
 
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_SADDV(DisasContext *s, arg_rpr_esz *a)
  *** SVE Shift by Immediate - Predicated Group
  */
 
-/* Store zero into every active element of Zd.  We will use this for two
- * and three-operand predicated instructions for which logic dictates a
- * zero result.
+/*
+ * Copy Zn into Zd, storing zeros into inactive elements.
+ * If invert, store zeros into the active elements.
  */
-static bool do_clr_zp(DisasContext *s, int rd, int pg, int esz)
-{
-    static gen_helper_gvec_2 * const fns[4] = {
-        gen_helper_sve_clr_b, gen_helper_sve_clr_h,
-        gen_helper_sve_clr_s, gen_helper_sve_clr_d,
-    };
-    if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_2_ool(vec_full_reg_offset(s, rd),
-                           pred_full_reg_offset(s, pg),
-                           vsz, vsz, 0, fns[esz]);
-    }
-    return true;
-}
-
-/* Copy Zn into Zd, storing zeros into inactive elements.  */
-static void do_movz_zpz(DisasContext *s, int rd, int rn, int pg, int esz)
+static bool do_movz_zpz(DisasContext *s, int rd, int rn, int pg,
+                        int esz, bool invert)
 {
     static gen_helper_gvec_3 * const fns[4] = {
         gen_helper_sve_movz_b, gen_helper_sve_movz_h,
         gen_helper_sve_movz_s, gen_helper_sve_movz_d,
     };
-    unsigned vsz = vec_full_reg_size(s);
-    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
-                       vec_full_reg_offset(s, rn),
-                       pred_full_reg_offset(s, pg),
-                       vsz, vsz, 0, fns[esz]);
+
+    if (sve_access_check(s)) {
+        unsigned vsz = vec_full_reg_size(s);
+        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
+                           vec_full_reg_offset(s, rn),
+                           pred_full_reg_offset(s, pg),
+                           vsz, vsz, invert, fns[esz]);
+    }
+    return true;
 }
 
 static bool do_zpzi_ool(DisasContext *s, arg_rpri_esz *a,
@@ -XXX,XX +XXX,XX @@ static bool trans_LSR_zpzi(DisasContext *s, arg_rpri_esz *a)
     /* Shift by element size is architecturally valid.
        For logical shifts, it is a zeroing operation.  */
     if (a->imm >= (8 << a->esz)) {
-        return do_clr_zp(s, a->rd, a->pg, a->esz);
+        return do_movz_zpz(s, a->rd, a->rd, a->pg, a->esz, true);
     } else {
         return do_zpzi_ool(s, a, fns[a->esz]);
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_LSL_zpzi(DisasContext *s, arg_rpri_esz *a)
     /* Shift by element size is architecturally valid.
        For logical shifts, it is a zeroing operation.  */
     if (a->imm >= (8 << a->esz)) {
-        return do_clr_zp(s, a->rd, a->pg, a->esz);
+        return do_movz_zpz(s, a->rd, a->rd, a->pg, a->esz, true);
     } else {
         return do_zpzi_ool(s, a, fns[a->esz]);
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_ASRD(DisasContext *s, arg_rpri_esz *a)
     /* Shift by element size is architecturally valid.  For arithmetic
        right shift for division, it is a zeroing operation.  */
     if (a->imm >= (8 << a->esz)) {
-        return do_clr_zp(s, a->rd, a->pg, a->esz);
+        return do_movz_zpz(s, a->rd, a->rd, a->pg, a->esz, true);
     } else {
         return do_zpzi_ool(s, a, fns[a->esz]);
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_LD1R_zpri(DisasContext *s, arg_rpri_load *a)
 
     /* Zero the inactive elements.  */
     gen_set_label(over);
-    do_movz_zpz(s, a->rd, a->rd, a->pg, esz);
-    return true;
+    return do_movz_zpz(s, a->rd, a->rd, a->pg, esz, false);
 }
 
 static void do_st_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
@@ -XXX,XX +XXX,XX @@ static bool trans_MOVPRFX_m(DisasContext *s, arg_rpr_esz *a)
 
 static bool trans_MOVPRFX_z(DisasContext *s, arg_rpr_esz *a)
 {
-    if (sve_access_check(s)) {
-        do_movz_zpz(s, a->rd, a->rn, a->pg, a->esz);
-    }
-    return true;
+    return do_movz_zpz(s, a->rd, a->rn, a->pg, a->esz, false);
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Model after gen_gvec_fn_zzz et al.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-11-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 29 ++++++++++++++---------------
 1 file changed, 14 insertions(+), 15 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
     return size_for_gvec(pred_full_reg_size(s));
 }
 
+/* Invoke an out-of-line helper on 2 Zregs and a predicate. */
+static void gen_gvec_ool_zzp(DisasContext *s, gen_helper_gvec_3 *fn,
+                             int rd, int rn, int pg, int data)
+{
+    unsigned vsz = vec_full_reg_size(s);
+    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       pred_full_reg_offset(s, pg),
+                       vsz, vsz, data, fn);
+}
+
 /* Invoke an out-of-line helper on 3 Zregs and a predicate. */
 static void gen_gvec_ool_zzzp(DisasContext *s, gen_helper_gvec_4 *fn,
                               int rd, int rn, int rm, int pg, int data)
@@ -XXX,XX +XXX,XX @@ static bool do_zpz_ool(DisasContext *s, arg_rpr_esz *a, gen_helper_gvec_3 *fn)
         return false;
     }
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           pred_full_reg_offset(s, a->pg),
-                           vsz, vsz, 0, fn);
+        gen_gvec_ool_zzp(s, fn, a->rd, a->rn, a->pg, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool do_movz_zpz(DisasContext *s, int rd, int rn, int pg,
     };
 
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
-                           vec_full_reg_offset(s, rn),
-                           pred_full_reg_offset(s, pg),
-                           vsz, vsz, invert, fns[esz]);
+        gen_gvec_ool_zzp(s, fns[esz], rd, rn, pg, invert);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool do_zpzi_ool(DisasContext *s, arg_rpri_esz *a,
                         gen_helper_gvec_3 *fn)
 {
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           pred_full_reg_offset(s, a->pg),
-                           vsz, vsz, a->imm, fn);
+        gen_gvec_ool_zzp(s, fn, a->rd, a->rn, a->pg, a->imm);
     }
     return true;
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-12-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 53 +++++++++++++-------------------------
 1 file changed, 18 insertions(+), 35 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
     return size_for_gvec(pred_full_reg_size(s));
 }
 
+/* Invoke an out-of-line helper on 3 Zregs. */
+static void gen_gvec_ool_zzz(DisasContext *s, gen_helper_gvec_3 *fn,
+                             int rd, int rn, int rm, int data)
+{
+    unsigned vsz = vec_full_reg_size(s);
+    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       vec_full_reg_offset(s, rm),
+                       vsz, vsz, data, fn);
+}
+
 /* Invoke an out-of-line helper on 2 Zregs and a predicate. */
 static void gen_gvec_ool_zzp(DisasContext *s, gen_helper_gvec_3 *fn,
                              int rd, int rn, int pg, int data)
@@ -XXX,XX +XXX,XX @@ static bool do_zzw_ool(DisasContext *s, arg_rrr_esz *a, gen_helper_gvec_3 *fn)
         return false;
     }
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, 0, fn);
+        gen_gvec_ool_zzz(s, fn, a->rd, a->rn, a->rm, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool trans_RDVL(DisasContext *s, arg_RDVL *a)
 static bool do_adr(DisasContext *s, arg_rrri *a, gen_helper_gvec_3 *fn)
 {
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, a->imm, fn);
+        gen_gvec_ool_zzz(s, fn, a->rd, a->rn, a->rm, a->imm);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool trans_FTSSEL(DisasContext *s, arg_rrr_esz *a)
         return false;
     }
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, 0, fns[a->esz]);
+        gen_gvec_ool_zzz(s, fns[a->esz], a->rd, a->rn, a->rm, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool trans_TBL(DisasContext *s, arg_rrr_esz *a)
     };
 
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, 0, fns[a->esz]);
+        gen_gvec_ool_zzz(s, fns[a->esz], a->rd, a->rn, a->rm, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool do_zzz_data_ool(DisasContext *s, arg_rrr_esz *a, int data,
                             gen_helper_gvec_3 *fn)
 {
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, data, fn);
+        gen_gvec_ool_zzz(s, fn, a->rd, a->rn, a->rm, data);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool trans_DOT_zzz(DisasContext *s, arg_DOT_zzz *a)
     };
 
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, 0, fns[a->u][a->sz]);
+        gen_gvec_ool_zzz(s, fns[a->u][a->sz], a->rd, a->rn, a->rm, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool trans_DOT_zzx(DisasContext *s, arg_DOT_zzx *a)
     };
 
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vec_full_reg_offset(s, a->rm),
-                           vsz, vsz, a->index, fns[a->u][a->sz]);
+        gen_gvec_ool_zzz(s, fns[a->u][a->sz], a->rd, a->rn, a->rm, a->index);
     }
     return true;
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-13-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 20 ++++++++++++--------
 1 file changed, 12 insertions(+), 8 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static int pred_gvec_reg_size(DisasContext *s)
     return size_for_gvec(pred_full_reg_size(s));
 }
 
+/* Invoke an out-of-line helper on 2 Zregs. */
+static void gen_gvec_ool_zz(DisasContext *s, gen_helper_gvec_2 *fn,
+                            int rd, int rn, int data)
+{
+    unsigned vsz = vec_full_reg_size(s);
+    tcg_gen_gvec_2_ool(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       vsz, vsz, data, fn);
+}
+
 /* Invoke an out-of-line helper on 3 Zregs. */
 static void gen_gvec_ool_zzz(DisasContext *s, gen_helper_gvec_3 *fn,
                              int rd, int rn, int rm, int data)
@@ -XXX,XX +XXX,XX @@ static bool trans_FEXPA(DisasContext *s, arg_rr_esz *a)
         return false;
     }
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_2_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vsz, vsz, 0, fns[a->esz]);
+        gen_gvec_ool_zz(s, fns[a->esz], a->rd, a->rn, 0);
     }
     return true;
 }
@@ -XXX,XX +XXX,XX @@ static bool trans_REV_v(DisasContext *s, arg_rr_esz *a)
     };
 
     if (sve_access_check(s)) {
-        unsigned vsz = vec_full_reg_size(s);
-        tcg_gen_gvec_2_ool(vec_full_reg_offset(s, a->rd),
-                           vec_full_reg_offset(s, a->rn),
-                           vsz, vsz, 0, fns[a->esz]);
+        gen_gvec_ool_zz(s, fns[a->esz], a->rd, a->rn, 0);
     }
     return true;
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Rather than require the user to fill in the immediate (shl or shr),
create full formats that include the immediate.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-14-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/sve.decode | 35 ++++++++++++++++-------------------
 1 file changed, 16 insertions(+), 19 deletions(-)

diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
 @rd_rn_i6       ........ ... rn:5 ..... imm:s6 rd:5             &rri
 
 # Two register operand, one immediate operand, with predicate,
-# element size encoded as TSZHL.  User must fill in imm.
-@rdn_pg_tszimm  ........ .. ... ... ... pg:3 ..... rd:5 \
-                &rpri_esz rn=%reg_movprfx esz=%tszimm_esz
+# element size encoded as TSZHL.
+@rdn_pg_tszimm_shl  ........ .. ... ... ... pg:3 ..... rd:5 \
+                    &rpri_esz rn=%reg_movprfx esz=%tszimm_esz imm=%tszimm_shl
+@rdn_pg_tszimm_shr  ........ .. ... ... ... pg:3 ..... rd:5 \
+                    &rpri_esz rn=%reg_movprfx esz=%tszimm_esz imm=%tszimm_shr
 
 # Similarly without predicate.
-@rd_rn_tszimm   ........ .. ... ... ...... rn:5 rd:5 \
-                &rri_esz esz=%tszimm16_esz
+@rd_rn_tszimm_shl   ........ .. ... ... ...... rn:5 rd:5 \
+                    &rri_esz esz=%tszimm16_esz imm=%tszimm16_shl
+@rd_rn_tszimm_shr   ........ .. ... ... ...... rn:5 rd:5 \
+                    &rri_esz esz=%tszimm16_esz imm=%tszimm16_shr
 
 # Two register operand, one immediate operand, with 4-bit predicate.
 # User must fill in imm.
@@ -XXX,XX +XXX,XX @@ UMINV           00000100 .. 001 011 001 ... ..... .....         @rd_pg_rn
 ### SVE Shift by Immediate - Predicated Group
 
 # SVE bitwise shift by immediate (predicated)
-ASR_zpzi        00000100 .. 000 000 100 ... .. ... ..... \
-                @rdn_pg_tszimm imm=%tszimm_shr
-LSR_zpzi        00000100 .. 000 001 100 ... .. ... ..... \
-                @rdn_pg_tszimm imm=%tszimm_shr
-LSL_zpzi        00000100 .. 000 011 100 ... .. ... ..... \
-                @rdn_pg_tszimm imm=%tszimm_shl
-ASRD            00000100 .. 000 100 100 ... .. ... ..... \
-                @rdn_pg_tszimm imm=%tszimm_shr
+ASR_zpzi        00000100 .. 000 000 100 ... .. ... .....  @rdn_pg_tszimm_shr
+LSR_zpzi        00000100 .. 000 001 100 ... .. ... .....  @rdn_pg_tszimm_shr
+LSL_zpzi        00000100 .. 000 011 100 ... .. ... .....  @rdn_pg_tszimm_shl
+ASRD            00000100 .. 000 100 100 ... .. ... .....  @rdn_pg_tszimm_shr
 
 # SVE bitwise shift by vector (predicated)
 ASR_zpzz        00000100 .. 010 000 100 ... ..... .....   @rdn_pg_rm
@@ -XXX,XX +XXX,XX @@ RDVL            00000100 101 11111 01010 imm:s6 rd:5
 ### SVE Bitwise Shift - Unpredicated Group
 
 # SVE bitwise shift by immediate (unpredicated)
-ASR_zzi         00000100 .. 1 ..... 1001 00 ..... ..... \
-                @rd_rn_tszimm imm=%tszimm16_shr
-LSR_zzi         00000100 .. 1 ..... 1001 01 ..... ..... \
-                @rd_rn_tszimm imm=%tszimm16_shr
-LSL_zzi         00000100 .. 1 ..... 1001 11 ..... ..... \
-                @rd_rn_tszimm imm=%tszimm16_shl
+ASR_zzi         00000100 .. 1 ..... 1001 00 ..... .....  @rd_rn_tszimm_shr
+LSR_zzi         00000100 .. 1 ..... 1001 01 ..... .....  @rd_rn_tszimm_shr
+LSL_zzi         00000100 .. 1 ..... 1001 11 ..... .....  @rd_rn_tszimm_shl
 
 # SVE bitwise shift by wide elements (unpredicated)
 # Note esz != 3
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Unify add/sub helpers and add a parameter for rounding.
This will allow saturating non-rounding to reuse this code.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
[PMM: fixed accidental use of '=' rather than '+=' in do_sqrdmlah_s]
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-15-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/vec_helper.c | 80 +++++++++++++++--------------------------
 1 file changed, 29 insertions(+), 51 deletions(-)

diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@
 #endif
 
 /* Signed saturating rounding doubling multiply-accumulate high half, 16-bit */
-static int16_t inl_qrdmlah_s16(int16_t src1, int16_t src2,
-                               int16_t src3, uint32_t *sat)
+static int16_t do_sqrdmlah_h(int16_t src1, int16_t src2, int16_t src3,
+                             bool neg, bool round, uint32_t *sat)
 {
-    /* Simplify:
+    /*
+     * Simplify:
      * = ((a3 << 16) + ((e1 * e2) << 1) + (1 << 15)) >> 16
      * = ((a3 << 15) + (e1 * e2) + (1 << 14)) >> 15
      */
     int32_t ret = (int32_t)src1 * src2;
-    ret = ((int32_t)src3 << 15) + ret + (1 << 14);
+    if (neg) {
+        ret = -ret;
+    }
+    ret += ((int32_t)src3 << 15) + (round << 14);
     ret >>= 15;
+
     if (ret != (int16_t)ret) {
         *sat = 1;
-        ret = (ret < 0 ? -0x8000 : 0x7fff);
+        ret = (ret < 0 ? INT16_MIN : INT16_MAX);
     }
     return ret;
 }
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(neon_qrdmlah_s16)(CPUARMState *env, uint32_t src1,
                                   uint32_t src2, uint32_t src3)
 {
     uint32_t *sat = &env->vfp.qc[0];
-    uint16_t e1 = inl_qrdmlah_s16(src1, src2, src3, sat);
-    uint16_t e2 = inl_qrdmlah_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
+    uint16_t e1 = do_sqrdmlah_h(src1, src2, src3, false, true, sat);
+    uint16_t e2 = do_sqrdmlah_h(src1 >> 16, src2 >> 16, src3 >> 16,
+                                false, true, sat);
     return deposit32(e1, 16, 16, e2);
 }
 
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlah_s16)(void *vd, void *vn, void *vm,
     uintptr_t i;
 
     for (i = 0; i < opr_sz / 2; ++i) {
-        d[i] = inl_qrdmlah_s16(n[i], m[i], d[i], vq);
+        d[i] = do_sqrdmlah_h(n[i], m[i], d[i], false, true, vq);
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
-/* Signed saturating rounding doubling multiply-subtract high half, 16-bit */
-static int16_t inl_qrdmlsh_s16(int16_t src1, int16_t src2,
-                               int16_t src3, uint32_t *sat)
-{
-    /* Similarly, using subtraction:
-     * = ((a3 << 16) - ((e1 * e2) << 1) + (1 << 15)) >> 16
-     * = ((a3 << 15) - (e1 * e2) + (1 << 14)) >> 15
-     */
-    int32_t ret = (int32_t)src1 * src2;
-    ret = ((int32_t)src3 << 15) - ret + (1 << 14);
-    ret >>= 15;
-    if (ret != (int16_t)ret) {
-        *sat = 1;
-        ret = (ret < 0 ? -0x8000 : 0x7fff);
-    }
-    return ret;
-}
-
 uint32_t HELPER(neon_qrdmlsh_s16)(CPUARMState *env, uint32_t src1,
                                   uint32_t src2, uint32_t src3)
 {
     uint32_t *sat = &env->vfp.qc[0];
-    uint16_t e1 = inl_qrdmlsh_s16(src1, src2, src3, sat);
-    uint16_t e2 = inl_qrdmlsh_s16(src1 >> 16, src2 >> 16, src3 >> 16, sat);
+    uint16_t e1 = do_sqrdmlah_h(src1, src2, src3, true, true, sat);
+    uint16_t e2 = do_sqrdmlah_h(src1 >> 16, src2 >> 16, src3 >> 16,
+                                true, true, sat);
     return deposit32(e1, 16, 16, e2);
 }
 
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
     uintptr_t i;
 
     for (i = 0; i < opr_sz / 2; ++i) {
-        d[i] = inl_qrdmlsh_s16(n[i], m[i], d[i], vq);
+        d[i] = do_sqrdmlah_h(n[i], m[i], d[i], true, true, vq);
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
 /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
-static int32_t inl_qrdmlah_s32(int32_t src1, int32_t src2,
-                               int32_t src3, uint32_t *sat)
+static int32_t do_sqrdmlah_s(int32_t src1, int32_t src2, int32_t src3,
+                             bool neg, bool round, uint32_t *sat)
 {
     /* Simplify similarly to int_qrdmlah_s16 above.  */
     int64_t ret = (int64_t)src1 * src2;
-    ret = ((int64_t)src3 << 31) + ret + (1 << 30);
+    if (neg) {
+        ret = -ret;
+    }
+    ret += ((int64_t)src3 << 31) + (round << 30);
     ret >>= 31;
+
     if (ret != (int32_t)ret) {
         *sat = 1;
         ret = (ret < 0 ? INT32_MIN : INT32_MAX);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(neon_qrdmlah_s32)(CPUARMState *env, int32_t src1,
                                   int32_t src2, int32_t src3)
 {
     uint32_t *sat = &env->vfp.qc[0];
-    return inl_qrdmlah_s32(src1, src2, src3, sat);
+    return do_sqrdmlah_s(src1, src2, src3, false, true, sat);
 }
 
 void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlah_s32)(void *vd, void *vn, void *vm,
     uintptr_t i;
 
     for (i = 0; i < opr_sz / 4; ++i) {
-        d[i] = inl_qrdmlah_s32(n[i], m[i], d[i], vq);
+        d[i] = do_sqrdmlah_s(n[i], m[i], d[i], false, true, vq);
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
-/* Signed saturating rounding doubling multiply-subtract high half, 32-bit */
-static int32_t inl_qrdmlsh_s32(int32_t src1, int32_t src2,
-                               int32_t src3, uint32_t *sat)
-{
-    /* Simplify similarly to int_qrdmlsh_s16 above.  */
-    int64_t ret = (int64_t)src1 * src2;
-    ret = ((int64_t)src3 << 31) - ret + (1 << 30);
-    ret >>= 31;
-    if (ret != (int32_t)ret) {
-        *sat = 1;
-        ret = (ret < 0 ? INT32_MIN : INT32_MAX);
-    }
-    return ret;
-}
-
 uint32_t HELPER(neon_qrdmlsh_s32)(CPUARMState *env, int32_t src1,
                                   int32_t src2, int32_t src3)
 {
     uint32_t *sat = &env->vfp.qc[0];
-    return inl_qrdmlsh_s32(src1, src2, src3, sat);
+    return do_sqrdmlah_s(src1, src2, src3, true, true, sat);
 }
 
 void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
     uintptr_t i;
 
     for (i = 0; i < opr_sz / 4; ++i) {
-        d[i] = inl_qrdmlsh_s32(n[i], m[i], d[i], vq);
+        d[i] = do_sqrdmlah_s(n[i], m[i], d[i], true, true, vq);
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-19-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  4 ++++
 target/arm/translate-a64.c | 16 ++++++++++++++++
 target/arm/vec_helper.c    | 29 +++++++++++++++++++++++++----
 3 files changed, 45 insertions(+), 4 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_uaba_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_uaba_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_uaba_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_mul_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_mul_idx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_mul_idx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
 #include "helper-sve.h"
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
                                data, gen_helper_gvec_fmlal_idx_a64);
         }
         return;
+
+    case 0x08: /* MUL */
+        if (!is_long && !is_scalar) {
+            static gen_helper_gvec_3 * const fns[3] = {
+                gen_helper_gvec_mul_idx_h,
+                gen_helper_gvec_mul_idx_s,
+                gen_helper_gvec_mul_idx_d,
+            };
+            tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
+                               vec_full_reg_offset(s, rn),
+                               vec_full_reg_offset(s, rm),
+                               is_q ? 16 : 8, vec_full_reg_size(s),
+                               index, fns[size - 1]);
+            return;
+        }
+        break;
     }
 
     if (size == 3) {
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_rsqrts_d, helper_rsqrtsf_f64, float64)
  */
 
 #define DO_MUL_IDX(NAME, TYPE, H) \
+void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc) \
+{                                                                          \
+    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t idx = simd_data(desc);                                        \
+    TYPE *d = vd, *n = vn, *m = vm;                                        \
+    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+        TYPE mm = m[H(i + idx)];                                           \
+        for (j = 0; j < segment; j++) {                                    \
+            d[i + j] = n[i + j] * mm;                                      \
+        }                                                                  \
+    }                                                                      \
+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
+}
+
+DO_MUL_IDX(gvec_mul_idx_h, uint16_t, H2)
+DO_MUL_IDX(gvec_mul_idx_s, uint32_t, H4)
+DO_MUL_IDX(gvec_mul_idx_d, uint64_t, )
+
+#undef DO_MUL_IDX
+
+#define DO_FMUL_IDX(NAME, TYPE, H) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
     intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
     clear_tail(d, oprsz, simd_maxsz(desc));                                \
 }
 
-DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
-DO_MUL_IDX(gvec_fmul_idx_s, float32, H4)
-DO_MUL_IDX(gvec_fmul_idx_d, float64, )
+DO_FMUL_IDX(gvec_fmul_idx_h, float16, H2)
+DO_FMUL_IDX(gvec_fmul_idx_s, float32, H4)
+DO_FMUL_IDX(gvec_fmul_idx_d, float64, )
 
-#undef DO_MUL_IDX
+#undef DO_FMUL_IDX
 
 #define DO_FMLA_IDX(NAME, TYPE, H)                                         \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-20-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        | 14 ++++++++++++++
 target/arm/translate-a64.c | 34 ++++++++++++++++++++++++++++++++++
 target/arm/vec_helper.c    | 25 +++++++++++++++++++++++++
 3 files changed, 73 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_mul_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_mul_idx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_mul_idx_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_mla_idx_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_mla_idx_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_mla_idx_d, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(gvec_mls_idx_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_mls_idx_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_mls_idx_d, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
 #include "helper-sve.h"
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
             return;
         }
         break;
+
+    case 0x10: /* MLA */
+        if (!is_long && !is_scalar) {
+            static gen_helper_gvec_4 * const fns[3] = {
+                gen_helper_gvec_mla_idx_h,
+                gen_helper_gvec_mla_idx_s,
+                gen_helper_gvec_mla_idx_d,
+            };
+            tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
+                               vec_full_reg_offset(s, rn),
+                               vec_full_reg_offset(s, rm),
+                               vec_full_reg_offset(s, rd),
+                               is_q ? 16 : 8, vec_full_reg_size(s),
+                               index, fns[size - 1]);
+            return;
+        }
+        break;
+
+    case 0x14: /* MLS */
+        if (!is_long && !is_scalar) {
+            static gen_helper_gvec_4 * const fns[3] = {
+                gen_helper_gvec_mls_idx_h,
+                gen_helper_gvec_mls_idx_s,
+                gen_helper_gvec_mls_idx_d,
+            };
+            tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
+                               vec_full_reg_offset(s, rn),
+                               vec_full_reg_offset(s, rm),
+                               vec_full_reg_offset(s, rd),
+                               is_q ? 16 : 8, vec_full_reg_size(s),
+                               index, fns[size - 1]);
+            return;
+        }
+        break;
     }
 
     if (size == 3) {
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_MUL_IDX(gvec_mul_idx_d, uint64_t, )
 
 #undef DO_MUL_IDX
 
+#define DO_MLA_IDX(NAME, TYPE, OP, H) \
+void HELPER(NAME)(void *vd, void *vn, void *vm, void *va, uint32_t desc)   \
+{                                                                          \
+    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t idx = simd_data(desc);                                        \
+    TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
+    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+        TYPE mm = m[H(i + idx)];                                           \
+        for (j = 0; j < segment; j++) {                                    \
+            d[i + j] = a[i + j] OP n[i + j] * mm;                          \
+        }                                                                  \
+    }                                                                      \
+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
+}
+
+DO_MLA_IDX(gvec_mla_idx_h, uint16_t, +, H2)
+DO_MLA_IDX(gvec_mla_idx_s, uint32_t, +, H4)
+DO_MLA_IDX(gvec_mla_idx_d, uint64_t, +,   )
+
+DO_MLA_IDX(gvec_mls_idx_h, uint16_t, -, H2)
+DO_MLA_IDX(gvec_mls_idx_s, uint32_t, -, H4)
+DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -,   )
+
+#undef DO_MLA_IDX
+
 #define DO_FMUL_IDX(NAME, TYPE, H) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200815013145.539409-21-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        | 10 ++++++++
 target/arm/translate-a64.c | 33 ++++++++++++++++++--------
 target/arm/vec_helper.c    | 48 ++++++++++++++++++++++++++++++++++++++
 3 files changed, 81 insertions(+), 10 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_mls_idx_s, TCG_CALL_NO_RWG,
 DEF_HELPER_FLAGS_5(gvec_mls_idx_d, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(neon_sqdmulh_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_sqdmulh_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(neon_sqrdmulh_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_sqrdmulh_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
 #include "helper-sve.h"
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3_fpst(DisasContext *s, bool is_q, int rd, int rn,
     tcg_temp_free_ptr(fpst);
 }
 
+/* Expand a 3-operand + qc + operation using an out-of-line helper.  */
+static void gen_gvec_op3_qc(DisasContext *s, bool is_q, int rd, int rn,
+                            int rm, gen_helper_gvec_3_ptr *fn)
+{
+    TCGv_ptr qc_ptr = tcg_temp_new_ptr();
+
+    tcg_gen_addi_ptr(qc_ptr, cpu_env, offsetof(CPUARMState, vfp.qc));
+    tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       vec_full_reg_offset(s, rm), qc_ptr,
+                       is_q ? 16 : 8, vec_full_reg_size(s), 0, fn);
+    tcg_temp_free_ptr(qc_ptr);
+}
+
 /* Set ZF and NF based on a 64 bit result. This is alas fiddlier
  * than the 32 bit equivalent.
  */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
             gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_mla, size);
         }
         return;
+    case 0x16: /* SQDMULH, SQRDMULH */
+        {
+            static gen_helper_gvec_3_ptr * const fns[2][2] = {
+                { gen_helper_neon_sqdmulh_h, gen_helper_neon_sqrdmulh_h },
+                { gen_helper_neon_sqdmulh_s, gen_helper_neon_sqrdmulh_s },
+            };
+            gen_gvec_op3_qc(s, is_q, rd, rn, rm, fns[size - 1][u]);
+        }
+        return;
     case 0x11:
         if (!u) { /* CMTST */
             gen_gvec_fn3(s, is_q, rd, rn, rm, gen_gvec_cmtst, size);
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                 genenvfn = fns[size][u];
                 break;
             }
-            case 0x16: /* SQDMULH, SQRDMULH */
-            {
-                static NeonGenTwoOpEnvFn * const fns[2][2] = {
-                    { gen_helper_neon_qdmulh_s16, gen_helper_neon_qrdmulh_s16 },
-                    { gen_helper_neon_qdmulh_s32, gen_helper_neon_qrdmulh_s32 },
-                };
-                assert(size == 1 || size == 2);
-                genenvfn = fns[size - 1][u];
-                break;
-            }
             default:
                 g_assert_not_reached();
             }
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s16)(void *vd, void *vn, void *vm,
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
+void HELPER(neon_sqdmulh_h)(void *vd, void *vn, void *vm,
+                            void *vq, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    int16_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 2; ++i) {
+        d[i] = do_sqrdmlah_h(n[i], m[i], 0, false, false, vq);
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(neon_sqrdmulh_h)(void *vd, void *vn, void *vm,
+                             void *vq, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    int16_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 2; ++i) {
+        d[i] = do_sqrdmlah_h(n[i], m[i], 0, false, true, vq);
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
 /* Signed saturating rounding doubling multiply-accumulate high half, 32-bit */
 static int32_t do_sqrdmlah_s(int32_t src1, int32_t src2, int32_t src3,
                              bool neg, bool round, uint32_t *sat)
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
+void HELPER(neon_sqdmulh_s)(void *vd, void *vn, void *vm,
+                            void *vq, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    int32_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 4; ++i) {
+        d[i] = do_sqrdmlah_s(n[i], m[i], 0, false, false, vq);
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(neon_sqrdmulh_s)(void *vd, void *vn, void *vm,
+                             void *vq, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    int32_t *d = vd, *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 4; ++i) {
+        d[i] = do_sqrdmlah_s(n[i], m[i], 0, false, true, vq);
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
 /* Integer 8 and 16-bit dot-product.
  *
  * Note that for the loops herein, host endianness does not matter
-- 
2.20.1