Series comparison

-[Qemu-devel] [PULL 00/55] target-arm queue
+[PULL 00/33] target-arm queue
-Hopefully last target-arm queue before softfreeze;
+Hi; here's the first target-arm pullreq for the 7.0 cycle.
 this one's largest part is the remainder of the SVE patches,
 but there are a selection of other minor things too.
 thanks
 -- PMM
-The following changes since commit 109b25045b3651f9c5d02c3766c0b3ff63e6d193:
+The following changes since commit 76b56fdfc9fa43ec6e5986aee33f108c6c6a511e:
-  Merge remote-tracking branch 'remotes/bonzini/tags/for-upstream' into staging (2018-06-29 12:30:29 +0100)
+  Merge tag 'block-pull-request' of https://gitlab.com/stefanha/qemu into staging (2021-12-14 12:46:18 -0800)
 are available in the Git repository at:
-  git://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20180629
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20211215
-for you to fetch changes up to 802abf4024d23e48d45373ac3f2b580124b54b47:
+for you to fetch changes up to aed176558806674d030a8305d989d4e6a5073359:
-  target/arm: Add ID_ISAR6 (2018-06-29 15:30:54 +0100)
+  tests/acpi: add expected blob for VIOT test on virt machine (2021-12-15 10:35:26 +0000)
 ----------------------------------------------------------------
 target-arm queue:
- * last of the SVE patches; SVE is now enabled for aarch64 linux-user
+ * ITS: error reporting cleanup
- * sd: Don't trace SDRequest crc field (coverity bugfix)
+ * aspeed: improve documentation
- * target/arm: Mark PMINTENSET accesses as possibly doing IO
+ * Fix STM32F2XX USART data register readout
- * clean up v7VE feature bit handling
+ * allow emulated GICv3 to be disabled in non-TCG builds
- * i.mx7d: minor cleanups
+ * fix exception priority for singlestep, misaligned PC, bp, etc
- * target/arm: support reading of CNT[VCT|FRQ]_EL0 from user-space
+ * Correct calculation of tlb range invalidate length
- * target/arm: Implement ARMv8.2-DotProd
+ * npcm7xx_emc: fix missing queue_flush
- * virt: add addresses to dt node names (which stops dtc from
+ * virt: Add VIOT ACPI table for virtio-iommu
-   complaining that they're not correctly named)
+ * target/i386: Use assert() to sanity-check b1 in SSE decode
- * cleanups: replace error_setg(&error_fatal) by error_report() + exit()
+ * Don't include qemu-common unnecessarily
 ----------------------------------------------------------------
-Aaron Lindsay (3):
+Alex Bennée (1):
-      target/arm: Add ARM_FEATURE_V7VE for v7 Virtualization Extensions
+      hw/intc: clean-up error reporting for failed ITS cmd
       target/arm: Remove redundant DIV detection for KVM
       target/arm: Mark PMINTENSET accesses as possibly doing IO
-Alex Bennée (1):
+Jean-Philippe Brucker (8):
-      target/arm: support reading of CNT[VCT|FRQ]_EL0 from user-space
+      hw/arm/virt-acpi-build: Add VIOT table for virtio-iommu
       hw/arm/virt: Remove device tree restriction for virtio-iommu
       hw/arm/virt: Reject instantiation of multiple IOMMUs
       hw/arm/virt: Use object_property_set instead of qdev_prop_set
       tests/acpi: allow updates of VIOT expected data files
       tests/acpi: add test case for VIOT
       tests/acpi: add expected blobs for VIOT test on q35 machine
       tests/acpi: add expected blob for VIOT test on virt machine
-Eric Auger (3):
+Joel Stanley (4):
-      device_tree: Add qemu_fdt_node_unit_path
+      docs: aspeed: Add new boards
-      hw/arm/virt: Silence dtc /intc warnings
+      docs: aspeed: Update OpenBMC image URL
-      hw/arm/virt: Silence dtc /memory warning
+      docs: aspeed: Give an example of booting a kernel
       docs: aspeed: ADC is now modelled
-Jean-Christophe Dubois (3):
+Olivier Hériveaux (1):
-      i.mx7d: Remove unused header files
+      Fix STM32F2XX USART data register readout
       i.mx7d: Change SRC unimplemented device name from sdma to src
       i.mx7d: Change IRQ number type from hwaddr to int
-Peter Maydell (1):
+Patrick Venture (1):
-      sd: Don't trace SDRequest crc field
+      hw/net: npcm7xx_emc fix missing queue_flush
-Philippe Mathieu-Daudé (4):
+Peter Maydell (6):
-      hw/block/fdc: Replace error_setg(&error_abort) by assert()
+      target/i386: Use assert() to sanity-check b1 in SSE decode
-      hw/arm/sysbus-fdt: Replace error_setg(&error_fatal) by error_report() + exit()
+      include/hw/i386: Don't include qemu-common.h in .h files
-      device_tree: Replace error_setg(&error_fatal) by error_report() + exit()
+      target/hexagon/cpu.h: don't include qemu-common.h
-      sdcard: Use the ldst API
+      target/rx/cpu.h: Don't include qemu-common.h
       hw/arm: Don't include qemu-common.h unnecessarily
       target/arm: Correct calculation of tlb range invalidate length
-Richard Henderson (40):
+Philippe Mathieu-Daudé (2):
-      target/arm: Implement SVE Memory Contiguous Load Group
+      hw/intc/arm_gicv3: Extract gicv3_set_gicv3state from arm_gicv3_cpuif.c
-      target/arm: Implement SVE Contiguous Load, first-fault and no-fault
+      hw/intc/arm_gicv3: Introduce CONFIG_ARM_GIC_TCG Kconfig selector
       target/arm: Implement SVE Memory Contiguous Store Group
       target/arm: Implement SVE load and broadcast quadword
       target/arm: Implement SVE integer convert to floating-point
       target/arm: Implement SVE floating-point arithmetic (predicated)
       target/arm: Implement SVE FP Multiply-Add Group
       target/arm: Implement SVE Floating Point Accumulating Reduction Group
       target/arm: Implement SVE load and broadcast element
       target/arm: Implement SVE store vector/predicate register
       target/arm: Implement SVE scatter stores
       target/arm: Implement SVE prefetches
       target/arm: Implement SVE gather loads
       target/arm: Implement SVE first-fault gather loads
       target/arm: Implement SVE scatter store vector immediate
       target/arm: Implement SVE floating-point compare vectors
       target/arm: Implement SVE floating-point arithmetic with immediate
       target/arm: Implement SVE Floating Point Multiply Indexed Group
       target/arm: Implement SVE FP Fast Reduction Group
       target/arm: Implement SVE Floating Point Unary Operations - Unpredicated Group
       target/arm: Implement SVE FP Compare with Zero Group
       target/arm: Implement SVE floating-point trig multiply-add coefficient
       target/arm: Implement SVE floating-point convert precision
       target/arm: Implement SVE floating-point convert to integer
       target/arm: Implement SVE floating-point round to integral value
       target/arm: Implement SVE floating-point unary operations
       target/arm: Implement SVE MOVPRFX
       target/arm: Implement SVE floating-point complex add
       target/arm: Implement SVE fp complex multiply add
       target/arm: Pass index to AdvSIMD FCMLA (indexed)
       target/arm: Implement SVE fp complex multiply add (indexed)
       target/arm: Implement SVE dot product (vectors)
       target/arm: Implement SVE dot product (indexed)
       target/arm: Enable SVE for aarch64-linux-user
       target/arm: Implement ARMv8.2-DotProd
       target/arm: Fix SVE signed division vs x86 overflow exception
       target/arm: Fix SVE system register access checks
       target/arm: Prune a57 features from max
       target/arm: Prune a15 features from max
       target/arm: Add ID_ISAR6
- include/sysemu/device_tree.h |   16 +
+Richard Henderson (10):
- target/arm/cpu.h             |    3 +
+      target/arm: Hoist pc_next to a local variable in aarch64_tr_translate_insn
- target/arm/helper-sve.h      |  682 +++++++++++++++
+      target/arm: Hoist pc_next to a local variable in arm_tr_translate_insn
- target/arm/helper.h          |   44 +-
+      target/arm: Hoist pc_next to a local variable in thumb_tr_translate_insn
- device_tree.c                |   78 +-
+      target/arm: Split arm_pre_translate_insn
- hw/arm/boot.c                |   41 +-
+      target/arm: Advance pc for arch single-step exception
- hw/arm/fsl-imx7.c            |    8 +-
+      target/arm: Split compute_fsr_fsc out of arm_deliver_fault
- hw/arm/mcimx7d-sabre.c       |    2 -
+      target/arm: Take an exception if PC is misaligned
- hw/arm/sysbus-fdt.c          |   53 +-
+      target/arm: Assert thumb pc is aligned
- hw/arm/virt.c                |   70 +-
+      target/arm: Suppress bp for exceptions with more priority
- hw/block/fdc.c               |    9 +-
+      tests/tcg: Add arm and aarch64 pc alignment tests
  hw/sd/bcm2835_sdhost.c       |   13 +-
  hw/sd/core.c                 |    2 +-
  hw/sd/milkymist-memcard.c    |    3 +-
  hw/sd/omap_mmc.c             |    6 +-
  hw/sd/pl181.c                |   11 +-
  hw/sd/sdhci.c                |   15 +-
  hw/sd/ssi-sd.c               |    6 +-
  linux-user/elfload.c         |    2 +
  target/arm/cpu.c             |   36 +-
  target/arm/cpu64.c           |   13 +-
  target/arm/helper.c          |   44 +-
  target/arm/kvm32.c           |   27 +-
  target/arm/sve_helper.c      | 1875 +++++++++++++++++++++++++++++++++++++++++-
  target/arm/translate-a64.c   |   62 +-
  target/arm/translate-sve.c   | 1688 ++++++++++++++++++++++++++++++++++++-
  target/arm/translate.c       |  102 ++-
  target/arm/vec_helper.c      |  311 ++++++-
  hw/sd/trace-events           |    2 +-
  target/arm/sve.decode        |  427 ++++++++++
 files changed, 5394 insertions(+), 257 deletions(-)
+ docs/system/arm/aspeed.rst        |  26 ++++++++++++----
+ include/hw/i386/microvm.h         |   1 -
+ include/hw/i386/x86.h             |   1 -
+ target/arm/helper.h               |   1 +
+ target/arm/syndrome.h             |   5 +++
+ target/hexagon/cpu.h              |   1 -
+ target/rx/cpu.h                   |   1 -
+ hw/arm/boot.c                     |   1 -
+ hw/arm/digic_boards.c             |   1 -
+ hw/arm/highbank.c                 |   1 -
+ hw/arm/npcm7xx_boards.c           |   1 -
+ hw/arm/sbsa-ref.c                 |   1 -
+ hw/arm/stm32f405_soc.c            |   1 -
+ hw/arm/vexpress.c                 |   1 -
+ hw/arm/virt-acpi-build.c          |   7 +++++
+ hw/arm/virt.c                     |  21 ++++++-------
+ hw/char/stm32f2xx_usart.c         |   3 +-
+ hw/intc/arm_gicv3.c               |   2 +-
+ hw/intc/arm_gicv3_cpuif.c         |  10 +-----
+ hw/intc/arm_gicv3_cpuif_common.c  |  22 +++++++++++++
+ hw/intc/arm_gicv3_its.c           |  39 +++++++++++++++--------
+ hw/net/npcm7xx_emc.c              |  18 +++++------
+ hw/virtio/virtio-iommu-pci.c      |  12 ++------
+ linux-user/aarch64/cpu_loop.c     |  46 ++++++++++++++++------------
+ linux-user/hexagon/cpu_loop.c     |   1 +
+ target/arm/debug_helper.c         |  23 ++++++++++++++
+ target/arm/gdbstub.c              |   9 ++++--
+ target/arm/helper.c               |   6 ++--
+ target/arm/machine.c              |  10 ++++++
+ target/arm/tlb_helper.c           |  63 ++++++++++++++++++++++++++++----------
+ target/arm/translate-a64.c        |  23 ++++++++++++--
+ target/arm/translate.c            |  58 ++++++++++++++++++++++++++---------
+ target/i386/tcg/translate.c       |  12 ++------
+ tests/qtest/bios-tables-test.c    |  38 +++++++++++++++++++++++
+ tests/tcg/aarch64/pcalign-a64.c   |  37 ++++++++++++++++++++++
+ tests/tcg/arm/pcalign-a32.c       |  46 ++++++++++++++++++++++++++++
+ hw/arm/Kconfig                    |   1 +
+ hw/intc/Kconfig                   |   5 +++
+ hw/intc/meson.build               |  11 ++++---
+ tests/data/acpi/q35/DSDT.viot     | Bin 0 -> 9398 bytes
+ tests/data/acpi/q35/VIOT.viot     | Bin 0 -> 112 bytes
+ tests/data/acpi/virt/VIOT         | Bin 0 -> 88 bytes
+ tests/tcg/aarch64/Makefile.target |   4 +--
+ tests/tcg/arm/Makefile.target     |   4 +++
+files changed, 429 insertions(+), 145 deletions(-)
+ create mode 100644 hw/intc/arm_gicv3_cpuif_common.c
+ create mode 100644 tests/tcg/aarch64/pcalign-a64.c
+ create mode 100644 tests/tcg/arm/pcalign-a32.c
+ create mode 100644 tests/data/acpi/q35/DSDT.viot
+ create mode 100644 tests/data/acpi/q35/VIOT.viot
+ create mode 100644 tests/data/acpi/virt/VIOT

-[Qemu-devel] [PULL 01/55] hw/block/fdc: Replace error_setg(&error_abort) by assert()
+Deleted patch
-From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Use assert() instead of error_setg(&error_abort),
-as suggested by the "qapi/error.h" documentation:
-    Please don't error_setg(&error_fatal, ...), use error_report() and
-    exit(), because that's more obvious.
-    Likewise, don't error_setg(&error_abort, ...), use assert().
-Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Acked-by: John Snow <jsnow@redhat.com>
-Message-id: 20180625165749.3910-2-f4bug@amsat.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- hw/block/fdc.c | 9 +--------
-file changed, 1 insertion(+), 8 deletions(-)
-diff --git a/hw/block/fdc.c b/hw/block/fdc.c
-index XXXXXXX..XXXXXXX 100644
---- a/hw/block/fdc.c
-+++ b/hw/block/fdc.c
-@@ -XXX,XX +XXX,XX @@ static int pick_geometry(FDrive *drv)
-                            nb_sectors,
-                            FloppyDriveType_str(parse->drive));
-         }
-+        assert(type_match != -1 && "misconfigured fd_format");
-         match = type_match;
-     }
--
--    /* No match of any kind found -- fd_format is misconfigured, abort. */
--    if (match == -1) {
--        error_setg(&error_abort, "No candidate geometries present in table "
--                   " for floppy drive type '%s'",
--                   FloppyDriveType_str(drv->drive));
--    }
--
-     parse = &(fd_formats[match]);
-  out:
---
-.17.1

-[Qemu-devel] [PULL 02/55] hw/arm/sysbus-fdt: Replace error_setg(&error_fatal) by error_report() + exit()
+Deleted patch
-From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Use error_report() + exit() instead of error_setg(&error_fatal),
-as suggested by the "qapi/error.h" documentation:
-   Please don't error_setg(&error_fatal, ...), use error_report() and
-   exit(), because that's more obvious.
-This fixes CID 1352173:
-    "Passing null pointer dt_name to qemu_fdt_node_path, which dereferences it."
-And this also fixes:
-    hw/arm/sysbus-fdt.c:322:9: warning: Array access (from variable 'node_path') results in a null pointer dereference
-        if (node_path[1]) {
-            ^~~~~~~~~~~~
-Fixes: Coverity CID 1352173 (Dereference after null check)
-Suggested-by: Eric Blake <eblake@redhat.com>
-Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Reviewed-by: Eric Auger <eric.auger@redhat.com>
-Message-id: 20180625165749.3910-3-f4bug@amsat.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- hw/arm/sysbus-fdt.c | 53 +++++++++++++++++++++++++--------------------
-file changed, 30 insertions(+), 23 deletions(-)
-diff --git a/hw/arm/sysbus-fdt.c b/hw/arm/sysbus-fdt.c
-index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/sysbus-fdt.c
-+++ b/hw/arm/sysbus-fdt.c
-@@ -XXX,XX +XXX,XX @@ static void copy_properties_from_host(HostProperty *props, int nb_props,
-         r = qemu_fdt_getprop(host_fdt, node_path,
-                              props[i].name,
-                              &prop_len,
--                             props[i].optional ? &err : &error_fatal);
-+                             &err);
-         if (r) {
-             qemu_fdt_setprop(guest_fdt, nodename,
-                              props[i].name, r, prop_len);
-         } else {
--            if (prop_len != -FDT_ERR_NOTFOUND) {
--                /* optional property not returned although property exists */
--                error_report_err(err);
--            } else {
-+            if (props[i].optional && prop_len == -FDT_ERR_NOTFOUND) {
-+                /* optional property does not exist */
-                 error_free(err);
-+            } else {
-+                error_report_err(err);
-+            }
-+            if (!props[i].optional) {
-+                /* mandatory property not found: bail out */
-+                exit(1);
-             }
-         }
-     }
-@@ -XXX,XX +XXX,XX @@ static void fdt_build_clock_node(void *host_fdt, void *guest_fdt,
-     node_offset = fdt_node_offset_by_phandle(host_fdt, host_phandle);
-     if (node_offset <= 0) {
--        error_setg(&error_fatal,
--                   "not able to locate clock handle %d in host device tree",
--                   host_phandle);
-+        error_report("not able to locate clock handle %d in host device tree",
-+                     host_phandle);
-+        exit(1);
-     }
-     node_path = g_malloc(path_len);
-     while ((ret = fdt_get_path(host_fdt, node_offset, node_path, path_len))
-@@ -XXX,XX +XXX,XX @@ static void fdt_build_clock_node(void *host_fdt, void *guest_fdt,
-         node_path = g_realloc(node_path, path_len);
-     }
-     if (ret < 0) {
--        error_setg(&error_fatal,
--                   "not able to retrieve node path for clock handle %d",
--                   host_phandle);
-+        error_report("not able to retrieve node path for clock handle %d",
-+                     host_phandle);
-+        exit(1);
-     }
-     r = qemu_fdt_getprop(host_fdt, node_path, "compatible", &prop_len,
-                          &error_fatal);
-     if (strcmp(r, "fixed-clock")) {
--        error_setg(&error_fatal,
--                   "clock handle %d is not a fixed clock", host_phandle);
-+        error_report("clock handle %d is not a fixed clock", host_phandle);
-+        exit(1);
-     }
-     nodename = strrchr(node_path, '/');
-@@ -XXX,XX +XXX,XX @@ static int add_amd_xgbe_fdt_node(SysBusDevice *sbdev, void *opaque)
-     dt_name = sysfs_to_dt_name(vbasedev->name);
-     if (!dt_name) {
--        error_setg(&error_fatal, "%s incorrect sysfs device name %s",
--                    __func__, vbasedev->name);
-+        error_report("%s incorrect sysfs device name %s",
-+                     __func__, vbasedev->name);
-+        exit(1);
-     }
-     node_path = qemu_fdt_node_path(host_fdt, dt_name, vdev->compat,
-                                    &error_fatal);
-     if (!node_path || !node_path[0]) {
--        error_setg(&error_fatal, "%s unable to retrieve node path for %s/%s",
--                   __func__, dt_name, vdev->compat);
-+        error_report("%s unable to retrieve node path for %s/%s",
-+                     __func__, dt_name, vdev->compat);
-+        exit(1);
-     }
-     if (node_path[1]) {
--        error_setg(&error_fatal, "%s more than one node matching %s/%s!",
--                   __func__, dt_name, vdev->compat);
-+        error_report("%s more than one node matching %s/%s!",
-+                     __func__, dt_name, vdev->compat);
-+        exit(1);
-     }
-     g_free(dt_name);
-     if (vbasedev->num_regions != 5) {
--        error_setg(&error_fatal, "%s Does the host dt node combine XGBE/PHY?",
--                   __func__);
-+        error_report("%s Does the host dt node combine XGBE/PHY?", __func__);
-+        exit(1);
-     }
-     /* generate nodes for DMA_CLK and PTP_CLK */
-     r = qemu_fdt_getprop(host_fdt, node_path[0], "clocks",
-                          &prop_len, &error_fatal);
-     if (prop_len != 8) {
--        error_setg(&error_fatal, "%s clocks property should contain 2 handles",
--                   __func__);
-+        error_report("%s clocks property should contain 2 handles", __func__);
-+        exit(1);
-     }
-     host_clock_phandles = (uint32_t *)r;
-     guest_clock_phandles[0] = qemu_fdt_alloc_phandle(guest_fdt);
---
-.17.1

-[Qemu-devel] [PULL 42/55] target/arm: support reading of CNT[VCT|FRQ]_EL0 from user-space
+[PULL 01/33] hw/intc: clean-up error reporting for failed ITS cmd
 From: Alex Bennée <alex.bennee@linaro.org>
-Since kernel commit a86bd139f2 (arm64: arch_timer: Enable CNTVCT_EL0
+While trying to debug a GIC ITS failure I saw some guest errors that
-trap..), released in kernel version v4.12, user-space has been able
+had poor formatting as well as leaving me confused as to what failed.
-to read these system registers. As we can't use QEMUTimer's in
+As most of the checks aren't possible without a valid dte split that
-linux-user mode we just directly call cpu_get_clock().
+check apart and then check the other conditions in steps. This avoids
 us relying on undefined data.
 I still get a failure with the current kvm-unit-tests but at least I
 know (partially) why now:
   Exception return from AArch64 EL1 to AArch64 EL1 PC 0x40080588
   PASS: gicv3: its-trigger: inv/invall: dev2/eventid=20 now triggers an LPI
   ITS: MAPD devid=2 size = 0x8 itt=0x40430000 valid=0
   INT dev_id=2 event_id=20
   process_its_cmd: invalid command attributes: invalid dte: 0 for 2 (MEM_TX: 0)
   PASS: gicv3: its-trigger: mapd valid=false: no LPI after device unmap
   SUMMARY: 6 tests, 1 unexpected failures
 Signed-off-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180625160009.17437-2-alex.bennee@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20211112170454.3158925-1-alex.bennee@linaro.org
+Cc: Shashi Mallela <shashi.mallela@linaro.org>
+Cc: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c | 27 ++++++++++++++++++++++++---
+ hw/intc/arm_gicv3_its.c | 39 +++++++++++++++++++++++++++------------
-file changed, 24 insertions(+), 3 deletions(-)
+file changed, 27 insertions(+), 12 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
+diff --git a/hw/intc/arm_gicv3_its.c b/hw/intc/arm_gicv3_its.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
+--- a/hw/intc/arm_gicv3_its.c
-+++ b/target/arm/helper.c
++++ b/hw/intc/arm_gicv3_its.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
+@@ -XXX,XX +XXX,XX @@ static bool process_its_cmd(GICv3ITSState *s, uint64_t value, uint32_t offset,
- };
+         if (res != MEMTX_OK) {
+             return result;
- #else
+         }
--/* In user-mode none of the generic timer registers are accessible,
++    } else {
-- * and their implementation depends on QEMU_CLOCK_VIRTUAL and qdev gpio outputs,
++        qemu_log_mask(LOG_GUEST_ERROR,
-- * so instead just don't register any of them.
++                      "%s: invalid command attributes: "
 +                      "invalid dte: %"PRIx64" for %d (MEM_TX: %d)\n",
 +                      __func__, dte, devid, res);
 +        return result;
      }
 -    if ((devid > s->dt.maxids.max_devids) || !dte_valid || !ite_valid ||
 -            !cte_valid || (eventid > max_eventid)) {
 +
-+/* In user-mode most of the generic timer registers are inaccessible
++    /*
-+ * however modern kernels (4.12+) allow access to cntvct_el0
++     * In this implementation, in case of guest errors we ignore the
-  */
++     * command and move onto the next command in the queue.
 +     */
 +    if (devid > s->dt.maxids.max_devids) {
          qemu_log_mask(LOG_GUEST_ERROR,
 -                      "%s: invalid command attributes "
 -                      "devid %d or eventid %d or invalid dte %d or"
 -                      "invalid cte %d or invalid ite %d\n",
 -                      __func__, devid, eventid, dte_valid, cte_valid,
 -                      ite_valid);
 -        /*
 -         * in this implementation, in case of error
 -         * we ignore this command and move onto the next
 -         * command in the queue
 -         */
 +                      "%s: invalid command attributes: devid %d>%d",
 +                      __func__, devid, s->dt.maxids.max_devids);
 +
-+static uint64_t gt_virt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
++    } else if (!dte_valid || !ite_valid || !cte_valid) {
-+{
++        qemu_log_mask(LOG_GUEST_ERROR,
-+    /* Currently we have no support for QEMUTimer in linux-user so we
++                      "%s: invalid command attributes: "
-+     * can't call gt_get_countervalue(env), instead we directly
++                      "dte: %s, ite: %s, cte: %s\n",
-+     * call the lower level functions.
++                      __func__,
-+     */
++                      dte_valid ? "valid" : "invalid",
-+    return cpu_get_clock() / GTIMER_SCALE;
++                      ite_valid ? "valid" : "invalid",
-+}
++                      cte_valid ? "valid" : "invalid");
-+
++    } else if (eventid > max_eventid) {
- static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
++        qemu_log_mask(LOG_GUEST_ERROR,
-+    { .name = "CNTFRQ_EL0", .state = ARM_CP_STATE_AA64,
++                      "%s: invalid command attributes: eventid %d > %d\n",
-+      .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 0, .opc2 = 0,
++                      __func__, eventid, max_eventid);
-+      .type = ARM_CP_CONST, .access = PL0_R /* no PL1_RW in linux-user */,
+     } else {
-+      .fieldoffset = offsetof(CPUARMState, cp15.c14_cntfrq),
+         /*
-+      .resetvalue = NANOSECONDS_PER_SECOND / GTIMER_SCALE,
+          * Current implementation only supports rdbase == procnum
 +    },
 +    { .name = "CNTVCT_EL0", .state = ARM_CP_STATE_AA64,
 +      .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 0, .opc2 = 2,
 +      .access = PL0_R, .type = ARM_CP_NO_RAW | ARM_CP_IO,
 +      .readfn = gt_virt_cnt_read,
 +    },
      REGINFO_SENTINEL
  };
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 54/55] target/arm: Prune a15 features from max
+[PULL 02/33] docs: aspeed: Add new boards
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Joel Stanley <joel@jms.id.au>
-There is no need to re-set these 3 features already
+Add X11, FP5280G2, G220A, Rainier and Fuji. Mention that Swift will be
-implied by the call to aarch64_a15_initfn.
+removed in v7.0.
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Joel Stanley <joel@jms.id.au>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Cédric Le Goater <clg@kaod.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20211117065752.330632-2-joel@jms.id.au
 Message-id: 20180629001538.11415-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.c | 3 ---
+ docs/system/arm/aspeed.rst | 7 ++++++-
-file changed, 3 deletions(-)
+file changed, 6 insertions(+), 1 deletion(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/docs/system/arm/aspeed.rst b/docs/system/arm/aspeed.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/docs/system/arm/aspeed.rst
-+++ b/target/arm/cpu.c
++++ b/docs/system/arm/aspeed.rst
-@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ AST2400 SoC based machines :
-          * since we don't correctly set the ID registers to advertise them,
-          */
+ - ``palmetto-bmc``         OpenPOWER Palmetto POWER8 BMC
-         set_feature(&cpu->env, ARM_FEATURE_V8);
+ - ``quanta-q71l-bmc``      OpenBMC Quanta BMC
--        set_feature(&cpu->env, ARM_FEATURE_VFP4);
++- ``supermicrox11-bmc``    Supermicro X11 BMC
--        set_feature(&cpu->env, ARM_FEATURE_NEON);
--        set_feature(&cpu->env, ARM_FEATURE_THUMB2EE);
+ AST2500 SoC based machines :
-         set_feature(&cpu->env, ARM_FEATURE_V8_AES);
-         set_feature(&cpu->env, ARM_FEATURE_V8_SHA1);
+@@ -XXX,XX +XXX,XX @@ AST2500 SoC based machines :
-         set_feature(&cpu->env, ARM_FEATURE_V8_SHA256);
+ - ``romulus-bmc``          OpenPOWER Romulus POWER9 BMC
  - ``witherspoon-bmc``      OpenPOWER Witherspoon POWER9 BMC
  - ``sonorapass-bmc``       OCP SonoraPass BMC
 -- ``swift-bmc``            OpenPOWER Swift BMC POWER9
 +- ``swift-bmc``            OpenPOWER Swift BMC POWER9 (to be removed in v7.0)
 +- ``fp5280g2-bmc``         Inspur FP5280G2 BMC
 +- ``g220a-bmc``            Bytedance G220A BMC
  AST2600 SoC based machines :
  - ``ast2600-evb``          Aspeed AST2600 Evaluation board (Cortex-A7)
  - ``tacoma-bmc``           OpenPOWER Witherspoon POWER9 AST2600 BMC
 +- ``rainier-bmc``          IBM Rainier POWER10 BMC
 +- ``fuji-bmc``             Facebook Fuji BMC
  Supported devices
  -----------------
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 53/55] target/arm: Prune a57 features from max
+[PULL 03/33] docs: aspeed: Update OpenBMC image URL
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Joel Stanley <joel@jms.id.au>
-There is no need to re-set these 9 features already
+This is the latest URL for the OpenBMC CI. The old URL still works, but
-implied by the call to aarch64_a57_initfn.
+redirects.
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Cédric Le Goater <clg@kaod.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Joel Stanley <joel@jms.id.au>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20211117065752.330632-3-joel@jms.id.au
 Message-id: 20180629001538.11415-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu64.c | 9 ---------
+ docs/system/arm/aspeed.rst | 2 +-
-file changed, 9 deletions(-)
+file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
+diff --git a/docs/system/arm/aspeed.rst b/docs/system/arm/aspeed.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
+--- a/docs/system/arm/aspeed.rst
-+++ b/target/arm/cpu64.c
++++ b/docs/system/arm/aspeed.rst
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ The Aspeed machines can be started using the ``-kernel`` option to
-          * whereas the architecture requires them to be present in both if
+ load a Linux kernel or from a firmware. Images can be downloaded from
-          * present in either.
+ the OpenBMC jenkins :
-          */
--        set_feature(&cpu->env, ARM_FEATURE_V8);
+-   https://jenkins.openbmc.org/job/ci-openbmc/lastSuccessfulBuild/distro=ubuntu,label=docker-builder
--        set_feature(&cpu->env, ARM_FEATURE_VFP4);
++   https://jenkins.openbmc.org/job/ci-openbmc/lastSuccessfulBuild/
--        set_feature(&cpu->env, ARM_FEATURE_NEON);
--        set_feature(&cpu->env, ARM_FEATURE_AARCH64);
+ or directly from the OpenBMC GitHub release repository :
--        set_feature(&cpu->env, ARM_FEATURE_V8_AES);
 -        set_feature(&cpu->env, ARM_FEATURE_V8_SHA1);
 -        set_feature(&cpu->env, ARM_FEATURE_V8_SHA256);
          set_feature(&cpu->env, ARM_FEATURE_V8_SHA512);
          set_feature(&cpu->env, ARM_FEATURE_V8_SHA3);
          set_feature(&cpu->env, ARM_FEATURE_V8_SM3);
          set_feature(&cpu->env, ARM_FEATURE_V8_SM4);
 -        set_feature(&cpu->env, ARM_FEATURE_V8_PMULL);
 -        set_feature(&cpu->env, ARM_FEATURE_CRC);
          set_feature(&cpu->env, ARM_FEATURE_V8_ATOMICS);
          set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
          set_feature(&cpu->env, ARM_FEATURE_V8_DOTPROD);
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 51/55] target/arm: Fix SVE signed division vs x86 overflow exception
+[PULL 04/33] docs: aspeed: Give an example of booting a kernel
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Joel Stanley <joel@jms.id.au>
-We already check for the same condition within the normal integer
+A common use case for the ASPEED machine is to boot a Linux kernel.
-sdiv and sdiv64 helpers.  Use a slightly different formation that
+Provide a full example command line.
 does not require deducing the expression type.
-Fixes: f97cfd596ed
+Reviewed-by: Cédric Le Goater <clg@kaod.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Joel Stanley <joel@jms.id.au>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20211117065752.330632-4-joel@jms.id.au
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20180629001538.11415-2-richard.henderson@linaro.org
 [PMM: reworded a comment]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/sve_helper.c | 20 +++++++++++++++-----
+ docs/system/arm/aspeed.rst | 15 ++++++++++++---
-file changed, 15 insertions(+), 5 deletions(-)
+file changed, 12 insertions(+), 3 deletions(-)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
+diff --git a/docs/system/arm/aspeed.rst b/docs/system/arm/aspeed.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
+--- a/docs/system/arm/aspeed.rst
-+++ b/target/arm/sve_helper.c
++++ b/docs/system/arm/aspeed.rst
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg, uint32_t desc) \
+@@ -XXX,XX +XXX,XX @@ Missing devices
- #define DO_MIN(N, M)  ((N) >= (M) ? (M) : (N))
+ Boot options
- #define DO_ABD(N, M)  ((N) >= (M) ? (N) - (M) : (M) - (N))
+ ------------
- #define DO_MUL(N, M)  (N * M)
--#define DO_DIV(N, M)  (M ? N / M : 0)
+-The Aspeed machines can be started using the ``-kernel`` option to
 -load a Linux kernel or from a firmware. Images can be downloaded from
 -the OpenBMC jenkins :
 +The Aspeed machines can be started using the ``-kernel`` and ``-dtb`` options
 +to load a Linux kernel or from a firmware. Images can be downloaded from the
 +OpenBMC jenkins :
     https://jenkins.openbmc.org/job/ci-openbmc/lastSuccessfulBuild/
@@ -XXX,XX +XXX,XX @@ or directly from the OpenBMC GitHub release repository :
     https://github.com/openbmc/openbmc/releases
 +To boot a kernel directly from a Linux build tree:
 +
++.. code-block:: bash
 +
-+/*
++  $ qemu-system-arm -M ast2600-evb -nographic \
-+ * We must avoid the C undefined behaviour cases: division by
++        -kernel arch/arm/boot/zImage \
-+ * zero and signed division of INT_MIN by -1. Both of these
++        -dtb arch/arm/boot/dts/aspeed-ast2600-evb.dtb \
-+ * have architecturally defined required results for Arm.
++        -initrd rootfs.cpio
-+ * We special case all signed divisions by -1 to avoid having
++
-+ * to deduce the minimum integer for the type involved.
+ The image should be attached as an MTD drive. Run :
-+ */
-+#define DO_SDIV(N, M) (unlikely(M == 0) ? 0 : unlikely(M == -1) ? -N : N / M)
+ .. code-block:: bash
 +#define DO_UDIV(N, M) (unlikely(M == 0) ? 0 : N / M)
  DO_ZPZZ(sve_and_zpzz_b, uint8_t, H1, DO_AND)
  DO_ZPZZ(sve_and_zpzz_h, uint16_t, H1_2, DO_AND)
@@ -XXX,XX +XXX,XX @@ DO_ZPZZ(sve_umulh_zpzz_h, uint16_t, H1_2, do_mulh_h)
  DO_ZPZZ(sve_umulh_zpzz_s, uint32_t, H1_4, do_mulh_s)
  DO_ZPZZ_D(sve_umulh_zpzz_d, uint64_t, do_umulh_d)
 -DO_ZPZZ(sve_sdiv_zpzz_s, int32_t, H1_4, DO_DIV)
 -DO_ZPZZ_D(sve_sdiv_zpzz_d, int64_t, DO_DIV)
 +DO_ZPZZ(sve_sdiv_zpzz_s, int32_t, H1_4, DO_SDIV)
 +DO_ZPZZ_D(sve_sdiv_zpzz_d, int64_t, DO_SDIV)
 -DO_ZPZZ(sve_udiv_zpzz_s, uint32_t, H1_4, DO_DIV)
 -DO_ZPZZ_D(sve_udiv_zpzz_d, uint64_t, DO_DIV)
 +DO_ZPZZ(sve_udiv_zpzz_s, uint32_t, H1_4, DO_UDIV)
 +DO_ZPZZ_D(sve_udiv_zpzz_d, uint64_t, DO_UDIV)
  /* Note that all bits of the shift are significant
     and not modulo the element size.  */
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 44/55] i.mx7d: Change SRC unimplemented device name from sdma to src
+[PULL 05/33] docs: aspeed: ADC is now modelled
-From: Jean-Christophe Dubois <jcd@tribudubois.net>
+From: Joel Stanley <joel@jms.id.au>
-Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
+Move it to the supported list.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Joel Stanley <joel@jms.id.au>
 Message-id: 20211117065752.330632-5-joel@jms.id.au
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/fsl-imx7.c | 2 +-
+ docs/system/arm/aspeed.rst | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/hw/arm/fsl-imx7.c b/hw/arm/fsl-imx7.c
+diff --git a/docs/system/arm/aspeed.rst b/docs/system/arm/aspeed.rst
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/fsl-imx7.c
+--- a/docs/system/arm/aspeed.rst
-+++ b/hw/arm/fsl-imx7.c
++++ b/docs/system/arm/aspeed.rst
-@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@ Supported devices
-     /*
+  * Front LEDs (PCA9552 on I2C bus)
-      * SRC
+  * LPC Peripheral Controller (a subset of subdevices are supported)
-      */
+  * Hash/Crypto Engine (HACE) - Hash support only. TODO: HMAC and RSA
--    create_unimplemented_device("sdma", FSL_IMX7_SRC_ADDR, FSL_IMX7_SRC_SIZE);
++ * ADC
-+    create_unimplemented_device("src", FSL_IMX7_SRC_ADDR, FSL_IMX7_SRC_SIZE);
-     /*
+ Missing devices
-      * Watchdog
+ ---------------
   * Coprocessor support
 - * ADC (out of tree implementation)
   * PWM and Fan Controller
   * Slave GPIO Controller
   * Super I/O Controller
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 50/55] sdcard: Use the ldst API
+[PULL 06/33] Fix STM32F2XX USART data register readout
-From: Philippe Mathieu-Daudé <f4bug@amsat.org>
+From: Olivier Hériveaux <olivier.heriveaux@ledger.fr>
-The load/store API will ease further code movement.
+Fix issue where the data register may be overwritten by next character
 reception before being read and returned.
-Per the Physical Layer Simplified Spec. "3.6 Bus Protocol":
+Signed-off-by: Olivier Hériveaux <olivier.heriveaux@ledger.fr>
   "In the CMD line the Most Significant Bit (MSB) is transmitted
    first, the Least Significant Bit (LSB) is the last."
 Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-id: 20211128120723.4053-1-olivier.heriveaux@ledger.fr
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/sd/bcm2835_sdhost.c    | 13 +++++--------
+ hw/char/stm32f2xx_usart.c | 3 ++-
- hw/sd/milkymist-memcard.c |  3 +--
+file changed, 2 insertions(+), 1 deletion(-)
  hw/sd/omap_mmc.c          |  6 ++----
  hw/sd/pl181.c             | 11 ++++-------
  hw/sd/sdhci.c             | 15 +++++----------
  hw/sd/ssi-sd.c            |  6 ++----
 files changed, 19 insertions(+), 35 deletions(-)
-diff --git a/hw/sd/bcm2835_sdhost.c b/hw/sd/bcm2835_sdhost.c
+diff --git a/hw/char/stm32f2xx_usart.c b/hw/char/stm32f2xx_usart.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/sd/bcm2835_sdhost.c
+--- a/hw/char/stm32f2xx_usart.c
-+++ b/hw/sd/bcm2835_sdhost.c
++++ b/hw/char/stm32f2xx_usart.c
-@@ -XXX,XX +XXX,XX @@ static void bcm2835_sdhost_send_command(BCM2835SDHostState *s)
+@@ -XXX,XX +XXX,XX @@ static uint64_t stm32f2xx_usart_read(void *opaque, hwaddr addr,
-         goto error;
+         return retvalue;
-     }
+     case USART_DR:
-     if (!(s->cmd & SDCMD_NO_RESPONSE)) {
+         DB_PRINT("Value: 0x%" PRIx32 ", %c\n", s->usart_dr, (char) s->usart_dr);
--#define RWORD(n) (((uint32_t)rsp[n] << 24) | (rsp[n + 1] << 16) \
++        retvalue = s->usart_dr & 0x3FF;
--                  | (rsp[n + 2] << 8) | rsp[n + 3])
+         s->usart_sr &= ~USART_SR_RXNE;
-         if (rlen == 0 || (rlen == 4 && (s->cmd & SDCMD_LONG_RESPONSE))) {
+         qemu_chr_fe_accept_input(&s->chr);
-             goto error;
+         qemu_set_irq(s->irq, 0);
-         }
+-        return s->usart_dr & 0x3FF;
-@@ -XXX,XX +XXX,XX @@ static void bcm2835_sdhost_send_command(BCM2835SDHostState *s)
++        return retvalue;
-             goto error;
+     case USART_BRR:
-         }
+         return s->usart_brr;
-         if (rlen == 4) {
+     case USART_CR1:
 -            s->rsp[0] = RWORD(0);
 +            s->rsp[0] = ldl_be_p(&rsp[0]);
              s->rsp[1] = s->rsp[2] = s->rsp[3] = 0;
          } else {
 -            s->rsp[0] = RWORD(12);
 -            s->rsp[1] = RWORD(8);
 -            s->rsp[2] = RWORD(4);
 -            s->rsp[3] = RWORD(0);
 +            s->rsp[0] = ldl_be_p(&rsp[12]);
 +            s->rsp[1] = ldl_be_p(&rsp[8]);
 +            s->rsp[2] = ldl_be_p(&rsp[4]);
 +            s->rsp[3] = ldl_be_p(&rsp[0]);
          }
 -#undef RWORD
      }
      /* We never really delay commands, so if this was a 'busywait' command
       * then we've completed it now and can raise the interrupt.
 diff --git a/hw/sd/milkymist-memcard.c b/hw/sd/milkymist-memcard.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/sd/milkymist-memcard.c
 +++ b/hw/sd/milkymist-memcard.c
@@ -XXX,XX +XXX,XX @@ static void memcard_sd_command(MilkymistMemcardState *s)
      SDRequest req;
      req.cmd = s->command[0] & 0x3f;
 -    req.arg = (s->command[1] << 24) | (s->command[2] << 16)
 -              | (s->command[3] << 8) | s->command[4];
 +    req.arg = ldl_be_p(s->command + 1);
      req.crc = s->command[5];
      s->response[0] = req.cmd;
 diff --git a/hw/sd/omap_mmc.c b/hw/sd/omap_mmc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/sd/omap_mmc.c
 +++ b/hw/sd/omap_mmc.c
@@ -XXX,XX +XXX,XX @@ static void omap_mmc_command(struct omap_mmc_s *host, int cmd, int dir,
                  CID_CSD_OVERWRITE;
          if (host->sdio & (1 << 13))
              mask |= AKE_SEQ_ERROR;
 -        rspstatus = (response[0] << 24) | (response[1] << 16) |
 -                (response[2] << 8) | (response[3] << 0);
 +        rspstatus = ldl_be_p(response);
          break;
      case sd_r2:
@@ -XXX,XX +XXX,XX @@ static void omap_mmc_command(struct omap_mmc_s *host, int cmd, int dir,
          }
          rsplen = 4;
 -        rspstatus = (response[0] << 24) | (response[1] << 16) |
 -                (response[2] << 8) | (response[3] << 0);
 +        rspstatus = ldl_be_p(response);
          if (rspstatus & 0x80000000)
              host->status &= 0xe000;
          else
 diff --git a/hw/sd/pl181.c b/hw/sd/pl181.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/sd/pl181.c
 +++ b/hw/sd/pl181.c
@@ -XXX,XX +XXX,XX @@ static void pl181_send_command(PL181State *s)
      if (rlen < 0)
          goto error;
      if (s->cmd & PL181_CMD_RESPONSE) {
 -#define RWORD(n) (((uint32_t)response[n] << 24) | (response[n + 1] << 16) \
 -                  | (response[n + 2] << 8) | response[n + 3])
          if (rlen == 0 || (rlen == 4 && (s->cmd & PL181_CMD_LONGRESP)))
              goto error;
          if (rlen != 4 && rlen != 16)
              goto error;
 -        s->response[0] = RWORD(0);
 +        s->response[0] = ldl_be_p(&response[0]);
          if (rlen == 4) {
              s->response[1] = s->response[2] = s->response[3] = 0;
          } else {
 -            s->response[1] = RWORD(4);
 -            s->response[2] = RWORD(8);
 -            s->response[3] = RWORD(12) & ~1;
 +            s->response[1] = ldl_be_p(&response[4]);
 +            s->response[2] = ldl_be_p(&response[8]);
 +            s->response[3] = ldl_be_p(&response[12]) & ~1;
          }
          DPRINTF("Response received\n");
          s->status |= PL181_STATUS_CMDRESPEND;
 -#undef RWORD
      } else {
          DPRINTF("Command sent\n");
          s->status |= PL181_STATUS_CMDSENT;
 diff --git a/hw/sd/sdhci.c b/hw/sd/sdhci.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/sd/sdhci.c
 +++ b/hw/sd/sdhci.c
@@ -XXX,XX +XXX,XX @@ static void sdhci_send_command(SDHCIState *s)
      if (s->cmdreg & SDHC_CMD_RESPONSE) {
          if (rlen == 4) {
 -            s->rspreg[0] = (response[0] << 24) | (response[1] << 16) |
 -                           (response[2] << 8)  |  response[3];
 +            s->rspreg[0] = ldl_be_p(response);
              s->rspreg[1] = s->rspreg[2] = s->rspreg[3] = 0;
              trace_sdhci_response4(s->rspreg[0]);
          } else if (rlen == 16) {
 -            s->rspreg[0] = (response[11] << 24) | (response[12] << 16) |
 -                           (response[13] << 8) |  response[14];
 -            s->rspreg[1] = (response[7] << 24) | (response[8] << 16) |
 -                           (response[9] << 8)  |  response[10];
 -            s->rspreg[2] = (response[3] << 24) | (response[4] << 16) |
 -                           (response[5] << 8)  |  response[6];
 +            s->rspreg[0] = ldl_be_p(&response[11]);
 +            s->rspreg[1] = ldl_be_p(&response[7]);
 +            s->rspreg[2] = ldl_be_p(&response[3]);
              s->rspreg[3] = (response[0] << 16) | (response[1] << 8) |
                              response[2];
              trace_sdhci_response16(s->rspreg[3], s->rspreg[2],
@@ -XXX,XX +XXX,XX @@ static void sdhci_end_transfer(SDHCIState *s)
          trace_sdhci_end_transfer(request.cmd, request.arg);
          sdbus_do_command(&s->sdbus, &request, response);
          /* Auto CMD12 response goes to the upper Response register */
 -        s->rspreg[3] = (response[0] << 24) | (response[1] << 16) |
 -                (response[2] << 8) | response[3];
 +        s->rspreg[3] = ldl_be_p(response);
      }
      s->prnsts &= ~(SDHC_DOING_READ | SDHC_DOING_WRITE |
 diff --git a/hw/sd/ssi-sd.c b/hw/sd/ssi-sd.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/sd/ssi-sd.c
 +++ b/hw/sd/ssi-sd.c
@@ -XXX,XX +XXX,XX @@ static uint32_t ssi_sd_transfer(SSISlave *dev, uint32_t val)
              uint8_t longresp[16];
              /* FIXME: Check CRC.  */
              request.cmd = s->cmd;
 -            request.arg = (s->cmdarg[0] << 24) | (s->cmdarg[1] << 16)
 -                           | (s->cmdarg[2] << 8) | s->cmdarg[3];
 +            request.arg = ldl_be_p(s->cmdarg);
              DPRINTF("CMD%d arg 0x%08x\n", s->cmd, request.arg);
              s->arglen = sdbus_do_command(&s->sdbus, &request, longresp);
              if (s->arglen <= 0) {
@@ -XXX,XX +XXX,XX @@ static uint32_t ssi_sd_transfer(SSISlave *dev, uint32_t val)
                  /* CMD13 returns a 2-byte statuse work. Other commands
                     only return the first byte.  */
                  s->arglen = (s->cmd == 13) ? 2 : 1;
 -                cardstatus = (longresp[0] << 24) | (longresp[1] << 16)
 -                             | (longresp[2] << 8) | longresp[3];
 +                cardstatus = ldl_be_p(longresp);
                  status = 0;
                  if (((cardstatus >> 9) & 0xf) < 4)
                      status |= SSI_SDR_IDLE;
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 38/55] target/arm: Implement SVE dot product (vectors)
+[PULL 07/33] hw/intc/arm_gicv3: Extract gicv3_set_gicv3state from arm_gicv3_cpuif.c
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Philippe Mathieu-Daudé <philmd@redhat.com>
+gicv3_set_gicv3state() is used by arm_gicv3_common.c in
+arm_gicv3_common_realize(). Since we want to restrict
+arm_gicv3_cpuif.c to TCG, extract gicv3_set_gicv3state()
+to a new file. Add this file to the meson 'specific'
+source set, since it needs access to "cpu.h".
+Signed-off-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20211115223619.2599282-2-philmd@redhat.com
 Message-id: 20180627043328.11531-33-richard.henderson@linaro.org
 [PMM: moved 'ra=%reg_movprfx' here from following patch]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |  5 +++
+ hw/intc/arm_gicv3_cpuif.c        | 10 +---------
- target/arm/translate-sve.c | 17 ++++++++++
+ hw/intc/arm_gicv3_cpuif_common.c | 22 ++++++++++++++++++++++
- target/arm/vec_helper.c    | 67 ++++++++++++++++++++++++++++++++++++++
+ hw/intc/meson.build              |  1 +
- target/arm/sve.decode      |  3 ++
+files changed, 24 insertions(+), 9 deletions(-)
-files changed, 92 insertions(+)
+ create mode 100644 hw/intc/arm_gicv3_cpuif_common.c
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/intc/arm_gicv3_cpuif.c b/hw/intc/arm_gicv3_cpuif.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/intc/arm_gicv3_cpuif.c
-+++ b/target/arm/helper.h
++++ b/hw/intc/arm_gicv3_cpuif.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_qrdmlah_s32, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@
  DEF_HELPER_FLAGS_5(gvec_qrdmlsh_s32, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sdot_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_udot_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_sdot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_udot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
  DEF_HELPER_FLAGS_5(gvec_fcaddh, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fcadds, TCG_CALL_NO_RWG,
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_ZZI(UMIN, umin)
  #undef DO_ZZI
 +static bool trans_DOT_zzz(DisasContext *s, arg_DOT_zzz *a, uint32_t insn)
 +{
 +    static gen_helper_gvec_3 * const fns[2][2] = {
 +        { gen_helper_gvec_sdot_b, gen_helper_gvec_sdot_h },
 +        { gen_helper_gvec_udot_b, gen_helper_gvec_udot_h }
 +    };
 +
 +    if (sve_access_check(s)) {
 +        unsigned vsz = vec_full_reg_size(s);
 +        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
 +                           vec_full_reg_offset(s, a->rn),
 +                           vec_full_reg_offset(s, a->rm),
 +                           vsz, vsz, 0, fns[a->u][a->sz]);
 +    }
 +    return true;
 +}
 +
  /*
-  *** SVE Floating Point Multiply-Add Indexed Group
+- * ARM Generic Interrupt Controller v3
-  */
++ * ARM Generic Interrupt Controller v3 (emulation)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+  *
-index XXXXXXX..XXXXXXX 100644
+  * Copyright (c) 2016 Linaro Limited
---- a/target/arm/vec_helper.c
+  * Written by Peter Maydell
-+++ b/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
+ #include "hw/irq.h"
-     clear_tail(d, opr_sz, simd_maxsz(desc));
+ #include "cpu.h"
- }
+-void gicv3_set_gicv3state(CPUState *cpu, GICv3CPUState *s)
-+/* Integer 8 and 16-bit dot-product.
+-{
 -    ARMCPU *arm_cpu = ARM_CPU(cpu);
 -    CPUARMState *env = &arm_cpu->env;
 -
 -    env->gicv3state = (void *)s;
 -};
 -
  static GICv3CPUState *icc_cs_from_env(CPUARMState *env)
  {
      return env->gicv3state;
 diff --git a/hw/intc/arm_gicv3_cpuif_common.c b/hw/intc/arm_gicv3_cpuif_common.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/intc/arm_gicv3_cpuif_common.c
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: GPL-2.0-or-later */
 +/*
 + * ARM Generic Interrupt Controller v3
 + *
-+ * Note that for the loops herein, host endianness does not matter
++ * Copyright (c) 2016 Linaro Limited
-+ * with respect to the ordering of data within the 64-bit lanes.
++ * Written by Peter Maydell
-+ * All elements are treated equally, no matter where they are.
++ *
 + * This code is licensed under the GPL, version 2 or (at your option)
 + * any later version.
 + */
 +
-+void HELPER(gvec_sdot_b)(void *vd, void *vn, void *vm, uint32_t desc)
++#include "qemu/osdep.h"
 +#include "gicv3_internal.h"
 +#include "cpu.h"
 +
 +void gicv3_set_gicv3state(CPUState *cpu, GICv3CPUState *s)
 +{
-+    intptr_t i, opr_sz = simd_oprsz(desc);
++    ARMCPU *arm_cpu = ARM_CPU(cpu);
-+    uint32_t *d = vd;
++    CPUARMState *env = &arm_cpu->env;
 +    int8_t *n = vn, *m = vm;
 +
-+    for (i = 0; i < opr_sz / 4; ++i) {
++    env->gicv3state = (void *)s;
-+        d[i] += n[i * 4 + 0] * m[i * 4 + 0]
++};
-+              + n[i * 4 + 1] * m[i * 4 + 1]
+diff --git a/hw/intc/meson.build b/hw/intc/meson.build
 +              + n[i * 4 + 2] * m[i * 4 + 2]
 +              + n[i * 4 + 3] * m[i * 4 + 3];
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_udot_b)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    uint32_t *d = vd;
 +    uint8_t *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz / 4; ++i) {
 +        d[i] += n[i * 4 + 0] * m[i * 4 + 0]
 +              + n[i * 4 + 1] * m[i * 4 + 1]
 +              + n[i * 4 + 2] * m[i * 4 + 2]
 +              + n[i * 4 + 3] * m[i * 4 + 3];
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_sdot_h)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    uint64_t *d = vd;
 +    int16_t *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz / 8; ++i) {
 +        d[i] += (int64_t)n[i * 4 + 0] * m[i * 4 + 0]
 +              + (int64_t)n[i * 4 + 1] * m[i * 4 + 1]
 +              + (int64_t)n[i * 4 + 2] * m[i * 4 + 2]
 +              + (int64_t)n[i * 4 + 3] * m[i * 4 + 3];
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_udot_h)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc);
 +    uint64_t *d = vd;
 +    uint16_t *n = vn, *m = vm;
 +
 +    for (i = 0; i < opr_sz / 8; ++i) {
 +        d[i] += (uint64_t)n[i * 4 + 0] * m[i * 4 + 0]
 +              + (uint64_t)n[i * 4 + 1] * m[i * 4 + 1]
 +              + (uint64_t)n[i * 4 + 2] * m[i * 4 + 2]
 +              + (uint64_t)n[i * 4 + 3] * m[i * 4 + 3];
 +    }
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
  void HELPER(gvec_fcaddh)(void *vd, void *vn, void *vm,
                           void *vfpst, uint32_t desc)
  {
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
+--- a/hw/intc/meson.build
-+++ b/target/arm/sve.decode
++++ b/hw/intc/meson.build
-@@ -XXX,XX +XXX,XX @@ UMIN_zzi        00100101 .. 101 011 110 ........ .....          @rdn_i8u
+@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP_PMU', if_true: files('xlnx-pmu-iomod-in
- # SVE integer multiply immediate (unpredicated)
- MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
+ specific_ss.add(when: 'CONFIG_ALLWINNER_A10_PIC', if_true: files('allwinner-a10-pic.c'))
+ specific_ss.add(when: 'CONFIG_APIC', if_true: files('apic.c', 'apic_common.c'))
-+# SVE integer dot product (unpredicated)
++specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif_common.c'))
-+DOT_zzz         01000100 1 sz:1 0 rm:5 00000 u:1 rn:5 rd:5      ra=%reg_movprfx
+ specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif.c'))
-+
+ specific_ss.add(when: 'CONFIG_ARM_GIC_KVM', if_true: files('arm_gic_kvm.c'))
- # SVE floating-point complex add (predicated)
+ specific_ss.add(when: ['CONFIG_ARM_GIC_KVM', 'TARGET_AARCH64'], if_true: files('arm_gicv3_kvm.c', 'arm_gicv3_its_kvm.c'))
  FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
                  rn=%reg_movprfx
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 47/55] target/arm: Remove redundant DIV detection for KVM
+[PULL 08/33] hw/intc/arm_gicv3: Introduce CONFIG_ARM_GIC_TCG Kconfig selector
-From: Aaron Lindsay <alindsay@codeaurora.org>
+From: Philippe Mathieu-Daudé <philmd@redhat.com>
-KVM implies V7VE, which implies ARM_DIV and THUMB_DIV. The conditional
+The TYPE_ARM_GICV3 device is an emulated one.  When using
-detection here is therefore unnecessary. Because V7VE is already
+KVM, it is recommended to use the TYPE_KVM_ARM_GICV3 device
-unconditionally specified for all KVM hosts, ARM_DIV and THUMB_DIV are
+(which uses in-kernel support).
 already indirectly specified and do not need to be included here at all.
-Signed-off-by: Aaron Lindsay <alindsay@codeaurora.org>
+When using --with-devices-FOO, it is possible to build a
-Message-id: 1529699547-17044-6-git-send-email-alindsay@codeaurora.org
+binary with a specific set of devices. When this binary is
 restricted to KVM accelerator, the TYPE_ARM_GICV3 device is
 irrelevant, and it is desirable to remove it from the binary.
 Therefore introduce the CONFIG_ARM_GIC_TCG Kconfig selector
 which select the files required to have the TYPE_ARM_GICV3
 device, but also allowing to de-select this device.
 Signed-off-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 20211115223619.2599282-3-philmd@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/kvm32.c | 19 +------------------
+ hw/intc/arm_gicv3.c |  2 +-
-file changed, 1 insertion(+), 18 deletions(-)
+ hw/intc/Kconfig     |  5 +++++
  hw/intc/meson.build | 10 ++++++----
 files changed, 12 insertions(+), 5 deletions(-)
-diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
+diff --git a/hw/intc/arm_gicv3.c b/hw/intc/arm_gicv3.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/kvm32.c
+--- a/hw/intc/arm_gicv3.c
-+++ b/target/arm/kvm32.c
++++ b/hw/intc/arm_gicv3.c
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
+@@ -XXX,XX +XXX,XX @@
-      * and then query that CPU for the relevant ID registers.
+ /*
-      */
+- * ARM Generic Interrupt Controller v3
-     int i, ret, fdarray[3];
++ * ARM Generic Interrupt Controller v3 (emulation)
--    uint32_t midr, id_pfr0, id_isar0, mvfr1;
+  *
-+    uint32_t midr, id_pfr0, mvfr1;
+  * Copyright (c) 2015 Huawei.
-     uint64_t features = 0;
+  * Copyright (c) 2016 Linaro Limited
-     /* Old kernels may not know about the PREFERRED_TARGET ioctl: however
+diff --git a/hw/intc/Kconfig b/hw/intc/Kconfig
-      * we know these will only support creating one kind of guest CPU,
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
+--- a/hw/intc/Kconfig
-             | ENCODE_CP_REG(15, 0, 0, 0, 1, 0, 0),
++++ b/hw/intc/Kconfig
-             .addr = (uintptr_t)&id_pfr0,
+@@ -XXX,XX +XXX,XX @@ config APIC
-         },
+     select MSI_NONBROKEN
--        {
+     select I8259
--            .id = KVM_REG_ARM | KVM_REG_SIZE_U32
--            | ENCODE_CP_REG(15, 0, 0, 0, 2, 0, 0),
++config ARM_GIC_TCG
--            .addr = (uintptr_t)&id_isar0,
++    bool
--        },
++    default y
-         {
++    depends on ARM_GIC && TCG
-             .id = KVM_REG_ARM | KVM_REG_SIZE_U32
++
-             | KVM_REG_ARM_VFP | KVM_REG_ARM_VFP_MVFR1,
+ config ARM_GIC_KVM
-@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
+     bool
-     set_feature(&features, ARM_FEATURE_VFP3);
+     default y
-     set_feature(&features, ARM_FEATURE_GENERIC_TIMER);
+diff --git a/hw/intc/meson.build b/hw/intc/meson.build
+index XXXXXXX..XXXXXXX 100644
--    switch (extract32(id_isar0, 24, 4)) {
+--- a/hw/intc/meson.build
--    case 1:
++++ b/hw/intc/meson.build
--        set_feature(&features, ARM_FEATURE_THUMB_DIV);
+@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_ARM_GIC', if_true: files(
--        break;
+   'arm_gic.c',
--    case 2:
+   'arm_gic_common.c',
--        set_feature(&features, ARM_FEATURE_ARM_DIV);
+   'arm_gicv2m.c',
--        set_feature(&features, ARM_FEATURE_THUMB_DIV);
+-  'arm_gicv3.c',
--        break;
+   'arm_gicv3_common.c',
--    default:
+-  'arm_gicv3_dist.c',
--        break;
+   'arm_gicv3_its_common.c',
--    }
+-  'arm_gicv3_redist.c',
--
++))
-     if (extract32(id_pfr0, 12, 4) == 1) {
++softmmu_ss.add(when: 'CONFIG_ARM_GIC_TCG', if_true: files(
-         set_feature(&features, ARM_FEATURE_THUMB2EE);
++  'arm_gicv3.c',
-     }
++  'arm_gicv3_dist.c',
    'arm_gicv3_its.c',
 +  'arm_gicv3_redist.c',
  ))
  softmmu_ss.add(when: 'CONFIG_ETRAXFS', if_true: files('etraxfs_pic.c'))
  softmmu_ss.add(when: 'CONFIG_HEATHROW_PIC', if_true: files('heathrow_pic.c'))
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP_PMU', if_true: files('xlnx-pmu-iomod-in
  specific_ss.add(when: 'CONFIG_ALLWINNER_A10_PIC', if_true: files('allwinner-a10-pic.c'))
  specific_ss.add(when: 'CONFIG_APIC', if_true: files('apic.c', 'apic_common.c'))
  specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif_common.c'))
 -specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif.c'))
 +specific_ss.add(when: 'CONFIG_ARM_GIC_TCG', if_true: files('arm_gicv3_cpuif.c'))
  specific_ss.add(when: 'CONFIG_ARM_GIC_KVM', if_true: files('arm_gic_kvm.c'))
  specific_ss.add(when: ['CONFIG_ARM_GIC_KVM', 'TARGET_AARCH64'], if_true: files('arm_gicv3_kvm.c', 'arm_gicv3_its_kvm.c'))
  specific_ss.add(when: 'CONFIG_ARM_V7M', if_true: files('armv7m_nvic.c'))
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 52/55] target/arm: Fix SVE system register access checks
+[PULL 09/33] target/arm: Hoist pc_next to a local variable in aarch64_tr_translate_insn
 From: Richard Henderson <richard.henderson@linaro.org>
-Leave ARM_CP_SVE, removing ARM_CP_FPU; the sve_access_check
-produced by the flag already includes fp_access_check.  If
-we also check ARM_CP_FPU the double fp_access_check asserts.
-Reported-by: Laurent Desnogues <laurent.desnogues@gmail.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Laurent Desnogues <laurent.desnogues@gmail.com>
-Message-id: 20180629001538.11415-3-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.c        | 8 ++++----
+ target/arm/translate-a64.c | 7 ++++---
- target/arm/translate-a64.c | 5 ++---
+file changed, 4 insertions(+), 3 deletions(-)
 files changed, 6 insertions(+), 7 deletions(-)
-diff --git a/target/arm/helper.c b/target/arm/helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.c
-+++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static void zcr_write(CPUARMState *env, const ARMCPRegInfo *ri,
- static const ARMCPRegInfo zcr_el1_reginfo = {
-     .name = "ZCR_EL1", .state = ARM_CP_STATE_AA64,
-     .opc0 = 3, .opc1 = 0, .crn = 1, .crm = 2, .opc2 = 0,
--    .access = PL1_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
-+    .access = PL1_RW, .type = ARM_CP_SVE,
-     .fieldoffset = offsetof(CPUARMState, vfp.zcr_el[1]),
-     .writefn = zcr_write, .raw_writefn = raw_write
- };
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo zcr_el1_reginfo = {
- static const ARMCPRegInfo zcr_el2_reginfo = {
-     .name = "ZCR_EL2", .state = ARM_CP_STATE_AA64,
-     .opc0 = 3, .opc1 = 4, .crn = 1, .crm = 2, .opc2 = 0,
--    .access = PL2_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
-+    .access = PL2_RW, .type = ARM_CP_SVE,
-     .fieldoffset = offsetof(CPUARMState, vfp.zcr_el[2]),
-     .writefn = zcr_write, .raw_writefn = raw_write
- };
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo zcr_el2_reginfo = {
- static const ARMCPRegInfo zcr_no_el2_reginfo = {
-     .name = "ZCR_EL2", .state = ARM_CP_STATE_AA64,
-     .opc0 = 3, .opc1 = 4, .crn = 1, .crm = 2, .opc2 = 0,
--    .access = PL2_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
-+    .access = PL2_RW, .type = ARM_CP_SVE,
-     .readfn = arm_cp_read_zero, .writefn = arm_cp_write_ignore
- };
- static const ARMCPRegInfo zcr_el3_reginfo = {
-     .name = "ZCR_EL3", .state = ARM_CP_STATE_AA64,
-     .opc0 = 3, .opc1 = 6, .crn = 1, .crm = 2, .opc2 = 0,
--    .access = PL3_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
-+    .access = PL3_RW, .type = ARM_CP_SVE,
-     .fieldoffset = offsetof(CPUARMState, vfp.zcr_el[3]),
-     .writefn = zcr_write, .raw_writefn = raw_write
- };
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void handle_sys(DisasContext *s, uint32_t insn, bool isread,
+@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
-     default:
+ {
-         break;
+     DisasContext *s = container_of(dcbase, DisasContext, base);
      CPUARMState *env = cpu->env_ptr;
 +    uint64_t pc = s->base.pc_next;
      uint32_t insn;
      if (s->ss_active && !s->pstate_ss) {
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
          return;
      }
--    if ((ri->type & ARM_CP_SVE) && !sve_access_check(s)) {
--        return;
+-    s->pc_curr = s->base.pc_next;
--    }
+-    insn = arm_ldl_code(env, &s->base, s->base.pc_next, s->sctlr_b);
-     if ((ri->type & ARM_CP_FPU) && !fp_access_check(s)) {
++    s->pc_curr = pc;
-         return;
++    insn = arm_ldl_code(env, &s->base, pc, s->sctlr_b);
-+    } else if ((ri->type & ARM_CP_SVE) && !sve_access_check(s)) {
+     s->insn = insn;
-+        return;
+-    s->base.pc_next += 4;
-     }
++    s->base.pc_next = pc + 4;
-     if ((tb_cflags(s->base.tb) & CF_USE_ICOUNT) && (ri->type & ARM_CP_IO)) {
+     s->fp_access_checked = false;
      s->sve_access_checked = false;
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 19/55] target/arm: Implement SVE gather loads
+[PULL 10/33] target/arm: Hoist pc_next to a local variable in arm_tr_translate_insn
 From: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Message-id: 20180627043328.11531-14-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    |  67 +++++++++++++++++++++++++
+ target/arm/translate.c | 9 +++++----
- target/arm/sve_helper.c    |  77 ++++++++++++++++++++++++++++
+file changed, 5 insertions(+), 4 deletions(-)
  target/arm/translate-sve.c | 100 +++++++++++++++++++++++++++++++++++++
  target/arm/sve.decode      |  57 +++++++++++++++++++++
 files changed, 301 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/target/arm/translate.c
-+++ b/target/arm/helper-sve.h
++++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_st1hd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+@@ -XXX,XX +XXX,XX @@ static void arm_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
+ {
- DEF_HELPER_FLAGS_4(sve_st1sd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+     DisasContext *dc = container_of(dcbase, DisasContext, base);
+     CPUARMState *env = cpu->env_ptr;
-+DEF_HELPER_FLAGS_6(sve_ldbsu_zsu, TCG_CALL_NO_WG,
++    uint32_t pc = dc->base.pc_next;
-+                   void, env, ptr, ptr, ptr, tl, i32)
+     unsigned int insn;
-+DEF_HELPER_FLAGS_6(sve_ldhsu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
+     if (arm_pre_translate_insn(dc)) {
-+DEF_HELPER_FLAGS_6(sve_ldssu_zsu, TCG_CALL_NO_WG,
+-        dc->base.pc_next += 4;
-+                   void, env, ptr, ptr, ptr, tl, i32)
++        dc->base.pc_next = pc + 4;
-+DEF_HELPER_FLAGS_6(sve_ldbss_zsu, TCG_CALL_NO_WG,
+         return;
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhss_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +
 +DEF_HELPER_FLAGS_6(sve_ldbsu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhsu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldssu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldbss_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhss_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +
 +DEF_HELPER_FLAGS_6(sve_ldbdu_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhdu_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldsdu_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldddu_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldbds_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhds_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldsds_zsu, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +
 +DEF_HELPER_FLAGS_6(sve_ldbdu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhdu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldsdu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldddu_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldbds_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhds_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldsds_zss, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +
 +DEF_HELPER_FLAGS_6(sve_ldbdu_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhdu_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldsdu_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldddu_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldbds_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldhds_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +DEF_HELPER_FLAGS_6(sve_ldsds_zd, TCG_CALL_NO_WG,
 +                   void, env, ptr, ptr, ptr, tl, i32)
 +
  DEF_HELPER_FLAGS_6(sve_stbs_zsu, TCG_CALL_NO_WG,
                     void, env, ptr, ptr, ptr, tl, i32)
  DEF_HELPER_FLAGS_6(sve_sths_zsu, TCG_CALL_NO_WG,
 diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_st4dd_r)(CPUARMState *env, void *vg,
      }
- }
+-    dc->pc_curr = dc->base.pc_next;
-+/* Loads with a vector index.  */
+-    insn = arm_ldl_code(env, &dc->base, dc->base.pc_next, dc->sctlr_b);
-+
++    dc->pc_curr = pc;
-+#define DO_LD1_ZPZ_S(NAME, TYPEI, TYPEM, FN)                            \
++    insn = arm_ldl_code(env, &dc->base, pc, dc->sctlr_b);
-+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
+     dc->insn = insn;
-+                  target_ulong base, uint32_t desc)                     \
+-    dc->base.pc_next += 4;
-+{                                                                       \
++    dc->base.pc_next = pc + 4;
-+    intptr_t i, oprsz = simd_oprsz(desc);                               \
+     disas_arm_insn(dc, insn);
-+    unsigned scale = simd_data(desc);                                   \
-+    uintptr_t ra = GETPC();                                             \
+     arm_post_translate_insn(dc);
 +    for (i = 0; i < oprsz; i++) {                                       \
 +        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
 +        do {                                                            \
 +            TYPEM m = 0;                                                \
 +            if (pg & 1) {                                               \
 +                target_ulong off = *(TYPEI *)(vm + H1_4(i));            \
 +                m = FN(env, base + (off << scale), ra);                 \
 +            }                                                           \
 +            *(uint32_t *)(vd + H1_4(i)) = m;                            \
 +            i += 4, pg >>= 4;                                           \
 +        } while (i & 15);                                               \
 +    }                                                                   \
 +}
 +
 +#define DO_LD1_ZPZ_D(NAME, TYPEI, TYPEM, FN)                            \
 +void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
 +                  target_ulong base, uint32_t desc)                     \
 +{                                                                       \
 +    intptr_t i, oprsz = simd_oprsz(desc) / 8;                           \
 +    unsigned scale = simd_data(desc);                                   \
 +    uintptr_t ra = GETPC();                                             \
 +    uint64_t *d = vd, *m = vm; uint8_t *pg = vg;                        \
 +    for (i = 0; i < oprsz; i++) {                                       \
 +        TYPEM mm = 0;                                                   \
 +        if (pg[H1(i)] & 1) {                                            \
 +            target_ulong off = (TYPEI)m[i];                             \
 +            mm = FN(env, base + (off << scale), ra);                    \
 +        }                                                               \
 +        d[i] = mm;                                                      \
 +    }                                                                   \
 +}
 +
 +DO_LD1_ZPZ_S(sve_ldbsu_zsu, uint32_t, uint8_t,  cpu_ldub_data_ra)
 +DO_LD1_ZPZ_S(sve_ldhsu_zsu, uint32_t, uint16_t, cpu_lduw_data_ra)
 +DO_LD1_ZPZ_S(sve_ldssu_zsu, uint32_t, uint32_t, cpu_ldl_data_ra)
 +DO_LD1_ZPZ_S(sve_ldbss_zsu, uint32_t, int8_t,   cpu_ldub_data_ra)
 +DO_LD1_ZPZ_S(sve_ldhss_zsu, uint32_t, int16_t,  cpu_lduw_data_ra)
 +
 +DO_LD1_ZPZ_S(sve_ldbsu_zss, int32_t, uint8_t,  cpu_ldub_data_ra)
 +DO_LD1_ZPZ_S(sve_ldhsu_zss, int32_t, uint16_t, cpu_lduw_data_ra)
 +DO_LD1_ZPZ_S(sve_ldssu_zss, int32_t, uint32_t, cpu_ldl_data_ra)
 +DO_LD1_ZPZ_S(sve_ldbss_zss, int32_t, int8_t,   cpu_ldub_data_ra)
 +DO_LD1_ZPZ_S(sve_ldhss_zss, int32_t, int16_t,  cpu_lduw_data_ra)
 +
 +DO_LD1_ZPZ_D(sve_ldbdu_zsu, uint32_t, uint8_t,  cpu_ldub_data_ra)
 +DO_LD1_ZPZ_D(sve_ldhdu_zsu, uint32_t, uint16_t, cpu_lduw_data_ra)
 +DO_LD1_ZPZ_D(sve_ldsdu_zsu, uint32_t, uint32_t, cpu_ldl_data_ra)
 +DO_LD1_ZPZ_D(sve_ldddu_zsu, uint32_t, uint64_t, cpu_ldq_data_ra)
 +DO_LD1_ZPZ_D(sve_ldbds_zsu, uint32_t, int8_t,   cpu_ldub_data_ra)
 +DO_LD1_ZPZ_D(sve_ldhds_zsu, uint32_t, int16_t,  cpu_lduw_data_ra)
 +DO_LD1_ZPZ_D(sve_ldsds_zsu, uint32_t, int32_t,  cpu_ldl_data_ra)
 +
 +DO_LD1_ZPZ_D(sve_ldbdu_zss, int32_t, uint8_t,  cpu_ldub_data_ra)
 +DO_LD1_ZPZ_D(sve_ldhdu_zss, int32_t, uint16_t, cpu_lduw_data_ra)
 +DO_LD1_ZPZ_D(sve_ldsdu_zss, int32_t, uint32_t, cpu_ldl_data_ra)
 +DO_LD1_ZPZ_D(sve_ldddu_zss, int32_t, uint64_t, cpu_ldq_data_ra)
 +DO_LD1_ZPZ_D(sve_ldbds_zss, int32_t, int8_t,   cpu_ldub_data_ra)
 +DO_LD1_ZPZ_D(sve_ldhds_zss, int32_t, int16_t,  cpu_lduw_data_ra)
 +DO_LD1_ZPZ_D(sve_ldsds_zss, int32_t, int32_t,  cpu_ldl_data_ra)
 +
 +DO_LD1_ZPZ_D(sve_ldbdu_zd, uint64_t, uint8_t,  cpu_ldub_data_ra)
 +DO_LD1_ZPZ_D(sve_ldhdu_zd, uint64_t, uint16_t, cpu_lduw_data_ra)
 +DO_LD1_ZPZ_D(sve_ldsdu_zd, uint64_t, uint32_t, cpu_ldl_data_ra)
 +DO_LD1_ZPZ_D(sve_ldddu_zd, uint64_t, uint64_t, cpu_ldq_data_ra)
 +DO_LD1_ZPZ_D(sve_ldbds_zd, uint64_t, int8_t,   cpu_ldub_data_ra)
 +DO_LD1_ZPZ_D(sve_ldhds_zd, uint64_t, int16_t,  cpu_lduw_data_ra)
 +DO_LD1_ZPZ_D(sve_ldsds_zd, uint64_t, int32_t,  cpu_ldl_data_ra)
 +
  /* Stores with a vector index.  */
  #define DO_ST1_ZPZ_S(NAME, TYPEI, FN)                                   \
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void do_mem_zpz(DisasContext *s, int zt, int pg, int zm, int scale,
      tcg_temp_free_i32(desc);
  }
 +/* Indexed by [ff][xs][u][msz].  */
 +static gen_helper_gvec_mem_scatter * const gather_load_fn32[2][2][2][3] = {
 +    { { { gen_helper_sve_ldbss_zsu,
 +          gen_helper_sve_ldhss_zsu,
 +          NULL, },
 +        { gen_helper_sve_ldbsu_zsu,
 +          gen_helper_sve_ldhsu_zsu,
 +          gen_helper_sve_ldssu_zsu, } },
 +      { { gen_helper_sve_ldbss_zss,
 +          gen_helper_sve_ldhss_zss,
 +          NULL, },
 +        { gen_helper_sve_ldbsu_zss,
 +          gen_helper_sve_ldhsu_zss,
 +          gen_helper_sve_ldssu_zss, } } },
 +    /* TODO fill in first-fault handlers */
 +};
 +
 +/* Note that we overload xs=2 to indicate 64-bit offset.  */
 +static gen_helper_gvec_mem_scatter * const gather_load_fn64[2][3][2][4] = {
 +    { { { gen_helper_sve_ldbds_zsu,
 +          gen_helper_sve_ldhds_zsu,
 +          gen_helper_sve_ldsds_zsu,
 +          NULL, },
 +        { gen_helper_sve_ldbdu_zsu,
 +          gen_helper_sve_ldhdu_zsu,
 +          gen_helper_sve_ldsdu_zsu,
 +          gen_helper_sve_ldddu_zsu, } },
 +      { { gen_helper_sve_ldbds_zss,
 +          gen_helper_sve_ldhds_zss,
 +          gen_helper_sve_ldsds_zss,
 +          NULL, },
 +        { gen_helper_sve_ldbdu_zss,
 +          gen_helper_sve_ldhdu_zss,
 +          gen_helper_sve_ldsdu_zss,
 +          gen_helper_sve_ldddu_zss, } },
 +      { { gen_helper_sve_ldbds_zd,
 +          gen_helper_sve_ldhds_zd,
 +          gen_helper_sve_ldsds_zd,
 +          NULL, },
 +        { gen_helper_sve_ldbdu_zd,
 +          gen_helper_sve_ldhdu_zd,
 +          gen_helper_sve_ldsdu_zd,
 +          gen_helper_sve_ldddu_zd, } } },
 +    /* TODO fill in first-fault handlers */
 +};
 +
 +static bool trans_LD1_zprz(DisasContext *s, arg_LD1_zprz *a, uint32_t insn)
 +{
 +    gen_helper_gvec_mem_scatter *fn = NULL;
 +
 +    if (!sve_access_check(s)) {
 +        return true;
 +    }
 +
 +    switch (a->esz) {
 +    case MO_32:
 +        fn = gather_load_fn32[a->ff][a->xs][a->u][a->msz];
 +        break;
 +    case MO_64:
 +        fn = gather_load_fn64[a->ff][a->xs][a->u][a->msz];
 +        break;
 +    }
 +    assert(fn != NULL);
 +
 +    do_mem_zpz(s, a->rd, a->pg, a->rm, a->scale * a->msz,
 +               cpu_reg_sp(s, a->rn), fn);
 +    return true;
 +}
 +
 +static bool trans_LD1_zpiz(DisasContext *s, arg_LD1_zpiz *a, uint32_t insn)
 +{
 +    gen_helper_gvec_mem_scatter *fn = NULL;
 +    TCGv_i64 imm;
 +
 +    if (a->esz < a->msz || (a->esz == a->msz && !a->u)) {
 +        return false;
 +    }
 +    if (!sve_access_check(s)) {
 +        return true;
 +    }
 +
 +    switch (a->esz) {
 +    case MO_32:
 +        fn = gather_load_fn32[a->ff][0][a->u][a->msz];
 +        break;
 +    case MO_64:
 +        fn = gather_load_fn64[a->ff][2][a->u][a->msz];
 +        break;
 +    }
 +    assert(fn != NULL);
 +
 +    /* Treat LD1_zpiz (zn[x] + imm) the same way as LD1_zprz (rn + zm[x])
 +     * by loading the immediate into the scalar parameter.
 +     */
 +    imm = tcg_const_i64(a->imm << a->msz);
 +    do_mem_zpz(s, a->rd, a->pg, a->rn, 0, imm, fn);
 +    tcg_temp_free_i64(imm);
 +    return true;
 +}
 +
  static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
  {
      /* Indexed by [xs][msz].  */
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
  &rpri_load      rd pg rn imm dtype nreg
  &rprr_store     rd pg rn rm msz esz nreg
  &rpri_store     rd pg rn imm msz esz nreg
 +&rprr_gather_load       rd pg rn rm esz msz u ff xs scale
 +&rpri_gather_load       rd pg rn imm esz msz u ff
  &rprr_scatter_store     rd pg rn rm esz msz xs scale
  ###########################################################################
@@ -XXX,XX +XXX,XX @@
  @rpri_load_msz  ....... .... . imm:s4 ... pg:3 rn:5 rd:5 \
                  &rpri_load dtype=%msz_dtype
 +# Gather Loads.
 +@rprr_g_load_u        ....... .. .    . rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
 +                      &rprr_gather_load xs=2
 +@rprr_g_load_xs_u     ....... .. xs:1 . rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
 +                      &rprr_gather_load
 +@rprr_g_load_xs_u_sc  ....... .. xs:1 scale:1 rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
 +                      &rprr_gather_load
 +@rprr_g_load_xs_sc    ....... .. xs:1 scale:1 rm:5 . . ff:1 pg:3 rn:5 rd:5 \
 +                      &rprr_gather_load
 +@rprr_g_load_u_sc     ....... .. .    scale:1 rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
 +                      &rprr_gather_load xs=2
 +@rprr_g_load_sc       ....... .. .    scale:1 rm:5 . . ff:1 pg:3 rn:5 rd:5 \
 +                      &rprr_gather_load xs=2
 +@rpri_g_load          ....... msz:2 .. imm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
 +                      &rpri_gather_load
 +
  # Stores; user must fill in ESZ, MSZ, NREG as needed.
  @rprr_store         ....... ..    ..     rm:5 ... pg:3 rn:5 rd:5    &rprr_store
  @rpri_store_msz     ....... msz:2 .. . imm:s4 ... pg:3 rn:5 rd:5    &rpri_store
@@ -XXX,XX +XXX,XX @@ LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
  LD1R_zpri       1000010 .. 1 imm:6 1.. pg:3 rn:5 rd:5 \
                  &rpri_load dtype=%dtype_23_13 nreg=0
 +# SVE 32-bit gather load (scalar plus 32-bit unscaled offsets)
 +# SVE 32-bit gather load (scalar plus 32-bit scaled offsets)
 +LD1_zprz        1000010 00 .0 ..... 0.. ... ..... ..... \
 +                @rprr_g_load_xs_u esz=2 msz=0 scale=0
 +LD1_zprz        1000010 01 .. ..... 0.. ... ..... ..... \
 +                @rprr_g_load_xs_u_sc esz=2 msz=1
 +LD1_zprz        1000010 10 .. ..... 01. ... ..... ..... \
 +                @rprr_g_load_xs_sc esz=2 msz=2 u=1
 +
 +# SVE 32-bit gather load (vector plus immediate)
 +LD1_zpiz        1000010 .. 01 ..... 1.. ... ..... ..... \
 +                @rpri_g_load esz=2
 +
  ### SVE Memory Contiguous Load Group
  # SVE contiguous load (scalar plus scalar)
@@ -XXX,XX +XXX,XX @@ PRF_rr          1000010 -- 00 rm:5 110 --- ----- 0 ----
  ### SVE Memory 64-bit Gather Group
 +# SVE 64-bit gather load (scalar plus 32-bit unpacked unscaled offsets)
 +# SVE 64-bit gather load (scalar plus 32-bit unpacked scaled offsets)
 +LD1_zprz        1100010 00 .0 ..... 0.. ... ..... ..... \
 +                @rprr_g_load_xs_u esz=3 msz=0 scale=0
 +LD1_zprz        1100010 01 .. ..... 0.. ... ..... ..... \
 +                @rprr_g_load_xs_u_sc esz=3 msz=1
 +LD1_zprz        1100010 10 .. ..... 0.. ... ..... ..... \
 +                @rprr_g_load_xs_u_sc esz=3 msz=2
 +LD1_zprz        1100010 11 .. ..... 01. ... ..... ..... \
 +                @rprr_g_load_xs_sc esz=3 msz=3 u=1
 +
 +# SVE 64-bit gather load (scalar plus 64-bit unscaled offsets)
 +# SVE 64-bit gather load (scalar plus 64-bit scaled offsets)
 +LD1_zprz        1100010 00 10 ..... 1.. ... ..... ..... \
 +                @rprr_g_load_u esz=3 msz=0 scale=0
 +LD1_zprz        1100010 01 1. ..... 1.. ... ..... ..... \
 +                @rprr_g_load_u_sc esz=3 msz=1
 +LD1_zprz        1100010 10 1. ..... 1.. ... ..... ..... \
 +                @rprr_g_load_u_sc esz=3 msz=2
 +LD1_zprz        1100010 11 1. ..... 11. ... ..... ..... \
 +                @rprr_g_load_sc esz=3 msz=3 u=1
 +
 +# SVE 64-bit gather load (vector plus immediate)
 +LD1_zpiz        1100010 .. 01 ..... 1.. ... ..... ..... \
 +                @rpri_g_load esz=3
 +
  # SVE 64-bit gather prefetch (scalar plus 64-bit scaled offsets)
  PRF             1100010 00 11 ----- 1-- --- ----- 0 ----
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 13/55] target/arm: Implement SVE FP Multiply-Add Group
+[PULL 11/33] target/arm: Hoist pc_next to a local variable in thumb_tr_translate_insn
 From: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Message-id: 20180627043328.11531-8-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    |  16 ++++
+ target/arm/translate.c | 16 ++++++++--------
- target/arm/sve_helper.c    | 158 +++++++++++++++++++++++++++++++++++++
+file changed, 8 insertions(+), 8 deletions(-)
  target/arm/translate-sve.c |  49 ++++++++++++
  target/arm/sve.decode      |  18 +++++
 files changed, 241 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/target/arm/translate.c
-+++ b/target/arm/helper-sve.h
++++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve_ucvt_ds, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ static void thumb_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
- DEF_HELPER_FLAGS_5(sve_ucvt_dd, TCG_CALL_NO_RWG,
+ {
-                    void, ptr, ptr, ptr, ptr, i32)
+     DisasContext *dc = container_of(dcbase, DisasContext, base);
+     CPUARMState *env = cpu->env_ptr;
-+DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
++    uint32_t pc = dc->base.pc_next;
-+DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
+     uint32_t insn;
-+DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
+     bool is_16bit;
-+
-+DEF_HELPER_FLAGS_3(sve_fmls_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
+     if (arm_pre_translate_insn(dc)) {
-+DEF_HELPER_FLAGS_3(sve_fmls_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
+-        dc->base.pc_next += 2;
-+DEF_HELPER_FLAGS_3(sve_fmls_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
++        dc->base.pc_next = pc + 2;
-+
+         return;
-+DEF_HELPER_FLAGS_3(sve_fnmla_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
+     }
-+DEF_HELPER_FLAGS_3(sve_fnmla_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
-+DEF_HELPER_FLAGS_3(sve_fnmla_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
+-    dc->pc_curr = dc->base.pc_next;
-+
+-    insn = arm_lduw_code(env, &dc->base, dc->base.pc_next, dc->sctlr_b);
-+DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
++    dc->pc_curr = pc;
-+DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
++    insn = arm_lduw_code(env, &dc->base, pc, dc->sctlr_b);
-+DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
+     is_16bit = thumb_insn_is_16bit(dc, dc->base.pc_next, insn);
-+
+-    dc->base.pc_next += 2;
- DEF_HELPER_FLAGS_4(sve_ld1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
++    pc += 2;
- DEF_HELPER_FLAGS_4(sve_ld2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+     if (!is_16bit) {
- DEF_HELPER_FLAGS_4(sve_ld3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+-        uint32_t insn2 = arm_lduw_code(env, &dc->base, dc->base.pc_next,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
+-                                       dc->sctlr_b);
-index XXXXXXX..XXXXXXX 100644
+-
---- a/target/arm/sve_helper.c
++        uint32_t insn2 = arm_lduw_code(env, &dc->base, pc, dc->sctlr_b);
-+++ b/target/arm/sve_helper.c
+         insn = insn << 16 | insn2;
-@@ -XXX,XX +XXX,XX @@ DO_ZPZ_FP(sve_ucvt_dd, uint64_t,     , uint64_to_float64)
+-        dc->base.pc_next += 2;
++        pc += 2;
- #undef DO_ZPZ_FP
+     }
++    dc->base.pc_next = pc;
-+/* 4-operand predicated multiply-add.  This requires 7 operands to pass
+     dc->insn = insn;
-+ * "properly", so we need to encode some of the registers into DESC.
-+ */
+     if (dc->pstate_il) {
 +QEMU_BUILD_BUG_ON(SIMD_DATA_SHIFT + 20 > 32);
 +
 +static void do_fmla_zpzzz_h(CPUARMState *env, void *vg, uint32_t desc,
 +                            uint16_t neg1, uint16_t neg3)
 +{
 +    intptr_t i = simd_oprsz(desc);
 +    unsigned rd = extract32(desc, SIMD_DATA_SHIFT, 5);
 +    unsigned rn = extract32(desc, SIMD_DATA_SHIFT + 5, 5);
 +    unsigned rm = extract32(desc, SIMD_DATA_SHIFT + 10, 5);
 +    unsigned ra = extract32(desc, SIMD_DATA_SHIFT + 15, 5);
 +    void *vd = &env->vfp.zregs[rd];
 +    void *vn = &env->vfp.zregs[rn];
 +    void *vm = &env->vfp.zregs[rm];
 +    void *va = &env->vfp.zregs[ra];
 +    uint64_t *g = vg;
 +
 +    do {
 +        uint64_t pg = g[(i - 1) >> 6];
 +        do {
 +            i -= 2;
 +            if (likely((pg >> (i & 63)) & 1)) {
 +                float16 e1, e2, e3, r;
 +
 +                e1 = *(uint16_t *)(vn + H1_2(i)) ^ neg1;
 +                e2 = *(uint16_t *)(vm + H1_2(i));
 +                e3 = *(uint16_t *)(va + H1_2(i)) ^ neg3;
 +                r = float16_muladd(e1, e2, e3, 0, &env->vfp.fp_status);
 +                *(uint16_t *)(vd + H1_2(i)) = r;
 +            }
 +        } while (i & 63);
 +    } while (i != 0);
 +}
 +
 +void HELPER(sve_fmla_zpzzz_h)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_h(env, vg, desc, 0, 0);
 +}
 +
 +void HELPER(sve_fmls_zpzzz_h)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_h(env, vg, desc, 0x8000, 0);
 +}
 +
 +void HELPER(sve_fnmla_zpzzz_h)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_h(env, vg, desc, 0x8000, 0x8000);
 +}
 +
 +void HELPER(sve_fnmls_zpzzz_h)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_h(env, vg, desc, 0, 0x8000);
 +}
 +
 +static void do_fmla_zpzzz_s(CPUARMState *env, void *vg, uint32_t desc,
 +                            uint32_t neg1, uint32_t neg3)
 +{
 +    intptr_t i = simd_oprsz(desc);
 +    unsigned rd = extract32(desc, SIMD_DATA_SHIFT, 5);
 +    unsigned rn = extract32(desc, SIMD_DATA_SHIFT + 5, 5);
 +    unsigned rm = extract32(desc, SIMD_DATA_SHIFT + 10, 5);
 +    unsigned ra = extract32(desc, SIMD_DATA_SHIFT + 15, 5);
 +    void *vd = &env->vfp.zregs[rd];
 +    void *vn = &env->vfp.zregs[rn];
 +    void *vm = &env->vfp.zregs[rm];
 +    void *va = &env->vfp.zregs[ra];
 +    uint64_t *g = vg;
 +
 +    do {
 +        uint64_t pg = g[(i - 1) >> 6];
 +        do {
 +            i -= 4;
 +            if (likely((pg >> (i & 63)) & 1)) {
 +                float32 e1, e2, e3, r;
 +
 +                e1 = *(uint32_t *)(vn + H1_4(i)) ^ neg1;
 +                e2 = *(uint32_t *)(vm + H1_4(i));
 +                e3 = *(uint32_t *)(va + H1_4(i)) ^ neg3;
 +                r = float32_muladd(e1, e2, e3, 0, &env->vfp.fp_status);
 +                *(uint32_t *)(vd + H1_4(i)) = r;
 +            }
 +        } while (i & 63);
 +    } while (i != 0);
 +}
 +
 +void HELPER(sve_fmla_zpzzz_s)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_s(env, vg, desc, 0, 0);
 +}
 +
 +void HELPER(sve_fmls_zpzzz_s)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_s(env, vg, desc, 0x80000000, 0);
 +}
 +
 +void HELPER(sve_fnmla_zpzzz_s)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_s(env, vg, desc, 0x80000000, 0x80000000);
 +}
 +
 +void HELPER(sve_fnmls_zpzzz_s)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_s(env, vg, desc, 0, 0x80000000);
 +}
 +
 +static void do_fmla_zpzzz_d(CPUARMState *env, void *vg, uint32_t desc,
 +                            uint64_t neg1, uint64_t neg3)
 +{
 +    intptr_t i = simd_oprsz(desc);
 +    unsigned rd = extract32(desc, SIMD_DATA_SHIFT, 5);
 +    unsigned rn = extract32(desc, SIMD_DATA_SHIFT + 5, 5);
 +    unsigned rm = extract32(desc, SIMD_DATA_SHIFT + 10, 5);
 +    unsigned ra = extract32(desc, SIMD_DATA_SHIFT + 15, 5);
 +    void *vd = &env->vfp.zregs[rd];
 +    void *vn = &env->vfp.zregs[rn];
 +    void *vm = &env->vfp.zregs[rm];
 +    void *va = &env->vfp.zregs[ra];
 +    uint64_t *g = vg;
 +
 +    do {
 +        uint64_t pg = g[(i - 1) >> 6];
 +        do {
 +            i -= 8;
 +            if (likely((pg >> (i & 63)) & 1)) {
 +                float64 e1, e2, e3, r;
 +
 +                e1 = *(uint64_t *)(vn + i) ^ neg1;
 +                e2 = *(uint64_t *)(vm + i);
 +                e3 = *(uint64_t *)(va + i) ^ neg3;
 +                r = float64_muladd(e1, e2, e3, 0, &env->vfp.fp_status);
 +                *(uint64_t *)(vd + i) = r;
 +            }
 +        } while (i & 63);
 +    } while (i != 0);
 +}
 +
 +void HELPER(sve_fmla_zpzzz_d)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_d(env, vg, desc, 0, 0);
 +}
 +
 +void HELPER(sve_fmls_zpzzz_d)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_d(env, vg, desc, INT64_MIN, 0);
 +}
 +
 +void HELPER(sve_fnmla_zpzzz_d)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_d(env, vg, desc, INT64_MIN, INT64_MIN);
 +}
 +
 +void HELPER(sve_fnmls_zpzzz_d)(CPUARMState *env, void *vg, uint32_t desc)
 +{
 +    do_fmla_zpzzz_d(env, vg, desc, 0, INT64_MIN);
 +}
 +
  /*
   * Load contiguous data, protected by a governing predicate.
   */
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_FP3(FMULX, fmulx)
  #undef DO_FP3
 +typedef void gen_helper_sve_fmla(TCGv_env, TCGv_ptr, TCGv_i32);
 +
 +static bool do_fmla(DisasContext *s, arg_rprrr_esz *a, gen_helper_sve_fmla *fn)
 +{
 +    if (fn == NULL) {
 +        return false;
 +    }
 +    if (!sve_access_check(s)) {
 +        return true;
 +    }
 +
 +    unsigned vsz = vec_full_reg_size(s);
 +    unsigned desc;
 +    TCGv_i32 t_desc;
 +    TCGv_ptr pg = tcg_temp_new_ptr();
 +
 +    /* We would need 7 operands to pass these arguments "properly".
 +     * So we encode all the register numbers into the descriptor.
 +     */
 +    desc = deposit32(a->rd, 5, 5, a->rn);
 +    desc = deposit32(desc, 10, 5, a->rm);
 +    desc = deposit32(desc, 15, 5, a->ra);
 +    desc = simd_desc(vsz, vsz, desc);
 +
 +    t_desc = tcg_const_i32(desc);
 +    tcg_gen_addi_ptr(pg, cpu_env, pred_full_reg_offset(s, a->pg));
 +    fn(cpu_env, pg, t_desc);
 +    tcg_temp_free_i32(t_desc);
 +    tcg_temp_free_ptr(pg);
 +    return true;
 +}
 +
 +#define DO_FMLA(NAME, name) \
 +static bool trans_##NAME(DisasContext *s, arg_rprrr_esz *a, uint32_t insn) \
 +{                                                                    \
 +    static gen_helper_sve_fmla * const fns[4] = {                    \
 +        NULL, gen_helper_sve_##name##_h,                             \
 +        gen_helper_sve_##name##_s, gen_helper_sve_##name##_d         \
 +    };                                                               \
 +    return do_fmla(s, a, fns[a->esz]);                               \
 +}
 +
 +DO_FMLA(FMLA_zpzzz, fmla_zpzzz)
 +DO_FMLA(FMLS_zpzzz, fmls_zpzzz)
 +DO_FMLA(FNMLA_zpzzz, fnmla_zpzzz)
 +DO_FMLA(FNMLS_zpzzz, fnmls_zpzzz)
 +
 +#undef DO_FMLA
 +
  /*
   *** SVE Floating Point Unary Operations Predicated Group
   */
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
                  &rprrr_esz ra=%reg_movprfx
  @rdn_pg_ra_rm   ........ esz:2 . rm:5  ... pg:3 ra:5 rd:5 \
                  &rprrr_esz rn=%reg_movprfx
 +@rdn_pg_rm_ra   ........ esz:2 . ra:5  ... pg:3 rm:5 rd:5 \
 +                &rprrr_esz rn=%reg_movprfx
  # One register operand, with governing predicate, vector element size
  @rd_pg_rn       ........ esz:2 ... ... ... pg:3 rn:5 rd:5       &rpr_esz
@@ -XXX,XX +XXX,XX @@ FMULX           01100101 .. 00 1010 100 ... ..... .....    @rdn_pg_rm
  FDIV            01100101 .. 00 1100 100 ... ..... .....    @rdm_pg_rn # FDIVR
  FDIV            01100101 .. 00 1101 100 ... ..... .....    @rdn_pg_rm
 +### SVE FP Multiply-Add Group
 +
 +# SVE floating-point multiply-accumulate writing addend
 +FMLA_zpzzz      01100101 .. 1 ..... 000 ... ..... .....         @rda_pg_rn_rm
 +FMLS_zpzzz      01100101 .. 1 ..... 001 ... ..... .....         @rda_pg_rn_rm
 +FNMLA_zpzzz     01100101 .. 1 ..... 010 ... ..... .....         @rda_pg_rn_rm
 +FNMLS_zpzzz     01100101 .. 1 ..... 011 ... ..... .....         @rda_pg_rn_rm
 +
 +# SVE floating-point multiply-accumulate writing multiplicand
 +# Alter the operand extraction order and reuse the helpers from above.
 +# FMAD, FMSB, FNMAD, FNMS
 +FMLA_zpzzz      01100101 .. 1 ..... 100 ... ..... .....         @rdn_pg_rm_ra
 +FMLS_zpzzz      01100101 .. 1 ..... 101 ... ..... .....         @rdn_pg_rm_ra
 +FNMLA_zpzzz     01100101 .. 1 ..... 110 ... ..... .....         @rdn_pg_rm_ra
 +FNMLS_zpzzz     01100101 .. 1 ..... 111 ... ..... .....         @rdn_pg_rm_ra
 +
  ### SVE FP Unary Operations Predicated Group
  # SVE integer convert to floating-point
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 55/55] target/arm: Add ID_ISAR6
+[PULL 12/33] target/arm: Split arm_pre_translate_insn
 From: Richard Henderson <richard.henderson@linaro.org>
-This register was added to aa32 state by ARMv8.2.
+Create arm_check_ss_active and arm_check_kernelpage.
 Reverse the order of the tests.  While it doesn't matter in practice,
 because only user-only has a kernel page and user-only never sets
 ss_active, ss_active has priority over execution exceptions and it
 is best to keep them in the proper order.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20180629001538.11415-6-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h    | 1 +
+ target/arm/translate.c | 10 +++++++---
- target/arm/cpu.c    | 4 ++++
+file changed, 7 insertions(+), 3 deletions(-)
  target/arm/cpu64.c  | 2 ++
  target/arm/helper.c | 5 ++---
 files changed, 9 insertions(+), 3 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/translate.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
+@@ -XXX,XX +XXX,XX @@ static void arm_tr_insn_start(DisasContextBase *dcbase, CPUState *cpu)
-     uint32_t id_isar3;
+     dc->insn_start = tcg_last_op();
      uint32_t id_isar4;
      uint32_t id_isar5;
 +    uint32_t id_isar6;
      uint64_t id_aa64pfr0;
      uint64_t id_aa64pfr1;
      uint64_t id_aa64dfr0;
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void cortex_m3_initfn(Object *obj)
      cpu->id_isar3 = 0x01111110;
      cpu->id_isar4 = 0x01310102;
      cpu->id_isar5 = 0x00000000;
 +    cpu->id_isar6 = 0x00000000;
  }
- static void cortex_m4_initfn(Object *obj)
+-static bool arm_pre_translate_insn(DisasContext *dc)
-@@ -XXX,XX +XXX,XX @@ static void cortex_m4_initfn(Object *obj)
++static bool arm_check_kernelpage(DisasContext *dc)
-     cpu->id_isar3 = 0x01111110;
+ {
-     cpu->id_isar4 = 0x01310102;
+ #ifdef CONFIG_USER_ONLY
-     cpu->id_isar5 = 0x00000000;
+     /* Intercept jump to the magic kernel page.  */
-+    cpu->id_isar6 = 0x00000000;
+@@ -XXX,XX +XXX,XX @@ static bool arm_pre_translate_insn(DisasContext *dc)
- }
+         return true;
+     }
- static void cortex_m33_initfn(Object *obj)
+ #endif
-@@ -XXX,XX +XXX,XX @@ static void cortex_m33_initfn(Object *obj)
++    return false;
-     cpu->id_isar3 = 0x01111131;
++}
-     cpu->id_isar4 = 0x01310132;
-     cpu->id_isar5 = 0x00000000;
++static bool arm_check_ss_active(DisasContext *dc)
-+    cpu->id_isar6 = 0x00000000;
++{
-     cpu->clidr = 0x00000000;
+     if (dc->ss_active && !dc->pstate_ss) {
-     cpu->ctr = 0x8000c000;
+         /* Singlestep state is Active-pending.
- }
+          * If we're in this state at the start of a TB then either
-@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ static void arm_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
-     cpu->id_isar3 = 0x01112131;
+     uint32_t pc = dc->base.pc_next;
-     cpu->id_isar4 = 0x0010142;
+     unsigned int insn;
-     cpu->id_isar5 = 0x0;
-+    cpu->id_isar6 = 0x0;
+-    if (arm_pre_translate_insn(dc)) {
-     cpu->mp_is_up = true;
++    if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
-     cpu->pmsav7_dregion = 16;
+         dc->base.pc_next = pc + 4;
-     define_arm_cp_regs(cpu, cortexr5_cp_reginfo);
+         return;
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
+     }
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static void thumb_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
---- a/target/arm/cpu64.c
+     uint32_t insn;
-+++ b/target/arm/cpu64.c
+     bool is_16bit;
-@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
-     cpu->id_isar3 = 0x01112131;
+-    if (arm_pre_translate_insn(dc)) {
-     cpu->id_isar4 = 0x00011142;
++    if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
-     cpu->id_isar5 = 0x00011121;
+         dc->base.pc_next = pc + 2;
-+    cpu->id_isar6 = 0;
+         return;
-     cpu->id_aa64pfr0 = 0x00002222;
+     }
      cpu->id_aa64dfr0 = 0x10305106;
      cpu->pmceid0 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
      cpu->id_isar3 = 0x01112131;
      cpu->id_isar4 = 0x00011142;
      cpu->id_isar5 = 0x00011121;
 +    cpu->id_isar6 = 0;
      cpu->id_aa64pfr0 = 0x00002222;
      cpu->id_aa64dfr0 = 0x10305106;
      cpu->id_aa64isar0 = 0x00011120;
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 6,
                .access = PL1_R, .type = ARM_CP_CONST,
                .resetvalue = cpu->id_mmfr4 },
 -            /* 7 is as yet unallocated and must RAZ */
 -            { .name = "ID_ISAR7_RESERVED", .state = ARM_CP_STATE_BOTH,
 +            { .name = "ID_ISAR6", .state = ARM_CP_STATE_BOTH,
                .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 7,
                .access = PL1_R, .type = ARM_CP_CONST,
 -              .resetvalue = 0 },
 +              .resetvalue = cpu->id_isar6 },
              REGINFO_SENTINEL
          };
          define_arm_cp_regs(cpu, v6_idregs);
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 36/55] target/arm: Pass index to AdvSIMD FCMLA (indexed)
+[PULL 13/33] target/arm: Advance pc for arch single-step exception
 From: Richard Henderson <richard.henderson@linaro.org>
-For aa64 advsimd, we had been passing the pre-indexed vector.
+The size of the code covered by a TranslationBlock cannot be 0;
-However, sve applies the index to each 128-bit segment, so we
+this is checked via assert in tb_gen_code.
 need to pass in the index separately.
 For aa32 advsimd, the fp32 operation always has index 0, but
 we failed to interpret the fp16 index correctly.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Message-id: 20180627043328.11531-31-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 21 ++++++++++++---------
+ target/arm/translate-a64.c | 1 +
- target/arm/translate.c     | 32 +++++++++++++++++++++++---------
+file changed, 1 insertion(+)
  target/arm/vec_helper.c    | 10 ++++++----
 files changed, 41 insertions(+), 22 deletions(-)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
-     case 0x13: /* FCMLA #90 */
+         assert(s->base.num_insns == 1);
-     case 0x15: /* FCMLA #180 */
+         gen_swstep_exception(s, 0, 0);
-     case 0x17: /* FCMLA #270 */
+         s->base.is_jmp = DISAS_NORETURN;
--        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
++        s->base.pc_next = pc + 4;
 -                           vec_full_reg_offset(s, rn),
 -                           vec_reg_offset(s, rm, index, size), fpst,
 -                           is_q ? 16 : 8, vec_full_reg_size(s),
 -                           extract32(insn, 13, 2), /* rot */
 -                           size == MO_64
 -                           ? gen_helper_gvec_fcmlas_idx
 -                           : gen_helper_gvec_fcmlah_idx);
 -        tcg_temp_free_ptr(fpst);
 +        {
 +            int rot = extract32(insn, 13, 2);
 +            int data = (index << 2) | rot;
 +            tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
 +                               vec_full_reg_offset(s, rn),
 +                               vec_full_reg_offset(s, rm), fpst,
 +                               is_q ? 16 : 8, vec_full_reg_size(s), data,
 +                               size == MO_64
 +                               ? gen_helper_gvec_fcmlas_idx
 +                               : gen_helper_gvec_fcmlah_idx);
 +            tcg_temp_free_ptr(fpst);
 +        }
          return;
      }
-diff --git a/target/arm/translate.c b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate.c
-+++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
- static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
- {
--    int rd, rn, rm, rot, size, opr_sz;
-+    gen_helper_gvec_3_ptr *fn_gvec_ptr;
-+    int rd, rn, rm, opr_sz, data;
-     TCGv_ptr fpst;
-     bool q;
-     q = extract32(insn, 6, 1);
-     VFP_DREG_D(rd, insn);
-     VFP_DREG_N(rn, insn);
--    VFP_DREG_M(rm, insn);
-     if ((rd | rn) & q) {
-         return 1;
-     }
-     if ((insn & 0xff000f10) == 0xfe000800) {
-         /* VCMLA (indexed) -- 1111 1110 S.RR .... .... 1000 ...0 .... */
--        rot = extract32(insn, 20, 2);
--        size = extract32(insn, 23, 1);
--        if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)
--            || (!size && !arm_dc_feature(s, ARM_FEATURE_V8_FP16))) {
-+        int rot = extract32(insn, 20, 2);
-+        int size = extract32(insn, 23, 1);
-+        int index;
-+
-+        if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)) {
-             return 1;
-         }
-+        if (size == 0) {
-+            if (!arm_dc_feature(s, ARM_FEATURE_V8_FP16)) {
-+                return 1;
-+            }
-+            /* For fp16, rm is just Vm, and index is M.  */
-+            rm = extract32(insn, 0, 4);
-+            index = extract32(insn, 5, 1);
-+        } else {
-+            /* For fp32, rm is the usual M:Vm, and index is 0.  */
-+            VFP_DREG_M(rm, insn);
-+            index = 0;
-+        }
-+        data = (index << 2) | rot;
-+        fn_gvec_ptr = (size ? gen_helper_gvec_fcmlas_idx
-+                       : gen_helper_gvec_fcmlah_idx);
-     } else {
-         return 1;
-     }
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
-     tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
-                        vfp_reg_offset(1, rn),
-                        vfp_reg_offset(1, rm), fpst,
--                       opr_sz, opr_sz, rot,
--                       size ? gen_helper_gvec_fcmlas_idx
--                       : gen_helper_gvec_fcmlah_idx);
-+                       opr_sz, opr_sz, data, fn_gvec_ptr);
-     tcg_temp_free_ptr(fpst);
-     return 0;
- }
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlah_idx)(void *vd, void *vn, void *vm,
-     float_status *fpst = vfpst;
-     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
-     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
-+    intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
-     uint32_t neg_real = flip ^ neg_imag;
-     uintptr_t i;
--    float16 e1 = m[H2(flip)];
--    float16 e3 = m[H2(1 - flip)];
-+    float16 e1 = m[H2(2 * index + flip)];
-+    float16 e3 = m[H2(2 * index + 1 - flip)];
-     /* Shift boolean to the sign bit so we can xor to negate.  */
-     neg_real <<= 15;
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlas_idx)(void *vd, void *vn, void *vm,
-     float_status *fpst = vfpst;
-     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
-     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
-+    intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
-     uint32_t neg_real = flip ^ neg_imag;
-     uintptr_t i;
--    float32 e1 = m[H4(flip)];
--    float32 e3 = m[H4(1 - flip)];
-+    float32 e1 = m[H4(2 * index + flip)];
-+    float32 e3 = m[H4(2 * index + 1 - flip)];
-     /* Shift boolean to the sign bit so we can xor to negate.  */
-     neg_real <<= 31;
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 37/55] target/arm: Implement SVE fp complex multiply add (indexed)
+[PULL 14/33] target/arm: Split compute_fsr_fsc out of arm_deliver_fault
 From: Richard Henderson <richard.henderson@linaro.org>
-Enhance the existing helpers to support SVE, which takes the
+We will reuse this section of arm_deliver_fault for
-index from each 128-bit segment.  The change has no effect
+raising pc alignment faults.
 for AdvSIMD, since there is only one such segment.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Message-id: 20180627043328.11531-32-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-sve.c | 23 ++++++++++++++++++
+ target/arm/tlb_helper.c | 45 +++++++++++++++++++++++++----------------
- target/arm/vec_helper.c    | 50 +++++++++++++++++++++++---------------
+file changed, 28 insertions(+), 17 deletions(-)
  target/arm/sve.decode      |  6 +++++
 files changed, 59 insertions(+), 20 deletions(-)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
+diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
+--- a/target/arm/tlb_helper.c
-+++ b/target/arm/translate-sve.c
++++ b/target/arm/tlb_helper.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_FCMLA_zpzzz(DisasContext *s,
+@@ -XXX,XX +XXX,XX @@ static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
-     return true;
+     return syn;
  }
-+static bool trans_FCMLA_zzxz(DisasContext *s, arg_FCMLA_zzxz *a, uint32_t insn)
+-static void QEMU_NORETURN arm_deliver_fault(ARMCPU *cpu, vaddr addr,
-+{
+-                                            MMUAccessType access_type,
-+    static gen_helper_gvec_3_ptr * const fns[2] = {
+-                                            int mmu_idx, ARMMMUFaultInfo *fi)
-+        gen_helper_gvec_fcmlah_idx,
++static uint32_t compute_fsr_fsc(CPUARMState *env, ARMMMUFaultInfo *fi,
-+        gen_helper_gvec_fcmlas_idx,
++                                int target_el, int mmu_idx, uint32_t *ret_fsc)
-+    };
+ {
-+
+-    CPUARMState *env = &cpu->env;
-+    tcg_debug_assert(a->esz == 1 || a->esz == 2);
+-    int target_el;
-+    tcg_debug_assert(a->rd == a->ra);
+-    bool same_el;
-+    if (sve_access_check(s)) {
+-    uint32_t syn, exc, fsr, fsc;
-+        unsigned vsz = vec_full_reg_size(s);
+     ARMMMUIdx arm_mmu_idx = core_to_arm_mmu_idx(env, mmu_idx);
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
+-
-+        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, a->rd),
+-    target_el = exception_target_el(env);
-+                           vec_full_reg_offset(s, a->rn),
+-    if (fi->stage2) {
-+                           vec_full_reg_offset(s, a->rm),
+-        target_el = 2;
-+                           status, vsz, vsz,
+-        env->cp15.hpfar_el2 = extract64(fi->s2addr, 12, 47) << 4;
-+                           a->index * 4 + a->rot,
+-        if (arm_is_secure_below_el3(env) && fi->s1ns) {
-+                           fns[a->esz - 1]);
+-            env->cp15.hpfar_el2 |= HPFAR_NS;
-+        tcg_temp_free_ptr(status);
+-        }
-+    }
+-    }
-+    return true;
+-    same_el = (arm_current_el(env) == target_el);
 +    uint32_t fsr, fsc;
      if (target_el == 2 || arm_el_is_aa64(env, target_el) ||
          arm_s1_regime_using_lpae_format(env, arm_mmu_idx)) {
@@ -XXX,XX +XXX,XX @@ static void QEMU_NORETURN arm_deliver_fault(ARMCPU *cpu, vaddr addr,
          fsc = 0x3f;
      }
 +    *ret_fsc = fsc;
 +    return fsr;
 +}
 +
- /*
++static void QEMU_NORETURN arm_deliver_fault(ARMCPU *cpu, vaddr addr,
-  *** SVE Floating Point Unary Operations Predicated Group
++                                            MMUAccessType access_type,
-  */
++                                            int mmu_idx, ARMMMUFaultInfo *fi)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++{
-index XXXXXXX..XXXXXXX 100644
++    CPUARMState *env = &cpu->env;
---- a/target/arm/vec_helper.c
++    int target_el;
-+++ b/target/arm/vec_helper.c
++    bool same_el;
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlah_idx)(void *vd, void *vn, void *vm,
++    uint32_t syn, exc, fsr, fsc;
      uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
      intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
      uint32_t neg_real = flip ^ neg_imag;
 -    uintptr_t i;
 -    float16 e1 = m[H2(2 * index + flip)];
 -    float16 e3 = m[H2(2 * index + 1 - flip)];
 +    intptr_t elements = opr_sz / sizeof(float16);
 +    intptr_t eltspersegment = 16 / sizeof(float16);
 +    intptr_t i, j;
      /* Shift boolean to the sign bit so we can xor to negate.  */
      neg_real <<= 15;
      neg_imag <<= 15;
 -    e1 ^= neg_real;
 -    e3 ^= neg_imag;
 -    for (i = 0; i < opr_sz / 2; i += 2) {
 -        float16 e2 = n[H2(i + flip)];
 -        float16 e4 = e2;
 +    for (i = 0; i < elements; i += eltspersegment) {
 +        float16 mr = m[H2(i + 2 * index + 0)];
 +        float16 mi = m[H2(i + 2 * index + 1)];
 +        float16 e1 = neg_real ^ (flip ? mi : mr);
 +        float16 e3 = neg_imag ^ (flip ? mr : mi);
 -        d[H2(i)] = float16_muladd(e2, e1, d[H2(i)], 0, fpst);
 -        d[H2(i + 1)] = float16_muladd(e4, e3, d[H2(i + 1)], 0, fpst);
 +        for (j = i; j < i + eltspersegment; j += 2) {
 +            float16 e2 = n[H2(j + flip)];
 +            float16 e4 = e2;
 +
-+            d[H2(j)] = float16_muladd(e2, e1, d[H2(j)], 0, fpst);
++    target_el = exception_target_el(env);
-+            d[H2(j + 1)] = float16_muladd(e4, e3, d[H2(j + 1)], 0, fpst);
++    if (fi->stage2) {
 +        target_el = 2;
 +        env->cp15.hpfar_el2 = extract64(fi->s2addr, 12, 47) << 4;
 +        if (arm_is_secure_below_el3(env) && fi->s1ns) {
 +            env->cp15.hpfar_el2 |= HPFAR_NS;
 +        }
-     }
++    }
-     clear_tail(d, opr_sz, simd_maxsz(desc));
++    same_el = (arm_current_el(env) == target_el);
  }
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlas_idx)(void *vd, void *vn, void *vm,
      uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
      intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
      uint32_t neg_real = flip ^ neg_imag;
 -    uintptr_t i;
 -    float32 e1 = m[H4(2 * index + flip)];
 -    float32 e3 = m[H4(2 * index + 1 - flip)];
 +    intptr_t elements = opr_sz / sizeof(float32);
 +    intptr_t eltspersegment = 16 / sizeof(float32);
 +    intptr_t i, j;
      /* Shift boolean to the sign bit so we can xor to negate.  */
      neg_real <<= 31;
      neg_imag <<= 31;
 -    e1 ^= neg_real;
 -    e3 ^= neg_imag;
 -    for (i = 0; i < opr_sz / 4; i += 2) {
 -        float32 e2 = n[H4(i + flip)];
 -        float32 e4 = e2;
 +    for (i = 0; i < elements; i += eltspersegment) {
 +        float32 mr = m[H4(i + 2 * index + 0)];
 +        float32 mi = m[H4(i + 2 * index + 1)];
 +        float32 e1 = neg_real ^ (flip ? mi : mr);
 +        float32 e3 = neg_imag ^ (flip ? mr : mi);
 -        d[H4(i)] = float32_muladd(e2, e1, d[H4(i)], 0, fpst);
 -        d[H4(i + 1)] = float32_muladd(e4, e3, d[H4(i + 1)], 0, fpst);
 +        for (j = i; j < i + eltspersegment; j += 2) {
 +            float32 e2 = n[H4(j + flip)];
 +            float32 e4 = e2;
 +
-+            d[H4(j)] = float32_muladd(e2, e1, d[H4(j)], 0, fpst);
++    fsr = compute_fsr_fsc(env, fi, target_el, mmu_idx, &fsc);
 +            d[H4(j + 1)] = float32_muladd(e4, e3, d[H4(j + 1)], 0, fpst);
 +        }
      }
      clear_tail(d, opr_sz, simd_maxsz(desc));
  }
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
  FCMLA_zpzzz     01100100 esz:2 0 rm:5 0 rot:2 pg:3 rn:5 rd:5 \
                  ra=%reg_movprfx
 +# SVE floating-point complex multiply-add (indexed)
 +FCMLA_zzxz      01100100 10 1 index:2 rm:3 0001 rot:2 rn:5 rd:5 \
 +                ra=%reg_movprfx esz=1
 +FCMLA_zzxz      01100100 11 1 index:1 rm:4 0001 rot:2 rn:5 rd:5 \
 +                ra=%reg_movprfx esz=2
 +
- ### SVE FP Multiply-Add Indexed Group
+     if (access_type == MMU_INST_FETCH) {
+         syn = syn_insn_abort(same_el, fi->ea, fi->s1ptw, fsc);
- # SVE floating-point multiply-add (indexed)
+         exc = EXCP_PREFETCH_ABORT;
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 39/55] target/arm: Implement SVE dot product (indexed)
+[PULL 15/33] target/arm: Take an exception if PC is misaligned
 From: Richard Henderson <richard.henderson@linaro.org>
+For A64, any input to an indirect branch can cause this.
+For A32, many indirect branch paths force the branch to be aligned,
+but BXWritePC does not.  This includes the BX instruction but also
+other interworking changes to PC.  Prior to v8, this case is UNDEFINED.
+With v8, this is CONSTRAINED UNPREDICTABLE and may either raise an
+exception or force align the PC.
+We choose to raise an exception because we have the infrastructure,
+it makes the generated code for gen_bx simpler, and it has the
+possibility of catching more guest bugs.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Message-id: 20180627043328.11531-34-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        |   5 ++
+ target/arm/helper.h           |  1 +
- target/arm/translate-sve.c |  18 ++++++
+ target/arm/syndrome.h         |  5 ++++
- target/arm/vec_helper.c    | 124 +++++++++++++++++++++++++++++++++++++
+ linux-user/aarch64/cpu_loop.c | 46 ++++++++++++++++++++---------------
- target/arm/sve.decode      |   6 ++
+ target/arm/tlb_helper.c       | 18 ++++++++++++++
-files changed, 153 insertions(+)
+ target/arm/translate-a64.c    | 15 ++++++++++++
  target/arm/translate.c        | 22 ++++++++++++++++-
 files changed, 87 insertions(+), 20 deletions(-)
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.h
 +++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_udot_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sel_flags, TCG_CALL_NO_RWG_SE,
- DEF_HELPER_FLAGS_4(gvec_sdot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_2(exception_internal, void, env, i32)
- DEF_HELPER_FLAGS_4(gvec_udot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_4(exception_with_syndrome, void, env, i32, i32, i32)
+ DEF_HELPER_2(exception_bkpt_insn, void, env, i32)
-+DEF_HELPER_FLAGS_4(gvec_sdot_idx_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++DEF_HELPER_2(exception_pc_alignment, noreturn, env, tl)
-+DEF_HELPER_FLAGS_4(gvec_udot_idx_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_1(setend, void, env)
-+DEF_HELPER_FLAGS_4(gvec_sdot_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_2(wfi, void, env, i32)
-+DEF_HELPER_FLAGS_4(gvec_udot_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ DEF_HELPER_1(wfe, void, env)
-+
+diff --git a/target/arm/syndrome.h b/target/arm/syndrome.h
- DEF_HELPER_FLAGS_5(gvec_fcaddh, TCG_CALL_NO_RWG,
+index XXXXXXX..XXXXXXX 100644
-                    void, ptr, ptr, ptr, ptr, i32)
+--- a/target/arm/syndrome.h
- DEF_HELPER_FLAGS_5(gvec_fcadds, TCG_CALL_NO_RWG,
++++ b/target/arm/syndrome.h
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
+@@ -XXX,XX +XXX,XX @@ static inline uint32_t syn_illegalstate(void)
-index XXXXXXX..XXXXXXX 100644
+     return (EC_ILLEGALSTATE << ARM_EL_EC_SHIFT) | ARM_EL_IL;
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_DOT_zzz(DisasContext *s, arg_DOT_zzz *a, uint32_t insn)
      return true;
  }
-+static bool trans_DOT_zzx(DisasContext *s, arg_DOT_zzx *a, uint32_t insn)
++static inline uint32_t syn_pcalignment(void)
 +{
-+    static gen_helper_gvec_3 * const fns[2][2] = {
++    return (EC_PCALIGNMENT << ARM_EL_EC_SHIFT) | ARM_EL_IL;
-+        { gen_helper_gvec_sdot_idx_b, gen_helper_gvec_sdot_idx_h },
++}
-+        { gen_helper_gvec_udot_idx_b, gen_helper_gvec_udot_idx_h }
++
-+    };
+ #endif /* TARGET_ARM_SYNDROME_H */
-+
+diff --git a/linux-user/aarch64/cpu_loop.c b/linux-user/aarch64/cpu_loop.c
-+    if (sve_access_check(s)) {
+index XXXXXXX..XXXXXXX 100644
-+        unsigned vsz = vec_full_reg_size(s);
+--- a/linux-user/aarch64/cpu_loop.c
-+        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
++++ b/linux-user/aarch64/cpu_loop.c
-+                           vec_full_reg_offset(s, a->rn),
+@@ -XXX,XX +XXX,XX @@ void cpu_loop(CPUARMState *env)
-+                           vec_full_reg_offset(s, a->rm),
+             break;
-+                           vsz, vsz, a->index, fns[a->u][a->sz]);
+         case EXCP_PREFETCH_ABORT:
          case EXCP_DATA_ABORT:
 -            /* We should only arrive here with EC in {DATAABORT, INSNABORT}. */
              ec = syn_get_ec(env->exception.syndrome);
 -            assert(ec == EC_DATAABORT || ec == EC_INSNABORT);
 -
 -            /* Both EC have the same format for FSC, or close enough. */
 -            fsc = extract32(env->exception.syndrome, 0, 6);
 -            switch (fsc) {
 -            case 0x04 ... 0x07: /* Translation fault, level {0-3} */
 -                si_signo = TARGET_SIGSEGV;
 -                si_code = TARGET_SEGV_MAPERR;
 +            switch (ec) {
 +            case EC_DATAABORT:
 +            case EC_INSNABORT:
 +                /* Both EC have the same format for FSC, or close enough. */
 +                fsc = extract32(env->exception.syndrome, 0, 6);
 +                switch (fsc) {
 +                case 0x04 ... 0x07: /* Translation fault, level {0-3} */
 +                    si_signo = TARGET_SIGSEGV;
 +                    si_code = TARGET_SEGV_MAPERR;
 +                    break;
 +                case 0x09 ... 0x0b: /* Access flag fault, level {1-3} */
 +                case 0x0d ... 0x0f: /* Permission fault, level {1-3} */
 +                    si_signo = TARGET_SIGSEGV;
 +                    si_code = TARGET_SEGV_ACCERR;
 +                    break;
 +                case 0x11: /* Synchronous Tag Check Fault */
 +                    si_signo = TARGET_SIGSEGV;
 +                    si_code = TARGET_SEGV_MTESERR;
 +                    break;
 +                case 0x21: /* Alignment fault */
 +                    si_signo = TARGET_SIGBUS;
 +                    si_code = TARGET_BUS_ADRALN;
 +                    break;
 +                default:
 +                    g_assert_not_reached();
 +                }
                  break;
 -            case 0x09 ... 0x0b: /* Access flag fault, level {1-3} */
 -            case 0x0d ... 0x0f: /* Permission fault, level {1-3} */
 -                si_signo = TARGET_SIGSEGV;
 -                si_code = TARGET_SEGV_ACCERR;
 -                break;
 -            case 0x11: /* Synchronous Tag Check Fault */
 -                si_signo = TARGET_SIGSEGV;
 -                si_code = TARGET_SEGV_MTESERR;
 -                break;
 -            case 0x21: /* Alignment fault */
 +            case EC_PCALIGNMENT:
                  si_signo = TARGET_SIGBUS;
                  si_code = TARGET_BUS_ADRALN;
                  break;
 diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tlb_helper.c
 +++ b/target/arm/tlb_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "cpu.h"
  #include "internals.h"
  #include "exec/exec-all.h"
 +#include "exec/helper-proto.h"
  static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
                                              unsigned int target_el,
@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_unaligned_access(CPUState *cs, vaddr vaddr,
      arm_deliver_fault(cpu, vaddr, access_type, mmu_idx, &fi);
  }
 +void helper_exception_pc_alignment(CPUARMState *env, target_ulong pc)
 +{
 +    ARMMMUFaultInfo fi = { .type = ARMFault_Alignment };
 +    int target_el = exception_target_el(env);
 +    int mmu_idx = cpu_mmu_index(env, true);
 +    uint32_t fsc;
 +
 +    env->exception.vaddress = pc;
 +
 +    /*
 +     * Note that the fsc is not applicable to this exception,
 +     * since any syndrome is pcalignment not insn_abort.
 +     */
 +    env->exception.fsr = compute_fsr_fsc(env, &fi, target_el, mmu_idx, &fsc);
 +    raise_exception(env, EXCP_PREFETCH_ABORT, syn_pcalignment(), target_el);
 +}
 +
  #if !defined(CONFIG_USER_ONLY)
  /*
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
      uint64_t pc = s->base.pc_next;
      uint32_t insn;
 +    /* Singlestep exceptions have the highest priority. */
      if (s->ss_active && !s->pstate_ss) {
          /* Singlestep state is Active-pending.
           * If we're in this state at the start of a TB then either
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
          return;
      }
 +    if (pc & 3) {
 +        /*
 +         * PC alignment fault.  This has priority over the instruction abort
 +         * that we would receive from a translation fault via arm_ldl_code.
 +         * This should only be possible after an indirect branch, at the
 +         * start of the TB.
 +         */
 +        assert(s->base.num_insns == 1);
 +        gen_helper_exception_pc_alignment(cpu_env, tcg_constant_tl(pc));
 +        s->base.is_jmp = DISAS_NORETURN;
 +        s->base.pc_next = QEMU_ALIGN_UP(pc, 4);
 +        return;
 +    }
-+    return true;
++
-+}
+     s->pc_curr = pc;
-+
+     insn = arm_ldl_code(env, &s->base, pc, s->sctlr_b);
-+
+     s->insn = insn;
- /*
+diff --git a/target/arm/translate.c b/target/arm/translate.c
-  *** SVE Floating Point Multiply-Add Indexed Group
+index XXXXXXX..XXXXXXX 100644
-  */
+--- a/target/arm/translate.c
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++++ b/target/arm/translate.c
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static void arm_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
---- a/target/arm/vec_helper.c
+     uint32_t pc = dc->base.pc_next;
-+++ b/target/arm/vec_helper.c
+     unsigned int insn;
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_udot_h)(void *vd, void *vn, void *vm, uint32_t desc)
-     clear_tail(d, opr_sz, simd_maxsz(desc));
+-    if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
- }
++    /* Singlestep exceptions have the highest priority. */
++    if (arm_check_ss_active(dc)) {
-+void HELPER(gvec_sdot_idx_b)(void *vd, void *vn, void *vm, uint32_t desc)
++        dc->base.pc_next = pc + 4;
-+{
++        return;
 +    intptr_t i, segend, opr_sz = simd_oprsz(desc), opr_sz_4 = opr_sz / 4;
 +    intptr_t index = simd_data(desc);
 +    uint32_t *d = vd;
 +    int8_t *n = vn;
 +    int8_t *m_indexed = (int8_t *)vm + index * 4;
 +
 +    /* Notice the special case of opr_sz == 8, from aa64/aa32 advsimd.
 +     * Otherwise opr_sz is a multiple of 16.
 +     */
 +    segend = MIN(4, opr_sz_4);
 +    i = 0;
 +    do {
 +        int8_t m0 = m_indexed[i * 4 + 0];
 +        int8_t m1 = m_indexed[i * 4 + 1];
 +        int8_t m2 = m_indexed[i * 4 + 2];
 +        int8_t m3 = m_indexed[i * 4 + 3];
 +
 +        do {
 +            d[i] += n[i * 4 + 0] * m0
 +                  + n[i * 4 + 1] * m1
 +                  + n[i * 4 + 2] * m2
 +                  + n[i * 4 + 3] * m3;
 +        } while (++i < segend);
 +        segend = i + 4;
 +    } while (i < opr_sz_4);
 +
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_udot_idx_b)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    intptr_t i, segend, opr_sz = simd_oprsz(desc), opr_sz_4 = opr_sz / 4;
 +    intptr_t index = simd_data(desc);
 +    uint32_t *d = vd;
 +    uint8_t *n = vn;
 +    uint8_t *m_indexed = (uint8_t *)vm + index * 4;
 +
 +    /* Notice the special case of opr_sz == 8, from aa64/aa32 advsimd.
 +     * Otherwise opr_sz is a multiple of 16.
 +     */
 +    segend = MIN(4, opr_sz_4);
 +    i = 0;
 +    do {
 +        uint8_t m0 = m_indexed[i * 4 + 0];
 +        uint8_t m1 = m_indexed[i * 4 + 1];
 +        uint8_t m2 = m_indexed[i * 4 + 2];
 +        uint8_t m3 = m_indexed[i * 4 + 3];
 +
 +        do {
 +            d[i] += n[i * 4 + 0] * m0
 +                  + n[i * 4 + 1] * m1
 +                  + n[i * 4 + 2] * m2
 +                  + n[i * 4 + 3] * m3;
 +        } while (++i < segend);
 +        segend = i + 4;
 +    } while (i < opr_sz_4);
 +
 +    clear_tail(d, opr_sz, simd_maxsz(desc));
 +}
 +
 +void HELPER(gvec_sdot_idx_h)(void *vd, void *vn, void *vm, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc), opr_sz_8 = opr_sz / 8;
 +    intptr_t index = simd_data(desc);
 +    uint64_t *d = vd;
 +    int16_t *n = vn;
 +    int16_t *m_indexed = (int16_t *)vm + index * 4;
 +
 +    /* This is supported by SVE only, so opr_sz is always a multiple of 16.
 +     * Process the entire segment all at once, writing back the results
 +     * only after we've consumed all of the inputs.
 +     */
 +    for (i = 0; i < opr_sz_8 ; i += 2) {
 +        uint64_t d0, d1;
 +
 +        d0  = n[i * 4 + 0] * (int64_t)m_indexed[i * 4 + 0];
 +        d0 += n[i * 4 + 1] * (int64_t)m_indexed[i * 4 + 1];
 +        d0 += n[i * 4 + 2] * (int64_t)m_indexed[i * 4 + 2];
 +        d0 += n[i * 4 + 3] * (int64_t)m_indexed[i * 4 + 3];
 +        d1  = n[i * 4 + 4] * (int64_t)m_indexed[i * 4 + 0];
 +        d1 += n[i * 4 + 5] * (int64_t)m_indexed[i * 4 + 1];
 +        d1 += n[i * 4 + 6] * (int64_t)m_indexed[i * 4 + 2];
 +        d1 += n[i * 4 + 7] * (int64_t)m_indexed[i * 4 + 3];
 +
 +        d[i + 0] += d0;
 +        d[i + 1] += d1;
 +    }
 +
-+    clear_tail(d, opr_sz, simd_maxsz(desc));
++    if (pc & 3) {
-+}
++        /*
-+
++         * PC alignment fault.  This has priority over the instruction abort
-+void HELPER(gvec_udot_idx_h)(void *vd, void *vn, void *vm, uint32_t desc)
++         * that we would receive from a translation fault via arm_ldl_code
-+{
++         * (or the execution of the kernelpage entrypoint). This should only
-+    intptr_t i, opr_sz = simd_oprsz(desc), opr_sz_8 = opr_sz / 8;
++         * be possible after an indirect branch, at the start of the TB.
-+    intptr_t index = simd_data(desc);
++         */
-+    uint64_t *d = vd;
++        assert(dc->base.num_insns == 1);
-+    uint16_t *n = vn;
++        gen_helper_exception_pc_alignment(cpu_env, tcg_constant_tl(pc));
-+    uint16_t *m_indexed = (uint16_t *)vm + index * 4;
++        dc->base.is_jmp = DISAS_NORETURN;
-+
++        dc->base.pc_next = QEMU_ALIGN_UP(pc, 4);
-+    /* This is supported by SVE only, so opr_sz is always a multiple of 16.
++        return;
 +     * Process the entire segment all at once, writing back the results
 +     * only after we've consumed all of the inputs.
 +     */
 +    for (i = 0; i < opr_sz_8 ; i += 2) {
 +        uint64_t d0, d1;
 +
 +        d0  = n[i * 4 + 0] * (uint64_t)m_indexed[i * 4 + 0];
 +        d0 += n[i * 4 + 1] * (uint64_t)m_indexed[i * 4 + 1];
 +        d0 += n[i * 4 + 2] * (uint64_t)m_indexed[i * 4 + 2];
 +        d0 += n[i * 4 + 3] * (uint64_t)m_indexed[i * 4 + 3];
 +        d1  = n[i * 4 + 4] * (uint64_t)m_indexed[i * 4 + 0];
 +        d1 += n[i * 4 + 5] * (uint64_t)m_indexed[i * 4 + 1];
 +        d1 += n[i * 4 + 6] * (uint64_t)m_indexed[i * 4 + 2];
 +        d1 += n[i * 4 + 7] * (uint64_t)m_indexed[i * 4 + 3];
 +
 +        d[i + 0] += d0;
 +        d[i + 1] += d1;
 +    }
 +
-+    clear_tail(d, opr_sz, simd_maxsz(desc));
++    if (arm_check_kernelpage(dc)) {
-+}
+         dc->base.pc_next = pc + 4;
-+
+         return;
- void HELPER(gvec_fcaddh)(void *vd, void *vn, void *vm,
+     }
                           void *vfpst, uint32_t desc)
  {
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
  # SVE integer dot product (unpredicated)
  DOT_zzz         01000100 1 sz:1 0 rm:5 00000 u:1 rn:5 rd:5      ra=%reg_movprfx
 +# SVE integer dot product (indexed)
 +DOT_zzx         01000100 101 index:2 rm:3 00000 u:1 rn:5 rd:5 \
 +                sz=0 ra=%reg_movprfx
 +DOT_zzx         01000100 111 index:1 rm:4 00000 u:1 rn:5 rd:5 \
 +                sz=1 ra=%reg_movprfx
 +
  # SVE floating-point complex add (predicated)
  FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
                  rn=%reg_movprfx
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 41/55] target/arm: Implement ARMv8.2-DotProd
+[PULL 16/33] target/arm: Assert thumb pc is aligned
 From: Richard Henderson <richard.henderson@linaro.org>
-We've already added the helpers with an SVE patch, all that remains
+Misaligned thumb PC is architecturally impossible.
-is to wire up the aa64 and aa32 translators.  Enable the feature
+Assert is better than proceeding, in case we've missed
-within -cpu max for CONFIG_USER_ONLY.
+something somewhere.
 Expand a comment about aligning the pc in gdbstub.
 Fail an incoming migrate if a thumb pc is misaligned.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-36-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h           |  1 +
+ target/arm/gdbstub.c   |  9 +++++++--
- linux-user/elfload.c       |  1 +
+ target/arm/machine.c   | 10 ++++++++++
- target/arm/cpu.c           |  1 +
+ target/arm/translate.c |  3 +++
- target/arm/cpu64.c         |  1 +
+files changed, 20 insertions(+), 2 deletions(-)
  target/arm/translate-a64.c | 36 +++++++++++++++++++
  target/arm/translate.c     | 74 +++++++++++++++++++++++++++-----------
 files changed, 93 insertions(+), 21 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/arm/gdbstub.c
-+++ b/target/arm/cpu.h
++++ b/target/arm/gdbstub.c
-@@ -XXX,XX +XXX,XX @@ enum arm_features {
+@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
-     ARM_FEATURE_V8_SM4, /* implements SM4 part of v8 Crypto Extensions */
-     ARM_FEATURE_V8_ATOMICS, /* ARMv8.1-Atomics feature */
+     tmp = ldl_p(mem_buf);
-     ARM_FEATURE_V8_RDM, /* implements v8.1 simd round multiply */
-+    ARM_FEATURE_V8_DOTPROD, /* implements v8.2 simd dot product */
+-    /* Mask out low bit of PC to workaround gdb bugs.  This will probably
-     ARM_FEATURE_V8_FP16, /* implements v8.2 half-precision float */
+-       cause problems if we ever implement the Jazelle DBX extensions.  */
-     ARM_FEATURE_V8_FCMA, /* has complex number part of v8.3 extensions.  */
++    /*
-     ARM_FEATURE_M_MAIN, /* M profile Main Extension */
++     * Mask out low bits of PC to workaround gdb bugs.
-diff --git a/linux-user/elfload.c b/linux-user/elfload.c
++     * This avoids an assert in thumb_tr_translate_insn, because it is
 +     * architecturally impossible to misalign the pc.
 +     * This will probably cause problems if we ever implement the
 +     * Jazelle DBX extensions.
 +     */
      if (n == 15) {
          tmp &= ~1;
      }
 diff --git a/target/arm/machine.c b/target/arm/machine.c
 index XXXXXXX..XXXXXXX 100644
---- a/linux-user/elfload.c
+--- a/target/arm/machine.c
-+++ b/linux-user/elfload.c
++++ b/target/arm/machine.c
-@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
+@@ -XXX,XX +XXX,XX @@ static int cpu_post_load(void *opaque, int version_id)
-                 ARM_HWCAP_A64_FPHP | ARM_HWCAP_A64_ASIMDHP);
+             return -1;
-     GET_FEATURE(ARM_FEATURE_V8_ATOMICS, ARM_HWCAP_A64_ATOMICS);
+         }
      GET_FEATURE(ARM_FEATURE_V8_RDM, ARM_HWCAP_A64_ASIMDRDM);
 +    GET_FEATURE(ARM_FEATURE_V8_DOTPROD, ARM_HWCAP_A64_ASIMDDP);
      GET_FEATURE(ARM_FEATURE_V8_FCMA, ARM_HWCAP_A64_FCMA);
      GET_FEATURE(ARM_FEATURE_SVE, ARM_HWCAP_A64_SVE);
  #undef GET_FEATURE
 diff --git a/target/arm/cpu.c b/target/arm/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.c
 +++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
          set_feature(&cpu->env, ARM_FEATURE_V8_PMULL);
          set_feature(&cpu->env, ARM_FEATURE_CRC);
          set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
 +        set_feature(&cpu->env, ARM_FEATURE_V8_DOTPROD);
          set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
  #endif
      }
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
-+++ b/target/arm/cpu64.c
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
-         set_feature(&cpu->env, ARM_FEATURE_CRC);
-         set_feature(&cpu->env, ARM_FEATURE_V8_ATOMICS);
-         set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
-+        set_feature(&cpu->env, ARM_FEATURE_V8_DOTPROD);
-         set_feature(&cpu->env, ARM_FEATURE_V8_FP16);
-         set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
-         set_feature(&cpu->env, ARM_FEATURE_SVE);
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
-+++ b/target/arm/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
-                    vec_full_reg_size(s), gvec_op);
- }
-+/* Expand a 3-operand operation using an out-of-line helper.  */
-+static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
-+                             int rn, int rm, int data, gen_helper_gvec_3 *fn)
-+{
-+    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
-+                       vec_full_reg_offset(s, rn),
-+                       vec_full_reg_offset(s, rm),
-+                       is_q ? 16 : 8, vec_full_reg_size(s), data, fn);
-+}
 +
- /* Expand a 3-operand + env pointer operation using
++    /*
-  * an out-of-line helper.
++     * Misaligned thumb pc is architecturally impossible.
-  */
++     * We have an assert in thumb_tr_translate_insn to verify this.
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
++     * Fail an incoming migrate to avoid this assert.
-         }
++     */
-         feature = ARM_FEATURE_V8_RDM;
++    if (!is_a64(env) && env->thumb && (env->regs[15] & 1)) {
-         break;
++        return -1;
-+    case 0x02: /* SDOT (vector) */
++    }
 +    case 0x12: /* UDOT (vector) */
 +        if (size != MO_32) {
 +            unallocated_encoding(s);
 +            return;
 +        }
 +        feature = ARM_FEATURE_V8_DOTPROD;
 +        break;
      case 0x8: /* FCMLA, #0 */
      case 0x9: /* FCMLA, #90 */
      case 0xa: /* FCMLA, #180 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
          }
          return;
 +    case 0x2: /* SDOT / UDOT */
 +        gen_gvec_op3_ool(s, is_q, rd, rn, rm, 0,
 +                         u ? gen_helper_gvec_udot_b : gen_helper_gvec_sdot_b);
 +        return;
 +
-     case 0x8: /* FCMLA, #0 */
+     if (!kvm_enabled()) {
-     case 0x9: /* FCMLA, #90 */
+         pmu_op_finish(&cpu->env);
      case 0xa: /* FCMLA, #180 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
              return;
          }
          break;
 +    case 0x0e: /* SDOT */
 +    case 0x1e: /* UDOT */
 +        if (size != MO_32 || !arm_dc_feature(s, ARM_FEATURE_V8_DOTPROD)) {
 +            unallocated_encoding(s);
 +            return;
 +        }
 +        break;
      case 0x11: /* FCMLA #0 */
      case 0x13: /* FCMLA #90 */
      case 0x15: /* FCMLA #180 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
      }
-     switch (16 * u + opcode) {
-+    case 0x0e: /* SDOT */
-+    case 0x1e: /* UDOT */
-+        gen_gvec_op3_ool(s, is_q, rd, rn, rm, index,
-+                         u ? gen_helper_gvec_udot_idx_b
-+                         : gen_helper_gvec_sdot_idx_b);
-+        return;
-     case 0x11: /* FCMLA #0 */
-     case 0x13: /* FCMLA #90 */
-     case 0x15: /* FCMLA #180 */
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
-@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static void thumb_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
-  */
+     uint32_t insn;
- static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
+     bool is_16bit;
- {
--    gen_helper_gvec_3_ptr *fn_gvec_ptr;
++    /* Misaligned thumb PC is architecturally impossible. */
--    int rd, rn, rm, rot, size, opr_sz;
++    assert((dc->base.pc_next & 1) == 0);
--    TCGv_ptr fpst;
++
-+    gen_helper_gvec_3 *fn_gvec = NULL;
+     if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
-+    gen_helper_gvec_3_ptr *fn_gvec_ptr = NULL;
+         dc->base.pc_next = pc + 2;
-+    int rd, rn, rm, opr_sz;
+         return;
 +    int data = 0;
      bool q;
      q = extract32(insn, 6, 1);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
      if ((insn & 0xfe200f10) == 0xfc200800) {
          /* VCMLA -- 1111 110R R.1S .... .... 1000 ...0 .... */
 -        size = extract32(insn, 20, 1);
 -        rot = extract32(insn, 23, 2);
 +        int size = extract32(insn, 20, 1);
 +        data = extract32(insn, 23, 2); /* rot */
          if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)
              || (!size && !arm_dc_feature(s, ARM_FEATURE_V8_FP16))) {
              return 1;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
          fn_gvec_ptr = size ? gen_helper_gvec_fcmlas : gen_helper_gvec_fcmlah;
      } else if ((insn & 0xfea00f10) == 0xfc800800) {
          /* VCADD -- 1111 110R 1.0S .... .... 1000 ...0 .... */
 -        size = extract32(insn, 20, 1);
 -        rot = extract32(insn, 24, 1);
 +        int size = extract32(insn, 20, 1);
 +        data = extract32(insn, 24, 1); /* rot */
          if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)
              || (!size && !arm_dc_feature(s, ARM_FEATURE_V8_FP16))) {
              return 1;
          }
          fn_gvec_ptr = size ? gen_helper_gvec_fcadds : gen_helper_gvec_fcaddh;
 +    } else if ((insn & 0xfeb00f00) == 0xfc200d00) {
 +        /* V[US]DOT -- 1111 1100 0.10 .... .... 1101 .Q.U .... */
 +        bool u = extract32(insn, 4, 1);
 +        if (!arm_dc_feature(s, ARM_FEATURE_V8_DOTPROD)) {
 +            return 1;
 +        }
 +        fn_gvec = u ? gen_helper_gvec_udot_b : gen_helper_gvec_sdot_b;
      } else {
          return 1;
      }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
      }
      opr_sz = (1 + q) * 8;
 -    fpst = get_fpstatus_ptr(1);
 -    tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
 -                       vfp_reg_offset(1, rn),
 -                       vfp_reg_offset(1, rm), fpst,
 -                       opr_sz, opr_sz, rot, fn_gvec_ptr);
 -    tcg_temp_free_ptr(fpst);
 +    if (fn_gvec_ptr) {
 +        TCGv_ptr fpst = get_fpstatus_ptr(1);
 +        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
 +                           vfp_reg_offset(1, rn),
 +                           vfp_reg_offset(1, rm), fpst,
 +                           opr_sz, opr_sz, data, fn_gvec_ptr);
 +        tcg_temp_free_ptr(fpst);
 +    } else {
 +        tcg_gen_gvec_3_ool(vfp_reg_offset(1, rd),
 +                           vfp_reg_offset(1, rn),
 +                           vfp_reg_offset(1, rm),
 +                           opr_sz, opr_sz, data, fn_gvec);
 +    }
      return 0;
  }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
  static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
  {
 -    gen_helper_gvec_3_ptr *fn_gvec_ptr;
 +    gen_helper_gvec_3 *fn_gvec = NULL;
 +    gen_helper_gvec_3_ptr *fn_gvec_ptr = NULL;
      int rd, rn, rm, opr_sz, data;
 -    TCGv_ptr fpst;
      bool q;
      q = extract32(insn, 6, 1);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
          data = (index << 2) | rot;
          fn_gvec_ptr = (size ? gen_helper_gvec_fcmlas_idx
                         : gen_helper_gvec_fcmlah_idx);
 +    } else if ((insn & 0xffb00f00) == 0xfe200d00) {
 +        /* V[US]DOT -- 1111 1110 0.10 .... .... 1101 .Q.U .... */
 +        int u = extract32(insn, 4, 1);
 +        if (!arm_dc_feature(s, ARM_FEATURE_V8_DOTPROD)) {
 +            return 1;
 +        }
 +        fn_gvec = u ? gen_helper_gvec_udot_idx_b : gen_helper_gvec_sdot_idx_b;
 +        /* rm is just Vm, and index is M.  */
 +        data = extract32(insn, 5, 1); /* index */
 +        rm = extract32(insn, 0, 4);
      } else {
          return 1;
      }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
      }
      opr_sz = (1 + q) * 8;
 -    fpst = get_fpstatus_ptr(1);
 -    tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
 -                       vfp_reg_offset(1, rn),
 -                       vfp_reg_offset(1, rm), fpst,
 -                       opr_sz, opr_sz, data, fn_gvec_ptr);
 -    tcg_temp_free_ptr(fpst);
 +    if (fn_gvec_ptr) {
 +        TCGv_ptr fpst = get_fpstatus_ptr(1);
 +        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
 +                           vfp_reg_offset(1, rn),
 +                           vfp_reg_offset(1, rm), fpst,
 +                           opr_sz, opr_sz, data, fn_gvec_ptr);
 +        tcg_temp_free_ptr(fpst);
 +    } else {
 +        tcg_gen_gvec_3_ool(vfp_reg_offset(1, rd),
 +                           vfp_reg_offset(1, rn),
 +                           vfp_reg_offset(1, rm),
 +                           opr_sz, opr_sz, data, fn_gvec);
 +    }
      return 0;
  }
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 32/55] target/arm: Implement SVE floating-point unary operations
+[PULL 17/33] target/arm: Suppress bp for exceptions with more priority
 From: Richard Henderson <richard.henderson@linaro.org>
+Both single-step and pc alignment faults have priority over
+breakpoint exceptions.
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-27-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    | 14 ++++++++++++++
+ target/arm/debug_helper.c | 23 +++++++++++++++++++++++
- target/arm/sve_helper.c    |  8 ++++++++
+file changed, 23 insertions(+)
  target/arm/translate-sve.c | 26 ++++++++++++++++++++++++++
  target/arm/sve.decode      |  4 ++++
 files changed, 52 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/target/arm/debug_helper.c
-+++ b/target/arm/helper-sve.h
++++ b/target/arm/debug_helper.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve_frintx_s, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ bool arm_debug_check_breakpoint(CPUState *cs)
- DEF_HELPER_FLAGS_5(sve_frintx_d, TCG_CALL_NO_RWG,
+ {
-                    void, ptr, ptr, ptr, ptr, i32)
+     ARMCPU *cpu = ARM_CPU(cs);
+     CPUARMState *env = &cpu->env;
-+DEF_HELPER_FLAGS_5(sve_frecpx_h, TCG_CALL_NO_RWG,
++    target_ulong pc;
-+                   void, ptr, ptr, ptr, ptr, i32)
+     int n;
-+DEF_HELPER_FLAGS_5(sve_frecpx_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
+     /*
-+DEF_HELPER_FLAGS_5(sve_frecpx_d, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ bool arm_debug_check_breakpoint(CPUState *cs)
-+                   void, ptr, ptr, ptr, ptr, i32)
+         return false;
-+
+     }
-+DEF_HELPER_FLAGS_5(sve_fsqrt_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
++    /*
-+DEF_HELPER_FLAGS_5(sve_fsqrt_s, TCG_CALL_NO_RWG,
++     * Single-step exceptions have priority over breakpoint exceptions.
-+                   void, ptr, ptr, ptr, ptr, i32)
++     * If single-step state is active-pending, suppress the bp.
-+DEF_HELPER_FLAGS_5(sve_fsqrt_d, TCG_CALL_NO_RWG,
++     */
-+                   void, ptr, ptr, ptr, ptr, i32)
++    if (arm_singlestep_active(env) && !(env->pstate & PSTATE_SS)) {
 +
  DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
 diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ DO_ZPZ_FP(sve_frintx_h, uint16_t, H1_2, float16_round_to_int)
  DO_ZPZ_FP(sve_frintx_s, uint32_t, H1_4, float32_round_to_int)
  DO_ZPZ_FP(sve_frintx_d, uint64_t,     , float64_round_to_int)
 +DO_ZPZ_FP(sve_frecpx_h, uint16_t, H1_2, helper_frecpx_f16)
 +DO_ZPZ_FP(sve_frecpx_s, uint32_t, H1_4, helper_frecpx_f32)
 +DO_ZPZ_FP(sve_frecpx_d, uint64_t,     , helper_frecpx_f64)
 +
 +DO_ZPZ_FP(sve_fsqrt_h, uint16_t, H1_2, float16_sqrt)
 +DO_ZPZ_FP(sve_fsqrt_s, uint32_t, H1_4, float32_sqrt)
 +DO_ZPZ_FP(sve_fsqrt_d, uint64_t,     , float64_sqrt)
 +
  DO_ZPZ_FP(sve_scvt_hh, uint16_t, H1_2, int16_to_float16)
  DO_ZPZ_FP(sve_scvt_sh, uint32_t, H1_4, int32_to_float16)
  DO_ZPZ_FP(sve_scvt_ss, uint32_t, H1_4, int32_to_float32)
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FRINTA(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
      return do_frint_mode(s, a, float_round_ties_away);
  }
 +static bool trans_FRECPX(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    static gen_helper_gvec_3_ptr * const fns[3] = {
 +        gen_helper_sve_frecpx_h,
 +        gen_helper_sve_frecpx_s,
 +        gen_helper_sve_frecpx_d
 +    };
 +    if (a->esz == 0) {
 +        return false;
 +    }
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, a->esz == MO_16, fns[a->esz - 1]);
-+}
 +
-+static bool trans_FSQRT(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
++    /*
-+{
++     * PC alignment faults have priority over breakpoint exceptions.
-+    static gen_helper_gvec_3_ptr * const fns[3] = {
++     */
-+        gen_helper_sve_fsqrt_h,
++    pc = is_a64(env) ? env->pc : env->regs[15];
-+        gen_helper_sve_fsqrt_s,
++    if ((is_a64(env) || !env->thumb) && (pc & 3) != 0) {
 +        gen_helper_sve_fsqrt_d
 +    };
 +    if (a->esz == 0) {
 +        return false;
 +    }
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, a->esz == MO_16, fns[a->esz - 1]);
-+}
 +
- static bool trans_SCVTF_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
++    /*
- {
++     * Instruction aborts have priority over breakpoint exceptions.
-     return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_hh);
++     * TODO: We would need to look up the page for PC and verify that
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
++     * it is present and executable.
-index XXXXXXX..XXXXXXX 100644
++     */
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ FRINTA          01100101 .. 000 100 101 ... ..... .....         @rd_pg_rn
  FRINTX          01100101 .. 000 110 101 ... ..... .....         @rd_pg_rn
  FRINTI          01100101 .. 000 111 101 ... ..... .....         @rd_pg_rn
 +# SVE floating-point unary operations
 +FRECPX          01100101 .. 001 100 101 ... ..... .....         @rd_pg_rn
 +FSQRT           01100101 .. 001 101 101 ... ..... .....         @rd_pg_rn
 +
- # SVE integer convert to floating-point
+     for (n = 0; n < ARRAY_SIZE(env->cpu_breakpoint); n++) {
- SCVTF_hh        01100101 01 010 01 0 101 ... ..... .....        @rd_pg_rn_e0
+         if (bp_wp_matches(cpu, n, false)) {
- SCVTF_sh        01100101 01 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
+             return true;
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 35/55] target/arm: Implement SVE fp complex multiply add
+[PULL 18/33] tests/tcg: Add arm and aarch64 pc alignment tests
 From: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-30-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    |   4 +
+ tests/tcg/aarch64/pcalign-a64.c   | 37 +++++++++++++++++++++++++
- target/arm/sve_helper.c    | 162 +++++++++++++++++++++++++++++++++++++
+ tests/tcg/arm/pcalign-a32.c       | 46 +++++++++++++++++++++++++++++++
- target/arm/translate-sve.c |  37 +++++++++
+ tests/tcg/aarch64/Makefile.target |  4 +--
- target/arm/sve.decode      |   4 +
+ tests/tcg/arm/Makefile.target     |  4 +++
-files changed, 207 insertions(+)
+files changed, 89 insertions(+), 2 deletions(-)
  create mode 100644 tests/tcg/aarch64/pcalign-a64.c
  create mode 100644 tests/tcg/arm/pcalign-a32.c
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/tests/tcg/aarch64/pcalign-a64.c b/tests/tcg/aarch64/pcalign-a64.c
-index XXXXXXX..XXXXXXX 100644
+new file mode 100644
---- a/target/arm/helper-sve.h
+index XXXXXXX..XXXXXXX
-+++ b/target/arm/helper-sve.h
+--- /dev/null
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
++++ b/tests/tcg/aarch64/pcalign-a64.c
- DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
++/* Test PC misalignment exception */
 +DEF_HELPER_FLAGS_3(sve_fcmla_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
 +DEF_HELPER_FLAGS_3(sve_fcmla_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
 +DEF_HELPER_FLAGS_3(sve_fcmla_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
 +
- DEF_HELPER_FLAGS_5(sve_ftmad_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++#include <assert.h>
- DEF_HELPER_FLAGS_5(sve_ftmad_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++#include <signal.h>
- DEF_HELPER_FLAGS_5(sve_ftmad_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++#include <stdlib.h>
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
++#include <stdio.h>
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fcadd_d)(void *vd, void *vn, void *vm, void *vg,
      } while (i != 0);
  }
 +/*
 + * FP Complex Multiply
 + */
 +
-+QEMU_BUILD_BUG_ON(SIMD_DATA_SHIFT + 22 > 32);
++static void *expected;
 +
-+void HELPER(sve_fcmla_zpzzz_h)(CPUARMState *env, void *vg, uint32_t desc)
++static void sigbus(int sig, siginfo_t *info, void *vuc)
 +{
-+    intptr_t j, i = simd_oprsz(desc);
++    assert(info->si_code == BUS_ADRALN);
-+    unsigned rd = extract32(desc, SIMD_DATA_SHIFT, 5);
++    assert(info->si_addr == expected);
-+    unsigned rn = extract32(desc, SIMD_DATA_SHIFT + 5, 5);
++    exit(EXIT_SUCCESS);
 +    unsigned rm = extract32(desc, SIMD_DATA_SHIFT + 10, 5);
 +    unsigned ra = extract32(desc, SIMD_DATA_SHIFT + 15, 5);
 +    unsigned rot = extract32(desc, SIMD_DATA_SHIFT + 20, 2);
 +    bool flip = rot & 1;
 +    float16 neg_imag, neg_real;
 +    void *vd = &env->vfp.zregs[rd];
 +    void *vn = &env->vfp.zregs[rn];
 +    void *vm = &env->vfp.zregs[rm];
 +    void *va = &env->vfp.zregs[ra];
 +    uint64_t *g = vg;
 +
 +    neg_imag = float16_set_sign(0, (rot & 2) != 0);
 +    neg_real = float16_set_sign(0, rot == 1 || rot == 2);
 +
 +    do {
 +        uint64_t pg = g[(i - 1) >> 6];
 +        do {
 +            float16 e1, e2, e3, e4, nr, ni, mr, mi, d;
 +
 +            /* I holds the real index; J holds the imag index.  */
 +            j = i - sizeof(float16);
 +            i -= 2 * sizeof(float16);
 +
 +            nr = *(float16 *)(vn + H1_2(i));
 +            ni = *(float16 *)(vn + H1_2(j));
 +            mr = *(float16 *)(vm + H1_2(i));
 +            mi = *(float16 *)(vm + H1_2(j));
 +
 +            e2 = (flip ? ni : nr);
 +            e1 = (flip ? mi : mr) ^ neg_real;
 +            e4 = e2;
 +            e3 = (flip ? mr : mi) ^ neg_imag;
 +
 +            if (likely((pg >> (i & 63)) & 1)) {
 +                d = *(float16 *)(va + H1_2(i));
 +                d = float16_muladd(e2, e1, d, 0, &env->vfp.fp_status_f16);
 +                *(float16 *)(vd + H1_2(i)) = d;
 +            }
 +            if (likely((pg >> (j & 63)) & 1)) {
 +                d = *(float16 *)(va + H1_2(j));
 +                d = float16_muladd(e4, e3, d, 0, &env->vfp.fp_status_f16);
 +                *(float16 *)(vd + H1_2(j)) = d;
 +            }
 +        } while (i & 63);
 +    } while (i != 0);
 +}
 +
-+void HELPER(sve_fcmla_zpzzz_s)(CPUARMState *env, void *vg, uint32_t desc)
++int main()
 +{
-+    intptr_t j, i = simd_oprsz(desc);
++    void *tmp;
 +    unsigned rd = extract32(desc, SIMD_DATA_SHIFT, 5);
 +    unsigned rn = extract32(desc, SIMD_DATA_SHIFT + 5, 5);
 +    unsigned rm = extract32(desc, SIMD_DATA_SHIFT + 10, 5);
 +    unsigned ra = extract32(desc, SIMD_DATA_SHIFT + 15, 5);
 +    unsigned rot = extract32(desc, SIMD_DATA_SHIFT + 20, 2);
 +    bool flip = rot & 1;
 +    float32 neg_imag, neg_real;
 +    void *vd = &env->vfp.zregs[rd];
 +    void *vn = &env->vfp.zregs[rn];
 +    void *vm = &env->vfp.zregs[rm];
 +    void *va = &env->vfp.zregs[ra];
 +    uint64_t *g = vg;
 +
-+    neg_imag = float32_set_sign(0, (rot & 2) != 0);
++    struct sigaction sa = {
-+    neg_real = float32_set_sign(0, rot == 1 || rot == 2);
++        .sa_sigaction = sigbus,
 +        .sa_flags = SA_SIGINFO
 +    };
 +
-+    do {
++    if (sigaction(SIGBUS, &sa, NULL) < 0) {
-+        uint64_t pg = g[(i - 1) >> 6];
++        perror("sigaction");
-+        do {
++        return EXIT_FAILURE;
-+            float32 e1, e2, e3, e4, nr, ni, mr, mi, d;
++    }
 +
-+            /* I holds the real index; J holds the imag index.  */
++    asm volatile("adr %0, 1f + 1\n\t"
-+            j = i - sizeof(float32);
++                 "str %0, %1\n\t"
-+            i -= 2 * sizeof(float32);
++                 "br  %0\n"
 +                 "1:"
 +                 : "=&r"(tmp), "=m"(expected));
 +    abort();
 +}
 diff --git a/tests/tcg/arm/pcalign-a32.c b/tests/tcg/arm/pcalign-a32.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/tcg/arm/pcalign-a32.c
@@ -XXX,XX +XXX,XX @@
 +/* Test PC misalignment exception */
 +
-+            nr = *(float32 *)(vn + H1_2(i));
++#ifdef __thumb__
-+            ni = *(float32 *)(vn + H1_2(j));
++#error "This test must be compiled for ARM"
-+            mr = *(float32 *)(vm + H1_2(i));
++#endif
 +            mi = *(float32 *)(vm + H1_2(j));
 +
-+            e2 = (flip ? ni : nr);
++#include <assert.h>
-+            e1 = (flip ? mi : mr) ^ neg_real;
++#include <signal.h>
-+            e4 = e2;
++#include <stdlib.h>
-+            e3 = (flip ? mr : mi) ^ neg_imag;
++#include <stdio.h>
 +
-+            if (likely((pg >> (i & 63)) & 1)) {
++static void *expected;
-+                d = *(float32 *)(va + H1_2(i));
++
-+                d = float32_muladd(e2, e1, d, 0, &env->vfp.fp_status);
++static void sigbus(int sig, siginfo_t *info, void *vuc)
-+                *(float32 *)(vd + H1_2(i)) = d;
++{
-+            }
++    assert(info->si_code == BUS_ADRALN);
-+            if (likely((pg >> (j & 63)) & 1)) {
++    assert(info->si_addr == expected);
-+                d = *(float32 *)(va + H1_2(j));
++    exit(EXIT_SUCCESS);
 +                d = float32_muladd(e4, e3, d, 0, &env->vfp.fp_status);
 +                *(float32 *)(vd + H1_2(j)) = d;
 +            }
 +        } while (i & 63);
 +    } while (i != 0);
 +}
 +
-+void HELPER(sve_fcmla_zpzzz_d)(CPUARMState *env, void *vg, uint32_t desc)
++int main()
 +{
-+    intptr_t j, i = simd_oprsz(desc);
++    void *tmp;
 +    unsigned rd = extract32(desc, SIMD_DATA_SHIFT, 5);
 +    unsigned rn = extract32(desc, SIMD_DATA_SHIFT + 5, 5);
 +    unsigned rm = extract32(desc, SIMD_DATA_SHIFT + 10, 5);
 +    unsigned ra = extract32(desc, SIMD_DATA_SHIFT + 15, 5);
 +    unsigned rot = extract32(desc, SIMD_DATA_SHIFT + 20, 2);
 +    bool flip = rot & 1;
 +    float64 neg_imag, neg_real;
 +    void *vd = &env->vfp.zregs[rd];
 +    void *vn = &env->vfp.zregs[rn];
 +    void *vm = &env->vfp.zregs[rm];
 +    void *va = &env->vfp.zregs[ra];
 +    uint64_t *g = vg;
 +
-+    neg_imag = float64_set_sign(0, (rot & 2) != 0);
++    struct sigaction sa = {
-+    neg_real = float64_set_sign(0, rot == 1 || rot == 2);
++        .sa_sigaction = sigbus,
-+
++        .sa_flags = SA_SIGINFO
 +    do {
 +        uint64_t pg = g[(i - 1) >> 6];
 +        do {
 +            float64 e1, e2, e3, e4, nr, ni, mr, mi, d;
 +
 +            /* I holds the real index; J holds the imag index.  */
 +            j = i - sizeof(float64);
 +            i -= 2 * sizeof(float64);
 +
 +            nr = *(float64 *)(vn + H1_2(i));
 +            ni = *(float64 *)(vn + H1_2(j));
 +            mr = *(float64 *)(vm + H1_2(i));
 +            mi = *(float64 *)(vm + H1_2(j));
 +
 +            e2 = (flip ? ni : nr);
 +            e1 = (flip ? mi : mr) ^ neg_real;
 +            e4 = e2;
 +            e3 = (flip ? mr : mi) ^ neg_imag;
 +
 +            if (likely((pg >> (i & 63)) & 1)) {
 +                d = *(float64 *)(va + H1_2(i));
 +                d = float64_muladd(e2, e1, d, 0, &env->vfp.fp_status);
 +                *(float64 *)(vd + H1_2(i)) = d;
 +            }
 +            if (likely((pg >> (j & 63)) & 1)) {
 +                d = *(float64 *)(va + H1_2(j));
 +                d = float64_muladd(e4, e3, d, 0, &env->vfp.fp_status);
 +                *(float64 *)(vd + H1_2(j)) = d;
 +            }
 +        } while (i & 63);
 +    } while (i != 0);
 +}
 +
  /*
   * Load contiguous data, protected by a governing predicate.
   */
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_FMLA(FNMLS_zpzzz, fnmls_zpzzz)
  #undef DO_FMLA
 +static bool trans_FCMLA_zpzzz(DisasContext *s,
 +                              arg_FCMLA_zpzzz *a, uint32_t insn)
 +{
 +    static gen_helper_sve_fmla * const fns[3] = {
 +        gen_helper_sve_fcmla_zpzzz_h,
 +        gen_helper_sve_fcmla_zpzzz_s,
 +        gen_helper_sve_fcmla_zpzzz_d,
 +    };
 +
-+    if (a->esz == 0) {
++    if (sigaction(SIGBUS, &sa, NULL) < 0) {
-+        return false;
++        perror("sigaction");
 +        return EXIT_FAILURE;
 +    }
-+    if (sve_access_check(s)) {
-+        unsigned vsz = vec_full_reg_size(s);
-+        unsigned desc;
-+        TCGv_i32 t_desc;
-+        TCGv_ptr pg = tcg_temp_new_ptr();
 +
-+        /* We would need 7 operands to pass these arguments "properly".
++    asm volatile("adr %0, 1f + 2\n\t"
-+         * So we encode all the register numbers into the descriptor.
++                 "str %0, %1\n\t"
-+         */
++                 "bx  %0\n"
-+        desc = deposit32(a->rd, 5, 5, a->rn);
++                 "1:"
-+        desc = deposit32(desc, 10, 5, a->rm);
++                 : "=&r"(tmp), "=m"(expected));
 +        desc = deposit32(desc, 15, 5, a->ra);
 +        desc = deposit32(desc, 20, 2, a->rot);
 +        desc = sextract32(desc, 0, 22);
 +        desc = simd_desc(vsz, vsz, desc);
 +
-+        t_desc = tcg_const_i32(desc);
++    /*
-+        tcg_gen_addi_ptr(pg, cpu_env, pred_full_reg_offset(s, a->pg));
++     * From v8, it is CONSTRAINED UNPREDICTABLE whether BXWritePC aligns
-+        fns[a->esz - 1](cpu_env, pg, t_desc);
++     * the address or not.  If so, we can legitimately fall through.
-+        tcg_temp_free_i32(t_desc);
++     */
-+        tcg_temp_free_ptr(pg);
++    return EXIT_SUCCESS;
 +    }
 +    return true;
 +}
+diff --git a/tests/tcg/aarch64/Makefile.target b/tests/tcg/aarch64/Makefile.target
+index XXXXXXX..XXXXXXX 100644
+--- a/tests/tcg/aarch64/Makefile.target
++++ b/tests/tcg/aarch64/Makefile.target
+@@ -XXX,XX +XXX,XX @@ VPATH         += $(ARM_SRC)
+ AARCH64_SRC=$(SRC_PATH)/tests/tcg/aarch64
+ VPATH         += $(AARCH64_SRC)
+-# Float-convert Tests
+-AARCH64_TESTS=fcvt
++# Base architecture tests
++AARCH64_TESTS=fcvt pcalign-a64
+ fcvt: LDFLAGS+=-lm
+diff --git a/tests/tcg/arm/Makefile.target b/tests/tcg/arm/Makefile.target
+index XXXXXXX..XXXXXXX 100644
+--- a/tests/tcg/arm/Makefile.target
++++ b/tests/tcg/arm/Makefile.target
+@@ -XXX,XX +XXX,XX @@ run-fcvt: fcvt
+     $(call run-test,fcvt,$(QEMU) $<,"$< on $(TARGET_NAME)")
+     $(call diff-out,fcvt,$(ARM_SRC)/fcvt.ref)
++# PC alignment test
++ARM_TESTS += pcalign-a32
++pcalign-a32: CFLAGS+=-marm
 +
- /*
+ ifeq ($(CONFIG_ARM_COMPATIBLE_SEMIHOSTING),y)
-  *** SVE Floating Point Unary Operations Predicated Group
-  */
+ # Semihosting smoke test for linux-user
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
  FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
                  rn=%reg_movprfx
 +# SVE floating-point complex multiply-add (predicated)
 +FCMLA_zpzzz     01100100 esz:2 0 rm:5 0 rot:2 pg:3 rn:5 rd:5 \
 +                ra=%reg_movprfx
 +
  ### SVE FP Multiply-Add Indexed Group
  # SVE floating-point multiply-add (indexed)
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 46/55] target/arm: Add ARM_FEATURE_V7VE for v7 Virtualization Extensions
+[PULL 19/33] target/i386: Use assert() to sanity-check b1 in SSE decode
-From: Aaron Lindsay <alindsay@codeaurora.org>
+In the SSE decode function gen_sse(), we combine a byte
 'b' and a value 'b1' which can be [0..3], and switch on them:
    b |= (b1 << 8);
    switch (b) {
    ...
    default:
    unknown_op:
        gen_unknown_opcode(env, s);
        return;
    }
-Signed-off-by: Aaron Lindsay <alindsay@codeaurora.org>
+In three cases inside this switch, we were then also checking for
-Message-id: 1529699547-17044-5-git-send-email-alindsay@codeaurora.org
+ "if (b1 >= 2) { goto unknown_op; }".
 However, this can never happen, because the 'case' values in each place
 are 0x0nn or 0x1nn and the switch will have directed the b1 == (2, 3)
 cases to the default already.
 This check was added in commit c045af25a52e9 in 2010; the added code
 was unnecessary then as well, and was apparently intended only to
 ensure that we never accidentally ended up indexing off the end
 of an sse_op_table with only 2 entries as a result of future bugs
 in the decode logic.
 Change the checks to assert() instead, and make sure they're always
 immediately before the array access they are protecting.
 Fixes: Coverity CID 1460207
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/arm/cpu.h   |  1 +
+ target/i386/tcg/translate.c | 12 +++---------
- target/arm/cpu.c   | 21 ++++++++++++++-------
+file changed, 3 insertions(+), 9 deletions(-)
  target/arm/kvm32.c |  8 ++++----
 files changed, 19 insertions(+), 11 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/target/i386/tcg/translate.c
-+++ b/target/arm/cpu.h
++++ b/target/i386/tcg/translate.c
-@@ -XXX,XX +XXX,XX @@ enum arm_features {
+@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
-     ARM_FEATURE_OMAPCP, /* OMAP specific CP15 ops handling.  */
+         case 0x171: /* shift xmm, im */
-     ARM_FEATURE_THUMB2EE,
+         case 0x172:
-     ARM_FEATURE_V7MP,    /* v7 Multiprocessing Extensions */
+         case 0x173:
-+    ARM_FEATURE_V7VE, /* v7 Virtualization Extensions (non-EL2 parts) */
+-            if (b1 >= 2) {
-     ARM_FEATURE_V4T,
+-                goto unknown_op;
-     ARM_FEATURE_V5,
+-            }
-     ARM_FEATURE_STRONGARM,
+             val = x86_ldub_code(env, s);
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+             if (is_xmm) {
-index XXXXXXX..XXXXXXX 100644
+                 tcg_gen_movi_tl(s->T0, val);
---- a/target/arm/cpu.c
+@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
-+++ b/target/arm/cpu.c
+                                 offsetof(CPUX86State, mmx_t0.MMX_L(1)));
-@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
+                 op1_offset = offsetof(CPUX86State,mmx_t0);
+             }
-     /* Some features automatically imply others: */
++            assert(b1 < 2);
-     if (arm_feature(env, ARM_FEATURE_V8)) {
+             sse_fn_epp = sse_op_table2[((b - 1) & 3) * 8 +
--        set_feature(env, ARM_FEATURE_V7);
+                                        (((modrm >> 3)) & 7)][b1];
-+        set_feature(env, ARM_FEATURE_V7VE);
+             if (!sse_fn_epp) {
-+    }
+@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
-+    if (arm_feature(env, ARM_FEATURE_V7VE)) {
+             rm = modrm & 7;
-+        /* v7 Virtualization Extensions. In real hardware this implies
+             reg = ((modrm >> 3) & 7) | REX_R(s);
-+         * EL2 and also the presence of the Security Extensions.
+             mod = (modrm >> 6) & 3;
-+         * For QEMU, for backwards-compatibility we implement some
+-            if (b1 >= 2) {
-+         * CPUs or CPU configs which have no actual EL2 or EL3 but do
+-                goto unknown_op;
-+         * include the various other features that V7VE implies.
+-            }
-+         * Presence of EL2 itself is ARM_FEATURE_EL2, and of the
-+         * Security Extensions is ARM_FEATURE_EL3.
++            assert(b1 < 2);
-+         */
+             sse_fn_epp = sse_op_table6[b].op[b1];
-         set_feature(env, ARM_FEATURE_ARM_DIV);
+             if (!sse_fn_epp) {
-         set_feature(env, ARM_FEATURE_LPAE);
+                 goto unknown_op;
-+        set_feature(env, ARM_FEATURE_V7);
+@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
-     }
+             rm = modrm & 7;
-     if (arm_feature(env, ARM_FEATURE_V7)) {
+             reg = ((modrm >> 3) & 7) | REX_R(s);
-         set_feature(env, ARM_FEATURE_VAPA);
+             mod = (modrm >> 6) & 3;
-@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
+-            if (b1 >= 2) {
-     ARMCPU *cpu = ARM_CPU(obj);
+-                goto unknown_op;
+-            }
-     cpu->dtb_compatible = "arm,cortex-a7";
--    set_feature(&cpu->env, ARM_FEATURE_V7);
++            assert(b1 < 2);
-+    set_feature(&cpu->env, ARM_FEATURE_V7VE);
+             sse_fn_eppi = sse_op_table7[b].op[b1];
-     set_feature(&cpu->env, ARM_FEATURE_VFP4);
+             if (!sse_fn_eppi) {
-     set_feature(&cpu->env, ARM_FEATURE_NEON);
+                 goto unknown_op;
      set_feature(&cpu->env, ARM_FEATURE_THUMB2EE);
 -    set_feature(&cpu->env, ARM_FEATURE_ARM_DIV);
      set_feature(&cpu->env, ARM_FEATURE_GENERIC_TIMER);
      set_feature(&cpu->env, ARM_FEATURE_DUMMY_C15_REGS);
      set_feature(&cpu->env, ARM_FEATURE_CBAR_RO);
 -    set_feature(&cpu->env, ARM_FEATURE_LPAE);
      set_feature(&cpu->env, ARM_FEATURE_EL3);
      cpu->kvm_target = QEMU_KVM_ARM_TARGET_CORTEX_A7;
      cpu->midr = 0x410fc075;
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
      ARMCPU *cpu = ARM_CPU(obj);
      cpu->dtb_compatible = "arm,cortex-a15";
 -    set_feature(&cpu->env, ARM_FEATURE_V7);
 +    set_feature(&cpu->env, ARM_FEATURE_V7VE);
      set_feature(&cpu->env, ARM_FEATURE_VFP4);
      set_feature(&cpu->env, ARM_FEATURE_NEON);
      set_feature(&cpu->env, ARM_FEATURE_THUMB2EE);
 -    set_feature(&cpu->env, ARM_FEATURE_ARM_DIV);
      set_feature(&cpu->env, ARM_FEATURE_GENERIC_TIMER);
      set_feature(&cpu->env, ARM_FEATURE_DUMMY_C15_REGS);
      set_feature(&cpu->env, ARM_FEATURE_CBAR_RO);
 -    set_feature(&cpu->env, ARM_FEATURE_LPAE);
      set_feature(&cpu->env, ARM_FEATURE_EL3);
      cpu->kvm_target = QEMU_KVM_ARM_TARGET_CORTEX_A15;
      cpu->midr = 0x412fc0f1;
 diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/kvm32.c
 +++ b/target/arm/kvm32.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
      /* Now we've retrieved all the register information we can
       * set the feature bits based on the ID register fields.
       * We can assume any KVM supporting CPU is at least a v7
 -     * with VFPv3, LPAE and the generic timers; this in turn implies
 -     * most of the other feature bits, but a few must be tested.
 +     * with VFPv3, virtualization extensions, and the generic
 +     * timers; this in turn implies most of the other feature
 +     * bits, but a few must be tested.
       */
 -    set_feature(&features, ARM_FEATURE_V7);
 +    set_feature(&features, ARM_FEATURE_V7VE);
      set_feature(&features, ARM_FEATURE_VFP3);
 -    set_feature(&features, ARM_FEATURE_LPAE);
      set_feature(&features, ARM_FEATURE_GENERIC_TIMER);
      switch (extract32(id_isar0, 24, 4)) {
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 45/55] i.mx7d: Change IRQ number type from hwaddr to int
+[PULL 20/33] include/hw/i386: Don't include qemu-common.h in .h files
-From: Jean-Christophe Dubois <jcd@tribudubois.net>
+The qemu-common.h header is not supposed to be included from any
 other header files, only from .c files (as documented in a comment at
 the start of it).
-The qdev_get_gpio_in() function accept an int as second parameter.
+include/hw/i386/x86.h and include/hw/i386/microvm.h break this rule.
 In fact, the include is not required at all, so we can just drop it
 from both files.
-Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20211129200510.1233037-2-peter.maydell@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/fsl-imx7.c | 6 +++---
+ include/hw/i386/microvm.h | 1 -
-file changed, 3 insertions(+), 3 deletions(-)
+ include/hw/i386/x86.h     | 1 -
 files changed, 2 deletions(-)
-diff --git a/hw/arm/fsl-imx7.c b/hw/arm/fsl-imx7.c
+diff --git a/include/hw/i386/microvm.h b/include/hw/i386/microvm.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/fsl-imx7.c
+--- a/include/hw/i386/microvm.h
-+++ b/hw/arm/fsl-imx7.c
++++ b/include/hw/i386/microvm.h
-@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@
-             FSL_IMX7_ECSPI4_ADDR,
+ #ifndef HW_I386_MICROVM_H
-         };
+ #define HW_I386_MICROVM_H
--        static const hwaddr FSL_IMX7_SPIn_IRQ[FSL_IMX7_NUM_ECSPIS] = {
+-#include "qemu-common.h"
-+        static const int FSL_IMX7_SPIn_IRQ[FSL_IMX7_NUM_ECSPIS] = {
+ #include "exec/hwaddr.h"
-             FSL_IMX7_ECSPI1_IRQ,
+ #include "qemu/notify.h"
-             FSL_IMX7_ECSPI2_IRQ,
-             FSL_IMX7_ECSPI3_IRQ,
+diff --git a/include/hw/i386/x86.h b/include/hw/i386/x86.h
-@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
+index XXXXXXX..XXXXXXX 100644
-             FSL_IMX7_I2C4_ADDR,
+--- a/include/hw/i386/x86.h
-         };
++++ b/include/hw/i386/x86.h
+@@ -XXX,XX +XXX,XX @@
--        static const hwaddr FSL_IMX7_I2Cn_IRQ[FSL_IMX7_NUM_I2CS] = {
+ #ifndef HW_I386_X86_H
-+        static const int FSL_IMX7_I2Cn_IRQ[FSL_IMX7_NUM_I2CS] = {
+ #define HW_I386_X86_H
-             FSL_IMX7_I2C1_IRQ,
-             FSL_IMX7_I2C2_IRQ,
+-#include "qemu-common.h"
-             FSL_IMX7_I2C3_IRQ,
+ #include "exec/hwaddr.h"
-@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
+ #include "qemu/notify.h"
-             FSL_IMX7_USB3_ADDR,
          };
 -        static const hwaddr FSL_IMX7_USBn_IRQ[FSL_IMX7_NUM_USBS] = {
 +        static const int FSL_IMX7_USBn_IRQ[FSL_IMX7_NUM_USBS] = {
              FSL_IMX7_USB1_IRQ,
              FSL_IMX7_USB2_IRQ,
              FSL_IMX7_USB3_IRQ,
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 49/55] sd: Don't trace SDRequest crc field
+[PULL 21/33] target/hexagon/cpu.h: don't include qemu-common.h
-We don't actually implement SD command CRC checking, because
+The qemu-common.h header is not supposed to be included from any
-for almost all of our SD controllers the CRC generation is
+other header files, only from .c files (as documented in a comment at
-done in hardware, and so modelling CRC generation and checking
+the start of it).
 would be a bit pointless. (The exception is that milkymist-memcard
 makes the guest software compute the CRC.)
-As a result almost all of our SD controller models don't bother
+Move the include to linux-user/hexagon/cpu_loop.c, which needs it for
-to set the SDRequest crc field, and the SD card model doesn't
+the declaration of cpu_exec_step_atomic().
 check it. So the tracing of it in sdbus_do_command() provokes
 Coverity warnings about use of uninitialized data.
 Drop the CRC field from the trace; we can always add it back
 if and when we do anything useful with the CRC.
 Fixes Coverity issues 1386072, 1386074, 1386076, 1390571.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20180626180324.5537-1-peter.maydell@linaro.org
+Reviewed-by: Taylor Simpson <tsimpson@quicinc.com>
 Message-id: 20211129200510.1233037-3-peter.maydell@linaro.org
 ---
- hw/sd/core.c       | 2 +-
+ target/hexagon/cpu.h          | 1 -
- hw/sd/trace-events | 2 +-
+ linux-user/hexagon/cpu_loop.c | 1 +
-files changed, 2 insertions(+), 2 deletions(-)
+files changed, 1 insertion(+), 1 deletion(-)
-diff --git a/hw/sd/core.c b/hw/sd/core.c
+diff --git a/target/hexagon/cpu.h b/target/hexagon/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/sd/core.c
+--- a/target/hexagon/cpu.h
-+++ b/hw/sd/core.c
++++ b/target/hexagon/cpu.h
-@@ -XXX,XX +XXX,XX @@ int sdbus_do_command(SDBus *sdbus, SDRequest *req, uint8_t *response)
+@@ -XXX,XX +XXX,XX @@ typedef struct CPUHexagonState CPUHexagonState;
- {
-     SDState *card = get_card(sdbus);
+ #include "fpu/softfloat-types.h"
--    trace_sdbus_command(sdbus_name(sdbus), req->cmd, req->arg, req->crc);
+-#include "qemu-common.h"
-+    trace_sdbus_command(sdbus_name(sdbus), req->cmd, req->arg);
+ #include "exec/cpu-defs.h"
-     if (card) {
+ #include "hex_regs.h"
-         SDCardClass *sc = SD_CARD_GET_CLASS(card);
+ #include "mmvec/mmvec.h"
+diff --git a/linux-user/hexagon/cpu_loop.c b/linux-user/hexagon/cpu_loop.c
 diff --git a/hw/sd/trace-events b/hw/sd/trace-events
 index XXXXXXX..XXXXXXX 100644
---- a/hw/sd/trace-events
+--- a/linux-user/hexagon/cpu_loop.c
-+++ b/hw/sd/trace-events
++++ b/linux-user/hexagon/cpu_loop.c
-@@ -XXX,XX +XXX,XX @@ bcm2835_sdhost_edm_change(const char *why, uint32_t edm) "(%s) EDM now 0x%x"
+@@ -XXX,XX +XXX,XX @@
- bcm2835_sdhost_update_irq(uint32_t irq) "IRQ bits 0x%x\n"
+  */
- # hw/sd/core.c
+ #include "qemu/osdep.h"
--sdbus_command(const char *bus_name, uint8_t cmd, uint32_t arg, uint8_t crc) "@%s CMD%02d arg 0x%08x crc 0x%02x"
++#include "qemu-common.h"
-+sdbus_command(const char *bus_name, uint8_t cmd, uint32_t arg) "@%s CMD%02d arg 0x%08x"
+ #include "qemu.h"
- sdbus_read(const char *bus_name, uint8_t value) "@%s value 0x%02x"
+ #include "user-internals.h"
- sdbus_write(const char *bus_name, uint8_t value) "@%s value 0x%02x"
+ #include "cpu_loop-common.h"
  sdbus_set_voltage(const char *bus_name, uint16_t millivolts) "@%s %u (mV)"
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 43/55] i.mx7d: Remove unused header files
+[PULL 22/33] target/rx/cpu.h: Don't include qemu-common.h
-From: Jean-Christophe Dubois <jcd@tribudubois.net>
+The qemu-common.h header is not supposed to be included from any
 other header files, only from .c files (as documented in a comment at
 the start of it).
-Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
+Nothing actually relies on target/rx/cpu.h including it, so we can
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+just drop the include.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Taylor Simpson <tsimpson@quicinc.com>
+Reviewed-by: Yoshinori Sato <ysato@users.sourceforge.jp>
+Message-id: 20211129200510.1233037-4-peter.maydell@linaro.org
 ---
- hw/arm/mcimx7d-sabre.c | 2 --
+ target/rx/cpu.h | 1 -
-file changed, 2 deletions(-)
+file changed, 1 deletion(-)
-diff --git a/hw/arm/mcimx7d-sabre.c b/hw/arm/mcimx7d-sabre.c
+diff --git a/target/rx/cpu.h b/target/rx/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/mcimx7d-sabre.c
+--- a/target/rx/cpu.h
-+++ b/hw/arm/mcimx7d-sabre.c
++++ b/target/rx/cpu.h
 @@ -XXX,XX +XXX,XX @@
- #include "hw/arm/fsl-imx7.h"
+ #define RX_CPU_H
- #include "hw/boards.h"
- #include "sysemu/sysemu.h"
+ #include "qemu/bitops.h"
--#include "sysemu/device_tree.h"
+-#include "qemu-common.h"
- #include "qemu/error-report.h"
+ #include "hw/registerfields.h"
- #include "sysemu/qtest.h"
+ #include "cpu-qom.h"
--#include "net/net.h"
  typedef struct {
      FslIMX7State soc;
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 06/55] hw/arm/virt: Silence dtc /memory warning
+[PULL 23/33] hw/arm: Don't include qemu-common.h unnecessarily
-From: Eric Auger <eric.auger@redhat.com>
+A lot of C files in hw/arm include qemu-common.h when they don't
 need anything from it. Drop the include lines.
-When running dtc on the guest /proc/device-tree we get the
+omap1.c, pxa2xx.c and strongarm.c retain the include because they
-following warning: Warning (unit_address_vs_reg): Node /memory
+use it for the prototype of qemu_get_timedate().
 has a reg or ranges property, but no unit name".
-Let's fix that by adding the unit address to the node name. We also
-don't create the /memory node anymore in create_fdt(). We directly
-create it in load_dtb. /chosen still needs to be created in create_fdt
-as the uart needs it. In case the user provided his own dtb, we nop
-all memory nodes found in root and create new one(s).
-Signed-off-by: Eric Auger <eric.auger@redhat.com>
-Message-id: 1530044492-24921-4-git-send-email-eric.auger@redhat.com
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Taylor Simpson <tsimpson@quicinc.com>
+Reviewed-by: Yoshinori Sato <ysato@users.sourceforge.jp>
+Message-id: 20211129200510.1233037-5-peter.maydell@linaro.org
 ---
- hw/arm/boot.c | 41 +++++++++++++++++++++++------------------
+ hw/arm/boot.c           | 1 -
- hw/arm/virt.c |  7 +------
+ hw/arm/digic_boards.c   | 1 -
-files changed, 24 insertions(+), 24 deletions(-)
+ hw/arm/highbank.c       | 1 -
  hw/arm/npcm7xx_boards.c | 1 -
  hw/arm/sbsa-ref.c       | 1 -
  hw/arm/stm32f405_soc.c  | 1 -
  hw/arm/vexpress.c       | 1 -
  hw/arm/virt.c           | 1 -
 files changed, 8 deletions(-)
 diff --git a/hw/arm/boot.c b/hw/arm/boot.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/boot.c
 +++ b/hw/arm/boot.c
-@@ -XXX,XX +XXX,XX @@ int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
+@@ -XXX,XX +XXX,XX @@
-                  hwaddr addr_limit, AddressSpace *as)
+  */
- {
-     void *fdt = NULL;
+ #include "qemu/osdep.h"
--    int size, rc;
+-#include "qemu-common.h"
-+    int size, rc, n = 0;
+ #include "qemu/datadir.h"
-     uint32_t acells, scells;
+ #include "qemu/error-report.h"
-     char *nodename;
+ #include "qapi/error.h"
-     unsigned int i;
+diff --git a/hw/arm/digic_boards.c b/hw/arm/digic_boards.c
-     hwaddr mem_base, mem_len;
+index XXXXXXX..XXXXXXX 100644
-+    char **node_path;
+--- a/hw/arm/digic_boards.c
-+    Error *err = NULL;
++++ b/hw/arm/digic_boards.c
+@@ -XXX,XX +XXX,XX @@
-     if (binfo->dtb_filename) {
-         char *filename;
+ #include "qemu/osdep.h"
-@@ -XXX,XX +XXX,XX @@ int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
+ #include "qapi/error.h"
-         goto fail;
+-#include "qemu-common.h"
-     }
+ #include "qemu/datadir.h"
+ #include "hw/boards.h"
-+    /* nop all root nodes matching /memory or /memory@unit-address */
+ #include "qemu/error-report.h"
-+    node_path = qemu_fdt_node_unit_path(fdt, "memory", &err);
+diff --git a/hw/arm/highbank.c b/hw/arm/highbank.c
-+    if (err) {
+index XXXXXXX..XXXXXXX 100644
-+        error_report_err(err);
+--- a/hw/arm/highbank.c
-+        goto fail;
++++ b/hw/arm/highbank.c
-+    }
+@@ -XXX,XX +XXX,XX @@
-+    while (node_path[n]) {
+  */
-+        if (g_str_has_prefix(node_path[n], "/memory")) {
-+            qemu_fdt_nop_node(fdt, node_path[n]);
+ #include "qemu/osdep.h"
-+        }
+-#include "qemu-common.h"
-+        n++;
+ #include "qemu/datadir.h"
-+    }
+ #include "qapi/error.h"
-+    g_strfreev(node_path);
+ #include "hw/sysbus.h"
-+
+diff --git a/hw/arm/npcm7xx_boards.c b/hw/arm/npcm7xx_boards.c
-     if (nb_numa_nodes > 0) {
+index XXXXXXX..XXXXXXX 100644
--        /*
+--- a/hw/arm/npcm7xx_boards.c
--         * Turn the /memory node created before into a NOP node, then create
++++ b/hw/arm/npcm7xx_boards.c
--         * /memory@addr nodes for all numa nodes respectively.
+@@ -XXX,XX +XXX,XX @@
--         */
+ #include "hw/qdev-core.h"
--        qemu_fdt_nop_node(fdt, "/memory");
+ #include "hw/qdev-properties.h"
-         mem_base = binfo->loader_start;
+ #include "qapi/error.h"
-         for (i = 0; i < nb_numa_nodes; i++) {
+-#include "qemu-common.h"
-             mem_len = numa_info[i].node_mem;
+ #include "qemu/datadir.h"
-@@ -XXX,XX +XXX,XX @@ int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
+ #include "qemu/units.h"
-             g_free(nodename);
+ #include "sysemu/blockdev.h"
-         }
+diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
-     } else {
+index XXXXXXX..XXXXXXX 100644
--        Error *err = NULL;
+--- a/hw/arm/sbsa-ref.c
-+        nodename = g_strdup_printf("/memory@%" PRIx64, binfo->loader_start);
++++ b/hw/arm/sbsa-ref.c
-+        qemu_fdt_add_subnode(fdt, nodename);
+@@ -XXX,XX +XXX,XX @@
-+        qemu_fdt_setprop_string(fdt, nodename, "device_type", "memory");
+  */
--        rc = fdt_path_offset(fdt, "/memory");
+ #include "qemu/osdep.h"
--        if (rc < 0) {
+-#include "qemu-common.h"
--            qemu_fdt_add_subnode(fdt, "/memory");
+ #include "qemu/datadir.h"
--        }
+ #include "qapi/error.h"
--
+ #include "qemu/error-report.h"
--        if (!qemu_fdt_getprop(fdt, "/memory", "device_type", NULL, &err)) {
+diff --git a/hw/arm/stm32f405_soc.c b/hw/arm/stm32f405_soc.c
--            qemu_fdt_setprop_string(fdt, "/memory", "device_type", "memory");
+index XXXXXXX..XXXXXXX 100644
--        }
+--- a/hw/arm/stm32f405_soc.c
--
++++ b/hw/arm/stm32f405_soc.c
--        rc = qemu_fdt_setprop_sized_cells(fdt, "/memory", "reg",
+@@ -XXX,XX +XXX,XX @@
-+        rc = qemu_fdt_setprop_sized_cells(fdt, nodename, "reg",
-                                           acells, binfo->loader_start,
+ #include "qemu/osdep.h"
-                                           scells, binfo->ram_size);
+ #include "qapi/error.h"
-         if (rc < 0) {
+-#include "qemu-common.h"
--            fprintf(stderr, "couldn't set /memory/reg\n");
+ #include "exec/address-spaces.h"
-+            fprintf(stderr, "couldn't set %s reg\n", nodename);
+ #include "sysemu/sysemu.h"
-             goto fail;
+ #include "hw/arm/stm32f405_soc.h"
-         }
+diff --git a/hw/arm/vexpress.c b/hw/arm/vexpress.c
-+        g_free(nodename);
+index XXXXXXX..XXXXXXX 100644
-     }
+--- a/hw/arm/vexpress.c
++++ b/hw/arm/vexpress.c
-     rc = fdt_path_offset(fdt, "/chosen");
+@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "qapi/error.h"
 -#include "qemu-common.h"
  #include "qemu/datadir.h"
  #include "cpu.h"
  #include "hw/sysbus.h"
 diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt.c
 +++ b/hw/arm/virt.c
-@@ -XXX,XX +XXX,XX @@ static void create_fdt(VirtMachineState *vms)
+@@ -XXX,XX +XXX,XX @@
-     qemu_fdt_setprop_cell(fdt, "/", "#address-cells", 0x2);
+  */
-     qemu_fdt_setprop_cell(fdt, "/", "#size-cells", 0x2);
+ #include "qemu/osdep.h"
--    /*
+-#include "qemu-common.h"
--     * /chosen and /memory nodes must exist for load_dtb
+ #include "qemu/datadir.h"
--     * to fill in necessary properties later
+ #include "qemu/units.h"
--     */
+ #include "qemu/option.h"
 +    /* /chosen must exist for load_dtb to fill in necessary properties later */
      qemu_fdt_add_subnode(fdt, "/chosen");
 -    qemu_fdt_add_subnode(fdt, "/memory");
 -    qemu_fdt_setprop_string(fdt, "/memory", "device_type", "memory");
      /* Clock node, for the benefit of the UART. The kernel device tree
       * binding documentation claims the PL011 node clock properties are
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 48/55] target/arm: Mark PMINTENSET accesses as possibly doing IO
+[PULL 24/33] target/arm: Correct calculation of tlb range invalidate length
-From: Aaron Lindsay <alindsay@codeaurora.org>
+The calculation of the length of TLB range invalidate operations
 in tlbi_aa64_range_get_length() is incorrect in two ways:
  * the NUM field is 5 bits, but we read only 4 bits
  * we miscalculate the page_shift value, because of an
    off-by-one error:
     TG 0b00 is invalid
     TG 0b01 is 4K granule size == 4096 == 2^12
     TG 0b10 is 16K granule size == 16384 == 2^14
     TG 0b11 is 64K granule size == 65536 == 2^16
    so page_shift should be (TG - 1) * 2 + 12
-This makes it match its AArch64 equivalent, PMINTENSET_EL1
+Thanks to the bug report submitter Cha HyunSoo for identifying
 both these errors.
-Signed-off-by: Aaron Lindsay <alindsay@codeaurora.org>
+Fixes: 84940ed82552d3c ("target/arm: Add support for FEAT_TLBIRANGE")
-Message-id: 1529699547-17044-13-git-send-email-alindsay@codeaurora.org
+Resolves: https://gitlab.com/qemu-project/qemu/-/issues/734
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20211130173257.1274194-1-peter.maydell@linaro.org
 ---
- target/arm/helper.c | 2 +-
+ target/arm/helper.c | 6 +++---
-file changed, 1 insertion(+), 1 deletion(-)
+file changed, 3 insertions(+), 3 deletions(-)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
+@@ -XXX,XX +XXX,XX @@ static uint64_t tlbi_aa64_range_get_length(CPUARMState *env,
-       .writefn = pmuserenr_write, .raw_writefn = raw_write },
+     uint64_t exponent;
-     { .name = "PMINTENSET", .cp = 15, .crn = 9, .crm = 14, .opc1 = 0, .opc2 = 1,
+     uint64_t length;
-       .access = PL1_RW, .accessfn = access_tpm,
--      .type = ARM_CP_ALIAS,
+-    num = extract64(value, 39, 4);
-+      .type = ARM_CP_ALIAS | ARM_CP_IO,
++    num = extract64(value, 39, 5);
-       .fieldoffset = offsetoflow32(CPUARMState, cp15.c9_pminten),
+     scale = extract64(value, 44, 2);
-       .resetvalue = 0,
+     page_size_granule = extract64(value, 46, 2);
-       .writefn = pmintenset_write, .raw_writefn = raw_write },
 -    page_shift = page_size_granule * 2 + 12;
 -
      if (page_size_granule == 0) {
          qemu_log_mask(LOG_GUEST_ERROR, "Invalid page size granule %d\n",
                        page_size_granule);
          return 0;
      }
 +    page_shift = (page_size_granule - 1) * 2 + 12;
 +
      exponent = (5 * scale) + 1;
      length = (num + 1) << (exponent + page_shift);
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 33/55] target/arm: Implement SVE MOVPRFX
+[PULL 25/33] hw/net: npcm7xx_emc fix missing queue_flush
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Patrick Venture <venture@google.com>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+The rx_active boolean change to true should always trigger a try_read
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+call that flushes the queue.
-Message-id: 20180627043328.11531-28-richard.henderson@linaro.org
 Signed-off-by: Patrick Venture <venture@google.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20211203221002.1719306-1-venture@google.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-sve.c | 60 +++++++++++++++++++++++++++++++++++++-
+ hw/net/npcm7xx_emc.c | 18 ++++++++----------
- target/arm/sve.decode      |  7 +++++
+file changed, 8 insertions(+), 10 deletions(-)
 files changed, 66 insertions(+), 1 deletion(-)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
+diff --git a/hw/net/npcm7xx_emc.c b/hw/net/npcm7xx_emc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
+--- a/hw/net/npcm7xx_emc.c
-+++ b/target/arm/translate-sve.c
++++ b/hw/net/npcm7xx_emc.c
-@@ -XXX,XX +XXX,XX @@ static bool do_zpzz_ool(DisasContext *s, arg_rprr_esz *a, gen_helper_gvec_4 *fn)
+@@ -XXX,XX +XXX,XX @@ static void emc_halt_rx(NPCM7xxEMCState *emc, uint32_t mista_flag)
-     return true;
+     emc_set_mista(emc, mista_flag);
  }
-+/* Select active elememnts from Zn and inactive elements from Zm,
++static void emc_enable_rx_and_flush(NPCM7xxEMCState *emc)
 + * storing the result in Zd.
 + */
 +static void do_sel_z(DisasContext *s, int rd, int rn, int rm, int pg, int esz)
 +{
-+    static gen_helper_gvec_4 * const fns[4] = {
++    emc->rx_active = true;
-+        gen_helper_sve_sel_zpzz_b, gen_helper_sve_sel_zpzz_h,
++    qemu_flush_queued_packets(qemu_get_queue(emc->nic));
 +        gen_helper_sve_sel_zpzz_s, gen_helper_sve_sel_zpzz_d
 +    };
 +    unsigned vsz = vec_full_reg_size(s);
 +    tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
 +                       vec_full_reg_offset(s, rn),
 +                       vec_full_reg_offset(s, rm),
 +                       pred_full_reg_offset(s, pg),
 +                       vsz, vsz, 0, fns[esz]);
 +}
 +
- #define DO_ZPZZ(NAME, name) \
+ static void emc_set_next_tx_descriptor(NPCM7xxEMCState *emc,
- static bool trans_##NAME##_zpzz(DisasContext *s, arg_rprr_esz *a,         \
+                                        const NPCM7xxEMCTxDesc *tx_desc,
-                                 uint32_t insn)                            \
+                                        uint32_t desc_addr)
-@@ -XXX,XX +XXX,XX @@ static bool trans_UDIV_zpzz(DisasContext *s, arg_rprr_esz *a, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@ static ssize_t emc_receive(NetClientState *nc, const uint8_t *buf, size_t len1)
-     return do_zpzz_ool(s, a, fns[a->esz]);
+     return len;
  }
--DO_ZPZZ(SEL, sel)
+-static void emc_try_receive_next_packet(NPCM7xxEMCState *emc)
-+static bool trans_SEL_zpzz(DisasContext *s, arg_rprr_esz *a, uint32_t insn)
+-{
-+{
+-    if (emc_can_receive(qemu_get_queue(emc->nic))) {
-+    if (sve_access_check(s)) {
+-        qemu_flush_queued_packets(qemu_get_queue(emc->nic));
-+        do_sel_z(s, a->rd, a->rn, a->rm, a->pg, a->esz);
+-    }
-+    }
+-}
-+    return true;
+-
-+}
+ static uint64_t npcm7xx_emc_read(void *opaque, hwaddr offset, unsigned size)
+ {
- #undef DO_ZPZZ
+     NPCM7xxEMCState *emc = opaque;
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_emc_write(void *opaque, hwaddr offset,
-@@ -XXX,XX +XXX,XX @@ static bool trans_PRF_rr(DisasContext *s, arg_PRF_rr *a, uint32_t insn)
+             emc->regs[REG_MGSTA] |= REG_MGSTA_RXHA;
-     sve_access_check(s);
+         }
-     return true;
+         if (value & REG_MCMDR_RXON) {
- }
+-            emc->rx_active = true;
-+
++            emc_enable_rx_and_flush(emc);
-+/*
+         } else {
-+ * Move Prefix
+             emc_halt_rx(emc, 0);
-+ *
+         }
-+ * TODO: The implementation so far could handle predicated merging movprfx.
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_emc_write(void *opaque, hwaddr offset,
-+ * The helper functions as written take an extra source register to
+         break;
-+ * use in the operation, but the result is only written when predication
+     case REG_RSDR:
-+ * succeeds.  For unpredicated movprfx, we need to rearrange the helpers
+         if (emc->regs[REG_MCMDR] & REG_MCMDR_RXON) {
-+ * to allow the final write back to the destination to be unconditional.
+-            emc->rx_active = true;
-+ * For predicated zeroing movprfx, we need to rearrange the helpers to
+-            emc_try_receive_next_packet(emc);
-+ * allow the final write back to zero inactives.
++            emc_enable_rx_and_flush(emc);
-+ *
+         }
-+ * In the meantime, just emit the moves.
+         break;
-+ */
+     case REG_MIIDA:
 +
 +static bool trans_MOVPRFX(DisasContext *s, arg_MOVPRFX *a, uint32_t insn)
 +{
 +    return do_mov_z(s, a->rd, a->rn);
 +}
 +
 +static bool trans_MOVPRFX_m(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    if (sve_access_check(s)) {
 +        do_sel_z(s, a->rd, a->rn, a->rd, a->pg, a->esz);
 +    }
 +    return true;
 +}
 +
 +static bool trans_MOVPRFX_z(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    if (sve_access_check(s)) {
 +        do_movz_zpz(s, a->rd, a->rn, a->pg, a->esz);
 +    }
 +    return true;
 +}
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ ORV             00000100 .. 011 000 001 ... ..... .....         @rd_pg_rn
  EORV            00000100 .. 011 001 001 ... ..... .....         @rd_pg_rn
  ANDV            00000100 .. 011 010 001 ... ..... .....         @rd_pg_rn
 +# SVE constructive prefix (predicated)
 +MOVPRFX_z       00000100 .. 010 000 001 ... ..... .....         @rd_pg_rn
 +MOVPRFX_m       00000100 .. 010 001 001 ... ..... .....         @rd_pg_rn
 +
  # SVE integer add reduction (predicated)
  # Note that saddv requires size != 3.
  UADDV           00000100 .. 000 001 001 ... ..... .....         @rd_pg_rn
@@ -XXX,XX +XXX,XX @@ ADR_p64         00000100 11 1 ..... 1010 .. ..... .....         @rd_rn_msz_rm
  ### SVE Integer Misc - Unpredicated Group
 +# SVE constructive prefix (unpredicated)
 +MOVPRFX         00000100 00 1 00000 101111 rn:5 rd:5
 +
  # SVE floating-point exponential accelerator
  # Note esz != 0
  FEXPA           00000100 .. 1 00000 101110 ..... .....          @rd_rn
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 15/55] target/arm: Implement SVE load and broadcast element
+[PULL 26/33] hw/arm/virt-acpi-build: Add VIOT table for virtio-iommu
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+When a virtio-iommu is instantiated, describe it using the ACPI VIOT
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+table.
-Message-id: 20180627043328.11531-10-richard.henderson@linaro.org
 Acked-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
 Message-id: 20211210170415.583179-2-jean-philippe@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    |  5 +++
+ hw/arm/virt-acpi-build.c | 7 +++++++
- target/arm/sve_helper.c    | 41 +++++++++++++++++++++++++
+ hw/arm/Kconfig           | 1 +
- target/arm/translate-sve.c | 62 ++++++++++++++++++++++++++++++++++++++
+files changed, 8 insertions(+)
  target/arm/sve.decode      |  5 +++
 files changed, 113 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/hw/arm/virt-acpi-build.c
-+++ b/target/arm/helper-sve.h
++++ b/hw/arm/virt-acpi-build.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sve_clr_h, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_3(sve_clr_s, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ #include "kvm_arm.h"
- DEF_HELPER_FLAGS_3(sve_clr_d, TCG_CALL_NO_RWG, void, ptr, ptr, i32)
+ #include "migration/vmstate.h"
+ #include "hw/acpi/ghes.h"
-+DEF_HELPER_FLAGS_4(sve_movz_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++#include "hw/acpi/viot.h"
-+DEF_HELPER_FLAGS_4(sve_movz_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_movz_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ #define ARM_SPI_BASE 32
-+DEF_HELPER_FLAGS_4(sve_movz_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
+@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
  DEF_HELPER_FLAGS_4(sve_asr_zpzi_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(sve_asr_zpzi_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(sve_asr_zpzi_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_clr_d)(void *vd, void *vg, uint32_t desc)
      }
- }
+ #endif
-+/* Copy Zn into Zd, and store zero into inactive elements.  */
++    if (vms->iommu == VIRT_IOMMU_VIRTIO) {
-+void HELPER(sve_movz_b)(void *vd, void *vn, void *vg, uint32_t desc)
++        acpi_add_table(table_offsets, tables_blob);
-+{
++        build_viot(ms, tables_blob, tables->linker, vms->virtio_iommu_bdf,
-+    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
++                   vms->oem_id, vms->oem_table_id);
 +    uint64_t *d = vd, *n = vn;
 +    uint8_t *pg = vg;
 +    for (i = 0; i < opr_sz; i += 1) {
 +        d[i] = n[i] & expand_pred_b(pg[H1(i)]);
 +    }
 +}
 +
 +void HELPER(sve_movz_h)(void *vd, void *vn, void *vg, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 +    uint64_t *d = vd, *n = vn;
 +    uint8_t *pg = vg;
 +    for (i = 0; i < opr_sz; i += 1) {
 +        d[i] = n[i] & expand_pred_h(pg[H1(i)]);
 +    }
 +}
 +
 +void HELPER(sve_movz_s)(void *vd, void *vn, void *vg, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 +    uint64_t *d = vd, *n = vn;
 +    uint8_t *pg = vg;
 +    for (i = 0; i < opr_sz; i += 1) {
 +        d[i] = n[i] & expand_pred_s(pg[H1(i)]);
 +    }
 +}
 +
 +void HELPER(sve_movz_d)(void *vd, void *vn, void *vg, uint32_t desc)
 +{
 +    intptr_t i, opr_sz = simd_oprsz(desc) / 8;
 +    uint64_t *d = vd, *n = vn;
 +    uint8_t *pg = vg;
 +    for (i = 0; i < opr_sz; i += 1) {
 +        d[i] = n[1] & -(uint64_t)(pg[H1(i)] & 1);
 +    }
 +}
 +
  /* Three-operand expander, immediate operand, controlled by a predicate.
   */
  #define DO_ZPZI(NAME, TYPE, H, OP)                              \
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool do_clr_zp(DisasContext *s, int rd, int pg, int esz)
      return true;
  }
 +/* Copy Zn into Zd, storing zeros into inactive elements.  */
 +static void do_movz_zpz(DisasContext *s, int rd, int rn, int pg, int esz)
 +{
 +    static gen_helper_gvec_3 * const fns[4] = {
 +        gen_helper_sve_movz_b, gen_helper_sve_movz_h,
 +        gen_helper_sve_movz_s, gen_helper_sve_movz_d,
 +    };
 +    unsigned vsz = vec_full_reg_size(s);
 +    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
 +                       vec_full_reg_offset(s, rn),
 +                       pred_full_reg_offset(s, pg),
 +                       vsz, vsz, 0, fns[esz]);
 +}
 +
  static bool do_zpzi_ool(DisasContext *s, arg_rpri_esz *a,
                          gen_helper_gvec_3 *fn)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_LD1RQ_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
      return true;
  }
 +/* Load and broadcast element.  */
 +static bool trans_LD1R_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
 +{
 +    if (!sve_access_check(s)) {
 +        return true;
 +    }
 +
-+    unsigned vsz = vec_full_reg_size(s);
+     /* XSDT is pointed to by RSDP */
-+    unsigned psz = pred_full_reg_size(s);
+     xsdt = tables_blob->len;
-+    unsigned esz = dtype_esz[a->dtype];
+     build_xsdt(tables_blob, tables->linker, table_offsets, vms->oem_id,
-+    TCGLabel *over = gen_new_label();
+diff --git a/hw/arm/Kconfig b/hw/arm/Kconfig
 +    TCGv_i64 temp;
 +
 +    /* If the guarding predicate has no bits set, no load occurs.  */
 +    if (psz <= 8) {
 +        /* Reduce the pred_esz_masks value simply to reduce the
 +         * size of the code generated here.
 +         */
 +        uint64_t psz_mask = MAKE_64BIT_MASK(0, psz * 8);
 +        temp = tcg_temp_new_i64();
 +        tcg_gen_ld_i64(temp, cpu_env, pred_full_reg_offset(s, a->pg));
 +        tcg_gen_andi_i64(temp, temp, pred_esz_masks[esz] & psz_mask);
 +        tcg_gen_brcondi_i64(TCG_COND_EQ, temp, 0, over);
 +        tcg_temp_free_i64(temp);
 +    } else {
 +        TCGv_i32 t32 = tcg_temp_new_i32();
 +        find_last_active(s, t32, esz, a->pg);
 +        tcg_gen_brcondi_i32(TCG_COND_LT, t32, 0, over);
 +        tcg_temp_free_i32(t32);
 +    }
 +
 +    /* Load the data.  */
 +    temp = tcg_temp_new_i64();
 +    tcg_gen_addi_i64(temp, cpu_reg_sp(s, a->rn), a->imm << esz);
 +    tcg_gen_qemu_ld_i64(temp, temp, get_mem_index(s),
 +                        s->be_data | dtype_mop[a->dtype]);
 +
 +    /* Broadcast to *all* elements.  */
 +    tcg_gen_gvec_dup_i64(esz, vec_full_reg_offset(s, a->rd),
 +                         vsz, vsz, temp);
 +    tcg_temp_free_i64(temp);
 +
 +    /* Zero the inactive elements.  */
 +    gen_set_label(over);
 +    do_movz_zpz(s, a->rd, a->rd, a->pg, esz);
 +    return true;
 +}
 +
  static void do_st_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
                        int msz, int esz, int nreg)
  {
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
+--- a/hw/arm/Kconfig
-+++ b/target/arm/sve.decode
++++ b/hw/arm/Kconfig
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ config ARM_VIRT
- %imm8_16_10     16:5 10:3
+     select DIMM
- %imm9_16_10     16:s6 10:3
+     select ACPI_HW_REDUCED
- %size_23        23:2
+     select ACPI_APEI
-+%dtype_23_13    23:2 13:2
++    select ACPI_VIOT
- # A combination of tsz:imm3 -- extract esize.
+ config CHEETAH
- %tszimm_esz     22:2 5:5 !function=tszimm_esz
+     bool
@@ -XXX,XX +XXX,XX @@ LDR_pri         10000101 10 ...... 000 ... ..... 0 ....         @pd_rn_i9
  # SVE load vector register
  LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
 +# SVE load and broadcast element
 +LD1R_zpri       1000010 .. 1 imm:6 1.. pg:3 rn:5 rd:5 \
 +                &rpri_load dtype=%dtype_23_13 nreg=0
 +
  ### SVE Memory Contiguous Load Group
  # SVE contiguous load (scalar plus scalar)
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 05/55] hw/arm/virt: Silence dtc /intc warnings
+[PULL 27/33] hw/arm/virt: Remove device tree restriction for virtio-iommu
-From: Eric Auger <eric.auger@redhat.com>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-When running dtc on the guest /proc/device-tree we get the
+virtio-iommu is now supported with ACPI VIOT as well as device tree.
-following warnings: "Warning (unit_address_vs_reg): Node <name>
+Remove the restriction that prevents from instantiating a virtio-iommu
-has a reg or ranges property, but no unit name", with name:
+device under ACPI.
 /intc, /intc/its, /intc/v2m.
-Nodes should have a name in the form <name>[@<unit-address>] where
+Acked-by: Igor Mammedov <imammedo@redhat.com>
-unit-address is the primary address used to access the device, listed
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
-in the node's reg property. This fix seems to make dtc happy.
+Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
+Message-id: 20211210170415.583179-3-jean-philippe@linaro.org
 Signed-off-by: Eric Auger <eric.auger@redhat.com>
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Message-id: 1530044492-24921-3-git-send-email-eric.auger@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/virt.c | 63 +++++++++++++++++++++++++++++++--------------------
+ hw/arm/virt.c                | 10 ++--------
-file changed, 39 insertions(+), 24 deletions(-)
+ hw/virtio/virtio-iommu-pci.c | 12 ++----------
 files changed, 4 insertions(+), 18 deletions(-)
 diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt.c
 +++ b/hw/arm/virt.c
-@@ -XXX,XX +XXX,XX @@ static void fdt_add_cpu_nodes(const VirtMachineState *vms)
+@@ -XXX,XX +XXX,XX @@ static HotplugHandler *virt_machine_get_hotplug_handler(MachineState *machine,
+     MachineClass *mc = MACHINE_GET_CLASS(machine);
- static void fdt_add_its_gic_node(VirtMachineState *vms)
- {
+     if (device_is_dynamic_sysbus(mc, dev) ||
-+    char *nodename;
+-       (object_dynamic_cast(OBJECT(dev), TYPE_PC_DIMM))) {
-+
++        object_dynamic_cast(OBJECT(dev), TYPE_PC_DIMM) ||
-     vms->msi_phandle = qemu_fdt_alloc_phandle(vms->fdt);
++        object_dynamic_cast(OBJECT(dev), TYPE_VIRTIO_IOMMU_PCI)) {
--    qemu_fdt_add_subnode(vms->fdt, "/intc/its");
+         return HOTPLUG_HANDLER(machine);
--    qemu_fdt_setprop_string(vms->fdt, "/intc/its", "compatible",
+     }
-+    nodename = g_strdup_printf("/intc/its@%" PRIx64,
+-    if (object_dynamic_cast(OBJECT(dev), TYPE_VIRTIO_IOMMU_PCI)) {
-+                               vms->memmap[VIRT_GIC_ITS].base);
+-        VirtMachineState *vms = VIRT_MACHINE(machine);
-+    qemu_fdt_add_subnode(vms->fdt, nodename);
+-
-+    qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
+-        if (!vms->bootinfo.firmware_loaded || !virt_is_acpi_enabled(vms)) {
-                             "arm,gic-v3-its");
+-            return HOTPLUG_HANDLER(machine);
--    qemu_fdt_setprop(vms->fdt, "/intc/its", "msi-controller", NULL, 0);
+-        }
--    qemu_fdt_setprop_sized_cells(vms->fdt, "/intc/its", "reg",
+-    }
-+    qemu_fdt_setprop(vms->fdt, nodename, "msi-controller", NULL, 0);
+     return NULL;
 +    qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
 , vms->memmap[VIRT_GIC_ITS].base,
 , vms->memmap[VIRT_GIC_ITS].size);
 -    qemu_fdt_setprop_cell(vms->fdt, "/intc/its", "phandle", vms->msi_phandle);
 +    qemu_fdt_setprop_cell(vms->fdt, nodename, "phandle", vms->msi_phandle);
 +    g_free(nodename);
  }
- static void fdt_add_v2m_gic_node(VirtMachineState *vms)
+diff --git a/hw/virtio/virtio-iommu-pci.c b/hw/virtio/virtio-iommu-pci.c
- {
+index XXXXXXX..XXXXXXX 100644
-+    char *nodename;
+--- a/hw/virtio/virtio-iommu-pci.c
-+
++++ b/hw/virtio/virtio-iommu-pci.c
-+    nodename = g_strdup_printf("/intc/v2m@%" PRIx64,
+@@ -XXX,XX +XXX,XX @@ static void virtio_iommu_pci_realize(VirtIOPCIProxy *vpci_dev, Error **errp)
-+                               vms->memmap[VIRT_GIC_V2M].base);
+     VirtIOIOMMU *s = VIRTIO_IOMMU(vdev);
-     vms->msi_phandle = qemu_fdt_alloc_phandle(vms->fdt);
--    qemu_fdt_add_subnode(vms->fdt, "/intc/v2m");
+     if (!qdev_get_machine_hotplug_handler(DEVICE(vpci_dev))) {
--    qemu_fdt_setprop_string(vms->fdt, "/intc/v2m", "compatible",
+-        MachineClass *mc = MACHINE_GET_CLASS(qdev_get_machine());
-+    qemu_fdt_add_subnode(vms->fdt, nodename);
+-
-+    qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
+-        error_setg(errp,
-                             "arm,gic-v2m-frame");
+-                   "%s machine fails to create iommu-map device tree bindings",
--    qemu_fdt_setprop(vms->fdt, "/intc/v2m", "msi-controller", NULL, 0);
+-                   mc->name);
--    qemu_fdt_setprop_sized_cells(vms->fdt, "/intc/v2m", "reg",
+-        error_append_hint(errp,
-+    qemu_fdt_setprop(vms->fdt, nodename, "msi-controller", NULL, 0);
+-                          "Check your machine implements a hotplug handler "
-+    qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
+-                          "for the virtio-iommu-pci device\n");
-, vms->memmap[VIRT_GIC_V2M].base,
+-        error_append_hint(errp, "Check the guest is booted without FW or with "
-, vms->memmap[VIRT_GIC_V2M].size);
+-                          "-no-acpi\n");
--    qemu_fdt_setprop_cell(vms->fdt, "/intc/v2m", "phandle", vms->msi_phandle);
++        error_setg(errp, "Check your machine implements a hotplug handler "
-+    qemu_fdt_setprop_cell(vms->fdt, nodename, "phandle", vms->msi_phandle);
++                         "for the virtio-iommu-pci device");
-+    g_free(nodename);
+         return;
  }
  static void fdt_add_gic_node(VirtMachineState *vms)
  {
 +    char *nodename;
 +
      vms->gic_phandle = qemu_fdt_alloc_phandle(vms->fdt);
      qemu_fdt_setprop_cell(vms->fdt, "/", "interrupt-parent", vms->gic_phandle);
 -    qemu_fdt_add_subnode(vms->fdt, "/intc");
 -    qemu_fdt_setprop_cell(vms->fdt, "/intc", "#interrupt-cells", 3);
 -    qemu_fdt_setprop(vms->fdt, "/intc", "interrupt-controller", NULL, 0);
 -    qemu_fdt_setprop_cell(vms->fdt, "/intc", "#address-cells", 0x2);
 -    qemu_fdt_setprop_cell(vms->fdt, "/intc", "#size-cells", 0x2);
 -    qemu_fdt_setprop(vms->fdt, "/intc", "ranges", NULL, 0);
 +    nodename = g_strdup_printf("/intc@%" PRIx64,
 +                               vms->memmap[VIRT_GIC_DIST].base);
 +    qemu_fdt_add_subnode(vms->fdt, nodename);
 +    qemu_fdt_setprop_cell(vms->fdt, nodename, "#interrupt-cells", 3);
 +    qemu_fdt_setprop(vms->fdt, nodename, "interrupt-controller", NULL, 0);
 +    qemu_fdt_setprop_cell(vms->fdt, nodename, "#address-cells", 0x2);
 +    qemu_fdt_setprop_cell(vms->fdt, nodename, "#size-cells", 0x2);
 +    qemu_fdt_setprop(vms->fdt, nodename, "ranges", NULL, 0);
      if (vms->gic_version == 3) {
          int nb_redist_regions = virt_gicv3_redist_region_count(vms);
 -        qemu_fdt_setprop_string(vms->fdt, "/intc", "compatible",
 +        qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
                                  "arm,gic-v3");
 -        qemu_fdt_setprop_cell(vms->fdt, "/intc",
 +        qemu_fdt_setprop_cell(vms->fdt, nodename,
                                "#redistributor-regions", nb_redist_regions);
          if (nb_redist_regions == 1) {
 -            qemu_fdt_setprop_sized_cells(vms->fdt, "/intc", "reg",
 +            qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
 , vms->memmap[VIRT_GIC_DIST].base,
 , vms->memmap[VIRT_GIC_DIST].size,
 , vms->memmap[VIRT_GIC_REDIST].base,
 , vms->memmap[VIRT_GIC_REDIST].size);
          } else {
 -            qemu_fdt_setprop_sized_cells(vms->fdt, "/intc", "reg",
 +            qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
 , vms->memmap[VIRT_GIC_DIST].base,
 , vms->memmap[VIRT_GIC_DIST].size,
 , vms->memmap[VIRT_GIC_REDIST].base,
@@ -XXX,XX +XXX,XX @@ static void fdt_add_gic_node(VirtMachineState *vms)
          }
          if (vms->virt) {
 -            qemu_fdt_setprop_cells(vms->fdt, "/intc", "interrupts",
 +            qemu_fdt_setprop_cells(vms->fdt, nodename, "interrupts",
                                     GIC_FDT_IRQ_TYPE_PPI, ARCH_GICV3_MAINT_IRQ,
                                     GIC_FDT_IRQ_FLAGS_LEVEL_HI);
          }
      } else {
          /* 'cortex-a15-gic' means 'GIC v2' */
 -        qemu_fdt_setprop_string(vms->fdt, "/intc", "compatible",
 +        qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
                                  "arm,cortex-a15-gic");
 -        qemu_fdt_setprop_sized_cells(vms->fdt, "/intc", "reg",
 +        qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
 , vms->memmap[VIRT_GIC_DIST].base,
 , vms->memmap[VIRT_GIC_DIST].size,
 , vms->memmap[VIRT_GIC_CPU].base,
 , vms->memmap[VIRT_GIC_CPU].size);
      }
+     for (int i = 0; i < s->nb_reserved_regions; i++) {
 -    qemu_fdt_setprop_cell(vms->fdt, "/intc", "phandle", vms->gic_phandle);
 +    qemu_fdt_setprop_cell(vms->fdt, nodename, "phandle", vms->gic_phandle);
 +    g_free(nodename);
  }
  static void fdt_add_pmu_nodes(const VirtMachineState *vms)
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 40/55] target/arm: Enable SVE for aarch64-linux-user
+[PULL 28/33] hw/arm/virt: Reject instantiation of multiple IOMMUs
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Enable ARM_FEATURE_SVE for the generic "max" cpu.
+We do not support instantiating multiple IOMMUs. Before adding a
 virtio-iommu, check that no other IOMMU is present. This will detect
 both "iommu=smmuv3" machine parameter and another virtio-iommu instance.
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Fixes: 70e89132c9 ("hw/arm/virt: Add the virtio-iommu device tree mappings")
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Igor Mammedov <imammedo@redhat.com>
-Message-id: 20180627043328.11531-35-richard.henderson@linaro.org
+Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
 Message-id: 20211210170415.583179-4-jean-philippe@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- linux-user/elfload.c | 1 +
+ hw/arm/virt.c | 5 +++++
- target/arm/cpu.c     | 7 +++++++
+file changed, 5 insertions(+)
  target/arm/cpu64.c   | 1 +
 files changed, 9 insertions(+)
-diff --git a/linux-user/elfload.c b/linux-user/elfload.c
+diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/linux-user/elfload.c
+--- a/hw/arm/virt.c
-+++ b/linux-user/elfload.c
++++ b/hw/arm/virt.c
-@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
+@@ -XXX,XX +XXX,XX @@ static void virt_machine_device_pre_plug_cb(HotplugHandler *hotplug_dev,
-     GET_FEATURE(ARM_FEATURE_V8_ATOMICS, ARM_HWCAP_A64_ATOMICS);
+         hwaddr db_start = 0, db_end = 0;
-     GET_FEATURE(ARM_FEATURE_V8_RDM, ARM_HWCAP_A64_ASIMDRDM);
+         char *resv_prop_str;
-     GET_FEATURE(ARM_FEATURE_V8_FCMA, ARM_HWCAP_A64_FCMA);
-+    GET_FEATURE(ARM_FEATURE_SVE, ARM_HWCAP_A64_SVE);
++        if (vms->iommu != VIRT_IOMMU_NONE) {
- #undef GET_FEATURE
++            error_setg(errp, "virt machine does not support multiple IOMMUs");
++            return;
-     return hwcaps;
++        }
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
++
-index XXXXXXX..XXXXXXX 100644
+         switch (vms->msi_controller) {
---- a/target/arm/cpu.c
+         case VIRT_MSI_CTRL_NONE:
-+++ b/target/arm/cpu.c
+             return;
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
          env->cp15.sctlr_el[1] |= SCTLR_UCT | SCTLR_UCI | SCTLR_DZE;
          /* and to the FP/Neon instructions */
          env->cp15.cpacr_el1 = deposit64(env->cp15.cpacr_el1, 20, 2, 3);
 +        /* and to the SVE instructions */
 +        env->cp15.cpacr_el1 = deposit64(env->cp15.cpacr_el1, 16, 2, 3);
 +        env->cp15.cptr_el[3] |= CPTR_EZ;
 +        /* with maximum vector length */
 +        env->vfp.zcr_el[1] = ARM_MAX_VQ - 1;
 +        env->vfp.zcr_el[2] = ARM_MAX_VQ - 1;
 +        env->vfp.zcr_el[3] = ARM_MAX_VQ - 1;
  #else
          /* Reset into the highest available EL */
          if (arm_feature(env, ARM_FEATURE_EL3)) {
 diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu64.c
 +++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
          set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
          set_feature(&cpu->env, ARM_FEATURE_V8_FP16);
          set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
 +        set_feature(&cpu->env, ARM_FEATURE_SVE);
          /* For usermode -cpu max we can use a larger and more efficient DCZ
           * blocksize since we don't have to follow what the hardware does.
           */
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 34/55] target/arm: Implement SVE floating-point complex add
+[PULL 29/33] hw/arm/virt: Use object_property_set instead of qdev_prop_set
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+To propagate errors to the caller of the pre_plug callback, use the
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+object_poperty_set*() functions directly instead of the qdev_prop_set*()
-Message-id: 20180627043328.11531-29-richard.henderson@linaro.org
+helpers.
 Suggested-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
 Message-id: 20211210170415.583179-5-jean-philippe@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    |   7 +++
+ hw/arm/virt.c | 5 +++--
- target/arm/sve_helper.c    | 100 +++++++++++++++++++++++++++++++++++++
+file changed, 3 insertions(+), 2 deletions(-)
  target/arm/translate-sve.c |  24 +++++++++
  target/arm/sve.decode      |   4 ++
 files changed, 135 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/hw/arm/virt.c
-+++ b/target/arm/helper-sve.h
++++ b/hw/arm/virt.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(sve_facgt_s, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ static void virt_machine_device_pre_plug_cb(HotplugHandler *hotplug_dev,
- DEF_HELPER_FLAGS_6(sve_facgt_d, TCG_CALL_NO_RWG,
+                                         db_start, db_end,
-                    void, ptr, ptr, ptr, ptr, ptr, i32)
+                                         VIRTIO_IOMMU_RESV_MEM_T_MSI);
-+DEF_HELPER_FLAGS_6(sve_fcadd_h, TCG_CALL_NO_RWG,
+-        qdev_prop_set_uint32(dev, "len-reserved-regions", 1);
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
+-        qdev_prop_set_string(dev, "reserved-regions[0]", resv_prop_str);
-+DEF_HELPER_FLAGS_6(sve_fcadd_s, TCG_CALL_NO_RWG,
++        object_property_set_uint(OBJECT(dev), "len-reserved-regions", 1, errp);
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
++        object_property_set_str(OBJECT(dev), "reserved-regions[0]",
-+DEF_HELPER_FLAGS_6(sve_fcadd_d, TCG_CALL_NO_RWG,
++                                resv_prop_str, errp);
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
+         g_free(resv_prop_str);
 +
  DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
  DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
  DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
 diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_ftmad_d)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
      }
  }
-+/*
-+ * FP Complex Add
-+ */
-+
-+void HELPER(sve_fcadd_h)(void *vd, void *vn, void *vm, void *vg,
-+                         void *vs, uint32_t desc)
-+{
-+    intptr_t j, i = simd_oprsz(desc);
-+    uint64_t *g = vg;
-+    float16 neg_imag = float16_set_sign(0, simd_data(desc));
-+    float16 neg_real = float16_chs(neg_imag);
-+
-+    do {
-+        uint64_t pg = g[(i - 1) >> 6];
-+        do {
-+            float16 e0, e1, e2, e3;
-+
-+            /* I holds the real index; J holds the imag index.  */
-+            j = i - sizeof(float16);
-+            i -= 2 * sizeof(float16);
-+
-+            e0 = *(float16 *)(vn + H1_2(i));
-+            e1 = *(float16 *)(vm + H1_2(j)) ^ neg_real;
-+            e2 = *(float16 *)(vn + H1_2(j));
-+            e3 = *(float16 *)(vm + H1_2(i)) ^ neg_imag;
-+
-+            if (likely((pg >> (i & 63)) & 1)) {
-+                *(float16 *)(vd + H1_2(i)) = float16_add(e0, e1, vs);
-+            }
-+            if (likely((pg >> (j & 63)) & 1)) {
-+                *(float16 *)(vd + H1_2(j)) = float16_add(e2, e3, vs);
-+            }
-+        } while (i & 63);
-+    } while (i != 0);
-+}
-+
-+void HELPER(sve_fcadd_s)(void *vd, void *vn, void *vm, void *vg,
-+                         void *vs, uint32_t desc)
-+{
-+    intptr_t j, i = simd_oprsz(desc);
-+    uint64_t *g = vg;
-+    float32 neg_imag = float32_set_sign(0, simd_data(desc));
-+    float32 neg_real = float32_chs(neg_imag);
-+
-+    do {
-+        uint64_t pg = g[(i - 1) >> 6];
-+        do {
-+            float32 e0, e1, e2, e3;
-+
-+            /* I holds the real index; J holds the imag index.  */
-+            j = i - sizeof(float32);
-+            i -= 2 * sizeof(float32);
-+
-+            e0 = *(float32 *)(vn + H1_2(i));
-+            e1 = *(float32 *)(vm + H1_2(j)) ^ neg_real;
-+            e2 = *(float32 *)(vn + H1_2(j));
-+            e3 = *(float32 *)(vm + H1_2(i)) ^ neg_imag;
-+
-+            if (likely((pg >> (i & 63)) & 1)) {
-+                *(float32 *)(vd + H1_2(i)) = float32_add(e0, e1, vs);
-+            }
-+            if (likely((pg >> (j & 63)) & 1)) {
-+                *(float32 *)(vd + H1_2(j)) = float32_add(e2, e3, vs);
-+            }
-+        } while (i & 63);
-+    } while (i != 0);
-+}
-+
-+void HELPER(sve_fcadd_d)(void *vd, void *vn, void *vm, void *vg,
-+                         void *vs, uint32_t desc)
-+{
-+    intptr_t j, i = simd_oprsz(desc);
-+    uint64_t *g = vg;
-+    float64 neg_imag = float64_set_sign(0, simd_data(desc));
-+    float64 neg_real = float64_chs(neg_imag);
-+
-+    do {
-+        uint64_t pg = g[(i - 1) >> 6];
-+        do {
-+            float64 e0, e1, e2, e3;
-+
-+            /* I holds the real index; J holds the imag index.  */
-+            j = i - sizeof(float64);
-+            i -= 2 * sizeof(float64);
-+
-+            e0 = *(float64 *)(vn + H1_2(i));
-+            e1 = *(float64 *)(vm + H1_2(j)) ^ neg_real;
-+            e2 = *(float64 *)(vn + H1_2(j));
-+            e3 = *(float64 *)(vm + H1_2(i)) ^ neg_imag;
-+
-+            if (likely((pg >> (i & 63)) & 1)) {
-+                *(float64 *)(vd + H1_2(i)) = float64_add(e0, e1, vs);
-+            }
-+            if (likely((pg >> (j & 63)) & 1)) {
-+                *(float64 *)(vd + H1_2(j)) = float64_add(e2, e3, vs);
-+            }
-+        } while (i & 63);
-+    } while (i != 0);
-+}
-+
- /*
-  * Load contiguous data, protected by a governing predicate.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_FPCMP(FACGT, facgt)
- #undef DO_FPCMP
-+static bool trans_FCADD(DisasContext *s, arg_FCADD *a, uint32_t insn)
-+{
-+    static gen_helper_gvec_4_ptr * const fns[3] = {
-+        gen_helper_sve_fcadd_h,
-+        gen_helper_sve_fcadd_s,
-+        gen_helper_sve_fcadd_d
-+    };
-+
-+    if (a->esz == 0) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        unsigned vsz = vec_full_reg_size(s);
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
-+        tcg_gen_gvec_4_ptr(vec_full_reg_offset(s, a->rd),
-+                           vec_full_reg_offset(s, a->rn),
-+                           vec_full_reg_offset(s, a->rm),
-+                           pred_full_reg_offset(s, a->pg),
-+                           status, vsz, vsz, a->rot, fns[a->esz - 1]);
-+        tcg_temp_free_ptr(status);
-+    }
-+    return true;
-+}
-+
- typedef void gen_helper_sve_fmla(TCGv_env, TCGv_ptr, TCGv_i32);
- static bool do_fmla(DisasContext *s, arg_rprrr_esz *a, gen_helper_sve_fmla *fn)
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ UMIN_zzi        00100101 .. 101 011 110 ........ .....          @rdn_i8u
- # SVE integer multiply immediate (unpredicated)
- MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
-+# SVE floating-point complex add (predicated)
-+FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
-+                rn=%reg_movprfx
-+
- ### SVE FP Multiply-Add Indexed Group
- # SVE floating-point multiply-add (indexed)
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 31/55] target/arm: Implement SVE floating-point round to integral value
+[PULL 30/33] tests/acpi: allow updates of VIOT expected data files
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Create empty data files and allow updates for the upcoming VIOT tests.
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-26-richard.henderson@linaro.org
+Acked-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
 Message-id: 20211210170415.583179-6-jean-philippe@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    | 14 +++++++
+ tests/qtest/bios-tables-test-allowed-diff.h | 3 +++
- target/arm/sve_helper.c    |  8 ++++
+ tests/data/acpi/q35/DSDT.viot               | 0
- target/arm/translate-sve.c | 77 ++++++++++++++++++++++++++++++++++++++
+ tests/data/acpi/q35/VIOT.viot               | 0
- target/arm/sve.decode      |  9 +++++
+ tests/data/acpi/virt/VIOT                   | 0
-files changed, 108 insertions(+)
+files changed, 3 insertions(+)
  create mode 100644 tests/data/acpi/q35/DSDT.viot
  create mode 100644 tests/data/acpi/q35/VIOT.viot
  create mode 100644 tests/data/acpi/virt/VIOT
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/tests/qtest/bios-tables-test-allowed-diff.h b/tests/qtest/bios-tables-test-allowed-diff.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/tests/qtest/bios-tables-test-allowed-diff.h
-+++ b/target/arm/helper-sve.h
++++ b/tests/qtest/bios-tables-test-allowed-diff.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve_fcvtzu_sd, TCG_CALL_NO_RWG,
+@@ -1 +1,4 @@
- DEF_HELPER_FLAGS_5(sve_fcvtzu_dd, TCG_CALL_NO_RWG,
+ /* List of comma-separated changed AML files to ignore */
-                    void, ptr, ptr, ptr, ptr, i32)
++"tests/data/acpi/virt/VIOT",
++"tests/data/acpi/q35/DSDT.viot",
-+DEF_HELPER_FLAGS_5(sve_frint_h, TCG_CALL_NO_RWG,
++"tests/data/acpi/q35/VIOT.viot",
-+                   void, ptr, ptr, ptr, ptr, i32)
+diff --git a/tests/data/acpi/q35/DSDT.viot b/tests/data/acpi/q35/DSDT.viot
-+DEF_HELPER_FLAGS_5(sve_frint_s, TCG_CALL_NO_RWG,
+new file mode 100644
-+                   void, ptr, ptr, ptr, ptr, i32)
+index XXXXXXX..XXXXXXX
-+DEF_HELPER_FLAGS_5(sve_frint_d, TCG_CALL_NO_RWG,
+diff --git a/tests/data/acpi/q35/VIOT.viot b/tests/data/acpi/q35/VIOT.viot
-+                   void, ptr, ptr, ptr, ptr, i32)
+new file mode 100644
-+
+index XXXXXXX..XXXXXXX
-+DEF_HELPER_FLAGS_5(sve_frintx_h, TCG_CALL_NO_RWG,
+diff --git a/tests/data/acpi/virt/VIOT b/tests/data/acpi/virt/VIOT
-+                   void, ptr, ptr, ptr, ptr, i32)
+new file mode 100644
-+DEF_HELPER_FLAGS_5(sve_frintx_s, TCG_CALL_NO_RWG,
+index XXXXXXX..XXXXXXX
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_frintx_d, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +
  DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
 diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ DO_ZPZ_FP(sve_fcvtzu_sd, uint64_t,     , vfp_float32_to_uint64_rtz)
  DO_ZPZ_FP(sve_fcvtzu_ds, uint64_t,     , helper_vfp_touizd)
  DO_ZPZ_FP(sve_fcvtzu_dd, uint64_t,     , vfp_float64_to_uint64_rtz)
 +DO_ZPZ_FP(sve_frint_h, uint16_t, H1_2, helper_advsimd_rinth)
 +DO_ZPZ_FP(sve_frint_s, uint32_t, H1_4, helper_rints)
 +DO_ZPZ_FP(sve_frint_d, uint64_t,     , helper_rintd)
 +
 +DO_ZPZ_FP(sve_frintx_h, uint16_t, H1_2, float16_round_to_int)
 +DO_ZPZ_FP(sve_frintx_s, uint32_t, H1_4, float32_round_to_int)
 +DO_ZPZ_FP(sve_frintx_d, uint64_t,     , float64_round_to_int)
 +
  DO_ZPZ_FP(sve_scvt_hh, uint16_t, H1_2, int16_to_float16)
  DO_ZPZ_FP(sve_scvt_sh, uint32_t, H1_4, int32_to_float16)
  DO_ZPZ_FP(sve_scvt_ss, uint32_t, H1_4, int32_to_float32)
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVTZU_dd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
      return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzu_dd);
  }
 +static gen_helper_gvec_3_ptr * const frint_fns[3] = {
 +    gen_helper_sve_frint_h,
 +    gen_helper_sve_frint_s,
 +    gen_helper_sve_frint_d
 +};
 +
 +static bool trans_FRINTI(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    if (a->esz == 0) {
 +        return false;
 +    }
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, a->esz == MO_16,
 +                      frint_fns[a->esz - 1]);
 +}
 +
 +static bool trans_FRINTX(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    static gen_helper_gvec_3_ptr * const fns[3] = {
 +        gen_helper_sve_frintx_h,
 +        gen_helper_sve_frintx_s,
 +        gen_helper_sve_frintx_d
 +    };
 +    if (a->esz == 0) {
 +        return false;
 +    }
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, a->esz == MO_16, fns[a->esz - 1]);
 +}
 +
 +static bool do_frint_mode(DisasContext *s, arg_rpr_esz *a, int mode)
 +{
 +    if (a->esz == 0) {
 +        return false;
 +    }
 +    if (sve_access_check(s)) {
 +        unsigned vsz = vec_full_reg_size(s);
 +        TCGv_i32 tmode = tcg_const_i32(mode);
 +        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
 +
 +        gen_helper_set_rmode(tmode, tmode, status);
 +
 +        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, a->rd),
 +                           vec_full_reg_offset(s, a->rn),
 +                           pred_full_reg_offset(s, a->pg),
 +                           status, vsz, vsz, 0, frint_fns[a->esz - 1]);
 +
 +        gen_helper_set_rmode(tmode, tmode, status);
 +        tcg_temp_free_i32(tmode);
 +        tcg_temp_free_ptr(status);
 +    }
 +    return true;
 +}
 +
 +static bool trans_FRINTN(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_frint_mode(s, a, float_round_nearest_even);
 +}
 +
 +static bool trans_FRINTP(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_frint_mode(s, a, float_round_up);
 +}
 +
 +static bool trans_FRINTM(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_frint_mode(s, a, float_round_down);
 +}
 +
 +static bool trans_FRINTZ(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_frint_mode(s, a, float_round_to_zero);
 +}
 +
 +static bool trans_FRINTA(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_frint_mode(s, a, float_round_ties_away);
 +}
 +
  static bool trans_SCVTF_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
  {
      return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_hh);
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ FCVTZU_sd       01100101 11 011 10 1 101 ... ..... .....        @rd_pg_rn_e0
  FCVTZS_dd       01100101 11 011 11 0 101 ... ..... .....        @rd_pg_rn_e0
  FCVTZU_dd       01100101 11 011 11 1 101 ... ..... .....        @rd_pg_rn_e0
 +# SVE floating-point round to integral value
 +FRINTN          01100101 .. 000 000 101 ... ..... .....         @rd_pg_rn
 +FRINTP          01100101 .. 000 001 101 ... ..... .....         @rd_pg_rn
 +FRINTM          01100101 .. 000 010 101 ... ..... .....         @rd_pg_rn
 +FRINTZ          01100101 .. 000 011 101 ... ..... .....         @rd_pg_rn
 +FRINTA          01100101 .. 000 100 101 ... ..... .....         @rd_pg_rn
 +FRINTX          01100101 .. 000 110 101 ... ..... .....         @rd_pg_rn
 +FRINTI          01100101 .. 000 111 101 ... ..... .....         @rd_pg_rn
 +
  # SVE integer convert to floating-point
  SCVTF_hh        01100101 01 010 01 0 101 ... ..... .....        @rd_pg_rn_e0
  SCVTF_sh        01100101 01 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 24/55] target/arm: Implement SVE Floating Point Multiply Indexed Group
+[PULL 31/33] tests/acpi: add test case for VIOT
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Add two test cases for VIOT, one on the q35 machine and the other on
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+virt. To test complex topologies the q35 test has two PCIe buses that
-Message-id: 20180627043328.11531-19-richard.henderson@linaro.org
+bypass the IOMMU (and are therefore not described by VIOT), and two
 buses that are translated by virtio-iommu.
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
 Message-id: 20211210170415.583179-7-jean-philippe@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper.h        | 14 +++++++++++
+ tests/qtest/bios-tables-test.c | 38 ++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 50 ++++++++++++++++++++++++++++++++++++++
+file changed, 38 insertions(+)
  target/arm/vec_helper.c    | 48 ++++++++++++++++++++++++++++++++++++
  target/arm/sve.decode      | 19 +++++++++++++++
 files changed, 131 insertions(+)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/tests/qtest/bios-tables-test.c b/tests/qtest/bios-tables-test.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/tests/qtest/bios-tables-test.c
-+++ b/target/arm/helper.h
++++ b/tests/qtest/bios-tables-test.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ static void test_acpi_virt_tcg(void)
- DEF_HELPER_FLAGS_5(gvec_ftsmul_d, TCG_CALL_NO_RWG,
+     free_test_data(&data);
-                    void, ptr, ptr, ptr, ptr, i32)
+ }
-+DEF_HELPER_FLAGS_5(gvec_fmul_idx_h, TCG_CALL_NO_RWG,
++static void test_acpi_q35_viot(void)
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(gvec_fmul_idx_s, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(gvec_fmul_idx_d, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_6(gvec_fmla_idx_h, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_6(gvec_fmla_idx_s, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_6(gvec_fmla_idx_d, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, ptr, i32)
 +
  #ifdef TARGET_AARCH64
  #include "helper-a64.h"
  #include "helper-sve.h"
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_ZZI(UMIN, umin)
  #undef DO_ZZI
 +/*
 + *** SVE Floating Point Multiply-Add Indexed Group
 + */
 +
 +static bool trans_FMLA_zzxz(DisasContext *s, arg_FMLA_zzxz *a, uint32_t insn)
 +{
-+    static gen_helper_gvec_4_ptr * const fns[3] = {
++    test_data data = {
-+        gen_helper_gvec_fmla_idx_h,
++        .machine = MACHINE_Q35,
-+        gen_helper_gvec_fmla_idx_s,
++        .variant = ".viot",
 +        gen_helper_gvec_fmla_idx_d,
 +    };
 +
-+    if (sve_access_check(s)) {
++    /*
-+        unsigned vsz = vec_full_reg_size(s);
++     * To keep things interesting, two buses bypass the IOMMU.
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
++     * VIOT should only describes the other two buses.
-+        tcg_gen_gvec_4_ptr(vec_full_reg_offset(s, a->rd),
++     */
-+                           vec_full_reg_offset(s, a->rn),
++    test_acpi_one("-machine default_bus_bypass_iommu=on "
-+                           vec_full_reg_offset(s, a->rm),
++                  "-device virtio-iommu-pci "
-+                           vec_full_reg_offset(s, a->ra),
++                  "-device pxb-pcie,bus_nr=0x10,id=pcie.100,bus=pcie.0 "
-+                           status, vsz, vsz, (a->index << 1) | a->sub,
++                  "-device pxb-pcie,bus_nr=0x20,id=pcie.200,bus=pcie.0,bypass_iommu=on "
-+                           fns[a->esz - 1]);
++                  "-device pxb-pcie,bus_nr=0x30,id=pcie.300,bus=pcie.0",
-+        tcg_temp_free_ptr(status);
++                  &data);
-+    }
++    free_test_data(&data);
 +    return true;
 +}
 +
-+/*
++static void test_acpi_virt_viot(void)
 + *** SVE Floating Point Multiply Indexed Group
 + */
 +
 +static bool trans_FMUL_zzx(DisasContext *s, arg_FMUL_zzx *a, uint32_t insn)
 +{
-+    static gen_helper_gvec_3_ptr * const fns[3] = {
++    test_data data = {
-+        gen_helper_gvec_fmul_idx_h,
++        .machine = "virt",
-+        gen_helper_gvec_fmul_idx_s,
++        .uefi_fl1 = "pc-bios/edk2-aarch64-code.fd",
-+        gen_helper_gvec_fmul_idx_d,
++        .uefi_fl2 = "pc-bios/edk2-arm-vars.fd",
 +        .cd = "tests/data/uefi-boot-images/bios-tables-test.aarch64.iso.qcow2",
 +        .ram_start = 0x40000000ULL,
 +        .scan_len = 128ULL * 1024 * 1024,
 +    };
 +
-+    if (sve_access_check(s)) {
++    test_acpi_one("-cpu cortex-a57 "
-+        unsigned vsz = vec_full_reg_size(s);
++                  "-device virtio-iommu-pci", &data);
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
++    free_test_data(&data);
 +        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, a->rd),
 +                           vec_full_reg_offset(s, a->rn),
 +                           vec_full_reg_offset(s, a->rm),
 +                           status, vsz, vsz, a->index, fns[a->esz - 1]);
 +        tcg_temp_free_ptr(status);
 +    }
 +    return true;
 +}
 +
- /*
+ static void test_oem_fields(test_data *data)
-  *** SVE Floating Point Accumulating Reduction Group
+ {
-  */
+     int i;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ int main(int argc, char *argv[])
-index XXXXXXX..XXXXXXX 100644
+             qtest_add_func("acpi/q35/kvm/xapic", test_acpi_q35_kvm_xapic);
---- a/target/arm/vec_helper.c
+             qtest_add_func("acpi/q35/kvm/dmar", test_acpi_q35_kvm_dmar);
-+++ b/target/arm/vec_helper.c
+         }
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_rsqrts_d, helper_rsqrtsf_f64, float64)
++        qtest_add_func("acpi/q35/viot", test_acpi_q35_viot);
+     } else if (strcmp(arch, "aarch64") == 0) {
- #endif
+         if (has_tcg) {
- #undef DO_3OP
+             qtest_add_func("acpi/virt", test_acpi_virt_tcg);
-+
+@@ -XXX,XX +XXX,XX @@ int main(int argc, char *argv[])
-+/* For the indexed ops, SVE applies the index per 128-bit vector segment.
+             qtest_add_func("acpi/virt/memhp", test_acpi_virt_tcg_memhp);
-+ * For AdvSIMD, there is of course only one such vector segment.
+             qtest_add_func("acpi/virt/pxb", test_acpi_virt_tcg_pxb);
-+ */
+             qtest_add_func("acpi/virt/oem-fields", test_acpi_oem_fields_virt);
-+
++            qtest_add_func("acpi/virt/viot", test_acpi_virt_viot);
-+#define DO_MUL_IDX(NAME, TYPE, H) \
+         }
-+void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+     }
-+{                                                                          \
+     ret = g_test_run();
 +    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
 +    intptr_t idx = simd_data(desc);                                        \
 +    TYPE *d = vd, *n = vn, *m = vm;                                        \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
 +        TYPE mm = m[H(i + idx)];                                           \
 +        for (j = 0; j < segment; j++) {                                    \
 +            d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
 +        }                                                                  \
 +    }                                                                      \
 +}
 +
 +DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
 +DO_MUL_IDX(gvec_fmul_idx_s, float32, H4)
 +DO_MUL_IDX(gvec_fmul_idx_d, float64, )
 +
 +#undef DO_MUL_IDX
 +
 +#define DO_FMLA_IDX(NAME, TYPE, H)                                         \
 +void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
 +                  void *stat, uint32_t desc)                               \
 +{                                                                          \
 +    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
 +    TYPE op1_neg = extract32(desc, SIMD_DATA_SHIFT, 1);                    \
 +    intptr_t idx = desc >> (SIMD_DATA_SHIFT + 1);                          \
 +    TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
 +    op1_neg <<= (8 * sizeof(TYPE) - 1);                                    \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
 +        TYPE mm = m[H(i + idx)];                                           \
 +        for (j = 0; j < segment; j++) {                                    \
 +            d[i + j] = TYPE##_muladd(n[i + j] ^ op1_neg,                   \
 +                                     mm, a[i + j], 0, stat);               \
 +        }                                                                  \
 +    }                                                                      \
 +}
 +
 +DO_FMLA_IDX(gvec_fmla_idx_h, float16, H2)
 +DO_FMLA_IDX(gvec_fmla_idx_s, float32, H4)
 +DO_FMLA_IDX(gvec_fmla_idx_d, float64, )
 +
 +#undef DO_FMLA_IDX
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
  %imm9_16_10     16:s6 10:3
  %size_23        23:2
  %dtype_23_13    23:2 13:2
 +%index3_22_19   22:1 19:2
  # A combination of tsz:imm3 -- extract esize.
  %tszimm_esz     22:2 5:5 !function=tszimm_esz
@@ -XXX,XX +XXX,XX @@ UMIN_zzi        00100101 .. 101 011 110 ........ .....          @rdn_i8u
  # SVE integer multiply immediate (unpredicated)
  MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
 +### SVE FP Multiply-Add Indexed Group
 +
 +# SVE floating-point multiply-add (indexed)
 +FMLA_zzxz       01100100 0.1 .. rm:3 00000 sub:1 rn:5 rd:5 \
 +                ra=%reg_movprfx index=%index3_22_19 esz=1
 +FMLA_zzxz       01100100 101 index:2 rm:3 00000 sub:1 rn:5 rd:5 \
 +                ra=%reg_movprfx esz=2
 +FMLA_zzxz       01100100 111 index:1 rm:4 00000 sub:1 rn:5 rd:5 \
 +                ra=%reg_movprfx esz=3
 +
 +### SVE FP Multiply Indexed Group
 +
 +# SVE floating-point multiply (indexed)
 +FMUL_zzx        01100100 0.1 .. rm:3 001000 rn:5 rd:5 \
 +                index=%index3_22_19 esz=1
 +FMUL_zzx        01100100 101 index:2 rm:3 001000 rn:5 rd:5      esz=2
 +FMUL_zzx        01100100 111 index:1 rm:4 001000 rn:5 rd:5      esz=3
 +
  ### SVE FP Accumulating Reduction Group
  # SVE floating-point serial reduction (predicated)
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 03/55] device_tree: Replace error_setg(&error_fatal) by error_report() + exit()
+[PULL 32/33] tests/acpi: add expected blobs for VIOT test on q35 machine
-From: Philippe Mathieu-Daudé <f4bug@amsat.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Use error_report() + exit() instead of error_setg(&error_fatal),
+Add expected blobs of the VIOT and DSDT table for the VIOT test on the
-as suggested by the "qapi/error.h" documentation:
+q35 machine.
-   Please don't error_setg(&error_fatal, ...), use error_report() and
+Since the test instantiates a virtio device and two PCIe expander
-   exit(), because that's more obvious.
+bridges, DSDT.viot has more blocks than the base DSDT.
-Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+The VIOT table generated for the q35 test is:
 [000h 0000   4]                    Signature : "VIOT"    [Virtual I/O Translation Table]
 [004h 0004   4]                 Table Length : 00000070
 [008h 0008   1]                     Revision : 00
 [009h 0009   1]                     Checksum : 3D
 [00Ah 0010   6]                       Oem ID : "BOCHS "
 [010h 0016   8]                 Oem Table ID : "BXPC    "
 [018h 0024   4]                 Oem Revision : 00000001
 [01Ch 0028   4]              Asl Compiler ID : "BXPC"
 [020h 0032   4]        Asl Compiler Revision : 00000001
 [024h 0036   2]                   Node count : 0003
 [026h 0038   2]                  Node offset : 0030
 [028h 0040   8]                     Reserved : 0000000000000000
 [030h 0048   1]                         Type : 03 [VirtIO-PCI IOMMU]
 [031h 0049   1]                     Reserved : 00
 [032h 0050   2]                       Length : 0010
 [034h 0052   2]                  PCI Segment : 0000
 [036h 0054   2]               PCI BDF number : 0010
 [038h 0056   8]                     Reserved : 0000000000000000
 [040h 0064   1]                         Type : 01 [PCI Range]
 [041h 0065   1]                     Reserved : 00
 [042h 0066   2]                       Length : 0018
 [044h 0068   4]               Endpoint start : 00003000
 [048h 0072   2]            PCI Segment start : 0000
 [04Ah 0074   2]              PCI Segment end : 0000
 [04Ch 0076   2]                PCI BDF start : 3000
 [04Eh 0078   2]                  PCI BDF end : 30FF
 [050h 0080   2]                  Output node : 0030
 [052h 0082   6]                     Reserved : 000000000000
 [058h 0088   1]                         Type : 01 [PCI Range]
 [059h 0089   1]                     Reserved : 00
 [05Ah 0090   2]                       Length : 0018
 [05Ch 0092   4]               Endpoint start : 00001000
 [060h 0096   2]            PCI Segment start : 0000
 [062h 0098   2]              PCI Segment end : 0000
 [064h 0100   2]                PCI BDF start : 1000
 [066h 0102   2]                  PCI BDF end : 10FF
 [068h 0104   2]                  Output node : 0030
 [06Ah 0106   6]                     Reserved : 000000000000
 And the DSDT diff is:
@@ -XXX,XX +XXX,XX @@
   *
   * Disassembling to symbolic ASL+ operators
   *
 - * Disassembly of tests/data/acpi/q35/DSDT, Fri Dec 10 15:03:08 2021
 + * Disassembly of /tmp/aml-H9Y5D1, Fri Dec 10 15:02:27 2021
   *
   * Original Table Header:
   *     Signature        "DSDT"
 - *     Length           0x00002061 (8289)
 + *     Length           0x000024B6 (9398)
   *     Revision         0x01 **** 32-bit table (V1), no 64-bit math support
 - *     Checksum         0xFA
 + *     Checksum         0xA7
   *     OEM ID           "BOCHS "
   *     OEM Table ID     "BXPC    "
   *     OEM Revision     0x00000001 (1)
@@ -XXX,XX +XXX,XX @@
          }
      }
 +    Scope (\_SB)
 +    {
 +        Device (PC30)
 +        {
 +            Name (_UID, 0x30)  // _UID: Unique ID
 +            Name (_BBN, 0x30)  // _BBN: BIOS Bus Number
 +            Name (_HID, EisaId ("PNP0A08") /* PCI Express Bus */)  // _HID: Hardware ID
 +            Name (_CID, EisaId ("PNP0A03") /* PCI Bus */)  // _CID: Compatible ID
 +            Method (_OSC, 4, NotSerialized)  // _OSC: Operating System Capabilities
 +            {
 +                CreateDWordField (Arg3, Zero, CDW1)
 +                If ((Arg0 == ToUUID ("33db4d5b-1ff7-401c-9657-7441c03dd766") /* PCI Host Bridge Device */))
 +                {
 +                    CreateDWordField (Arg3, 0x04, CDW2)
 +                    CreateDWordField (Arg3, 0x08, CDW3)
 +                    Local0 = CDW3 /* \_SB_.PC30._OSC.CDW3 */
 +                    Local0 &= 0x1F
 +                    If ((Arg1 != One))
 +                    {
 +                        CDW1 |= 0x08
 +                    }
 +
 +                    If ((CDW3 != Local0))
 +                    {
 +                        CDW1 |= 0x10
 +                    }
 +
 +                    CDW3 = Local0
 +                }
 +                Else
 +                {
 +                    CDW1 |= 0x04
 +                }
 +
 +                Return (Arg3)
 +            }
 +
 +            Method (_PRT, 0, NotSerialized)  // _PRT: PCI Routing Table
 +            {
 +                Local0 = Package (0x80){}
 +                Local1 = Zero
 +                While ((Local1 < 0x80))
 +                {
 +                    Local2 = (Local1 >> 0x02)
 +                    Local3 = ((Local1 + Local2) & 0x03)
 +                    If ((Local3 == Zero))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKD,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == One))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKA,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == 0x02))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKB,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == 0x03))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKC,
 +                                Zero
 +                            }
 +                    }
 +
 +                    Local4 [Zero] = ((Local2 << 0x10) | 0xFFFF)
 +                    Local4 [One] = (Local1 & 0x03)
 +                    Local0 [Local1] = Local4
 +                    Local1++
 +                }
 +
 +                Return (Local0)
 +            }
 +
 +            Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
 +            {
 +                WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
 +                    0x0000,             // Granularity
 +                    0x0030,             // Range Minimum
 +                    0x0030,             // Range Maximum
 +                    0x0000,             // Translation Offset
 +                    0x0001,             // Length
 +                    ,, )
 +            })
 +        }
 +    }
 +
 +    Scope (\_SB)
 +    {
 +        Device (PC20)
 +        {
 +            Name (_UID, 0x20)  // _UID: Unique ID
 +            Name (_BBN, 0x20)  // _BBN: BIOS Bus Number
 +            Name (_HID, EisaId ("PNP0A08") /* PCI Express Bus */)  // _HID: Hardware ID
 +            Name (_CID, EisaId ("PNP0A03") /* PCI Bus */)  // _CID: Compatible ID
 +            Method (_OSC, 4, NotSerialized)  // _OSC: Operating System Capabilities
 +            {
 +                CreateDWordField (Arg3, Zero, CDW1)
 +                If ((Arg0 == ToUUID ("33db4d5b-1ff7-401c-9657-7441c03dd766") /* PCI Host Bridge Device */))
 +                {
 +                    CreateDWordField (Arg3, 0x04, CDW2)
 +                    CreateDWordField (Arg3, 0x08, CDW3)
 +                    Local0 = CDW3 /* \_SB_.PC20._OSC.CDW3 */
 +                    Local0 &= 0x1F
 +                    If ((Arg1 != One))
 +                    {
 +                        CDW1 |= 0x08
 +                    }
 +
 +                    If ((CDW3 != Local0))
 +                    {
 +                        CDW1 |= 0x10
 +                    }
 +
 +                    CDW3 = Local0
 +                }
 +                Else
 +                {
 +                    CDW1 |= 0x04
 +                }
 +
 +                Return (Arg3)
 +            }
 +
 +            Method (_PRT, 0, NotSerialized)  // _PRT: PCI Routing Table
 +            {
 +                Local0 = Package (0x80){}
 +                Local1 = Zero
 +                While ((Local1 < 0x80))
 +                {
 +                    Local2 = (Local1 >> 0x02)
 +                    Local3 = ((Local1 + Local2) & 0x03)
 +                    If ((Local3 == Zero))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKD,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == One))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKA,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == 0x02))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKB,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == 0x03))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKC,
 +                                Zero
 +                            }
 +                    }
 +
 +                    Local4 [Zero] = ((Local2 << 0x10) | 0xFFFF)
 +                    Local4 [One] = (Local1 & 0x03)
 +                    Local0 [Local1] = Local4
 +                    Local1++
 +                }
 +
 +                Return (Local0)
 +            }
 +
 +            Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
 +            {
 +                WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
 +                    0x0000,             // Granularity
 +                    0x0020,             // Range Minimum
 +                    0x0020,             // Range Maximum
 +                    0x0000,             // Translation Offset
 +                    0x0001,             // Length
 +                    ,, )
 +            })
 +        }
 +    }
 +
 +    Scope (\_SB)
 +    {
 +        Device (PC10)
 +        {
 +            Name (_UID, 0x10)  // _UID: Unique ID
 +            Name (_BBN, 0x10)  // _BBN: BIOS Bus Number
 +            Name (_HID, EisaId ("PNP0A08") /* PCI Express Bus */)  // _HID: Hardware ID
 +            Name (_CID, EisaId ("PNP0A03") /* PCI Bus */)  // _CID: Compatible ID
 +            Method (_OSC, 4, NotSerialized)  // _OSC: Operating System Capabilities
 +            {
 +                CreateDWordField (Arg3, Zero, CDW1)
 +                If ((Arg0 == ToUUID ("33db4d5b-1ff7-401c-9657-7441c03dd766") /* PCI Host Bridge Device */))
 +                {
 +                    CreateDWordField (Arg3, 0x04, CDW2)
 +                    CreateDWordField (Arg3, 0x08, CDW3)
 +                    Local0 = CDW3 /* \_SB_.PC10._OSC.CDW3 */
 +                    Local0 &= 0x1F
 +                    If ((Arg1 != One))
 +                    {
 +                        CDW1 |= 0x08
 +                    }
 +
 +                    If ((CDW3 != Local0))
 +                    {
 +                        CDW1 |= 0x10
 +                    }
 +
 +                    CDW3 = Local0
 +                }
 +                Else
 +                {
 +                    CDW1 |= 0x04
 +                }
 +
 +                Return (Arg3)
 +            }
 +
 +            Method (_PRT, 0, NotSerialized)  // _PRT: PCI Routing Table
 +            {
 +                Local0 = Package (0x80){}
 +                Local1 = Zero
 +                While ((Local1 < 0x80))
 +                {
 +                    Local2 = (Local1 >> 0x02)
 +                    Local3 = ((Local1 + Local2) & 0x03)
 +                    If ((Local3 == Zero))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKD,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == One))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKA,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == 0x02))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKB,
 +                                Zero
 +                            }
 +                    }
 +
 +                    If ((Local3 == 0x03))
 +                    {
 +                        Local4 = Package (0x04)
 +                            {
 +                                Zero,
 +                                Zero,
 +                                LNKC,
 +                                Zero
 +                            }
 +                    }
 +
 +                    Local4 [Zero] = ((Local2 << 0x10) | 0xFFFF)
 +                    Local4 [One] = (Local1 & 0x03)
 +                    Local0 [Local1] = Local4
 +                    Local1++
 +                }
 +
 +                Return (Local0)
 +            }
 +
 +            Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
 +            {
 +                WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
 +                    0x0000,             // Granularity
 +                    0x0010,             // Range Minimum
 +                    0x0010,             // Range Maximum
 +                    0x0000,             // Translation Offset
 +                    0x0001,             // Length
 +                    ,, )
 +            })
 +        }
 +    }
 +
      Scope (\_SB.PCI0)
      {
          Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
@@ -XXX,XX +XXX,XX @@
              WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
 x0000,             // Granularity
 x0000,             // Range Minimum
 -                0x00FF,             // Range Maximum
 +                0x000F,             // Range Maximum
 x0000,             // Translation Offset
 -                0x0100,             // Length
 +                0x0010,             // Length
                  ,, )
              IO (Decode16,
 x0CF8,             // Range Minimum
@@ -XXX,XX +XXX,XX @@
                  }
              }
 +            Device (S10)
 +            {
 +                Name (_ADR, 0x00020000)  // _ADR: Address
 +            }
 +
 +            Device (S18)
 +            {
 +                Name (_ADR, 0x00030000)  // _ADR: Address
 +            }
 +
 +            Device (S20)
 +            {
 +                Name (_ADR, 0x00040000)  // _ADR: Address
 +            }
 +
 +            Device (S28)
 +            {
 +                Name (_ADR, 0x00050000)  // _ADR: Address
 +            }
 +
              Method (PCNT, 0, NotSerialized)
              {
              }
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
-Reviewed-by: Markus Armbruster <armbru@redhat.com>
+Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Reviewed-by: David Gibson <david@gibson.dropbear.id.au>
+Message-id: 20211210170415.583179-8-jean-philippe@linaro.org
 Message-id: 20180625165749.3910-4-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- device_tree.c | 23 +++++++++++++----------
+ tests/qtest/bios-tables-test-allowed-diff.h |   2 --
-file changed, 13 insertions(+), 10 deletions(-)
+ tests/data/acpi/q35/DSDT.viot               | Bin 0 -> 9398 bytes
+ tests/data/acpi/q35/VIOT.viot               | Bin 0 -> 112 bytes
-diff --git a/device_tree.c b/device_tree.c
+files changed, 2 deletions(-)
 diff --git a/tests/qtest/bios-tables-test-allowed-diff.h b/tests/qtest/bios-tables-test-allowed-diff.h
 index XXXXXXX..XXXXXXX 100644
---- a/device_tree.c
+--- a/tests/qtest/bios-tables-test-allowed-diff.h
-+++ b/device_tree.c
++++ b/tests/qtest/bios-tables-test-allowed-diff.h
-@@ -XXX,XX +XXX,XX @@ static void read_fstree(void *fdt, const char *dirname)
+@@ -XXX,XX +XXX,XX @@
-     const char *parent_node;
+ /* List of comma-separated changed AML files to ignore */
+ "tests/data/acpi/virt/VIOT",
-     if (strstr(dirname, root_dir) != dirname) {
+-"tests/data/acpi/q35/DSDT.viot",
--        error_setg(&error_fatal, "%s: %s must be searched within %s",
+-"tests/data/acpi/q35/VIOT.viot",
--                   __func__, dirname, root_dir);
+diff --git a/tests/data/acpi/q35/DSDT.viot b/tests/data/acpi/q35/DSDT.viot
-+        error_report("%s: %s must be searched within %s",
+index XXXXXXX..XXXXXXX 100644
-+                     __func__, dirname, root_dir);
+GIT binary patch
-+        exit(1);
+literal 9398
-     }
+zcmeHNO>7&-8J*>iv|O&FB}G~Oi$yp||57BBoWHhc5OS9yDTx$CQgH$r;8Idr*-4Q_
-     parent_node = &dirname[strlen(SYSFS_DT_BASEDIR)];
+z5(9Az1F`}niVsB-)<KW7p`g9Br(A2Gm-gmc1N78GFS!;)e2V(MnH_0{q<{#yMgn&C
+zn|*J-d9yqFhO_H6z19~`FlPL*u<DkZ*}|)JH;X@mF-FI<cPg<fti9tEN*yB^i5czN
-     d = opendir(dirname);
+zNq&q?!OZ;BE3B7{KWzJ-`Tn~f`9?Qj8~2^N8{Oc8J%57{==w%rS#;nOCp*nTr@iZ1
-     if (!d) {
+zb+?i;JLQUJ=O0?8*>S~D)a>NF1~WVB6^~_B#yhJ`H+JU@=6aXs`?Yv)J2h=N?drcS
--        error_setg(&error_fatal, "%s cannot open %s", __func__, dirname);
+zeLZ*n<<Bm^n}6`jfBx#u8&(W}1?)}iF9o#mZ~E2+zwdn7yK3AbIzKnxpZ>JRPm3~#
--        return;
+z&ICS{+_OayRW-l=Mtk=~uaS3o8z<_udd|(wqg`&JnVPfCe>BUOO`Su3e>pff_^UW%
-+        error_report("%s cannot open %s", __func__, dirname);
+z&JE^NO`)=Amg~iqRB1pPscP?(>#ZuY8GHCmlEvD$9g3%4Db~Dfz2SATnddvrR-Oe^
-+        exit(1);
+z;s;dJec!hnzi)ri^I6YN9vtkm{^TdUF8h7gX8-<Qe4p)GQ=)AtYx2VcwdLVAEXEjG
-     }
+z^Mj|UHPqkj-LsWuzQem1>F3atdZn=zv3$#RmZzSHN+6-yyU#8cJb=YDilX&sl}vNm
+znkgAR^O<3kj4if>{ly5fwRfMWuC5=lrlvKPX~i#654Cp}R_d*JS$9laZ$ra6)<ns8
-     while ((de = readdir(d)) != NULL) {
+zFZy28G%xP(nit&F>LDi%G<tIc=TY=gl$jSD&Uv!Yat~XR46h%rI$!}a%!|xG7u8Zn
-@@ -XXX,XX +XXX,XX @@ static void read_fstree(void *fdt, const char *dirname)
+zeY8_|n=K>xz_v_W8VX$W-Fg-qFWcT}7MCyz{%%{ia7hZ>Law-k6NOr}VI&_48U=2l
-         tmpnam = g_strdup_printf("%s/%s", dirname, de->d_name);
+zwqDKFE8eTwwozDdms#e?x?5a|v>&JF;2_v0L~z5n%BYU^52<*cWuD4|GYUm@1+?))
+zte^45>Rz)t*<T5V#={r>@t@{%?^i#W{i=HAZ*Dc9y59Va-+#P!jrGs;u38a{fLr`N
-         if (lstat(tmpnam, &st) < 0) {
+zvT@rUu>DljxJ?^&Z?-?vyJn3C>3D=qux{Y*bs5|5n)Qmi$TD^Zdn4GU$ocJS2Hh-<
--            error_setg(&error_fatal, "%s cannot lstat %s", __func__, tmpnam);
+z`xPI^^+v0nUVdjMos8k`WGl7hA`{03ju%<lrgAHSpd^DRf-*}_#Ly0mB!LSfVgWcQ
-+            error_report("%s cannot lstat %s", __func__, tmpnam);
+z&T$@~G9)JI=hz5m0vkrel+Xy{Oh7pkAu-V!j*W7rY(bO}Q$nMH2`FbGB&N)QaV4<4
-+            exit(1);
+zo)~9JXiP9=;}NPl<C@MmXG&;XFlFNrsyfFsonxFSp<}vEgsRSQP3O3#b6nSnP}ON_
-         }
+zI!#Tdsp~|j>ckUB>FI=~GokB5sOq#dotCE4(sd$KbtW~PNlj-`*NIToiD#j5J#9^=
+zt?NXn>YUJYPG~wObe#xQos*i*NloXZt`niEb4t@WrRki~bs|)CI+{*L)9L6s5vn><
-         if (S_ISREG(st.st_mode)) {
+zn$DD_Go|Z9sOn5>I@6lYw5}7Os&iV?Ij!lO)^#FOb!If38BJ$K*NIToIiu;E(R9w}
-@@ -XXX,XX +XXX,XX @@ static void read_fstree(void *fdt, const char *dirname)
+zIuWWmPiZ<&X*y5oIuWWmF_XaEC!a&Jn$B5WCqh-{X-(&8P3LJ{Cqh-{8P3dyPr@^t
-             gsize len;
+zSqL9?X9Uwd3W@23*s~h*tj0X6GZCuHa~kuU#yqDp5vt7d8uPryJg+kms?5hU=3^T3
+zF`bD}WnSP+=`t5MQ$FJ_2&Q~+BP6E0f^%BVIW6a$o)e+SX~IDBih-7z6{O~7YTy`&
-             if (!g_file_get_contents(tmpnam, &val, &len, NULL)) {
+zLjy&Cv?7QikV#>n0>>@MV8oK`Gmun34-FKdlm-J8SZSaNlnhir4-FI{S|bfqV8e)V
--                error_setg(&error_fatal, "%s not able to extract info from %s",
+zss<{chX#reE#g=hsKAC%sF6d-Km}BWs!kZFsFpKfpbC@>6rprQGEjt4Ck#|zITHq|
--                           __func__, tmpnam);
+zK*>M_l;<P^MJRQ`Kn0dFVW0|>3{*fllMEE0)CmI>Sk8ojDo`>|0p(0GP=xY&!axO<
-+                error_report("%s not able to extract info from %s",
+zGhv_#lnhirIg<<&q0|Wj6<E%MfhtfkPyyvkGEjt4Ck#|zITHq|K*>M_lrzad5lWpf
-+                             __func__, tmpnam);
+zP=V!47^ngz0~JutBm+e#b;3XemNQ|X3X}{~Ksl2P6rt1!0~J`#gn=qhGEf2KOfpb}
-+                exit(1);
+zQYQ>lU^x>8szAv=1(Y+%KoLrvFi?TzOc<yFB?A>u&LjgxD0RX>1(q{mpbC@>R6seC
-             }
+z3>2Z%2?G^a&V+#~P%=;f<xDbAgi<FARA4z12C6{GKn0XD$v_cGoiI>=<xCi;0wn_#
+zP|hR+MJRQ`Kn0dFVW0|>3{*fllMEE0)CmI>Sk8ojDo`>|0p(0GP=rz^3{+q_69%e4
-             if (strlen(parent_node) > 0) {
+z$v_2^Gs!>^N}VuJf#pmXr~)Me6;RG314Srx!axxz28u{EP=u<1B2)}iVZuNaCK;&0
-@@ -XXX,XX +XXX,XX @@ void *load_device_tree_from_sysfs(void)
+zBm-5LFi?dF167!0pbC==RAItE6($T+VUmF=Ofpb~2?JG_Fi?d_2C6X0Kouqo6p_5T
-     host_fdt = create_device_tree(&host_fdt_size);
+zFi=FeV!SiSKoR0H$dH(_Z(*Q_WZ%L-5y`$K14StNmJAdjmWs}HV4<vU_xO+1efmLq
-     read_fstree(host_fdt, SYSFS_DT_BASEDIR);
+zZ;W>N_U)fP6Qy6Nw5mbt9Y(#emWSi66=>tq#xoh#Ue=0qyhxi8ZOUe5y0V7VfPUhp
-     if (fdt_check_header(host_fdt)) {
+zwX=;ymc+i5%sg9Ja~lZ&8oAV@mHc>&CHP9v4R(jhtT?un;O4e9#pno)Xkh7OWgK&a
--        error_setg(&error_fatal,
+zyj=3Iv0OuoK_;5rOr5f(Kb~ZXDBO+V`OWYo#_C08imwChQxnjdd?wZLDou8aj;$SD
--                   "%s host device tree extracted into memory is invalid",
+zGDYiA3<$Tu<JnHL(KPOChi#zrR32t83}naR$+ym4P_h?z_5#|cW-nw$XD_sOtE62l
--                   __func__);
+zrD3@*)NVyiklt0&yF9%+klsBey&I<Y2E<!f(E8TuJte)z(|ZHyy<^gQVfx}=`q&B5
-+        error_report("%s host device tree extracted into memory is invalid",
+z7nSryp1wGczIaUfVwiq$Fn#<4=@*ssi#+|}K>EdF(l3VTOM~ghPLRH&q%ZOGrGfON
-+                     __func__);
+zW73zx^yR_y<0nX8R??Sw`tm^f@-gYlNFSp|*<gA{q?Zp5Oe-+l#rmyYmKozi9y=P>
-+        exit(1);
+zVReJU*h=ZuVXiS$ohTbw-O#v9>(yZbGE|)?8(H1ZIKvV!jWa0>vy!3eMA^vdhQ>`s
-     }
+zuMSg{q3T50$m)j1!HixV<}X9liL#N^4c*tL^y)CF8LCc{jjV3yKAqL8!%SzWI#H%q
-     return host_fdt;
+z=bSrQ&)%JCRttF5g4Zf`6l?y@>PzD7MA^D>wBlcH6r1ucwJ<p0O%rZ?JzIY3-QdmZ
- }
+zzs|n>`a5r3e|z)wcUaqS>nqFQ-8x}eCF4u`OWUxqst-@1rSmUs%WmKP5e0dcb?e2N
 z;Z|x*!);VwF|Yuhqs^khqOM!@u*jY!WYldISF(V6`BoNd&6Qfk3>X#SuD^7J>p_D=
 zBPa51y^_n#=cpOt#Zf$ya$Ae9Mfz56n|<i!a=ELS@)%a{^NIH3SDuN<R~sah1km#P
 zU@?*f%<rG=4W1wgfi;C?_n|W@%lm$&8YfvNOJodIg&IcIpIJQRHr<+ej11GQ6)&eF
 z2Lam*jIH}#y0>KnY%4JQfOYS$*uU%f#@$U6`N8I3N-lV?5ErFCdv~xDmu2(wexld4
 z4v^;aVAT2k6GJ^m*FD(Wqc(Qg^)6a<?}h$zLoj}4;PP!+(O{@!a1y-hoAhF_7!z+6
 zslpAmNtYbjHrw-~#SPVk_FUf>-Obg6yV`8o$8_`PyJe_;bY5_EMBfBfWU!Q=*9HsG
 z%_Cda{@_Krr!oHVhv9+y+T5qR8zZ2aZ>5r!$*|f$^U%yBUYfR&B!+EYy_PwL!BeUi
 zJH^}r3r9Q+B)X@Z)fk=P13w&7x#wBtXTZ)g>WITPg5r&pQc!nmyrmk#S(>>b9xnNr
 zx_b#v9Xv-Y><Wb%?S^0Xe&<)bbKl_=Z|3C$tf|F<bYzE*mfHB;uC)`q-?buaBe?l?
 zcLTpK*k<49Z32`K?|nSBMFqxTK^_IE-li2fEGdK~(ZdoKBl6ab4a;Hler#`xvEXJG
 zb?<E%EZExfX>jcOVhS*0rS~RS1dA#xhkv@Nct@#q?LyeKS<$uFec!bw>{@uu$gZ6a
 zyVen1i{1BKd%~`D7|m$;U0a<I*3I7%^N%N%lGYdU_GS!gaR8T$NA@GzFi~z`l7hdl
 zarZy6590|88pi(1zq;V(>38zM0sT&<zX;R5$1w3;`_JMG`;&I&0Y23DMx1%@(w(R9
 z4M$j;D5J+Gy%fijRQsctzFKf&cv|BAz#YLq3CZJWDdtL4u1u1|mkdcUp7|sxJC+?Y
 z_@@s`v3j}Q7*z>6X~cwUxUL8G1KT)_XTp!KAbs;vCp{K3&~_X@+ew=-D}v`2MbFV0
 zQsVsL=rXi-pI*G|iiz;VTCutgUs)hDzV1+4?8KcoP3xROf<M%qC6lgVdpFt4<-|uM
 z=#rl_b1#YjSIl6Toj2z_hOZcKupkdE(LozC(fN=FY(x|sk)ym|;Rq2E1xJWD%Z!ol
 Gu>S+TT-130
 literal 0
 HcmV?d00001
 diff --git a/tests/data/acpi/q35/VIOT.viot b/tests/data/acpi/q35/VIOT.viot
 index XXXXXXX..XXXXXXX 100644
 GIT binary patch
 literal 112
 zcmWIZ^baXu00LVle`k+i1*eDrX9XZ&1PX!JAex!M0Hgv8m>C3sGzdcgBZCA3T-xBj
 Q0Zb)W9Hva*zW_`e0M!8s0RR91
 literal 0
 HcmV?d00001
 --
-.17.1
+.25.1

-[Qemu-devel] [PULL 04/55] device_tree: Add qemu_fdt_node_unit_path
+Deleted patch
-From: Eric Auger <eric.auger@redhat.com>
-This helper allows to retrieve the paths of nodes whose name
-match node-name or node-name@unit-address patterns.
-Signed-off-by: Eric Auger <eric.auger@redhat.com>
-Message-id: 1530044492-24921-2-git-send-email-eric.auger@redhat.com
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- include/sysemu/device_tree.h | 16 +++++++++++
- device_tree.c                | 55 ++++++++++++++++++++++++++++++++++++
-files changed, 71 insertions(+)
-diff --git a/include/sysemu/device_tree.h b/include/sysemu/device_tree.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/sysemu/device_tree.h
-+++ b/include/sysemu/device_tree.h
-@@ -XXX,XX +XXX,XX @@ void *load_device_tree_from_sysfs(void);
- char **qemu_fdt_node_path(void *fdt, const char *name, char *compat,
-                           Error **errp);
-+/**
-+ * qemu_fdt_node_unit_path: return the paths of nodes matching a given
-+ * node-name, ie. node-name and node-name@unit-address
-+ * @fdt: pointer to the dt blob
-+ * @name: node name
-+ * @errp: handle to an error object
-+ *
-+ * returns a newly allocated NULL-terminated array of node paths.
-+ * Use g_strfreev() to free it. If one or more nodes were found, the
-+ * array contains the path of each node and the last element equals to
-+ * NULL. If there is no error but no matching node was found, the
-+ * returned array contains a single element equal to NULL. If an error
-+ * was encountered when parsing the blob, the function returns NULL
-+ */
-+char **qemu_fdt_node_unit_path(void *fdt, const char *name, Error **errp);
-+
- int qemu_fdt_setprop(void *fdt, const char *node_path,
-                      const char *property, const void *val, int size);
- int qemu_fdt_setprop_cell(void *fdt, const char *node_path,
-diff --git a/device_tree.c b/device_tree.c
-index XXXXXXX..XXXXXXX 100644
---- a/device_tree.c
-+++ b/device_tree.c
-@@ -XXX,XX +XXX,XX @@ static int findnode_nofail(void *fdt, const char *node_path)
-     return offset;
- }
-+char **qemu_fdt_node_unit_path(void *fdt, const char *name, Error **errp)
-+{
-+    char *prefix =  g_strdup_printf("%s@", name);
-+    unsigned int path_len = 16, n = 0;
-+    GSList *path_list = NULL, *iter;
-+    const char *iter_name;
-+    int offset, len, ret;
-+    char **path_array;
-+
-+    offset = fdt_next_node(fdt, -1, NULL);
-+
-+    while (offset >= 0) {
-+        iter_name = fdt_get_name(fdt, offset, &len);
-+        if (!iter_name) {
-+            offset = len;
-+            break;
-+        }
-+        if (!strcmp(iter_name, name) || g_str_has_prefix(iter_name, prefix)) {
-+            char *path;
-+
-+            path = g_malloc(path_len);
-+            while ((ret = fdt_get_path(fdt, offset, path, path_len))
-+                  == -FDT_ERR_NOSPACE) {
-+                path_len += 16;
-+                path = g_realloc(path, path_len);
-+            }
-+            path_list = g_slist_prepend(path_list, path);
-+            n++;
-+        }
-+        offset = fdt_next_node(fdt, offset, NULL);
-+    }
-+    g_free(prefix);
-+
-+    if (offset < 0 && offset != -FDT_ERR_NOTFOUND) {
-+        error_setg(errp, "%s: abort parsing dt for %s node units: %s",
-+                   __func__, name, fdt_strerror(offset));
-+        for (iter = path_list; iter; iter = iter->next) {
-+            g_free(iter->data);
-+        }
-+        g_slist_free(path_list);
-+        return NULL;
-+    }
-+
-+    path_array = g_new(char *, n + 1);
-+    path_array[n--] = NULL;
-+
-+    for (iter = path_list; iter; iter = iter->next) {
-+        path_array[n--] = iter->data;
-+    }
-+
-+    g_slist_free(path_list);
-+
-+    return path_array;
-+}
-+
- char **qemu_fdt_node_path(void *fdt, const char *name, char *compat,
-                           Error **errp)
- {
---
-.17.1

-[Qemu-devel] [PULL 07/55] target/arm: Implement SVE Memory Contiguous Load Group
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-2-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    |  35 +++++++++
- target/arm/sve_helper.c    | 153 +++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 121 +++++++++++++++++++++++++++++
- target/arm/sve.decode      |  34 +++++++++
-files changed, 343 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld4bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld2hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld3hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld4hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld2ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld3ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld4ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld2dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld3dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld4dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1bhu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1bsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1bdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1bhs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1bss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1bds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1hsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1hdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1hss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ld1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ld1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_while)(void *vd, uint32_t count, uint32_t pred_desc)
-     return predtest_ones(d, oprsz, esz_mask);
- }
-+
-+/*
-+ * Load contiguous data, protected by a governing predicate.
-+ */
-+#define DO_LD1(NAME, FN, TYPEE, TYPEM, H)                  \
-+static void do_##NAME(CPUARMState *env, void *vd, void *vg, \
-+                      target_ulong addr, intptr_t oprsz,   \
-+                      uintptr_t ra)                        \
-+{                                                          \
-+    intptr_t i = 0;                                        \
-+    do {                                                   \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            TYPEM m = 0;                                   \
-+            if (pg & 1) {                                  \
-+                m = FN(env, addr, ra);                     \
-+            }                                              \
-+            *(TYPEE *)(vd + H(i)) = m;                     \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += sizeof(TYPEM);                         \
-+        } while (i & 15);                                  \
-+    } while (i < oprsz);                                   \
-+}                                                          \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    do_##NAME(env, &env->vfp.zregs[simd_data(desc)], vg,   \
-+              addr, simd_oprsz(desc), GETPC());            \
-+}
-+
-+#define DO_LD2(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *d1 = &env->vfp.zregs[rd];                        \
-+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            TYPEM m1 = 0, m2 = 0;                          \
-+            if (pg & 1) {                                  \
-+                m1 = FN(env, addr, ra);                    \
-+                m2 = FN(env, addr + sizeof(TYPEM), ra);    \
-+            }                                              \
-+            *(TYPEE *)(d1 + H(i)) = m1;                    \
-+            *(TYPEE *)(d2 + H(i)) = m2;                    \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += 2 * sizeof(TYPEM);                     \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+#define DO_LD3(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *d1 = &env->vfp.zregs[rd];                        \
-+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
-+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            TYPEM m1 = 0, m2 = 0, m3 = 0;                  \
-+            if (pg & 1) {                                  \
-+                m1 = FN(env, addr, ra);                    \
-+                m2 = FN(env, addr + sizeof(TYPEM), ra);    \
-+                m3 = FN(env, addr + 2 * sizeof(TYPEM), ra); \
-+            }                                              \
-+            *(TYPEE *)(d1 + H(i)) = m1;                    \
-+            *(TYPEE *)(d2 + H(i)) = m2;                    \
-+            *(TYPEE *)(d3 + H(i)) = m3;                    \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += 3 * sizeof(TYPEM);                     \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+#define DO_LD4(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *d1 = &env->vfp.zregs[rd];                        \
-+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
-+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
-+    void *d4 = &env->vfp.zregs[(rd + 3) & 31];             \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            TYPEM m1 = 0, m2 = 0, m3 = 0, m4 = 0;          \
-+            if (pg & 1) {                                  \
-+                m1 = FN(env, addr, ra);                    \
-+                m2 = FN(env, addr + sizeof(TYPEM), ra);    \
-+                m3 = FN(env, addr + 2 * sizeof(TYPEM), ra); \
-+                m4 = FN(env, addr + 3 * sizeof(TYPEM), ra); \
-+            }                                              \
-+            *(TYPEE *)(d1 + H(i)) = m1;                    \
-+            *(TYPEE *)(d2 + H(i)) = m2;                    \
-+            *(TYPEE *)(d3 + H(i)) = m3;                    \
-+            *(TYPEE *)(d4 + H(i)) = m4;                    \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += 4 * sizeof(TYPEM);                     \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+DO_LD1(sve_ld1bhu_r, cpu_ldub_data_ra, uint16_t, uint8_t, H1_2)
-+DO_LD1(sve_ld1bhs_r, cpu_ldsb_data_ra, uint16_t, int8_t, H1_2)
-+DO_LD1(sve_ld1bsu_r, cpu_ldub_data_ra, uint32_t, uint8_t, H1_4)
-+DO_LD1(sve_ld1bss_r, cpu_ldsb_data_ra, uint32_t, int8_t, H1_4)
-+DO_LD1(sve_ld1bdu_r, cpu_ldub_data_ra, uint64_t, uint8_t, )
-+DO_LD1(sve_ld1bds_r, cpu_ldsb_data_ra, uint64_t, int8_t, )
-+
-+DO_LD1(sve_ld1hsu_r, cpu_lduw_data_ra, uint32_t, uint16_t, H1_4)
-+DO_LD1(sve_ld1hss_r, cpu_ldsw_data_ra, uint32_t, int8_t, H1_4)
-+DO_LD1(sve_ld1hdu_r, cpu_lduw_data_ra, uint64_t, uint16_t, )
-+DO_LD1(sve_ld1hds_r, cpu_ldsw_data_ra, uint64_t, int16_t, )
-+
-+DO_LD1(sve_ld1sdu_r, cpu_ldl_data_ra, uint64_t, uint32_t, )
-+DO_LD1(sve_ld1sds_r, cpu_ldl_data_ra, uint64_t, int32_t, )
-+
-+DO_LD1(sve_ld1bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
-+DO_LD2(sve_ld2bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
-+DO_LD3(sve_ld3bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
-+DO_LD4(sve_ld4bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
-+
-+DO_LD1(sve_ld1hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_LD2(sve_ld2hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_LD3(sve_ld3hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_LD4(sve_ld4hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
-+
-+DO_LD1(sve_ld1ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_LD2(sve_ld2ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_LD3(sve_ld3ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_LD4(sve_ld4ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
-+
-+DO_LD1(sve_ld1dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
-+DO_LD2(sve_ld2dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
-+DO_LD3(sve_ld3dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
-+DO_LD4(sve_ld4dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
-+
-+#undef DO_LD1
-+#undef DO_LD2
-+#undef DO_LD3
-+#undef DO_LD4
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ typedef void gen_helper_gvec_flags_3(TCGv_i32, TCGv_ptr, TCGv_ptr,
- typedef void gen_helper_gvec_flags_4(TCGv_i32, TCGv_ptr, TCGv_ptr,
-                                      TCGv_ptr, TCGv_ptr, TCGv_i32);
-+typedef void gen_helper_gvec_mem(TCGv_env, TCGv_ptr, TCGv_i64, TCGv_i32);
-+
- /*
-  * Helpers for extracting complex instruction fields.
-  */
-@@ -XXX,XX +XXX,XX @@ static inline int expand_imm_sh8u(int x)
-     return (uint8_t)x << (x & 0x100 ? 8 : 0);
- }
-+/* Convert a 2-bit memory size (msz) to a 4-bit data type (dtype)
-+ * with unsigned data.  C.f. SVE Memory Contiguous Load Group.
-+ */
-+static inline int msz_dtype(int msz)
-+{
-+    static const uint8_t dtype[4] = { 0, 5, 10, 15 };
-+    return dtype[msz];
-+}
-+
- /*
-  * Include the generated decoder.
-  */
-@@ -XXX,XX +XXX,XX @@ static bool trans_LDR_pri(DisasContext *s, arg_rri *a, uint32_t insn)
-     }
-     return true;
- }
-+
-+/*
-+ *** SVE Memory - Contiguous Load Group
-+ */
-+
-+/* The memory mode of the dtype.  */
-+static const TCGMemOp dtype_mop[16] = {
-+    MO_UB, MO_UB, MO_UB, MO_UB,
-+    MO_SL, MO_UW, MO_UW, MO_UW,
-+    MO_SW, MO_SW, MO_UL, MO_UL,
-+    MO_SB, MO_SB, MO_SB, MO_Q
-+};
-+
-+#define dtype_msz(x)  (dtype_mop[x] & MO_SIZE)
-+
-+/* The vector element size of dtype.  */
-+static const uint8_t dtype_esz[16] = {
-+    0, 1, 2, 3,
-+    3, 1, 2, 3,
-+    3, 2, 2, 3,
-+    3, 2, 1, 3
-+};
-+
-+static void do_mem_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
-+                       gen_helper_gvec_mem *fn)
-+{
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_ptr t_pg;
-+    TCGv_i32 desc;
-+
-+    /* For e.g. LD4, there are not enough arguments to pass all 4
-+     * registers as pointers, so encode the regno into the data field.
-+     * For consistency, do this even for LD1.
-+     */
-+    desc = tcg_const_i32(simd_desc(vsz, vsz, zt));
-+    t_pg = tcg_temp_new_ptr();
-+
-+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, pg));
-+    fn(cpu_env, t_pg, addr, desc);
-+
-+    tcg_temp_free_ptr(t_pg);
-+    tcg_temp_free_i32(desc);
-+}
-+
-+static void do_ld_zpa(DisasContext *s, int zt, int pg,
-+                      TCGv_i64 addr, int dtype, int nreg)
-+{
-+    static gen_helper_gvec_mem * const fns[16][4] = {
-+        { gen_helper_sve_ld1bb_r, gen_helper_sve_ld2bb_r,
-+          gen_helper_sve_ld3bb_r, gen_helper_sve_ld4bb_r },
-+        { gen_helper_sve_ld1bhu_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1bsu_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1bdu_r, NULL, NULL, NULL },
-+
-+        { gen_helper_sve_ld1sds_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1hh_r, gen_helper_sve_ld2hh_r,
-+          gen_helper_sve_ld3hh_r, gen_helper_sve_ld4hh_r },
-+        { gen_helper_sve_ld1hsu_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1hdu_r, NULL, NULL, NULL },
-+
-+        { gen_helper_sve_ld1hds_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1hss_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1ss_r, gen_helper_sve_ld2ss_r,
-+          gen_helper_sve_ld3ss_r, gen_helper_sve_ld4ss_r },
-+        { gen_helper_sve_ld1sdu_r, NULL, NULL, NULL },
-+
-+        { gen_helper_sve_ld1bds_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1bss_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1bhs_r, NULL, NULL, NULL },
-+        { gen_helper_sve_ld1dd_r, gen_helper_sve_ld2dd_r,
-+          gen_helper_sve_ld3dd_r, gen_helper_sve_ld4dd_r },
-+    };
-+    gen_helper_gvec_mem *fn = fns[dtype][nreg];
-+
-+    /* While there are holes in the table, they are not
-+     * accessible via the instruction encoding.
-+     */
-+    assert(fn != NULL);
-+    do_mem_zpa(s, zt, pg, addr, fn);
-+}
-+
-+static bool trans_LD_zprr(DisasContext *s, arg_rprr_load *a, uint32_t insn)
-+{
-+    if (a->rm == 31) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        TCGv_i64 addr = new_tmp_a64(s);
-+        tcg_gen_muli_i64(addr, cpu_reg(s, a->rm),
-+                         (a->nreg + 1) << dtype_msz(a->dtype));
-+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
-+        do_ld_zpa(s, a->rd, a->pg, addr, a->dtype, a->nreg);
-+    }
-+    return true;
-+}
-+
-+static bool trans_LD_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
-+{
-+    if (sve_access_check(s)) {
-+        int vsz = vec_full_reg_size(s);
-+        int elements = vsz >> dtype_esz[a->dtype];
-+        TCGv_i64 addr = new_tmp_a64(s);
-+
-+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn),
-+                         (a->imm * elements * (a->nreg + 1))
-+                         << dtype_msz(a->dtype));
-+        do_ld_zpa(s, a->rd, a->pg, addr, a->dtype, a->nreg);
-+    }
-+    return true;
-+}
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- # Unsigned 8-bit immediate, optionally shifted left by 8.
- %sh8_i8u        5:9 !function=expand_imm_sh8u
-+# Unsigned load of msz into esz=2, represented as a dtype.
-+%msz_dtype      23:2 !function=msz_dtype
-+
- # Either a copy of rd (at bit 0), or a different source
- # as propagated via the MOVPRFX instruction.
- %reg_movprfx    0:5
-@@ -XXX,XX +XXX,XX @@
- &incdec2_cnt    rd rn pat esz imm d u
- &incdec_pred    rd pg esz d u
- &incdec2_pred   rd rn pg esz d u
-+&rprr_load      rd pg rn rm dtype nreg
-+&rpri_load      rd pg rn imm dtype nreg
- ###########################################################################
- # Named instruction formats.  These are generally used to
-@@ -XXX,XX +XXX,XX @@
- @incdec2_pred   ........ esz:2 .... .. ..... .. pg:4 rd:5 \
-                 &incdec2_pred rn=%reg_movprfx
-+# Loads; user must fill in NREG.
-+@rprr_load_dt   ....... dtype:4 rm:5 ... pg:3 rn:5 rd:5         &rprr_load
-+@rpri_load_dt   ....... dtype:4 . imm:s4 ... pg:3 rn:5 rd:5     &rpri_load
-+
-+@rprr_load_msz  ....... .... rm:5 ... pg:3 rn:5 rd:5 \
-+                &rprr_load dtype=%msz_dtype
-+@rpri_load_msz  ....... .... . imm:s4 ... pg:3 rn:5 rd:5 \
-+                &rpri_load dtype=%msz_dtype
-+
- ###########################################################################
- # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
-@@ -XXX,XX +XXX,XX @@ LDR_pri         10000101 10 ...... 000 ... ..... 0 ....         @pd_rn_i9
- # SVE load vector register
- LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
-+
-+### SVE Memory Contiguous Load Group
-+
-+# SVE contiguous load (scalar plus scalar)
-+LD_zprr         1010010 .... ..... 010 ... ..... .....    @rprr_load_dt nreg=0
-+
-+# SVE contiguous load (scalar plus immediate)
-+LD_zpri         1010010 .... 0.... 101 ... ..... .....    @rpri_load_dt nreg=0
-+
-+# SVE contiguous non-temporal load (scalar plus scalar)
-+# LDNT1B, LDNT1H, LDNT1W, LDNT1D
-+# SVE load multiple structures (scalar plus scalar)
-+# LD2B, LD2H, LD2W, LD2D; etc.
-+LD_zprr         1010010 .. nreg:2 ..... 110 ... ..... .....     @rprr_load_msz
-+
-+# SVE contiguous non-temporal load (scalar plus immediate)
-+# LDNT1B, LDNT1H, LDNT1W, LDNT1D
-+# SVE load multiple structures (scalar plus immediate)
-+# LD2B, LD2H, LD2W, LD2D; etc.
-+LD_zpri         1010010 .. nreg:2 0.... 111 ... ..... .....     @rpri_load_msz
---
-.17.1

-[Qemu-devel] [PULL 08/55] target/arm: Implement SVE Contiguous Load, first-fault and no-fault
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
-Message-id: 20180627043328.11531-3-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    |  40 ++++++++++
- target/arm/sve_helper.c    | 157 +++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c |  69 ++++++++++++++++
- target/arm/sve.decode      |   6 ++
-files changed, 272 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_ld1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ld1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ld1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldff1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1bhu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1bsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1bdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1bhs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1bss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1bds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldff1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1hsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1hdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1hss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldff1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldff1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldff1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldnf1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1bhu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1bsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1bdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1bhs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1bss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1bds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldnf1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1hsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1hdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1hss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldnf1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_ldnf1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_ldnf1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_LD4(sve_ld4dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
- #undef DO_LD2
- #undef DO_LD3
- #undef DO_LD4
-+
-+/*
-+ * Load contiguous data, first-fault and no-fault.
-+ */
-+
-+#ifdef CONFIG_USER_ONLY
-+
-+/* Fault on byte I.  All bits in FFR from I are cleared.  The vector
-+ * result from I is CONSTRAINED UNPREDICTABLE; we choose the MERGE
-+ * option, which leaves subsequent data unchanged.
-+ */
-+static void record_fault(CPUARMState *env, uintptr_t i, uintptr_t oprsz)
-+{
-+    uint64_t *ffr = env->vfp.pregs[FFR_PRED_NUM].p;
-+
-+    if (i & 63) {
-+        ffr[i / 64] &= MAKE_64BIT_MASK(0, i & 63);
-+        i = ROUND_UP(i, 64);
-+    }
-+    for (; i < oprsz; i += 64) {
-+        ffr[i / 64] = 0;
-+    }
-+}
-+
-+/* Hold the mmap lock during the operation so that there is no race
-+ * between page_check_range and the load operation.  We expect the
-+ * usual case to have no faults at all, so we check the whole range
-+ * first and if successful defer to the normal load operation.
-+ *
-+ * TODO: Change mmap_lock to a rwlock so that multiple readers
-+ * can run simultaneously.  This will probably help other uses
-+ * within QEMU as well.
-+ */
-+#define DO_LDFF1(PART, FN, TYPEE, TYPEM, H)                             \
-+static void do_sve_ldff1##PART(CPUARMState *env, void *vd, void *vg,    \
-+                               target_ulong addr, intptr_t oprsz,       \
-+                               bool first, uintptr_t ra)                \
-+{                                                                       \
-+    intptr_t i = 0;                                                     \
-+    do {                                                                \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
-+        do {                                                            \
-+            TYPEM m = 0;                                                \
-+            if (pg & 1) {                                               \
-+                if (!first &&                                           \
-+                    unlikely(page_check_range(addr, sizeof(TYPEM),      \
-+                                              PAGE_READ))) {            \
-+                    record_fault(env, i, oprsz);                        \
-+                    return;                                             \
-+                }                                                       \
-+                m = FN(env, addr, ra);                                  \
-+                first = false;                                          \
-+            }                                                           \
-+            *(TYPEE *)(vd + H(i)) = m;                                  \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);                   \
-+            addr += sizeof(TYPEM);                                      \
-+        } while (i & 15);                                               \
-+    } while (i < oprsz);                                                \
-+}                                                                       \
-+void HELPER(sve_ldff1##PART)(CPUARMState *env, void *vg,                \
-+                             target_ulong addr, uint32_t desc)          \
-+{                                                                       \
-+    intptr_t oprsz = simd_oprsz(desc);                                  \
-+    unsigned rd = simd_data(desc);                                      \
-+    void *vd = &env->vfp.zregs[rd];                                     \
-+    mmap_lock();                                                        \
-+    if (likely(page_check_range(addr, oprsz, PAGE_READ) == 0)) {        \
-+        do_sve_ld1##PART(env, vd, vg, addr, oprsz, GETPC());            \
-+    } else {                                                            \
-+        do_sve_ldff1##PART(env, vd, vg, addr, oprsz, true, GETPC());    \
-+    }                                                                   \
-+    mmap_unlock();                                                      \
-+}
-+
-+/* No-fault loads are like first-fault loads without the
-+ * first faulting special case.
-+ */
-+#define DO_LDNF1(PART)                                                  \
-+void HELPER(sve_ldnf1##PART)(CPUARMState *env, void *vg,                \
-+                             target_ulong addr, uint32_t desc)          \
-+{                                                                       \
-+    intptr_t oprsz = simd_oprsz(desc);                                  \
-+    unsigned rd = simd_data(desc);                                      \
-+    void *vd = &env->vfp.zregs[rd];                                     \
-+    mmap_lock();                                                        \
-+    if (likely(page_check_range(addr, oprsz, PAGE_READ) == 0)) {        \
-+        do_sve_ld1##PART(env, vd, vg, addr, oprsz, GETPC());            \
-+    } else {                                                            \
-+        do_sve_ldff1##PART(env, vd, vg, addr, oprsz, false, GETPC());   \
-+    }                                                                   \
-+    mmap_unlock();                                                      \
-+}
-+
-+#else
-+
-+/* TODO: System mode is not yet supported.
-+ * This would probably use tlb_vaddr_to_host.
-+ */
-+#define DO_LDFF1(PART, FN, TYPEE, TYPEM, H)                     \
-+void HELPER(sve_ldff1##PART)(CPUARMState *env, void *vg,        \
-+                  target_ulong addr, uint32_t desc)             \
-+{                                                               \
-+    g_assert_not_reached();                                     \
-+}
-+
-+#define DO_LDNF1(PART)                                          \
-+void HELPER(sve_ldnf1##PART)(CPUARMState *env, void *vg,        \
-+                  target_ulong addr, uint32_t desc)             \
-+{                                                               \
-+    g_assert_not_reached();                                     \
-+}
-+
-+#endif
-+
-+DO_LDFF1(bb_r,  cpu_ldub_data_ra, uint8_t, uint8_t, H1)
-+DO_LDFF1(bhu_r, cpu_ldub_data_ra, uint16_t, uint8_t, H1_2)
-+DO_LDFF1(bhs_r, cpu_ldsb_data_ra, uint16_t, int8_t, H1_2)
-+DO_LDFF1(bsu_r, cpu_ldub_data_ra, uint32_t, uint8_t, H1_4)
-+DO_LDFF1(bss_r, cpu_ldsb_data_ra, uint32_t, int8_t, H1_4)
-+DO_LDFF1(bdu_r, cpu_ldub_data_ra, uint64_t, uint8_t, )
-+DO_LDFF1(bds_r, cpu_ldsb_data_ra, uint64_t, int8_t, )
-+
-+DO_LDFF1(hh_r,  cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_LDFF1(hsu_r, cpu_lduw_data_ra, uint32_t, uint16_t, H1_4)
-+DO_LDFF1(hss_r, cpu_ldsw_data_ra, uint32_t, int8_t, H1_4)
-+DO_LDFF1(hdu_r, cpu_lduw_data_ra, uint64_t, uint16_t, )
-+DO_LDFF1(hds_r, cpu_ldsw_data_ra, uint64_t, int16_t, )
-+
-+DO_LDFF1(ss_r,  cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_LDFF1(sdu_r, cpu_ldl_data_ra, uint64_t, uint32_t, )
-+DO_LDFF1(sds_r, cpu_ldl_data_ra, uint64_t, int32_t, )
-+
-+DO_LDFF1(dd_r,  cpu_ldq_data_ra, uint64_t, uint64_t, )
-+
-+#undef DO_LDFF1
-+
-+DO_LDNF1(bb_r)
-+DO_LDNF1(bhu_r)
-+DO_LDNF1(bhs_r)
-+DO_LDNF1(bsu_r)
-+DO_LDNF1(bss_r)
-+DO_LDNF1(bdu_r)
-+DO_LDNF1(bds_r)
-+
-+DO_LDNF1(hh_r)
-+DO_LDNF1(hsu_r)
-+DO_LDNF1(hss_r)
-+DO_LDNF1(hdu_r)
-+DO_LDNF1(hds_r)
-+
-+DO_LDNF1(ss_r)
-+DO_LDNF1(sdu_r)
-+DO_LDNF1(sds_r)
-+
-+DO_LDNF1(dd_r)
-+
-+#undef DO_LDNF1
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_LD_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
-     }
-     return true;
- }
-+
-+static bool trans_LDFF1_zprr(DisasContext *s, arg_rprr_load *a, uint32_t insn)
-+{
-+    static gen_helper_gvec_mem * const fns[16] = {
-+        gen_helper_sve_ldff1bb_r,
-+        gen_helper_sve_ldff1bhu_r,
-+        gen_helper_sve_ldff1bsu_r,
-+        gen_helper_sve_ldff1bdu_r,
-+
-+        gen_helper_sve_ldff1sds_r,
-+        gen_helper_sve_ldff1hh_r,
-+        gen_helper_sve_ldff1hsu_r,
-+        gen_helper_sve_ldff1hdu_r,
-+
-+        gen_helper_sve_ldff1hds_r,
-+        gen_helper_sve_ldff1hss_r,
-+        gen_helper_sve_ldff1ss_r,
-+        gen_helper_sve_ldff1sdu_r,
-+
-+        gen_helper_sve_ldff1bds_r,
-+        gen_helper_sve_ldff1bss_r,
-+        gen_helper_sve_ldff1bhs_r,
-+        gen_helper_sve_ldff1dd_r,
-+    };
-+
-+    if (sve_access_check(s)) {
-+        TCGv_i64 addr = new_tmp_a64(s);
-+        tcg_gen_shli_i64(addr, cpu_reg(s, a->rm), dtype_msz(a->dtype));
-+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
-+        do_mem_zpa(s, a->rd, a->pg, addr, fns[a->dtype]);
-+    }
-+    return true;
-+}
-+
-+static bool trans_LDNF1_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
-+{
-+    static gen_helper_gvec_mem * const fns[16] = {
-+        gen_helper_sve_ldnf1bb_r,
-+        gen_helper_sve_ldnf1bhu_r,
-+        gen_helper_sve_ldnf1bsu_r,
-+        gen_helper_sve_ldnf1bdu_r,
-+
-+        gen_helper_sve_ldnf1sds_r,
-+        gen_helper_sve_ldnf1hh_r,
-+        gen_helper_sve_ldnf1hsu_r,
-+        gen_helper_sve_ldnf1hdu_r,
-+
-+        gen_helper_sve_ldnf1hds_r,
-+        gen_helper_sve_ldnf1hss_r,
-+        gen_helper_sve_ldnf1ss_r,
-+        gen_helper_sve_ldnf1sdu_r,
-+
-+        gen_helper_sve_ldnf1bds_r,
-+        gen_helper_sve_ldnf1bss_r,
-+        gen_helper_sve_ldnf1bhs_r,
-+        gen_helper_sve_ldnf1dd_r,
-+    };
-+
-+    if (sve_access_check(s)) {
-+        int vsz = vec_full_reg_size(s);
-+        int elements = vsz >> dtype_esz[a->dtype];
-+        int off = (a->imm * elements) << dtype_msz(a->dtype);
-+        TCGv_i64 addr = new_tmp_a64(s);
-+
-+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn), off);
-+        do_mem_zpa(s, a->rd, a->pg, addr, fns[a->dtype]);
-+    }
-+    return true;
-+}
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
- # SVE contiguous load (scalar plus scalar)
- LD_zprr         1010010 .... ..... 010 ... ..... .....    @rprr_load_dt nreg=0
-+# SVE contiguous first-fault load (scalar plus scalar)
-+LDFF1_zprr      1010010 .... ..... 011 ... ..... .....    @rprr_load_dt nreg=0
-+
- # SVE contiguous load (scalar plus immediate)
- LD_zpri         1010010 .... 0.... 101 ... ..... .....    @rpri_load_dt nreg=0
-+# SVE contiguous non-fault load (scalar plus immediate)
-+LDNF1_zpri      1010010 .... 1.... 101 ... ..... .....    @rpri_load_dt nreg=0
-+
- # SVE contiguous non-temporal load (scalar plus scalar)
- # LDNT1B, LDNT1H, LDNT1W, LDNT1D
- # SVE load multiple structures (scalar plus scalar)
---
-.17.1

-[Qemu-devel] [PULL 09/55] target/arm: Implement SVE Memory Contiguous Store Group
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-4-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    |  29 +++++
- target/arm/sve_helper.c    | 211 +++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c |  65 ++++++++++++
- target/arm/sve.decode      |  38 +++++++
-files changed, 343 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_ldnf1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ldnf1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ldnf1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st4bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st2hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st3hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st4hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st2ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st3ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st4ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st2dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st3dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st4dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1bh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st1bs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st1bd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1hs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+DEF_HELPER_FLAGS_4(sve_st1hd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_st1sd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_LDNF1(sds_r)
- DO_LDNF1(dd_r)
- #undef DO_LDNF1
-+
-+/*
-+ * Store contiguous data, protected by a governing predicate.
-+ */
-+#define DO_ST1(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *vd = &env->vfp.zregs[rd];                        \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            if (pg & 1) {                                  \
-+                TYPEM m = *(TYPEE *)(vd + H(i));           \
-+                FN(env, addr, m, ra);                      \
-+            }                                              \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += sizeof(TYPEM);                         \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+#define DO_ST1_D(NAME, FN, TYPEM)                          \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc) / 8;              \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    uint64_t *d = &env->vfp.zregs[rd].d[0];                \
-+    uint8_t *pg = vg;                                      \
-+    for (i = 0; i < oprsz; i += 1) {                       \
-+        if (pg[H1(i)] & 1) {                               \
-+            FN(env, addr, d[i], ra);                       \
-+        }                                                  \
-+        addr += sizeof(TYPEM);                             \
-+    }                                                      \
-+}
-+
-+#define DO_ST2(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *d1 = &env->vfp.zregs[rd];                        \
-+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            if (pg & 1) {                                  \
-+                TYPEM m1 = *(TYPEE *)(d1 + H(i));          \
-+                TYPEM m2 = *(TYPEE *)(d2 + H(i));          \
-+                FN(env, addr, m1, ra);                     \
-+                FN(env, addr + sizeof(TYPEM), m2, ra);     \
-+            }                                              \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += 2 * sizeof(TYPEM);                     \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+#define DO_ST3(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *d1 = &env->vfp.zregs[rd];                        \
-+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
-+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            if (pg & 1) {                                  \
-+                TYPEM m1 = *(TYPEE *)(d1 + H(i));          \
-+                TYPEM m2 = *(TYPEE *)(d2 + H(i));          \
-+                TYPEM m3 = *(TYPEE *)(d3 + H(i));          \
-+                FN(env, addr, m1, ra);                     \
-+                FN(env, addr + sizeof(TYPEM), m2, ra);     \
-+                FN(env, addr + 2 * sizeof(TYPEM), m3, ra); \
-+            }                                              \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += 3 * sizeof(TYPEM);                     \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+#define DO_ST4(NAME, FN, TYPEE, TYPEM, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vg,              \
-+                  target_ulong addr, uint32_t desc)        \
-+{                                                          \
-+    intptr_t i, oprsz = simd_oprsz(desc);                  \
-+    intptr_t ra = GETPC();                                 \
-+    unsigned rd = simd_data(desc);                         \
-+    void *d1 = &env->vfp.zregs[rd];                        \
-+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
-+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
-+    void *d4 = &env->vfp.zregs[(rd + 3) & 31];             \
-+    for (i = 0; i < oprsz; ) {                             \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
-+        do {                                               \
-+            if (pg & 1) {                                  \
-+                TYPEM m1 = *(TYPEE *)(d1 + H(i));          \
-+                TYPEM m2 = *(TYPEE *)(d2 + H(i));          \
-+                TYPEM m3 = *(TYPEE *)(d3 + H(i));          \
-+                TYPEM m4 = *(TYPEE *)(d4 + H(i));          \
-+                FN(env, addr, m1, ra);                     \
-+                FN(env, addr + sizeof(TYPEM), m2, ra);     \
-+                FN(env, addr + 2 * sizeof(TYPEM), m3, ra); \
-+                FN(env, addr + 3 * sizeof(TYPEM), m4, ra); \
-+            }                                              \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
-+            addr += 4 * sizeof(TYPEM);                     \
-+        } while (i & 15);                                  \
-+    }                                                      \
-+}
-+
-+DO_ST1(sve_st1bh_r, cpu_stb_data_ra, uint16_t, uint8_t, H1_2)
-+DO_ST1(sve_st1bs_r, cpu_stb_data_ra, uint32_t, uint8_t, H1_4)
-+DO_ST1_D(sve_st1bd_r, cpu_stb_data_ra, uint8_t)
-+
-+DO_ST1(sve_st1hs_r, cpu_stw_data_ra, uint32_t, uint16_t, H1_4)
-+DO_ST1_D(sve_st1hd_r, cpu_stw_data_ra, uint16_t)
-+
-+DO_ST1_D(sve_st1sd_r, cpu_stl_data_ra, uint32_t)
-+
-+DO_ST1(sve_st1bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
-+DO_ST2(sve_st2bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
-+DO_ST3(sve_st3bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
-+DO_ST4(sve_st4bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
-+
-+DO_ST1(sve_st1hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_ST2(sve_st2hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_ST3(sve_st3hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
-+DO_ST4(sve_st4hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
-+
-+DO_ST1(sve_st1ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_ST2(sve_st2ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_ST3(sve_st3ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
-+DO_ST4(sve_st4ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
-+
-+DO_ST1_D(sve_st1dd_r, cpu_stq_data_ra, uint64_t)
-+
-+void HELPER(sve_st2dd_r)(CPUARMState *env, void *vg,
-+                         target_ulong addr, uint32_t desc)
-+{
-+    intptr_t i, oprsz = simd_oprsz(desc) / 8;
-+    intptr_t ra = GETPC();
-+    unsigned rd = simd_data(desc);
-+    uint64_t *d1 = &env->vfp.zregs[rd].d[0];
-+    uint64_t *d2 = &env->vfp.zregs[(rd + 1) & 31].d[0];
-+    uint8_t *pg = vg;
-+
-+    for (i = 0; i < oprsz; i += 1) {
-+        if (pg[H1(i)] & 1) {
-+            cpu_stq_data_ra(env, addr, d1[i], ra);
-+            cpu_stq_data_ra(env, addr + 8, d2[i], ra);
-+        }
-+        addr += 2 * 8;
-+    }
-+}
-+
-+void HELPER(sve_st3dd_r)(CPUARMState *env, void *vg,
-+                         target_ulong addr, uint32_t desc)
-+{
-+    intptr_t i, oprsz = simd_oprsz(desc) / 8;
-+    intptr_t ra = GETPC();
-+    unsigned rd = simd_data(desc);
-+    uint64_t *d1 = &env->vfp.zregs[rd].d[0];
-+    uint64_t *d2 = &env->vfp.zregs[(rd + 1) & 31].d[0];
-+    uint64_t *d3 = &env->vfp.zregs[(rd + 2) & 31].d[0];
-+    uint8_t *pg = vg;
-+
-+    for (i = 0; i < oprsz; i += 1) {
-+        if (pg[H1(i)] & 1) {
-+            cpu_stq_data_ra(env, addr, d1[i], ra);
-+            cpu_stq_data_ra(env, addr + 8, d2[i], ra);
-+            cpu_stq_data_ra(env, addr + 16, d3[i], ra);
-+        }
-+        addr += 3 * 8;
-+    }
-+}
-+
-+void HELPER(sve_st4dd_r)(CPUARMState *env, void *vg,
-+                         target_ulong addr, uint32_t desc)
-+{
-+    intptr_t i, oprsz = simd_oprsz(desc) / 8;
-+    intptr_t ra = GETPC();
-+    unsigned rd = simd_data(desc);
-+    uint64_t *d1 = &env->vfp.zregs[rd].d[0];
-+    uint64_t *d2 = &env->vfp.zregs[(rd + 1) & 31].d[0];
-+    uint64_t *d3 = &env->vfp.zregs[(rd + 2) & 31].d[0];
-+    uint64_t *d4 = &env->vfp.zregs[(rd + 3) & 31].d[0];
-+    uint8_t *pg = vg;
-+
-+    for (i = 0; i < oprsz; i += 1) {
-+        if (pg[H1(i)] & 1) {
-+            cpu_stq_data_ra(env, addr, d1[i], ra);
-+            cpu_stq_data_ra(env, addr + 8, d2[i], ra);
-+            cpu_stq_data_ra(env, addr + 16, d3[i], ra);
-+            cpu_stq_data_ra(env, addr + 24, d4[i], ra);
-+        }
-+        addr += 4 * 8;
-+    }
-+}
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_LDNF1_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
-     }
-     return true;
- }
-+
-+static void do_st_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
-+                      int msz, int esz, int nreg)
-+{
-+    static gen_helper_gvec_mem * const fn_single[4][4] = {
-+        { gen_helper_sve_st1bb_r, gen_helper_sve_st1bh_r,
-+          gen_helper_sve_st1bs_r, gen_helper_sve_st1bd_r },
-+        { NULL,                   gen_helper_sve_st1hh_r,
-+          gen_helper_sve_st1hs_r, gen_helper_sve_st1hd_r },
-+        { NULL, NULL,
-+          gen_helper_sve_st1ss_r, gen_helper_sve_st1sd_r },
-+        { NULL, NULL, NULL, gen_helper_sve_st1dd_r },
-+    };
-+    static gen_helper_gvec_mem * const fn_multiple[3][4] = {
-+        { gen_helper_sve_st2bb_r, gen_helper_sve_st2hh_r,
-+          gen_helper_sve_st2ss_r, gen_helper_sve_st2dd_r },
-+        { gen_helper_sve_st3bb_r, gen_helper_sve_st3hh_r,
-+          gen_helper_sve_st3ss_r, gen_helper_sve_st3dd_r },
-+        { gen_helper_sve_st4bb_r, gen_helper_sve_st4hh_r,
-+          gen_helper_sve_st4ss_r, gen_helper_sve_st4dd_r },
-+    };
-+    gen_helper_gvec_mem *fn;
-+
-+    if (nreg == 0) {
-+        /* ST1 */
-+        fn = fn_single[msz][esz];
-+    } else {
-+        /* ST2, ST3, ST4 -- msz == esz, enforced by encoding */
-+        assert(msz == esz);
-+        fn = fn_multiple[nreg - 1][msz];
-+    }
-+    assert(fn != NULL);
-+    do_mem_zpa(s, zt, pg, addr, fn);
-+}
-+
-+static bool trans_ST_zprr(DisasContext *s, arg_rprr_store *a, uint32_t insn)
-+{
-+    if (a->rm == 31 || a->msz > a->esz) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        TCGv_i64 addr = new_tmp_a64(s);
-+        tcg_gen_muli_i64(addr, cpu_reg(s, a->rm), (a->nreg + 1) << a->msz);
-+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
-+        do_st_zpa(s, a->rd, a->pg, addr, a->msz, a->esz, a->nreg);
-+    }
-+    return true;
-+}
-+
-+static bool trans_ST_zpri(DisasContext *s, arg_rpri_store *a, uint32_t insn)
-+{
-+    if (a->msz > a->esz) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        int vsz = vec_full_reg_size(s);
-+        int elements = vsz >> a->esz;
-+        TCGv_i64 addr = new_tmp_a64(s);
-+
-+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn),
-+                         (a->imm * elements * (a->nreg + 1)) << a->msz);
-+        do_st_zpa(s, a->rd, a->pg, addr, a->msz, a->esz, a->nreg);
-+    }
-+    return true;
-+}
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- %imm7_22_16     22:2 16:5
- %imm8_16_10     16:5 10:3
- %imm9_16_10     16:s6 10:3
-+%size_23        23:2
- # A combination of tsz:imm3 -- extract esize.
- %tszimm_esz     22:2 5:5 !function=tszimm_esz
-@@ -XXX,XX +XXX,XX @@
- &incdec2_pred   rd rn pg esz d u
- &rprr_load      rd pg rn rm dtype nreg
- &rpri_load      rd pg rn imm dtype nreg
-+&rprr_store     rd pg rn rm msz esz nreg
-+&rpri_store     rd pg rn imm msz esz nreg
- ###########################################################################
- # Named instruction formats.  These are generally used to
-@@ -XXX,XX +XXX,XX @@
- @rpri_load_msz  ....... .... . imm:s4 ... pg:3 rn:5 rd:5 \
-                 &rpri_load dtype=%msz_dtype
-+# Stores; user must fill in ESZ, MSZ, NREG as needed.
-+@rprr_store         ....... ..    ..     rm:5 ... pg:3 rn:5 rd:5    &rprr_store
-+@rpri_store_msz     ....... msz:2 .. . imm:s4 ... pg:3 rn:5 rd:5    &rpri_store
-+@rprr_store_esz_n0  ....... ..    esz:2  rm:5 ... pg:3 rn:5 rd:5 \
-+                    &rprr_store nreg=0
-+
- ###########################################################################
- # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
-@@ -XXX,XX +XXX,XX @@ LD_zprr         1010010 .. nreg:2 ..... 110 ... ..... .....     @rprr_load_msz
- # SVE load multiple structures (scalar plus immediate)
- # LD2B, LD2H, LD2W, LD2D; etc.
- LD_zpri         1010010 .. nreg:2 0.... 111 ... ..... .....     @rpri_load_msz
-+
-+### SVE Memory Store Group
-+
-+# SVE contiguous store (scalar plus immediate)
-+# ST1B, ST1H, ST1W, ST1D; require msz <= esz
-+ST_zpri         1110010 .. esz:2  0.... 111 ... ..... ..... \
-+                @rpri_store_msz nreg=0
-+
-+# SVE contiguous store (scalar plus scalar)
-+# ST1B, ST1H, ST1W, ST1D; require msz <= esz
-+# Enumerate msz lest we conflict with STR_zri.
-+ST_zprr         1110010 00 ..     ..... 010 ... ..... ..... \
-+                @rprr_store_esz_n0 msz=0
-+ST_zprr         1110010 01 ..     ..... 010 ... ..... ..... \
-+                @rprr_store_esz_n0 msz=1
-+ST_zprr         1110010 10 ..     ..... 010 ... ..... ..... \
-+                @rprr_store_esz_n0 msz=2
-+ST_zprr         1110010 11 11     ..... 010 ... ..... ..... \
-+                @rprr_store msz=3 esz=3 nreg=0
-+
-+# SVE contiguous non-temporal store (scalar plus immediate)  (nreg == 0)
-+# SVE store multiple structures (scalar plus immediate)      (nreg != 0)
-+ST_zpri         1110010 .. nreg:2 1.... 111 ... ..... ..... \
-+                @rpri_store_msz esz=%size_23
-+
-+# SVE contiguous non-temporal store (scalar plus scalar)     (nreg == 0)
-+# SVE store multiple structures (scalar plus scalar)         (nreg != 0)
-+ST_zprr         1110010 msz:2 nreg:2 ..... 011 ... ..... ..... \
-+                @rprr_store esz=%size_23
---
-.17.1

-[Qemu-devel] [PULL 10/55] target/arm: Implement SVE load and broadcast quadword
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-5-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate-sve.c | 52 ++++++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      |  9 +++++++
-files changed, 61 insertions(+)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_LDNF1_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
-     return true;
- }
-+static void do_ldrq(DisasContext *s, int zt, int pg, TCGv_i64 addr, int msz)
-+{
-+    static gen_helper_gvec_mem * const fns[4] = {
-+        gen_helper_sve_ld1bb_r, gen_helper_sve_ld1hh_r,
-+        gen_helper_sve_ld1ss_r, gen_helper_sve_ld1dd_r,
-+    };
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_ptr t_pg;
-+    TCGv_i32 desc;
-+
-+    /* Load the first quadword using the normal predicated load helpers.  */
-+    desc = tcg_const_i32(simd_desc(16, 16, zt));
-+    t_pg = tcg_temp_new_ptr();
-+
-+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, pg));
-+    fns[msz](cpu_env, t_pg, addr, desc);
-+
-+    tcg_temp_free_ptr(t_pg);
-+    tcg_temp_free_i32(desc);
-+
-+    /* Replicate that first quadword.  */
-+    if (vsz > 16) {
-+        unsigned dofs = vec_full_reg_offset(s, zt);
-+        tcg_gen_gvec_dup_mem(4, dofs + 16, dofs, vsz - 16, vsz - 16);
-+    }
-+}
-+
-+static bool trans_LD1RQ_zprr(DisasContext *s, arg_rprr_load *a, uint32_t insn)
-+{
-+    if (a->rm == 31) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        int msz = dtype_msz(a->dtype);
-+        TCGv_i64 addr = new_tmp_a64(s);
-+        tcg_gen_shli_i64(addr, cpu_reg(s, a->rm), msz);
-+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
-+        do_ldrq(s, a->rd, a->pg, addr, msz);
-+    }
-+    return true;
-+}
-+
-+static bool trans_LD1RQ_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
-+{
-+    if (sve_access_check(s)) {
-+        TCGv_i64 addr = new_tmp_a64(s);
-+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn), a->imm * 16);
-+        do_ldrq(s, a->rd, a->pg, addr, dtype_msz(a->dtype));
-+    }
-+    return true;
-+}
-+
- static void do_st_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
-                       int msz, int esz, int nreg)
- {
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ LD_zprr         1010010 .. nreg:2 ..... 110 ... ..... .....     @rprr_load_msz
- # LD2B, LD2H, LD2W, LD2D; etc.
- LD_zpri         1010010 .. nreg:2 0.... 111 ... ..... .....     @rpri_load_msz
-+# SVE load and broadcast quadword (scalar plus scalar)
-+LD1RQ_zprr      1010010 .. 00 ..... 000 ... ..... ..... \
-+                @rprr_load_msz nreg=0
-+
-+# SVE load and broadcast quadword (scalar plus immediate)
-+# LD1RQB, LD1RQH, LD1RQS, LD1RQD
-+LD1RQ_zpri      1010010 .. 00 0.... 001 ... ..... ..... \
-+                @rpri_load_msz nreg=0
-+
- ### SVE Memory Store Group
- # SVE contiguous store (scalar plus immediate)
---
-.17.1

-[Qemu-devel] [PULL 11/55] target/arm: Implement SVE integer convert to floating-point
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-[PMM: fixed typo]
-Message-id: 20180627043328.11531-6-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 30 +++++++++++++
- target/arm/sve_helper.c    | 38 ++++++++++++++++
- target/arm/translate-sve.c | 90 ++++++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      | 22 ++++++++++
-files changed, 180 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_dh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_ss, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_sd, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_ds, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_scvt_dd, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_5(sve_ucvt_hh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ucvt_sh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ucvt_dh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ucvt_ss, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ucvt_sd, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ucvt_ds, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ucvt_dd, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_4(sve_ld1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ld2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ld3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_while)(void *vd, uint32_t count, uint32_t pred_desc)
-     return predtest_ones(d, oprsz, esz_mask);
- }
-+/* Fully general two-operand expander, controlled by a predicate,
-+ * With the extra float_status parameter.
-+ */
-+#define DO_ZPZ_FP(NAME, TYPE, H, OP)                                  \
-+void HELPER(NAME)(void *vd, void *vn, void *vg, void *status, uint32_t desc) \
-+{                                                                     \
-+    intptr_t i = simd_oprsz(desc);                                    \
-+    uint64_t *g = vg;                                                 \
-+    do {                                                              \
-+        uint64_t pg = g[(i - 1) >> 6];                                \
-+        do {                                                          \
-+            i -= sizeof(TYPE);                                        \
-+            if (likely((pg >> (i & 63)) & 1)) {                       \
-+                TYPE nn = *(TYPE *)(vn + H(i));                       \
-+                *(TYPE *)(vd + H(i)) = OP(nn, status);                \
-+            }                                                         \
-+        } while (i & 63);                                             \
-+    } while (i != 0);                                                 \
-+}
-+
-+DO_ZPZ_FP(sve_scvt_hh, uint16_t, H1_2, int16_to_float16)
-+DO_ZPZ_FP(sve_scvt_sh, uint32_t, H1_4, int32_to_float16)
-+DO_ZPZ_FP(sve_scvt_ss, uint32_t, H1_4, int32_to_float32)
-+DO_ZPZ_FP(sve_scvt_sd, uint64_t,     , int32_to_float64)
-+DO_ZPZ_FP(sve_scvt_dh, uint64_t,     , int64_to_float16)
-+DO_ZPZ_FP(sve_scvt_ds, uint64_t,     , int64_to_float32)
-+DO_ZPZ_FP(sve_scvt_dd, uint64_t,     , int64_to_float64)
-+
-+DO_ZPZ_FP(sve_ucvt_hh, uint16_t, H1_2, uint16_to_float16)
-+DO_ZPZ_FP(sve_ucvt_sh, uint32_t, H1_4, uint32_to_float16)
-+DO_ZPZ_FP(sve_ucvt_ss, uint32_t, H1_4, uint32_to_float32)
-+DO_ZPZ_FP(sve_ucvt_sd, uint64_t,     , uint32_to_float64)
-+DO_ZPZ_FP(sve_ucvt_dh, uint64_t,     , uint64_to_float16)
-+DO_ZPZ_FP(sve_ucvt_ds, uint64_t,     , uint64_to_float32)
-+DO_ZPZ_FP(sve_ucvt_dd, uint64_t,     , uint64_to_float64)
-+
-+#undef DO_ZPZ_FP
-+
- /*
-  * Load contiguous data, protected by a governing predicate.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_FP3(FRSQRTS, rsqrts)
- #undef DO_FP3
-+
-+/*
-+ *** SVE Floating Point Unary Operations Predicated Group
-+ */
-+
-+static bool do_zpz_ptr(DisasContext *s, int rd, int rn, int pg,
-+                       bool is_fp16, gen_helper_gvec_3_ptr *fn)
-+{
-+    if (sve_access_check(s)) {
-+        unsigned vsz = vec_full_reg_size(s);
-+        TCGv_ptr status = get_fpstatus_ptr(is_fp16);
-+        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
-+                           vec_full_reg_offset(s, rn),
-+                           pred_full_reg_offset(s, pg),
-+                           status, vsz, vsz, 0, fn);
-+        tcg_temp_free_ptr(status);
-+    }
-+    return true;
-+}
-+
-+static bool trans_SCVTF_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_hh);
-+}
-+
-+static bool trans_SCVTF_sh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_sh);
-+}
-+
-+static bool trans_SCVTF_dh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_dh);
-+}
-+
-+static bool trans_SCVTF_ss(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_scvt_ss);
-+}
-+
-+static bool trans_SCVTF_ds(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_scvt_ds);
-+}
-+
-+static bool trans_SCVTF_sd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_scvt_sd);
-+}
-+
-+static bool trans_SCVTF_dd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_scvt_dd);
-+}
-+
-+static bool trans_UCVTF_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_ucvt_hh);
-+}
-+
-+static bool trans_UCVTF_sh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_ucvt_sh);
-+}
-+
-+static bool trans_UCVTF_dh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_ucvt_dh);
-+}
-+
-+static bool trans_UCVTF_ss(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_ucvt_ss);
-+}
-+
-+static bool trans_UCVTF_ds(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_ucvt_ds);
-+}
-+
-+static bool trans_UCVTF_sd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_ucvt_sd);
-+}
-+
-+static bool trans_UCVTF_dd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_ucvt_dd);
-+}
-+
- /*
-  *** SVE Memory - 32-bit Gather and Unsized Contiguous Group
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- @rd_pg_rn       ........ esz:2 ... ... ... pg:3 rn:5 rd:5       &rpr_esz
- @rd_pg4_pn      ........ esz:2 ... ... .. pg:4 . rn:4 rd:5      &rpr_esz
-+# One register operand, with governing predicate, no vector element size
-+@rd_pg_rn_e0    ........ .. ... ... ... pg:3 rn:5 rd:5          &rpr_esz esz=0
-+
- # Two register operands with a 6-bit signed immediate.
- @rd_rn_i6       ........ ... rn:5 ..... imm:s6 rd:5             &rri
-@@ -XXX,XX +XXX,XX @@ FTSMUL          01100101 .. 0 ..... 000 011 ..... .....         @rd_rn_rm
- FRECPS          01100101 .. 0 ..... 000 110 ..... .....         @rd_rn_rm
- FRSQRTS         01100101 .. 0 ..... 000 111 ..... .....         @rd_rn_rm
-+### SVE FP Unary Operations Predicated Group
-+
-+# SVE integer convert to floating-point
-+SCVTF_hh        01100101 01 010 01 0 101 ... ..... .....        @rd_pg_rn_e0
-+SCVTF_sh        01100101 01 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
-+SCVTF_dh        01100101 01 010 11 0 101 ... ..... .....        @rd_pg_rn_e0
-+SCVTF_ss        01100101 10 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
-+SCVTF_sd        01100101 11 010 00 0 101 ... ..... .....        @rd_pg_rn_e0
-+SCVTF_ds        01100101 11 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
-+SCVTF_dd        01100101 11 010 11 0 101 ... ..... .....        @rd_pg_rn_e0
-+
-+UCVTF_hh        01100101 01 010 01 1 101 ... ..... .....        @rd_pg_rn_e0
-+UCVTF_sh        01100101 01 010 10 1 101 ... ..... .....        @rd_pg_rn_e0
-+UCVTF_dh        01100101 01 010 11 1 101 ... ..... .....        @rd_pg_rn_e0
-+UCVTF_ss        01100101 10 010 10 1 101 ... ..... .....        @rd_pg_rn_e0
-+UCVTF_sd        01100101 11 010 00 1 101 ... ..... .....        @rd_pg_rn_e0
-+UCVTF_ds        01100101 11 010 10 1 101 ... ..... .....        @rd_pg_rn_e0
-+UCVTF_dd        01100101 11 010 11 1 101 ... ..... .....        @rd_pg_rn_e0
-+
- ### SVE Memory - 32-bit Gather and Unsized Contiguous Group
- # SVE load predicate register
---
-.17.1

-[Qemu-devel] [PULL 12/55] target/arm: Implement SVE floating-point arithmetic (predicated)
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-7-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 77 +++++++++++++++++++++++++++++++++
- target/arm/sve_helper.c    | 89 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 46 ++++++++++++++++++++
- target/arm/sve.decode      | 17 ++++++++
-files changed, 229 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fadd_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fadd_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fadd_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fsub_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fsub_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fsub_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmul_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmul_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmul_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fdiv_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fdiv_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fdiv_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmin_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmin_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmin_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmax_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmax_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmax_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fminnum_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fminnum_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fminnum_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmaxnum_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmaxnum_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmaxnum_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fabd_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fabd_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fabd_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fscalbn_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fscalbn_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fscalbn_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmulx_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmulx_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmulx_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_while)(void *vd, uint32_t count, uint32_t pred_desc)
-     return predtest_ones(d, oprsz, esz_mask);
- }
-+/* Fully general three-operand expander, controlled by a predicate,
-+ * With the extra float_status parameter.
-+ */
-+#define DO_ZPZZ_FP(NAME, TYPE, H, OP)                           \
-+void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg,       \
-+                  void *status, uint32_t desc)                  \
-+{                                                               \
-+    intptr_t i = simd_oprsz(desc);                              \
-+    uint64_t *g = vg;                                           \
-+    do {                                                        \
-+        uint64_t pg = g[(i - 1) >> 6];                          \
-+        do {                                                    \
-+            i -= sizeof(TYPE);                                  \
-+            if (likely((pg >> (i & 63)) & 1)) {                 \
-+                TYPE nn = *(TYPE *)(vn + H(i));                 \
-+                TYPE mm = *(TYPE *)(vm + H(i));                 \
-+                *(TYPE *)(vd + H(i)) = OP(nn, mm, status);      \
-+            }                                                   \
-+        } while (i & 63);                                       \
-+    } while (i != 0);                                           \
-+}
-+
-+DO_ZPZZ_FP(sve_fadd_h, uint16_t, H1_2, float16_add)
-+DO_ZPZZ_FP(sve_fadd_s, uint32_t, H1_4, float32_add)
-+DO_ZPZZ_FP(sve_fadd_d, uint64_t,     , float64_add)
-+
-+DO_ZPZZ_FP(sve_fsub_h, uint16_t, H1_2, float16_sub)
-+DO_ZPZZ_FP(sve_fsub_s, uint32_t, H1_4, float32_sub)
-+DO_ZPZZ_FP(sve_fsub_d, uint64_t,     , float64_sub)
-+
-+DO_ZPZZ_FP(sve_fmul_h, uint16_t, H1_2, float16_mul)
-+DO_ZPZZ_FP(sve_fmul_s, uint32_t, H1_4, float32_mul)
-+DO_ZPZZ_FP(sve_fmul_d, uint64_t,     , float64_mul)
-+
-+DO_ZPZZ_FP(sve_fdiv_h, uint16_t, H1_2, float16_div)
-+DO_ZPZZ_FP(sve_fdiv_s, uint32_t, H1_4, float32_div)
-+DO_ZPZZ_FP(sve_fdiv_d, uint64_t,     , float64_div)
-+
-+DO_ZPZZ_FP(sve_fmin_h, uint16_t, H1_2, float16_min)
-+DO_ZPZZ_FP(sve_fmin_s, uint32_t, H1_4, float32_min)
-+DO_ZPZZ_FP(sve_fmin_d, uint64_t,     , float64_min)
-+
-+DO_ZPZZ_FP(sve_fmax_h, uint16_t, H1_2, float16_max)
-+DO_ZPZZ_FP(sve_fmax_s, uint32_t, H1_4, float32_max)
-+DO_ZPZZ_FP(sve_fmax_d, uint64_t,     , float64_max)
-+
-+DO_ZPZZ_FP(sve_fminnum_h, uint16_t, H1_2, float16_minnum)
-+DO_ZPZZ_FP(sve_fminnum_s, uint32_t, H1_4, float32_minnum)
-+DO_ZPZZ_FP(sve_fminnum_d, uint64_t,     , float64_minnum)
-+
-+DO_ZPZZ_FP(sve_fmaxnum_h, uint16_t, H1_2, float16_maxnum)
-+DO_ZPZZ_FP(sve_fmaxnum_s, uint32_t, H1_4, float32_maxnum)
-+DO_ZPZZ_FP(sve_fmaxnum_d, uint64_t,     , float64_maxnum)
-+
-+static inline float16 abd_h(float16 a, float16 b, float_status *s)
-+{
-+    return float16_abs(float16_sub(a, b, s));
-+}
-+
-+static inline float32 abd_s(float32 a, float32 b, float_status *s)
-+{
-+    return float32_abs(float32_sub(a, b, s));
-+}
-+
-+static inline float64 abd_d(float64 a, float64 b, float_status *s)
-+{
-+    return float64_abs(float64_sub(a, b, s));
-+}
-+
-+DO_ZPZZ_FP(sve_fabd_h, uint16_t, H1_2, abd_h)
-+DO_ZPZZ_FP(sve_fabd_s, uint32_t, H1_4, abd_s)
-+DO_ZPZZ_FP(sve_fabd_d, uint64_t,     , abd_d)
-+
-+static inline float64 scalbn_d(float64 a, int64_t b, float_status *s)
-+{
-+    int b_int = MIN(MAX(b, INT_MIN), INT_MAX);
-+    return float64_scalbn(a, b_int, s);
-+}
-+
-+DO_ZPZZ_FP(sve_fscalbn_h, int16_t, H1_2, float16_scalbn)
-+DO_ZPZZ_FP(sve_fscalbn_s, int32_t, H1_4, float32_scalbn)
-+DO_ZPZZ_FP(sve_fscalbn_d, int64_t,     , scalbn_d)
-+
-+DO_ZPZZ_FP(sve_fmulx_h, uint16_t, H1_2, helper_advsimd_mulxh)
-+DO_ZPZZ_FP(sve_fmulx_s, uint32_t, H1_4, helper_vfp_mulxs)
-+DO_ZPZZ_FP(sve_fmulx_d, uint64_t,     , helper_vfp_mulxd)
-+
-+#undef DO_ZPZZ_FP
-+
- /* Fully general two-operand expander, controlled by a predicate,
-  * With the extra float_status parameter.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_FP3(FRSQRTS, rsqrts)
- #undef DO_FP3
-+/*
-+ *** SVE Floating Point Arithmetic - Predicated Group
-+ */
-+
-+static bool do_zpzz_fp(DisasContext *s, arg_rprr_esz *a,
-+                       gen_helper_gvec_4_ptr *fn)
-+{
-+    if (fn == NULL) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        unsigned vsz = vec_full_reg_size(s);
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
-+        tcg_gen_gvec_4_ptr(vec_full_reg_offset(s, a->rd),
-+                           vec_full_reg_offset(s, a->rn),
-+                           vec_full_reg_offset(s, a->rm),
-+                           pred_full_reg_offset(s, a->pg),
-+                           status, vsz, vsz, 0, fn);
-+        tcg_temp_free_ptr(status);
-+    }
-+    return true;
-+}
-+
-+#define DO_FP3(NAME, name) \
-+static bool trans_##NAME(DisasContext *s, arg_rprr_esz *a, uint32_t insn) \
-+{                                                                   \
-+    static gen_helper_gvec_4_ptr * const fns[4] = {                 \
-+        NULL, gen_helper_sve_##name##_h,                            \
-+        gen_helper_sve_##name##_s, gen_helper_sve_##name##_d        \
-+    };                                                              \
-+    return do_zpzz_fp(s, a, fns[a->esz]);                           \
-+}
-+
-+DO_FP3(FADD_zpzz, fadd)
-+DO_FP3(FSUB_zpzz, fsub)
-+DO_FP3(FMUL_zpzz, fmul)
-+DO_FP3(FMIN_zpzz, fmin)
-+DO_FP3(FMAX_zpzz, fmax)
-+DO_FP3(FMINNM_zpzz, fminnum)
-+DO_FP3(FMAXNM_zpzz, fmaxnum)
-+DO_FP3(FABD, fabd)
-+DO_FP3(FSCALE, fscalbn)
-+DO_FP3(FDIV, fdiv)
-+DO_FP3(FMULX, fmulx)
-+
-+#undef DO_FP3
- /*
-  *** SVE Floating Point Unary Operations Predicated Group
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ FTSMUL          01100101 .. 0 ..... 000 011 ..... .....         @rd_rn_rm
- FRECPS          01100101 .. 0 ..... 000 110 ..... .....         @rd_rn_rm
- FRSQRTS         01100101 .. 0 ..... 000 111 ..... .....         @rd_rn_rm
-+### SVE FP Arithmetic Predicated Group
-+
-+# SVE floating-point arithmetic (predicated)
-+FADD_zpzz       01100101 .. 00 0000 100 ... ..... .....    @rdn_pg_rm
-+FSUB_zpzz       01100101 .. 00 0001 100 ... ..... .....    @rdn_pg_rm
-+FMUL_zpzz       01100101 .. 00 0010 100 ... ..... .....    @rdn_pg_rm
-+FSUB_zpzz       01100101 .. 00 0011 100 ... ..... .....    @rdm_pg_rn # FSUBR
-+FMAXNM_zpzz     01100101 .. 00 0100 100 ... ..... .....    @rdn_pg_rm
-+FMINNM_zpzz     01100101 .. 00 0101 100 ... ..... .....    @rdn_pg_rm
-+FMAX_zpzz       01100101 .. 00 0110 100 ... ..... .....    @rdn_pg_rm
-+FMIN_zpzz       01100101 .. 00 0111 100 ... ..... .....    @rdn_pg_rm
-+FABD            01100101 .. 00 1000 100 ... ..... .....    @rdn_pg_rm
-+FSCALE          01100101 .. 00 1001 100 ... ..... .....    @rdn_pg_rm
-+FMULX           01100101 .. 00 1010 100 ... ..... .....    @rdn_pg_rm
-+FDIV            01100101 .. 00 1100 100 ... ..... .....    @rdm_pg_rn # FDIVR
-+FDIV            01100101 .. 00 1101 100 ... ..... .....    @rdn_pg_rm
-+
- ### SVE FP Unary Operations Predicated Group
- # SVE integer convert to floating-point
---
-.17.1

-[Qemu-devel] [PULL 14/55] target/arm: Implement SVE Floating Point Accumulating Reduction Group
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-9-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    |  7 +++++
- target/arm/sve_helper.c    | 56 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 45 ++++++++++++++++++++++++++++++
- target/arm/sve.decode      |  5 ++++
-files changed, 113 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fadda_h, TCG_CALL_NO_RWG,
-+                   i64, i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fadda_s, TCG_CALL_NO_RWG,
-+                   i64, i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fadda_d, TCG_CALL_NO_RWG,
-+                   i64, i64, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_6(sve_fadd_h, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_6(sve_fadd_s, TCG_CALL_NO_RWG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_while)(void *vd, uint32_t count, uint32_t pred_desc)
-     return predtest_ones(d, oprsz, esz_mask);
- }
-+uint64_t HELPER(sve_fadda_h)(uint64_t nn, void *vm, void *vg,
-+                             void *status, uint32_t desc)
-+{
-+    intptr_t i = 0, opr_sz = simd_oprsz(desc);
-+    float16 result = nn;
-+
-+    do {
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));
-+        do {
-+            if (pg & 1) {
-+                float16 mm = *(float16 *)(vm + H1_2(i));
-+                result = float16_add(result, mm, status);
-+            }
-+            i += sizeof(float16), pg >>= sizeof(float16);
-+        } while (i & 15);
-+    } while (i < opr_sz);
-+
-+    return result;
-+}
-+
-+uint64_t HELPER(sve_fadda_s)(uint64_t nn, void *vm, void *vg,
-+                             void *status, uint32_t desc)
-+{
-+    intptr_t i = 0, opr_sz = simd_oprsz(desc);
-+    float32 result = nn;
-+
-+    do {
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));
-+        do {
-+            if (pg & 1) {
-+                float32 mm = *(float32 *)(vm + H1_2(i));
-+                result = float32_add(result, mm, status);
-+            }
-+            i += sizeof(float32), pg >>= sizeof(float32);
-+        } while (i & 15);
-+    } while (i < opr_sz);
-+
-+    return result;
-+}
-+
-+uint64_t HELPER(sve_fadda_d)(uint64_t nn, void *vm, void *vg,
-+                             void *status, uint32_t desc)
-+{
-+    intptr_t i = 0, opr_sz = simd_oprsz(desc) / 8;
-+    uint64_t *m = vm;
-+    uint8_t *pg = vg;
-+
-+    for (i = 0; i < opr_sz; i++) {
-+        if (pg[H1(i)] & 1) {
-+            nn = float64_add(nn, m[i], status);
-+        }
-+    }
-+
-+    return nn;
-+}
-+
- /* Fully general three-operand expander, controlled by a predicate,
-  * With the extra float_status parameter.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_ZZI(UMIN, umin)
- #undef DO_ZZI
-+/*
-+ *** SVE Floating Point Accumulating Reduction Group
-+ */
-+
-+static bool trans_FADDA(DisasContext *s, arg_rprr_esz *a, uint32_t insn)
-+{
-+    typedef void fadda_fn(TCGv_i64, TCGv_i64, TCGv_ptr,
-+                          TCGv_ptr, TCGv_ptr, TCGv_i32);
-+    static fadda_fn * const fns[3] = {
-+        gen_helper_sve_fadda_h,
-+        gen_helper_sve_fadda_s,
-+        gen_helper_sve_fadda_d,
-+    };
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_ptr t_rm, t_pg, t_fpst;
-+    TCGv_i64 t_val;
-+    TCGv_i32 t_desc;
-+
-+    if (a->esz == 0) {
-+        return false;
-+    }
-+    if (!sve_access_check(s)) {
-+        return true;
-+    }
-+
-+    t_val = load_esz(cpu_env, vec_reg_offset(s, a->rn, 0, a->esz), a->esz);
-+    t_rm = tcg_temp_new_ptr();
-+    t_pg = tcg_temp_new_ptr();
-+    tcg_gen_addi_ptr(t_rm, cpu_env, vec_full_reg_offset(s, a->rm));
-+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, a->pg));
-+    t_fpst = get_fpstatus_ptr(a->esz == MO_16);
-+    t_desc = tcg_const_i32(simd_desc(vsz, vsz, 0));
-+
-+    fns[a->esz - 1](t_val, t_val, t_rm, t_pg, t_fpst, t_desc);
-+
-+    tcg_temp_free_i32(t_desc);
-+    tcg_temp_free_ptr(t_fpst);
-+    tcg_temp_free_ptr(t_pg);
-+    tcg_temp_free_ptr(t_rm);
-+
-+    write_fp_dreg(s, a->rd, t_val);
-+    tcg_temp_free_i64(t_val);
-+    return true;
-+}
-+
- /*
-  *** SVE Floating Point Arithmetic - Unpredicated Group
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ UMIN_zzi        00100101 .. 101 011 110 ........ .....          @rdn_i8u
- # SVE integer multiply immediate (unpredicated)
- MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
-+### SVE FP Accumulating Reduction Group
-+
-+# SVE floating-point serial reduction (predicated)
-+FADDA           01100101 .. 011 000 001 ... ..... .....         @rdn_pg_rm
-+
- ### SVE Floating Point Arithmetic - Unpredicated Group
- # SVE floating-point arithmetic (unpredicated)
---
-.17.1

-[Qemu-devel] [PULL 16/55] target/arm: Implement SVE store vector/predicate register
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-11-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate-sve.c | 103 +++++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      |   6 +++
-files changed, 109 insertions(+)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static void do_ldr(DisasContext *s, uint32_t vofs, uint32_t len,
-     tcg_temp_free_i64(t0);
- }
-+/* Similarly for stores.  */
-+static void do_str(DisasContext *s, uint32_t vofs, uint32_t len,
-+                   int rn, int imm)
-+{
-+    uint32_t len_align = QEMU_ALIGN_DOWN(len, 8);
-+    uint32_t len_remain = len % 8;
-+    uint32_t nparts = len / 8 + ctpop8(len_remain);
-+    int midx = get_mem_index(s);
-+    TCGv_i64 addr, t0;
-+
-+    addr = tcg_temp_new_i64();
-+    t0 = tcg_temp_new_i64();
-+
-+    /* Note that unpredicated load/store of vector/predicate registers
-+     * are defined as a stream of bytes, which equates to little-endian
-+     * operations on larger quantities.  There is no nice way to force
-+     * a little-endian store for aarch64_be-linux-user out of line.
-+     *
-+     * Attempt to keep code expansion to a minimum by limiting the
-+     * amount of unrolling done.
-+     */
-+    if (nparts <= 4) {
-+        int i;
-+
-+        for (i = 0; i < len_align; i += 8) {
-+            tcg_gen_ld_i64(t0, cpu_env, vofs + i);
-+            tcg_gen_addi_i64(addr, cpu_reg_sp(s, rn), imm + i);
-+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEQ);
-+        }
-+    } else {
-+        TCGLabel *loop = gen_new_label();
-+        TCGv_ptr t2, i = tcg_const_local_ptr(0);
-+
-+        gen_set_label(loop);
-+
-+        t2 = tcg_temp_new_ptr();
-+        tcg_gen_add_ptr(t2, cpu_env, i);
-+        tcg_gen_ld_i64(t0, t2, vofs);
-+
-+        /* Minimize the number of local temps that must be re-read from
-+         * the stack each iteration.  Instead, re-compute values other
-+         * than the loop counter.
-+         */
-+        tcg_gen_addi_ptr(t2, i, imm);
-+        tcg_gen_extu_ptr_i64(addr, t2);
-+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, rn));
-+        tcg_temp_free_ptr(t2);
-+
-+        tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEQ);
-+
-+        tcg_gen_addi_ptr(i, i, 8);
-+
-+        tcg_gen_brcondi_ptr(TCG_COND_LTU, i, len_align, loop);
-+        tcg_temp_free_ptr(i);
-+    }
-+
-+    /* Predicate register stores can be any multiple of 2.  */
-+    if (len_remain) {
-+        tcg_gen_ld_i64(t0, cpu_env, vofs + len_align);
-+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, rn), imm + len_align);
-+
-+        switch (len_remain) {
-+        case 2:
-+        case 4:
-+        case 8:
-+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LE | ctz32(len_remain));
-+            break;
-+
-+        case 6:
-+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEUL);
-+            tcg_gen_addi_i64(addr, addr, 4);
-+            tcg_gen_shri_i64(t0, t0, 32);
-+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEUW);
-+            break;
-+
-+        default:
-+            g_assert_not_reached();
-+        }
-+    }
-+    tcg_temp_free_i64(addr);
-+    tcg_temp_free_i64(t0);
-+}
-+
- static bool trans_LDR_zri(DisasContext *s, arg_rri *a, uint32_t insn)
- {
-     if (sve_access_check(s)) {
-@@ -XXX,XX +XXX,XX @@ static bool trans_LDR_pri(DisasContext *s, arg_rri *a, uint32_t insn)
-     return true;
- }
-+static bool trans_STR_zri(DisasContext *s, arg_rri *a, uint32_t insn)
-+{
-+    if (sve_access_check(s)) {
-+        int size = vec_full_reg_size(s);
-+        int off = vec_full_reg_offset(s, a->rd);
-+        do_str(s, off, size, a->rn, a->imm * size);
-+    }
-+    return true;
-+}
-+
-+static bool trans_STR_pri(DisasContext *s, arg_rri *a, uint32_t insn)
-+{
-+    if (sve_access_check(s)) {
-+        int size = pred_full_reg_size(s);
-+        int off = pred_full_reg_offset(s, a->rd);
-+        do_str(s, off, size, a->rn, a->imm * size);
-+    }
-+    return true;
-+}
-+
- /*
-  *** SVE Memory - Contiguous Load Group
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ LD1RQ_zpri      1010010 .. 00 0.... 001 ... ..... ..... \
- ### SVE Memory Store Group
-+# SVE store predicate register
-+STR_pri         1110010 11 0.     ..... 000 ... ..... 0 ....    @pd_rn_i9
-+
-+# SVE store vector register
-+STR_zri         1110010 11 0.     ..... 010 ... ..... .....     @rd_rn_i9
-+
- # SVE contiguous store (scalar plus immediate)
- # ST1B, ST1H, ST1W, ST1D; require msz <= esz
- ST_zpri         1110010 .. esz:2  0.... 111 ... ..... ..... \
---
-.17.1

-[Qemu-devel] [PULL 17/55] target/arm: Implement SVE scatter stores
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-12-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 41 +++++++++++++++++++++
- target/arm/sve_helper.c    | 61 +++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 75 ++++++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      | 39 ++++++++++++++++++++
-files changed, 216 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_st1hs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_st1hd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_st1sd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_stbs_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_sths_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stss_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_stbs_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_sths_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stss_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_stbd_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_sthd_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stsd_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stdd_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_stbd_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_sthd_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stsd_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stdd_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_stbd_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_sthd_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stsd_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_stdd_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(sve_st4dd_r)(CPUARMState *env, void *vg,
-         addr += 4 * 8;
-     }
- }
-+
-+/* Stores with a vector index.  */
-+
-+#define DO_ST1_ZPZ_S(NAME, TYPEI, FN)                                   \
-+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
-+                  target_ulong base, uint32_t desc)                     \
-+{                                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);                               \
-+    unsigned scale = simd_data(desc);                                   \
-+    uintptr_t ra = GETPC();                                             \
-+    for (i = 0; i < oprsz; ) {                                          \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
-+        do {                                                            \
-+            if (likely(pg & 1)) {                                       \
-+                target_ulong off = *(TYPEI *)(vm + H1_4(i));            \
-+                uint32_t d = *(uint32_t *)(vd + H1_4(i));               \
-+                FN(env, base + (off << scale), d, ra);                  \
-+            }                                                           \
-+            i += sizeof(uint32_t), pg >>= sizeof(uint32_t);             \
-+        } while (i & 15);                                               \
-+    }                                                                   \
-+}
-+
-+#define DO_ST1_ZPZ_D(NAME, TYPEI, FN)                                   \
-+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
-+                  target_ulong base, uint32_t desc)                     \
-+{                                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc) / 8;                           \
-+    unsigned scale = simd_data(desc);                                   \
-+    uintptr_t ra = GETPC();                                             \
-+    uint64_t *d = vd, *m = vm; uint8_t *pg = vg;                        \
-+    for (i = 0; i < oprsz; i++) {                                       \
-+        if (likely(pg[H1(i)] & 1)) {                                    \
-+            target_ulong off = (target_ulong)(TYPEI)m[i] << scale;      \
-+            FN(env, base + off, d[i], ra);                              \
-+        }                                                               \
-+    }                                                                   \
-+}
-+
-+DO_ST1_ZPZ_S(sve_stbs_zsu, uint32_t, cpu_stb_data_ra)
-+DO_ST1_ZPZ_S(sve_sths_zsu, uint32_t, cpu_stw_data_ra)
-+DO_ST1_ZPZ_S(sve_stss_zsu, uint32_t, cpu_stl_data_ra)
-+
-+DO_ST1_ZPZ_S(sve_stbs_zss, int32_t, cpu_stb_data_ra)
-+DO_ST1_ZPZ_S(sve_sths_zss, int32_t, cpu_stw_data_ra)
-+DO_ST1_ZPZ_S(sve_stss_zss, int32_t, cpu_stl_data_ra)
-+
-+DO_ST1_ZPZ_D(sve_stbd_zsu, uint32_t, cpu_stb_data_ra)
-+DO_ST1_ZPZ_D(sve_sthd_zsu, uint32_t, cpu_stw_data_ra)
-+DO_ST1_ZPZ_D(sve_stsd_zsu, uint32_t, cpu_stl_data_ra)
-+DO_ST1_ZPZ_D(sve_stdd_zsu, uint32_t, cpu_stq_data_ra)
-+
-+DO_ST1_ZPZ_D(sve_stbd_zss, int32_t, cpu_stb_data_ra)
-+DO_ST1_ZPZ_D(sve_sthd_zss, int32_t, cpu_stw_data_ra)
-+DO_ST1_ZPZ_D(sve_stsd_zss, int32_t, cpu_stl_data_ra)
-+DO_ST1_ZPZ_D(sve_stdd_zss, int32_t, cpu_stq_data_ra)
-+
-+DO_ST1_ZPZ_D(sve_stbd_zd, uint64_t, cpu_stb_data_ra)
-+DO_ST1_ZPZ_D(sve_sthd_zd, uint64_t, cpu_stw_data_ra)
-+DO_ST1_ZPZ_D(sve_stsd_zd, uint64_t, cpu_stl_data_ra)
-+DO_ST1_ZPZ_D(sve_stdd_zd, uint64_t, cpu_stq_data_ra)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ typedef void gen_helper_gvec_flags_4(TCGv_i32, TCGv_ptr, TCGv_ptr,
-                                      TCGv_ptr, TCGv_ptr, TCGv_i32);
- typedef void gen_helper_gvec_mem(TCGv_env, TCGv_ptr, TCGv_i64, TCGv_i32);
-+typedef void gen_helper_gvec_mem_scatter(TCGv_env, TCGv_ptr, TCGv_ptr,
-+                                         TCGv_ptr, TCGv_i64, TCGv_i32);
- /*
-  * Helpers for extracting complex instruction fields.
-@@ -XXX,XX +XXX,XX @@ static bool trans_ST_zpri(DisasContext *s, arg_rpri_store *a, uint32_t insn)
-     }
-     return true;
- }
-+
-+/*
-+ *** SVE gather loads / scatter stores
-+ */
-+
-+static void do_mem_zpz(DisasContext *s, int zt, int pg, int zm, int scale,
-+                       TCGv_i64 scalar, gen_helper_gvec_mem_scatter *fn)
-+{
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_i32 desc = tcg_const_i32(simd_desc(vsz, vsz, scale));
-+    TCGv_ptr t_zm = tcg_temp_new_ptr();
-+    TCGv_ptr t_pg = tcg_temp_new_ptr();
-+    TCGv_ptr t_zt = tcg_temp_new_ptr();
-+
-+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, pg));
-+    tcg_gen_addi_ptr(t_zm, cpu_env, vec_full_reg_offset(s, zm));
-+    tcg_gen_addi_ptr(t_zt, cpu_env, vec_full_reg_offset(s, zt));
-+    fn(cpu_env, t_zt, t_pg, t_zm, scalar, desc);
-+
-+    tcg_temp_free_ptr(t_zt);
-+    tcg_temp_free_ptr(t_zm);
-+    tcg_temp_free_ptr(t_pg);
-+    tcg_temp_free_i32(desc);
-+}
-+
-+static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
-+{
-+    /* Indexed by [xs][msz].  */
-+    static gen_helper_gvec_mem_scatter * const fn32[2][3] = {
-+        { gen_helper_sve_stbs_zsu,
-+          gen_helper_sve_sths_zsu,
-+          gen_helper_sve_stss_zsu, },
-+        { gen_helper_sve_stbs_zss,
-+          gen_helper_sve_sths_zss,
-+          gen_helper_sve_stss_zss, },
-+    };
-+    /* Note that we overload xs=2 to indicate 64-bit offset.  */
-+    static gen_helper_gvec_mem_scatter * const fn64[3][4] = {
-+        { gen_helper_sve_stbd_zsu,
-+          gen_helper_sve_sthd_zsu,
-+          gen_helper_sve_stsd_zsu,
-+          gen_helper_sve_stdd_zsu, },
-+        { gen_helper_sve_stbd_zss,
-+          gen_helper_sve_sthd_zss,
-+          gen_helper_sve_stsd_zss,
-+          gen_helper_sve_stdd_zss, },
-+        { gen_helper_sve_stbd_zd,
-+          gen_helper_sve_sthd_zd,
-+          gen_helper_sve_stsd_zd,
-+          gen_helper_sve_stdd_zd, },
-+    };
-+    gen_helper_gvec_mem_scatter *fn;
-+
-+    if (a->esz < a->msz || (a->msz == 0 && a->scale)) {
-+        return false;
-+    }
-+    if (!sve_access_check(s)) {
-+        return true;
-+    }
-+    switch (a->esz) {
-+    case MO_32:
-+        fn = fn32[a->xs][a->msz];
-+        break;
-+    case MO_64:
-+        fn = fn64[a->xs][a->msz];
-+        break;
-+    default:
-+        g_assert_not_reached();
-+    }
-+    do_mem_zpz(s, a->rd, a->pg, a->rm, a->scale * a->msz,
-+               cpu_reg_sp(s, a->rn), fn);
-+    return true;
-+}
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- &rpri_load      rd pg rn imm dtype nreg
- &rprr_store     rd pg rn rm msz esz nreg
- &rpri_store     rd pg rn imm msz esz nreg
-+&rprr_scatter_store     rd pg rn rm esz msz xs scale
- ###########################################################################
- # Named instruction formats.  These are generally used to
-@@ -XXX,XX +XXX,XX @@
- @rpri_store_msz     ....... msz:2 .. . imm:s4 ... pg:3 rn:5 rd:5    &rpri_store
- @rprr_store_esz_n0  ....... ..    esz:2  rm:5 ... pg:3 rn:5 rd:5 \
-                     &rprr_store nreg=0
-+@rprr_scatter_store ....... msz:2 ..     rm:5 ... pg:3 rn:5 rd:5 \
-+                    &rprr_scatter_store
- ###########################################################################
- # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
-@@ -XXX,XX +XXX,XX @@ ST_zpri         1110010 .. nreg:2 1.... 111 ... ..... ..... \
- # SVE store multiple structures (scalar plus scalar)         (nreg != 0)
- ST_zprr         1110010 msz:2 nreg:2 ..... 011 ... ..... ..... \
-                 @rprr_store esz=%size_23
-+
-+# SVE 32-bit scatter store (scalar plus 32-bit scaled offsets)
-+# Require msz > 0 && msz <= esz.
-+ST1_zprz        1110010 .. 11 ..... 100 ... ..... ..... \
-+                @rprr_scatter_store xs=0 esz=2 scale=1
-+ST1_zprz        1110010 .. 11 ..... 110 ... ..... ..... \
-+                @rprr_scatter_store xs=1 esz=2 scale=1
-+
-+# SVE 32-bit scatter store (scalar plus 32-bit unscaled offsets)
-+# Require msz <= esz.
-+ST1_zprz        1110010 .. 10 ..... 100 ... ..... ..... \
-+                @rprr_scatter_store xs=0 esz=2 scale=0
-+ST1_zprz        1110010 .. 10 ..... 110 ... ..... ..... \
-+                @rprr_scatter_store xs=1 esz=2 scale=0
-+
-+# SVE 64-bit scatter store (scalar plus 64-bit scaled offset)
-+# Require msz > 0
-+ST1_zprz        1110010 .. 01 ..... 101 ... ..... ..... \
-+                @rprr_scatter_store xs=2 esz=3 scale=1
-+
-+# SVE 64-bit scatter store (scalar plus 64-bit unscaled offset)
-+ST1_zprz        1110010 .. 00 ..... 101 ... ..... ..... \
-+                @rprr_scatter_store xs=2 esz=3 scale=0
-+
-+# SVE 64-bit scatter store (scalar plus unpacked 32-bit scaled offset)
-+# Require msz > 0
-+ST1_zprz        1110010 .. 01 ..... 100 ... ..... ..... \
-+                @rprr_scatter_store xs=0 esz=3 scale=1
-+ST1_zprz        1110010 .. 01 ..... 110 ... ..... ..... \
-+                @rprr_scatter_store xs=1 esz=3 scale=1
-+
-+# SVE 64-bit scatter store (scalar plus unpacked 32-bit unscaled offset)
-+ST1_zprz        1110010 .. 00 ..... 100 ... ..... ..... \
-+                @rprr_scatter_store xs=0 esz=3 scale=0
-+ST1_zprz        1110010 .. 00 ..... 110 ... ..... ..... \
-+                @rprr_scatter_store xs=1 esz=3 scale=0
---
-.17.1

-[Qemu-devel] [PULL 18/55] target/arm: Implement SVE prefetches
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-13-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate-sve.c | 21 +++++++++++++++++++++
- target/arm/sve.decode      | 23 +++++++++++++++++++++++
-files changed, 44 insertions(+)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
-                cpu_reg_sp(s, a->rn), fn);
-     return true;
- }
-+
-+/*
-+ * Prefetches
-+ */
-+
-+static bool trans_PRF(DisasContext *s, arg_PRF *a, uint32_t insn)
-+{
-+    /* Prefetch is a nop within QEMU.  */
-+    sve_access_check(s);
-+    return true;
-+}
-+
-+static bool trans_PRF_rr(DisasContext *s, arg_PRF_rr *a, uint32_t insn)
-+{
-+    if (a->rm == 31) {
-+        return false;
-+    }
-+    /* Prefetch is a nop within QEMU.  */
-+    sve_access_check(s);
-+    return true;
-+}
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ LD1RQ_zprr      1010010 .. 00 ..... 000 ... ..... ..... \
- LD1RQ_zpri      1010010 .. 00 0.... 001 ... ..... ..... \
-                 @rpri_load_msz nreg=0
-+# SVE 32-bit gather prefetch (scalar plus 32-bit scaled offsets)
-+PRF             1000010 00 -1 ----- 0-- --- ----- 0 ----
-+
-+# SVE 32-bit gather prefetch (vector plus immediate)
-+PRF             1000010 -- 00 ----- 111 --- ----- 0 ----
-+
-+# SVE contiguous prefetch (scalar plus immediate)
-+PRF             1000010 11 1- ----- 0-- --- ----- 0 ----
-+
-+# SVE contiguous prefetch (scalar plus scalar)
-+PRF_rr          1000010 -- 00 rm:5 110 --- ----- 0 ----
-+
-+### SVE Memory 64-bit Gather Group
-+
-+# SVE 64-bit gather prefetch (scalar plus 64-bit scaled offsets)
-+PRF             1100010 00 11 ----- 1-- --- ----- 0 ----
-+
-+# SVE 64-bit gather prefetch (scalar plus unpacked 32-bit scaled offsets)
-+PRF             1100010 00 -1 ----- 0-- --- ----- 0 ----
-+
-+# SVE 64-bit gather prefetch (vector plus immediate)
-+PRF             1100010 -- 00 ----- 111 --- ----- 0 ----
-+
- ### SVE Memory Store Group
- # SVE store predicate register
---
-.17.1

-[Qemu-devel] [PULL 20/55] target/arm: Implement SVE first-fault gather loads
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-15-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 67 +++++++++++++++++++++++++++++
- target/arm/sve_helper.c    | 88 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 40 ++++++++++++++++-
-files changed, 193 insertions(+), 2 deletions(-)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(sve_ldhds_zd, TCG_CALL_NO_WG,
- DEF_HELPER_FLAGS_6(sve_ldsds_zd, TCG_CALL_NO_WG,
-                    void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffbsu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhsu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffssu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffbss_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhss_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_ldffbsu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhsu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffssu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffbss_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhss_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_ldffbdu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhdu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffsdu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffddu_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffbds_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhds_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffsds_zsu, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_ldffbdu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhdu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffsdu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffddu_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffbds_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhds_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffsds_zss, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_ldffbdu_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhdu_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffsdu_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffddu_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffbds_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffhds_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+DEF_HELPER_FLAGS_6(sve_ldffsds_zd, TCG_CALL_NO_WG,
-+                   void, env, ptr, ptr, ptr, tl, i32)
-+
- DEF_HELPER_FLAGS_6(sve_stbs_zsu, TCG_CALL_NO_WG,
-                    void, env, ptr, ptr, ptr, tl, i32)
- DEF_HELPER_FLAGS_6(sve_sths_zsu, TCG_CALL_NO_WG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_LD1_ZPZ_D(sve_ldbds_zd, uint64_t, int8_t,   cpu_ldub_data_ra)
- DO_LD1_ZPZ_D(sve_ldhds_zd, uint64_t, int16_t,  cpu_lduw_data_ra)
- DO_LD1_ZPZ_D(sve_ldsds_zd, uint64_t, int32_t,  cpu_ldl_data_ra)
-+/* First fault loads with a vector index.  */
-+
-+#ifdef CONFIG_USER_ONLY
-+
-+#define DO_LDFF1_ZPZ(NAME, TYPEE, TYPEI, TYPEM, FN, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
-+                  target_ulong base, uint32_t desc)                     \
-+{                                                                       \
-+    intptr_t i, oprsz = simd_oprsz(desc);                               \
-+    unsigned scale = simd_data(desc);                                   \
-+    uintptr_t ra = GETPC();                                             \
-+    bool first = true;                                                  \
-+    mmap_lock();                                                        \
-+    for (i = 0; i < oprsz; i++) {                                       \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
-+        do {                                                            \
-+            TYPEM m = 0;                                                \
-+            if (pg & 1) {                                               \
-+                target_ulong off = *(TYPEI *)(vm + H(i));               \
-+                target_ulong addr = base + (off << scale);              \
-+                if (!first &&                                           \
-+                    page_check_range(addr, sizeof(TYPEM), PAGE_READ)) { \
-+                    record_fault(env, i, oprsz);                        \
-+                    goto exit;                                          \
-+                }                                                       \
-+                m = FN(env, addr, ra);                                  \
-+                first = false;                                          \
-+            }                                                           \
-+            *(TYPEE *)(vd + H(i)) = m;                                  \
-+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);                   \
-+        } while (i & 15);                                               \
-+    }                                                                   \
-+ exit:                                                                  \
-+    mmap_unlock();                                                      \
-+}
-+
-+#else
-+
-+#define DO_LDFF1_ZPZ(NAME, TYPEE, TYPEI, TYPEM, FN, H)                  \
-+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
-+                  target_ulong base, uint32_t desc)                     \
-+{                                                                       \
-+    g_assert_not_reached();                                             \
-+}
-+
-+#endif
-+
-+#define DO_LDFF1_ZPZ_S(NAME, TYPEI, TYPEM, FN) \
-+    DO_LDFF1_ZPZ(NAME, uint32_t, TYPEI, TYPEM, FN, H1_4)
-+#define DO_LDFF1_ZPZ_D(NAME, TYPEI, TYPEM, FN) \
-+    DO_LDFF1_ZPZ(NAME, uint64_t, TYPEI, TYPEM, FN, )
-+
-+DO_LDFF1_ZPZ_S(sve_ldffbsu_zsu, uint32_t, uint8_t,  cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffhsu_zsu, uint32_t, uint16_t, cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffssu_zsu, uint32_t, uint32_t, cpu_ldl_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffbss_zsu, uint32_t, int8_t,   cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffhss_zsu, uint32_t, int16_t,  cpu_lduw_data_ra)
-+
-+DO_LDFF1_ZPZ_S(sve_ldffbsu_zss, int32_t, uint8_t,  cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffhsu_zss, int32_t, uint16_t, cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffssu_zss, int32_t, uint32_t, cpu_ldl_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffbss_zss, int32_t, int8_t,   cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_S(sve_ldffhss_zss, int32_t, int16_t,  cpu_lduw_data_ra)
-+
-+DO_LDFF1_ZPZ_D(sve_ldffbdu_zsu, uint32_t, uint8_t,  cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffhdu_zsu, uint32_t, uint16_t, cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffsdu_zsu, uint32_t, uint32_t, cpu_ldl_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffddu_zsu, uint32_t, uint64_t, cpu_ldq_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffbds_zsu, uint32_t, int8_t,   cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffhds_zsu, uint32_t, int16_t,  cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffsds_zsu, uint32_t, int32_t,  cpu_ldl_data_ra)
-+
-+DO_LDFF1_ZPZ_D(sve_ldffbdu_zss, int32_t, uint8_t,  cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffhdu_zss, int32_t, uint16_t, cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffsdu_zss, int32_t, uint32_t, cpu_ldl_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffddu_zss, int32_t, uint64_t, cpu_ldq_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffbds_zss, int32_t, int8_t,   cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffhds_zss, int32_t, int16_t,  cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffsds_zss, int32_t, int32_t,  cpu_ldl_data_ra)
-+
-+DO_LDFF1_ZPZ_D(sve_ldffbdu_zd, uint64_t, uint8_t,  cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffhdu_zd, uint64_t, uint16_t, cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffsdu_zd, uint64_t, uint32_t, cpu_ldl_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffddu_zd, uint64_t, uint64_t, cpu_ldq_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffbds_zd, uint64_t, int8_t,   cpu_ldub_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffhds_zd, uint64_t, int16_t,  cpu_lduw_data_ra)
-+DO_LDFF1_ZPZ_D(sve_ldffsds_zd, uint64_t, int32_t,  cpu_ldl_data_ra)
-+
- /* Stores with a vector index.  */
- #define DO_ST1_ZPZ_S(NAME, TYPEI, FN)                                   \
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_mem_scatter * const gather_load_fn32[2][2][2][3] = {
-         { gen_helper_sve_ldbsu_zss,
-           gen_helper_sve_ldhsu_zss,
-           gen_helper_sve_ldssu_zss, } } },
--    /* TODO fill in first-fault handlers */
-+
-+    { { { gen_helper_sve_ldffbss_zsu,
-+          gen_helper_sve_ldffhss_zsu,
-+          NULL, },
-+        { gen_helper_sve_ldffbsu_zsu,
-+          gen_helper_sve_ldffhsu_zsu,
-+          gen_helper_sve_ldffssu_zsu, } },
-+      { { gen_helper_sve_ldffbss_zss,
-+          gen_helper_sve_ldffhss_zss,
-+          NULL, },
-+        { gen_helper_sve_ldffbsu_zss,
-+          gen_helper_sve_ldffhsu_zss,
-+          gen_helper_sve_ldffssu_zss, } } }
- };
- /* Note that we overload xs=2 to indicate 64-bit offset.  */
-@@ -XXX,XX +XXX,XX @@ static gen_helper_gvec_mem_scatter * const gather_load_fn64[2][3][2][4] = {
-           gen_helper_sve_ldhdu_zd,
-           gen_helper_sve_ldsdu_zd,
-           gen_helper_sve_ldddu_zd, } } },
--    /* TODO fill in first-fault handlers */
-+
-+    { { { gen_helper_sve_ldffbds_zsu,
-+          gen_helper_sve_ldffhds_zsu,
-+          gen_helper_sve_ldffsds_zsu,
-+          NULL, },
-+        { gen_helper_sve_ldffbdu_zsu,
-+          gen_helper_sve_ldffhdu_zsu,
-+          gen_helper_sve_ldffsdu_zsu,
-+          gen_helper_sve_ldffddu_zsu, } },
-+      { { gen_helper_sve_ldffbds_zss,
-+          gen_helper_sve_ldffhds_zss,
-+          gen_helper_sve_ldffsds_zss,
-+          NULL, },
-+        { gen_helper_sve_ldffbdu_zss,
-+          gen_helper_sve_ldffhdu_zss,
-+          gen_helper_sve_ldffsdu_zss,
-+          gen_helper_sve_ldffddu_zss, } },
-+      { { gen_helper_sve_ldffbds_zd,
-+          gen_helper_sve_ldffhds_zd,
-+          gen_helper_sve_ldffsds_zd,
-+          NULL, },
-+        { gen_helper_sve_ldffbdu_zd,
-+          gen_helper_sve_ldffhdu_zd,
-+          gen_helper_sve_ldffsdu_zd,
-+          gen_helper_sve_ldffddu_zd, } } }
- };
- static bool trans_LD1_zprz(DisasContext *s, arg_LD1_zprz *a, uint32_t insn)
---
-.17.1

-[Qemu-devel] [PULL 21/55] target/arm: Implement SVE scatter store vector immediate
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-16-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/translate-sve.c | 85 ++++++++++++++++++++++++++------------
- target/arm/sve.decode      | 11 +++++
-files changed, 70 insertions(+), 26 deletions(-)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_LD1_zpiz(DisasContext *s, arg_LD1_zpiz *a, uint32_t insn)
-     return true;
- }
-+/* Indexed by [xs][msz].  */
-+static gen_helper_gvec_mem_scatter * const scatter_store_fn32[2][3] = {
-+    { gen_helper_sve_stbs_zsu,
-+      gen_helper_sve_sths_zsu,
-+      gen_helper_sve_stss_zsu, },
-+    { gen_helper_sve_stbs_zss,
-+      gen_helper_sve_sths_zss,
-+      gen_helper_sve_stss_zss, },
-+};
-+
-+/* Note that we overload xs=2 to indicate 64-bit offset.  */
-+static gen_helper_gvec_mem_scatter * const scatter_store_fn64[3][4] = {
-+    { gen_helper_sve_stbd_zsu,
-+      gen_helper_sve_sthd_zsu,
-+      gen_helper_sve_stsd_zsu,
-+      gen_helper_sve_stdd_zsu, },
-+    { gen_helper_sve_stbd_zss,
-+      gen_helper_sve_sthd_zss,
-+      gen_helper_sve_stsd_zss,
-+      gen_helper_sve_stdd_zss, },
-+    { gen_helper_sve_stbd_zd,
-+      gen_helper_sve_sthd_zd,
-+      gen_helper_sve_stsd_zd,
-+      gen_helper_sve_stdd_zd, },
-+};
-+
- static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
- {
--    /* Indexed by [xs][msz].  */
--    static gen_helper_gvec_mem_scatter * const fn32[2][3] = {
--        { gen_helper_sve_stbs_zsu,
--          gen_helper_sve_sths_zsu,
--          gen_helper_sve_stss_zsu, },
--        { gen_helper_sve_stbs_zss,
--          gen_helper_sve_sths_zss,
--          gen_helper_sve_stss_zss, },
--    };
--    /* Note that we overload xs=2 to indicate 64-bit offset.  */
--    static gen_helper_gvec_mem_scatter * const fn64[3][4] = {
--        { gen_helper_sve_stbd_zsu,
--          gen_helper_sve_sthd_zsu,
--          gen_helper_sve_stsd_zsu,
--          gen_helper_sve_stdd_zsu, },
--        { gen_helper_sve_stbd_zss,
--          gen_helper_sve_sthd_zss,
--          gen_helper_sve_stsd_zss,
--          gen_helper_sve_stdd_zss, },
--        { gen_helper_sve_stbd_zd,
--          gen_helper_sve_sthd_zd,
--          gen_helper_sve_stsd_zd,
--          gen_helper_sve_stdd_zd, },
--    };
-     gen_helper_gvec_mem_scatter *fn;
-     if (a->esz < a->msz || (a->msz == 0 && a->scale)) {
-@@ -XXX,XX +XXX,XX @@ static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
-     }
-     switch (a->esz) {
-     case MO_32:
--        fn = fn32[a->xs][a->msz];
-+        fn = scatter_store_fn32[a->xs][a->msz];
-         break;
-     case MO_64:
--        fn = fn64[a->xs][a->msz];
-+        fn = scatter_store_fn64[a->xs][a->msz];
-         break;
-     default:
-         g_assert_not_reached();
-@@ -XXX,XX +XXX,XX @@ static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
-     return true;
- }
-+static bool trans_ST1_zpiz(DisasContext *s, arg_ST1_zpiz *a, uint32_t insn)
-+{
-+    gen_helper_gvec_mem_scatter *fn = NULL;
-+    TCGv_i64 imm;
-+
-+    if (a->esz < a->msz) {
-+        return false;
-+    }
-+    if (!sve_access_check(s)) {
-+        return true;
-+    }
-+
-+    switch (a->esz) {
-+    case MO_32:
-+        fn = scatter_store_fn32[0][a->msz];
-+        break;
-+    case MO_64:
-+        fn = scatter_store_fn64[2][a->msz];
-+        break;
-+    }
-+    assert(fn != NULL);
-+
-+    /* Treat ST1_zpiz (zn[x] + imm) the same way as ST1_zprz (rn + zm[x])
-+     * by loading the immediate into the scalar parameter.
-+     */
-+    imm = tcg_const_i64(a->imm << a->msz);
-+    do_mem_zpz(s, a->rd, a->pg, a->rn, 0, imm, fn);
-+    tcg_temp_free_i64(imm);
-+    return true;
-+}
-+
- /*
-  * Prefetches
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- &rprr_gather_load       rd pg rn rm esz msz u ff xs scale
- &rpri_gather_load       rd pg rn imm esz msz u ff
- &rprr_scatter_store     rd pg rn rm esz msz xs scale
-+&rpri_scatter_store     rd pg rn imm esz msz
- ###########################################################################
- # Named instruction formats.  These are generally used to
-@@ -XXX,XX +XXX,XX @@
-                     &rprr_store nreg=0
- @rprr_scatter_store ....... msz:2 ..     rm:5 ... pg:3 rn:5 rd:5 \
-                     &rprr_scatter_store
-+@rpri_scatter_store ....... msz:2 ..    imm:5 ... pg:3 rn:5 rd:5 \
-+                    &rpri_scatter_store
- ###########################################################################
- # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
-@@ -XXX,XX +XXX,XX @@ ST1_zprz        1110010 .. 01 ..... 101 ... ..... ..... \
- ST1_zprz        1110010 .. 00 ..... 101 ... ..... ..... \
-                 @rprr_scatter_store xs=2 esz=3 scale=0
-+# SVE 64-bit scatter store (vector plus immediate)
-+ST1_zpiz        1110010 .. 10 ..... 101 ... ..... ..... \
-+                @rpri_scatter_store esz=3
-+
-+# SVE 32-bit scatter store (vector plus immediate)
-+ST1_zpiz        1110010 .. 11 ..... 101 ... ..... ..... \
-+                @rpri_scatter_store esz=2
-+
- # SVE 64-bit scatter store (scalar plus unpacked 32-bit scaled offset)
- # Require msz > 0
- ST1_zprz        1110010 .. 01 ..... 100 ... ..... ..... \
---
-.17.1

-[Qemu-devel] [PULL 22/55] target/arm: Implement SVE floating-point compare vectors
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-17-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 49 ++++++++++++++++++++++++++++++
- target/arm/sve_helper.c    | 62 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 40 ++++++++++++++++++++++++
- target/arm/sve.decode      | 11 +++++++
-files changed, 162 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve_ucvt_ds, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(sve_ucvt_dd, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmge_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmge_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmge_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fcmgt_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmgt_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmgt_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fcmeq_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmeq_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmeq_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fcmne_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmne_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmne_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fcmuo_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmuo_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fcmuo_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_facge_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_facge_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_facge_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_facgt_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_facgt_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_facgt_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
- DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
- DEF_HELPER_FLAGS_3(sve_fmla_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(sve_fnmls_zpzzz_d)(CPUARMState *env, void *vg, uint32_t desc)
-     do_fmla_zpzzz_d(env, vg, desc, 0, INT64_MIN);
- }
-+/* Two operand floating-point comparison controlled by a predicate.
-+ * Unlike the integer version, we are not allowed to optimistically
-+ * compare operands, since the comparison may have side effects wrt
-+ * the FPSR.
-+ */
-+#define DO_FPCMP_PPZZ(NAME, TYPE, H, OP)                                \
-+void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg,               \
-+                  void *status, uint32_t desc)                          \
-+{                                                                       \
-+    intptr_t i = simd_oprsz(desc), j = (i - 1) >> 6;                    \
-+    uint64_t *d = vd, *g = vg;                                          \
-+    do {                                                                \
-+        uint64_t out = 0, pg = g[j];                                    \
-+        do {                                                            \
-+            i -= sizeof(TYPE), out <<= sizeof(TYPE);                    \
-+            if (likely((pg >> (i & 63)) & 1)) {                         \
-+                TYPE nn = *(TYPE *)(vn + H(i));                         \
-+                TYPE mm = *(TYPE *)(vm + H(i));                         \
-+                out |= OP(TYPE, nn, mm, status);                        \
-+            }                                                           \
-+        } while (i & 63);                                               \
-+        d[j--] = out;                                                   \
-+    } while (i > 0);                                                    \
-+}
-+
-+#define DO_FPCMP_PPZZ_H(NAME, OP) \
-+    DO_FPCMP_PPZZ(NAME##_h, float16, H1_2, OP)
-+#define DO_FPCMP_PPZZ_S(NAME, OP) \
-+    DO_FPCMP_PPZZ(NAME##_s, float32, H1_4, OP)
-+#define DO_FPCMP_PPZZ_D(NAME, OP) \
-+    DO_FPCMP_PPZZ(NAME##_d, float64,     , OP)
-+
-+#define DO_FPCMP_PPZZ_ALL(NAME, OP) \
-+    DO_FPCMP_PPZZ_H(NAME, OP)   \
-+    DO_FPCMP_PPZZ_S(NAME, OP)   \
-+    DO_FPCMP_PPZZ_D(NAME, OP)
-+
-+#define DO_FCMGE(TYPE, X, Y, ST)  TYPE##_compare(Y, X, ST) <= 0
-+#define DO_FCMGT(TYPE, X, Y, ST)  TYPE##_compare(Y, X, ST) < 0
-+#define DO_FCMEQ(TYPE, X, Y, ST)  TYPE##_compare_quiet(X, Y, ST) == 0
-+#define DO_FCMNE(TYPE, X, Y, ST)  TYPE##_compare_quiet(X, Y, ST) != 0
-+#define DO_FCMUO(TYPE, X, Y, ST)  \
-+    TYPE##_compare_quiet(X, Y, ST) == float_relation_unordered
-+#define DO_FACGE(TYPE, X, Y, ST)  \
-+    TYPE##_compare(TYPE##_abs(Y), TYPE##_abs(X), ST) <= 0
-+#define DO_FACGT(TYPE, X, Y, ST)  \
-+    TYPE##_compare(TYPE##_abs(Y), TYPE##_abs(X), ST) < 0
-+
-+DO_FPCMP_PPZZ_ALL(sve_fcmge, DO_FCMGE)
-+DO_FPCMP_PPZZ_ALL(sve_fcmgt, DO_FCMGT)
-+DO_FPCMP_PPZZ_ALL(sve_fcmeq, DO_FCMEQ)
-+DO_FPCMP_PPZZ_ALL(sve_fcmne, DO_FCMNE)
-+DO_FPCMP_PPZZ_ALL(sve_fcmuo, DO_FCMUO)
-+DO_FPCMP_PPZZ_ALL(sve_facge, DO_FACGE)
-+DO_FPCMP_PPZZ_ALL(sve_facgt, DO_FACGT)
-+
-+#undef DO_FPCMP_PPZZ_ALL
-+#undef DO_FPCMP_PPZZ_D
-+#undef DO_FPCMP_PPZZ_S
-+#undef DO_FPCMP_PPZZ_H
-+#undef DO_FPCMP_PPZZ
-+
- /*
-  * Load contiguous data, protected by a governing predicate.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_FP3(FMULX, fmulx)
- #undef DO_FP3
-+static bool do_fp_cmp(DisasContext *s, arg_rprr_esz *a,
-+                      gen_helper_gvec_4_ptr *fn)
-+{
-+    if (fn == NULL) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        unsigned vsz = vec_full_reg_size(s);
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
-+        tcg_gen_gvec_4_ptr(pred_full_reg_offset(s, a->rd),
-+                           vec_full_reg_offset(s, a->rn),
-+                           vec_full_reg_offset(s, a->rm),
-+                           pred_full_reg_offset(s, a->pg),
-+                           status, vsz, vsz, 0, fn);
-+        tcg_temp_free_ptr(status);
-+    }
-+    return true;
-+}
-+
-+#define DO_FPCMP(NAME, name) \
-+static bool trans_##NAME##_ppzz(DisasContext *s, arg_rprr_esz *a,     \
-+                                uint32_t insn)                        \
-+{                                                                     \
-+    static gen_helper_gvec_4_ptr * const fns[4] = {                   \
-+        NULL, gen_helper_sve_##name##_h,                              \
-+        gen_helper_sve_##name##_s, gen_helper_sve_##name##_d          \
-+    };                                                                \
-+    return do_fp_cmp(s, a, fns[a->esz]);                              \
-+}
-+
-+DO_FPCMP(FCMGE, fcmge)
-+DO_FPCMP(FCMGT, fcmgt)
-+DO_FPCMP(FCMEQ, fcmeq)
-+DO_FPCMP(FCMNE, fcmne)
-+DO_FPCMP(FCMUO, fcmuo)
-+DO_FPCMP(FACGE, facge)
-+DO_FPCMP(FACGT, facgt)
-+
-+#undef DO_FPCMP
-+
- typedef void gen_helper_sve_fmla(TCGv_env, TCGv_ptr, TCGv_i32);
- static bool do_fmla(DisasContext *s, arg_rprrr_esz *a, gen_helper_sve_fmla *fn)
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ UXTH            00000100 .. 010 011 101 ... ..... .....         @rd_pg_rn
- SXTW            00000100 .. 010 100 101 ... ..... .....         @rd_pg_rn
- UXTW            00000100 .. 010 101 101 ... ..... .....         @rd_pg_rn
-+### SVE Floating Point Compare - Vectors Group
-+
-+# SVE floating-point compare vectors
-+FCMGE_ppzz      01100101 .. 0 ..... 010 ... ..... 0 ....        @pd_pg_rn_rm
-+FCMGT_ppzz      01100101 .. 0 ..... 010 ... ..... 1 ....        @pd_pg_rn_rm
-+FCMEQ_ppzz      01100101 .. 0 ..... 011 ... ..... 0 ....        @pd_pg_rn_rm
-+FCMNE_ppzz      01100101 .. 0 ..... 011 ... ..... 1 ....        @pd_pg_rn_rm
-+FCMUO_ppzz      01100101 .. 0 ..... 110 ... ..... 0 ....        @pd_pg_rn_rm
-+FACGE_ppzz      01100101 .. 0 ..... 110 ... ..... 1 ....        @pd_pg_rn_rm
-+FACGT_ppzz      01100101 .. 0 ..... 111 ... ..... 1 ....        @pd_pg_rn_rm
-+
- ### SVE Integer Multiply-Add Group
- # SVE integer multiply-add writing addend (predicated)
---
-.17.1

-[Qemu-devel] [PULL 23/55] target/arm: Implement SVE floating-point arithmetic with immediate
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-18-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 56 ++++++++++++++++++++++++++++
- target/arm/sve_helper.c    | 69 +++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 75 ++++++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      | 14 +++++++
-files changed, 214 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(sve_fmulx_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_6(sve_fmulx_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fadds_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fadds_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fadds_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fsubs_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fsubs_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fsubs_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmuls_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmuls_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmuls_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fsubrs_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fsubrs_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fsubrs_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmaxnms_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmaxnms_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmaxnms_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fminnms_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fminnms_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fminnms_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmaxs_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmaxs_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmaxs_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
-+DEF_HELPER_FLAGS_6(sve_fmins_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmins_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_6(sve_fmins_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, i64, ptr, i32)
-+
- DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_ZPZZ_FP(sve_fmulx_d, uint64_t,     , helper_vfp_mulxd)
- #undef DO_ZPZZ_FP
-+/* Three-operand expander, with one scalar operand, controlled by
-+ * a predicate, with the extra float_status parameter.
-+ */
-+#define DO_ZPZS_FP(NAME, TYPE, H, OP) \
-+void HELPER(NAME)(void *vd, void *vn, void *vg, uint64_t scalar,  \
-+                  void *status, uint32_t desc)                    \
-+{                                                                 \
-+    intptr_t i = simd_oprsz(desc);                                \
-+    uint64_t *g = vg;                                             \
-+    TYPE mm = scalar;                                             \
-+    do {                                                          \
-+        uint64_t pg = g[(i - 1) >> 6];                            \
-+        do {                                                      \
-+            i -= sizeof(TYPE);                                    \
-+            if (likely((pg >> (i & 63)) & 1)) {                   \
-+                TYPE nn = *(TYPE *)(vn + H(i));                   \
-+                *(TYPE *)(vd + H(i)) = OP(nn, mm, status);        \
-+            }                                                     \
-+        } while (i & 63);                                         \
-+    } while (i != 0);                                             \
-+}
-+
-+DO_ZPZS_FP(sve_fadds_h, float16, H1_2, float16_add)
-+DO_ZPZS_FP(sve_fadds_s, float32, H1_4, float32_add)
-+DO_ZPZS_FP(sve_fadds_d, float64,     , float64_add)
-+
-+DO_ZPZS_FP(sve_fsubs_h, float16, H1_2, float16_sub)
-+DO_ZPZS_FP(sve_fsubs_s, float32, H1_4, float32_sub)
-+DO_ZPZS_FP(sve_fsubs_d, float64,     , float64_sub)
-+
-+DO_ZPZS_FP(sve_fmuls_h, float16, H1_2, float16_mul)
-+DO_ZPZS_FP(sve_fmuls_s, float32, H1_4, float32_mul)
-+DO_ZPZS_FP(sve_fmuls_d, float64,     , float64_mul)
-+
-+static inline float16 subr_h(float16 a, float16 b, float_status *s)
-+{
-+    return float16_sub(b, a, s);
-+}
-+
-+static inline float32 subr_s(float32 a, float32 b, float_status *s)
-+{
-+    return float32_sub(b, a, s);
-+}
-+
-+static inline float64 subr_d(float64 a, float64 b, float_status *s)
-+{
-+    return float64_sub(b, a, s);
-+}
-+
-+DO_ZPZS_FP(sve_fsubrs_h, float16, H1_2, subr_h)
-+DO_ZPZS_FP(sve_fsubrs_s, float32, H1_4, subr_s)
-+DO_ZPZS_FP(sve_fsubrs_d, float64,     , subr_d)
-+
-+DO_ZPZS_FP(sve_fmaxnms_h, float16, H1_2, float16_maxnum)
-+DO_ZPZS_FP(sve_fmaxnms_s, float32, H1_4, float32_maxnum)
-+DO_ZPZS_FP(sve_fmaxnms_d, float64,     , float64_maxnum)
-+
-+DO_ZPZS_FP(sve_fminnms_h, float16, H1_2, float16_minnum)
-+DO_ZPZS_FP(sve_fminnms_s, float32, H1_4, float32_minnum)
-+DO_ZPZS_FP(sve_fminnms_d, float64,     , float64_minnum)
-+
-+DO_ZPZS_FP(sve_fmaxs_h, float16, H1_2, float16_max)
-+DO_ZPZS_FP(sve_fmaxs_s, float32, H1_4, float32_max)
-+DO_ZPZS_FP(sve_fmaxs_d, float64,     , float64_max)
-+
-+DO_ZPZS_FP(sve_fmins_h, float16, H1_2, float16_min)
-+DO_ZPZS_FP(sve_fmins_s, float32, H1_4, float32_min)
-+DO_ZPZS_FP(sve_fmins_d, float64,     , float64_min)
-+
- /* Fully general two-operand expander, controlled by a predicate,
-  * With the extra float_status parameter.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@
- #include "exec/log.h"
- #include "trace-tcg.h"
- #include "translate-a64.h"
-+#include "fpu/softfloat.h"
- typedef void GVecGen2sFn(unsigned, uint32_t, uint32_t,
-@@ -XXX,XX +XXX,XX @@ DO_FP3(FMULX, fmulx)
- #undef DO_FP3
-+typedef void gen_helper_sve_fp2scalar(TCGv_ptr, TCGv_ptr, TCGv_ptr,
-+                                      TCGv_i64, TCGv_ptr, TCGv_i32);
-+
-+static void do_fp_scalar(DisasContext *s, int zd, int zn, int pg, bool is_fp16,
-+                         TCGv_i64 scalar, gen_helper_sve_fp2scalar *fn)
-+{
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_ptr t_zd, t_zn, t_pg, status;
-+    TCGv_i32 desc;
-+
-+    t_zd = tcg_temp_new_ptr();
-+    t_zn = tcg_temp_new_ptr();
-+    t_pg = tcg_temp_new_ptr();
-+    tcg_gen_addi_ptr(t_zd, cpu_env, vec_full_reg_offset(s, zd));
-+    tcg_gen_addi_ptr(t_zn, cpu_env, vec_full_reg_offset(s, zn));
-+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, pg));
-+
-+    status = get_fpstatus_ptr(is_fp16);
-+    desc = tcg_const_i32(simd_desc(vsz, vsz, 0));
-+    fn(t_zd, t_zn, t_pg, scalar, status, desc);
-+
-+    tcg_temp_free_i32(desc);
-+    tcg_temp_free_ptr(status);
-+    tcg_temp_free_ptr(t_pg);
-+    tcg_temp_free_ptr(t_zn);
-+    tcg_temp_free_ptr(t_zd);
-+}
-+
-+static void do_fp_imm(DisasContext *s, arg_rpri_esz *a, uint64_t imm,
-+                      gen_helper_sve_fp2scalar *fn)
-+{
-+    TCGv_i64 temp = tcg_const_i64(imm);
-+    do_fp_scalar(s, a->rd, a->rn, a->pg, a->esz == MO_16, temp, fn);
-+    tcg_temp_free_i64(temp);
-+}
-+
-+#define DO_FP_IMM(NAME, name, const0, const1) \
-+static bool trans_##NAME##_zpzi(DisasContext *s, arg_rpri_esz *a,         \
-+                                uint32_t insn)                            \
-+{                                                                         \
-+    static gen_helper_sve_fp2scalar * const fns[3] = {                    \
-+        gen_helper_sve_##name##_h,                                        \
-+        gen_helper_sve_##name##_s,                                        \
-+        gen_helper_sve_##name##_d                                         \
-+    };                                                                    \
-+    static uint64_t const val[3][2] = {                                   \
-+        { float16_##const0, float16_##const1 },                           \
-+        { float32_##const0, float32_##const1 },                           \
-+        { float64_##const0, float64_##const1 },                           \
-+    };                                                                    \
-+    if (a->esz == 0) {                                                    \
-+        return false;                                                     \
-+    }                                                                     \
-+    if (sve_access_check(s)) {                                            \
-+        do_fp_imm(s, a, val[a->esz - 1][a->imm], fns[a->esz - 1]);        \
-+    }                                                                     \
-+    return true;                                                          \
-+}
-+
-+#define float16_two  make_float16(0x4000)
-+#define float32_two  make_float32(0x40000000)
-+#define float64_two  make_float64(0x4000000000000000ULL)
-+
-+DO_FP_IMM(FADD, fadds, half, one)
-+DO_FP_IMM(FSUB, fsubs, half, one)
-+DO_FP_IMM(FMUL, fmuls, half, two)
-+DO_FP_IMM(FSUBR, fsubrs, half, one)
-+DO_FP_IMM(FMAXNM, fmaxnms, zero, one)
-+DO_FP_IMM(FMINNM, fminnms, zero, one)
-+DO_FP_IMM(FMAX, fmaxs, zero, one)
-+DO_FP_IMM(FMIN, fmins, zero, one)
-+
-+#undef DO_FP_IMM
-+
- static bool do_fp_cmp(DisasContext *s, arg_rprr_esz *a,
-                       gen_helper_gvec_4_ptr *fn)
- {
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- @rdn_pg4        ........ esz:2 .. pg:4 ... ........ rd:5 \
-                 &rpri_esz rn=%reg_movprfx
-+# Two register operand, one one-bit floating-point operand.
-+@rdn_i1         ........ esz:2 ......... pg:3 .... imm:1 rd:5 \
-+                &rpri_esz rn=%reg_movprfx
-+
- # Two register operand, one encoded bitmask.
- @rdn_dbm        ........ .. .... dbm:13 rd:5 \
-                 &rr_dbm rn=%reg_movprfx
-@@ -XXX,XX +XXX,XX @@ FMULX           01100101 .. 00 1010 100 ... ..... .....    @rdn_pg_rm
- FDIV            01100101 .. 00 1100 100 ... ..... .....    @rdm_pg_rn # FDIVR
- FDIV            01100101 .. 00 1101 100 ... ..... .....    @rdn_pg_rm
-+# SVE floating-point arithmetic with immediate (predicated)
-+FADD_zpzi       01100101 .. 011 000 100 ... 0000 . .....        @rdn_i1
-+FSUB_zpzi       01100101 .. 011 001 100 ... 0000 . .....        @rdn_i1
-+FMUL_zpzi       01100101 .. 011 010 100 ... 0000 . .....        @rdn_i1
-+FSUBR_zpzi      01100101 .. 011 011 100 ... 0000 . .....        @rdn_i1
-+FMAXNM_zpzi     01100101 .. 011 100 100 ... 0000 . .....        @rdn_i1
-+FMINNM_zpzi     01100101 .. 011 101 100 ... 0000 . .....        @rdn_i1
-+FMAX_zpzi       01100101 .. 011 110 100 ... 0000 . .....        @rdn_i1
-+FMIN_zpzi       01100101 .. 011 111 100 ... 0000 . .....        @rdn_i1
-+
- ### SVE FP Multiply-Add Group
- # SVE floating-point multiply-accumulate writing addend
---
-.17.1

-[Qemu-devel] [PULL 25/55] target/arm: Implement SVE FP Fast Reduction Group
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-20-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 35 ++++++++++++++++++++++
- target/arm/sve_helper.c    | 61 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 57 +++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      |  8 +++++
-files changed, 161 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_faddv_h, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_faddv_s, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_faddv_d, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_fmaxnmv_h, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fmaxnmv_s, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fmaxnmv_d, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_fminnmv_h, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fminnmv_s, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fminnmv_d, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_fmaxv_h, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fmaxv_s, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fmaxv_d, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(sve_fminv_h, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fminv_s, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(sve_fminv_d, TCG_CALL_NO_RWG,
-+                   i64, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_5(sve_fadda_h, TCG_CALL_NO_RWG,
-                    i64, i64, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(sve_fadda_s, TCG_CALL_NO_RWG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_while)(void *vd, uint32_t count, uint32_t pred_desc)
-     return predtest_ones(d, oprsz, esz_mask);
- }
-+/* Recursive reduction on a function;
-+ * C.f. the ARM ARM function ReducePredicated.
-+ *
-+ * While it would be possible to write this without the DATA temporary,
-+ * it is much simpler to process the predicate register this way.
-+ * The recursion is bounded to depth 7 (128 fp16 elements), so there's
-+ * little to gain with a more complex non-recursive form.
-+ */
-+#define DO_REDUCE(NAME, TYPE, H, FUNC, IDENT)                         \
-+static TYPE NAME##_reduce(TYPE *data, float_status *status, uintptr_t n) \
-+{                                                                     \
-+    if (n == 1) {                                                     \
-+        return *data;                                                 \
-+    } else {                                                          \
-+        uintptr_t half = n / 2;                                       \
-+        TYPE lo = NAME##_reduce(data, status, half);                  \
-+        TYPE hi = NAME##_reduce(data + half, status, half);           \
-+        return TYPE##_##FUNC(lo, hi, status);                         \
-+    }                                                                 \
-+}                                                                     \
-+uint64_t HELPER(NAME)(void *vn, void *vg, void *vs, uint32_t desc)    \
-+{                                                                     \
-+    uintptr_t i, oprsz = simd_oprsz(desc), maxsz = simd_maxsz(desc);  \
-+    TYPE data[sizeof(ARMVectorReg) / sizeof(TYPE)];                   \
-+    for (i = 0; i < oprsz; ) {                                        \
-+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));               \
-+        do {                                                          \
-+            TYPE nn = *(TYPE *)(vn + H(i));                           \
-+            *(TYPE *)((void *)data + i) = (pg & 1 ? nn : IDENT);      \
-+            i += sizeof(TYPE), pg >>= sizeof(TYPE);                   \
-+        } while (i & 15);                                             \
-+    }                                                                 \
-+    for (; i < maxsz; i += sizeof(TYPE)) {                            \
-+        *(TYPE *)((void *)data + i) = IDENT;                          \
-+    }                                                                 \
-+    return NAME##_reduce(data, vs, maxsz / sizeof(TYPE));             \
-+}
-+
-+DO_REDUCE(sve_faddv_h, float16, H1_2, add, float16_zero)
-+DO_REDUCE(sve_faddv_s, float32, H1_4, add, float32_zero)
-+DO_REDUCE(sve_faddv_d, float64,     , add, float64_zero)
-+
-+/* Identity is floatN_default_nan, without the function call.  */
-+DO_REDUCE(sve_fminnmv_h, float16, H1_2, minnum, 0x7E00)
-+DO_REDUCE(sve_fminnmv_s, float32, H1_4, minnum, 0x7FC00000)
-+DO_REDUCE(sve_fminnmv_d, float64,     , minnum, 0x7FF8000000000000ULL)
-+
-+DO_REDUCE(sve_fmaxnmv_h, float16, H1_2, maxnum, 0x7E00)
-+DO_REDUCE(sve_fmaxnmv_s, float32, H1_4, maxnum, 0x7FC00000)
-+DO_REDUCE(sve_fmaxnmv_d, float64,     , maxnum, 0x7FF8000000000000ULL)
-+
-+DO_REDUCE(sve_fminv_h, float16, H1_2, min, float16_infinity)
-+DO_REDUCE(sve_fminv_s, float32, H1_4, min, float32_infinity)
-+DO_REDUCE(sve_fminv_d, float64,     , min, float64_infinity)
-+
-+DO_REDUCE(sve_fmaxv_h, float16, H1_2, max, float16_chs(float16_infinity))
-+DO_REDUCE(sve_fmaxv_s, float32, H1_4, max, float32_chs(float32_infinity))
-+DO_REDUCE(sve_fmaxv_d, float64,     , max, float64_chs(float64_infinity))
-+
-+#undef DO_REDUCE
-+
- uint64_t HELPER(sve_fadda_h)(uint64_t nn, void *vm, void *vg,
-                              void *status, uint32_t desc)
- {
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_FMUL_zzx(DisasContext *s, arg_FMUL_zzx *a, uint32_t insn)
-     return true;
- }
-+/*
-+ *** SVE Floating Point Fast Reduction Group
-+ */
-+
-+typedef void gen_helper_fp_reduce(TCGv_i64, TCGv_ptr, TCGv_ptr,
-+                                  TCGv_ptr, TCGv_i32);
-+
-+static void do_reduce(DisasContext *s, arg_rpr_esz *a,
-+                      gen_helper_fp_reduce *fn)
-+{
-+    unsigned vsz = vec_full_reg_size(s);
-+    unsigned p2vsz = pow2ceil(vsz);
-+    TCGv_i32 t_desc = tcg_const_i32(simd_desc(vsz, p2vsz, 0));
-+    TCGv_ptr t_zn, t_pg, status;
-+    TCGv_i64 temp;
-+
-+    temp = tcg_temp_new_i64();
-+    t_zn = tcg_temp_new_ptr();
-+    t_pg = tcg_temp_new_ptr();
-+
-+    tcg_gen_addi_ptr(t_zn, cpu_env, vec_full_reg_offset(s, a->rn));
-+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, a->pg));
-+    status = get_fpstatus_ptr(a->esz == MO_16);
-+
-+    fn(temp, t_zn, t_pg, status, t_desc);
-+    tcg_temp_free_ptr(t_zn);
-+    tcg_temp_free_ptr(t_pg);
-+    tcg_temp_free_ptr(status);
-+    tcg_temp_free_i32(t_desc);
-+
-+    write_fp_dreg(s, a->rd, temp);
-+    tcg_temp_free_i64(temp);
-+}
-+
-+#define DO_VPZ(NAME, name) \
-+static bool trans_##NAME(DisasContext *s, arg_rpr_esz *a, uint32_t insn) \
-+{                                                                        \
-+    static gen_helper_fp_reduce * const fns[3] = {                       \
-+        gen_helper_sve_##name##_h,                                       \
-+        gen_helper_sve_##name##_s,                                       \
-+        gen_helper_sve_##name##_d,                                       \
-+    };                                                                   \
-+    if (a->esz == 0) {                                                   \
-+        return false;                                                    \
-+    }                                                                    \
-+    if (sve_access_check(s)) {                                           \
-+        do_reduce(s, a, fns[a->esz - 1]);                                \
-+    }                                                                    \
-+    return true;                                                         \
-+}
-+
-+DO_VPZ(FADDV, faddv)
-+DO_VPZ(FMINNMV, fminnmv)
-+DO_VPZ(FMAXNMV, fmaxnmv)
-+DO_VPZ(FMINV, fminv)
-+DO_VPZ(FMAXV, fmaxv)
-+
- /*
-  *** SVE Floating Point Accumulating Reduction Group
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ FMUL_zzx        01100100 0.1 .. rm:3 001000 rn:5 rd:5 \
- FMUL_zzx        01100100 101 index:2 rm:3 001000 rn:5 rd:5      esz=2
- FMUL_zzx        01100100 111 index:1 rm:4 001000 rn:5 rd:5      esz=3
-+### SVE FP Fast Reduction Group
-+
-+FADDV           01100101 .. 000 000 001 ... ..... .....         @rd_pg_rn
-+FMAXNMV         01100101 .. 000 100 001 ... ..... .....         @rd_pg_rn
-+FMINNMV         01100101 .. 000 101 001 ... ..... .....         @rd_pg_rn
-+FMAXV           01100101 .. 000 110 001 ... ..... .....         @rd_pg_rn
-+FMINV           01100101 .. 000 111 001 ... ..... .....         @rd_pg_rn
-+
- ### SVE FP Accumulating Reduction Group
- # SVE floating-point serial reduction (predicated)
---
-.17.1

-[Qemu-devel] [PULL 26/55] target/arm: Implement SVE Floating Point Unary Operations - Unpredicated Group
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-21-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper.h        |  8 +++++++
- target/arm/translate-sve.c | 47 ++++++++++++++++++++++++++++++++++++++
- target/arm/vec_helper.c    | 20 ++++++++++++++++
- target/arm/sve.decode      |  5 ++++
-files changed, 80 insertions(+)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fcmlas_idx, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(gvec_fcmlad, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_VPZ(FMAXNMV, fmaxnmv)
- DO_VPZ(FMINV, fminv)
- DO_VPZ(FMAXV, fmaxv)
-+/*
-+ *** SVE Floating Point Unary Operations - Unpredicated Group
-+ */
-+
-+static void do_zz_fp(DisasContext *s, arg_rr_esz *a, gen_helper_gvec_2_ptr *fn)
-+{
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
-+
-+    tcg_gen_gvec_2_ptr(vec_full_reg_offset(s, a->rd),
-+                       vec_full_reg_offset(s, a->rn),
-+                       status, vsz, vsz, 0, fn);
-+    tcg_temp_free_ptr(status);
-+}
-+
-+static bool trans_FRECPE(DisasContext *s, arg_rr_esz *a, uint32_t insn)
-+{
-+    static gen_helper_gvec_2_ptr * const fns[3] = {
-+        gen_helper_gvec_frecpe_h,
-+        gen_helper_gvec_frecpe_s,
-+        gen_helper_gvec_frecpe_d,
-+    };
-+    if (a->esz == 0) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        do_zz_fp(s, a, fns[a->esz - 1]);
-+    }
-+    return true;
-+}
-+
-+static bool trans_FRSQRTE(DisasContext *s, arg_rr_esz *a, uint32_t insn)
-+{
-+    static gen_helper_gvec_2_ptr * const fns[3] = {
-+        gen_helper_gvec_frsqrte_h,
-+        gen_helper_gvec_frsqrte_s,
-+        gen_helper_gvec_frsqrte_d,
-+    };
-+    if (a->esz == 0) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        do_zz_fp(s, a, fns[a->esz - 1]);
-+    }
-+    return true;
-+}
-+
- /*
-  *** SVE Floating Point Accumulating Reduction Group
-  */
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlad)(void *vd, void *vn, void *vm,
-     clear_tail(d, opr_sz, simd_maxsz(desc));
- }
-+#define DO_2OP(NAME, FUNC, TYPE) \
-+void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
-+{                                                                 \
-+    intptr_t i, oprsz = simd_oprsz(desc);                         \
-+    TYPE *d = vd, *n = vn;                                        \
-+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {                  \
-+        d[i] = FUNC(n[i], stat);                                  \
-+    }                                                             \
-+}
-+
-+DO_2OP(gvec_frecpe_h, helper_recpe_f16, float16)
-+DO_2OP(gvec_frecpe_s, helper_recpe_f32, float32)
-+DO_2OP(gvec_frecpe_d, helper_recpe_f64, float64)
-+
-+DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
-+DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
-+DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
-+
-+#undef DO_2OP
-+
- /* Floating-point trigonometric starting value.
-  * See the ARM ARM pseudocode function FPTrigSMul.
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ FMINNMV         01100101 .. 000 101 001 ... ..... .....         @rd_pg_rn
- FMAXV           01100101 .. 000 110 001 ... ..... .....         @rd_pg_rn
- FMINV           01100101 .. 000 111 001 ... ..... .....         @rd_pg_rn
-+## SVE Floating Point Unary Operations - Unpredicated Group
-+
-+FRECPE          01100101 .. 001 110 001100 ..... .....          @rd_rn
-+FRSQRTE         01100101 .. 001 111 001100 ..... .....          @rd_rn
-+
- ### SVE FP Accumulating Reduction Group
- # SVE floating-point serial reduction (predicated)
---
-.17.1

-[Qemu-devel] [PULL 27/55] target/arm: Implement SVE FP Compare with Zero Group
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-22-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 42 +++++++++++++++++++++++++++++++++++++
- target/arm/sve_helper.c    | 43 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 43 ++++++++++++++++++++++++++++++++++++++
- target/arm/sve.decode      | 10 +++++++++
-files changed, 138 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve_fadda_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_5(sve_fadda_d, TCG_CALL_NO_RWG,
-                    i64, i64, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmge0_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmge0_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmge0_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_5(sve_fcmgt0_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmgt0_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmgt0_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_5(sve_fcmlt0_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmlt0_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmlt0_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_5(sve_fcmle0_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmle0_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmle0_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_5(sve_fcmeq0_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmeq0_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmeq0_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
-+DEF_HELPER_FLAGS_5(sve_fcmne0_h, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmne0_s, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcmne0_d, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_6(sve_fadd_h, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_6(sve_fadd_s, TCG_CALL_NO_RWG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg,               \
- #define DO_FCMGE(TYPE, X, Y, ST)  TYPE##_compare(Y, X, ST) <= 0
- #define DO_FCMGT(TYPE, X, Y, ST)  TYPE##_compare(Y, X, ST) < 0
-+#define DO_FCMLE(TYPE, X, Y, ST)  TYPE##_compare(X, Y, ST) <= 0
-+#define DO_FCMLT(TYPE, X, Y, ST)  TYPE##_compare(X, Y, ST) < 0
- #define DO_FCMEQ(TYPE, X, Y, ST)  TYPE##_compare_quiet(X, Y, ST) == 0
- #define DO_FCMNE(TYPE, X, Y, ST)  TYPE##_compare_quiet(X, Y, ST) != 0
- #define DO_FCMUO(TYPE, X, Y, ST)  \
-@@ -XXX,XX +XXX,XX @@ DO_FPCMP_PPZZ_ALL(sve_facgt, DO_FACGT)
- #undef DO_FPCMP_PPZZ_H
- #undef DO_FPCMP_PPZZ
-+/* One operand floating-point comparison against zero, controlled
-+ * by a predicate.
-+ */
-+#define DO_FPCMP_PPZ0(NAME, TYPE, H, OP)                   \
-+void HELPER(NAME)(void *vd, void *vn, void *vg,            \
-+                  void *status, uint32_t desc)             \
-+{                                                          \
-+    intptr_t i = simd_oprsz(desc), j = (i - 1) >> 6;       \
-+    uint64_t *d = vd, *g = vg;                             \
-+    do {                                                   \
-+        uint64_t out = 0, pg = g[j];                       \
-+        do {                                               \
-+            i -= sizeof(TYPE), out <<= sizeof(TYPE);       \
-+            if ((pg >> (i & 63)) & 1) {                    \
-+                TYPE nn = *(TYPE *)(vn + H(i));            \
-+                out |= OP(TYPE, nn, 0, status);            \
-+            }                                              \
-+        } while (i & 63);                                  \
-+        d[j--] = out;                                      \
-+    } while (i > 0);                                       \
-+}
-+
-+#define DO_FPCMP_PPZ0_H(NAME, OP) \
-+    DO_FPCMP_PPZ0(NAME##_h, float16, H1_2, OP)
-+#define DO_FPCMP_PPZ0_S(NAME, OP) \
-+    DO_FPCMP_PPZ0(NAME##_s, float32, H1_4, OP)
-+#define DO_FPCMP_PPZ0_D(NAME, OP) \
-+    DO_FPCMP_PPZ0(NAME##_d, float64,     , OP)
-+
-+#define DO_FPCMP_PPZ0_ALL(NAME, OP) \
-+    DO_FPCMP_PPZ0_H(NAME, OP)   \
-+    DO_FPCMP_PPZ0_S(NAME, OP)   \
-+    DO_FPCMP_PPZ0_D(NAME, OP)
-+
-+DO_FPCMP_PPZ0_ALL(sve_fcmge0, DO_FCMGE)
-+DO_FPCMP_PPZ0_ALL(sve_fcmgt0, DO_FCMGT)
-+DO_FPCMP_PPZ0_ALL(sve_fcmle0, DO_FCMLE)
-+DO_FPCMP_PPZ0_ALL(sve_fcmlt0, DO_FCMLT)
-+DO_FPCMP_PPZ0_ALL(sve_fcmeq0, DO_FCMEQ)
-+DO_FPCMP_PPZ0_ALL(sve_fcmne0, DO_FCMNE)
-+
- /*
-  * Load contiguous data, protected by a governing predicate.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_FRSQRTE(DisasContext *s, arg_rr_esz *a, uint32_t insn)
-     return true;
- }
-+/*
-+ *** SVE Floating Point Compare with Zero Group
-+ */
-+
-+static void do_ppz_fp(DisasContext *s, arg_rpr_esz *a,
-+                      gen_helper_gvec_3_ptr *fn)
-+{
-+    unsigned vsz = vec_full_reg_size(s);
-+    TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
-+
-+    tcg_gen_gvec_3_ptr(pred_full_reg_offset(s, a->rd),
-+                       vec_full_reg_offset(s, a->rn),
-+                       pred_full_reg_offset(s, a->pg),
-+                       status, vsz, vsz, 0, fn);
-+    tcg_temp_free_ptr(status);
-+}
-+
-+#define DO_PPZ(NAME, name) \
-+static bool trans_##NAME(DisasContext *s, arg_rpr_esz *a, uint32_t insn) \
-+{                                                                 \
-+    static gen_helper_gvec_3_ptr * const fns[3] = {               \
-+        gen_helper_sve_##name##_h,                                \
-+        gen_helper_sve_##name##_s,                                \
-+        gen_helper_sve_##name##_d,                                \
-+    };                                                            \
-+    if (a->esz == 0) {                                            \
-+        return false;                                             \
-+    }                                                             \
-+    if (sve_access_check(s)) {                                    \
-+        do_ppz_fp(s, a, fns[a->esz - 1]);                         \
-+    }                                                             \
-+    return true;                                                  \
-+}
-+
-+DO_PPZ(FCMGE_ppz0, fcmge0)
-+DO_PPZ(FCMGT_ppz0, fcmgt0)
-+DO_PPZ(FCMLE_ppz0, fcmle0)
-+DO_PPZ(FCMLT_ppz0, fcmlt0)
-+DO_PPZ(FCMEQ_ppz0, fcmeq0)
-+DO_PPZ(FCMNE_ppz0, fcmne0)
-+
-+#undef DO_PPZ
-+
- /*
-  *** SVE Floating Point Accumulating Reduction Group
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@
- # One register operand, with governing predicate, vector element size
- @rd_pg_rn       ........ esz:2 ... ... ... pg:3 rn:5 rd:5       &rpr_esz
- @rd_pg4_pn      ........ esz:2 ... ... .. pg:4 . rn:4 rd:5      &rpr_esz
-+@pd_pg_rn       ........ esz:2 ... ... ... pg:3 rn:5 . rd:4     &rpr_esz
- # One register operand, with governing predicate, no vector element size
- @rd_pg_rn_e0    ........ .. ... ... ... pg:3 rn:5 rd:5          &rpr_esz esz=0
-@@ -XXX,XX +XXX,XX @@ FMINV           01100101 .. 000 111 001 ... ..... .....         @rd_pg_rn
- FRECPE          01100101 .. 001 110 001100 ..... .....          @rd_rn
- FRSQRTE         01100101 .. 001 111 001100 ..... .....          @rd_rn
-+### SVE FP Compare with Zero Group
-+
-+FCMGE_ppz0      01100101 .. 0100 00 001 ... ..... 0 ....        @pd_pg_rn
-+FCMGT_ppz0      01100101 .. 0100 00 001 ... ..... 1 ....        @pd_pg_rn
-+FCMLT_ppz0      01100101 .. 0100 01 001 ... ..... 0 ....        @pd_pg_rn
-+FCMLE_ppz0      01100101 .. 0100 01 001 ... ..... 1 ....        @pd_pg_rn
-+FCMEQ_ppz0      01100101 .. 0100 10 001 ... ..... 0 ....        @pd_pg_rn
-+FCMNE_ppz0      01100101 .. 0100 11 001 ... ..... 0 ....        @pd_pg_rn
-+
- ### SVE FP Accumulating Reduction Group
- # SVE floating-point serial reduction (predicated)
---
-.17.1

-[Qemu-devel] [PULL 28/55] target/arm: Implement SVE floating-point trig multiply-add coefficient
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-23-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    |  4 +++
- target/arm/sve_helper.c    | 70 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 27 +++++++++++++++
- target/arm/sve.decode      |  3 ++
-files changed, 104 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_h, TCG_CALL_NO_RWG, void, env, ptr, i32)
- DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_s, TCG_CALL_NO_RWG, void, env, ptr, i32)
- DEF_HELPER_FLAGS_3(sve_fnmls_zpzzz_d, TCG_CALL_NO_RWG, void, env, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ftmad_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ftmad_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_ftmad_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_4(sve_ld1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ld2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
- DEF_HELPER_FLAGS_4(sve_ld3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ DO_FPCMP_PPZ0_ALL(sve_fcmlt0, DO_FCMLT)
- DO_FPCMP_PPZ0_ALL(sve_fcmeq0, DO_FCMEQ)
- DO_FPCMP_PPZ0_ALL(sve_fcmne0, DO_FCMNE)
-+/* FP Trig Multiply-Add. */
-+
-+void HELPER(sve_ftmad_h)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
-+{
-+    static const float16 coeff[16] = {
-+        0x3c00, 0xb155, 0x2030, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
-+        0x3c00, 0xb800, 0x293a, 0x0000, 0x0000, 0x0000, 0x0000, 0x0000,
-+    };
-+    intptr_t i, opr_sz = simd_oprsz(desc) / sizeof(float16);
-+    intptr_t x = simd_data(desc);
-+    float16 *d = vd, *n = vn, *m = vm;
-+    for (i = 0; i < opr_sz; i++) {
-+        float16 mm = m[i];
-+        intptr_t xx = x;
-+        if (float16_is_neg(mm)) {
-+            mm = float16_abs(mm);
-+            xx += 8;
-+        }
-+        d[i] = float16_muladd(n[i], mm, coeff[xx], 0, vs);
-+    }
-+}
-+
-+void HELPER(sve_ftmad_s)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
-+{
-+    static const float32 coeff[16] = {
-+        0x3f800000, 0xbe2aaaab, 0x3c088886, 0xb95008b9,
-+        0x36369d6d, 0x00000000, 0x00000000, 0x00000000,
-+        0x3f800000, 0xbf000000, 0x3d2aaaa6, 0xbab60705,
-+        0x37cd37cc, 0x00000000, 0x00000000, 0x00000000,
-+    };
-+    intptr_t i, opr_sz = simd_oprsz(desc) / sizeof(float32);
-+    intptr_t x = simd_data(desc);
-+    float32 *d = vd, *n = vn, *m = vm;
-+    for (i = 0; i < opr_sz; i++) {
-+        float32 mm = m[i];
-+        intptr_t xx = x;
-+        if (float32_is_neg(mm)) {
-+            mm = float32_abs(mm);
-+            xx += 8;
-+        }
-+        d[i] = float32_muladd(n[i], mm, coeff[xx], 0, vs);
-+    }
-+}
-+
-+void HELPER(sve_ftmad_d)(void *vd, void *vn, void *vm, void *vs, uint32_t desc)
-+{
-+    static const float64 coeff[16] = {
-+        0x3ff0000000000000ull, 0xbfc5555555555543ull,
-+        0x3f8111111110f30cull, 0xbf2a01a019b92fc6ull,
-+        0x3ec71de351f3d22bull, 0xbe5ae5e2b60f7b91ull,
-+        0x3de5d8408868552full, 0x0000000000000000ull,
-+        0x3ff0000000000000ull, 0xbfe0000000000000ull,
-+        0x3fa5555555555536ull, 0xbf56c16c16c13a0bull,
-+        0x3efa01a019b1e8d8ull, 0xbe927e4f7282f468ull,
-+        0x3e21ee96d2641b13ull, 0xbda8f76380fbb401ull,
-+    };
-+    intptr_t i, opr_sz = simd_oprsz(desc) / sizeof(float64);
-+    intptr_t x = simd_data(desc);
-+    float64 *d = vd, *n = vn, *m = vm;
-+    for (i = 0; i < opr_sz; i++) {
-+        float64 mm = m[i];
-+        intptr_t xx = x;
-+        if (float64_is_neg(mm)) {
-+            mm = float64_abs(mm);
-+            xx += 8;
-+        }
-+        d[i] = float64_muladd(n[i], mm, coeff[xx], 0, vs);
-+    }
-+}
-+
- /*
-  * Load contiguous data, protected by a governing predicate.
-  */
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DO_PPZ(FCMNE_ppz0, fcmne0)
- #undef DO_PPZ
-+/*
-+ *** SVE floating-point trig multiply-add coefficient
-+ */
-+
-+static bool trans_FTMAD(DisasContext *s, arg_FTMAD *a, uint32_t insn)
-+{
-+    static gen_helper_gvec_3_ptr * const fns[3] = {
-+        gen_helper_sve_ftmad_h,
-+        gen_helper_sve_ftmad_s,
-+        gen_helper_sve_ftmad_d,
-+    };
-+
-+    if (a->esz == 0) {
-+        return false;
-+    }
-+    if (sve_access_check(s)) {
-+        unsigned vsz = vec_full_reg_size(s);
-+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
-+        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, a->rd),
-+                           vec_full_reg_offset(s, a->rn),
-+                           vec_full_reg_offset(s, a->rm),
-+                           status, vsz, vsz, a->imm, fns[a->esz - 1]);
-+        tcg_temp_free_ptr(status);
-+    }
-+    return true;
-+}
-+
- /*
-  *** SVE Floating Point Accumulating Reduction Group
-  */
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ FMINNM_zpzi     01100101 .. 011 101 100 ... 0000 . .....        @rdn_i1
- FMAX_zpzi       01100101 .. 011 110 100 ... 0000 . .....        @rdn_i1
- FMIN_zpzi       01100101 .. 011 111 100 ... 0000 . .....        @rdn_i1
-+# SVE floating-point trig multiply-add coefficient
-+FTMAD           01100101 esz:2 010 imm:3 100000 rm:5 rd:5       rn=%reg_movprfx
-+
- ### SVE FP Multiply-Add Group
- # SVE floating-point multiply-accumulate writing addend
---
-.17.1

-[Qemu-devel] [PULL 29/55] target/arm: Implement SVE floating-point convert precision
+Deleted patch
-From: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-24-richard.henderson@linaro.org
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
----
- target/arm/helper-sve.h    | 13 +++++++++
- target/arm/sve_helper.c    | 55 ++++++++++++++++++++++++++++++++++++++
- target/arm/translate-sve.c | 30 +++++++++++++++++++++
- target/arm/sve.decode      |  8 ++++++
-files changed, 106 insertions(+)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
-+++ b/target/arm/helper-sve.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_6(sve_fmins_s, TCG_CALL_NO_RWG,
- DEF_HELPER_FLAGS_6(sve_fmins_d, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, i64, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcvt_sh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcvt_dh, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcvt_hs, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcvt_ds, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcvt_hd, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(sve_fcvt_sd, TCG_CALL_NO_RWG,
-+                   void, ptr, ptr, ptr, ptr, i32)
-+
- DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
-                    void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
-diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve_helper.c
-+++ b/target/arm/sve_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vg, void *status, uint32_t desc) \
-     } while (i != 0);                                                 \
- }
-+/* SVE fp16 conversions always use IEEE mode.  Like AdvSIMD, they ignore
-+ * FZ16.  When converting from fp16, this affects flushing input denormals;
-+ * when converting to fp16, this affects flushing output denormals.
-+ */
-+static inline float32 sve_f16_to_f32(float16 f, float_status *fpst)
-+{
-+    flag save = get_flush_inputs_to_zero(fpst);
-+    float32 ret;
-+
-+    set_flush_inputs_to_zero(false, fpst);
-+    ret = float16_to_float32(f, true, fpst);
-+    set_flush_inputs_to_zero(save, fpst);
-+    return ret;
-+}
-+
-+static inline float64 sve_f16_to_f64(float16 f, float_status *fpst)
-+{
-+    flag save = get_flush_inputs_to_zero(fpst);
-+    float64 ret;
-+
-+    set_flush_inputs_to_zero(false, fpst);
-+    ret = float16_to_float64(f, true, fpst);
-+    set_flush_inputs_to_zero(save, fpst);
-+    return ret;
-+}
-+
-+static inline float16 sve_f32_to_f16(float32 f, float_status *fpst)
-+{
-+    flag save = get_flush_to_zero(fpst);
-+    float16 ret;
-+
-+    set_flush_to_zero(false, fpst);
-+    ret = float32_to_float16(f, true, fpst);
-+    set_flush_to_zero(save, fpst);
-+    return ret;
-+}
-+
-+static inline float16 sve_f64_to_f16(float64 f, float_status *fpst)
-+{
-+    flag save = get_flush_to_zero(fpst);
-+    float16 ret;
-+
-+    set_flush_to_zero(false, fpst);
-+    ret = float64_to_float16(f, true, fpst);
-+    set_flush_to_zero(save, fpst);
-+    return ret;
-+}
-+
-+DO_ZPZ_FP(sve_fcvt_sh, uint32_t, H1_4, sve_f32_to_f16)
-+DO_ZPZ_FP(sve_fcvt_hs, uint32_t, H1_4, sve_f16_to_f32)
-+DO_ZPZ_FP(sve_fcvt_dh, uint64_t,     , sve_f64_to_f16)
-+DO_ZPZ_FP(sve_fcvt_hd, uint64_t,     , sve_f16_to_f64)
-+DO_ZPZ_FP(sve_fcvt_ds, uint64_t,     , float64_to_float32)
-+DO_ZPZ_FP(sve_fcvt_sd, uint64_t,     , float32_to_float64)
-+
- DO_ZPZ_FP(sve_scvt_hh, uint16_t, H1_2, int16_to_float16)
- DO_ZPZ_FP(sve_scvt_sh, uint32_t, H1_4, int32_to_float16)
- DO_ZPZ_FP(sve_scvt_ss, uint32_t, H1_4, int32_to_float32)
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-sve.c
-+++ b/target/arm/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static bool do_zpz_ptr(DisasContext *s, int rd, int rn, int pg,
-     return true;
- }
-+static bool trans_FCVT_sh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvt_sh);
-+}
-+
-+static bool trans_FCVT_hs(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvt_hs);
-+}
-+
-+static bool trans_FCVT_dh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvt_dh);
-+}
-+
-+static bool trans_FCVT_hd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvt_hd);
-+}
-+
-+static bool trans_FCVT_ds(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvt_ds);
-+}
-+
-+static bool trans_FCVT_sd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
-+{
-+    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvt_sd);
-+}
-+
- static bool trans_SCVTF_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
- {
-     return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_hh);
-diff --git a/target/arm/sve.decode b/target/arm/sve.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/sve.decode
-+++ b/target/arm/sve.decode
-@@ -XXX,XX +XXX,XX @@ FNMLS_zpzzz     01100101 .. 1 ..... 111 ... ..... .....         @rdn_pg_rm_ra
- ### SVE FP Unary Operations Predicated Group
-+# SVE floating-point convert precision
-+FCVT_sh         01100101 10 0010 00 101 ... ..... .....         @rd_pg_rn_e0
-+FCVT_hs         01100101 10 0010 01 101 ... ..... .....         @rd_pg_rn_e0
-+FCVT_dh         01100101 11 0010 00 101 ... ..... .....         @rd_pg_rn_e0
-+FCVT_hd         01100101 11 0010 01 101 ... ..... .....         @rd_pg_rn_e0
-+FCVT_ds         01100101 11 0010 10 101 ... ..... .....         @rd_pg_rn_e0
-+FCVT_sd         01100101 11 0010 11 101 ... ..... .....         @rd_pg_rn_e0
-+
- # SVE integer convert to floating-point
- SCVTF_hh        01100101 01 010 01 0 101 ... ..... .....        @rd_pg_rn_e0
- SCVTF_sh        01100101 01 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
---
-.17.1

-[Qemu-devel] [PULL 30/55] target/arm: Implement SVE floating-point convert to integer
+[PULL 33/33] tests/acpi: add expected blob for VIOT test on virt machine
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jean-Philippe Brucker <jean-philippe@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+The VIOT blob contains the following:
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180627043328.11531-25-richard.henderson@linaro.org
+[000h 0000   4]                    Signature : "VIOT"    [Virtual I/O Translation Table]
 [004h 0004   4]                 Table Length : 00000058
 [008h 0008   1]                     Revision : 00
 [009h 0009   1]                     Checksum : 66
 [00Ah 0010   6]                       Oem ID : "BOCHS "
 [010h 0016   8]                 Oem Table ID : "BXPC    "
 [018h 0024   4]                 Oem Revision : 00000001
 [01Ch 0028   4]              Asl Compiler ID : "BXPC"
 [020h 0032   4]        Asl Compiler Revision : 00000001
 [024h 0036   2]                   Node count : 0002
 [026h 0038   2]                  Node offset : 0030
 [028h 0040   8]                     Reserved : 0000000000000000
 [030h 0048   1]                         Type : 03 [VirtIO-PCI IOMMU]
 [031h 0049   1]                     Reserved : 00
 [032h 0050   2]                       Length : 0010
 [034h 0052   2]                  PCI Segment : 0000
 [036h 0054   2]               PCI BDF number : 0008
 [038h 0056   8]                     Reserved : 0000000000000000
 [040h 0064   1]                         Type : 01 [PCI Range]
 [041h 0065   1]                     Reserved : 00
 [042h 0066   2]                       Length : 0018
 [044h 0068   4]               Endpoint start : 00000000
 [048h 0072   2]            PCI Segment start : 0000
 [04Ah 0074   2]              PCI Segment end : 0000
 [04Ch 0076   2]                PCI BDF start : 0000
 [04Eh 0078   2]                  PCI BDF end : 00FF
 [050h 0080   2]                  Output node : 0030
 [052h 0082   6]                     Reserved : 000000000000
 Acked-by: Ani Sinha <ani@anisinha.ca>
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
 Message-id: 20211210170415.583179-9-jean-philippe@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/helper-sve.h    | 30 +++++++++++++
+ tests/qtest/bios-tables-test-allowed-diff.h |   1 -
- target/arm/helper.h        | 12 +++---
+ tests/data/acpi/virt/VIOT                   | Bin 0 -> 88 bytes
- target/arm/helper.c        |  2 +-
+files changed, 1 deletion(-)
  target/arm/sve_helper.c    | 88 ++++++++++++++++++++++++++++++++++++++
  target/arm/translate-sve.c | 70 ++++++++++++++++++++++++++++++
  target/arm/sve.decode      | 16 +++++++
 files changed, 211 insertions(+), 7 deletions(-)
-diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
+diff --git a/tests/qtest/bios-tables-test-allowed-diff.h b/tests/qtest/bios-tables-test-allowed-diff.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-sve.h
+--- a/tests/qtest/bios-tables-test-allowed-diff.h
-+++ b/target/arm/helper-sve.h
++++ b/tests/qtest/bios-tables-test-allowed-diff.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(sve_fcvt_hd, TCG_CALL_NO_RWG,
+@@ -1,2 +1 @@
- DEF_HELPER_FLAGS_5(sve_fcvt_sd, TCG_CALL_NO_RWG,
+ /* List of comma-separated changed AML files to ignore */
-                    void, ptr, ptr, ptr, ptr, i32)
+-"tests/data/acpi/virt/VIOT",
+diff --git a/tests/data/acpi/virt/VIOT b/tests/data/acpi/virt/VIOT
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_hh, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_hs, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_ss, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_ds, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_hd, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_sd, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzs_dd, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_hh, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_hs, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_ss, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_ds, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_hd, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_sd, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_5(sve_fcvtzu_dd, TCG_CALL_NO_RWG,
 +                   void, ptr, ptr, ptr, ptr, i32)
 +
  DEF_HELPER_FLAGS_5(sve_scvt_hh, TCG_CALL_NO_RWG,
                     void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(sve_scvt_sh, TCG_CALL_NO_RWG,
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+GIT binary patch
-+++ b/target/arm/helper.h
+literal 88
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(vfp_touid, i32, f64, ptr)
+zcmWIZ^bd((0D?3pe`k+i1*eDrX9XZ&1PX!JAexE60Hgv8m>C3sGzXN&z`)2L0cSHX
- DEF_HELPER_2(vfp_touizh, i32, f16, ptr)
+I{D-Rq0Q5fy0RR91
- DEF_HELPER_2(vfp_touizs, i32, f32, ptr)
- DEF_HELPER_2(vfp_touizd, i32, f64, ptr)
+literal 0
--DEF_HELPER_2(vfp_tosih, i32, f16, ptr)
+HcmV?d00001
--DEF_HELPER_2(vfp_tosis, i32, f32, ptr)
 -DEF_HELPER_2(vfp_tosid, i32, f64, ptr)
 -DEF_HELPER_2(vfp_tosizh, i32, f16, ptr)
 -DEF_HELPER_2(vfp_tosizs, i32, f32, ptr)
 -DEF_HELPER_2(vfp_tosizd, i32, f64, ptr)
 +DEF_HELPER_2(vfp_tosih, s32, f16, ptr)
 +DEF_HELPER_2(vfp_tosis, s32, f32, ptr)
 +DEF_HELPER_2(vfp_tosid, s32, f64, ptr)
 +DEF_HELPER_2(vfp_tosizh, s32, f16, ptr)
 +DEF_HELPER_2(vfp_tosizs, s32, f32, ptr)
 +DEF_HELPER_2(vfp_tosizd, s32, f64, ptr)
  DEF_HELPER_3(vfp_toshs_round_to_zero, i32, f32, i32, ptr)
  DEF_HELPER_3(vfp_tosls_round_to_zero, i32, f32, i32, ptr)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ ftype HELPER(name)(uint32_t x, void *fpstp)                         \
  }
  #define CONV_FTOI(name, ftype, fsz, sign, round)                \
 -uint32_t HELPER(name)(ftype x, void *fpstp)                     \
 +sign##int32_t HELPER(name)(ftype x, void *fpstp)                \
  {                                                               \
      float_status *fpst = fpstp;                                 \
      if (float##fsz##_is_any_nan(x)) {                           \
 diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve_helper.c
 +++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ static inline float16 sve_f64_to_f16(float64 f, float_status *fpst)
      return ret;
  }
 +static inline int16_t vfp_float16_to_int16_rtz(float16 f, float_status *s)
 +{
 +    if (float16_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float16_to_int16_round_to_zero(f, s);
 +}
 +
 +static inline int64_t vfp_float16_to_int64_rtz(float16 f, float_status *s)
 +{
 +    if (float16_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float16_to_int64_round_to_zero(f, s);
 +}
 +
 +static inline int64_t vfp_float32_to_int64_rtz(float32 f, float_status *s)
 +{
 +    if (float32_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float32_to_int64_round_to_zero(f, s);
 +}
 +
 +static inline int64_t vfp_float64_to_int64_rtz(float64 f, float_status *s)
 +{
 +    if (float64_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float64_to_int64_round_to_zero(f, s);
 +}
 +
 +static inline uint16_t vfp_float16_to_uint16_rtz(float16 f, float_status *s)
 +{
 +    if (float16_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float16_to_uint16_round_to_zero(f, s);
 +}
 +
 +static inline uint64_t vfp_float16_to_uint64_rtz(float16 f, float_status *s)
 +{
 +    if (float16_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float16_to_uint64_round_to_zero(f, s);
 +}
 +
 +static inline uint64_t vfp_float32_to_uint64_rtz(float32 f, float_status *s)
 +{
 +    if (float32_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float32_to_uint64_round_to_zero(f, s);
 +}
 +
 +static inline uint64_t vfp_float64_to_uint64_rtz(float64 f, float_status *s)
 +{
 +    if (float64_is_any_nan(f)) {
 +        float_raise(float_flag_invalid, s);
 +        return 0;
 +    }
 +    return float64_to_uint64_round_to_zero(f, s);
 +}
 +
  DO_ZPZ_FP(sve_fcvt_sh, uint32_t, H1_4, sve_f32_to_f16)
  DO_ZPZ_FP(sve_fcvt_hs, uint32_t, H1_4, sve_f16_to_f32)
  DO_ZPZ_FP(sve_fcvt_dh, uint64_t,     , sve_f64_to_f16)
@@ -XXX,XX +XXX,XX @@ DO_ZPZ_FP(sve_fcvt_hd, uint64_t,     , sve_f16_to_f64)
  DO_ZPZ_FP(sve_fcvt_ds, uint64_t,     , float64_to_float32)
  DO_ZPZ_FP(sve_fcvt_sd, uint64_t,     , float32_to_float64)
 +DO_ZPZ_FP(sve_fcvtzs_hh, uint16_t, H1_2, vfp_float16_to_int16_rtz)
 +DO_ZPZ_FP(sve_fcvtzs_hs, uint32_t, H1_4, helper_vfp_tosizh)
 +DO_ZPZ_FP(sve_fcvtzs_ss, uint32_t, H1_4, helper_vfp_tosizs)
 +DO_ZPZ_FP(sve_fcvtzs_hd, uint64_t,     , vfp_float16_to_int64_rtz)
 +DO_ZPZ_FP(sve_fcvtzs_sd, uint64_t,     , vfp_float32_to_int64_rtz)
 +DO_ZPZ_FP(sve_fcvtzs_ds, uint64_t,     , helper_vfp_tosizd)
 +DO_ZPZ_FP(sve_fcvtzs_dd, uint64_t,     , vfp_float64_to_int64_rtz)
 +
 +DO_ZPZ_FP(sve_fcvtzu_hh, uint16_t, H1_2, vfp_float16_to_uint16_rtz)
 +DO_ZPZ_FP(sve_fcvtzu_hs, uint32_t, H1_4, helper_vfp_touizh)
 +DO_ZPZ_FP(sve_fcvtzu_ss, uint32_t, H1_4, helper_vfp_touizs)
 +DO_ZPZ_FP(sve_fcvtzu_hd, uint64_t,     , vfp_float16_to_uint64_rtz)
 +DO_ZPZ_FP(sve_fcvtzu_sd, uint64_t,     , vfp_float32_to_uint64_rtz)
 +DO_ZPZ_FP(sve_fcvtzu_ds, uint64_t,     , helper_vfp_touizd)
 +DO_ZPZ_FP(sve_fcvtzu_dd, uint64_t,     , vfp_float64_to_uint64_rtz)
 +
  DO_ZPZ_FP(sve_scvt_hh, uint16_t, H1_2, int16_to_float16)
  DO_ZPZ_FP(sve_scvt_sh, uint32_t, H1_4, int32_to_float16)
  DO_ZPZ_FP(sve_scvt_ss, uint32_t, H1_4, int32_to_float32)
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FCVT_sd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
      return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvt_sd);
  }
 +static bool trans_FCVTZS_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvtzs_hh);
 +}
 +
 +static bool trans_FCVTZU_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvtzu_hh);
 +}
 +
 +static bool trans_FCVTZS_hs(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvtzs_hs);
 +}
 +
 +static bool trans_FCVTZU_hs(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvtzu_hs);
 +}
 +
 +static bool trans_FCVTZS_hd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvtzs_hd);
 +}
 +
 +static bool trans_FCVTZU_hd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_fcvtzu_hd);
 +}
 +
 +static bool trans_FCVTZS_ss(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzs_ss);
 +}
 +
 +static bool trans_FCVTZU_ss(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzu_ss);
 +}
 +
 +static bool trans_FCVTZS_sd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzs_sd);
 +}
 +
 +static bool trans_FCVTZU_sd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzu_sd);
 +}
 +
 +static bool trans_FCVTZS_ds(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzs_ds);
 +}
 +
 +static bool trans_FCVTZU_ds(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzu_ds);
 +}
 +
 +static bool trans_FCVTZS_dd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzs_dd);
 +}
 +
 +static bool trans_FCVTZU_dd(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
 +{
 +    return do_zpz_ptr(s, a->rd, a->rn, a->pg, false, gen_helper_sve_fcvtzu_dd);
 +}
 +
  static bool trans_SCVTF_hh(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
  {
      return do_zpz_ptr(s, a->rd, a->rn, a->pg, true, gen_helper_sve_scvt_hh);
 diff --git a/target/arm/sve.decode b/target/arm/sve.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/sve.decode
 +++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ FCVT_hd         01100101 11 0010 01 101 ... ..... .....         @rd_pg_rn_e0
  FCVT_ds         01100101 11 0010 10 101 ... ..... .....         @rd_pg_rn_e0
  FCVT_sd         01100101 11 0010 11 101 ... ..... .....         @rd_pg_rn_e0
 +# SVE floating-point convert to integer
 +FCVTZS_hh       01100101 01 011 01 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_hh       01100101 01 011 01 1 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZS_hs       01100101 01 011 10 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_hs       01100101 01 011 10 1 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZS_hd       01100101 01 011 11 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_hd       01100101 01 011 11 1 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZS_ss       01100101 10 011 10 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_ss       01100101 10 011 10 1 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZS_ds       01100101 11 011 00 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_ds       01100101 11 011 00 1 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZS_sd       01100101 11 011 10 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_sd       01100101 11 011 10 1 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZS_dd       01100101 11 011 11 0 101 ... ..... .....        @rd_pg_rn_e0
 +FCVTZU_dd       01100101 11 011 11 1 101 ... ..... .....        @rd_pg_rn_e0
 +
  # SVE integer convert to floating-point
  SCVTF_hh        01100101 01 010 01 0 101 ... ..... .....        @rd_pg_rn_e0
  SCVTF_sh        01100101 01 010 10 0 101 ... ..... .....        @rd_pg_rn_e0
 --
-.17.1
+.25.1

Hopefully last target-arm queue before softfreeze;
this one's largest part is the remainder of the SVE patches,
but there are a selection of other minor things too.

thanks
-- PMM

The following changes since commit 109b25045b3651f9c5d02c3766c0b3ff63e6d193:

Merge remote-tracking branch 'remotes/bonzini/tags/for-upstream' into staging (2018-06-29 12:30:29 +0100)

are available in the Git repository at:

git://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20180629

for you to fetch changes up to 802abf4024d23e48d45373ac3f2b580124b54b47:

target/arm: Add ID_ISAR6 (2018-06-29 15:30:54 +0100)

----------------------------------------------------------------
target-arm queue:
 * last of the SVE patches; SVE is now enabled for aarch64 linux-user
 * sd: Don't trace SDRequest crc field (coverity bugfix)
 * target/arm: Mark PMINTENSET accesses as possibly doing IO
 * clean up v7VE feature bit handling
 * i.mx7d: minor cleanups
 * target/arm: support reading of CNT[VCT|FRQ]_EL0 from user-space
 * target/arm: Implement ARMv8.2-DotProd
 * virt: add addresses to dt node names (which stops dtc from
   complaining that they're not correctly named)
 * cleanups: replace error_setg(&error_fatal) by error_report() + exit()

----------------------------------------------------------------
Aaron Lindsay (3):
      target/arm: Add ARM_FEATURE_V7VE for v7 Virtualization Extensions
      target/arm: Remove redundant DIV detection for KVM
      target/arm: Mark PMINTENSET accesses as possibly doing IO

Alex Bennée (1):
      target/arm: support reading of CNT[VCT|FRQ]_EL0 from user-space

Eric Auger (3):
      device_tree: Add qemu_fdt_node_unit_path
      hw/arm/virt: Silence dtc /intc warnings
      hw/arm/virt: Silence dtc /memory warning

Jean-Christophe Dubois (3):
      i.mx7d: Remove unused header files
      i.mx7d: Change SRC unimplemented device name from sdma to src
      i.mx7d: Change IRQ number type from hwaddr to int

Peter Maydell (1):
      sd: Don't trace SDRequest crc field

Philippe Mathieu-Daudé (4):
      hw/block/fdc: Replace error_setg(&error_abort) by assert()
      hw/arm/sysbus-fdt: Replace error_setg(&error_fatal) by error_report() + exit()
      device_tree: Replace error_setg(&error_fatal) by error_report() + exit()
      sdcard: Use the ldst API

Richard Henderson (40):
      target/arm: Implement SVE Memory Contiguous Load Group
      target/arm: Implement SVE Contiguous Load, first-fault and no-fault
      target/arm: Implement SVE Memory Contiguous Store Group
      target/arm: Implement SVE load and broadcast quadword
      target/arm: Implement SVE integer convert to floating-point
      target/arm: Implement SVE floating-point arithmetic (predicated)
      target/arm: Implement SVE FP Multiply-Add Group
      target/arm: Implement SVE Floating Point Accumulating Reduction Group
      target/arm: Implement SVE load and broadcast element
      target/arm: Implement SVE store vector/predicate register
      target/arm: Implement SVE scatter stores
      target/arm: Implement SVE prefetches
      target/arm: Implement SVE gather loads
      target/arm: Implement SVE first-fault gather loads
      target/arm: Implement SVE scatter store vector immediate
      target/arm: Implement SVE floating-point compare vectors
      target/arm: Implement SVE floating-point arithmetic with immediate
      target/arm: Implement SVE Floating Point Multiply Indexed Group
      target/arm: Implement SVE FP Fast Reduction Group
      target/arm: Implement SVE Floating Point Unary Operations - Unpredicated Group
      target/arm: Implement SVE FP Compare with Zero Group
      target/arm: Implement SVE floating-point trig multiply-add coefficient
      target/arm: Implement SVE floating-point convert precision
      target/arm: Implement SVE floating-point convert to integer
      target/arm: Implement SVE floating-point round to integral value
      target/arm: Implement SVE floating-point unary operations
      target/arm: Implement SVE MOVPRFX
      target/arm: Implement SVE floating-point complex add
      target/arm: Implement SVE fp complex multiply add
      target/arm: Pass index to AdvSIMD FCMLA (indexed)
      target/arm: Implement SVE fp complex multiply add (indexed)
      target/arm: Implement SVE dot product (vectors)
      target/arm: Implement SVE dot product (indexed)
      target/arm: Enable SVE for aarch64-linux-user
      target/arm: Implement ARMv8.2-DotProd
      target/arm: Fix SVE signed division vs x86 overflow exception
      target/arm: Fix SVE system register access checks
      target/arm: Prune a57 features from max
      target/arm: Prune a15 features from max
      target/arm: Add ID_ISAR6

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Use assert() instead of error_setg(&error_abort),
as suggested by the "qapi/error.h" documentation:

Please don't error_setg(&error_fatal, ...), use error_report() and
    exit(), because that's more obvious.
    Likewise, don't error_setg(&error_abort, ...), use assert().

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Acked-by: John Snow <jsnow@redhat.com>
Message-id: 20180625165749.3910-2-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/block/fdc.c | 9 +--------
 1 file changed, 1 insertion(+), 8 deletions(-)

diff --git a/hw/block/fdc.c b/hw/block/fdc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/block/fdc.c
+++ b/hw/block/fdc.c
@@ -XXX,XX +XXX,XX @@ static int pick_geometry(FDrive *drv)
                            nb_sectors,
                            FloppyDriveType_str(parse->drive));
         }
+        assert(type_match != -1 && "misconfigured fd_format");
         match = type_match;
     }
-
-    /* No match of any kind found -- fd_format is misconfigured, abort. */
-    if (match == -1) {
-        error_setg(&error_abort, "No candidate geometries present in table "
-                   " for floppy drive type '%s'",
-                   FloppyDriveType_str(drv->drive));
-    }
-
     parse = &(fd_formats[match]);
 
  out:
-- 
2.17.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Use error_report() + exit() instead of error_setg(&error_fatal),
as suggested by the "qapi/error.h" documentation:

Please don't error_setg(&error_fatal, ...), use error_report() and
   exit(), because that's more obvious.

This fixes CID 1352173:
    "Passing null pointer dt_name to qemu_fdt_node_path, which dereferences it."

And this also fixes:

hw/arm/sysbus-fdt.c:322:9: warning: Array access (from variable 'node_path') results in a null pointer dereference
        if (node_path[1]) {
            ^~~~~~~~~~~~

Fixes: Coverity CID 1352173 (Dereference after null check)
Suggested-by: Eric Blake <eblake@redhat.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Message-id: 20180625165749.3910-3-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/sysbus-fdt.c | 53 +++++++++++++++++++++++++--------------------
 1 file changed, 30 insertions(+), 23 deletions(-)

diff --git a/hw/arm/sysbus-fdt.c b/hw/arm/sysbus-fdt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sysbus-fdt.c
+++ b/hw/arm/sysbus-fdt.c
@@ -XXX,XX +XXX,XX @@ static void copy_properties_from_host(HostProperty *props, int nb_props,
         r = qemu_fdt_getprop(host_fdt, node_path,
                              props[i].name,
                              &prop_len,
-                             props[i].optional ? &err : &error_fatal);
+                             &err);
         if (r) {
             qemu_fdt_setprop(guest_fdt, nodename,
                              props[i].name, r, prop_len);
         } else {
-            if (prop_len != -FDT_ERR_NOTFOUND) {
-                /* optional property not returned although property exists */
-                error_report_err(err);
-            } else {
+            if (props[i].optional && prop_len == -FDT_ERR_NOTFOUND) {
+                /* optional property does not exist */
                 error_free(err);
+            } else {
+                error_report_err(err);
+            }
+            if (!props[i].optional) {
+                /* mandatory property not found: bail out */
+                exit(1);
             }
         }
     }
@@ -XXX,XX +XXX,XX @@ static void fdt_build_clock_node(void *host_fdt, void *guest_fdt,
 
     node_offset = fdt_node_offset_by_phandle(host_fdt, host_phandle);
     if (node_offset <= 0) {
-        error_setg(&error_fatal,
-                   "not able to locate clock handle %d in host device tree",
-                   host_phandle);
+        error_report("not able to locate clock handle %d in host device tree",
+                     host_phandle);
+        exit(1);
     }
     node_path = g_malloc(path_len);
     while ((ret = fdt_get_path(host_fdt, node_offset, node_path, path_len))
@@ -XXX,XX +XXX,XX @@ static void fdt_build_clock_node(void *host_fdt, void *guest_fdt,
         node_path = g_realloc(node_path, path_len);
     }
     if (ret < 0) {
-        error_setg(&error_fatal,
-                   "not able to retrieve node path for clock handle %d",
-                   host_phandle);
+        error_report("not able to retrieve node path for clock handle %d",
+                     host_phandle);
+        exit(1);
     }
 
     r = qemu_fdt_getprop(host_fdt, node_path, "compatible", &prop_len,
                          &error_fatal);
     if (strcmp(r, "fixed-clock")) {
-        error_setg(&error_fatal,
-                   "clock handle %d is not a fixed clock", host_phandle);
+        error_report("clock handle %d is not a fixed clock", host_phandle);
+        exit(1);
     }
 
     nodename = strrchr(node_path, '/');
@@ -XXX,XX +XXX,XX @@ static int add_amd_xgbe_fdt_node(SysBusDevice *sbdev, void *opaque)
 
     dt_name = sysfs_to_dt_name(vbasedev->name);
     if (!dt_name) {
-        error_setg(&error_fatal, "%s incorrect sysfs device name %s",
-                    __func__, vbasedev->name);
+        error_report("%s incorrect sysfs device name %s",
+                     __func__, vbasedev->name);
+        exit(1);
     }
     node_path = qemu_fdt_node_path(host_fdt, dt_name, vdev->compat,
                                    &error_fatal);
     if (!node_path || !node_path[0]) {
-        error_setg(&error_fatal, "%s unable to retrieve node path for %s/%s",
-                   __func__, dt_name, vdev->compat);
+        error_report("%s unable to retrieve node path for %s/%s",
+                     __func__, dt_name, vdev->compat);
+        exit(1);
     }
 
     if (node_path[1]) {
-        error_setg(&error_fatal, "%s more than one node matching %s/%s!",
-                   __func__, dt_name, vdev->compat);
+        error_report("%s more than one node matching %s/%s!",
+                     __func__, dt_name, vdev->compat);
+        exit(1);
     }
 
     g_free(dt_name);
 
     if (vbasedev->num_regions != 5) {
-        error_setg(&error_fatal, "%s Does the host dt node combine XGBE/PHY?",
-                   __func__);
+        error_report("%s Does the host dt node combine XGBE/PHY?", __func__);
+        exit(1);
     }
 
     /* generate nodes for DMA_CLK and PTP_CLK */
     r = qemu_fdt_getprop(host_fdt, node_path[0], "clocks",
                          &prop_len, &error_fatal);
     if (prop_len != 8) {
-        error_setg(&error_fatal, "%s clocks property should contain 2 handles",
-                   __func__);
+        error_report("%s clocks property should contain 2 handles", __func__);
+        exit(1);
     }
     host_clock_phandles = (uint32_t *)r;
     guest_clock_phandles[0] = qemu_fdt_alloc_phandle(guest_fdt);
-- 
2.17.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Use error_report() + exit() instead of error_setg(&error_fatal),
as suggested by the "qapi/error.h" documentation:

Please don't error_setg(&error_fatal, ...), use error_report() and
   exit(), because that's more obvious.

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Reviewed-by: Markus Armbruster <armbru@redhat.com>
Reviewed-by: David Gibson <david@gibson.dropbear.id.au>
Message-id: 20180625165749.3910-4-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 device_tree.c | 23 +++++++++++++----------
 1 file changed, 13 insertions(+), 10 deletions(-)

diff --git a/device_tree.c b/device_tree.c
index XXXXXXX..XXXXXXX 100644
--- a/device_tree.c
+++ b/device_tree.c
@@ -XXX,XX +XXX,XX @@ static void read_fstree(void *fdt, const char *dirname)
     const char *parent_node;
 
     if (strstr(dirname, root_dir) != dirname) {
-        error_setg(&error_fatal, "%s: %s must be searched within %s",
-                   __func__, dirname, root_dir);
+        error_report("%s: %s must be searched within %s",
+                     __func__, dirname, root_dir);
+        exit(1);
     }
     parent_node = &dirname[strlen(SYSFS_DT_BASEDIR)];
 
     d = opendir(dirname);
     if (!d) {
-        error_setg(&error_fatal, "%s cannot open %s", __func__, dirname);
-        return;
+        error_report("%s cannot open %s", __func__, dirname);
+        exit(1);
     }
 
     while ((de = readdir(d)) != NULL) {
@@ -XXX,XX +XXX,XX @@ static void read_fstree(void *fdt, const char *dirname)
         tmpnam = g_strdup_printf("%s/%s", dirname, de->d_name);
 
         if (lstat(tmpnam, &st) < 0) {
-            error_setg(&error_fatal, "%s cannot lstat %s", __func__, tmpnam);
+            error_report("%s cannot lstat %s", __func__, tmpnam);
+            exit(1);
         }
 
         if (S_ISREG(st.st_mode)) {
@@ -XXX,XX +XXX,XX @@ static void read_fstree(void *fdt, const char *dirname)
             gsize len;
 
             if (!g_file_get_contents(tmpnam, &val, &len, NULL)) {
-                error_setg(&error_fatal, "%s not able to extract info from %s",
-                           __func__, tmpnam);
+                error_report("%s not able to extract info from %s",
+                             __func__, tmpnam);
+                exit(1);
             }
 
             if (strlen(parent_node) > 0) {
@@ -XXX,XX +XXX,XX @@ void *load_device_tree_from_sysfs(void)
     host_fdt = create_device_tree(&host_fdt_size);
     read_fstree(host_fdt, SYSFS_DT_BASEDIR);
     if (fdt_check_header(host_fdt)) {
-        error_setg(&error_fatal,
-                   "%s host device tree extracted into memory is invalid",
-                   __func__);
+        error_report("%s host device tree extracted into memory is invalid",
+                     __func__);
+        exit(1);
     }
     return host_fdt;
 }
-- 
2.17.1

From: Eric Auger <eric.auger@redhat.com>

This helper allows to retrieve the paths of nodes whose name
match node-name or node-name@unit-address patterns.

Signed-off-by: Eric Auger <eric.auger@redhat.com>
Message-id: 1530044492-24921-2-git-send-email-eric.auger@redhat.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/sysemu/device_tree.h | 16 +++++++++++
 device_tree.c                | 55 ++++++++++++++++++++++++++++++++++++
 2 files changed, 71 insertions(+)

diff --git a/include/sysemu/device_tree.h b/include/sysemu/device_tree.h
index XXXXXXX..XXXXXXX 100644
--- a/include/sysemu/device_tree.h
+++ b/include/sysemu/device_tree.h
@@ -XXX,XX +XXX,XX @@ void *load_device_tree_from_sysfs(void);
 char **qemu_fdt_node_path(void *fdt, const char *name, char *compat,
                           Error **errp);
 
+/**
+ * qemu_fdt_node_unit_path: return the paths of nodes matching a given
+ * node-name, ie. node-name and node-name@unit-address
+ * @fdt: pointer to the dt blob
+ * @name: node name
+ * @errp: handle to an error object
+ *
+ * returns a newly allocated NULL-terminated array of node paths.
+ * Use g_strfreev() to free it. If one or more nodes were found, the
+ * array contains the path of each node and the last element equals to
+ * NULL. If there is no error but no matching node was found, the
+ * returned array contains a single element equal to NULL. If an error
+ * was encountered when parsing the blob, the function returns NULL
+ */
+char **qemu_fdt_node_unit_path(void *fdt, const char *name, Error **errp);
+
 int qemu_fdt_setprop(void *fdt, const char *node_path,
                      const char *property, const void *val, int size);
 int qemu_fdt_setprop_cell(void *fdt, const char *node_path,
diff --git a/device_tree.c b/device_tree.c
index XXXXXXX..XXXXXXX 100644
--- a/device_tree.c
+++ b/device_tree.c
@@ -XXX,XX +XXX,XX @@ static int findnode_nofail(void *fdt, const char *node_path)
     return offset;
 }
 
+char **qemu_fdt_node_unit_path(void *fdt, const char *name, Error **errp)
+{
+    char *prefix =  g_strdup_printf("%s@", name);
+    unsigned int path_len = 16, n = 0;
+    GSList *path_list = NULL, *iter;
+    const char *iter_name;
+    int offset, len, ret;
+    char **path_array;
+
+    offset = fdt_next_node(fdt, -1, NULL);
+
+    while (offset >= 0) {
+        iter_name = fdt_get_name(fdt, offset, &len);
+        if (!iter_name) {
+            offset = len;
+            break;
+        }
+        if (!strcmp(iter_name, name) || g_str_has_prefix(iter_name, prefix)) {
+            char *path;
+
+            path = g_malloc(path_len);
+            while ((ret = fdt_get_path(fdt, offset, path, path_len))
+                  == -FDT_ERR_NOSPACE) {
+                path_len += 16;
+                path = g_realloc(path, path_len);
+            }
+            path_list = g_slist_prepend(path_list, path);
+            n++;
+        }
+        offset = fdt_next_node(fdt, offset, NULL);
+    }
+    g_free(prefix);
+
+    if (offset < 0 && offset != -FDT_ERR_NOTFOUND) {
+        error_setg(errp, "%s: abort parsing dt for %s node units: %s",
+                   __func__, name, fdt_strerror(offset));
+        for (iter = path_list; iter; iter = iter->next) {
+            g_free(iter->data);
+        }
+        g_slist_free(path_list);
+        return NULL;
+    }
+
+    path_array = g_new(char *, n + 1);
+    path_array[n--] = NULL;
+
+    for (iter = path_list; iter; iter = iter->next) {
+        path_array[n--] = iter->data;
+    }
+
+    g_slist_free(path_list);
+
+    return path_array;
+}
+
 char **qemu_fdt_node_path(void *fdt, const char *name, char *compat,
                           Error **errp)
 {
-- 
2.17.1

From: Eric Auger <eric.auger@redhat.com>

When running dtc on the guest /proc/device-tree we get the
following warnings: "Warning (unit_address_vs_reg): Node <name>
has a reg or ranges property, but no unit name", with name:
/intc, /intc/its, /intc/v2m.

Nodes should have a name in the form <name>[@<unit-address>] where
unit-address is the primary address used to access the device, listed
in the node's reg property. This fix seems to make dtc happy.

Signed-off-by: Eric Auger <eric.auger@redhat.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 1530044492-24921-3-git-send-email-eric.auger@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/virt.c | 63 +++++++++++++++++++++++++++++++--------------------
 1 file changed, 39 insertions(+), 24 deletions(-)

diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void fdt_add_cpu_nodes(const VirtMachineState *vms)
 
 static void fdt_add_its_gic_node(VirtMachineState *vms)
 {
+    char *nodename;
+
     vms->msi_phandle = qemu_fdt_alloc_phandle(vms->fdt);
-    qemu_fdt_add_subnode(vms->fdt, "/intc/its");
-    qemu_fdt_setprop_string(vms->fdt, "/intc/its", "compatible",
+    nodename = g_strdup_printf("/intc/its@%" PRIx64,
+                               vms->memmap[VIRT_GIC_ITS].base);
+    qemu_fdt_add_subnode(vms->fdt, nodename);
+    qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
                             "arm,gic-v3-its");
-    qemu_fdt_setprop(vms->fdt, "/intc/its", "msi-controller", NULL, 0);
-    qemu_fdt_setprop_sized_cells(vms->fdt, "/intc/its", "reg",
+    qemu_fdt_setprop(vms->fdt, nodename, "msi-controller", NULL, 0);
+    qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
                                  2, vms->memmap[VIRT_GIC_ITS].base,
                                  2, vms->memmap[VIRT_GIC_ITS].size);
-    qemu_fdt_setprop_cell(vms->fdt, "/intc/its", "phandle", vms->msi_phandle);
+    qemu_fdt_setprop_cell(vms->fdt, nodename, "phandle", vms->msi_phandle);
+    g_free(nodename);
 }
 
 static void fdt_add_v2m_gic_node(VirtMachineState *vms)
 {
+    char *nodename;
+
+    nodename = g_strdup_printf("/intc/v2m@%" PRIx64,
+                               vms->memmap[VIRT_GIC_V2M].base);
     vms->msi_phandle = qemu_fdt_alloc_phandle(vms->fdt);
-    qemu_fdt_add_subnode(vms->fdt, "/intc/v2m");
-    qemu_fdt_setprop_string(vms->fdt, "/intc/v2m", "compatible",
+    qemu_fdt_add_subnode(vms->fdt, nodename);
+    qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
                             "arm,gic-v2m-frame");
-    qemu_fdt_setprop(vms->fdt, "/intc/v2m", "msi-controller", NULL, 0);
-    qemu_fdt_setprop_sized_cells(vms->fdt, "/intc/v2m", "reg",
+    qemu_fdt_setprop(vms->fdt, nodename, "msi-controller", NULL, 0);
+    qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
                                  2, vms->memmap[VIRT_GIC_V2M].base,
                                  2, vms->memmap[VIRT_GIC_V2M].size);
-    qemu_fdt_setprop_cell(vms->fdt, "/intc/v2m", "phandle", vms->msi_phandle);
+    qemu_fdt_setprop_cell(vms->fdt, nodename, "phandle", vms->msi_phandle);
+    g_free(nodename);
 }
 
 static void fdt_add_gic_node(VirtMachineState *vms)
 {
+    char *nodename;
+
     vms->gic_phandle = qemu_fdt_alloc_phandle(vms->fdt);
     qemu_fdt_setprop_cell(vms->fdt, "/", "interrupt-parent", vms->gic_phandle);
 
-    qemu_fdt_add_subnode(vms->fdt, "/intc");
-    qemu_fdt_setprop_cell(vms->fdt, "/intc", "#interrupt-cells", 3);
-    qemu_fdt_setprop(vms->fdt, "/intc", "interrupt-controller", NULL, 0);
-    qemu_fdt_setprop_cell(vms->fdt, "/intc", "#address-cells", 0x2);
-    qemu_fdt_setprop_cell(vms->fdt, "/intc", "#size-cells", 0x2);
-    qemu_fdt_setprop(vms->fdt, "/intc", "ranges", NULL, 0);
+    nodename = g_strdup_printf("/intc@%" PRIx64,
+                               vms->memmap[VIRT_GIC_DIST].base);
+    qemu_fdt_add_subnode(vms->fdt, nodename);
+    qemu_fdt_setprop_cell(vms->fdt, nodename, "#interrupt-cells", 3);
+    qemu_fdt_setprop(vms->fdt, nodename, "interrupt-controller", NULL, 0);
+    qemu_fdt_setprop_cell(vms->fdt, nodename, "#address-cells", 0x2);
+    qemu_fdt_setprop_cell(vms->fdt, nodename, "#size-cells", 0x2);
+    qemu_fdt_setprop(vms->fdt, nodename, "ranges", NULL, 0);
     if (vms->gic_version == 3) {
         int nb_redist_regions = virt_gicv3_redist_region_count(vms);
 
-        qemu_fdt_setprop_string(vms->fdt, "/intc", "compatible",
+        qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
                                 "arm,gic-v3");
 
-        qemu_fdt_setprop_cell(vms->fdt, "/intc",
+        qemu_fdt_setprop_cell(vms->fdt, nodename,
                               "#redistributor-regions", nb_redist_regions);
 
         if (nb_redist_regions == 1) {
-            qemu_fdt_setprop_sized_cells(vms->fdt, "/intc", "reg",
+            qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
                                          2, vms->memmap[VIRT_GIC_DIST].base,
                                          2, vms->memmap[VIRT_GIC_DIST].size,
                                          2, vms->memmap[VIRT_GIC_REDIST].base,
                                          2, vms->memmap[VIRT_GIC_REDIST].size);
         } else {
-            qemu_fdt_setprop_sized_cells(vms->fdt, "/intc", "reg",
+            qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
                                          2, vms->memmap[VIRT_GIC_DIST].base,
                                          2, vms->memmap[VIRT_GIC_DIST].size,
                                          2, vms->memmap[VIRT_GIC_REDIST].base,
@@ -XXX,XX +XXX,XX @@ static void fdt_add_gic_node(VirtMachineState *vms)
         }
 
         if (vms->virt) {
-            qemu_fdt_setprop_cells(vms->fdt, "/intc", "interrupts",
+            qemu_fdt_setprop_cells(vms->fdt, nodename, "interrupts",
                                    GIC_FDT_IRQ_TYPE_PPI, ARCH_GICV3_MAINT_IRQ,
                                    GIC_FDT_IRQ_FLAGS_LEVEL_HI);
         }
     } else {
         /* 'cortex-a15-gic' means 'GIC v2' */
-        qemu_fdt_setprop_string(vms->fdt, "/intc", "compatible",
+        qemu_fdt_setprop_string(vms->fdt, nodename, "compatible",
                                 "arm,cortex-a15-gic");
-        qemu_fdt_setprop_sized_cells(vms->fdt, "/intc", "reg",
+        qemu_fdt_setprop_sized_cells(vms->fdt, nodename, "reg",
                                       2, vms->memmap[VIRT_GIC_DIST].base,
                                       2, vms->memmap[VIRT_GIC_DIST].size,
                                       2, vms->memmap[VIRT_GIC_CPU].base,
                                       2, vms->memmap[VIRT_GIC_CPU].size);
     }
 
-    qemu_fdt_setprop_cell(vms->fdt, "/intc", "phandle", vms->gic_phandle);
+    qemu_fdt_setprop_cell(vms->fdt, nodename, "phandle", vms->gic_phandle);
+    g_free(nodename);
 }
 
 static void fdt_add_pmu_nodes(const VirtMachineState *vms)
-- 
2.17.1

From: Eric Auger <eric.auger@redhat.com>

When running dtc on the guest /proc/device-tree we get the
following warning: Warning (unit_address_vs_reg): Node /memory
has a reg or ranges property, but no unit name".

Let's fix that by adding the unit address to the node name. We also
don't create the /memory node anymore in create_fdt(). We directly
create it in load_dtb. /chosen still needs to be created in create_fdt
as the uart needs it. In case the user provided his own dtb, we nop
all memory nodes found in root and create new one(s).

Signed-off-by: Eric Auger <eric.auger@redhat.com>
Message-id: 1530044492-24921-4-git-send-email-eric.auger@redhat.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/boot.c | 41 +++++++++++++++++++++++------------------
 hw/arm/virt.c |  7 +------
 2 files changed, 24 insertions(+), 24 deletions(-)

diff --git a/hw/arm/boot.c b/hw/arm/boot.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/boot.c
+++ b/hw/arm/boot.c
@@ -XXX,XX +XXX,XX @@ int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
                  hwaddr addr_limit, AddressSpace *as)
 {
     void *fdt = NULL;
-    int size, rc;
+    int size, rc, n = 0;
     uint32_t acells, scells;
     char *nodename;
     unsigned int i;
     hwaddr mem_base, mem_len;
+    char **node_path;
+    Error *err = NULL;
 
     if (binfo->dtb_filename) {
         char *filename;
@@ -XXX,XX +XXX,XX @@ int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
         goto fail;
     }
 
+    /* nop all root nodes matching /memory or /memory@unit-address */
+    node_path = qemu_fdt_node_unit_path(fdt, "memory", &err);
+    if (err) {
+        error_report_err(err);
+        goto fail;
+    }
+    while (node_path[n]) {
+        if (g_str_has_prefix(node_path[n], "/memory")) {
+            qemu_fdt_nop_node(fdt, node_path[n]);
+        }
+        n++;
+    }
+    g_strfreev(node_path);
+
     if (nb_numa_nodes > 0) {
-        /*
-         * Turn the /memory node created before into a NOP node, then create
-         * /memory@addr nodes for all numa nodes respectively.
-         */
-        qemu_fdt_nop_node(fdt, "/memory");
         mem_base = binfo->loader_start;
         for (i = 0; i < nb_numa_nodes; i++) {
             mem_len = numa_info[i].node_mem;
@@ -XXX,XX +XXX,XX @@ int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
             g_free(nodename);
         }
     } else {
-        Error *err = NULL;
+        nodename = g_strdup_printf("/memory@%" PRIx64, binfo->loader_start);
+        qemu_fdt_add_subnode(fdt, nodename);
+        qemu_fdt_setprop_string(fdt, nodename, "device_type", "memory");
 
-        rc = fdt_path_offset(fdt, "/memory");
-        if (rc < 0) {
-            qemu_fdt_add_subnode(fdt, "/memory");
-        }
-
-        if (!qemu_fdt_getprop(fdt, "/memory", "device_type", NULL, &err)) {
-            qemu_fdt_setprop_string(fdt, "/memory", "device_type", "memory");
-        }
-
-        rc = qemu_fdt_setprop_sized_cells(fdt, "/memory", "reg",
+        rc = qemu_fdt_setprop_sized_cells(fdt, nodename, "reg",
                                           acells, binfo->loader_start,
                                           scells, binfo->ram_size);
         if (rc < 0) {
-            fprintf(stderr, "couldn't set /memory/reg\n");
+            fprintf(stderr, "couldn't set %s reg\n", nodename);
             goto fail;
         }
+        g_free(nodename);
     }
 
     rc = fdt_path_offset(fdt, "/chosen");
diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void create_fdt(VirtMachineState *vms)
     qemu_fdt_setprop_cell(fdt, "/", "#address-cells", 0x2);
     qemu_fdt_setprop_cell(fdt, "/", "#size-cells", 0x2);
 
-    /*
-     * /chosen and /memory nodes must exist for load_dtb
-     * to fill in necessary properties later
-     */
+    /* /chosen must exist for load_dtb to fill in necessary properties later */
     qemu_fdt_add_subnode(fdt, "/chosen");
-    qemu_fdt_add_subnode(fdt, "/memory");
-    qemu_fdt_setprop_string(fdt, "/memory", "device_type", "memory");
 
     /* Clock node, for the benefit of the UART. The kernel device tree
      * binding documentation claims the PL011 node clock properties are
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  35 +++++++++
 target/arm/sve_helper.c    | 153 +++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 121 +++++++++++++++++++++++++++++
 target/arm/sve.decode      |  34 +++++++++
 4 files changed, 343 insertions(+)

diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-sve.h
+++ b/target/arm/helper-sve.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_rsqrts_s, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_rsqrts_d, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld4bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld2hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld3hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld4hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld2ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld3ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld4ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld2dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld3dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld4dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1bhu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1bsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1bdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1bhs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1bss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1bds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1hsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1hdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1hss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ld1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ld1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve_helper.c
+++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(sve_while)(void *vd, uint32_t count, uint32_t pred_desc)
 
     return predtest_ones(d, oprsz, esz_mask);
 }
+
+/*
+ * Load contiguous data, protected by a governing predicate.
+ */
+#define DO_LD1(NAME, FN, TYPEE, TYPEM, H)                  \
+static void do_##NAME(CPUARMState *env, void *vd, void *vg, \
+                      target_ulong addr, intptr_t oprsz,   \
+                      uintptr_t ra)                        \
+{                                                          \
+    intptr_t i = 0;                                        \
+    do {                                                   \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            TYPEM m = 0;                                   \
+            if (pg & 1) {                                  \
+                m = FN(env, addr, ra);                     \
+            }                                              \
+            *(TYPEE *)(vd + H(i)) = m;                     \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += sizeof(TYPEM);                         \
+        } while (i & 15);                                  \
+    } while (i < oprsz);                                   \
+}                                                          \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    do_##NAME(env, &env->vfp.zregs[simd_data(desc)], vg,   \
+              addr, simd_oprsz(desc), GETPC());            \
+}
+
+#define DO_LD2(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *d1 = &env->vfp.zregs[rd];                        \
+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            TYPEM m1 = 0, m2 = 0;                          \
+            if (pg & 1) {                                  \
+                m1 = FN(env, addr, ra);                    \
+                m2 = FN(env, addr + sizeof(TYPEM), ra);    \
+            }                                              \
+            *(TYPEE *)(d1 + H(i)) = m1;                    \
+            *(TYPEE *)(d2 + H(i)) = m2;                    \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += 2 * sizeof(TYPEM);                     \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+#define DO_LD3(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *d1 = &env->vfp.zregs[rd];                        \
+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            TYPEM m1 = 0, m2 = 0, m3 = 0;                  \
+            if (pg & 1) {                                  \
+                m1 = FN(env, addr, ra);                    \
+                m2 = FN(env, addr + sizeof(TYPEM), ra);    \
+                m3 = FN(env, addr + 2 * sizeof(TYPEM), ra); \
+            }                                              \
+            *(TYPEE *)(d1 + H(i)) = m1;                    \
+            *(TYPEE *)(d2 + H(i)) = m2;                    \
+            *(TYPEE *)(d3 + H(i)) = m3;                    \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += 3 * sizeof(TYPEM);                     \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+#define DO_LD4(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *d1 = &env->vfp.zregs[rd];                        \
+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
+    void *d4 = &env->vfp.zregs[(rd + 3) & 31];             \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            TYPEM m1 = 0, m2 = 0, m3 = 0, m4 = 0;          \
+            if (pg & 1) {                                  \
+                m1 = FN(env, addr, ra);                    \
+                m2 = FN(env, addr + sizeof(TYPEM), ra);    \
+                m3 = FN(env, addr + 2 * sizeof(TYPEM), ra); \
+                m4 = FN(env, addr + 3 * sizeof(TYPEM), ra); \
+            }                                              \
+            *(TYPEE *)(d1 + H(i)) = m1;                    \
+            *(TYPEE *)(d2 + H(i)) = m2;                    \
+            *(TYPEE *)(d3 + H(i)) = m3;                    \
+            *(TYPEE *)(d4 + H(i)) = m4;                    \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += 4 * sizeof(TYPEM);                     \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+DO_LD1(sve_ld1bhu_r, cpu_ldub_data_ra, uint16_t, uint8_t, H1_2)
+DO_LD1(sve_ld1bhs_r, cpu_ldsb_data_ra, uint16_t, int8_t, H1_2)
+DO_LD1(sve_ld1bsu_r, cpu_ldub_data_ra, uint32_t, uint8_t, H1_4)
+DO_LD1(sve_ld1bss_r, cpu_ldsb_data_ra, uint32_t, int8_t, H1_4)
+DO_LD1(sve_ld1bdu_r, cpu_ldub_data_ra, uint64_t, uint8_t, )
+DO_LD1(sve_ld1bds_r, cpu_ldsb_data_ra, uint64_t, int8_t, )
+
+DO_LD1(sve_ld1hsu_r, cpu_lduw_data_ra, uint32_t, uint16_t, H1_4)
+DO_LD1(sve_ld1hss_r, cpu_ldsw_data_ra, uint32_t, int8_t, H1_4)
+DO_LD1(sve_ld1hdu_r, cpu_lduw_data_ra, uint64_t, uint16_t, )
+DO_LD1(sve_ld1hds_r, cpu_ldsw_data_ra, uint64_t, int16_t, )
+
+DO_LD1(sve_ld1sdu_r, cpu_ldl_data_ra, uint64_t, uint32_t, )
+DO_LD1(sve_ld1sds_r, cpu_ldl_data_ra, uint64_t, int32_t, )
+
+DO_LD1(sve_ld1bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
+DO_LD2(sve_ld2bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
+DO_LD3(sve_ld3bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
+DO_LD4(sve_ld4bb_r, cpu_ldub_data_ra, uint8_t, uint8_t, H1)
+
+DO_LD1(sve_ld1hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
+DO_LD2(sve_ld2hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
+DO_LD3(sve_ld3hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
+DO_LD4(sve_ld4hh_r, cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
+
+DO_LD1(sve_ld1ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
+DO_LD2(sve_ld2ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
+DO_LD3(sve_ld3ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
+DO_LD4(sve_ld4ss_r, cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
+
+DO_LD1(sve_ld1dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
+DO_LD2(sve_ld2dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
+DO_LD3(sve_ld3dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
+DO_LD4(sve_ld4dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
+
+#undef DO_LD1
+#undef DO_LD2
+#undef DO_LD3
+#undef DO_LD4
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ typedef void gen_helper_gvec_flags_3(TCGv_i32, TCGv_ptr, TCGv_ptr,
 typedef void gen_helper_gvec_flags_4(TCGv_i32, TCGv_ptr, TCGv_ptr,
                                      TCGv_ptr, TCGv_ptr, TCGv_i32);
 
+typedef void gen_helper_gvec_mem(TCGv_env, TCGv_ptr, TCGv_i64, TCGv_i32);
+
 /*
  * Helpers for extracting complex instruction fields.
  */
@@ -XXX,XX +XXX,XX @@ static inline int expand_imm_sh8u(int x)
     return (uint8_t)x << (x & 0x100 ? 8 : 0);
 }
 
+/* Convert a 2-bit memory size (msz) to a 4-bit data type (dtype)
+ * with unsigned data.  C.f. SVE Memory Contiguous Load Group.
+ */
+static inline int msz_dtype(int msz)
+{
+    static const uint8_t dtype[4] = { 0, 5, 10, 15 };
+    return dtype[msz];
+}
+
 /*
  * Include the generated decoder.
  */
@@ -XXX,XX +XXX,XX @@ static bool trans_LDR_pri(DisasContext *s, arg_rri *a, uint32_t insn)
     }
     return true;
 }
+
+/*
+ *** SVE Memory - Contiguous Load Group
+ */
+
+/* The memory mode of the dtype.  */
+static const TCGMemOp dtype_mop[16] = {
+    MO_UB, MO_UB, MO_UB, MO_UB,
+    MO_SL, MO_UW, MO_UW, MO_UW,
+    MO_SW, MO_SW, MO_UL, MO_UL,
+    MO_SB, MO_SB, MO_SB, MO_Q
+};
+
+#define dtype_msz(x)  (dtype_mop[x] & MO_SIZE)
+
+/* The vector element size of dtype.  */
+static const uint8_t dtype_esz[16] = {
+    0, 1, 2, 3,
+    3, 1, 2, 3,
+    3, 2, 2, 3,
+    3, 2, 1, 3
+};
+
+static void do_mem_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
+                       gen_helper_gvec_mem *fn)
+{
+    unsigned vsz = vec_full_reg_size(s);
+    TCGv_ptr t_pg;
+    TCGv_i32 desc;
+
+    /* For e.g. LD4, there are not enough arguments to pass all 4
+     * registers as pointers, so encode the regno into the data field.
+     * For consistency, do this even for LD1.
+     */
+    desc = tcg_const_i32(simd_desc(vsz, vsz, zt));
+    t_pg = tcg_temp_new_ptr();
+
+    tcg_gen_addi_ptr(t_pg, cpu_env, pred_full_reg_offset(s, pg));
+    fn(cpu_env, t_pg, addr, desc);
+
+    tcg_temp_free_ptr(t_pg);
+    tcg_temp_free_i32(desc);
+}
+
+static void do_ld_zpa(DisasContext *s, int zt, int pg,
+                      TCGv_i64 addr, int dtype, int nreg)
+{
+    static gen_helper_gvec_mem * const fns[16][4] = {
+        { gen_helper_sve_ld1bb_r, gen_helper_sve_ld2bb_r,
+          gen_helper_sve_ld3bb_r, gen_helper_sve_ld4bb_r },
+        { gen_helper_sve_ld1bhu_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1bsu_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1bdu_r, NULL, NULL, NULL },
+
+        { gen_helper_sve_ld1sds_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1hh_r, gen_helper_sve_ld2hh_r,
+          gen_helper_sve_ld3hh_r, gen_helper_sve_ld4hh_r },
+        { gen_helper_sve_ld1hsu_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1hdu_r, NULL, NULL, NULL },
+
+        { gen_helper_sve_ld1hds_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1hss_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1ss_r, gen_helper_sve_ld2ss_r,
+          gen_helper_sve_ld3ss_r, gen_helper_sve_ld4ss_r },
+        { gen_helper_sve_ld1sdu_r, NULL, NULL, NULL },
+
+        { gen_helper_sve_ld1bds_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1bss_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1bhs_r, NULL, NULL, NULL },
+        { gen_helper_sve_ld1dd_r, gen_helper_sve_ld2dd_r,
+          gen_helper_sve_ld3dd_r, gen_helper_sve_ld4dd_r },
+    };
+    gen_helper_gvec_mem *fn = fns[dtype][nreg];
+
+    /* While there are holes in the table, they are not
+     * accessible via the instruction encoding.
+     */
+    assert(fn != NULL);
+    do_mem_zpa(s, zt, pg, addr, fn);
+}
+
+static bool trans_LD_zprr(DisasContext *s, arg_rprr_load *a, uint32_t insn)
+{
+    if (a->rm == 31) {
+        return false;
+    }
+    if (sve_access_check(s)) {
+        TCGv_i64 addr = new_tmp_a64(s);
+        tcg_gen_muli_i64(addr, cpu_reg(s, a->rm),
+                         (a->nreg + 1) << dtype_msz(a->dtype));
+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
+        do_ld_zpa(s, a->rd, a->pg, addr, a->dtype, a->nreg);
+    }
+    return true;
+}
+
+static bool trans_LD_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
+{
+    if (sve_access_check(s)) {
+        int vsz = vec_full_reg_size(s);
+        int elements = vsz >> dtype_esz[a->dtype];
+        TCGv_i64 addr = new_tmp_a64(s);
+
+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn),
+                         (a->imm * elements * (a->nreg + 1))
+                         << dtype_msz(a->dtype));
+        do_ld_zpa(s, a->rd, a->pg, addr, a->dtype, a->nreg);
+    }
+    return true;
+}
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
 # Unsigned 8-bit immediate, optionally shifted left by 8.
 %sh8_i8u        5:9 !function=expand_imm_sh8u
 
+# Unsigned load of msz into esz=2, represented as a dtype.
+%msz_dtype      23:2 !function=msz_dtype
+
 # Either a copy of rd (at bit 0), or a different source
 # as propagated via the MOVPRFX instruction.
 %reg_movprfx    0:5
@@ -XXX,XX +XXX,XX @@
 &incdec2_cnt    rd rn pat esz imm d u
 &incdec_pred    rd pg esz d u
 &incdec2_pred   rd rn pg esz d u
+&rprr_load      rd pg rn rm dtype nreg
+&rpri_load      rd pg rn imm dtype nreg
 
 ###########################################################################
 # Named instruction formats.  These are generally used to
@@ -XXX,XX +XXX,XX @@
 @incdec2_pred   ........ esz:2 .... .. ..... .. pg:4 rd:5 \
                 &incdec2_pred rn=%reg_movprfx
 
+# Loads; user must fill in NREG.
+@rprr_load_dt   ....... dtype:4 rm:5 ... pg:3 rn:5 rd:5         &rprr_load
+@rpri_load_dt   ....... dtype:4 . imm:s4 ... pg:3 rn:5 rd:5     &rpri_load
+
+@rprr_load_msz  ....... .... rm:5 ... pg:3 rn:5 rd:5 \
+                &rprr_load dtype=%msz_dtype
+@rpri_load_msz  ....... .... . imm:s4 ... pg:3 rn:5 rd:5 \
+                &rpri_load dtype=%msz_dtype
+
 ###########################################################################
 # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
 
@@ -XXX,XX +XXX,XX @@ LDR_pri         10000101 10 ...... 000 ... ..... 0 ....         @pd_rn_i9
 
 # SVE load vector register
 LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
+
+### SVE Memory Contiguous Load Group
+
+# SVE contiguous load (scalar plus scalar)
+LD_zprr         1010010 .... ..... 010 ... ..... .....    @rprr_load_dt nreg=0
+
+# SVE contiguous load (scalar plus immediate)
+LD_zpri         1010010 .... 0.... 101 ... ..... .....    @rpri_load_dt nreg=0
+
+# SVE contiguous non-temporal load (scalar plus scalar)
+# LDNT1B, LDNT1H, LDNT1W, LDNT1D
+# SVE load multiple structures (scalar plus scalar)
+# LD2B, LD2H, LD2W, LD2D; etc.
+LD_zprr         1010010 .. nreg:2 ..... 110 ... ..... .....     @rprr_load_msz
+
+# SVE contiguous non-temporal load (scalar plus immediate)
+# LDNT1B, LDNT1H, LDNT1W, LDNT1D
+# SVE load multiple structures (scalar plus immediate)
+# LD2B, LD2H, LD2W, LD2D; etc.
+LD_zpri         1010010 .. nreg:2 0.... 111 ... ..... .....     @rpri_load_msz
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Tested-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180627043328.11531-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  40 ++++++++++
 target/arm/sve_helper.c    | 157 +++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c |  69 ++++++++++++++++
 target/arm/sve.decode      |   6 ++
 4 files changed, 272 insertions(+)

diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-sve.h
+++ b/target/arm/helper-sve.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_ld1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
 
 DEF_HELPER_FLAGS_4(sve_ld1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
 DEF_HELPER_FLAGS_4(sve_ld1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldff1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1bhu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1bsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1bdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1bhs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1bss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1bds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldff1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1hsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1hdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1hss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldff1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldff1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldff1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldnf1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1bhu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1bsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1bdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1bhs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1bss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1bds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldnf1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1hsu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1hdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1hss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1hds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldnf1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_ldnf1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_ldnf1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve_helper.c
+++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ DO_LD4(sve_ld4dd_r, cpu_ldq_data_ra, uint64_t, uint64_t, )
 #undef DO_LD2
 #undef DO_LD3
 #undef DO_LD4
+
+/*
+ * Load contiguous data, first-fault and no-fault.
+ */
+
+#ifdef CONFIG_USER_ONLY
+
+/* Fault on byte I.  All bits in FFR from I are cleared.  The vector
+ * result from I is CONSTRAINED UNPREDICTABLE; we choose the MERGE
+ * option, which leaves subsequent data unchanged.
+ */
+static void record_fault(CPUARMState *env, uintptr_t i, uintptr_t oprsz)
+{
+    uint64_t *ffr = env->vfp.pregs[FFR_PRED_NUM].p;
+
+    if (i & 63) {
+        ffr[i / 64] &= MAKE_64BIT_MASK(0, i & 63);
+        i = ROUND_UP(i, 64);
+    }
+    for (; i < oprsz; i += 64) {
+        ffr[i / 64] = 0;
+    }
+}
+
+/* Hold the mmap lock during the operation so that there is no race
+ * between page_check_range and the load operation.  We expect the
+ * usual case to have no faults at all, so we check the whole range
+ * first and if successful defer to the normal load operation.
+ *
+ * TODO: Change mmap_lock to a rwlock so that multiple readers
+ * can run simultaneously.  This will probably help other uses
+ * within QEMU as well.
+ */
+#define DO_LDFF1(PART, FN, TYPEE, TYPEM, H)                             \
+static void do_sve_ldff1##PART(CPUARMState *env, void *vd, void *vg,    \
+                               target_ulong addr, intptr_t oprsz,       \
+                               bool first, uintptr_t ra)                \
+{                                                                       \
+    intptr_t i = 0;                                                     \
+    do {                                                                \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
+        do {                                                            \
+            TYPEM m = 0;                                                \
+            if (pg & 1) {                                               \
+                if (!first &&                                           \
+                    unlikely(page_check_range(addr, sizeof(TYPEM),      \
+                                              PAGE_READ))) {            \
+                    record_fault(env, i, oprsz);                        \
+                    return;                                             \
+                }                                                       \
+                m = FN(env, addr, ra);                                  \
+                first = false;                                          \
+            }                                                           \
+            *(TYPEE *)(vd + H(i)) = m;                                  \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);                   \
+            addr += sizeof(TYPEM);                                      \
+        } while (i & 15);                                               \
+    } while (i < oprsz);                                                \
+}                                                                       \
+void HELPER(sve_ldff1##PART)(CPUARMState *env, void *vg,                \
+                             target_ulong addr, uint32_t desc)          \
+{                                                                       \
+    intptr_t oprsz = simd_oprsz(desc);                                  \
+    unsigned rd = simd_data(desc);                                      \
+    void *vd = &env->vfp.zregs[rd];                                     \
+    mmap_lock();                                                        \
+    if (likely(page_check_range(addr, oprsz, PAGE_READ) == 0)) {        \
+        do_sve_ld1##PART(env, vd, vg, addr, oprsz, GETPC());            \
+    } else {                                                            \
+        do_sve_ldff1##PART(env, vd, vg, addr, oprsz, true, GETPC());    \
+    }                                                                   \
+    mmap_unlock();                                                      \
+}
+
+/* No-fault loads are like first-fault loads without the
+ * first faulting special case.
+ */
+#define DO_LDNF1(PART)                                                  \
+void HELPER(sve_ldnf1##PART)(CPUARMState *env, void *vg,                \
+                             target_ulong addr, uint32_t desc)          \
+{                                                                       \
+    intptr_t oprsz = simd_oprsz(desc);                                  \
+    unsigned rd = simd_data(desc);                                      \
+    void *vd = &env->vfp.zregs[rd];                                     \
+    mmap_lock();                                                        \
+    if (likely(page_check_range(addr, oprsz, PAGE_READ) == 0)) {        \
+        do_sve_ld1##PART(env, vd, vg, addr, oprsz, GETPC());            \
+    } else {                                                            \
+        do_sve_ldff1##PART(env, vd, vg, addr, oprsz, false, GETPC());   \
+    }                                                                   \
+    mmap_unlock();                                                      \
+}
+
+#else
+
+/* TODO: System mode is not yet supported.
+ * This would probably use tlb_vaddr_to_host.
+ */
+#define DO_LDFF1(PART, FN, TYPEE, TYPEM, H)                     \
+void HELPER(sve_ldff1##PART)(CPUARMState *env, void *vg,        \
+                  target_ulong addr, uint32_t desc)             \
+{                                                               \
+    g_assert_not_reached();                                     \
+}
+
+#define DO_LDNF1(PART)                                          \
+void HELPER(sve_ldnf1##PART)(CPUARMState *env, void *vg,        \
+                  target_ulong addr, uint32_t desc)             \
+{                                                               \
+    g_assert_not_reached();                                     \
+}
+
+#endif
+
+DO_LDFF1(bb_r,  cpu_ldub_data_ra, uint8_t, uint8_t, H1)
+DO_LDFF1(bhu_r, cpu_ldub_data_ra, uint16_t, uint8_t, H1_2)
+DO_LDFF1(bhs_r, cpu_ldsb_data_ra, uint16_t, int8_t, H1_2)
+DO_LDFF1(bsu_r, cpu_ldub_data_ra, uint32_t, uint8_t, H1_4)
+DO_LDFF1(bss_r, cpu_ldsb_data_ra, uint32_t, int8_t, H1_4)
+DO_LDFF1(bdu_r, cpu_ldub_data_ra, uint64_t, uint8_t, )
+DO_LDFF1(bds_r, cpu_ldsb_data_ra, uint64_t, int8_t, )
+
+DO_LDFF1(hh_r,  cpu_lduw_data_ra, uint16_t, uint16_t, H1_2)
+DO_LDFF1(hsu_r, cpu_lduw_data_ra, uint32_t, uint16_t, H1_4)
+DO_LDFF1(hss_r, cpu_ldsw_data_ra, uint32_t, int8_t, H1_4)
+DO_LDFF1(hdu_r, cpu_lduw_data_ra, uint64_t, uint16_t, )
+DO_LDFF1(hds_r, cpu_ldsw_data_ra, uint64_t, int16_t, )
+
+DO_LDFF1(ss_r,  cpu_ldl_data_ra, uint32_t, uint32_t, H1_4)
+DO_LDFF1(sdu_r, cpu_ldl_data_ra, uint64_t, uint32_t, )
+DO_LDFF1(sds_r, cpu_ldl_data_ra, uint64_t, int32_t, )
+
+DO_LDFF1(dd_r,  cpu_ldq_data_ra, uint64_t, uint64_t, )
+
+#undef DO_LDFF1
+
+DO_LDNF1(bb_r)
+DO_LDNF1(bhu_r)
+DO_LDNF1(bhs_r)
+DO_LDNF1(bsu_r)
+DO_LDNF1(bss_r)
+DO_LDNF1(bdu_r)
+DO_LDNF1(bds_r)
+
+DO_LDNF1(hh_r)
+DO_LDNF1(hsu_r)
+DO_LDNF1(hss_r)
+DO_LDNF1(hdu_r)
+DO_LDNF1(hds_r)
+
+DO_LDNF1(ss_r)
+DO_LDNF1(sdu_r)
+DO_LDNF1(sds_r)
+
+DO_LDNF1(dd_r)
+
+#undef DO_LDNF1
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_LD_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
     }
     return true;
 }
+
+static bool trans_LDFF1_zprr(DisasContext *s, arg_rprr_load *a, uint32_t insn)
+{
+    static gen_helper_gvec_mem * const fns[16] = {
+        gen_helper_sve_ldff1bb_r,
+        gen_helper_sve_ldff1bhu_r,
+        gen_helper_sve_ldff1bsu_r,
+        gen_helper_sve_ldff1bdu_r,
+
+        gen_helper_sve_ldff1sds_r,
+        gen_helper_sve_ldff1hh_r,
+        gen_helper_sve_ldff1hsu_r,
+        gen_helper_sve_ldff1hdu_r,
+
+        gen_helper_sve_ldff1hds_r,
+        gen_helper_sve_ldff1hss_r,
+        gen_helper_sve_ldff1ss_r,
+        gen_helper_sve_ldff1sdu_r,
+
+        gen_helper_sve_ldff1bds_r,
+        gen_helper_sve_ldff1bss_r,
+        gen_helper_sve_ldff1bhs_r,
+        gen_helper_sve_ldff1dd_r,
+    };
+
+    if (sve_access_check(s)) {
+        TCGv_i64 addr = new_tmp_a64(s);
+        tcg_gen_shli_i64(addr, cpu_reg(s, a->rm), dtype_msz(a->dtype));
+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
+        do_mem_zpa(s, a->rd, a->pg, addr, fns[a->dtype]);
+    }
+    return true;
+}
+
+static bool trans_LDNF1_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
+{
+    static gen_helper_gvec_mem * const fns[16] = {
+        gen_helper_sve_ldnf1bb_r,
+        gen_helper_sve_ldnf1bhu_r,
+        gen_helper_sve_ldnf1bsu_r,
+        gen_helper_sve_ldnf1bdu_r,
+
+        gen_helper_sve_ldnf1sds_r,
+        gen_helper_sve_ldnf1hh_r,
+        gen_helper_sve_ldnf1hsu_r,
+        gen_helper_sve_ldnf1hdu_r,
+
+        gen_helper_sve_ldnf1hds_r,
+        gen_helper_sve_ldnf1hss_r,
+        gen_helper_sve_ldnf1ss_r,
+        gen_helper_sve_ldnf1sdu_r,
+
+        gen_helper_sve_ldnf1bds_r,
+        gen_helper_sve_ldnf1bss_r,
+        gen_helper_sve_ldnf1bhs_r,
+        gen_helper_sve_ldnf1dd_r,
+    };
+
+    if (sve_access_check(s)) {
+        int vsz = vec_full_reg_size(s);
+        int elements = vsz >> dtype_esz[a->dtype];
+        int off = (a->imm * elements) << dtype_msz(a->dtype);
+        TCGv_i64 addr = new_tmp_a64(s);
+
+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn), off);
+        do_mem_zpa(s, a->rd, a->pg, addr, fns[a->dtype]);
+    }
+    return true;
+}
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
 # SVE contiguous load (scalar plus scalar)
 LD_zprr         1010010 .... ..... 010 ... ..... .....    @rprr_load_dt nreg=0
 
+# SVE contiguous first-fault load (scalar plus scalar)
+LDFF1_zprr      1010010 .... ..... 011 ... ..... .....    @rprr_load_dt nreg=0
+
 # SVE contiguous load (scalar plus immediate)
 LD_zpri         1010010 .... 0.... 101 ... ..... .....    @rpri_load_dt nreg=0
 
+# SVE contiguous non-fault load (scalar plus immediate)
+LDNF1_zpri      1010010 .... 1.... 101 ... ..... .....    @rpri_load_dt nreg=0
+
 # SVE contiguous non-temporal load (scalar plus scalar)
 # LDNT1B, LDNT1H, LDNT1W, LDNT1D
 # SVE load multiple structures (scalar plus scalar)
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  29 +++++
 target/arm/sve_helper.c    | 211 +++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c |  65 ++++++++++++
 target/arm/sve.decode      |  38 +++++++
 4 files changed, 343 insertions(+)

diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-sve.h
+++ b/target/arm/helper-sve.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_ldnf1sdu_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
 DEF_HELPER_FLAGS_4(sve_ldnf1sds_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
 
 DEF_HELPER_FLAGS_4(sve_ldnf1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st2bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st3bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st4bb_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st2hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st3hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st4hh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st2ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st3ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st4ss_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st2dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st3dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st4dd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1bh_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st1bs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st1bd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1hs_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+DEF_HELPER_FLAGS_4(sve_st1hd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_4(sve_st1sd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve_helper.c
+++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ DO_LDNF1(sds_r)
 DO_LDNF1(dd_r)
 
 #undef DO_LDNF1
+
+/*
+ * Store contiguous data, protected by a governing predicate.
+ */
+#define DO_ST1(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *vd = &env->vfp.zregs[rd];                        \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            if (pg & 1) {                                  \
+                TYPEM m = *(TYPEE *)(vd + H(i));           \
+                FN(env, addr, m, ra);                      \
+            }                                              \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += sizeof(TYPEM);                         \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+#define DO_ST1_D(NAME, FN, TYPEM)                          \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc) / 8;              \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    uint64_t *d = &env->vfp.zregs[rd].d[0];                \
+    uint8_t *pg = vg;                                      \
+    for (i = 0; i < oprsz; i += 1) {                       \
+        if (pg[H1(i)] & 1) {                               \
+            FN(env, addr, d[i], ra);                       \
+        }                                                  \
+        addr += sizeof(TYPEM);                             \
+    }                                                      \
+}
+
+#define DO_ST2(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *d1 = &env->vfp.zregs[rd];                        \
+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            if (pg & 1) {                                  \
+                TYPEM m1 = *(TYPEE *)(d1 + H(i));          \
+                TYPEM m2 = *(TYPEE *)(d2 + H(i));          \
+                FN(env, addr, m1, ra);                     \
+                FN(env, addr + sizeof(TYPEM), m2, ra);     \
+            }                                              \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += 2 * sizeof(TYPEM);                     \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+#define DO_ST3(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *d1 = &env->vfp.zregs[rd];                        \
+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            if (pg & 1) {                                  \
+                TYPEM m1 = *(TYPEE *)(d1 + H(i));          \
+                TYPEM m2 = *(TYPEE *)(d2 + H(i));          \
+                TYPEM m3 = *(TYPEE *)(d3 + H(i));          \
+                FN(env, addr, m1, ra);                     \
+                FN(env, addr + sizeof(TYPEM), m2, ra);     \
+                FN(env, addr + 2 * sizeof(TYPEM), m3, ra); \
+            }                                              \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += 3 * sizeof(TYPEM);                     \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+#define DO_ST4(NAME, FN, TYPEE, TYPEM, H)                  \
+void HELPER(NAME)(CPUARMState *env, void *vg,              \
+                  target_ulong addr, uint32_t desc)        \
+{                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                  \
+    intptr_t ra = GETPC();                                 \
+    unsigned rd = simd_data(desc);                         \
+    void *d1 = &env->vfp.zregs[rd];                        \
+    void *d2 = &env->vfp.zregs[(rd + 1) & 31];             \
+    void *d3 = &env->vfp.zregs[(rd + 2) & 31];             \
+    void *d4 = &env->vfp.zregs[(rd + 3) & 31];             \
+    for (i = 0; i < oprsz; ) {                             \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));    \
+        do {                                               \
+            if (pg & 1) {                                  \
+                TYPEM m1 = *(TYPEE *)(d1 + H(i));          \
+                TYPEM m2 = *(TYPEE *)(d2 + H(i));          \
+                TYPEM m3 = *(TYPEE *)(d3 + H(i));          \
+                TYPEM m4 = *(TYPEE *)(d4 + H(i));          \
+                FN(env, addr, m1, ra);                     \
+                FN(env, addr + sizeof(TYPEM), m2, ra);     \
+                FN(env, addr + 2 * sizeof(TYPEM), m3, ra); \
+                FN(env, addr + 3 * sizeof(TYPEM), m4, ra); \
+            }                                              \
+            i += sizeof(TYPEE), pg >>= sizeof(TYPEE);      \
+            addr += 4 * sizeof(TYPEM);                     \
+        } while (i & 15);                                  \
+    }                                                      \
+}
+
+DO_ST1(sve_st1bh_r, cpu_stb_data_ra, uint16_t, uint8_t, H1_2)
+DO_ST1(sve_st1bs_r, cpu_stb_data_ra, uint32_t, uint8_t, H1_4)
+DO_ST1_D(sve_st1bd_r, cpu_stb_data_ra, uint8_t)
+
+DO_ST1(sve_st1hs_r, cpu_stw_data_ra, uint32_t, uint16_t, H1_4)
+DO_ST1_D(sve_st1hd_r, cpu_stw_data_ra, uint16_t)
+
+DO_ST1_D(sve_st1sd_r, cpu_stl_data_ra, uint32_t)
+
+DO_ST1(sve_st1bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
+DO_ST2(sve_st2bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
+DO_ST3(sve_st3bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
+DO_ST4(sve_st4bb_r, cpu_stb_data_ra, uint8_t, uint8_t, H1)
+
+DO_ST1(sve_st1hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
+DO_ST2(sve_st2hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
+DO_ST3(sve_st3hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
+DO_ST4(sve_st4hh_r, cpu_stw_data_ra, uint16_t, uint16_t, H1_2)
+
+DO_ST1(sve_st1ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
+DO_ST2(sve_st2ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
+DO_ST3(sve_st3ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
+DO_ST4(sve_st4ss_r, cpu_stl_data_ra, uint32_t, uint32_t, H1_4)
+
+DO_ST1_D(sve_st1dd_r, cpu_stq_data_ra, uint64_t)
+
+void HELPER(sve_st2dd_r)(CPUARMState *env, void *vg,
+                         target_ulong addr, uint32_t desc)
+{
+    intptr_t i, oprsz = simd_oprsz(desc) / 8;
+    intptr_t ra = GETPC();
+    unsigned rd = simd_data(desc);
+    uint64_t *d1 = &env->vfp.zregs[rd].d[0];
+    uint64_t *d2 = &env->vfp.zregs[(rd + 1) & 31].d[0];
+    uint8_t *pg = vg;
+
+    for (i = 0; i < oprsz; i += 1) {
+        if (pg[H1(i)] & 1) {
+            cpu_stq_data_ra(env, addr, d1[i], ra);
+            cpu_stq_data_ra(env, addr + 8, d2[i], ra);
+        }
+        addr += 2 * 8;
+    }
+}
+
+void HELPER(sve_st3dd_r)(CPUARMState *env, void *vg,
+                         target_ulong addr, uint32_t desc)
+{
+    intptr_t i, oprsz = simd_oprsz(desc) / 8;
+    intptr_t ra = GETPC();
+    unsigned rd = simd_data(desc);
+    uint64_t *d1 = &env->vfp.zregs[rd].d[0];
+    uint64_t *d2 = &env->vfp.zregs[(rd + 1) & 31].d[0];
+    uint64_t *d3 = &env->vfp.zregs[(rd + 2) & 31].d[0];
+    uint8_t *pg = vg;
+
+    for (i = 0; i < oprsz; i += 1) {
+        if (pg[H1(i)] & 1) {
+            cpu_stq_data_ra(env, addr, d1[i], ra);
+            cpu_stq_data_ra(env, addr + 8, d2[i], ra);
+            cpu_stq_data_ra(env, addr + 16, d3[i], ra);
+        }
+        addr += 3 * 8;
+    }
+}
+
+void HELPER(sve_st4dd_r)(CPUARMState *env, void *vg,
+                         target_ulong addr, uint32_t desc)
+{
+    intptr_t i, oprsz = simd_oprsz(desc) / 8;
+    intptr_t ra = GETPC();
+    unsigned rd = simd_data(desc);
+    uint64_t *d1 = &env->vfp.zregs[rd].d[0];
+    uint64_t *d2 = &env->vfp.zregs[(rd + 1) & 31].d[0];
+    uint64_t *d3 = &env->vfp.zregs[(rd + 2) & 31].d[0];
+    uint64_t *d4 = &env->vfp.zregs[(rd + 3) & 31].d[0];
+    uint8_t *pg = vg;
+
+    for (i = 0; i < oprsz; i += 1) {
+        if (pg[H1(i)] & 1) {
+            cpu_stq_data_ra(env, addr, d1[i], ra);
+            cpu_stq_data_ra(env, addr + 8, d2[i], ra);
+            cpu_stq_data_ra(env, addr + 16, d3[i], ra);
+            cpu_stq_data_ra(env, addr + 24, d4[i], ra);
+        }
+        addr += 4 * 8;
+    }
+}
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_LDNF1_zpri(DisasContext *s, arg_rpri_load *a, uint32_t insn)
     }
     return true;
 }
+
+static void do_st_zpa(DisasContext *s, int zt, int pg, TCGv_i64 addr,
+                      int msz, int esz, int nreg)
+{
+    static gen_helper_gvec_mem * const fn_single[4][4] = {
+        { gen_helper_sve_st1bb_r, gen_helper_sve_st1bh_r,
+          gen_helper_sve_st1bs_r, gen_helper_sve_st1bd_r },
+        { NULL,                   gen_helper_sve_st1hh_r,
+          gen_helper_sve_st1hs_r, gen_helper_sve_st1hd_r },
+        { NULL, NULL,
+          gen_helper_sve_st1ss_r, gen_helper_sve_st1sd_r },
+        { NULL, NULL, NULL, gen_helper_sve_st1dd_r },
+    };
+    static gen_helper_gvec_mem * const fn_multiple[3][4] = {
+        { gen_helper_sve_st2bb_r, gen_helper_sve_st2hh_r,
+          gen_helper_sve_st2ss_r, gen_helper_sve_st2dd_r },
+        { gen_helper_sve_st3bb_r, gen_helper_sve_st3hh_r,
+          gen_helper_sve_st3ss_r, gen_helper_sve_st3dd_r },
+        { gen_helper_sve_st4bb_r, gen_helper_sve_st4hh_r,
+          gen_helper_sve_st4ss_r, gen_helper_sve_st4dd_r },
+    };
+    gen_helper_gvec_mem *fn;
+
+    if (nreg == 0) {
+        /* ST1 */
+        fn = fn_single[msz][esz];
+    } else {
+        /* ST2, ST3, ST4 -- msz == esz, enforced by encoding */
+        assert(msz == esz);
+        fn = fn_multiple[nreg - 1][msz];
+    }
+    assert(fn != NULL);
+    do_mem_zpa(s, zt, pg, addr, fn);
+}
+
+static bool trans_ST_zprr(DisasContext *s, arg_rprr_store *a, uint32_t insn)
+{
+    if (a->rm == 31 || a->msz > a->esz) {
+        return false;
+    }
+    if (sve_access_check(s)) {
+        TCGv_i64 addr = new_tmp_a64(s);
+        tcg_gen_muli_i64(addr, cpu_reg(s, a->rm), (a->nreg + 1) << a->msz);
+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, a->rn));
+        do_st_zpa(s, a->rd, a->pg, addr, a->msz, a->esz, a->nreg);
+    }
+    return true;
+}
+
+static bool trans_ST_zpri(DisasContext *s, arg_rpri_store *a, uint32_t insn)
+{
+    if (a->msz > a->esz) {
+        return false;
+    }
+    if (sve_access_check(s)) {
+        int vsz = vec_full_reg_size(s);
+        int elements = vsz >> a->esz;
+        TCGv_i64 addr = new_tmp_a64(s);
+
+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, a->rn),
+                         (a->imm * elements * (a->nreg + 1)) << a->msz);
+        do_st_zpa(s, a->rd, a->pg, addr, a->msz, a->esz, a->nreg);
+    }
+    return true;
+}
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
 %imm7_22_16     22:2 16:5
 %imm8_16_10     16:5 10:3
 %imm9_16_10     16:s6 10:3
+%size_23        23:2
 
 # A combination of tsz:imm3 -- extract esize.
 %tszimm_esz     22:2 5:5 !function=tszimm_esz
@@ -XXX,XX +XXX,XX @@
 &incdec2_pred   rd rn pg esz d u
 &rprr_load      rd pg rn rm dtype nreg
 &rpri_load      rd pg rn imm dtype nreg
+&rprr_store     rd pg rn rm msz esz nreg
+&rpri_store     rd pg rn imm msz esz nreg
 
 ###########################################################################
 # Named instruction formats.  These are generally used to
@@ -XXX,XX +XXX,XX @@
 @rpri_load_msz  ....... .... . imm:s4 ... pg:3 rn:5 rd:5 \
                 &rpri_load dtype=%msz_dtype
 
+# Stores; user must fill in ESZ, MSZ, NREG as needed.
+@rprr_store         ....... ..    ..     rm:5 ... pg:3 rn:5 rd:5    &rprr_store
+@rpri_store_msz     ....... msz:2 .. . imm:s4 ... pg:3 rn:5 rd:5    &rpri_store
+@rprr_store_esz_n0  ....... ..    esz:2  rm:5 ... pg:3 rn:5 rd:5 \
+                    &rprr_store nreg=0
+
 ###########################################################################
 # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
 
@@ -XXX,XX +XXX,XX @@ LD_zprr         1010010 .. nreg:2 ..... 110 ... ..... .....     @rprr_load_msz
 # SVE load multiple structures (scalar plus immediate)
 # LD2B, LD2H, LD2W, LD2D; etc.
 LD_zpri         1010010 .. nreg:2 0.... 111 ... ..... .....     @rpri_load_msz
+
+### SVE Memory Store Group
+
+# SVE contiguous store (scalar plus immediate)
+# ST1B, ST1H, ST1W, ST1D; require msz <= esz
+ST_zpri         1110010 .. esz:2  0.... 111 ... ..... ..... \
+                @rpri_store_msz nreg=0
+
+# SVE contiguous store (scalar plus scalar)
+# ST1B, ST1H, ST1W, ST1D; require msz <= esz
+# Enumerate msz lest we conflict with STR_zri.
+ST_zprr         1110010 00 ..     ..... 010 ... ..... ..... \
+                @rprr_store_esz_n0 msz=0
+ST_zprr         1110010 01 ..     ..... 010 ... ..... ..... \
+                @rprr_store_esz_n0 msz=1
+ST_zprr         1110010 10 ..     ..... 010 ... ..... ..... \
+                @rprr_store_esz_n0 msz=2
+ST_zprr         1110010 11 11     ..... 010 ... ..... ..... \
+                @rprr_store msz=3 esz=3 nreg=0
+
+# SVE contiguous non-temporal store (scalar plus immediate)  (nreg == 0)
+# SVE store multiple structures (scalar plus immediate)      (nreg != 0)
+ST_zpri         1110010 .. nreg:2 1.... 111 ... ..... ..... \
+                @rpri_store_msz esz=%size_23
+
+# SVE contiguous non-temporal store (scalar plus scalar)     (nreg == 0)
+# SVE store multiple structures (scalar plus scalar)         (nreg != 0)
+ST_zprr         1110010 msz:2 nreg:2 ..... 011 ... ..... ..... \
+                @rprr_store esz=%size_23
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 52 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  9 +++++++
 2 files changed, 61 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
[PMM: fixed typo]
Message-id: 20180627043328.11531-6-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 30 +++++++++++++
 target/arm/sve_helper.c    | 38 ++++++++++++++++
 target/arm/translate-sve.c | 90 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      | 22 ++++++++++
 4 files changed, 180 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-7-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 77 +++++++++++++++++++++++++++++++++
 target/arm/sve_helper.c    | 89 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 46 ++++++++++++++++++++
 target/arm/sve.decode      | 17 ++++++++
 4 files changed, 229 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180627043328.11531-8-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  16 ++++
 target/arm/sve_helper.c    | 158 +++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c |  49 ++++++++++++
 target/arm/sve.decode      |  18 +++++
 4 files changed, 241 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-9-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  7 +++++
 target/arm/sve_helper.c    | 56 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 45 ++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  5 ++++
 4 files changed, 113 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-10-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  5 +++
 target/arm/sve_helper.c    | 41 +++++++++++++++++++++++++
 target/arm/translate-sve.c | 62 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  5 +++
 4 files changed, 113 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-11-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 103 +++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |   6 +++
 2 files changed, 109 insertions(+)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void do_ldr(DisasContext *s, uint32_t vofs, uint32_t len,
     tcg_temp_free_i64(t0);
 }
 
+/* Similarly for stores.  */
+static void do_str(DisasContext *s, uint32_t vofs, uint32_t len,
+                   int rn, int imm)
+{
+    uint32_t len_align = QEMU_ALIGN_DOWN(len, 8);
+    uint32_t len_remain = len % 8;
+    uint32_t nparts = len / 8 + ctpop8(len_remain);
+    int midx = get_mem_index(s);
+    TCGv_i64 addr, t0;
+
+    addr = tcg_temp_new_i64();
+    t0 = tcg_temp_new_i64();
+
+    /* Note that unpredicated load/store of vector/predicate registers
+     * are defined as a stream of bytes, which equates to little-endian
+     * operations on larger quantities.  There is no nice way to force
+     * a little-endian store for aarch64_be-linux-user out of line.
+     *
+     * Attempt to keep code expansion to a minimum by limiting the
+     * amount of unrolling done.
+     */
+    if (nparts <= 4) {
+        int i;
+
+        for (i = 0; i < len_align; i += 8) {
+            tcg_gen_ld_i64(t0, cpu_env, vofs + i);
+            tcg_gen_addi_i64(addr, cpu_reg_sp(s, rn), imm + i);
+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEQ);
+        }
+    } else {
+        TCGLabel *loop = gen_new_label();
+        TCGv_ptr t2, i = tcg_const_local_ptr(0);
+
+        gen_set_label(loop);
+
+        t2 = tcg_temp_new_ptr();
+        tcg_gen_add_ptr(t2, cpu_env, i);
+        tcg_gen_ld_i64(t0, t2, vofs);
+
+        /* Minimize the number of local temps that must be re-read from
+         * the stack each iteration.  Instead, re-compute values other
+         * than the loop counter.
+         */
+        tcg_gen_addi_ptr(t2, i, imm);
+        tcg_gen_extu_ptr_i64(addr, t2);
+        tcg_gen_add_i64(addr, addr, cpu_reg_sp(s, rn));
+        tcg_temp_free_ptr(t2);
+
+        tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEQ);
+
+        tcg_gen_addi_ptr(i, i, 8);
+
+        tcg_gen_brcondi_ptr(TCG_COND_LTU, i, len_align, loop);
+        tcg_temp_free_ptr(i);
+    }
+
+    /* Predicate register stores can be any multiple of 2.  */
+    if (len_remain) {
+        tcg_gen_ld_i64(t0, cpu_env, vofs + len_align);
+        tcg_gen_addi_i64(addr, cpu_reg_sp(s, rn), imm + len_align);
+
+        switch (len_remain) {
+        case 2:
+        case 4:
+        case 8:
+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LE | ctz32(len_remain));
+            break;
+
+        case 6:
+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEUL);
+            tcg_gen_addi_i64(addr, addr, 4);
+            tcg_gen_shri_i64(t0, t0, 32);
+            tcg_gen_qemu_st_i64(t0, addr, midx, MO_LEUW);
+            break;
+
+        default:
+            g_assert_not_reached();
+        }
+    }
+    tcg_temp_free_i64(addr);
+    tcg_temp_free_i64(t0);
+}
+
 static bool trans_LDR_zri(DisasContext *s, arg_rri *a, uint32_t insn)
 {
     if (sve_access_check(s)) {
@@ -XXX,XX +XXX,XX @@ static bool trans_LDR_pri(DisasContext *s, arg_rri *a, uint32_t insn)
     return true;
 }
 
+static bool trans_STR_zri(DisasContext *s, arg_rri *a, uint32_t insn)
+{
+    if (sve_access_check(s)) {
+        int size = vec_full_reg_size(s);
+        int off = vec_full_reg_offset(s, a->rd);
+        do_str(s, off, size, a->rn, a->imm * size);
+    }
+    return true;
+}
+
+static bool trans_STR_pri(DisasContext *s, arg_rri *a, uint32_t insn)
+{
+    if (sve_access_check(s)) {
+        int size = pred_full_reg_size(s);
+        int off = pred_full_reg_offset(s, a->rd);
+        do_str(s, off, size, a->rn, a->imm * size);
+    }
+    return true;
+}
+
 /*
  *** SVE Memory - Contiguous Load Group
  */
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ LD1RQ_zpri      1010010 .. 00 0.... 001 ... ..... ..... \
 
 ### SVE Memory Store Group
 
+# SVE store predicate register
+STR_pri         1110010 11 0.     ..... 000 ... ..... 0 ....    @pd_rn_i9
+
+# SVE store vector register
+STR_zri         1110010 11 0.     ..... 010 ... ..... .....     @rd_rn_i9
+
 # SVE contiguous store (scalar plus immediate)
 # ST1B, ST1H, ST1W, ST1D; require msz <= esz
 ST_zpri         1110010 .. esz:2  0.... 111 ... ..... ..... \
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-12-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 41 +++++++++++++++++++++
 target/arm/sve_helper.c    | 61 +++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 75 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      | 39 ++++++++++++++++++++
 4 files changed, 216 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-13-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 21 +++++++++++++++++++++
 target/arm/sve.decode      | 23 +++++++++++++++++++++++
 2 files changed, 44 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180627043328.11531-14-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  67 +++++++++++++++++++++++++
 target/arm/sve_helper.c    |  77 ++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 100 +++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  57 +++++++++++++++++++++
 4 files changed, 301 insertions(+)

diff --git a/target/arm/helper-sve.h b/target/arm/helper-sve.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-sve.h
+++ b/target/arm/helper-sve.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(sve_st1hd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
 
 DEF_HELPER_FLAGS_4(sve_st1sd_r, TCG_CALL_NO_WG, void, env, ptr, tl, i32)
 
+DEF_HELPER_FLAGS_6(sve_ldbsu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhsu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldssu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldbss_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhss_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_6(sve_ldbsu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhsu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldssu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldbss_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhss_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_6(sve_ldbdu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhdu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldsdu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldddu_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldbds_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhds_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldsds_zsu, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_6(sve_ldbdu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhdu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldsdu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldddu_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldbds_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhds_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldsds_zss, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+
+DEF_HELPER_FLAGS_6(sve_ldbdu_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhdu_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldsdu_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldddu_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldbds_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldhds_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+DEF_HELPER_FLAGS_6(sve_ldsds_zd, TCG_CALL_NO_WG,
+                   void, env, ptr, ptr, ptr, tl, i32)
+
 DEF_HELPER_FLAGS_6(sve_stbs_zsu, TCG_CALL_NO_WG,
                    void, env, ptr, ptr, ptr, tl, i32)
 DEF_HELPER_FLAGS_6(sve_sths_zsu, TCG_CALL_NO_WG,
diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve_helper.c
+++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(sve_st4dd_r)(CPUARMState *env, void *vg,
     }
 }
 
+/* Loads with a vector index.  */
+
+#define DO_LD1_ZPZ_S(NAME, TYPEI, TYPEM, FN)                            \
+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
+                  target_ulong base, uint32_t desc)                     \
+{                                                                       \
+    intptr_t i, oprsz = simd_oprsz(desc);                               \
+    unsigned scale = simd_data(desc);                                   \
+    uintptr_t ra = GETPC();                                             \
+    for (i = 0; i < oprsz; i++) {                                       \
+        uint16_t pg = *(uint16_t *)(vg + H1_2(i >> 3));                 \
+        do {                                                            \
+            TYPEM m = 0;                                                \
+            if (pg & 1) {                                               \
+                target_ulong off = *(TYPEI *)(vm + H1_4(i));            \
+                m = FN(env, base + (off << scale), ra);                 \
+            }                                                           \
+            *(uint32_t *)(vd + H1_4(i)) = m;                            \
+            i += 4, pg >>= 4;                                           \
+        } while (i & 15);                                               \
+    }                                                                   \
+}
+
+#define DO_LD1_ZPZ_D(NAME, TYPEI, TYPEM, FN)                            \
+void HELPER(NAME)(CPUARMState *env, void *vd, void *vg, void *vm,       \
+                  target_ulong base, uint32_t desc)                     \
+{                                                                       \
+    intptr_t i, oprsz = simd_oprsz(desc) / 8;                           \
+    unsigned scale = simd_data(desc);                                   \
+    uintptr_t ra = GETPC();                                             \
+    uint64_t *d = vd, *m = vm; uint8_t *pg = vg;                        \
+    for (i = 0; i < oprsz; i++) {                                       \
+        TYPEM mm = 0;                                                   \
+        if (pg[H1(i)] & 1) {                                            \
+            target_ulong off = (TYPEI)m[i];                             \
+            mm = FN(env, base + (off << scale), ra);                    \
+        }                                                               \
+        d[i] = mm;                                                      \
+    }                                                                   \
+}
+
+DO_LD1_ZPZ_S(sve_ldbsu_zsu, uint32_t, uint8_t,  cpu_ldub_data_ra)
+DO_LD1_ZPZ_S(sve_ldhsu_zsu, uint32_t, uint16_t, cpu_lduw_data_ra)
+DO_LD1_ZPZ_S(sve_ldssu_zsu, uint32_t, uint32_t, cpu_ldl_data_ra)
+DO_LD1_ZPZ_S(sve_ldbss_zsu, uint32_t, int8_t,   cpu_ldub_data_ra)
+DO_LD1_ZPZ_S(sve_ldhss_zsu, uint32_t, int16_t,  cpu_lduw_data_ra)
+
+DO_LD1_ZPZ_S(sve_ldbsu_zss, int32_t, uint8_t,  cpu_ldub_data_ra)
+DO_LD1_ZPZ_S(sve_ldhsu_zss, int32_t, uint16_t, cpu_lduw_data_ra)
+DO_LD1_ZPZ_S(sve_ldssu_zss, int32_t, uint32_t, cpu_ldl_data_ra)
+DO_LD1_ZPZ_S(sve_ldbss_zss, int32_t, int8_t,   cpu_ldub_data_ra)
+DO_LD1_ZPZ_S(sve_ldhss_zss, int32_t, int16_t,  cpu_lduw_data_ra)
+
+DO_LD1_ZPZ_D(sve_ldbdu_zsu, uint32_t, uint8_t,  cpu_ldub_data_ra)
+DO_LD1_ZPZ_D(sve_ldhdu_zsu, uint32_t, uint16_t, cpu_lduw_data_ra)
+DO_LD1_ZPZ_D(sve_ldsdu_zsu, uint32_t, uint32_t, cpu_ldl_data_ra)
+DO_LD1_ZPZ_D(sve_ldddu_zsu, uint32_t, uint64_t, cpu_ldq_data_ra)
+DO_LD1_ZPZ_D(sve_ldbds_zsu, uint32_t, int8_t,   cpu_ldub_data_ra)
+DO_LD1_ZPZ_D(sve_ldhds_zsu, uint32_t, int16_t,  cpu_lduw_data_ra)
+DO_LD1_ZPZ_D(sve_ldsds_zsu, uint32_t, int32_t,  cpu_ldl_data_ra)
+
+DO_LD1_ZPZ_D(sve_ldbdu_zss, int32_t, uint8_t,  cpu_ldub_data_ra)
+DO_LD1_ZPZ_D(sve_ldhdu_zss, int32_t, uint16_t, cpu_lduw_data_ra)
+DO_LD1_ZPZ_D(sve_ldsdu_zss, int32_t, uint32_t, cpu_ldl_data_ra)
+DO_LD1_ZPZ_D(sve_ldddu_zss, int32_t, uint64_t, cpu_ldq_data_ra)
+DO_LD1_ZPZ_D(sve_ldbds_zss, int32_t, int8_t,   cpu_ldub_data_ra)
+DO_LD1_ZPZ_D(sve_ldhds_zss, int32_t, int16_t,  cpu_lduw_data_ra)
+DO_LD1_ZPZ_D(sve_ldsds_zss, int32_t, int32_t,  cpu_ldl_data_ra)
+
+DO_LD1_ZPZ_D(sve_ldbdu_zd, uint64_t, uint8_t,  cpu_ldub_data_ra)
+DO_LD1_ZPZ_D(sve_ldhdu_zd, uint64_t, uint16_t, cpu_lduw_data_ra)
+DO_LD1_ZPZ_D(sve_ldsdu_zd, uint64_t, uint32_t, cpu_ldl_data_ra)
+DO_LD1_ZPZ_D(sve_ldddu_zd, uint64_t, uint64_t, cpu_ldq_data_ra)
+DO_LD1_ZPZ_D(sve_ldbds_zd, uint64_t, int8_t,   cpu_ldub_data_ra)
+DO_LD1_ZPZ_D(sve_ldhds_zd, uint64_t, int16_t,  cpu_lduw_data_ra)
+DO_LD1_ZPZ_D(sve_ldsds_zd, uint64_t, int32_t,  cpu_ldl_data_ra)
+
 /* Stores with a vector index.  */
 
 #define DO_ST1_ZPZ_S(NAME, TYPEI, FN)                                   \
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void do_mem_zpz(DisasContext *s, int zt, int pg, int zm, int scale,
     tcg_temp_free_i32(desc);
 }
 
+/* Indexed by [ff][xs][u][msz].  */
+static gen_helper_gvec_mem_scatter * const gather_load_fn32[2][2][2][3] = {
+    { { { gen_helper_sve_ldbss_zsu,
+          gen_helper_sve_ldhss_zsu,
+          NULL, },
+        { gen_helper_sve_ldbsu_zsu,
+          gen_helper_sve_ldhsu_zsu,
+          gen_helper_sve_ldssu_zsu, } },
+      { { gen_helper_sve_ldbss_zss,
+          gen_helper_sve_ldhss_zss,
+          NULL, },
+        { gen_helper_sve_ldbsu_zss,
+          gen_helper_sve_ldhsu_zss,
+          gen_helper_sve_ldssu_zss, } } },
+    /* TODO fill in first-fault handlers */
+};
+
+/* Note that we overload xs=2 to indicate 64-bit offset.  */
+static gen_helper_gvec_mem_scatter * const gather_load_fn64[2][3][2][4] = {
+    { { { gen_helper_sve_ldbds_zsu,
+          gen_helper_sve_ldhds_zsu,
+          gen_helper_sve_ldsds_zsu,
+          NULL, },
+        { gen_helper_sve_ldbdu_zsu,
+          gen_helper_sve_ldhdu_zsu,
+          gen_helper_sve_ldsdu_zsu,
+          gen_helper_sve_ldddu_zsu, } },
+      { { gen_helper_sve_ldbds_zss,
+          gen_helper_sve_ldhds_zss,
+          gen_helper_sve_ldsds_zss,
+          NULL, },
+        { gen_helper_sve_ldbdu_zss,
+          gen_helper_sve_ldhdu_zss,
+          gen_helper_sve_ldsdu_zss,
+          gen_helper_sve_ldddu_zss, } },
+      { { gen_helper_sve_ldbds_zd,
+          gen_helper_sve_ldhds_zd,
+          gen_helper_sve_ldsds_zd,
+          NULL, },
+        { gen_helper_sve_ldbdu_zd,
+          gen_helper_sve_ldhdu_zd,
+          gen_helper_sve_ldsdu_zd,
+          gen_helper_sve_ldddu_zd, } } },
+    /* TODO fill in first-fault handlers */
+};
+
+static bool trans_LD1_zprz(DisasContext *s, arg_LD1_zprz *a, uint32_t insn)
+{
+    gen_helper_gvec_mem_scatter *fn = NULL;
+
+    if (!sve_access_check(s)) {
+        return true;
+    }
+
+    switch (a->esz) {
+    case MO_32:
+        fn = gather_load_fn32[a->ff][a->xs][a->u][a->msz];
+        break;
+    case MO_64:
+        fn = gather_load_fn64[a->ff][a->xs][a->u][a->msz];
+        break;
+    }
+    assert(fn != NULL);
+
+    do_mem_zpz(s, a->rd, a->pg, a->rm, a->scale * a->msz,
+               cpu_reg_sp(s, a->rn), fn);
+    return true;
+}
+
+static bool trans_LD1_zpiz(DisasContext *s, arg_LD1_zpiz *a, uint32_t insn)
+{
+    gen_helper_gvec_mem_scatter *fn = NULL;
+    TCGv_i64 imm;
+
+    if (a->esz < a->msz || (a->esz == a->msz && !a->u)) {
+        return false;
+    }
+    if (!sve_access_check(s)) {
+        return true;
+    }
+
+    switch (a->esz) {
+    case MO_32:
+        fn = gather_load_fn32[a->ff][0][a->u][a->msz];
+        break;
+    case MO_64:
+        fn = gather_load_fn64[a->ff][2][a->u][a->msz];
+        break;
+    }
+    assert(fn != NULL);
+
+    /* Treat LD1_zpiz (zn[x] + imm) the same way as LD1_zprz (rn + zm[x])
+     * by loading the immediate into the scalar parameter.
+     */
+    imm = tcg_const_i64(a->imm << a->msz);
+    do_mem_zpz(s, a->rd, a->pg, a->rn, 0, imm, fn);
+    tcg_temp_free_i64(imm);
+    return true;
+}
+
 static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
 {
     /* Indexed by [xs][msz].  */
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
 &rpri_load      rd pg rn imm dtype nreg
 &rprr_store     rd pg rn rm msz esz nreg
 &rpri_store     rd pg rn imm msz esz nreg
+&rprr_gather_load       rd pg rn rm esz msz u ff xs scale
+&rpri_gather_load       rd pg rn imm esz msz u ff
 &rprr_scatter_store     rd pg rn rm esz msz xs scale
 
 ###########################################################################
@@ -XXX,XX +XXX,XX @@
 @rpri_load_msz  ....... .... . imm:s4 ... pg:3 rn:5 rd:5 \
                 &rpri_load dtype=%msz_dtype
 
+# Gather Loads.
+@rprr_g_load_u        ....... .. .    . rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
+                      &rprr_gather_load xs=2
+@rprr_g_load_xs_u     ....... .. xs:1 . rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
+                      &rprr_gather_load
+@rprr_g_load_xs_u_sc  ....... .. xs:1 scale:1 rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
+                      &rprr_gather_load
+@rprr_g_load_xs_sc    ....... .. xs:1 scale:1 rm:5 . . ff:1 pg:3 rn:5 rd:5 \
+                      &rprr_gather_load
+@rprr_g_load_u_sc     ....... .. .    scale:1 rm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
+                      &rprr_gather_load xs=2
+@rprr_g_load_sc       ....... .. .    scale:1 rm:5 . . ff:1 pg:3 rn:5 rd:5 \
+                      &rprr_gather_load xs=2
+@rpri_g_load          ....... msz:2 .. imm:5 . u:1 ff:1 pg:3 rn:5 rd:5 \
+                      &rpri_gather_load
+
 # Stores; user must fill in ESZ, MSZ, NREG as needed.
 @rprr_store         ....... ..    ..     rm:5 ... pg:3 rn:5 rd:5    &rprr_store
 @rpri_store_msz     ....... msz:2 .. . imm:s4 ... pg:3 rn:5 rd:5    &rpri_store
@@ -XXX,XX +XXX,XX @@ LDR_zri         10000101 10 ...... 010 ... ..... .....          @rd_rn_i9
 LD1R_zpri       1000010 .. 1 imm:6 1.. pg:3 rn:5 rd:5 \
                 &rpri_load dtype=%dtype_23_13 nreg=0
 
+# SVE 32-bit gather load (scalar plus 32-bit unscaled offsets)
+# SVE 32-bit gather load (scalar plus 32-bit scaled offsets)
+LD1_zprz        1000010 00 .0 ..... 0.. ... ..... ..... \
+                @rprr_g_load_xs_u esz=2 msz=0 scale=0
+LD1_zprz        1000010 01 .. ..... 0.. ... ..... ..... \
+                @rprr_g_load_xs_u_sc esz=2 msz=1
+LD1_zprz        1000010 10 .. ..... 01. ... ..... ..... \
+                @rprr_g_load_xs_sc esz=2 msz=2 u=1
+
+# SVE 32-bit gather load (vector plus immediate)
+LD1_zpiz        1000010 .. 01 ..... 1.. ... ..... ..... \
+                @rpri_g_load esz=2
+
 ### SVE Memory Contiguous Load Group
 
 # SVE contiguous load (scalar plus scalar)
@@ -XXX,XX +XXX,XX @@ PRF_rr          1000010 -- 00 rm:5 110 --- ----- 0 ----
 
 ### SVE Memory 64-bit Gather Group
 
+# SVE 64-bit gather load (scalar plus 32-bit unpacked unscaled offsets)
+# SVE 64-bit gather load (scalar plus 32-bit unpacked scaled offsets)
+LD1_zprz        1100010 00 .0 ..... 0.. ... ..... ..... \
+                @rprr_g_load_xs_u esz=3 msz=0 scale=0
+LD1_zprz        1100010 01 .. ..... 0.. ... ..... ..... \
+                @rprr_g_load_xs_u_sc esz=3 msz=1
+LD1_zprz        1100010 10 .. ..... 0.. ... ..... ..... \
+                @rprr_g_load_xs_u_sc esz=3 msz=2
+LD1_zprz        1100010 11 .. ..... 01. ... ..... ..... \
+                @rprr_g_load_xs_sc esz=3 msz=3 u=1
+
+# SVE 64-bit gather load (scalar plus 64-bit unscaled offsets)
+# SVE 64-bit gather load (scalar plus 64-bit scaled offsets)
+LD1_zprz        1100010 00 10 ..... 1.. ... ..... ..... \
+                @rprr_g_load_u esz=3 msz=0 scale=0
+LD1_zprz        1100010 01 1. ..... 1.. ... ..... ..... \
+                @rprr_g_load_u_sc esz=3 msz=1
+LD1_zprz        1100010 10 1. ..... 1.. ... ..... ..... \
+                @rprr_g_load_u_sc esz=3 msz=2
+LD1_zprz        1100010 11 1. ..... 11. ... ..... ..... \
+                @rprr_g_load_sc esz=3 msz=3 u=1
+
+# SVE 64-bit gather load (vector plus immediate)
+LD1_zpiz        1100010 .. 01 ..... 1.. ... ..... ..... \
+                @rpri_g_load esz=3
+
 # SVE 64-bit gather prefetch (scalar plus 64-bit scaled offsets)
 PRF             1100010 00 11 ----- 1-- --- ----- 0 ----
 
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-15-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 67 +++++++++++++++++++++++++++++
 target/arm/sve_helper.c    | 88 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 40 ++++++++++++++++-
 3 files changed, 193 insertions(+), 2 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-16-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 85 ++++++++++++++++++++++++++------------
 target/arm/sve.decode      | 11 +++++
 2 files changed, 70 insertions(+), 26 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_LD1_zpiz(DisasContext *s, arg_LD1_zpiz *a, uint32_t insn)
     return true;
 }
 
+/* Indexed by [xs][msz].  */
+static gen_helper_gvec_mem_scatter * const scatter_store_fn32[2][3] = {
+    { gen_helper_sve_stbs_zsu,
+      gen_helper_sve_sths_zsu,
+      gen_helper_sve_stss_zsu, },
+    { gen_helper_sve_stbs_zss,
+      gen_helper_sve_sths_zss,
+      gen_helper_sve_stss_zss, },
+};
+
+/* Note that we overload xs=2 to indicate 64-bit offset.  */
+static gen_helper_gvec_mem_scatter * const scatter_store_fn64[3][4] = {
+    { gen_helper_sve_stbd_zsu,
+      gen_helper_sve_sthd_zsu,
+      gen_helper_sve_stsd_zsu,
+      gen_helper_sve_stdd_zsu, },
+    { gen_helper_sve_stbd_zss,
+      gen_helper_sve_sthd_zss,
+      gen_helper_sve_stsd_zss,
+      gen_helper_sve_stdd_zss, },
+    { gen_helper_sve_stbd_zd,
+      gen_helper_sve_sthd_zd,
+      gen_helper_sve_stsd_zd,
+      gen_helper_sve_stdd_zd, },
+};
+
 static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
 {
-    /* Indexed by [xs][msz].  */
-    static gen_helper_gvec_mem_scatter * const fn32[2][3] = {
-        { gen_helper_sve_stbs_zsu,
-          gen_helper_sve_sths_zsu,
-          gen_helper_sve_stss_zsu, },
-        { gen_helper_sve_stbs_zss,
-          gen_helper_sve_sths_zss,
-          gen_helper_sve_stss_zss, },
-    };
-    /* Note that we overload xs=2 to indicate 64-bit offset.  */
-    static gen_helper_gvec_mem_scatter * const fn64[3][4] = {
-        { gen_helper_sve_stbd_zsu,
-          gen_helper_sve_sthd_zsu,
-          gen_helper_sve_stsd_zsu,
-          gen_helper_sve_stdd_zsu, },
-        { gen_helper_sve_stbd_zss,
-          gen_helper_sve_sthd_zss,
-          gen_helper_sve_stsd_zss,
-          gen_helper_sve_stdd_zss, },
-        { gen_helper_sve_stbd_zd,
-          gen_helper_sve_sthd_zd,
-          gen_helper_sve_stsd_zd,
-          gen_helper_sve_stdd_zd, },
-    };
     gen_helper_gvec_mem_scatter *fn;
 
     if (a->esz < a->msz || (a->msz == 0 && a->scale)) {
@@ -XXX,XX +XXX,XX @@ static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
     }
     switch (a->esz) {
     case MO_32:
-        fn = fn32[a->xs][a->msz];
+        fn = scatter_store_fn32[a->xs][a->msz];
         break;
     case MO_64:
-        fn = fn64[a->xs][a->msz];
+        fn = scatter_store_fn64[a->xs][a->msz];
         break;
     default:
         g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static bool trans_ST1_zprz(DisasContext *s, arg_ST1_zprz *a, uint32_t insn)
     return true;
 }
 
+static bool trans_ST1_zpiz(DisasContext *s, arg_ST1_zpiz *a, uint32_t insn)
+{
+    gen_helper_gvec_mem_scatter *fn = NULL;
+    TCGv_i64 imm;
+
+    if (a->esz < a->msz) {
+        return false;
+    }
+    if (!sve_access_check(s)) {
+        return true;
+    }
+
+    switch (a->esz) {
+    case MO_32:
+        fn = scatter_store_fn32[0][a->msz];
+        break;
+    case MO_64:
+        fn = scatter_store_fn64[2][a->msz];
+        break;
+    }
+    assert(fn != NULL);
+
+    /* Treat ST1_zpiz (zn[x] + imm) the same way as ST1_zprz (rn + zm[x])
+     * by loading the immediate into the scalar parameter.
+     */
+    imm = tcg_const_i64(a->imm << a->msz);
+    do_mem_zpz(s, a->rd, a->pg, a->rn, 0, imm, fn);
+    tcg_temp_free_i64(imm);
+    return true;
+}
+
 /*
  * Prefetches
  */
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
 &rprr_gather_load       rd pg rn rm esz msz u ff xs scale
 &rpri_gather_load       rd pg rn imm esz msz u ff
 &rprr_scatter_store     rd pg rn rm esz msz xs scale
+&rpri_scatter_store     rd pg rn imm esz msz
 
 ###########################################################################
 # Named instruction formats.  These are generally used to
@@ -XXX,XX +XXX,XX @@
                     &rprr_store nreg=0
 @rprr_scatter_store ....... msz:2 ..     rm:5 ... pg:3 rn:5 rd:5 \
                     &rprr_scatter_store
+@rpri_scatter_store ....... msz:2 ..    imm:5 ... pg:3 rn:5 rd:5 \
+                    &rpri_scatter_store
 
 ###########################################################################
 # Instruction patterns.  Grouped according to the SVE encodingindex.xhtml.
@@ -XXX,XX +XXX,XX @@ ST1_zprz        1110010 .. 01 ..... 101 ... ..... ..... \
 ST1_zprz        1110010 .. 00 ..... 101 ... ..... ..... \
                 @rprr_scatter_store xs=2 esz=3 scale=0
 
+# SVE 64-bit scatter store (vector plus immediate)
+ST1_zpiz        1110010 .. 10 ..... 101 ... ..... ..... \
+                @rpri_scatter_store esz=3
+
+# SVE 32-bit scatter store (vector plus immediate)
+ST1_zpiz        1110010 .. 11 ..... 101 ... ..... ..... \
+                @rpri_scatter_store esz=2
+
 # SVE 64-bit scatter store (scalar plus unpacked 32-bit scaled offset)
 # Require msz > 0
 ST1_zprz        1110010 .. 01 ..... 100 ... ..... ..... \
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-17-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 49 ++++++++++++++++++++++++++++++
 target/arm/sve_helper.c    | 62 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 40 ++++++++++++++++++++++++
 target/arm/sve.decode      | 11 +++++++
 4 files changed, 162 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-18-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 56 ++++++++++++++++++++++++++++
 target/arm/sve_helper.c    | 69 +++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 75 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      | 14 +++++++
 4 files changed, 214 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-19-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        | 14 +++++++++++
 target/arm/translate-sve.c | 50 ++++++++++++++++++++++++++++++++++++++
 target/arm/vec_helper.c    | 48 ++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      | 19 +++++++++++++++
 4 files changed, 131 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
 DEF_HELPER_FLAGS_5(gvec_ftsmul_d, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_fmul_idx_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fmul_idx_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fmul_idx_d, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_6(gvec_fmla_idx_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_6(gvec_fmla_idx_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_6(gvec_fmla_idx_d, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, ptr, i32)
+
 #ifdef TARGET_AARCH64
 #include "helper-a64.h"
 #include "helper-sve.h"
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_ZZI(UMIN, umin)
 
 #undef DO_ZZI
 
+/*
+ *** SVE Floating Point Multiply-Add Indexed Group
+ */
+
+static bool trans_FMLA_zzxz(DisasContext *s, arg_FMLA_zzxz *a, uint32_t insn)
+{
+    static gen_helper_gvec_4_ptr * const fns[3] = {
+        gen_helper_gvec_fmla_idx_h,
+        gen_helper_gvec_fmla_idx_s,
+        gen_helper_gvec_fmla_idx_d,
+    };
+
+    if (sve_access_check(s)) {
+        unsigned vsz = vec_full_reg_size(s);
+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
+        tcg_gen_gvec_4_ptr(vec_full_reg_offset(s, a->rd),
+                           vec_full_reg_offset(s, a->rn),
+                           vec_full_reg_offset(s, a->rm),
+                           vec_full_reg_offset(s, a->ra),
+                           status, vsz, vsz, (a->index << 1) | a->sub,
+                           fns[a->esz - 1]);
+        tcg_temp_free_ptr(status);
+    }
+    return true;
+}
+
+/*
+ *** SVE Floating Point Multiply Indexed Group
+ */
+
+static bool trans_FMUL_zzx(DisasContext *s, arg_FMUL_zzx *a, uint32_t insn)
+{
+    static gen_helper_gvec_3_ptr * const fns[3] = {
+        gen_helper_gvec_fmul_idx_h,
+        gen_helper_gvec_fmul_idx_s,
+        gen_helper_gvec_fmul_idx_d,
+    };
+
+    if (sve_access_check(s)) {
+        unsigned vsz = vec_full_reg_size(s);
+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
+        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, a->rd),
+                           vec_full_reg_offset(s, a->rn),
+                           vec_full_reg_offset(s, a->rm),
+                           status, vsz, vsz, a->index, fns[a->esz - 1]);
+        tcg_temp_free_ptr(status);
+    }
+    return true;
+}
+
 /*
  *** SVE Floating Point Accumulating Reduction Group
  */
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_rsqrts_d, helper_rsqrtsf_f64, float64)
 
 #endif
 #undef DO_3OP
+
+/* For the indexed ops, SVE applies the index per 128-bit vector segment.
+ * For AdvSIMD, there is of course only one such vector segment.
+ */
+
+#define DO_MUL_IDX(NAME, TYPE, H) \
+void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+{                                                                          \
+    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t idx = simd_data(desc);                                        \
+    TYPE *d = vd, *n = vn, *m = vm;                                        \
+    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+        TYPE mm = m[H(i + idx)];                                           \
+        for (j = 0; j < segment; j++) {                                    \
+            d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
+        }                                                                  \
+    }                                                                      \
+}
+
+DO_MUL_IDX(gvec_fmul_idx_h, float16, H2)
+DO_MUL_IDX(gvec_fmul_idx_s, float32, H4)
+DO_MUL_IDX(gvec_fmul_idx_d, float64, )
+
+#undef DO_MUL_IDX
+
+#define DO_FMLA_IDX(NAME, TYPE, H)                                         \
+void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
+                  void *stat, uint32_t desc)                               \
+{                                                                          \
+    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    TYPE op1_neg = extract32(desc, SIMD_DATA_SHIFT, 1);                    \
+    intptr_t idx = desc >> (SIMD_DATA_SHIFT + 1);                          \
+    TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
+    op1_neg <<= (8 * sizeof(TYPE) - 1);                                    \
+    for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+        TYPE mm = m[H(i + idx)];                                           \
+        for (j = 0; j < segment; j++) {                                    \
+            d[i + j] = TYPE##_muladd(n[i + j] ^ op1_neg,                   \
+                                     mm, a[i + j], 0, stat);               \
+        }                                                                  \
+    }                                                                      \
+}
+
+DO_FMLA_IDX(gvec_fmla_idx_h, float16, H2)
+DO_FMLA_IDX(gvec_fmla_idx_s, float32, H4)
+DO_FMLA_IDX(gvec_fmla_idx_d, float64, )
+
+#undef DO_FMLA_IDX
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@
 %imm9_16_10     16:s6 10:3
 %size_23        23:2
 %dtype_23_13    23:2 13:2
+%index3_22_19   22:1 19:2
 
 # A combination of tsz:imm3 -- extract esize.
 %tszimm_esz     22:2 5:5 !function=tszimm_esz
@@ -XXX,XX +XXX,XX @@ UMIN_zzi        00100101 .. 101 011 110 ........ .....          @rdn_i8u
 # SVE integer multiply immediate (unpredicated)
 MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
 
+### SVE FP Multiply-Add Indexed Group
+
+# SVE floating-point multiply-add (indexed)
+FMLA_zzxz       01100100 0.1 .. rm:3 00000 sub:1 rn:5 rd:5 \
+                ra=%reg_movprfx index=%index3_22_19 esz=1
+FMLA_zzxz       01100100 101 index:2 rm:3 00000 sub:1 rn:5 rd:5 \
+                ra=%reg_movprfx esz=2
+FMLA_zzxz       01100100 111 index:1 rm:4 00000 sub:1 rn:5 rd:5 \
+                ra=%reg_movprfx esz=3
+
+### SVE FP Multiply Indexed Group
+
+# SVE floating-point multiply (indexed)
+FMUL_zzx        01100100 0.1 .. rm:3 001000 rn:5 rd:5 \
+                index=%index3_22_19 esz=1
+FMUL_zzx        01100100 101 index:2 rm:3 001000 rn:5 rd:5      esz=2
+FMUL_zzx        01100100 111 index:1 rm:4 001000 rn:5 rd:5      esz=3
+
 ### SVE FP Accumulating Reduction Group
 
 # SVE floating-point serial reduction (predicated)
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-20-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 35 ++++++++++++++++++++++
 target/arm/sve_helper.c    | 61 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 57 +++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  8 +++++
 4 files changed, 161 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-21-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  8 +++++++
 target/arm/translate-sve.c | 47 ++++++++++++++++++++++++++++++++++++++
 target/arm/vec_helper.c    | 20 ++++++++++++++++
 target/arm/sve.decode      |  5 ++++
 4 files changed, 80 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fcmlas_idx, TCG_CALL_NO_RWG,
 DEF_HELPER_FLAGS_5(gvec_fcmlad, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_VPZ(FMAXNMV, fmaxnmv)
 DO_VPZ(FMINV, fminv)
 DO_VPZ(FMAXV, fmaxv)
 
+/*
+ *** SVE Floating Point Unary Operations - Unpredicated Group
+ */
+
+static void do_zz_fp(DisasContext *s, arg_rr_esz *a, gen_helper_gvec_2_ptr *fn)
+{
+    unsigned vsz = vec_full_reg_size(s);
+    TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
+
+    tcg_gen_gvec_2_ptr(vec_full_reg_offset(s, a->rd),
+                       vec_full_reg_offset(s, a->rn),
+                       status, vsz, vsz, 0, fn);
+    tcg_temp_free_ptr(status);
+}
+
+static bool trans_FRECPE(DisasContext *s, arg_rr_esz *a, uint32_t insn)
+{
+    static gen_helper_gvec_2_ptr * const fns[3] = {
+        gen_helper_gvec_frecpe_h,
+        gen_helper_gvec_frecpe_s,
+        gen_helper_gvec_frecpe_d,
+    };
+    if (a->esz == 0) {
+        return false;
+    }
+    if (sve_access_check(s)) {
+        do_zz_fp(s, a, fns[a->esz - 1]);
+    }
+    return true;
+}
+
+static bool trans_FRSQRTE(DisasContext *s, arg_rr_esz *a, uint32_t insn)
+{
+    static gen_helper_gvec_2_ptr * const fns[3] = {
+        gen_helper_gvec_frsqrte_h,
+        gen_helper_gvec_frsqrte_s,
+        gen_helper_gvec_frsqrte_d,
+    };
+    if (a->esz == 0) {
+        return false;
+    }
+    if (sve_access_check(s)) {
+        do_zz_fp(s, a, fns[a->esz - 1]);
+    }
+    return true;
+}
+
 /*
  *** SVE Floating Point Accumulating Reduction Group
  */
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlad)(void *vd, void *vn, void *vm,
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
+#define DO_2OP(NAME, FUNC, TYPE) \
+void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
+{                                                                 \
+    intptr_t i, oprsz = simd_oprsz(desc);                         \
+    TYPE *d = vd, *n = vn;                                        \
+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {                  \
+        d[i] = FUNC(n[i], stat);                                  \
+    }                                                             \
+}
+
+DO_2OP(gvec_frecpe_h, helper_recpe_f16, float16)
+DO_2OP(gvec_frecpe_s, helper_recpe_f32, float32)
+DO_2OP(gvec_frecpe_d, helper_recpe_f64, float64)
+
+DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
+DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
+DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
+
+#undef DO_2OP
+
 /* Floating-point trigonometric starting value.
  * See the ARM ARM pseudocode function FPTrigSMul.
  */
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ FMINNMV         01100101 .. 000 101 001 ... ..... .....         @rd_pg_rn
 FMAXV           01100101 .. 000 110 001 ... ..... .....         @rd_pg_rn
 FMINV           01100101 .. 000 111 001 ... ..... .....         @rd_pg_rn
 
+## SVE Floating Point Unary Operations - Unpredicated Group
+
+FRECPE          01100101 .. 001 110 001100 ..... .....          @rd_rn
+FRSQRTE         01100101 .. 001 111 001100 ..... .....          @rd_rn
+
 ### SVE FP Accumulating Reduction Group
 
 # SVE floating-point serial reduction (predicated)
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-22-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 42 +++++++++++++++++++++++++++++++++++++
 target/arm/sve_helper.c    | 43 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 43 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      | 10 +++++++++
 4 files changed, 138 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-23-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |  4 +++
 target/arm/sve_helper.c    | 70 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 27 +++++++++++++++
 target/arm/sve.decode      |  3 ++
 4 files changed, 104 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-24-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 13 +++++++++
 target/arm/sve_helper.c    | 55 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 30 +++++++++++++++++++++
 target/arm/sve.decode      |  8 ++++++
 4 files changed, 106 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-25-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 30 +++++++++++++
 target/arm/helper.h        | 12 +++---
 target/arm/helper.c        |  2 +-
 target/arm/sve_helper.c    | 88 ++++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c | 70 ++++++++++++++++++++++++++++++
 target/arm/sve.decode      | 16 +++++++
 6 files changed, 211 insertions(+), 7 deletions(-)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-26-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 14 +++++++
 target/arm/sve_helper.c    |  8 ++++
 target/arm/translate-sve.c | 77 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  9 +++++
 4 files changed, 108 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-27-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    | 14 ++++++++++++++
 target/arm/sve_helper.c    |  8 ++++++++
 target/arm/translate-sve.c | 26 ++++++++++++++++++++++++++
 target/arm/sve.decode      |  4 ++++
 4 files changed, 52 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-28-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 60 +++++++++++++++++++++++++++++++++++++-
 target/arm/sve.decode      |  7 +++++
 2 files changed, 66 insertions(+), 1 deletion(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool do_zpzz_ool(DisasContext *s, arg_rprr_esz *a, gen_helper_gvec_4 *fn)
     return true;
 }
 
+/* Select active elememnts from Zn and inactive elements from Zm,
+ * storing the result in Zd.
+ */
+static void do_sel_z(DisasContext *s, int rd, int rn, int rm, int pg, int esz)
+{
+    static gen_helper_gvec_4 * const fns[4] = {
+        gen_helper_sve_sel_zpzz_b, gen_helper_sve_sel_zpzz_h,
+        gen_helper_sve_sel_zpzz_s, gen_helper_sve_sel_zpzz_d
+    };
+    unsigned vsz = vec_full_reg_size(s);
+    tcg_gen_gvec_4_ool(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       vec_full_reg_offset(s, rm),
+                       pred_full_reg_offset(s, pg),
+                       vsz, vsz, 0, fns[esz]);
+}
+
 #define DO_ZPZZ(NAME, name) \
 static bool trans_##NAME##_zpzz(DisasContext *s, arg_rprr_esz *a,         \
                                 uint32_t insn)                            \
@@ -XXX,XX +XXX,XX @@ static bool trans_UDIV_zpzz(DisasContext *s, arg_rprr_esz *a, uint32_t insn)
     return do_zpzz_ool(s, a, fns[a->esz]);
 }
 
-DO_ZPZZ(SEL, sel)
+static bool trans_SEL_zpzz(DisasContext *s, arg_rprr_esz *a, uint32_t insn)
+{
+    if (sve_access_check(s)) {
+        do_sel_z(s, a->rd, a->rn, a->rm, a->pg, a->esz);
+    }
+    return true;
+}
 
 #undef DO_ZPZZ
 
@@ -XXX,XX +XXX,XX @@ static bool trans_PRF_rr(DisasContext *s, arg_PRF_rr *a, uint32_t insn)
     sve_access_check(s);
     return true;
 }
+
+/*
+ * Move Prefix
+ *
+ * TODO: The implementation so far could handle predicated merging movprfx.
+ * The helper functions as written take an extra source register to
+ * use in the operation, but the result is only written when predication
+ * succeeds.  For unpredicated movprfx, we need to rearrange the helpers
+ * to allow the final write back to the destination to be unconditional.
+ * For predicated zeroing movprfx, we need to rearrange the helpers to
+ * allow the final write back to zero inactives.
+ *
+ * In the meantime, just emit the moves.
+ */
+
+static bool trans_MOVPRFX(DisasContext *s, arg_MOVPRFX *a, uint32_t insn)
+{
+    return do_mov_z(s, a->rd, a->rn);
+}
+
+static bool trans_MOVPRFX_m(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
+{
+    if (sve_access_check(s)) {
+        do_sel_z(s, a->rd, a->rn, a->rd, a->pg, a->esz);
+    }
+    return true;
+}
+
+static bool trans_MOVPRFX_z(DisasContext *s, arg_rpr_esz *a, uint32_t insn)
+{
+    if (sve_access_check(s)) {
+        do_movz_zpz(s, a->rd, a->rn, a->pg, a->esz);
+    }
+    return true;
+}
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ ORV             00000100 .. 011 000 001 ... ..... .....         @rd_pg_rn
 EORV            00000100 .. 011 001 001 ... ..... .....         @rd_pg_rn
 ANDV            00000100 .. 011 010 001 ... ..... .....         @rd_pg_rn
 
+# SVE constructive prefix (predicated)
+MOVPRFX_z       00000100 .. 010 000 001 ... ..... .....         @rd_pg_rn
+MOVPRFX_m       00000100 .. 010 001 001 ... ..... .....         @rd_pg_rn
+
 # SVE integer add reduction (predicated)
 # Note that saddv requires size != 3.
 UADDV           00000100 .. 000 001 001 ... ..... .....         @rd_pg_rn
@@ -XXX,XX +XXX,XX @@ ADR_p64         00000100 11 1 ..... 1010 .. ..... .....         @rd_rn_msz_rm
 
 ### SVE Integer Misc - Unpredicated Group
 
+# SVE constructive prefix (unpredicated)
+MOVPRFX         00000100 00 1 00000 101111 rn:5 rd:5
+
 # SVE floating-point exponential accelerator
 # Note esz != 0
 FEXPA           00000100 .. 1 00000 101110 ..... .....          @rd_rn
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-29-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |   7 +++
 target/arm/sve_helper.c    | 100 +++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c |  24 +++++++++
 target/arm/sve.decode      |   4 ++
 4 files changed, 135 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-30-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-sve.h    |   4 +
 target/arm/sve_helper.c    | 162 +++++++++++++++++++++++++++++++++++++
 target/arm/translate-sve.c |  37 +++++++++
 target/arm/sve.decode      |   4 +
 4 files changed, 207 insertions(+)

From: Richard Henderson <richard.henderson@linaro.org>

For aa64 advsimd, we had been passing the pre-indexed vector.
However, sve applies the index to each 128-bit segment, so we
need to pass in the index separately.

For aa32 advsimd, the fp32 operation always has index 0, but
we failed to interpret the fp16 index correctly.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180627043328.11531-31-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 21 ++++++++++++---------
 target/arm/translate.c     | 32 +++++++++++++++++++++++---------
 target/arm/vec_helper.c    | 10 ++++++----
 3 files changed, 41 insertions(+), 22 deletions(-)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
     case 0x13: /* FCMLA #90 */
     case 0x15: /* FCMLA #180 */
     case 0x17: /* FCMLA #270 */
-        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
-                           vec_full_reg_offset(s, rn),
-                           vec_reg_offset(s, rm, index, size), fpst,
-                           is_q ? 16 : 8, vec_full_reg_size(s),
-                           extract32(insn, 13, 2), /* rot */
-                           size == MO_64
-                           ? gen_helper_gvec_fcmlas_idx
-                           : gen_helper_gvec_fcmlah_idx);
-        tcg_temp_free_ptr(fpst);
+        {
+            int rot = extract32(insn, 13, 2);
+            int data = (index << 2) | rot;
+            tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, rd),
+                               vec_full_reg_offset(s, rn),
+                               vec_full_reg_offset(s, rm), fpst,
+                               is_q ? 16 : 8, vec_full_reg_size(s), data,
+                               size == MO_64
+                               ? gen_helper_gvec_fcmlas_idx
+                               : gen_helper_gvec_fcmlah_idx);
+            tcg_temp_free_ptr(fpst);
+        }
         return;
     }
 
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
 
 static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
 {
-    int rd, rn, rm, rot, size, opr_sz;
+    gen_helper_gvec_3_ptr *fn_gvec_ptr;
+    int rd, rn, rm, opr_sz, data;
     TCGv_ptr fpst;
     bool q;
 
     q = extract32(insn, 6, 1);
     VFP_DREG_D(rd, insn);
     VFP_DREG_N(rn, insn);
-    VFP_DREG_M(rm, insn);
     if ((rd | rn) & q) {
         return 1;
     }
 
     if ((insn & 0xff000f10) == 0xfe000800) {
         /* VCMLA (indexed) -- 1111 1110 S.RR .... .... 1000 ...0 .... */
-        rot = extract32(insn, 20, 2);
-        size = extract32(insn, 23, 1);
-        if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)
-            || (!size && !arm_dc_feature(s, ARM_FEATURE_V8_FP16))) {
+        int rot = extract32(insn, 20, 2);
+        int size = extract32(insn, 23, 1);
+        int index;
+
+        if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)) {
             return 1;
         }
+        if (size == 0) {
+            if (!arm_dc_feature(s, ARM_FEATURE_V8_FP16)) {
+                return 1;
+            }
+            /* For fp16, rm is just Vm, and index is M.  */
+            rm = extract32(insn, 0, 4);
+            index = extract32(insn, 5, 1);
+        } else {
+            /* For fp32, rm is the usual M:Vm, and index is 0.  */
+            VFP_DREG_M(rm, insn);
+            index = 0;
+        }
+        data = (index << 2) | rot;
+        fn_gvec_ptr = (size ? gen_helper_gvec_fcmlas_idx
+                       : gen_helper_gvec_fcmlah_idx);
     } else {
         return 1;
     }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
     tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
                        vfp_reg_offset(1, rn),
                        vfp_reg_offset(1, rm), fpst,
-                       opr_sz, opr_sz, rot,
-                       size ? gen_helper_gvec_fcmlas_idx
-                       : gen_helper_gvec_fcmlah_idx);
+                       opr_sz, opr_sz, data, fn_gvec_ptr);
     tcg_temp_free_ptr(fpst);
     return 0;
 }
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlah_idx)(void *vd, void *vn, void *vm,
     float_status *fpst = vfpst;
     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+    intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
     uint32_t neg_real = flip ^ neg_imag;
     uintptr_t i;
-    float16 e1 = m[H2(flip)];
-    float16 e3 = m[H2(1 - flip)];
+    float16 e1 = m[H2(2 * index + flip)];
+    float16 e3 = m[H2(2 * index + 1 - flip)];
 
     /* Shift boolean to the sign bit so we can xor to negate.  */
     neg_real <<= 15;
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlas_idx)(void *vd, void *vn, void *vm,
     float_status *fpst = vfpst;
     intptr_t flip = extract32(desc, SIMD_DATA_SHIFT, 1);
     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
+    intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
     uint32_t neg_real = flip ^ neg_imag;
     uintptr_t i;
-    float32 e1 = m[H4(flip)];
-    float32 e3 = m[H4(1 - flip)];
+    float32 e1 = m[H4(2 * index + flip)];
+    float32 e3 = m[H4(2 * index + 1 - flip)];
 
     /* Shift boolean to the sign bit so we can xor to negate.  */
     neg_real <<= 31;
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Enhance the existing helpers to support SVE, which takes the
index from each 128-bit segment.  The change has no effect
for AdvSIMD, since there is only one such segment.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180627043328.11531-32-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-sve.c | 23 ++++++++++++++++++
 target/arm/vec_helper.c    | 50 +++++++++++++++++++++++---------------
 target/arm/sve.decode      |  6 +++++
 3 files changed, 59 insertions(+), 20 deletions(-)

diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_FCMLA_zpzzz(DisasContext *s,
     return true;
 }
 
+static bool trans_FCMLA_zzxz(DisasContext *s, arg_FCMLA_zzxz *a, uint32_t insn)
+{
+    static gen_helper_gvec_3_ptr * const fns[2] = {
+        gen_helper_gvec_fcmlah_idx,
+        gen_helper_gvec_fcmlas_idx,
+    };
+
+    tcg_debug_assert(a->esz == 1 || a->esz == 2);
+    tcg_debug_assert(a->rd == a->ra);
+    if (sve_access_check(s)) {
+        unsigned vsz = vec_full_reg_size(s);
+        TCGv_ptr status = get_fpstatus_ptr(a->esz == MO_16);
+        tcg_gen_gvec_3_ptr(vec_full_reg_offset(s, a->rd),
+                           vec_full_reg_offset(s, a->rn),
+                           vec_full_reg_offset(s, a->rm),
+                           status, vsz, vsz,
+                           a->index * 4 + a->rot,
+                           fns[a->esz - 1]);
+        tcg_temp_free_ptr(status);
+    }
+    return true;
+}
+
 /*
  *** SVE Floating Point Unary Operations Predicated Group
  */
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlah_idx)(void *vd, void *vn, void *vm,
     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
     intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
     uint32_t neg_real = flip ^ neg_imag;
-    uintptr_t i;
-    float16 e1 = m[H2(2 * index + flip)];
-    float16 e3 = m[H2(2 * index + 1 - flip)];
+    intptr_t elements = opr_sz / sizeof(float16);
+    intptr_t eltspersegment = 16 / sizeof(float16);
+    intptr_t i, j;
 
     /* Shift boolean to the sign bit so we can xor to negate.  */
     neg_real <<= 15;
     neg_imag <<= 15;
-    e1 ^= neg_real;
-    e3 ^= neg_imag;
 
-    for (i = 0; i < opr_sz / 2; i += 2) {
-        float16 e2 = n[H2(i + flip)];
-        float16 e4 = e2;
+    for (i = 0; i < elements; i += eltspersegment) {
+        float16 mr = m[H2(i + 2 * index + 0)];
+        float16 mi = m[H2(i + 2 * index + 1)];
+        float16 e1 = neg_real ^ (flip ? mi : mr);
+        float16 e3 = neg_imag ^ (flip ? mr : mi);
 
-        d[H2(i)] = float16_muladd(e2, e1, d[H2(i)], 0, fpst);
-        d[H2(i + 1)] = float16_muladd(e4, e3, d[H2(i + 1)], 0, fpst);
+        for (j = i; j < i + eltspersegment; j += 2) {
+            float16 e2 = n[H2(j + flip)];
+            float16 e4 = e2;
+
+            d[H2(j)] = float16_muladd(e2, e1, d[H2(j)], 0, fpst);
+            d[H2(j + 1)] = float16_muladd(e4, e3, d[H2(j + 1)], 0, fpst);
+        }
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlas_idx)(void *vd, void *vn, void *vm,
     uint32_t neg_imag = extract32(desc, SIMD_DATA_SHIFT + 1, 1);
     intptr_t index = extract32(desc, SIMD_DATA_SHIFT + 2, 2);
     uint32_t neg_real = flip ^ neg_imag;
-    uintptr_t i;
-    float32 e1 = m[H4(2 * index + flip)];
-    float32 e3 = m[H4(2 * index + 1 - flip)];
+    intptr_t elements = opr_sz / sizeof(float32);
+    intptr_t eltspersegment = 16 / sizeof(float32);
+    intptr_t i, j;
 
     /* Shift boolean to the sign bit so we can xor to negate.  */
     neg_real <<= 31;
     neg_imag <<= 31;
-    e1 ^= neg_real;
-    e3 ^= neg_imag;
 
-    for (i = 0; i < opr_sz / 4; i += 2) {
-        float32 e2 = n[H4(i + flip)];
-        float32 e4 = e2;
+    for (i = 0; i < elements; i += eltspersegment) {
+        float32 mr = m[H4(i + 2 * index + 0)];
+        float32 mi = m[H4(i + 2 * index + 1)];
+        float32 e1 = neg_real ^ (flip ? mi : mr);
+        float32 e3 = neg_imag ^ (flip ? mr : mi);
 
-        d[H4(i)] = float32_muladd(e2, e1, d[H4(i)], 0, fpst);
-        d[H4(i + 1)] = float32_muladd(e4, e3, d[H4(i + 1)], 0, fpst);
+        for (j = i; j < i + eltspersegment; j += 2) {
+            float32 e2 = n[H4(j + flip)];
+            float32 e4 = e2;
+
+            d[H4(j)] = float32_muladd(e2, e1, d[H4(j)], 0, fpst);
+            d[H4(j + 1)] = float32_muladd(e4, e3, d[H4(j + 1)], 0, fpst);
+        }
     }
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
 FCMLA_zpzzz     01100100 esz:2 0 rm:5 0 rot:2 pg:3 rn:5 rd:5 \
                 ra=%reg_movprfx
 
+# SVE floating-point complex multiply-add (indexed)
+FCMLA_zzxz      01100100 10 1 index:2 rm:3 0001 rot:2 rn:5 rd:5 \
+                ra=%reg_movprfx esz=1
+FCMLA_zzxz      01100100 11 1 index:1 rm:4 0001 rot:2 rn:5 rd:5 \
+                ra=%reg_movprfx esz=2
+
 ### SVE FP Multiply-Add Indexed Group
 
 # SVE floating-point multiply-add (indexed)
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-33-richard.henderson@linaro.org
[PMM: moved 'ra=%reg_movprfx' here from following patch]
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  5 +++
 target/arm/translate-sve.c | 17 ++++++++++
 target/arm/vec_helper.c    | 67 ++++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |  3 ++
 4 files changed, 92 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_qrdmlah_s32, TCG_CALL_NO_RWG,
 DEF_HELPER_FLAGS_5(gvec_qrdmlsh_s32, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_sdot_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_udot_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_sdot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_udot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_fcaddh, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fcadds, TCG_CALL_NO_RWG,
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ DO_ZZI(UMIN, umin)
 
 #undef DO_ZZI
 
+static bool trans_DOT_zzz(DisasContext *s, arg_DOT_zzz *a, uint32_t insn)
+{
+    static gen_helper_gvec_3 * const fns[2][2] = {
+        { gen_helper_gvec_sdot_b, gen_helper_gvec_sdot_h },
+        { gen_helper_gvec_udot_b, gen_helper_gvec_udot_h }
+    };
+
+    if (sve_access_check(s)) {
+        unsigned vsz = vec_full_reg_size(s);
+        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
+                           vec_full_reg_offset(s, a->rn),
+                           vec_full_reg_offset(s, a->rm),
+                           vsz, vsz, 0, fns[a->u][a->sz]);
+    }
+    return true;
+}
+
 /*
  *** SVE Floating Point Multiply-Add Indexed Group
  */
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_qrdmlsh_s32)(void *vd, void *vn, void *vm,
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
+/* Integer 8 and 16-bit dot-product.
+ *
+ * Note that for the loops herein, host endianness does not matter
+ * with respect to the ordering of data within the 64-bit lanes.
+ * All elements are treated equally, no matter where they are.
+ */
+
+void HELPER(gvec_sdot_b)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint32_t *d = vd;
+    int8_t *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 4; ++i) {
+        d[i] += n[i * 4 + 0] * m[i * 4 + 0]
+              + n[i * 4 + 1] * m[i * 4 + 1]
+              + n[i * 4 + 2] * m[i * 4 + 2]
+              + n[i * 4 + 3] * m[i * 4 + 3];
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_udot_b)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint32_t *d = vd;
+    uint8_t *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 4; ++i) {
+        d[i] += n[i * 4 + 0] * m[i * 4 + 0]
+              + n[i * 4 + 1] * m[i * 4 + 1]
+              + n[i * 4 + 2] * m[i * 4 + 2]
+              + n[i * 4 + 3] * m[i * 4 + 3];
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_sdot_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint64_t *d = vd;
+    int16_t *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 8; ++i) {
+        d[i] += (int64_t)n[i * 4 + 0] * m[i * 4 + 0]
+              + (int64_t)n[i * 4 + 1] * m[i * 4 + 1]
+              + (int64_t)n[i * 4 + 2] * m[i * 4 + 2]
+              + (int64_t)n[i * 4 + 3] * m[i * 4 + 3];
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_udot_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc);
+    uint64_t *d = vd;
+    uint16_t *n = vn, *m = vm;
+
+    for (i = 0; i < opr_sz / 8; ++i) {
+        d[i] += (uint64_t)n[i * 4 + 0] * m[i * 4 + 0]
+              + (uint64_t)n[i * 4 + 1] * m[i * 4 + 1]
+              + (uint64_t)n[i * 4 + 2] * m[i * 4 + 2]
+              + (uint64_t)n[i * 4 + 3] * m[i * 4 + 3];
+    }
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
 void HELPER(gvec_fcaddh)(void *vd, void *vn, void *vm,
                          void *vfpst, uint32_t desc)
 {
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ UMIN_zzi        00100101 .. 101 011 110 ........ .....          @rdn_i8u
 # SVE integer multiply immediate (unpredicated)
 MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
 
+# SVE integer dot product (unpredicated)
+DOT_zzz         01000100 1 sz:1 0 rm:5 00000 u:1 rn:5 rd:5      ra=%reg_movprfx
+
 # SVE floating-point complex add (predicated)
 FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
                 rn=%reg_movprfx
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180627043328.11531-34-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |   5 ++
 target/arm/translate-sve.c |  18 ++++++
 target/arm/vec_helper.c    | 124 +++++++++++++++++++++++++++++++++++++
 target/arm/sve.decode      |   6 ++
 4 files changed, 153 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_udot_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_sdot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_udot_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_sdot_idx_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_udot_idx_b, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_sdot_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_udot_idx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_fcaddh, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fcadds, TCG_CALL_NO_RWG,
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_DOT_zzz(DisasContext *s, arg_DOT_zzz *a, uint32_t insn)
     return true;
 }
 
+static bool trans_DOT_zzx(DisasContext *s, arg_DOT_zzx *a, uint32_t insn)
+{
+    static gen_helper_gvec_3 * const fns[2][2] = {
+        { gen_helper_gvec_sdot_idx_b, gen_helper_gvec_sdot_idx_h },
+        { gen_helper_gvec_udot_idx_b, gen_helper_gvec_udot_idx_h }
+    };
+
+    if (sve_access_check(s)) {
+        unsigned vsz = vec_full_reg_size(s);
+        tcg_gen_gvec_3_ool(vec_full_reg_offset(s, a->rd),
+                           vec_full_reg_offset(s, a->rn),
+                           vec_full_reg_offset(s, a->rm),
+                           vsz, vsz, a->index, fns[a->u][a->sz]);
+    }
+    return true;
+}
+
+
 /*
  *** SVE Floating Point Multiply-Add Indexed Group
  */
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_udot_h)(void *vd, void *vn, void *vm, uint32_t desc)
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
+void HELPER(gvec_sdot_idx_b)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, segend, opr_sz = simd_oprsz(desc), opr_sz_4 = opr_sz / 4;
+    intptr_t index = simd_data(desc);
+    uint32_t *d = vd;
+    int8_t *n = vn;
+    int8_t *m_indexed = (int8_t *)vm + index * 4;
+
+    /* Notice the special case of opr_sz == 8, from aa64/aa32 advsimd.
+     * Otherwise opr_sz is a multiple of 16.
+     */
+    segend = MIN(4, opr_sz_4);
+    i = 0;
+    do {
+        int8_t m0 = m_indexed[i * 4 + 0];
+        int8_t m1 = m_indexed[i * 4 + 1];
+        int8_t m2 = m_indexed[i * 4 + 2];
+        int8_t m3 = m_indexed[i * 4 + 3];
+
+        do {
+            d[i] += n[i * 4 + 0] * m0
+                  + n[i * 4 + 1] * m1
+                  + n[i * 4 + 2] * m2
+                  + n[i * 4 + 3] * m3;
+        } while (++i < segend);
+        segend = i + 4;
+    } while (i < opr_sz_4);
+
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_udot_idx_b)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, segend, opr_sz = simd_oprsz(desc), opr_sz_4 = opr_sz / 4;
+    intptr_t index = simd_data(desc);
+    uint32_t *d = vd;
+    uint8_t *n = vn;
+    uint8_t *m_indexed = (uint8_t *)vm + index * 4;
+
+    /* Notice the special case of opr_sz == 8, from aa64/aa32 advsimd.
+     * Otherwise opr_sz is a multiple of 16.
+     */
+    segend = MIN(4, opr_sz_4);
+    i = 0;
+    do {
+        uint8_t m0 = m_indexed[i * 4 + 0];
+        uint8_t m1 = m_indexed[i * 4 + 1];
+        uint8_t m2 = m_indexed[i * 4 + 2];
+        uint8_t m3 = m_indexed[i * 4 + 3];
+
+        do {
+            d[i] += n[i * 4 + 0] * m0
+                  + n[i * 4 + 1] * m1
+                  + n[i * 4 + 2] * m2
+                  + n[i * 4 + 3] * m3;
+        } while (++i < segend);
+        segend = i + 4;
+    } while (i < opr_sz_4);
+
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_sdot_idx_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc), opr_sz_8 = opr_sz / 8;
+    intptr_t index = simd_data(desc);
+    uint64_t *d = vd;
+    int16_t *n = vn;
+    int16_t *m_indexed = (int16_t *)vm + index * 4;
+
+    /* This is supported by SVE only, so opr_sz is always a multiple of 16.
+     * Process the entire segment all at once, writing back the results
+     * only after we've consumed all of the inputs.
+     */
+    for (i = 0; i < opr_sz_8 ; i += 2) {
+        uint64_t d0, d1;
+
+        d0  = n[i * 4 + 0] * (int64_t)m_indexed[i * 4 + 0];
+        d0 += n[i * 4 + 1] * (int64_t)m_indexed[i * 4 + 1];
+        d0 += n[i * 4 + 2] * (int64_t)m_indexed[i * 4 + 2];
+        d0 += n[i * 4 + 3] * (int64_t)m_indexed[i * 4 + 3];
+        d1  = n[i * 4 + 4] * (int64_t)m_indexed[i * 4 + 0];
+        d1 += n[i * 4 + 5] * (int64_t)m_indexed[i * 4 + 1];
+        d1 += n[i * 4 + 6] * (int64_t)m_indexed[i * 4 + 2];
+        d1 += n[i * 4 + 7] * (int64_t)m_indexed[i * 4 + 3];
+
+        d[i + 0] += d0;
+        d[i + 1] += d1;
+    }
+
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
+void HELPER(gvec_udot_idx_h)(void *vd, void *vn, void *vm, uint32_t desc)
+{
+    intptr_t i, opr_sz = simd_oprsz(desc), opr_sz_8 = opr_sz / 8;
+    intptr_t index = simd_data(desc);
+    uint64_t *d = vd;
+    uint16_t *n = vn;
+    uint16_t *m_indexed = (uint16_t *)vm + index * 4;
+
+    /* This is supported by SVE only, so opr_sz is always a multiple of 16.
+     * Process the entire segment all at once, writing back the results
+     * only after we've consumed all of the inputs.
+     */
+    for (i = 0; i < opr_sz_8 ; i += 2) {
+        uint64_t d0, d1;
+
+        d0  = n[i * 4 + 0] * (uint64_t)m_indexed[i * 4 + 0];
+        d0 += n[i * 4 + 1] * (uint64_t)m_indexed[i * 4 + 1];
+        d0 += n[i * 4 + 2] * (uint64_t)m_indexed[i * 4 + 2];
+        d0 += n[i * 4 + 3] * (uint64_t)m_indexed[i * 4 + 3];
+        d1  = n[i * 4 + 4] * (uint64_t)m_indexed[i * 4 + 0];
+        d1 += n[i * 4 + 5] * (uint64_t)m_indexed[i * 4 + 1];
+        d1 += n[i * 4 + 6] * (uint64_t)m_indexed[i * 4 + 2];
+        d1 += n[i * 4 + 7] * (uint64_t)m_indexed[i * 4 + 3];
+
+        d[i + 0] += d0;
+        d[i + 1] += d1;
+    }
+
+    clear_tail(d, opr_sz, simd_maxsz(desc));
+}
+
 void HELPER(gvec_fcaddh)(void *vd, void *vn, void *vm,
                          void *vfpst, uint32_t desc)
 {
diff --git a/target/arm/sve.decode b/target/arm/sve.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve.decode
+++ b/target/arm/sve.decode
@@ -XXX,XX +XXX,XX @@ MUL_zzi         00100101 .. 110 000 110 ........ .....          @rdn_i8s
 # SVE integer dot product (unpredicated)
 DOT_zzz         01000100 1 sz:1 0 rm:5 00000 u:1 rn:5 rd:5      ra=%reg_movprfx
 
+# SVE integer dot product (indexed)
+DOT_zzx         01000100 101 index:2 rm:3 00000 u:1 rn:5 rd:5 \
+                sz=0 ra=%reg_movprfx
+DOT_zzx         01000100 111 index:1 rm:4 00000 u:1 rn:5 rd:5 \
+                sz=1 ra=%reg_movprfx
+
 # SVE floating-point complex add (predicated)
 FCADD           01100100 esz:2 00000 rot:1 100 pg:3 rm:5 rd:5 \
                 rn=%reg_movprfx
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Enable ARM_FEATURE_SVE for the generic "max" cpu.

Tested-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-35-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 1 +
 target/arm/cpu.c     | 7 +++++++
 target/arm/cpu64.c   | 1 +
 3 files changed, 9 insertions(+)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
     GET_FEATURE(ARM_FEATURE_V8_ATOMICS, ARM_HWCAP_A64_ATOMICS);
     GET_FEATURE(ARM_FEATURE_V8_RDM, ARM_HWCAP_A64_ASIMDRDM);
     GET_FEATURE(ARM_FEATURE_V8_FCMA, ARM_HWCAP_A64_FCMA);
+    GET_FEATURE(ARM_FEATURE_SVE, ARM_HWCAP_A64_SVE);
 #undef GET_FEATURE
 
     return hwcaps;
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_reset(CPUState *s)
         env->cp15.sctlr_el[1] |= SCTLR_UCT | SCTLR_UCI | SCTLR_DZE;
         /* and to the FP/Neon instructions */
         env->cp15.cpacr_el1 = deposit64(env->cp15.cpacr_el1, 20, 2, 3);
+        /* and to the SVE instructions */
+        env->cp15.cpacr_el1 = deposit64(env->cp15.cpacr_el1, 16, 2, 3);
+        env->cp15.cptr_el[3] |= CPTR_EZ;
+        /* with maximum vector length */
+        env->vfp.zcr_el[1] = ARM_MAX_VQ - 1;
+        env->vfp.zcr_el[2] = ARM_MAX_VQ - 1;
+        env->vfp.zcr_el[3] = ARM_MAX_VQ - 1;
 #else
         /* Reset into the highest available EL */
         if (arm_feature(env, ARM_FEATURE_EL3)) {
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
         set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
         set_feature(&cpu->env, ARM_FEATURE_V8_FP16);
         set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
+        set_feature(&cpu->env, ARM_FEATURE_SVE);
         /* For usermode -cpu max we can use a larger and more efficient DCZ
          * blocksize since we don't have to follow what the hardware does.
          */
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

We've already added the helpers with an SVE patch, all that remains
is to wire up the aa64 and aa32 translators.  Enable the feature
within -cpu max for CONFIG_USER_ONLY.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180627043328.11531-36-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h           |  1 +
 linux-user/elfload.c       |  1 +
 target/arm/cpu.c           |  1 +
 target/arm/cpu64.c         |  1 +
 target/arm/translate-a64.c | 36 +++++++++++++++++++
 target/arm/translate.c     | 74 +++++++++++++++++++++++++++-----------
 6 files changed, 93 insertions(+), 21 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ enum arm_features {
     ARM_FEATURE_V8_SM4, /* implements SM4 part of v8 Crypto Extensions */
     ARM_FEATURE_V8_ATOMICS, /* ARMv8.1-Atomics feature */
     ARM_FEATURE_V8_RDM, /* implements v8.1 simd round multiply */
+    ARM_FEATURE_V8_DOTPROD, /* implements v8.2 simd dot product */
     ARM_FEATURE_V8_FP16, /* implements v8.2 half-precision float */
     ARM_FEATURE_V8_FCMA, /* has complex number part of v8.3 extensions.  */
     ARM_FEATURE_M_MAIN, /* M profile Main Extension */
diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
                 ARM_HWCAP_A64_FPHP | ARM_HWCAP_A64_ASIMDHP);
     GET_FEATURE(ARM_FEATURE_V8_ATOMICS, ARM_HWCAP_A64_ATOMICS);
     GET_FEATURE(ARM_FEATURE_V8_RDM, ARM_HWCAP_A64_ASIMDRDM);
+    GET_FEATURE(ARM_FEATURE_V8_DOTPROD, ARM_HWCAP_A64_ASIMDDP);
     GET_FEATURE(ARM_FEATURE_V8_FCMA, ARM_HWCAP_A64_FCMA);
     GET_FEATURE(ARM_FEATURE_SVE, ARM_HWCAP_A64_SVE);
 #undef GET_FEATURE
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
         set_feature(&cpu->env, ARM_FEATURE_V8_PMULL);
         set_feature(&cpu->env, ARM_FEATURE_CRC);
         set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
+        set_feature(&cpu->env, ARM_FEATURE_V8_DOTPROD);
         set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
 #endif
     }
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
         set_feature(&cpu->env, ARM_FEATURE_CRC);
         set_feature(&cpu->env, ARM_FEATURE_V8_ATOMICS);
         set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
+        set_feature(&cpu->env, ARM_FEATURE_V8_DOTPROD);
         set_feature(&cpu->env, ARM_FEATURE_V8_FP16);
         set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
         set_feature(&cpu->env, ARM_FEATURE_SVE);
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_gvec_op3(DisasContext *s, bool is_q, int rd,
                    vec_full_reg_size(s), gvec_op);
 }
 
+/* Expand a 3-operand operation using an out-of-line helper.  */
+static void gen_gvec_op3_ool(DisasContext *s, bool is_q, int rd,
+                             int rn, int rm, int data, gen_helper_gvec_3 *fn)
+{
+    tcg_gen_gvec_3_ool(vec_full_reg_offset(s, rd),
+                       vec_full_reg_offset(s, rn),
+                       vec_full_reg_offset(s, rm),
+                       is_q ? 16 : 8, vec_full_reg_size(s), data, fn);
+}
+
 /* Expand a 3-operand + env pointer operation using
  * an out-of-line helper.
  */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
         }
         feature = ARM_FEATURE_V8_RDM;
         break;
+    case 0x02: /* SDOT (vector) */
+    case 0x12: /* UDOT (vector) */
+        if (size != MO_32) {
+            unallocated_encoding(s);
+            return;
+        }
+        feature = ARM_FEATURE_V8_DOTPROD;
+        break;
     case 0x8: /* FCMLA, #0 */
     case 0x9: /* FCMLA, #90 */
     case 0xa: /* FCMLA, #180 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_three_reg_same_extra(DisasContext *s, uint32_t insn)
         }
         return;
 
+    case 0x2: /* SDOT / UDOT */
+        gen_gvec_op3_ool(s, is_q, rd, rn, rm, 0,
+                         u ? gen_helper_gvec_udot_b : gen_helper_gvec_sdot_b);
+        return;
+
     case 0x8: /* FCMLA, #0 */
     case 0x9: /* FCMLA, #90 */
     case 0xa: /* FCMLA, #180 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
             return;
         }
         break;
+    case 0x0e: /* SDOT */
+    case 0x1e: /* UDOT */
+        if (size != MO_32 || !arm_dc_feature(s, ARM_FEATURE_V8_DOTPROD)) {
+            unallocated_encoding(s);
+            return;
+        }
+        break;
     case 0x11: /* FCMLA #0 */
     case 0x13: /* FCMLA #90 */
     case 0x15: /* FCMLA #180 */
@@ -XXX,XX +XXX,XX @@ static void disas_simd_indexed(DisasContext *s, uint32_t insn)
     }
 
     switch (16 * u + opcode) {
+    case 0x0e: /* SDOT */
+    case 0x1e: /* UDOT */
+        gen_gvec_op3_ool(s, is_q, rd, rn, rm, index,
+                         u ? gen_helper_gvec_udot_idx_b
+                         : gen_helper_gvec_sdot_idx_b);
+        return;
     case 0x11: /* FCMLA #0 */
     case 0x13: /* FCMLA #90 */
     case 0x15: /* FCMLA #180 */
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static int disas_neon_data_insn(DisasContext *s, uint32_t insn)
  */
 static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
 {
-    gen_helper_gvec_3_ptr *fn_gvec_ptr;
-    int rd, rn, rm, rot, size, opr_sz;
-    TCGv_ptr fpst;
+    gen_helper_gvec_3 *fn_gvec = NULL;
+    gen_helper_gvec_3_ptr *fn_gvec_ptr = NULL;
+    int rd, rn, rm, opr_sz;
+    int data = 0;
     bool q;
 
     q = extract32(insn, 6, 1);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
 
     if ((insn & 0xfe200f10) == 0xfc200800) {
         /* VCMLA -- 1111 110R R.1S .... .... 1000 ...0 .... */
-        size = extract32(insn, 20, 1);
-        rot = extract32(insn, 23, 2);
+        int size = extract32(insn, 20, 1);
+        data = extract32(insn, 23, 2); /* rot */
         if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)
             || (!size && !arm_dc_feature(s, ARM_FEATURE_V8_FP16))) {
             return 1;
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
         fn_gvec_ptr = size ? gen_helper_gvec_fcmlas : gen_helper_gvec_fcmlah;
     } else if ((insn & 0xfea00f10) == 0xfc800800) {
         /* VCADD -- 1111 110R 1.0S .... .... 1000 ...0 .... */
-        size = extract32(insn, 20, 1);
-        rot = extract32(insn, 24, 1);
+        int size = extract32(insn, 20, 1);
+        data = extract32(insn, 24, 1); /* rot */
         if (!arm_dc_feature(s, ARM_FEATURE_V8_FCMA)
             || (!size && !arm_dc_feature(s, ARM_FEATURE_V8_FP16))) {
             return 1;
         }
         fn_gvec_ptr = size ? gen_helper_gvec_fcadds : gen_helper_gvec_fcaddh;
+    } else if ((insn & 0xfeb00f00) == 0xfc200d00) {
+        /* V[US]DOT -- 1111 1100 0.10 .... .... 1101 .Q.U .... */
+        bool u = extract32(insn, 4, 1);
+        if (!arm_dc_feature(s, ARM_FEATURE_V8_DOTPROD)) {
+            return 1;
+        }
+        fn_gvec = u ? gen_helper_gvec_udot_b : gen_helper_gvec_sdot_b;
     } else {
         return 1;
     }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
     }
 
     opr_sz = (1 + q) * 8;
-    fpst = get_fpstatus_ptr(1);
-    tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
-                       vfp_reg_offset(1, rn),
-                       vfp_reg_offset(1, rm), fpst,
-                       opr_sz, opr_sz, rot, fn_gvec_ptr);
-    tcg_temp_free_ptr(fpst);
+    if (fn_gvec_ptr) {
+        TCGv_ptr fpst = get_fpstatus_ptr(1);
+        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
+                           vfp_reg_offset(1, rn),
+                           vfp_reg_offset(1, rm), fpst,
+                           opr_sz, opr_sz, data, fn_gvec_ptr);
+        tcg_temp_free_ptr(fpst);
+    } else {
+        tcg_gen_gvec_3_ool(vfp_reg_offset(1, rd),
+                           vfp_reg_offset(1, rn),
+                           vfp_reg_offset(1, rm),
+                           opr_sz, opr_sz, data, fn_gvec);
+    }
     return 0;
 }
 
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_3same_ext(DisasContext *s, uint32_t insn)
 
 static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
 {
-    gen_helper_gvec_3_ptr *fn_gvec_ptr;
+    gen_helper_gvec_3 *fn_gvec = NULL;
+    gen_helper_gvec_3_ptr *fn_gvec_ptr = NULL;
     int rd, rn, rm, opr_sz, data;
-    TCGv_ptr fpst;
     bool q;
 
     q = extract32(insn, 6, 1);
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
         data = (index << 2) | rot;
         fn_gvec_ptr = (size ? gen_helper_gvec_fcmlas_idx
                        : gen_helper_gvec_fcmlah_idx);
+    } else if ((insn & 0xffb00f00) == 0xfe200d00) {
+        /* V[US]DOT -- 1111 1110 0.10 .... .... 1101 .Q.U .... */
+        int u = extract32(insn, 4, 1);
+        if (!arm_dc_feature(s, ARM_FEATURE_V8_DOTPROD)) {
+            return 1;
+        }
+        fn_gvec = u ? gen_helper_gvec_udot_idx_b : gen_helper_gvec_sdot_idx_b;
+        /* rm is just Vm, and index is M.  */
+        data = extract32(insn, 5, 1); /* index */
+        rm = extract32(insn, 0, 4);
     } else {
         return 1;
     }
@@ -XXX,XX +XXX,XX @@ static int disas_neon_insn_2reg_scalar_ext(DisasContext *s, uint32_t insn)
     }
 
     opr_sz = (1 + q) * 8;
-    fpst = get_fpstatus_ptr(1);
-    tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
-                       vfp_reg_offset(1, rn),
-                       vfp_reg_offset(1, rm), fpst,
-                       opr_sz, opr_sz, data, fn_gvec_ptr);
-    tcg_temp_free_ptr(fpst);
+    if (fn_gvec_ptr) {
+        TCGv_ptr fpst = get_fpstatus_ptr(1);
+        tcg_gen_gvec_3_ptr(vfp_reg_offset(1, rd),
+                           vfp_reg_offset(1, rn),
+                           vfp_reg_offset(1, rm), fpst,
+                           opr_sz, opr_sz, data, fn_gvec_ptr);
+        tcg_temp_free_ptr(fpst);
+    } else {
+        tcg_gen_gvec_3_ool(vfp_reg_offset(1, rd),
+                           vfp_reg_offset(1, rn),
+                           vfp_reg_offset(1, rm),
+                           opr_sz, opr_sz, data, fn_gvec);
+    }
     return 0;
 }
 
-- 
2.17.1

From: Alex Bennée <alex.bennee@linaro.org>

Since kernel commit a86bd139f2 (arm64: arch_timer: Enable CNTVCT_EL0
trap..), released in kernel version v4.12, user-space has been able
to read these system registers. As we can't use QEMUTimer's in
linux-user mode we just directly call cpu_get_clock().

Signed-off-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180625160009.17437-2-alex.bennee@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 27 ++++++++++++++++++++++++---
 1 file changed, 24 insertions(+), 3 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
 };
 
 #else
-/* In user-mode none of the generic timer registers are accessible,
- * and their implementation depends on QEMU_CLOCK_VIRTUAL and qdev gpio outputs,
- * so instead just don't register any of them.
+
+/* In user-mode most of the generic timer registers are inaccessible
+ * however modern kernels (4.12+) allow access to cntvct_el0
  */
+
+static uint64_t gt_virt_cnt_read(CPUARMState *env, const ARMCPRegInfo *ri)
+{
+    /* Currently we have no support for QEMUTimer in linux-user so we
+     * can't call gt_get_countervalue(env), instead we directly
+     * call the lower level functions.
+     */
+    return cpu_get_clock() / GTIMER_SCALE;
+}
+
 static const ARMCPRegInfo generic_timer_cp_reginfo[] = {
+    { .name = "CNTFRQ_EL0", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 0, .opc2 = 0,
+      .type = ARM_CP_CONST, .access = PL0_R /* no PL1_RW in linux-user */,
+      .fieldoffset = offsetof(CPUARMState, cp15.c14_cntfrq),
+      .resetvalue = NANOSECONDS_PER_SECOND / GTIMER_SCALE,
+    },
+    { .name = "CNTVCT_EL0", .state = ARM_CP_STATE_AA64,
+      .opc0 = 3, .opc1 = 3, .crn = 14, .crm = 0, .opc2 = 2,
+      .access = PL0_R, .type = ARM_CP_NO_RAW | ARM_CP_IO,
+      .readfn = gt_virt_cnt_read,
+    },
     REGINFO_SENTINEL
 };
 
-- 
2.17.1

From: Jean-Christophe Dubois <jcd@tribudubois.net>

The qdev_get_gpio_in() function accept an int as second parameter.

Signed-off-by: Jean-Christophe Dubois <jcd@tribudubois.net>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/fsl-imx7.c | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/hw/arm/fsl-imx7.c b/hw/arm/fsl-imx7.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/fsl-imx7.c
+++ b/hw/arm/fsl-imx7.c
@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
             FSL_IMX7_ECSPI4_ADDR,
         };
 
-        static const hwaddr FSL_IMX7_SPIn_IRQ[FSL_IMX7_NUM_ECSPIS] = {
+        static const int FSL_IMX7_SPIn_IRQ[FSL_IMX7_NUM_ECSPIS] = {
             FSL_IMX7_ECSPI1_IRQ,
             FSL_IMX7_ECSPI2_IRQ,
             FSL_IMX7_ECSPI3_IRQ,
@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
             FSL_IMX7_I2C4_ADDR,
         };
 
-        static const hwaddr FSL_IMX7_I2Cn_IRQ[FSL_IMX7_NUM_I2CS] = {
+        static const int FSL_IMX7_I2Cn_IRQ[FSL_IMX7_NUM_I2CS] = {
             FSL_IMX7_I2C1_IRQ,
             FSL_IMX7_I2C2_IRQ,
             FSL_IMX7_I2C3_IRQ,
@@ -XXX,XX +XXX,XX @@ static void fsl_imx7_realize(DeviceState *dev, Error **errp)
             FSL_IMX7_USB3_ADDR,
         };
 
-        static const hwaddr FSL_IMX7_USBn_IRQ[FSL_IMX7_NUM_USBS] = {
+        static const int FSL_IMX7_USBn_IRQ[FSL_IMX7_NUM_USBS] = {
             FSL_IMX7_USB1_IRQ,
             FSL_IMX7_USB2_IRQ,
             FSL_IMX7_USB3_IRQ,
-- 
2.17.1

From: Aaron Lindsay <alindsay@codeaurora.org>

Signed-off-by: Aaron Lindsay <alindsay@codeaurora.org>
Message-id: 1529699547-17044-5-git-send-email-alindsay@codeaurora.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h   |  1 +
 target/arm/cpu.c   | 21 ++++++++++++++-------
 target/arm/kvm32.c |  8 ++++----
 3 files changed, 19 insertions(+), 11 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ enum arm_features {
     ARM_FEATURE_OMAPCP, /* OMAP specific CP15 ops handling.  */
     ARM_FEATURE_THUMB2EE,
     ARM_FEATURE_V7MP,    /* v7 Multiprocessing Extensions */
+    ARM_FEATURE_V7VE, /* v7 Virtualization Extensions (non-EL2 parts) */
     ARM_FEATURE_V4T,
     ARM_FEATURE_V5,
     ARM_FEATURE_STRONGARM,
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_cpu_realizefn(DeviceState *dev, Error **errp)
 
     /* Some features automatically imply others: */
     if (arm_feature(env, ARM_FEATURE_V8)) {
-        set_feature(env, ARM_FEATURE_V7);
+        set_feature(env, ARM_FEATURE_V7VE);
+    }
+    if (arm_feature(env, ARM_FEATURE_V7VE)) {
+        /* v7 Virtualization Extensions. In real hardware this implies
+         * EL2 and also the presence of the Security Extensions.
+         * For QEMU, for backwards-compatibility we implement some
+         * CPUs or CPU configs which have no actual EL2 or EL3 but do
+         * include the various other features that V7VE implies.
+         * Presence of EL2 itself is ARM_FEATURE_EL2, and of the
+         * Security Extensions is ARM_FEATURE_EL3.
+         */
         set_feature(env, ARM_FEATURE_ARM_DIV);
         set_feature(env, ARM_FEATURE_LPAE);
+        set_feature(env, ARM_FEATURE_V7);
     }
     if (arm_feature(env, ARM_FEATURE_V7)) {
         set_feature(env, ARM_FEATURE_VAPA);
@@ -XXX,XX +XXX,XX @@ static void cortex_a7_initfn(Object *obj)
     ARMCPU *cpu = ARM_CPU(obj);
 
     cpu->dtb_compatible = "arm,cortex-a7";
-    set_feature(&cpu->env, ARM_FEATURE_V7);
+    set_feature(&cpu->env, ARM_FEATURE_V7VE);
     set_feature(&cpu->env, ARM_FEATURE_VFP4);
     set_feature(&cpu->env, ARM_FEATURE_NEON);
     set_feature(&cpu->env, ARM_FEATURE_THUMB2EE);
-    set_feature(&cpu->env, ARM_FEATURE_ARM_DIV);
     set_feature(&cpu->env, ARM_FEATURE_GENERIC_TIMER);
     set_feature(&cpu->env, ARM_FEATURE_DUMMY_C15_REGS);
     set_feature(&cpu->env, ARM_FEATURE_CBAR_RO);
-    set_feature(&cpu->env, ARM_FEATURE_LPAE);
     set_feature(&cpu->env, ARM_FEATURE_EL3);
     cpu->kvm_target = QEMU_KVM_ARM_TARGET_CORTEX_A7;
     cpu->midr = 0x410fc075;
@@ -XXX,XX +XXX,XX @@ static void cortex_a15_initfn(Object *obj)
     ARMCPU *cpu = ARM_CPU(obj);
 
     cpu->dtb_compatible = "arm,cortex-a15";
-    set_feature(&cpu->env, ARM_FEATURE_V7);
+    set_feature(&cpu->env, ARM_FEATURE_V7VE);
     set_feature(&cpu->env, ARM_FEATURE_VFP4);
     set_feature(&cpu->env, ARM_FEATURE_NEON);
     set_feature(&cpu->env, ARM_FEATURE_THUMB2EE);
-    set_feature(&cpu->env, ARM_FEATURE_ARM_DIV);
     set_feature(&cpu->env, ARM_FEATURE_GENERIC_TIMER);
     set_feature(&cpu->env, ARM_FEATURE_DUMMY_C15_REGS);
     set_feature(&cpu->env, ARM_FEATURE_CBAR_RO);
-    set_feature(&cpu->env, ARM_FEATURE_LPAE);
     set_feature(&cpu->env, ARM_FEATURE_EL3);
     cpu->kvm_target = QEMU_KVM_ARM_TARGET_CORTEX_A15;
     cpu->midr = 0x412fc0f1;
diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/kvm32.c
+++ b/target/arm/kvm32.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
     /* Now we've retrieved all the register information we can
      * set the feature bits based on the ID register fields.
      * We can assume any KVM supporting CPU is at least a v7
-     * with VFPv3, LPAE and the generic timers; this in turn implies
-     * most of the other feature bits, but a few must be tested.
+     * with VFPv3, virtualization extensions, and the generic
+     * timers; this in turn implies most of the other feature
+     * bits, but a few must be tested.
      */
-    set_feature(&features, ARM_FEATURE_V7);
+    set_feature(&features, ARM_FEATURE_V7VE);
     set_feature(&features, ARM_FEATURE_VFP3);
-    set_feature(&features, ARM_FEATURE_LPAE);
     set_feature(&features, ARM_FEATURE_GENERIC_TIMER);
 
     switch (extract32(id_isar0, 24, 4)) {
-- 
2.17.1

From: Aaron Lindsay <alindsay@codeaurora.org>

KVM implies V7VE, which implies ARM_DIV and THUMB_DIV. The conditional
detection here is therefore unnecessary. Because V7VE is already
unconditionally specified for all KVM hosts, ARM_DIV and THUMB_DIV are
already indirectly specified and do not need to be included here at all.

Signed-off-by: Aaron Lindsay <alindsay@codeaurora.org>
Message-id: 1529699547-17044-6-git-send-email-alindsay@codeaurora.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/kvm32.c | 19 +------------------
 1 file changed, 1 insertion(+), 18 deletions(-)

diff --git a/target/arm/kvm32.c b/target/arm/kvm32.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/kvm32.c
+++ b/target/arm/kvm32.c
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
      * and then query that CPU for the relevant ID registers.
      */
     int i, ret, fdarray[3];
-    uint32_t midr, id_pfr0, id_isar0, mvfr1;
+    uint32_t midr, id_pfr0, mvfr1;
     uint64_t features = 0;
     /* Old kernels may not know about the PREFERRED_TARGET ioctl: however
      * we know these will only support creating one kind of guest CPU,
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
             | ENCODE_CP_REG(15, 0, 0, 0, 1, 0, 0),
             .addr = (uintptr_t)&id_pfr0,
         },
-        {
-            .id = KVM_REG_ARM | KVM_REG_SIZE_U32
-            | ENCODE_CP_REG(15, 0, 0, 0, 2, 0, 0),
-            .addr = (uintptr_t)&id_isar0,
-        },
         {
             .id = KVM_REG_ARM | KVM_REG_SIZE_U32
             | KVM_REG_ARM_VFP | KVM_REG_ARM_VFP_MVFR1,
@@ -XXX,XX +XXX,XX @@ bool kvm_arm_get_host_cpu_features(ARMHostCPUFeatures *ahcf)
     set_feature(&features, ARM_FEATURE_VFP3);
     set_feature(&features, ARM_FEATURE_GENERIC_TIMER);
 
-    switch (extract32(id_isar0, 24, 4)) {
-    case 1:
-        set_feature(&features, ARM_FEATURE_THUMB_DIV);
-        break;
-    case 2:
-        set_feature(&features, ARM_FEATURE_ARM_DIV);
-        set_feature(&features, ARM_FEATURE_THUMB_DIV);
-        break;
-    default:
-        break;
-    }
-
     if (extract32(id_pfr0, 12, 4) == 1) {
         set_feature(&features, ARM_FEATURE_THUMB2EE);
     }
-- 
2.17.1

From: Aaron Lindsay <alindsay@codeaurora.org>

This makes it match its AArch64 equivalent, PMINTENSET_EL1

Signed-off-by: Aaron Lindsay <alindsay@codeaurora.org>
Message-id: 1529699547-17044-13-git-send-email-alindsay@codeaurora.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v7_cp_reginfo[] = {
       .writefn = pmuserenr_write, .raw_writefn = raw_write },
     { .name = "PMINTENSET", .cp = 15, .crn = 9, .crm = 14, .opc1 = 0, .opc2 = 1,
       .access = PL1_RW, .accessfn = access_tpm,
-      .type = ARM_CP_ALIAS,
+      .type = ARM_CP_ALIAS | ARM_CP_IO,
       .fieldoffset = offsetoflow32(CPUARMState, cp15.c9_pminten),
       .resetvalue = 0,
       .writefn = pmintenset_write, .raw_writefn = raw_write },
-- 
2.17.1

We don't actually implement SD command CRC checking, because
for almost all of our SD controllers the CRC generation is
done in hardware, and so modelling CRC generation and checking
would be a bit pointless. (The exception is that milkymist-memcard
makes the guest software compute the CRC.)

As a result almost all of our SD controller models don't bother
to set the SDRequest crc field, and the SD card model doesn't
check it. So the tracing of it in sdbus_do_command() provokes
Coverity warnings about use of uninitialized data.

Drop the CRC field from the trace; we can always add it back
if and when we do anything useful with the CRC.

Fixes Coverity issues 1386072, 1386074, 1386076, 1390571.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20180626180324.5537-1-peter.maydell@linaro.org
---
 hw/sd/core.c       | 2 +-
 hw/sd/trace-events | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/hw/sd/core.c b/hw/sd/core.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/core.c
+++ b/hw/sd/core.c
@@ -XXX,XX +XXX,XX @@ int sdbus_do_command(SDBus *sdbus, SDRequest *req, uint8_t *response)
 {
     SDState *card = get_card(sdbus);
 
-    trace_sdbus_command(sdbus_name(sdbus), req->cmd, req->arg, req->crc);
+    trace_sdbus_command(sdbus_name(sdbus), req->cmd, req->arg);
     if (card) {
         SDCardClass *sc = SD_CARD_GET_CLASS(card);
 
diff --git a/hw/sd/trace-events b/hw/sd/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/trace-events
+++ b/hw/sd/trace-events
@@ -XXX,XX +XXX,XX @@ bcm2835_sdhost_edm_change(const char *why, uint32_t edm) "(%s) EDM now 0x%x"
 bcm2835_sdhost_update_irq(uint32_t irq) "IRQ bits 0x%x\n"
 
 # hw/sd/core.c
-sdbus_command(const char *bus_name, uint8_t cmd, uint32_t arg, uint8_t crc) "@%s CMD%02d arg 0x%08x crc 0x%02x"
+sdbus_command(const char *bus_name, uint8_t cmd, uint32_t arg) "@%s CMD%02d arg 0x%08x"
 sdbus_read(const char *bus_name, uint8_t value) "@%s value 0x%02x"
 sdbus_write(const char *bus_name, uint8_t value) "@%s value 0x%02x"
 sdbus_set_voltage(const char *bus_name, uint16_t millivolts) "@%s %u (mV)"
-- 
2.17.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

The load/store API will ease further code movement.

Per the Physical Layer Simplified Spec. "3.6 Bus Protocol":

"In the CMD line the Most Significant Bit (MSB) is transmitted
   first, the Least Significant Bit (LSB) is the last."

Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/sd/bcm2835_sdhost.c    | 13 +++++--------
 hw/sd/milkymist-memcard.c |  3 +--
 hw/sd/omap_mmc.c          |  6 ++----
 hw/sd/pl181.c             | 11 ++++-------
 hw/sd/sdhci.c             | 15 +++++----------
 hw/sd/ssi-sd.c            |  6 ++----
 6 files changed, 19 insertions(+), 35 deletions(-)

diff --git a/hw/sd/bcm2835_sdhost.c b/hw/sd/bcm2835_sdhost.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/bcm2835_sdhost.c
+++ b/hw/sd/bcm2835_sdhost.c
@@ -XXX,XX +XXX,XX @@ static void bcm2835_sdhost_send_command(BCM2835SDHostState *s)
         goto error;
     }
     if (!(s->cmd & SDCMD_NO_RESPONSE)) {
-#define RWORD(n) (((uint32_t)rsp[n] << 24) | (rsp[n + 1] << 16) \
-                  | (rsp[n + 2] << 8) | rsp[n + 3])
         if (rlen == 0 || (rlen == 4 && (s->cmd & SDCMD_LONG_RESPONSE))) {
             goto error;
         }
@@ -XXX,XX +XXX,XX @@ static void bcm2835_sdhost_send_command(BCM2835SDHostState *s)
             goto error;
         }
         if (rlen == 4) {
-            s->rsp[0] = RWORD(0);
+            s->rsp[0] = ldl_be_p(&rsp[0]);
             s->rsp[1] = s->rsp[2] = s->rsp[3] = 0;
         } else {
-            s->rsp[0] = RWORD(12);
-            s->rsp[1] = RWORD(8);
-            s->rsp[2] = RWORD(4);
-            s->rsp[3] = RWORD(0);
+            s->rsp[0] = ldl_be_p(&rsp[12]);
+            s->rsp[1] = ldl_be_p(&rsp[8]);
+            s->rsp[2] = ldl_be_p(&rsp[4]);
+            s->rsp[3] = ldl_be_p(&rsp[0]);
         }
-#undef RWORD
     }
     /* We never really delay commands, so if this was a 'busywait' command
      * then we've completed it now and can raise the interrupt.
diff --git a/hw/sd/milkymist-memcard.c b/hw/sd/milkymist-memcard.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/milkymist-memcard.c
+++ b/hw/sd/milkymist-memcard.c
@@ -XXX,XX +XXX,XX @@ static void memcard_sd_command(MilkymistMemcardState *s)
     SDRequest req;
 
     req.cmd = s->command[0] & 0x3f;
-    req.arg = (s->command[1] << 24) | (s->command[2] << 16)
-              | (s->command[3] << 8) | s->command[4];
+    req.arg = ldl_be_p(s->command + 1);
     req.crc = s->command[5];
 
     s->response[0] = req.cmd;
diff --git a/hw/sd/omap_mmc.c b/hw/sd/omap_mmc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/omap_mmc.c
+++ b/hw/sd/omap_mmc.c
@@ -XXX,XX +XXX,XX @@ static void omap_mmc_command(struct omap_mmc_s *host, int cmd, int dir,
                 CID_CSD_OVERWRITE;
         if (host->sdio & (1 << 13))
             mask |= AKE_SEQ_ERROR;
-        rspstatus = (response[0] << 24) | (response[1] << 16) |
-                (response[2] << 8) | (response[3] << 0);
+        rspstatus = ldl_be_p(response);
         break;
 
     case sd_r2:
@@ -XXX,XX +XXX,XX @@ static void omap_mmc_command(struct omap_mmc_s *host, int cmd, int dir,
         }
         rsplen = 4;
 
-        rspstatus = (response[0] << 24) | (response[1] << 16) |
-                (response[2] << 8) | (response[3] << 0);
+        rspstatus = ldl_be_p(response);
         if (rspstatus & 0x80000000)
             host->status &= 0xe000;
         else
diff --git a/hw/sd/pl181.c b/hw/sd/pl181.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/pl181.c
+++ b/hw/sd/pl181.c
@@ -XXX,XX +XXX,XX @@ static void pl181_send_command(PL181State *s)
     if (rlen < 0)
         goto error;
     if (s->cmd & PL181_CMD_RESPONSE) {
-#define RWORD(n) (((uint32_t)response[n] << 24) | (response[n + 1] << 16) \
-                  | (response[n + 2] << 8) | response[n + 3])
         if (rlen == 0 || (rlen == 4 && (s->cmd & PL181_CMD_LONGRESP)))
             goto error;
         if (rlen != 4 && rlen != 16)
             goto error;
-        s->response[0] = RWORD(0);
+        s->response[0] = ldl_be_p(&response[0]);
         if (rlen == 4) {
             s->response[1] = s->response[2] = s->response[3] = 0;
         } else {
-            s->response[1] = RWORD(4);
-            s->response[2] = RWORD(8);
-            s->response[3] = RWORD(12) & ~1;
+            s->response[1] = ldl_be_p(&response[4]);
+            s->response[2] = ldl_be_p(&response[8]);
+            s->response[3] = ldl_be_p(&response[12]) & ~1;
         }
         DPRINTF("Response received\n");
         s->status |= PL181_STATUS_CMDRESPEND;
-#undef RWORD
     } else {
         DPRINTF("Command sent\n");
         s->status |= PL181_STATUS_CMDSENT;
diff --git a/hw/sd/sdhci.c b/hw/sd/sdhci.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/sdhci.c
+++ b/hw/sd/sdhci.c
@@ -XXX,XX +XXX,XX @@ static void sdhci_send_command(SDHCIState *s)
 
     if (s->cmdreg & SDHC_CMD_RESPONSE) {
         if (rlen == 4) {
-            s->rspreg[0] = (response[0] << 24) | (response[1] << 16) |
-                           (response[2] << 8)  |  response[3];
+            s->rspreg[0] = ldl_be_p(response);
             s->rspreg[1] = s->rspreg[2] = s->rspreg[3] = 0;
             trace_sdhci_response4(s->rspreg[0]);
         } else if (rlen == 16) {
-            s->rspreg[0] = (response[11] << 24) | (response[12] << 16) |
-                           (response[13] << 8) |  response[14];
-            s->rspreg[1] = (response[7] << 24) | (response[8] << 16) |
-                           (response[9] << 8)  |  response[10];
-            s->rspreg[2] = (response[3] << 24) | (response[4] << 16) |
-                           (response[5] << 8)  |  response[6];
+            s->rspreg[0] = ldl_be_p(&response[11]);
+            s->rspreg[1] = ldl_be_p(&response[7]);
+            s->rspreg[2] = ldl_be_p(&response[3]);
             s->rspreg[3] = (response[0] << 16) | (response[1] << 8) |
                             response[2];
             trace_sdhci_response16(s->rspreg[3], s->rspreg[2],
@@ -XXX,XX +XXX,XX @@ static void sdhci_end_transfer(SDHCIState *s)
         trace_sdhci_end_transfer(request.cmd, request.arg);
         sdbus_do_command(&s->sdbus, &request, response);
         /* Auto CMD12 response goes to the upper Response register */
-        s->rspreg[3] = (response[0] << 24) | (response[1] << 16) |
-                (response[2] << 8) | response[3];
+        s->rspreg[3] = ldl_be_p(response);
     }
 
     s->prnsts &= ~(SDHC_DOING_READ | SDHC_DOING_WRITE |
diff --git a/hw/sd/ssi-sd.c b/hw/sd/ssi-sd.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/ssi-sd.c
+++ b/hw/sd/ssi-sd.c
@@ -XXX,XX +XXX,XX @@ static uint32_t ssi_sd_transfer(SSISlave *dev, uint32_t val)
             uint8_t longresp[16];
             /* FIXME: Check CRC.  */
             request.cmd = s->cmd;
-            request.arg = (s->cmdarg[0] << 24) | (s->cmdarg[1] << 16)
-                           | (s->cmdarg[2] << 8) | s->cmdarg[3];
+            request.arg = ldl_be_p(s->cmdarg);
             DPRINTF("CMD%d arg 0x%08x\n", s->cmd, request.arg);
             s->arglen = sdbus_do_command(&s->sdbus, &request, longresp);
             if (s->arglen <= 0) {
@@ -XXX,XX +XXX,XX @@ static uint32_t ssi_sd_transfer(SSISlave *dev, uint32_t val)
                 /* CMD13 returns a 2-byte statuse work. Other commands
                    only return the first byte.  */
                 s->arglen = (s->cmd == 13) ? 2 : 1;
-                cardstatus = (longresp[0] << 24) | (longresp[1] << 16)
-                             | (longresp[2] << 8) | longresp[3];
+                cardstatus = ldl_be_p(longresp);
                 status = 0;
                 if (((cardstatus >> 9) & 0xf) < 4)
                     status |= SSI_SDR_IDLE;
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

We already check for the same condition within the normal integer
sdiv and sdiv64 helpers.  Use a slightly different formation that
does not require deducing the expression type.

Fixes: f97cfd596ed
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20180629001538.11415-2-richard.henderson@linaro.org
[PMM: reworded a comment]
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/sve_helper.c | 20 +++++++++++++++-----
 1 file changed, 15 insertions(+), 5 deletions(-)

diff --git a/target/arm/sve_helper.c b/target/arm/sve_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/sve_helper.c
+++ b/target/arm/sve_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *vg, uint32_t desc) \
 #define DO_MIN(N, M)  ((N) >= (M) ? (M) : (N))
 #define DO_ABD(N, M)  ((N) >= (M) ? (N) - (M) : (M) - (N))
 #define DO_MUL(N, M)  (N * M)
-#define DO_DIV(N, M)  (M ? N / M : 0)
+
+
+/*
+ * We must avoid the C undefined behaviour cases: division by
+ * zero and signed division of INT_MIN by -1. Both of these
+ * have architecturally defined required results for Arm.
+ * We special case all signed divisions by -1 to avoid having
+ * to deduce the minimum integer for the type involved.
+ */
+#define DO_SDIV(N, M) (unlikely(M == 0) ? 0 : unlikely(M == -1) ? -N : N / M)
+#define DO_UDIV(N, M) (unlikely(M == 0) ? 0 : N / M)
 
 DO_ZPZZ(sve_and_zpzz_b, uint8_t, H1, DO_AND)
 DO_ZPZZ(sve_and_zpzz_h, uint16_t, H1_2, DO_AND)
@@ -XXX,XX +XXX,XX @@ DO_ZPZZ(sve_umulh_zpzz_h, uint16_t, H1_2, do_mulh_h)
 DO_ZPZZ(sve_umulh_zpzz_s, uint32_t, H1_4, do_mulh_s)
 DO_ZPZZ_D(sve_umulh_zpzz_d, uint64_t, do_umulh_d)
 
-DO_ZPZZ(sve_sdiv_zpzz_s, int32_t, H1_4, DO_DIV)
-DO_ZPZZ_D(sve_sdiv_zpzz_d, int64_t, DO_DIV)
+DO_ZPZZ(sve_sdiv_zpzz_s, int32_t, H1_4, DO_SDIV)
+DO_ZPZZ_D(sve_sdiv_zpzz_d, int64_t, DO_SDIV)
 
-DO_ZPZZ(sve_udiv_zpzz_s, uint32_t, H1_4, DO_DIV)
-DO_ZPZZ_D(sve_udiv_zpzz_d, uint64_t, DO_DIV)
+DO_ZPZZ(sve_udiv_zpzz_s, uint32_t, H1_4, DO_UDIV)
+DO_ZPZZ_D(sve_udiv_zpzz_d, uint64_t, DO_UDIV)
 
 /* Note that all bits of the shift are significant
    and not modulo the element size.  */
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Leave ARM_CP_SVE, removing ARM_CP_FPU; the sve_access_check
produced by the flag already includes fp_access_check.  If
we also check ARM_CP_FPU the double fp_access_check asserts.

Reported-by: Laurent Desnogues <laurent.desnogues@gmail.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Laurent Desnogues <laurent.desnogues@gmail.com>
Message-id: 20180629001538.11415-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.c        | 8 ++++----
 target/arm/translate-a64.c | 5 ++---
 2 files changed, 6 insertions(+), 7 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void zcr_write(CPUARMState *env, const ARMCPRegInfo *ri,
 static const ARMCPRegInfo zcr_el1_reginfo = {
     .name = "ZCR_EL1", .state = ARM_CP_STATE_AA64,
     .opc0 = 3, .opc1 = 0, .crn = 1, .crm = 2, .opc2 = 0,
-    .access = PL1_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
+    .access = PL1_RW, .type = ARM_CP_SVE,
     .fieldoffset = offsetof(CPUARMState, vfp.zcr_el[1]),
     .writefn = zcr_write, .raw_writefn = raw_write
 };
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo zcr_el1_reginfo = {
 static const ARMCPRegInfo zcr_el2_reginfo = {
     .name = "ZCR_EL2", .state = ARM_CP_STATE_AA64,
     .opc0 = 3, .opc1 = 4, .crn = 1, .crm = 2, .opc2 = 0,
-    .access = PL2_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
+    .access = PL2_RW, .type = ARM_CP_SVE,
     .fieldoffset = offsetof(CPUARMState, vfp.zcr_el[2]),
     .writefn = zcr_write, .raw_writefn = raw_write
 };
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo zcr_el2_reginfo = {
 static const ARMCPRegInfo zcr_no_el2_reginfo = {
     .name = "ZCR_EL2", .state = ARM_CP_STATE_AA64,
     .opc0 = 3, .opc1 = 4, .crn = 1, .crm = 2, .opc2 = 0,
-    .access = PL2_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
+    .access = PL2_RW, .type = ARM_CP_SVE,
     .readfn = arm_cp_read_zero, .writefn = arm_cp_write_ignore
 };
 
 static const ARMCPRegInfo zcr_el3_reginfo = {
     .name = "ZCR_EL3", .state = ARM_CP_STATE_AA64,
     .opc0 = 3, .opc1 = 6, .crn = 1, .crm = 2, .opc2 = 0,
-    .access = PL3_RW, .type = ARM_CP_SVE | ARM_CP_FPU,
+    .access = PL3_RW, .type = ARM_CP_SVE,
     .fieldoffset = offsetof(CPUARMState, vfp.zcr_el[3]),
     .writefn = zcr_write, .raw_writefn = raw_write
 };
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_sys(DisasContext *s, uint32_t insn, bool isread,
     default:
         break;
     }
-    if ((ri->type & ARM_CP_SVE) && !sve_access_check(s)) {
-        return;
-    }
     if ((ri->type & ARM_CP_FPU) && !fp_access_check(s)) {
         return;
+    } else if ((ri->type & ARM_CP_SVE) && !sve_access_check(s)) {
+        return;
     }
 
     if ((tb_cflags(s->base.tb) & CF_USE_ICOUNT) && (ri->type & ARM_CP_IO)) {
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

There is no need to re-set these 9 features already
implied by the call to aarch64_a57_initfn.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20180629001538.11415-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu64.c | 9 ---------
 1 file changed, 9 deletions(-)

diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
          * whereas the architecture requires them to be present in both if
          * present in either.
          */
-        set_feature(&cpu->env, ARM_FEATURE_V8);
-        set_feature(&cpu->env, ARM_FEATURE_VFP4);
-        set_feature(&cpu->env, ARM_FEATURE_NEON);
-        set_feature(&cpu->env, ARM_FEATURE_AARCH64);
-        set_feature(&cpu->env, ARM_FEATURE_V8_AES);
-        set_feature(&cpu->env, ARM_FEATURE_V8_SHA1);
-        set_feature(&cpu->env, ARM_FEATURE_V8_SHA256);
         set_feature(&cpu->env, ARM_FEATURE_V8_SHA512);
         set_feature(&cpu->env, ARM_FEATURE_V8_SHA3);
         set_feature(&cpu->env, ARM_FEATURE_V8_SM3);
         set_feature(&cpu->env, ARM_FEATURE_V8_SM4);
-        set_feature(&cpu->env, ARM_FEATURE_V8_PMULL);
-        set_feature(&cpu->env, ARM_FEATURE_CRC);
         set_feature(&cpu->env, ARM_FEATURE_V8_ATOMICS);
         set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
         set_feature(&cpu->env, ARM_FEATURE_V8_DOTPROD);
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

There is no need to re-set these 3 features already
implied by the call to aarch64_a15_initfn.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20180629001538.11415-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.c | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
          * since we don't correctly set the ID registers to advertise them,
          */
         set_feature(&cpu->env, ARM_FEATURE_V8);
-        set_feature(&cpu->env, ARM_FEATURE_VFP4);
-        set_feature(&cpu->env, ARM_FEATURE_NEON);
-        set_feature(&cpu->env, ARM_FEATURE_THUMB2EE);
         set_feature(&cpu->env, ARM_FEATURE_V8_AES);
         set_feature(&cpu->env, ARM_FEATURE_V8_SHA1);
         set_feature(&cpu->env, ARM_FEATURE_V8_SHA256);
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

This register was added to aa32 state by ARMv8.2.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20180629001538.11415-6-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h    | 1 +
 target/arm/cpu.c    | 4 ++++
 target/arm/cpu64.c  | 2 ++
 target/arm/helper.c | 5 ++---
 4 files changed, 9 insertions(+), 3 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ struct ARMCPU {
     uint32_t id_isar3;
     uint32_t id_isar4;
     uint32_t id_isar5;
+    uint32_t id_isar6;
     uint64_t id_aa64pfr0;
     uint64_t id_aa64pfr1;
     uint64_t id_aa64dfr0;
diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void cortex_m3_initfn(Object *obj)
     cpu->id_isar3 = 0x01111110;
     cpu->id_isar4 = 0x01310102;
     cpu->id_isar5 = 0x00000000;
+    cpu->id_isar6 = 0x00000000;
 }
 
 static void cortex_m4_initfn(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void cortex_m4_initfn(Object *obj)
     cpu->id_isar3 = 0x01111110;
     cpu->id_isar4 = 0x01310102;
     cpu->id_isar5 = 0x00000000;
+    cpu->id_isar6 = 0x00000000;
 }
 
 static void cortex_m33_initfn(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void cortex_m33_initfn(Object *obj)
     cpu->id_isar3 = 0x01111131;
     cpu->id_isar4 = 0x01310132;
     cpu->id_isar5 = 0x00000000;
+    cpu->id_isar6 = 0x00000000;
     cpu->clidr = 0x00000000;
     cpu->ctr = 0x8000c000;
 }
@@ -XXX,XX +XXX,XX @@ static void cortex_r5_initfn(Object *obj)
     cpu->id_isar3 = 0x01112131;
     cpu->id_isar4 = 0x0010142;
     cpu->id_isar5 = 0x0;
+    cpu->id_isar6 = 0x0;
     cpu->mp_is_up = true;
     cpu->pmsav7_dregion = 16;
     define_arm_cp_regs(cpu, cortexr5_cp_reginfo);
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_a57_initfn(Object *obj)
     cpu->id_isar3 = 0x01112131;
     cpu->id_isar4 = 0x00011142;
     cpu->id_isar5 = 0x00011121;
+    cpu->id_isar6 = 0;
     cpu->id_aa64pfr0 = 0x00002222;
     cpu->id_aa64dfr0 = 0x10305106;
     cpu->pmceid0 = 0x00000000;
@@ -XXX,XX +XXX,XX @@ static void aarch64_a53_initfn(Object *obj)
     cpu->id_isar3 = 0x01112131;
     cpu->id_isar4 = 0x00011142;
     cpu->id_isar5 = 0x00011121;
+    cpu->id_isar6 = 0;
     cpu->id_aa64pfr0 = 0x00002222;
     cpu->id_aa64dfr0 = 0x10305106;
     cpu->id_aa64isar0 = 0x00011120;
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ void register_cp_regs_for_features(ARMCPU *cpu)
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 6,
               .access = PL1_R, .type = ARM_CP_CONST,
               .resetvalue = cpu->id_mmfr4 },
-            /* 7 is as yet unallocated and must RAZ */
-            { .name = "ID_ISAR7_RESERVED", .state = ARM_CP_STATE_BOTH,
+            { .name = "ID_ISAR6", .state = ARM_CP_STATE_BOTH,
               .opc0 = 3, .opc1 = 0, .crn = 0, .crm = 2, .opc2 = 7,
               .access = PL1_R, .type = ARM_CP_CONST,
-              .resetvalue = 0 },
+              .resetvalue = cpu->id_isar6 },
             REGINFO_SENTINEL
         };
         define_arm_cp_regs(cpu, v6_idregs);
-- 
2.17.1

Hi; here's the first target-arm pullreq for the 7.0 cycle.

thanks
-- PMM

The following changes since commit 76b56fdfc9fa43ec6e5986aee33f108c6c6a511e:

Merge tag 'block-pull-request' of https://gitlab.com/stefanha/qemu into staging (2021-12-14 12:46:18 -0800)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20211215

for you to fetch changes up to aed176558806674d030a8305d989d4e6a5073359:

tests/acpi: add expected blob for VIOT test on virt machine (2021-12-15 10:35:26 +0000)

----------------------------------------------------------------
target-arm queue:
 * ITS: error reporting cleanup
 * aspeed: improve documentation
 * Fix STM32F2XX USART data register readout
 * allow emulated GICv3 to be disabled in non-TCG builds
 * fix exception priority for singlestep, misaligned PC, bp, etc
 * Correct calculation of tlb range invalidate length
 * npcm7xx_emc: fix missing queue_flush
 * virt: Add VIOT ACPI table for virtio-iommu
 * target/i386: Use assert() to sanity-check b1 in SSE decode
 * Don't include qemu-common unnecessarily

----------------------------------------------------------------
Alex Bennée (1):
      hw/intc: clean-up error reporting for failed ITS cmd

Jean-Philippe Brucker (8):
      hw/arm/virt-acpi-build: Add VIOT table for virtio-iommu
      hw/arm/virt: Remove device tree restriction for virtio-iommu
      hw/arm/virt: Reject instantiation of multiple IOMMUs
      hw/arm/virt: Use object_property_set instead of qdev_prop_set
      tests/acpi: allow updates of VIOT expected data files
      tests/acpi: add test case for VIOT
      tests/acpi: add expected blobs for VIOT test on q35 machine
      tests/acpi: add expected blob for VIOT test on virt machine

Joel Stanley (4):
      docs: aspeed: Add new boards
      docs: aspeed: Update OpenBMC image URL
      docs: aspeed: Give an example of booting a kernel
      docs: aspeed: ADC is now modelled

Olivier Hériveaux (1):
      Fix STM32F2XX USART data register readout

Patrick Venture (1):
      hw/net: npcm7xx_emc fix missing queue_flush

Peter Maydell (6):
      target/i386: Use assert() to sanity-check b1 in SSE decode
      include/hw/i386: Don't include qemu-common.h in .h files
      target/hexagon/cpu.h: don't include qemu-common.h
      target/rx/cpu.h: Don't include qemu-common.h
      hw/arm: Don't include qemu-common.h unnecessarily
      target/arm: Correct calculation of tlb range invalidate length

Philippe Mathieu-Daudé (2):
      hw/intc/arm_gicv3: Extract gicv3_set_gicv3state from arm_gicv3_cpuif.c
      hw/intc/arm_gicv3: Introduce CONFIG_ARM_GIC_TCG Kconfig selector

Richard Henderson (10):
      target/arm: Hoist pc_next to a local variable in aarch64_tr_translate_insn
      target/arm: Hoist pc_next to a local variable in arm_tr_translate_insn
      target/arm: Hoist pc_next to a local variable in thumb_tr_translate_insn
      target/arm: Split arm_pre_translate_insn
      target/arm: Advance pc for arch single-step exception
      target/arm: Split compute_fsr_fsc out of arm_deliver_fault
      target/arm: Take an exception if PC is misaligned
      target/arm: Assert thumb pc is aligned
      target/arm: Suppress bp for exceptions with more priority
      tests/tcg: Add arm and aarch64 pc alignment tests

docs/system/arm/aspeed.rst        |  26 ++++++++++++----
 include/hw/i386/microvm.h         |   1 -
 include/hw/i386/x86.h             |   1 -
 target/arm/helper.h               |   1 +
 target/arm/syndrome.h             |   5 +++
 target/hexagon/cpu.h              |   1 -
 target/rx/cpu.h                   |   1 -
 hw/arm/boot.c                     |   1 -
 hw/arm/digic_boards.c             |   1 -
 hw/arm/highbank.c                 |   1 -
 hw/arm/npcm7xx_boards.c           |   1 -
 hw/arm/sbsa-ref.c                 |   1 -
 hw/arm/stm32f405_soc.c            |   1 -
 hw/arm/vexpress.c                 |   1 -
 hw/arm/virt-acpi-build.c          |   7 +++++
 hw/arm/virt.c                     |  21 ++++++-------
 hw/char/stm32f2xx_usart.c         |   3 +-
 hw/intc/arm_gicv3.c               |   2 +-
 hw/intc/arm_gicv3_cpuif.c         |  10 +-----
 hw/intc/arm_gicv3_cpuif_common.c  |  22 +++++++++++++
 hw/intc/arm_gicv3_its.c           |  39 +++++++++++++++--------
 hw/net/npcm7xx_emc.c              |  18 +++++------
 hw/virtio/virtio-iommu-pci.c      |  12 ++------
 linux-user/aarch64/cpu_loop.c     |  46 ++++++++++++++++------------
 linux-user/hexagon/cpu_loop.c     |   1 +
 target/arm/debug_helper.c         |  23 ++++++++++++++
 target/arm/gdbstub.c              |   9 ++++--
 target/arm/helper.c               |   6 ++--
 target/arm/machine.c              |  10 ++++++
 target/arm/tlb_helper.c           |  63 ++++++++++++++++++++++++++++----------
 target/arm/translate-a64.c        |  23 ++++++++++++--
 target/arm/translate.c            |  58 ++++++++++++++++++++++++++---------
 target/i386/tcg/translate.c       |  12 ++------
 tests/qtest/bios-tables-test.c    |  38 +++++++++++++++++++++++
 tests/tcg/aarch64/pcalign-a64.c   |  37 ++++++++++++++++++++++
 tests/tcg/arm/pcalign-a32.c       |  46 ++++++++++++++++++++++++++++
 hw/arm/Kconfig                    |   1 +
 hw/intc/Kconfig                   |   5 +++
 hw/intc/meson.build               |  11 ++++---
 tests/data/acpi/q35/DSDT.viot     | Bin 0 -> 9398 bytes
 tests/data/acpi/q35/VIOT.viot     | Bin 0 -> 112 bytes
 tests/data/acpi/virt/VIOT         | Bin 0 -> 88 bytes
 tests/tcg/aarch64/Makefile.target |   4 +--
 tests/tcg/arm/Makefile.target     |   4 +++
 44 files changed, 429 insertions(+), 145 deletions(-)
 create mode 100644 hw/intc/arm_gicv3_cpuif_common.c
 create mode 100644 tests/tcg/aarch64/pcalign-a64.c
 create mode 100644 tests/tcg/arm/pcalign-a32.c
 create mode 100644 tests/data/acpi/q35/DSDT.viot
 create mode 100644 tests/data/acpi/q35/VIOT.viot
 create mode 100644 tests/data/acpi/virt/VIOT

From: Alex Bennée <alex.bennee@linaro.org>

While trying to debug a GIC ITS failure I saw some guest errors that
had poor formatting as well as leaving me confused as to what failed.
As most of the checks aren't possible without a valid dte split that
check apart and then check the other conditions in steps. This avoids
us relying on undefined data.

I still get a failure with the current kvm-unit-tests but at least I
know (partially) why now:

Exception return from AArch64 EL1 to AArch64 EL1 PC 0x40080588
  PASS: gicv3: its-trigger: inv/invall: dev2/eventid=20 now triggers an LPI
  ITS: MAPD devid=2 size = 0x8 itt=0x40430000 valid=0
  INT dev_id=2 event_id=20
  process_its_cmd: invalid command attributes: invalid dte: 0 for 2 (MEM_TX: 0)
  PASS: gicv3: its-trigger: mapd valid=false: no LPI after device unmap
  SUMMARY: 6 tests, 1 unexpected failures

Signed-off-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20211112170454.3158925-1-alex.bennee@linaro.org
Cc: Shashi Mallela <shashi.mallela@linaro.org>
Cc: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/intc/arm_gicv3_its.c | 39 +++++++++++++++++++++++++++------------
 1 file changed, 27 insertions(+), 12 deletions(-)

diff --git a/hw/intc/arm_gicv3_its.c b/hw/intc/arm_gicv3_its.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gicv3_its.c
+++ b/hw/intc/arm_gicv3_its.c
@@ -XXX,XX +XXX,XX @@ static bool process_its_cmd(GICv3ITSState *s, uint64_t value, uint32_t offset,
         if (res != MEMTX_OK) {
             return result;
         }
+    } else {
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: invalid command attributes: "
+                      "invalid dte: %"PRIx64" for %d (MEM_TX: %d)\n",
+                      __func__, dte, devid, res);
+        return result;
     }
 
-    if ((devid > s->dt.maxids.max_devids) || !dte_valid || !ite_valid ||
-            !cte_valid || (eventid > max_eventid)) {
+
+    /*
+     * In this implementation, in case of guest errors we ignore the
+     * command and move onto the next command in the queue.
+     */
+    if (devid > s->dt.maxids.max_devids) {
         qemu_log_mask(LOG_GUEST_ERROR,
-                      "%s: invalid command attributes "
-                      "devid %d or eventid %d or invalid dte %d or"
-                      "invalid cte %d or invalid ite %d\n",
-                      __func__, devid, eventid, dte_valid, cte_valid,
-                      ite_valid);
-        /*
-         * in this implementation, in case of error
-         * we ignore this command and move onto the next
-         * command in the queue
-         */
+                      "%s: invalid command attributes: devid %d>%d",
+                      __func__, devid, s->dt.maxids.max_devids);
+
+    } else if (!dte_valid || !ite_valid || !cte_valid) {
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: invalid command attributes: "
+                      "dte: %s, ite: %s, cte: %s\n",
+                      __func__,
+                      dte_valid ? "valid" : "invalid",
+                      ite_valid ? "valid" : "invalid",
+                      cte_valid ? "valid" : "invalid");
+    } else if (eventid > max_eventid) {
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: invalid command attributes: eventid %d > %d\n",
+                      __func__, eventid, max_eventid);
     } else {
         /*
          * Current implementation only supports rdbase == procnum
-- 
2.25.1

From: Joel Stanley <joel@jms.id.au>

Add X11, FP5280G2, G220A, Rainier and Fuji. Mention that Swift will be
removed in v7.0.

Signed-off-by: Joel Stanley <joel@jms.id.au>
Reviewed-by: Cédric Le Goater <clg@kaod.org>
Message-id: 20211117065752.330632-2-joel@jms.id.au
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/aspeed.rst | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/docs/system/arm/aspeed.rst b/docs/system/arm/aspeed.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/aspeed.rst
+++ b/docs/system/arm/aspeed.rst
@@ -XXX,XX +XXX,XX @@ AST2400 SoC based machines :
 
 - ``palmetto-bmc``         OpenPOWER Palmetto POWER8 BMC
 - ``quanta-q71l-bmc``      OpenBMC Quanta BMC
+- ``supermicrox11-bmc``    Supermicro X11 BMC
 
 AST2500 SoC based machines :
 
@@ -XXX,XX +XXX,XX @@ AST2500 SoC based machines :
 - ``romulus-bmc``          OpenPOWER Romulus POWER9 BMC
 - ``witherspoon-bmc``      OpenPOWER Witherspoon POWER9 BMC
 - ``sonorapass-bmc``       OCP SonoraPass BMC
-- ``swift-bmc``            OpenPOWER Swift BMC POWER9
+- ``swift-bmc``            OpenPOWER Swift BMC POWER9 (to be removed in v7.0)
+- ``fp5280g2-bmc``         Inspur FP5280G2 BMC
+- ``g220a-bmc``            Bytedance G220A BMC
 
 AST2600 SoC based machines :
 
 - ``ast2600-evb``          Aspeed AST2600 Evaluation board (Cortex-A7)
 - ``tacoma-bmc``           OpenPOWER Witherspoon POWER9 AST2600 BMC
+- ``rainier-bmc``          IBM Rainier POWER10 BMC
+- ``fuji-bmc``             Facebook Fuji BMC
 
 Supported devices
 -----------------
-- 
2.25.1

From: Joel Stanley <joel@jms.id.au>

A common use case for the ASPEED machine is to boot a Linux kernel.
Provide a full example command line.

Reviewed-by: Cédric Le Goater <clg@kaod.org>
Signed-off-by: Joel Stanley <joel@jms.id.au>
Message-id: 20211117065752.330632-4-joel@jms.id.au
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/aspeed.rst | 15 ++++++++++++---
 1 file changed, 12 insertions(+), 3 deletions(-)

diff --git a/docs/system/arm/aspeed.rst b/docs/system/arm/aspeed.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/aspeed.rst
+++ b/docs/system/arm/aspeed.rst
@@ -XXX,XX +XXX,XX @@ Missing devices
 Boot options
 ------------
 
-The Aspeed machines can be started using the ``-kernel`` option to
-load a Linux kernel or from a firmware. Images can be downloaded from
-the OpenBMC jenkins :
+The Aspeed machines can be started using the ``-kernel`` and ``-dtb`` options
+to load a Linux kernel or from a firmware. Images can be downloaded from the
+OpenBMC jenkins :
 
    https://jenkins.openbmc.org/job/ci-openbmc/lastSuccessfulBuild/
 
@@ -XXX,XX +XXX,XX @@ or directly from the OpenBMC GitHub release repository :
 
    https://github.com/openbmc/openbmc/releases
 
+To boot a kernel directly from a Linux build tree:
+
+.. code-block:: bash
+
+  $ qemu-system-arm -M ast2600-evb -nographic \
+        -kernel arch/arm/boot/zImage \
+        -dtb arch/arm/boot/dts/aspeed-ast2600-evb.dtb \
+        -initrd rootfs.cpio
+
 The image should be attached as an MTD drive. Run :
 
 .. code-block:: bash
-- 
2.25.1

From: Olivier Hériveaux <olivier.heriveaux@ledger.fr>

Fix issue where the data register may be overwritten by next character
reception before being read and returned.

Signed-off-by: Olivier Hériveaux <olivier.heriveaux@ledger.fr>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20211128120723.4053-1-olivier.heriveaux@ledger.fr
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/char/stm32f2xx_usart.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/hw/char/stm32f2xx_usart.c b/hw/char/stm32f2xx_usart.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/stm32f2xx_usart.c
+++ b/hw/char/stm32f2xx_usart.c
@@ -XXX,XX +XXX,XX @@ static uint64_t stm32f2xx_usart_read(void *opaque, hwaddr addr,
         return retvalue;
     case USART_DR:
         DB_PRINT("Value: 0x%" PRIx32 ", %c\n", s->usart_dr, (char) s->usart_dr);
+        retvalue = s->usart_dr & 0x3FF;
         s->usart_sr &= ~USART_SR_RXNE;
         qemu_chr_fe_accept_input(&s->chr);
         qemu_set_irq(s->irq, 0);
-        return s->usart_dr & 0x3FF;
+        return retvalue;
     case USART_BRR:
         return s->usart_brr;
     case USART_CR1:
-- 
2.25.1

From: Philippe Mathieu-Daudé <philmd@redhat.com>

gicv3_set_gicv3state() is used by arm_gicv3_common.c in
arm_gicv3_common_realize(). Since we want to restrict
arm_gicv3_cpuif.c to TCG, extract gicv3_set_gicv3state()
to a new file. Add this file to the meson 'specific'
source set, since it needs access to "cpu.h".

Signed-off-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20211115223619.2599282-2-philmd@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/intc/arm_gicv3_cpuif.c        | 10 +---------
 hw/intc/arm_gicv3_cpuif_common.c | 22 ++++++++++++++++++++++
 hw/intc/meson.build              |  1 +
 3 files changed, 24 insertions(+), 9 deletions(-)
 create mode 100644 hw/intc/arm_gicv3_cpuif_common.c

diff --git a/hw/intc/arm_gicv3_cpuif.c b/hw/intc/arm_gicv3_cpuif.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gicv3_cpuif.c
+++ b/hw/intc/arm_gicv3_cpuif.c
@@ -XXX,XX +XXX,XX @@
 /*
- * ARM Generic Interrupt Controller v3
+ * ARM Generic Interrupt Controller v3 (emulation)
  *
  * Copyright (c) 2016 Linaro Limited
  * Written by Peter Maydell
@@ -XXX,XX +XXX,XX @@
 #include "hw/irq.h"
 #include "cpu.h"
 
-void gicv3_set_gicv3state(CPUState *cpu, GICv3CPUState *s)
-{
-    ARMCPU *arm_cpu = ARM_CPU(cpu);
-    CPUARMState *env = &arm_cpu->env;
-
-    env->gicv3state = (void *)s;
-};
-
 static GICv3CPUState *icc_cs_from_env(CPUARMState *env)
 {
     return env->gicv3state;
diff --git a/hw/intc/arm_gicv3_cpuif_common.c b/hw/intc/arm_gicv3_cpuif_common.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/intc/arm_gicv3_cpuif_common.c
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: GPL-2.0-or-later */
+/*
+ * ARM Generic Interrupt Controller v3
+ *
+ * Copyright (c) 2016 Linaro Limited
+ * Written by Peter Maydell
+ *
+ * This code is licensed under the GPL, version 2 or (at your option)
+ * any later version.
+ */
+
+#include "qemu/osdep.h"
+#include "gicv3_internal.h"
+#include "cpu.h"
+
+void gicv3_set_gicv3state(CPUState *cpu, GICv3CPUState *s)
+{
+    ARMCPU *arm_cpu = ARM_CPU(cpu);
+    CPUARMState *env = &arm_cpu->env;
+
+    env->gicv3state = (void *)s;
+};
diff --git a/hw/intc/meson.build b/hw/intc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/meson.build
+++ b/hw/intc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP_PMU', if_true: files('xlnx-pmu-iomod-in
 
 specific_ss.add(when: 'CONFIG_ALLWINNER_A10_PIC', if_true: files('allwinner-a10-pic.c'))
 specific_ss.add(when: 'CONFIG_APIC', if_true: files('apic.c', 'apic_common.c'))
+specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif_common.c'))
 specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif.c'))
 specific_ss.add(when: 'CONFIG_ARM_GIC_KVM', if_true: files('arm_gic_kvm.c'))
 specific_ss.add(when: ['CONFIG_ARM_GIC_KVM', 'TARGET_AARCH64'], if_true: files('arm_gicv3_kvm.c', 'arm_gicv3_its_kvm.c'))
-- 
2.25.1

From: Philippe Mathieu-Daudé <philmd@redhat.com>

The TYPE_ARM_GICV3 device is an emulated one.  When using
KVM, it is recommended to use the TYPE_KVM_ARM_GICV3 device
(which uses in-kernel support).

When using --with-devices-FOO, it is possible to build a
binary with a specific set of devices. When this binary is
restricted to KVM accelerator, the TYPE_ARM_GICV3 device is
irrelevant, and it is desirable to remove it from the binary.

Therefore introduce the CONFIG_ARM_GIC_TCG Kconfig selector
which select the files required to have the TYPE_ARM_GICV3
device, but also allowing to de-select this device.

Signed-off-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20211115223619.2599282-3-philmd@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/intc/arm_gicv3.c |  2 +-
 hw/intc/Kconfig     |  5 +++++
 hw/intc/meson.build | 10 ++++++----
 3 files changed, 12 insertions(+), 5 deletions(-)

diff --git a/hw/intc/arm_gicv3.c b/hw/intc/arm_gicv3.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gicv3.c
+++ b/hw/intc/arm_gicv3.c
@@ -XXX,XX +XXX,XX @@
 /*
- * ARM Generic Interrupt Controller v3
+ * ARM Generic Interrupt Controller v3 (emulation)
  *
  * Copyright (c) 2015 Huawei.
  * Copyright (c) 2016 Linaro Limited
diff --git a/hw/intc/Kconfig b/hw/intc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/Kconfig
+++ b/hw/intc/Kconfig
@@ -XXX,XX +XXX,XX @@ config APIC
     select MSI_NONBROKEN
     select I8259
 
+config ARM_GIC_TCG
+    bool
+    default y
+    depends on ARM_GIC && TCG
+
 config ARM_GIC_KVM
     bool
     default y
diff --git a/hw/intc/meson.build b/hw/intc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/meson.build
+++ b/hw/intc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_ARM_GIC', if_true: files(
   'arm_gic.c',
   'arm_gic_common.c',
   'arm_gicv2m.c',
-  'arm_gicv3.c',
   'arm_gicv3_common.c',
-  'arm_gicv3_dist.c',
   'arm_gicv3_its_common.c',
-  'arm_gicv3_redist.c',
+))
+softmmu_ss.add(when: 'CONFIG_ARM_GIC_TCG', if_true: files(
+  'arm_gicv3.c',
+  'arm_gicv3_dist.c',
   'arm_gicv3_its.c',
+  'arm_gicv3_redist.c',
 ))
 softmmu_ss.add(when: 'CONFIG_ETRAXFS', if_true: files('etraxfs_pic.c'))
 softmmu_ss.add(when: 'CONFIG_HEATHROW_PIC', if_true: files('heathrow_pic.c'))
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP_PMU', if_true: files('xlnx-pmu-iomod-in
 specific_ss.add(when: 'CONFIG_ALLWINNER_A10_PIC', if_true: files('allwinner-a10-pic.c'))
 specific_ss.add(when: 'CONFIG_APIC', if_true: files('apic.c', 'apic_common.c'))
 specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif_common.c'))
-specific_ss.add(when: 'CONFIG_ARM_GIC', if_true: files('arm_gicv3_cpuif.c'))
+specific_ss.add(when: 'CONFIG_ARM_GIC_TCG', if_true: files('arm_gicv3_cpuif.c'))
 specific_ss.add(when: 'CONFIG_ARM_GIC_KVM', if_true: files('arm_gic_kvm.c'))
 specific_ss.add(when: ['CONFIG_ARM_GIC_KVM', 'TARGET_AARCH64'], if_true: files('arm_gicv3_kvm.c', 'arm_gicv3_its_kvm.c'))
 specific_ss.add(when: 'CONFIG_ARM_V7M', if_true: files('armv7m_nvic.c'))
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
 {
     DisasContext *s = container_of(dcbase, DisasContext, base);
     CPUARMState *env = cpu->env_ptr;
+    uint64_t pc = s->base.pc_next;
     uint32_t insn;
 
     if (s->ss_active && !s->pstate_ss) {
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
         return;
     }
 
-    s->pc_curr = s->base.pc_next;
-    insn = arm_ldl_code(env, &s->base, s->base.pc_next, s->sctlr_b);
+    s->pc_curr = pc;
+    insn = arm_ldl_code(env, &s->base, pc, s->sctlr_b);
     s->insn = insn;
-    s->base.pc_next += 4;
+    s->base.pc_next = pc + 4;
 
     s->fp_access_checked = false;
     s->sve_access_checked = false;
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void arm_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
 {
     DisasContext *dc = container_of(dcbase, DisasContext, base);
     CPUARMState *env = cpu->env_ptr;
+    uint32_t pc = dc->base.pc_next;
     unsigned int insn;
 
     if (arm_pre_translate_insn(dc)) {
-        dc->base.pc_next += 4;
+        dc->base.pc_next = pc + 4;
         return;
     }
 
-    dc->pc_curr = dc->base.pc_next;
-    insn = arm_ldl_code(env, &dc->base, dc->base.pc_next, dc->sctlr_b);
+    dc->pc_curr = pc;
+    insn = arm_ldl_code(env, &dc->base, pc, dc->sctlr_b);
     dc->insn = insn;
-    dc->base.pc_next += 4;
+    dc->base.pc_next = pc + 4;
     disas_arm_insn(dc, insn);
 
     arm_post_translate_insn(dc);
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void thumb_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
 {
     DisasContext *dc = container_of(dcbase, DisasContext, base);
     CPUARMState *env = cpu->env_ptr;
+    uint32_t pc = dc->base.pc_next;
     uint32_t insn;
     bool is_16bit;
 
     if (arm_pre_translate_insn(dc)) {
-        dc->base.pc_next += 2;
+        dc->base.pc_next = pc + 2;
         return;
     }
 
-    dc->pc_curr = dc->base.pc_next;
-    insn = arm_lduw_code(env, &dc->base, dc->base.pc_next, dc->sctlr_b);
+    dc->pc_curr = pc;
+    insn = arm_lduw_code(env, &dc->base, pc, dc->sctlr_b);
     is_16bit = thumb_insn_is_16bit(dc, dc->base.pc_next, insn);
-    dc->base.pc_next += 2;
+    pc += 2;
     if (!is_16bit) {
-        uint32_t insn2 = arm_lduw_code(env, &dc->base, dc->base.pc_next,
-                                       dc->sctlr_b);
-
+        uint32_t insn2 = arm_lduw_code(env, &dc->base, pc, dc->sctlr_b);
         insn = insn << 16 | insn2;
-        dc->base.pc_next += 2;
+        pc += 2;
     }
+    dc->base.pc_next = pc;
     dc->insn = insn;
 
     if (dc->pstate_il) {
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

Create arm_check_ss_active and arm_check_kernelpage.

Reverse the order of the tests.  While it doesn't matter in practice,
because only user-only has a kernel page and user-only never sets
ss_active, ss_active has priority over execution exceptions and it
is best to keep them in the proper order.

diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void arm_tr_insn_start(DisasContextBase *dcbase, CPUState *cpu)
     dc->insn_start = tcg_last_op();
 }
 
-static bool arm_pre_translate_insn(DisasContext *dc)
+static bool arm_check_kernelpage(DisasContext *dc)
 {
 #ifdef CONFIG_USER_ONLY
     /* Intercept jump to the magic kernel page.  */
@@ -XXX,XX +XXX,XX @@ static bool arm_pre_translate_insn(DisasContext *dc)
         return true;
     }
 #endif
+    return false;
+}
 
+static bool arm_check_ss_active(DisasContext *dc)
+{
     if (dc->ss_active && !dc->pstate_ss) {
         /* Singlestep state is Active-pending.
          * If we're in this state at the start of a TB then either
@@ -XXX,XX +XXX,XX @@ static void arm_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
     uint32_t pc = dc->base.pc_next;
     unsigned int insn;
 
-    if (arm_pre_translate_insn(dc)) {
+    if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
         dc->base.pc_next = pc + 4;
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void thumb_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
     uint32_t insn;
     bool is_16bit;
 
-    if (arm_pre_translate_insn(dc)) {
+    if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
         dc->base.pc_next = pc + 2;
         return;
     }
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

We will reuse this section of arm_deliver_fault for
raising pc alignment faults.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/tlb_helper.c | 45 +++++++++++++++++++++++++----------------
 1 file changed, 28 insertions(+), 17 deletions(-)

diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tlb_helper.c
+++ b/target/arm/tlb_helper.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
     return syn;
 }
 
-static void QEMU_NORETURN arm_deliver_fault(ARMCPU *cpu, vaddr addr,
-                                            MMUAccessType access_type,
-                                            int mmu_idx, ARMMMUFaultInfo *fi)
+static uint32_t compute_fsr_fsc(CPUARMState *env, ARMMMUFaultInfo *fi,
+                                int target_el, int mmu_idx, uint32_t *ret_fsc)
 {
-    CPUARMState *env = &cpu->env;
-    int target_el;
-    bool same_el;
-    uint32_t syn, exc, fsr, fsc;
     ARMMMUIdx arm_mmu_idx = core_to_arm_mmu_idx(env, mmu_idx);
-
-    target_el = exception_target_el(env);
-    if (fi->stage2) {
-        target_el = 2;
-        env->cp15.hpfar_el2 = extract64(fi->s2addr, 12, 47) << 4;
-        if (arm_is_secure_below_el3(env) && fi->s1ns) {
-            env->cp15.hpfar_el2 |= HPFAR_NS;
-        }
-    }
-    same_el = (arm_current_el(env) == target_el);
+    uint32_t fsr, fsc;
 
     if (target_el == 2 || arm_el_is_aa64(env, target_el) ||
         arm_s1_regime_using_lpae_format(env, arm_mmu_idx)) {
@@ -XXX,XX +XXX,XX @@ static void QEMU_NORETURN arm_deliver_fault(ARMCPU *cpu, vaddr addr,
         fsc = 0x3f;
     }
 
+    *ret_fsc = fsc;
+    return fsr;
+}
+
+static void QEMU_NORETURN arm_deliver_fault(ARMCPU *cpu, vaddr addr,
+                                            MMUAccessType access_type,
+                                            int mmu_idx, ARMMMUFaultInfo *fi)
+{
+    CPUARMState *env = &cpu->env;
+    int target_el;
+    bool same_el;
+    uint32_t syn, exc, fsr, fsc;
+
+    target_el = exception_target_el(env);
+    if (fi->stage2) {
+        target_el = 2;
+        env->cp15.hpfar_el2 = extract64(fi->s2addr, 12, 47) << 4;
+        if (arm_is_secure_below_el3(env) && fi->s1ns) {
+            env->cp15.hpfar_el2 |= HPFAR_NS;
+        }
+    }
+    same_el = (arm_current_el(env) == target_el);
+
+    fsr = compute_fsr_fsc(env, fi, target_el, mmu_idx, &fsc);
+
     if (access_type == MMU_INST_FETCH) {
         syn = syn_insn_abort(same_el, fi->ea, fi->s1ptw, fsc);
         exc = EXCP_PREFETCH_ABORT;
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

For A64, any input to an indirect branch can cause this.

For A32, many indirect branch paths force the branch to be aligned,
but BXWritePC does not.  This includes the BX instruction but also
other interworking changes to PC.  Prior to v8, this case is UNDEFINED.
With v8, this is CONSTRAINED UNPREDICTABLE and may either raise an
exception or force align the PC.

We choose to raise an exception because we have the infrastructure,
it makes the generated code for gen_bx simpler, and it has the
possibility of catching more guest bugs.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h           |  1 +
 target/arm/syndrome.h         |  5 ++++
 linux-user/aarch64/cpu_loop.c | 46 ++++++++++++++++++++---------------
 target/arm/tlb_helper.c       | 18 ++++++++++++++
 target/arm/translate-a64.c    | 15 ++++++++++++
 target/arm/translate.c        | 22 ++++++++++++++++-
 6 files changed, 87 insertions(+), 20 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(sel_flags, TCG_CALL_NO_RWG_SE,
 DEF_HELPER_2(exception_internal, void, env, i32)
 DEF_HELPER_4(exception_with_syndrome, void, env, i32, i32, i32)
 DEF_HELPER_2(exception_bkpt_insn, void, env, i32)
+DEF_HELPER_2(exception_pc_alignment, noreturn, env, tl)
 DEF_HELPER_1(setend, void, env)
 DEF_HELPER_2(wfi, void, env, i32)
 DEF_HELPER_1(wfe, void, env)
diff --git a/target/arm/syndrome.h b/target/arm/syndrome.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/syndrome.h
+++ b/target/arm/syndrome.h
@@ -XXX,XX +XXX,XX @@ static inline uint32_t syn_illegalstate(void)
     return (EC_ILLEGALSTATE << ARM_EL_EC_SHIFT) | ARM_EL_IL;
 }
 
+static inline uint32_t syn_pcalignment(void)
+{
+    return (EC_PCALIGNMENT << ARM_EL_EC_SHIFT) | ARM_EL_IL;
+}
+
 #endif /* TARGET_ARM_SYNDROME_H */
diff --git a/linux-user/aarch64/cpu_loop.c b/linux-user/aarch64/cpu_loop.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/aarch64/cpu_loop.c
+++ b/linux-user/aarch64/cpu_loop.c
@@ -XXX,XX +XXX,XX @@ void cpu_loop(CPUARMState *env)
             break;
         case EXCP_PREFETCH_ABORT:
         case EXCP_DATA_ABORT:
-            /* We should only arrive here with EC in {DATAABORT, INSNABORT}. */
             ec = syn_get_ec(env->exception.syndrome);
-            assert(ec == EC_DATAABORT || ec == EC_INSNABORT);
-
-            /* Both EC have the same format for FSC, or close enough. */
-            fsc = extract32(env->exception.syndrome, 0, 6);
-            switch (fsc) {
-            case 0x04 ... 0x07: /* Translation fault, level {0-3} */
-                si_signo = TARGET_SIGSEGV;
-                si_code = TARGET_SEGV_MAPERR;
+            switch (ec) {
+            case EC_DATAABORT:
+            case EC_INSNABORT:
+                /* Both EC have the same format for FSC, or close enough. */
+                fsc = extract32(env->exception.syndrome, 0, 6);
+                switch (fsc) {
+                case 0x04 ... 0x07: /* Translation fault, level {0-3} */
+                    si_signo = TARGET_SIGSEGV;
+                    si_code = TARGET_SEGV_MAPERR;
+                    break;
+                case 0x09 ... 0x0b: /* Access flag fault, level {1-3} */
+                case 0x0d ... 0x0f: /* Permission fault, level {1-3} */
+                    si_signo = TARGET_SIGSEGV;
+                    si_code = TARGET_SEGV_ACCERR;
+                    break;
+                case 0x11: /* Synchronous Tag Check Fault */
+                    si_signo = TARGET_SIGSEGV;
+                    si_code = TARGET_SEGV_MTESERR;
+                    break;
+                case 0x21: /* Alignment fault */
+                    si_signo = TARGET_SIGBUS;
+                    si_code = TARGET_BUS_ADRALN;
+                    break;
+                default:
+                    g_assert_not_reached();
+                }
                 break;
-            case 0x09 ... 0x0b: /* Access flag fault, level {1-3} */
-            case 0x0d ... 0x0f: /* Permission fault, level {1-3} */
-                si_signo = TARGET_SIGSEGV;
-                si_code = TARGET_SEGV_ACCERR;
-                break;
-            case 0x11: /* Synchronous Tag Check Fault */
-                si_signo = TARGET_SIGSEGV;
-                si_code = TARGET_SEGV_MTESERR;
-                break;
-            case 0x21: /* Alignment fault */
+            case EC_PCALIGNMENT:
                 si_signo = TARGET_SIGBUS;
                 si_code = TARGET_BUS_ADRALN;
                 break;
diff --git a/target/arm/tlb_helper.c b/target/arm/tlb_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tlb_helper.c
+++ b/target/arm/tlb_helper.c
@@ -XXX,XX +XXX,XX @@
 #include "cpu.h"
 #include "internals.h"
 #include "exec/exec-all.h"
+#include "exec/helper-proto.h"
 
 static inline uint32_t merge_syn_data_abort(uint32_t template_syn,
                                             unsigned int target_el,
@@ -XXX,XX +XXX,XX @@ void arm_cpu_do_unaligned_access(CPUState *cs, vaddr vaddr,
     arm_deliver_fault(cpu, vaddr, access_type, mmu_idx, &fi);
 }
 
+void helper_exception_pc_alignment(CPUARMState *env, target_ulong pc)
+{
+    ARMMMUFaultInfo fi = { .type = ARMFault_Alignment };
+    int target_el = exception_target_el(env);
+    int mmu_idx = cpu_mmu_index(env, true);
+    uint32_t fsc;
+
+    env->exception.vaddress = pc;
+
+    /*
+     * Note that the fsc is not applicable to this exception,
+     * since any syndrome is pcalignment not insn_abort.
+     */
+    env->exception.fsr = compute_fsr_fsc(env, &fi, target_el, mmu_idx, &fsc);
+    raise_exception(env, EXCP_PREFETCH_ABORT, syn_pcalignment(), target_el);
+}
+
 #if !defined(CONFIG_USER_ONLY)
 
 /*
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
     uint64_t pc = s->base.pc_next;
     uint32_t insn;
 
+    /* Singlestep exceptions have the highest priority. */
     if (s->ss_active && !s->pstate_ss) {
         /* Singlestep state is Active-pending.
          * If we're in this state at the start of a TB then either
@@ -XXX,XX +XXX,XX @@ static void aarch64_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
         return;
     }
 
+    if (pc & 3) {
+        /*
+         * PC alignment fault.  This has priority over the instruction abort
+         * that we would receive from a translation fault via arm_ldl_code.
+         * This should only be possible after an indirect branch, at the
+         * start of the TB.
+         */
+        assert(s->base.num_insns == 1);
+        gen_helper_exception_pc_alignment(cpu_env, tcg_constant_tl(pc));
+        s->base.is_jmp = DISAS_NORETURN;
+        s->base.pc_next = QEMU_ALIGN_UP(pc, 4);
+        return;
+    }
+
     s->pc_curr = pc;
     insn = arm_ldl_code(env, &s->base, pc, s->sctlr_b);
     s->insn = insn;
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void arm_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
     uint32_t pc = dc->base.pc_next;
     unsigned int insn;
 
-    if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
+    /* Singlestep exceptions have the highest priority. */
+    if (arm_check_ss_active(dc)) {
+        dc->base.pc_next = pc + 4;
+        return;
+    }
+
+    if (pc & 3) {
+        /*
+         * PC alignment fault.  This has priority over the instruction abort
+         * that we would receive from a translation fault via arm_ldl_code
+         * (or the execution of the kernelpage entrypoint). This should only
+         * be possible after an indirect branch, at the start of the TB.
+         */
+        assert(dc->base.num_insns == 1);
+        gen_helper_exception_pc_alignment(cpu_env, tcg_constant_tl(pc));
+        dc->base.is_jmp = DISAS_NORETURN;
+        dc->base.pc_next = QEMU_ALIGN_UP(pc, 4);
+        return;
+    }
+
+    if (arm_check_kernelpage(dc)) {
         dc->base.pc_next = pc + 4;
         return;
     }
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

Misaligned thumb PC is architecturally impossible.
Assert is better than proceeding, in case we've missed
something somewhere.

Expand a comment about aligning the pc in gdbstub.
Fail an incoming migrate if a thumb pc is misaligned.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/gdbstub.c   |  9 +++++++--
 target/arm/machine.c   | 10 ++++++++++
 target/arm/translate.c |  3 +++
 3 files changed, 20 insertions(+), 2 deletions(-)

diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/gdbstub.c
+++ b/target/arm/gdbstub.c
@@ -XXX,XX +XXX,XX @@ int arm_cpu_gdb_write_register(CPUState *cs, uint8_t *mem_buf, int n)
 
     tmp = ldl_p(mem_buf);
 
-    /* Mask out low bit of PC to workaround gdb bugs.  This will probably
-       cause problems if we ever implement the Jazelle DBX extensions.  */
+    /*
+     * Mask out low bits of PC to workaround gdb bugs.
+     * This avoids an assert in thumb_tr_translate_insn, because it is
+     * architecturally impossible to misalign the pc.
+     * This will probably cause problems if we ever implement the
+     * Jazelle DBX extensions.
+     */
     if (n == 15) {
         tmp &= ~1;
     }
diff --git a/target/arm/machine.c b/target/arm/machine.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/machine.c
+++ b/target/arm/machine.c
@@ -XXX,XX +XXX,XX @@ static int cpu_post_load(void *opaque, int version_id)
             return -1;
         }
     }
+
+    /*
+     * Misaligned thumb pc is architecturally impossible.
+     * We have an assert in thumb_tr_translate_insn to verify this.
+     * Fail an incoming migrate to avoid this assert.
+     */
+    if (!is_a64(env) && env->thumb && (env->regs[15] & 1)) {
+        return -1;
+    }
+
     if (!kvm_enabled()) {
         pmu_op_finish(&cpu->env);
     }
diff --git a/target/arm/translate.c b/target/arm/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate.c
+++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ static void thumb_tr_translate_insn(DisasContextBase *dcbase, CPUState *cpu)
     uint32_t insn;
     bool is_16bit;
 
+    /* Misaligned thumb PC is architecturally impossible. */
+    assert((dc->base.pc_next & 1) == 0);
+
     if (arm_check_ss_active(dc) || arm_check_kernelpage(dc)) {
         dc->base.pc_next = pc + 2;
         return;
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

Both single-step and pc alignment faults have priority over
breakpoint exceptions.

diff --git a/target/arm/debug_helper.c b/target/arm/debug_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/debug_helper.c
+++ b/target/arm/debug_helper.c
@@ -XXX,XX +XXX,XX @@ bool arm_debug_check_breakpoint(CPUState *cs)
 {
     ARMCPU *cpu = ARM_CPU(cs);
     CPUARMState *env = &cpu->env;
+    target_ulong pc;
     int n;
 
     /*
@@ -XXX,XX +XXX,XX @@ bool arm_debug_check_breakpoint(CPUState *cs)
         return false;
     }
 
+    /*
+     * Single-step exceptions have priority over breakpoint exceptions.
+     * If single-step state is active-pending, suppress the bp.
+     */
+    if (arm_singlestep_active(env) && !(env->pstate & PSTATE_SS)) {
+        return false;
+    }
+
+    /*
+     * PC alignment faults have priority over breakpoint exceptions.
+     */
+    pc = is_a64(env) ? env->pc : env->regs[15];
+    if ((is_a64(env) || !env->thumb) && (pc & 3) != 0) {
+        return false;
+    }
+
+    /*
+     * Instruction aborts have priority over breakpoint exceptions.
+     * TODO: We would need to look up the page for PC and verify that
+     * it is present and executable.
+     */
+
     for (n = 0; n < ARRAY_SIZE(env->cpu_breakpoint); n++) {
         if (bp_wp_matches(cpu, n, false)) {
             return true;
-- 
2.25.1

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tests/tcg/aarch64/pcalign-a64.c   | 37 +++++++++++++++++++++++++
 tests/tcg/arm/pcalign-a32.c       | 46 +++++++++++++++++++++++++++++++
 tests/tcg/aarch64/Makefile.target |  4 +--
 tests/tcg/arm/Makefile.target     |  4 +++
 4 files changed, 89 insertions(+), 2 deletions(-)
 create mode 100644 tests/tcg/aarch64/pcalign-a64.c
 create mode 100644 tests/tcg/arm/pcalign-a32.c

diff --git a/tests/tcg/aarch64/pcalign-a64.c b/tests/tcg/aarch64/pcalign-a64.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/aarch64/pcalign-a64.c
@@ -XXX,XX +XXX,XX @@
+/* Test PC misalignment exception */
+
+#include <assert.h>
+#include <signal.h>
+#include <stdlib.h>
+#include <stdio.h>
+
+static void *expected;
+
+static void sigbus(int sig, siginfo_t *info, void *vuc)
+{
+    assert(info->si_code == BUS_ADRALN);
+    assert(info->si_addr == expected);
+    exit(EXIT_SUCCESS);
+}
+
+int main()
+{
+    void *tmp;
+
+    struct sigaction sa = {
+        .sa_sigaction = sigbus,
+        .sa_flags = SA_SIGINFO
+    };
+
+    if (sigaction(SIGBUS, &sa, NULL) < 0) {
+        perror("sigaction");
+        return EXIT_FAILURE;
+    }
+
+    asm volatile("adr %0, 1f + 1\n\t"
+                 "str %0, %1\n\t"
+                 "br  %0\n"
+                 "1:"
+                 : "=&r"(tmp), "=m"(expected));
+    abort();
+}
diff --git a/tests/tcg/arm/pcalign-a32.c b/tests/tcg/arm/pcalign-a32.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/arm/pcalign-a32.c
@@ -XXX,XX +XXX,XX @@
+/* Test PC misalignment exception */
+
+#ifdef __thumb__
+#error "This test must be compiled for ARM"
+#endif
+
+#include <assert.h>
+#include <signal.h>
+#include <stdlib.h>
+#include <stdio.h>
+
+static void *expected;
+
+static void sigbus(int sig, siginfo_t *info, void *vuc)
+{
+    assert(info->si_code == BUS_ADRALN);
+    assert(info->si_addr == expected);
+    exit(EXIT_SUCCESS);
+}
+
+int main()
+{
+    void *tmp;
+
+    struct sigaction sa = {
+        .sa_sigaction = sigbus,
+        .sa_flags = SA_SIGINFO
+    };
+
+    if (sigaction(SIGBUS, &sa, NULL) < 0) {
+        perror("sigaction");
+        return EXIT_FAILURE;
+    }
+
+    asm volatile("adr %0, 1f + 2\n\t"
+                 "str %0, %1\n\t"
+                 "bx  %0\n"
+                 "1:"
+                 : "=&r"(tmp), "=m"(expected));
+
+    /*
+     * From v8, it is CONSTRAINED UNPREDICTABLE whether BXWritePC aligns
+     * the address or not.  If so, we can legitimately fall through.
+     */
+    return EXIT_SUCCESS;
+}
diff --git a/tests/tcg/aarch64/Makefile.target b/tests/tcg/aarch64/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/aarch64/Makefile.target
+++ b/tests/tcg/aarch64/Makefile.target
@@ -XXX,XX +XXX,XX @@ VPATH 		+= $(ARM_SRC)
 AARCH64_SRC=$(SRC_PATH)/tests/tcg/aarch64
 VPATH 		+= $(AARCH64_SRC)
 
-# Float-convert Tests
-AARCH64_TESTS=fcvt
+# Base architecture tests
+AARCH64_TESTS=fcvt pcalign-a64
 
 fcvt: LDFLAGS+=-lm
 
diff --git a/tests/tcg/arm/Makefile.target b/tests/tcg/arm/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/arm/Makefile.target
+++ b/tests/tcg/arm/Makefile.target
@@ -XXX,XX +XXX,XX @@ run-fcvt: fcvt
 	$(call run-test,fcvt,$(QEMU) $<,"$< on $(TARGET_NAME)")
 	$(call diff-out,fcvt,$(ARM_SRC)/fcvt.ref)
 
+# PC alignment test
+ARM_TESTS += pcalign-a32
+pcalign-a32: CFLAGS+=-marm
+
 ifeq ($(CONFIG_ARM_COMPATIBLE_SEMIHOSTING),y)
 
 # Semihosting smoke test for linux-user
-- 
2.25.1

In the SSE decode function gen_sse(), we combine a byte
'b' and a value 'b1' which can be [0..3], and switch on them:
   b |= (b1 << 8);
   switch (b) {
   ...
   default:
   unknown_op:
       gen_unknown_opcode(env, s);
       return;
   }

In three cases inside this switch, we were then also checking for
 "if (b1 >= 2) { goto unknown_op; }".
However, this can never happen, because the 'case' values in each place
are 0x0nn or 0x1nn and the switch will have directed the b1 == (2, 3)
cases to the default already.

This check was added in commit c045af25a52e9 in 2010; the added code
was unnecessary then as well, and was apparently intended only to
ensure that we never accidentally ended up indexing off the end
of an sse_op_table with only 2 entries as a result of future bugs
in the decode logic.

Change the checks to assert() instead, and make sure they're always
immediately before the array access they are protecting.

Fixes: Coverity CID 1460207
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/i386/tcg/translate.c | 12 +++---------
 1 file changed, 3 insertions(+), 9 deletions(-)

diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/translate.c
+++ b/target/i386/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
         case 0x171: /* shift xmm, im */
         case 0x172:
         case 0x173:
-            if (b1 >= 2) {
-                goto unknown_op;
-            }
             val = x86_ldub_code(env, s);
             if (is_xmm) {
                 tcg_gen_movi_tl(s->T0, val);
@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
                                 offsetof(CPUX86State, mmx_t0.MMX_L(1)));
                 op1_offset = offsetof(CPUX86State,mmx_t0);
             }
+            assert(b1 < 2);
             sse_fn_epp = sse_op_table2[((b - 1) & 3) * 8 +
                                        (((modrm >> 3)) & 7)][b1];
             if (!sse_fn_epp) {
@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
             rm = modrm & 7;
             reg = ((modrm >> 3) & 7) | REX_R(s);
             mod = (modrm >> 6) & 3;
-            if (b1 >= 2) {
-                goto unknown_op;
-            }
 
+            assert(b1 < 2);
             sse_fn_epp = sse_op_table6[b].op[b1];
             if (!sse_fn_epp) {
                 goto unknown_op;
@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
             rm = modrm & 7;
             reg = ((modrm >> 3) & 7) | REX_R(s);
             mod = (modrm >> 6) & 3;
-            if (b1 >= 2) {
-                goto unknown_op;
-            }
 
+            assert(b1 < 2);
             sse_fn_eppi = sse_op_table7[b].op[b1];
             if (!sse_fn_eppi) {
                 goto unknown_op;
-- 
2.25.1

The qemu-common.h header is not supposed to be included from any
other header files, only from .c files (as documented in a comment at
the start of it).

include/hw/i386/x86.h and include/hw/i386/microvm.h break this rule.
In fact, the include is not required at all, so we can just drop it
from both files.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20211129200510.1233037-2-peter.maydell@linaro.org
---
 include/hw/i386/microvm.h | 1 -
 include/hw/i386/x86.h     | 1 -
 2 files changed, 2 deletions(-)

diff --git a/include/hw/i386/microvm.h b/include/hw/i386/microvm.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/i386/microvm.h
+++ b/include/hw/i386/microvm.h
@@ -XXX,XX +XXX,XX @@
 #ifndef HW_I386_MICROVM_H
 #define HW_I386_MICROVM_H
 
-#include "qemu-common.h"
 #include "exec/hwaddr.h"
 #include "qemu/notify.h"
 
diff --git a/include/hw/i386/x86.h b/include/hw/i386/x86.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/i386/x86.h
+++ b/include/hw/i386/x86.h
@@ -XXX,XX +XXX,XX @@
 #ifndef HW_I386_X86_H
 #define HW_I386_X86_H
 
-#include "qemu-common.h"
 #include "exec/hwaddr.h"
 #include "qemu/notify.h"
 
-- 
2.25.1

The qemu-common.h header is not supposed to be included from any
other header files, only from .c files (as documented in a comment at
the start of it).

Move the include to linux-user/hexagon/cpu_loop.c, which needs it for
the declaration of cpu_exec_step_atomic().

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Taylor Simpson <tsimpson@quicinc.com>
Message-id: 20211129200510.1233037-3-peter.maydell@linaro.org
---
 target/hexagon/cpu.h          | 1 -
 linux-user/hexagon/cpu_loop.c | 1 +
 2 files changed, 1 insertion(+), 1 deletion(-)

diff --git a/target/hexagon/cpu.h b/target/hexagon/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/hexagon/cpu.h
+++ b/target/hexagon/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef struct CPUHexagonState CPUHexagonState;
 
 #include "fpu/softfloat-types.h"
 
-#include "qemu-common.h"
 #include "exec/cpu-defs.h"
 #include "hex_regs.h"
 #include "mmvec/mmvec.h"
diff --git a/linux-user/hexagon/cpu_loop.c b/linux-user/hexagon/cpu_loop.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/hexagon/cpu_loop.c
+++ b/linux-user/hexagon/cpu_loop.c
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "qemu/osdep.h"
+#include "qemu-common.h"
 #include "qemu.h"
 #include "user-internals.h"
 #include "cpu_loop-common.h"
-- 
2.25.1

A lot of C files in hw/arm include qemu-common.h when they don't
need anything from it. Drop the include lines.

omap1.c, pxa2xx.c and strongarm.c retain the include because they
use it for the prototype of qemu_get_timedate().

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Taylor Simpson <tsimpson@quicinc.com>
Reviewed-by: Yoshinori Sato <ysato@users.sourceforge.jp>
Message-id: 20211129200510.1233037-5-peter.maydell@linaro.org
---
 hw/arm/boot.c           | 1 -
 hw/arm/digic_boards.c   | 1 -
 hw/arm/highbank.c       | 1 -
 hw/arm/npcm7xx_boards.c | 1 -
 hw/arm/sbsa-ref.c       | 1 -
 hw/arm/stm32f405_soc.c  | 1 -
 hw/arm/vexpress.c       | 1 -
 hw/arm/virt.c           | 1 -
 8 files changed, 8 deletions(-)

diff --git a/hw/arm/boot.c b/hw/arm/boot.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/boot.c
+++ b/hw/arm/boot.c
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "qemu/osdep.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "qemu/error-report.h"
 #include "qapi/error.h"
diff --git a/hw/arm/digic_boards.c b/hw/arm/digic_boards.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/digic_boards.c
+++ b/hw/arm/digic_boards.c
@@ -XXX,XX +XXX,XX @@
 
 #include "qemu/osdep.h"
 #include "qapi/error.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "hw/boards.h"
 #include "qemu/error-report.h"
diff --git a/hw/arm/highbank.c b/hw/arm/highbank.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/highbank.c
+++ b/hw/arm/highbank.c
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "qemu/osdep.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "qapi/error.h"
 #include "hw/sysbus.h"
diff --git a/hw/arm/npcm7xx_boards.c b/hw/arm/npcm7xx_boards.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/npcm7xx_boards.c
+++ b/hw/arm/npcm7xx_boards.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/qdev-core.h"
 #include "hw/qdev-properties.h"
 #include "qapi/error.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "qemu/units.h"
 #include "sysemu/blockdev.h"
diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sbsa-ref.c
+++ b/hw/arm/sbsa-ref.c
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "qemu/osdep.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "qapi/error.h"
 #include "qemu/error-report.h"
diff --git a/hw/arm/stm32f405_soc.c b/hw/arm/stm32f405_soc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/stm32f405_soc.c
+++ b/hw/arm/stm32f405_soc.c
@@ -XXX,XX +XXX,XX @@
 
 #include "qemu/osdep.h"
 #include "qapi/error.h"
-#include "qemu-common.h"
 #include "exec/address-spaces.h"
 #include "sysemu/sysemu.h"
 #include "hw/arm/stm32f405_soc.h"
diff --git a/hw/arm/vexpress.c b/hw/arm/vexpress.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/vexpress.c
+++ b/hw/arm/vexpress.c
@@ -XXX,XX +XXX,XX @@
 
 #include "qemu/osdep.h"
 #include "qapi/error.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "cpu.h"
 #include "hw/sysbus.h"
diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "qemu/osdep.h"
-#include "qemu-common.h"
 #include "qemu/datadir.h"
 #include "qemu/units.h"
 #include "qemu/option.h"
-- 
2.25.1

The calculation of the length of TLB range invalidate operations
in tlbi_aa64_range_get_length() is incorrect in two ways:
 * the NUM field is 5 bits, but we read only 4 bits
 * we miscalculate the page_shift value, because of an
   off-by-one error:
    TG 0b00 is invalid
    TG 0b01 is 4K granule size == 4096 == 2^12
    TG 0b10 is 16K granule size == 16384 == 2^14
    TG 0b11 is 64K granule size == 65536 == 2^16
   so page_shift should be (TG - 1) * 2 + 12

Thanks to the bug report submitter Cha HyunSoo for identifying
both these errors.

Fixes: 84940ed82552d3c ("target/arm: Add support for FEAT_TLBIRANGE")
Resolves: https://gitlab.com/qemu-project/qemu/-/issues/734
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20211130173257.1274194-1-peter.maydell@linaro.org
---
 target/arm/helper.c | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static uint64_t tlbi_aa64_range_get_length(CPUARMState *env,
     uint64_t exponent;
     uint64_t length;
 
-    num = extract64(value, 39, 4);
+    num = extract64(value, 39, 5);
     scale = extract64(value, 44, 2);
     page_size_granule = extract64(value, 46, 2);
 
-    page_shift = page_size_granule * 2 + 12;
-
     if (page_size_granule == 0) {
         qemu_log_mask(LOG_GUEST_ERROR, "Invalid page size granule %d\n",
                       page_size_granule);
         return 0;
     }
 
+    page_shift = (page_size_granule - 1) * 2 + 12;
+
     exponent = (5 * scale) + 1;
     length = (num + 1) << (exponent + page_shift);
 
-- 
2.25.1

From: Patrick Venture <venture@google.com>

The rx_active boolean change to true should always trigger a try_read
call that flushes the queue.

Signed-off-by: Patrick Venture <venture@google.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20211203221002.1719306-1-venture@google.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/net/npcm7xx_emc.c | 18 ++++++++----------
 1 file changed, 8 insertions(+), 10 deletions(-)

diff --git a/hw/net/npcm7xx_emc.c b/hw/net/npcm7xx_emc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/net/npcm7xx_emc.c
+++ b/hw/net/npcm7xx_emc.c
@@ -XXX,XX +XXX,XX @@ static void emc_halt_rx(NPCM7xxEMCState *emc, uint32_t mista_flag)
     emc_set_mista(emc, mista_flag);
 }
 
+static void emc_enable_rx_and_flush(NPCM7xxEMCState *emc)
+{
+    emc->rx_active = true;
+    qemu_flush_queued_packets(qemu_get_queue(emc->nic));
+}
+
 static void emc_set_next_tx_descriptor(NPCM7xxEMCState *emc,
                                        const NPCM7xxEMCTxDesc *tx_desc,
                                        uint32_t desc_addr)
@@ -XXX,XX +XXX,XX @@ static ssize_t emc_receive(NetClientState *nc, const uint8_t *buf, size_t len1)
     return len;
 }
 
-static void emc_try_receive_next_packet(NPCM7xxEMCState *emc)
-{
-    if (emc_can_receive(qemu_get_queue(emc->nic))) {
-        qemu_flush_queued_packets(qemu_get_queue(emc->nic));
-    }
-}
-
 static uint64_t npcm7xx_emc_read(void *opaque, hwaddr offset, unsigned size)
 {
     NPCM7xxEMCState *emc = opaque;
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_emc_write(void *opaque, hwaddr offset,
             emc->regs[REG_MGSTA] |= REG_MGSTA_RXHA;
         }
         if (value & REG_MCMDR_RXON) {
-            emc->rx_active = true;
+            emc_enable_rx_and_flush(emc);
         } else {
             emc_halt_rx(emc, 0);
         }
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_emc_write(void *opaque, hwaddr offset,
         break;
     case REG_RSDR:
         if (emc->regs[REG_MCMDR] & REG_MCMDR_RXON) {
-            emc->rx_active = true;
-            emc_try_receive_next_packet(emc);
+            emc_enable_rx_and_flush(emc);
         }
         break;
     case REG_MIIDA:
-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

When a virtio-iommu is instantiated, describe it using the ACPI VIOT
table.

diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt-acpi-build.c
+++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@
 #include "kvm_arm.h"
 #include "migration/vmstate.h"
 #include "hw/acpi/ghes.h"
+#include "hw/acpi/viot.h"
 
 #define ARM_SPI_BASE 32
 
@@ -XXX,XX +XXX,XX @@ void virt_acpi_build(VirtMachineState *vms, AcpiBuildTables *tables)
     }
 #endif
 
+    if (vms->iommu == VIRT_IOMMU_VIRTIO) {
+        acpi_add_table(table_offsets, tables_blob);
+        build_viot(ms, tables_blob, tables->linker, vms->virtio_iommu_bdf,
+                   vms->oem_id, vms->oem_table_id);
+    }
+
     /* XSDT is pointed to by RSDP */
     xsdt = tables_blob->len;
     build_xsdt(tables_blob, tables->linker, table_offsets, vms->oem_id,
diff --git a/hw/arm/Kconfig b/hw/arm/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/Kconfig
+++ b/hw/arm/Kconfig
@@ -XXX,XX +XXX,XX @@ config ARM_VIRT
     select DIMM
     select ACPI_HW_REDUCED
     select ACPI_APEI
+    select ACPI_VIOT
 
 config CHEETAH
     bool
-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

virtio-iommu is now supported with ACPI VIOT as well as device tree.
Remove the restriction that prevents from instantiating a virtio-iommu
device under ACPI.

diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static HotplugHandler *virt_machine_get_hotplug_handler(MachineState *machine,
     MachineClass *mc = MACHINE_GET_CLASS(machine);
 
     if (device_is_dynamic_sysbus(mc, dev) ||
-       (object_dynamic_cast(OBJECT(dev), TYPE_PC_DIMM))) {
+        object_dynamic_cast(OBJECT(dev), TYPE_PC_DIMM) ||
+        object_dynamic_cast(OBJECT(dev), TYPE_VIRTIO_IOMMU_PCI)) {
         return HOTPLUG_HANDLER(machine);
     }
-    if (object_dynamic_cast(OBJECT(dev), TYPE_VIRTIO_IOMMU_PCI)) {
-        VirtMachineState *vms = VIRT_MACHINE(machine);
-
-        if (!vms->bootinfo.firmware_loaded || !virt_is_acpi_enabled(vms)) {
-            return HOTPLUG_HANDLER(machine);
-        }
-    }
     return NULL;
 }
 
diff --git a/hw/virtio/virtio-iommu-pci.c b/hw/virtio/virtio-iommu-pci.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/virtio/virtio-iommu-pci.c
+++ b/hw/virtio/virtio-iommu-pci.c
@@ -XXX,XX +XXX,XX @@ static void virtio_iommu_pci_realize(VirtIOPCIProxy *vpci_dev, Error **errp)
     VirtIOIOMMU *s = VIRTIO_IOMMU(vdev);
 
     if (!qdev_get_machine_hotplug_handler(DEVICE(vpci_dev))) {
-        MachineClass *mc = MACHINE_GET_CLASS(qdev_get_machine());
-
-        error_setg(errp,
-                   "%s machine fails to create iommu-map device tree bindings",
-                   mc->name);
-        error_append_hint(errp,
-                          "Check your machine implements a hotplug handler "
-                          "for the virtio-iommu-pci device\n");
-        error_append_hint(errp, "Check the guest is booted without FW or with "
-                          "-no-acpi\n");
+        error_setg(errp, "Check your machine implements a hotplug handler "
+                         "for the virtio-iommu-pci device");
         return;
     }
     for (int i = 0; i < s->nb_reserved_regions; i++) {
-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

We do not support instantiating multiple IOMMUs. Before adding a
virtio-iommu, check that no other IOMMU is present. This will detect
both "iommu=smmuv3" machine parameter and another virtio-iommu instance.

Fixes: 70e89132c9 ("hw/arm/virt: Add the virtio-iommu device tree mappings")
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
Message-id: 20211210170415.583179-4-jean-philippe@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/virt.c | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void virt_machine_device_pre_plug_cb(HotplugHandler *hotplug_dev,
         hwaddr db_start = 0, db_end = 0;
         char *resv_prop_str;
 
+        if (vms->iommu != VIRT_IOMMU_NONE) {
+            error_setg(errp, "virt machine does not support multiple IOMMUs");
+            return;
+        }
+
         switch (vms->msi_controller) {
         case VIRT_MSI_CTRL_NONE:
             return;
-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

To propagate errors to the caller of the pre_plug callback, use the
object_poperty_set*() functions directly instead of the qdev_prop_set*()
helpers.

Suggested-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
Message-id: 20211210170415.583179-5-jean-philippe@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/virt.c | 5 +++--
 1 file changed, 3 insertions(+), 2 deletions(-)

diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void virt_machine_device_pre_plug_cb(HotplugHandler *hotplug_dev,
                                         db_start, db_end,
                                         VIRTIO_IOMMU_RESV_MEM_T_MSI);
 
-        qdev_prop_set_uint32(dev, "len-reserved-regions", 1);
-        qdev_prop_set_string(dev, "reserved-regions[0]", resv_prop_str);
+        object_property_set_uint(OBJECT(dev), "len-reserved-regions", 1, errp);
+        object_property_set_str(OBJECT(dev), "reserved-regions[0]",
+                                resv_prop_str, errp);
         g_free(resv_prop_str);
     }
 }
-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

Create empty data files and allow updates for the upcoming VIOT tests.

Acked-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
Message-id: 20211210170415.583179-6-jean-philippe@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tests/qtest/bios-tables-test-allowed-diff.h | 3 +++
 tests/data/acpi/q35/DSDT.viot               | 0
 tests/data/acpi/q35/VIOT.viot               | 0
 tests/data/acpi/virt/VIOT                   | 0
 4 files changed, 3 insertions(+)
 create mode 100644 tests/data/acpi/q35/DSDT.viot
 create mode 100644 tests/data/acpi/q35/VIOT.viot
 create mode 100644 tests/data/acpi/virt/VIOT

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

Add two test cases for VIOT, one on the q35 machine and the other on
virt. To test complex topologies the q35 test has two PCIe buses that
bypass the IOMMU (and are therefore not described by VIOT), and two
buses that are translated by virtio-iommu.

Reviewed-by: Eric Auger <eric.auger@redhat.com>
Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
Message-id: 20211210170415.583179-7-jean-philippe@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tests/qtest/bios-tables-test.c | 38 ++++++++++++++++++++++++++++++++++
 1 file changed, 38 insertions(+)

diff --git a/tests/qtest/bios-tables-test.c b/tests/qtest/bios-tables-test.c
index XXXXXXX..XXXXXXX 100644
--- a/tests/qtest/bios-tables-test.c
+++ b/tests/qtest/bios-tables-test.c
@@ -XXX,XX +XXX,XX @@ static void test_acpi_virt_tcg(void)
     free_test_data(&data);
 }
 
+static void test_acpi_q35_viot(void)
+{
+    test_data data = {
+        .machine = MACHINE_Q35,
+        .variant = ".viot",
+    };
+
+    /*
+     * To keep things interesting, two buses bypass the IOMMU.
+     * VIOT should only describes the other two buses.
+     */
+    test_acpi_one("-machine default_bus_bypass_iommu=on "
+                  "-device virtio-iommu-pci "
+                  "-device pxb-pcie,bus_nr=0x10,id=pcie.100,bus=pcie.0 "
+                  "-device pxb-pcie,bus_nr=0x20,id=pcie.200,bus=pcie.0,bypass_iommu=on "
+                  "-device pxb-pcie,bus_nr=0x30,id=pcie.300,bus=pcie.0",
+                  &data);
+    free_test_data(&data);
+}
+
+static void test_acpi_virt_viot(void)
+{
+    test_data data = {
+        .machine = "virt",
+        .uefi_fl1 = "pc-bios/edk2-aarch64-code.fd",
+        .uefi_fl2 = "pc-bios/edk2-arm-vars.fd",
+        .cd = "tests/data/uefi-boot-images/bios-tables-test.aarch64.iso.qcow2",
+        .ram_start = 0x40000000ULL,
+        .scan_len = 128ULL * 1024 * 1024,
+    };
+
+    test_acpi_one("-cpu cortex-a57 "
+                  "-device virtio-iommu-pci", &data);
+    free_test_data(&data);
+}
+
 static void test_oem_fields(test_data *data)
 {
     int i;
@@ -XXX,XX +XXX,XX @@ int main(int argc, char *argv[])
             qtest_add_func("acpi/q35/kvm/xapic", test_acpi_q35_kvm_xapic);
             qtest_add_func("acpi/q35/kvm/dmar", test_acpi_q35_kvm_dmar);
         }
+        qtest_add_func("acpi/q35/viot", test_acpi_q35_viot);
     } else if (strcmp(arch, "aarch64") == 0) {
         if (has_tcg) {
             qtest_add_func("acpi/virt", test_acpi_virt_tcg);
@@ -XXX,XX +XXX,XX @@ int main(int argc, char *argv[])
             qtest_add_func("acpi/virt/memhp", test_acpi_virt_tcg_memhp);
             qtest_add_func("acpi/virt/pxb", test_acpi_virt_tcg_pxb);
             qtest_add_func("acpi/virt/oem-fields", test_acpi_oem_fields_virt);
+            qtest_add_func("acpi/virt/viot", test_acpi_virt_viot);
         }
     }
     ret = g_test_run();
-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

Add expected blobs of the VIOT and DSDT table for the VIOT test on the
q35 machine.

Since the test instantiates a virtio device and two PCIe expander
bridges, DSDT.viot has more blocks than the base DSDT.

The VIOT table generated for the q35 test is:

[000h 0000   4]                    Signature : "VIOT"    [Virtual I/O Translation Table]
[004h 0004   4]                 Table Length : 00000070
[008h 0008   1]                     Revision : 00
[009h 0009   1]                     Checksum : 3D
[00Ah 0010   6]                       Oem ID : "BOCHS "
[010h 0016   8]                 Oem Table ID : "BXPC    "
[018h 0024   4]                 Oem Revision : 00000001
[01Ch 0028   4]              Asl Compiler ID : "BXPC"
[020h 0032   4]        Asl Compiler Revision : 00000001

[024h 0036   2]                   Node count : 0003
[026h 0038   2]                  Node offset : 0030
[028h 0040   8]                     Reserved : 0000000000000000

[030h 0048   1]                         Type : 03 [VirtIO-PCI IOMMU]
[031h 0049   1]                     Reserved : 00
[032h 0050   2]                       Length : 0010

[034h 0052   2]                  PCI Segment : 0000
[036h 0054   2]               PCI BDF number : 0010
[038h 0056   8]                     Reserved : 0000000000000000

[040h 0064   1]                         Type : 01 [PCI Range]
[041h 0065   1]                     Reserved : 00
[042h 0066   2]                       Length : 0018

[044h 0068   4]               Endpoint start : 00003000
[048h 0072   2]            PCI Segment start : 0000
[04Ah 0074   2]              PCI Segment end : 0000
[04Ch 0076   2]                PCI BDF start : 3000
[04Eh 0078   2]                  PCI BDF end : 30FF
[050h 0080   2]                  Output node : 0030
[052h 0082   6]                     Reserved : 000000000000

[058h 0088   1]                         Type : 01 [PCI Range]
[059h 0089   1]                     Reserved : 00
[05Ah 0090   2]                       Length : 0018

[05Ch 0092   4]               Endpoint start : 00001000
[060h 0096   2]            PCI Segment start : 0000
[062h 0098   2]              PCI Segment end : 0000
[064h 0100   2]                PCI BDF start : 1000
[066h 0102   2]                  PCI BDF end : 10FF
[068h 0104   2]                  Output node : 0030
[06Ah 0106   6]                     Reserved : 000000000000

And the DSDT diff is:

@@ -XXX,XX +XXX,XX @@
  *
  * Disassembling to symbolic ASL+ operators
  *
- * Disassembly of tests/data/acpi/q35/DSDT, Fri Dec 10 15:03:08 2021
+ * Disassembly of /tmp/aml-H9Y5D1, Fri Dec 10 15:02:27 2021
  *
  * Original Table Header:
  *     Signature        "DSDT"
- *     Length           0x00002061 (8289)
+ *     Length           0x000024B6 (9398)
  *     Revision         0x01 **** 32-bit table (V1), no 64-bit math support
- *     Checksum         0xFA
+ *     Checksum         0xA7
  *     OEM ID           "BOCHS "
  *     OEM Table ID     "BXPC    "
  *     OEM Revision     0x00000001 (1)
@@ -XXX,XX +XXX,XX @@
         }
     }

+    Scope (\_SB)
+    {
+        Device (PC30)
+        {
+            Name (_UID, 0x30)  // _UID: Unique ID
+            Name (_BBN, 0x30)  // _BBN: BIOS Bus Number
+            Name (_HID, EisaId ("PNP0A08") /* PCI Express Bus */)  // _HID: Hardware ID
+            Name (_CID, EisaId ("PNP0A03") /* PCI Bus */)  // _CID: Compatible ID
+            Method (_OSC, 4, NotSerialized)  // _OSC: Operating System Capabilities
+            {
+                CreateDWordField (Arg3, Zero, CDW1)
+                If ((Arg0 == ToUUID ("33db4d5b-1ff7-401c-9657-7441c03dd766") /* PCI Host Bridge Device */))
+                {
+                    CreateDWordField (Arg3, 0x04, CDW2)
+                    CreateDWordField (Arg3, 0x08, CDW3)
+                    Local0 = CDW3 /* \_SB_.PC30._OSC.CDW3 */
+                    Local0 &= 0x1F
+                    If ((Arg1 != One))
+                    {
+                        CDW1 |= 0x08
+                    }
+
+                    If ((CDW3 != Local0))
+                    {
+                        CDW1 |= 0x10
+                    }
+
+                    CDW3 = Local0
+                }
+                Else
+                {
+                    CDW1 |= 0x04
+                }
+
+                Return (Arg3)
+            }
+
+            Method (_PRT, 0, NotSerialized)  // _PRT: PCI Routing Table
+            {
+                Local0 = Package (0x80){}
+                Local1 = Zero
+                While ((Local1 < 0x80))
+                {
+                    Local2 = (Local1 >> 0x02)
+                    Local3 = ((Local1 + Local2) & 0x03)
+                    If ((Local3 == Zero))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKD,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == One))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKA,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == 0x02))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKB,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == 0x03))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKC,
+                                Zero
+                            }
+                    }
+
+                    Local4 [Zero] = ((Local2 << 0x10) | 0xFFFF)
+                    Local4 [One] = (Local1 & 0x03)
+                    Local0 [Local1] = Local4
+                    Local1++
+                }
+
+                Return (Local0)
+            }
+
+            Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
+            {
+                WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
+                    0x0000,             // Granularity
+                    0x0030,             // Range Minimum
+                    0x0030,             // Range Maximum
+                    0x0000,             // Translation Offset
+                    0x0001,             // Length
+                    ,, )
+            })
+        }
+    }
+
+    Scope (\_SB)
+    {
+        Device (PC20)
+        {
+            Name (_UID, 0x20)  // _UID: Unique ID
+            Name (_BBN, 0x20)  // _BBN: BIOS Bus Number
+            Name (_HID, EisaId ("PNP0A08") /* PCI Express Bus */)  // _HID: Hardware ID
+            Name (_CID, EisaId ("PNP0A03") /* PCI Bus */)  // _CID: Compatible ID
+            Method (_OSC, 4, NotSerialized)  // _OSC: Operating System Capabilities
+            {
+                CreateDWordField (Arg3, Zero, CDW1)
+                If ((Arg0 == ToUUID ("33db4d5b-1ff7-401c-9657-7441c03dd766") /* PCI Host Bridge Device */))
+                {
+                    CreateDWordField (Arg3, 0x04, CDW2)
+                    CreateDWordField (Arg3, 0x08, CDW3)
+                    Local0 = CDW3 /* \_SB_.PC20._OSC.CDW3 */
+                    Local0 &= 0x1F
+                    If ((Arg1 != One))
+                    {
+                        CDW1 |= 0x08
+                    }
+
+                    If ((CDW3 != Local0))
+                    {
+                        CDW1 |= 0x10
+                    }
+
+                    CDW3 = Local0
+                }
+                Else
+                {
+                    CDW1 |= 0x04
+                }
+
+                Return (Arg3)
+            }
+
+            Method (_PRT, 0, NotSerialized)  // _PRT: PCI Routing Table
+            {
+                Local0 = Package (0x80){}
+                Local1 = Zero
+                While ((Local1 < 0x80))
+                {
+                    Local2 = (Local1 >> 0x02)
+                    Local3 = ((Local1 + Local2) & 0x03)
+                    If ((Local3 == Zero))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKD,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == One))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKA,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == 0x02))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKB,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == 0x03))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKC,
+                                Zero
+                            }
+                    }
+
+                    Local4 [Zero] = ((Local2 << 0x10) | 0xFFFF)
+                    Local4 [One] = (Local1 & 0x03)
+                    Local0 [Local1] = Local4
+                    Local1++
+                }
+
+                Return (Local0)
+            }
+
+            Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
+            {
+                WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
+                    0x0000,             // Granularity
+                    0x0020,             // Range Minimum
+                    0x0020,             // Range Maximum
+                    0x0000,             // Translation Offset
+                    0x0001,             // Length
+                    ,, )
+            })
+        }
+    }
+
+    Scope (\_SB)
+    {
+        Device (PC10)
+        {
+            Name (_UID, 0x10)  // _UID: Unique ID
+            Name (_BBN, 0x10)  // _BBN: BIOS Bus Number
+            Name (_HID, EisaId ("PNP0A08") /* PCI Express Bus */)  // _HID: Hardware ID
+            Name (_CID, EisaId ("PNP0A03") /* PCI Bus */)  // _CID: Compatible ID
+            Method (_OSC, 4, NotSerialized)  // _OSC: Operating System Capabilities
+            {
+                CreateDWordField (Arg3, Zero, CDW1)
+                If ((Arg0 == ToUUID ("33db4d5b-1ff7-401c-9657-7441c03dd766") /* PCI Host Bridge Device */))
+                {
+                    CreateDWordField (Arg3, 0x04, CDW2)
+                    CreateDWordField (Arg3, 0x08, CDW3)
+                    Local0 = CDW3 /* \_SB_.PC10._OSC.CDW3 */
+                    Local0 &= 0x1F
+                    If ((Arg1 != One))
+                    {
+                        CDW1 |= 0x08
+                    }
+
+                    If ((CDW3 != Local0))
+                    {
+                        CDW1 |= 0x10
+                    }
+
+                    CDW3 = Local0
+                }
+                Else
+                {
+                    CDW1 |= 0x04
+                }
+
+                Return (Arg3)
+            }
+
+            Method (_PRT, 0, NotSerialized)  // _PRT: PCI Routing Table
+            {
+                Local0 = Package (0x80){}
+                Local1 = Zero
+                While ((Local1 < 0x80))
+                {
+                    Local2 = (Local1 >> 0x02)
+                    Local3 = ((Local1 + Local2) & 0x03)
+                    If ((Local3 == Zero))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKD,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == One))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKA,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == 0x02))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKB,
+                                Zero
+                            }
+                    }
+
+                    If ((Local3 == 0x03))
+                    {
+                        Local4 = Package (0x04)
+                            {
+                                Zero,
+                                Zero,
+                                LNKC,
+                                Zero
+                            }
+                    }
+
+                    Local4 [Zero] = ((Local2 << 0x10) | 0xFFFF)
+                    Local4 [One] = (Local1 & 0x03)
+                    Local0 [Local1] = Local4
+                    Local1++
+                }
+
+                Return (Local0)
+            }
+
+            Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
+            {
+                WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
+                    0x0000,             // Granularity
+                    0x0010,             // Range Minimum
+                    0x0010,             // Range Maximum
+                    0x0000,             // Translation Offset
+                    0x0001,             // Length
+                    ,, )
+            })
+        }
+    }
+
     Scope (\_SB.PCI0)
     {
         Name (_CRS, ResourceTemplate ()  // _CRS: Current Resource Settings
@@ -XXX,XX +XXX,XX @@
             WordBusNumber (ResourceProducer, MinFixed, MaxFixed, PosDecode,
                 0x0000,             // Granularity
                 0x0000,             // Range Minimum
-                0x00FF,             // Range Maximum
+                0x000F,             // Range Maximum
                 0x0000,             // Translation Offset
-                0x0100,             // Length
+                0x0010,             // Length
                 ,, )
             IO (Decode16,
                 0x0CF8,             // Range Minimum
@@ -XXX,XX +XXX,XX @@
                 }
             }

+            Device (S10)
+            {
+                Name (_ADR, 0x00020000)  // _ADR: Address
+            }
+
+            Device (S18)
+            {
+                Name (_ADR, 0x00030000)  // _ADR: Address
+            }
+
+            Device (S20)
+            {
+                Name (_ADR, 0x00040000)  // _ADR: Address
+            }
+
+            Device (S28)
+            {
+                Name (_ADR, 0x00050000)  // _ADR: Address
+            }
+
             Method (PCNT, 0, NotSerialized)
             {
             }

Reviewed-by: Eric Auger <eric.auger@redhat.com>
Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
Message-id: 20211210170415.583179-8-jean-philippe@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tests/qtest/bios-tables-test-allowed-diff.h |   2 --
 tests/data/acpi/q35/DSDT.viot               | Bin 0 -> 9398 bytes
 tests/data/acpi/q35/VIOT.viot               | Bin 0 -> 112 bytes
 3 files changed, 2 deletions(-)

diff --git a/tests/qtest/bios-tables-test-allowed-diff.h b/tests/qtest/bios-tables-test-allowed-diff.h
index XXXXXXX..XXXXXXX 100644
--- a/tests/qtest/bios-tables-test-allowed-diff.h
+++ b/tests/qtest/bios-tables-test-allowed-diff.h
@@ -XXX,XX +XXX,XX @@
 /* List of comma-separated changed AML files to ignore */
 "tests/data/acpi/virt/VIOT",
-"tests/data/acpi/q35/DSDT.viot",
-"tests/data/acpi/q35/VIOT.viot",
diff --git a/tests/data/acpi/q35/DSDT.viot b/tests/data/acpi/q35/DSDT.viot
index XXXXXXX..XXXXXXX 100644
GIT binary patch
literal 9398
zcmeHNO>7&-8J*>iv|O&FB}G~Oi$yp||57BBoWHhc5OS9yDTx$CQgH$r;8Idr*-4Q_
z5(9Az1F`}niVsB-)<KW7p`g9Br(A2Gm-gmc1N78GFS!;)e2V(MnH_0{q<{#yMgn&C
zn|*J-d9yqFhO_H6z19~`FlPL*u<DkZ*}|)JH;X@mF-FI<cPg<fti9tEN*yB^i5czN
zNq&q?!OZ;BE3B7{KWzJ-`Tn~f`9?Qj8~2^N8{Oc8J%57{==w%rS#;nOCp*nTr@iZ1
zb+?i;JLQUJ=O0?8*>S~D)a>NF1~WVB6^~_B#yhJ`H+JU@=6aXs`?Yv)J2h=N?drcS
zeLZ*n<<Bm^n}6`jfBx#u8&(W}1?)}iF9o#mZ~E2+zwdn7yK3AbIzKnxpZ>JRPm3~#
z&ICS{+_OayRW-l=Mtk=~uaS3o8z<_udd|(wqg`&JnVPfCe>BUOO`Su3e>pff_^UW%
z&JE^NO`)=Amg~iqRB1pPscP?(>#ZuY8GHCmlEvD$9g3%4Db~Dfz2SATnddvrR-Oe^
z;s;dJec!hnzi)ri^I6YN9vtkm{^TdUF8h7gX8-<Qe4p)GQ=)AtYx2VcwdLVAEXEjG
z^Mj|UHPqkj-LsWuzQem1>F3atdZn=zv3$#RmZzSHN+6-yyU#8cJb=YDilX&sl}vNm
znkgAR^O<3kj4if>{ly5fwRfMWuC5=lrlvKPX~i#654Cp}R_d*JS$9laZ$ra6)<ns8
zFZy28G%xP(nit&F>LDi%G<tIc=TY=gl$jSD&Uv!Yat~XR46h%rI$!}a%!|xG7u8Zn
zeY8_|n=K>xz_v_W8VX$W-Fg-qFWcT}7MCyz{%%{ia7hZ>Law-k6NOr}VI&_48U=2l
zwqDKFE8eTwwozDdms#e?x?5a|v>&JF;2_v0L~z5n%BYU^52<*cWuD4|GYUm@1+?))
zte^45>Rz)t*<T5V#={r>@t@{%?^i#W{i=HAZ*Dc9y59Va-+#P!jrGs;u38a{fLr`N
zvT@rUu>DljxJ?^&Z?-?vyJn3C>3D=qux{Y*bs5|5n)Qmi$TD^Zdn4GU$ocJS2Hh-<
z`xPI^^+v0nUVdjMos8k`WGl7hA`{03ju%<lrgAHSpd^DRf-*}_#Ly0mB!LSfVgWcQ
z&T$@~G9)JI=hz5m0vkrel+Xy{Oh7pkAu-V!j*W7rY(bO}Q$nMH2`FbGB&N)QaV4<4
zo)~9JXiP9=;}NPl<C@MmXG&;XFlFNrsyfFsonxFSp<}vEgsRSQP3O3#b6nSnP}ON_
zI!#Tdsp~|j>ckUB>FI=~GokB5sOq#dotCE4(sd$KbtW~PNlj-`*NIToiD#j5J#9^=
zt?NXn>YUJYPG~wObe#xQos*i*NloXZt`niEb4t@WrRki~bs|)CI+{*L)9L6s5vn><
zn$DD_Go|Z9sOn5>I@6lYw5}7Os&iV?Ij!lO)^#FOb!If38BJ$K*NIToIiu;E(R9w}
zIuWWmPiZ<&X*y5oIuWWmF_XaEC!a&Jn$B5WCqh-{X-(&8P3LJ{Cqh-{8P3dyPr@^t
zSqL9?X9Uwd3W@23*s~h*tj0X6GZCuHa~kuU#yqDp5vt7d8uPryJg+kms?5hU=3^T3
zF`bD}WnSP+=`t5MQ$FJ_2&Q~+BP6E0f^%BVIW6a$o)e+SX~IDBih-7z6{O~7YTy`&
zLjy&Cv?7QikV#>n0>>@MV8oK`Gmun34-FKdlm-J8SZSaNlnhir4-FI{S|bfqV8e)V
zss<{chX#reE#g=hsKAC%sF6d-Km}BWs!kZFsFpKfpbC@>6rprQGEjt4Ck#|zITHq|
zK*>M_l;<P^MJRQ`Kn0dFVW0|>3{*fllMEE0)CmI>Sk8ojDo`>|0p(0GP=xY&!axO<
zGhv_#lnhirIg<<&q0|Wj6<E%MfhtfkPyyvkGEjt4Ck#|zITHq|K*>M_lrzad5lWpf
zP=V!47^ngz0~JutBm+e#b;3XemNQ|X3X}{~Ksl2P6rt1!0~J`#gn=qhGEf2KOfpb}
zQYQ>lU^x>8szAv=1(Y+%KoLrvFi?TzOc<yFB?A>u&LjgxD0RX>1(q{mpbC@>R6seC
z3>2Z%2?G^a&V+#~P%=;f<xDbAgi<FARA4z12C6{GKn0XD$v_cGoiI>=<xCi;0wn_#
zP|hR+MJRQ`Kn0dFVW0|>3{*fllMEE0)CmI>Sk8ojDo`>|0p(0GP=rz^3{+q_69%e4
z$v_2^Gs!>^N}VuJf#pmXr~)Me6;RG314Srx!axxz28u{EP=u<1B2)}iVZuNaCK;&0
zBm-5LFi?dF167!0pbC==RAItE6($T+VUmF=Ofpb~2?JG_Fi?d_2C6X0Kouqo6p_5T
zFi=FeV!SiSKoR0H$dH(_Z(*Q_WZ%L-5y`$K14StNmJAdjmWs}HV4<vU_xO+1efmLq
zZ;W>N_U)fP6Qy6Nw5mbt9Y(#emWSi66=>tq#xoh#Ue=0qyhxi8ZOUe5y0V7VfPUhp
zwX=;ymc+i5%sg9Ja~lZ&8oAV@mHc>&CHP9v4R(jhtT?un;O4e9#pno)Xkh7OWgK&a
zyj=3Iv0OuoK_;5rOr5f(Kb~ZXDBO+V`OWYo#_C08imwChQxnjdd?wZLDou8aj;$SD
zGDYiA3<$Tu<JnHL(KPOChi#zrR32t83}naR$+ym4P_h?z_5#|cW-nw$XD_sOtE62l
zrD3@*)NVyiklt0&yF9%+klsBey&I<Y2E<!f(E8TuJte)z(|ZHyy<^gQVfx}=`q&B5
z7nSryp1wGczIaUfVwiq$Fn#<4=@*ssi#+|}K>EdF(l3VTOM~ghPLRH&q%ZOGrGfON
zW73zx^yR_y<0nX8R??Sw`tm^f@-gYlNFSp|*<gA{q?Zp5Oe-+l#rmyYmKozi9y=P>
zVReJU*h=ZuVXiS$ohTbw-O#v9>(yZbGE|)?8(H1ZIKvV!jWa0>vy!3eMA^vdhQ>`s
zuMSg{q3T50$m)j1!HixV<}X9liL#N^4c*tL^y)CF8LCc{jjV3yKAqL8!%SzWI#H%q
z=bSrQ&)%JCRttF5g4Zf`6l?y@>PzD7MA^D>wBlcH6r1ucwJ<p0O%rZ?JzIY3-QdmZ
zzs|n>`a5r3e|z)wcUaqS>nqFQ-8x}eCF4u`OWUxqst-@1rSmUs%WmKP5e0dcb?e2N
z;Z|x*!);VwF|Yuhqs^khqOM!@u*jY!WYldISF(V6`BoNd&6Qfk3>X#SuD^7J>p_D=
zBPa51y^_n#=cpOt#Zf$ya$Ae9Mfz56n|<i!a=ELS@)%a{^NIH3SDuN<R~sah1km#P
zU@?*f%<rG=4W1wgfi;C?_n|W@%lm$&8YfvNOJodIg&IcIpIJQRHr<+ej11GQ6)&eF
z2Lam*jIH}#y0>KnY%4JQfOYS$*uU%f#@$U6`N8I3N-lV?5ErFCdv~xDmu2(wexld4
z4v^;aVAT2k6GJ^m*FD(Wqc(Qg^)6a<?}h$zLoj}4;PP!+(O{@!a1y-hoAhF_7!z+6
zslpAmNtYbjHrw-~#SPVk_FUf>-Obg6yV`8o$8_`PyJe_;bY5_EMBfBfWU!Q=*9HsG
z%_Cda{@_Krr!oHVhv9+y+T5qR8zZ2aZ>5r!$*|f$^U%yBUYfR&B!+EYy_PwL!BeUi
zJH^}r3r9Q+B)X@Z)fk=P13w&7x#wBtXTZ)g>WITPg5r&pQc!nmyrmk#S(>>b9xnNr
zx_b#v9Xv-Y><Wb%?S^0Xe&<)bbKl_=Z|3C$tf|F<bYzE*mfHB;uC)`q-?buaBe?l?
zcLTpK*k<49Z32`K?|nSBMFqxTK^_IE-li2fEGdK~(ZdoKBl6ab4a;Hler#`xvEXJG
zb?<E%EZExfX>jcOVhS*0rS~RS1dA#xhkv@Nct@#q?LyeKS<$uFec!bw>{@uu$gZ6a
zyVen1i{1BKd%~`D7|m$;U0a<I*3I7%^N%N%lGYdU_GS!gaR8T$NA@GzFi~z`l7hdl
zarZy6590|88pi(1zq;V(>38zM0sT&<zX;R5$1w3;`_JMG`;&I&0Y23DMx1%@(w(R9
z4M$j;D5J+Gy%fijRQsctzFKf&cv|BAz#YLq3CZJWDdtL4u1u1|mkdcUp7|sxJC+?Y
z_@@s`v3j}Q7*z>6X~cwUxUL8G1KT)_XTp!KAbs;vCp{K3&~_X@+ew=-D}v`2MbFV0
zQsVsL=rXi-pI*G|iiz;VTCutgUs)hDzV1+4?8KcoP3xROf<M%qC6lgVdpFt4<-|uM
z=#rl_b1#YjSIl6Toj2z_hOZcKupkdE(LozC(fN=FY(x|sk)ym|;Rq2E1xJWD%Z!ol
Gu>S+TT-130

literal 0
HcmV?d00001

diff --git a/tests/data/acpi/q35/VIOT.viot b/tests/data/acpi/q35/VIOT.viot
index XXXXXXX..XXXXXXX 100644
GIT binary patch
literal 112
zcmWIZ^baXu00LVle`k+i1*eDrX9XZ&1PX!JAex!M0Hgv8m>C3sGzdcgBZCA3T-xBj
Q0Zb)W9Hva*zW_`e0M!8s0RR91

literal 0
HcmV?d00001

-- 
2.25.1

From: Jean-Philippe Brucker <jean-philippe@linaro.org>

The VIOT blob contains the following:

[000h 0000   4]                    Signature : "VIOT"    [Virtual I/O Translation Table]
[004h 0004   4]                 Table Length : 00000058
[008h 0008   1]                     Revision : 00
[009h 0009   1]                     Checksum : 66
[00Ah 0010   6]                       Oem ID : "BOCHS "
[010h 0016   8]                 Oem Table ID : "BXPC    "
[018h 0024   4]                 Oem Revision : 00000001
[01Ch 0028   4]              Asl Compiler ID : "BXPC"
[020h 0032   4]        Asl Compiler Revision : 00000001

[024h 0036   2]                   Node count : 0002
[026h 0038   2]                  Node offset : 0030
[028h 0040   8]                     Reserved : 0000000000000000

[030h 0048   1]                         Type : 03 [VirtIO-PCI IOMMU]
[031h 0049   1]                     Reserved : 00
[032h 0050   2]                       Length : 0010

[034h 0052   2]                  PCI Segment : 0000
[036h 0054   2]               PCI BDF number : 0008
[038h 0056   8]                     Reserved : 0000000000000000

[040h 0064   1]                         Type : 01 [PCI Range]
[041h 0065   1]                     Reserved : 00
[042h 0066   2]                       Length : 0018

[044h 0068   4]               Endpoint start : 00000000
[048h 0072   2]            PCI Segment start : 0000
[04Ah 0074   2]              PCI Segment end : 0000
[04Ch 0076   2]                PCI BDF start : 0000
[04Eh 0078   2]                  PCI BDF end : 00FF
[050h 0080   2]                  Output node : 0030
[052h 0082   6]                     Reserved : 000000000000

Acked-by: Ani Sinha <ani@anisinha.ca>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Signed-off-by: Jean-Philippe Brucker <jean-philippe@linaro.org>
Message-id: 20211210170415.583179-9-jean-philippe@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tests/qtest/bios-tables-test-allowed-diff.h |   1 -
 tests/data/acpi/virt/VIOT                   | Bin 0 -> 88 bytes
 2 files changed, 1 deletion(-)

literal 0
HcmV?d00001

-- 
2.25.1