Series comparison

-[Qemu-devel] [PULL 00/21] target-arm queue
+[Qemu-devel] [PULL 00/25] target-arm queue
-The following changes since commit e5cd695266c5709308aa95b1baae499e4b5d4544:
+target-arm queue. This has the "plumb txattrs through various
 bits of exec.c" patches, and a collection of bug fixes from
 various people.
-  Merge remote-tracking branch 'remotes/cody/tags/block-pull-request' into staging (2018-05-08 17:05:58 +0100)
+thanks
 -- PMM
 The following changes since commit a3ac12fba028df90f7b3dbec924995c126c41022:
   Merge remote-tracking branch 'remotes/ehabkost/tags/numa-next-pull-request' into staging (2018-05-31 11:12:36 +0100)
 are available in the Git repository at:
-  git://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20180510
+  git://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20180531
-for you to fetch changes up to 9a9f1f59521f46e8ff4527d9a2b52f83577e2aa3:
+for you to fetch changes up to 49d1dca0520ea71bc21867fab6647f474fcf857b:
-  target/arm: Clear SVE high bits for FMOV (2018-05-10 18:10:58 +0100)
+  KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice (2018-05-31 14:52:53 +0100)
 ----------------------------------------------------------------
 target-arm queue:
- * hw/arm/iotkit.c: fix minor memory leak
+ * target/arm: Honour FPCR.FZ in FRECPX
- * softfloat: fix wrong-exception-flags bug for multiply-add corner case
+ * MAINTAINERS: Add entries for newer MPS2 boards and devices
- * arm: isolate and clean up DTB generation
+ * hw/intc/arm_gicv3: Fix APxR<n> register dispatching
- * implement Arm v8.1-Atomics extension
+ * arm_gicv3_kvm: fix bug in writing zero bits back to the in-kernel
- * Fix some bugs and missing instructions in the v8.2-FP16 extension
+   GIC state
  * tcg: Fix helper function vs host abi for float16
  * arm: fix qemu crash on startup with -bios option
  * arm: fix malloc type mismatch
  * xlnx-zdma: Correct mem leaks and memset to zero on desc unaligned errors
  * Correct CPACR reset value for v7 cores
  * memory.h: Improve IOMMU related documentation
  * exec: Plumb transaction attributes through various functions in
    preparation for allowing IOMMUs to see them
  * vmstate.h: Provide VMSTATE_BOOL_SUB_ARRAY
  * ARM: ACPI: Fix use-after-free due to memory realloc
  * KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice
 ----------------------------------------------------------------
-Igor Mammedov (4):
+Francisco Iglesias (1):
-      pc: simplify MachineClass::get_hotplug_handler handling
+      xlnx-zdma: Correct mem leaks and memset to zero on desc unaligned errors
       platform-bus-device: use device plug callback instead of machine_done notifier
       arm/boot: split load_dtb() from arm_load_kernel()
       make sure that we aren't overwriting mc->get_hotplug_handler by accident
-Peter Maydell (3):
+Igor Mammedov (1):
-      hw/arm/iotkit.c: fix minor memory leak
+      arm: fix qemu crash on startup with -bios option
       softfloat: Handle default NaN mode after pickNaNMulAdd, not before
       atomic.h: Work around gcc spurious "unused value" warning
-Richard Henderson (14):
+Jan Kiszka (1):
-      tcg: Introduce helpers for integer min/max
+      hw/intc/arm_gicv3: Fix APxR<n> register dispatching
       target/arm: Use new min/max expanders
       target/xtensa: Use new min/max expanders
       tcg: Introduce atomic helpers for integer min/max
       tcg: Use GEN_ATOMIC_HELPER_FN for opposite endian atomic add
       target/riscv: Use new atomic min/max expanders
       target/arm: Introduce ARM_FEATURE_V8_ATOMICS and initial decode
       target/arm: Fill in disas_ldst_atomic
       target/arm: Implement CAS and CASP
       target/arm: Enable ARM_FEATURE_V8_ATOMICS for user-only
       target/arm: Implement vector shifted SCVF/UCVF for fp16
       target/arm: Implement vector shifted FCVT for fp16
       target/arm: Fix float16 to/from int16
       target/arm: Clear SVE high bits for FMOV
- accel/tcg/atomic_template.h | 112 ++++++----
+Paolo Bonzini (1):
- accel/tcg/tcg-runtime.h     |   8 +
+      arm: fix malloc type mismatch
  hw/ppc/e500.h               |   5 +
  include/hw/arm/arm.h        |  45 +++-
  include/hw/arm/sysbus-fdt.h |  37 +---
  include/hw/arm/virt.h       |   1 +
  include/hw/i386/pc.h        |   8 -
  include/hw/platform-bus.h   |   4 +-
  include/qemu/atomic.h       |   2 +-
  target/arm/cpu.h            |   1 +
  target/arm/helper-a64.h     |   2 +
  target/arm/helper.h         |   4 +-
  tcg/tcg-op.h                |  50 +++++
  tcg/tcg.h                   |   8 +
  fpu/softfloat.c             |  52 +++--
  hw/arm/boot.c               |  72 ++-----
  hw/arm/iotkit.c             |   1 +
  hw/arm/sysbus-fdt.c         |  64 +-----
  hw/arm/virt.c               |  96 ++++++---
  hw/core/platform-bus.c      |  29 +--
  hw/i386/pc.c                |   7 +-
  hw/ppc/e500.c               |  38 ++--
  hw/ppc/e500plat.c           |  32 +++
  hw/ppc/spapr.c              |   1 +
  hw/s390x/s390-virtio-ccw.c  |   1 +
  linux-user/elfload.c        |   1 +
  target/arm/cpu64.c          |   1 +
  target/arm/helper-a64.c     |  43 ++++
  target/arm/helper.c         |  53 ++++-
  target/arm/translate-a64.c  | 490 +++++++++++++++++++++++++++++++++-----------
  target/riscv/translate.c    |  72 ++-----
  target/xtensa/translate.c   |  50 +++--
  tcg/tcg-op.c                |  48 +++++
 files changed, 934 insertions(+), 504 deletions(-)
+Peter Maydell (17):
+      target/arm: Honour FPCR.FZ in FRECPX
+      MAINTAINERS: Add entries for newer MPS2 boards and devices
+      Correct CPACR reset value for v7 cores
+      memory.h: Improve IOMMU related documentation
+      Make tb_invalidate_phys_addr() take a MemTxAttrs argument
+      Make address_space_translate{, _cached}() take a MemTxAttrs argument
+      Make address_space_map() take a MemTxAttrs argument
+      Make address_space_access_valid() take a MemTxAttrs argument
+      Make flatview_extend_translation() take a MemTxAttrs argument
+      Make memory_region_access_valid() take a MemTxAttrs argument
+      Make MemoryRegion valid.accepts callback take a MemTxAttrs argument
+      Make flatview_access_valid() take a MemTxAttrs argument
+      Make flatview_translate() take a MemTxAttrs argument
+      Make address_space_get_iotlb_entry() take a MemTxAttrs argument
+      Make flatview_do_translate() take a MemTxAttrs argument
+      Make address_space_translate_iommu take a MemTxAttrs argument
+      vmstate.h: Provide VMSTATE_BOOL_SUB_ARRAY
+Richard Henderson (1):
+      tcg: Fix helper function vs host abi for float16
+Shannon Zhao (3):
+      arm_gicv3_kvm: increase clroffset accordingly
+      ARM: ACPI: Fix use-after-free due to memory realloc
+      KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice
+ include/exec/exec-all.h        |   5 +-
+ include/exec/helper-head.h     |   2 +-
+ include/exec/memory-internal.h |   3 +-
+ include/exec/memory.h          | 128 +++++++++++++++++++++++++++++++++++------
+ include/migration/vmstate.h    |   3 +
+ include/sysemu/dma.h           |   6 +-
+ accel/tcg/translate-all.c      |   4 +-
+ exec.c                         |  95 ++++++++++++++++++------------
+ hw/arm/boot.c                  |  18 +++---
+ hw/arm/virt-acpi-build.c       |  20 +++++--
+ hw/dma/xlnx-zdma.c             |  10 +++-
+ hw/hppa/dino.c                 |   3 +-
+ hw/intc/arm_gic_kvm.c          |   1 -
+ hw/intc/arm_gicv3_cpuif.c      |  12 ++--
+ hw/intc/arm_gicv3_kvm.c        |   2 +-
+ hw/nvram/fw_cfg.c              |  12 ++--
+ hw/s390x/s390-pci-inst.c       |   3 +-
+ hw/scsi/esp.c                  |   3 +-
+ hw/vfio/common.c               |   3 +-
+ hw/virtio/vhost.c              |   3 +-
+ hw/xen/xen_pt_msi.c            |   3 +-
+ memory.c                       |  12 ++--
+ memory_ldst.inc.c              |  18 +++---
+ target/arm/gdbstub.c           |   3 +-
+ target/arm/helper-a64.c        |  41 +++++++------
+ target/arm/helper.c            |  90 ++++++++++++++++-------------
+ target/ppc/mmu-hash64.c        |   3 +-
+ target/riscv/helper.c          |   2 +-
+ target/s390x/diag.c            |   6 +-
+ target/s390x/excp_helper.c     |   3 +-
+ target/s390x/mmu_helper.c      |   3 +-
+ target/s390x/sigp.c            |   3 +-
+ target/xtensa/op_helper.c      |   3 +-
+ MAINTAINERS                    |   9 ++-
+files changed, 353 insertions(+), 182 deletions(-)

-New patch
+[Qemu-devel] [PULL 01/25] target/arm: Honour FPCR.FZ in FRECPX
+The FRECPX instructions should (like most other floating point operations)
+honour the FPCR.FZ bit which specifies whether input denormals should
+be flushed to zero (or FZ16 for the half-precision version).
+We forgot to implement this, which doesn't affect the results (since
+the calculation doesn't actually care about the mantissa bits) but did
+mean we were failing to set the FPSR.IDC bit.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20180521172712.19930-1-peter.maydell@linaro.org
+---
+ target/arm/helper-a64.c | 6 ++++++
+file changed, 6 insertions(+)
+diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/arm/helper-a64.c
++++ b/target/arm/helper-a64.c
+@@ -XXX,XX +XXX,XX @@ float16 HELPER(frecpx_f16)(float16 a, void *fpstp)
+         return nan;
+     }
++    a = float16_squash_input_denormal(a, fpst);
++
+     val16 = float16_val(a);
+     sbit = 0x8000 & val16;
+     exp = extract32(val16, 10, 5);
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(frecpx_f32)(float32 a, void *fpstp)
+         return nan;
+     }
++    a = float32_squash_input_denormal(a, fpst);
++
+     val32 = float32_val(a);
+     sbit = 0x80000000ULL & val32;
+     exp = extract32(val32, 23, 8);
+@@ -XXX,XX +XXX,XX @@ float64 HELPER(frecpx_f64)(float64 a, void *fpstp)
+         return nan;
+     }
++    a = float64_squash_input_denormal(a, fpst);
++
+     val64 = float64_val(a);
+     sbit = 0x8000000000000000ULL & val64;
+     exp = extract64(float64_val(a), 52, 11);
+--
+.17.1

-New patch
+[Qemu-devel] [PULL 02/25] MAINTAINERS: Add entries for newer MPS2 boards and devices
+Add entries to MAINTAINERS to cover the newer MPS2 boards and
+the new devices they use.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20180518153157.14899-1-peter.maydell@linaro.org
+---
+ MAINTAINERS | 9 +++++++--
+file changed, 7 insertions(+), 2 deletions(-)
+diff --git a/MAINTAINERS b/MAINTAINERS
+index XXXXXXX..XXXXXXX 100644
+--- a/MAINTAINERS
++++ b/MAINTAINERS
+@@ -XXX,XX +XXX,XX @@ F: hw/timer/cmsdk-apb-timer.c
+ F: include/hw/timer/cmsdk-apb-timer.h
+ F: hw/char/cmsdk-apb-uart.c
+ F: include/hw/char/cmsdk-apb-uart.h
++F: hw/misc/tz-ppc.c
++F: include/hw/misc/tz-ppc.h
+ ARM cores
+ M: Peter Maydell <peter.maydell@linaro.org>
+@@ -XXX,XX +XXX,XX @@ M: Peter Maydell <peter.maydell@linaro.org>
+ L: qemu-arm@nongnu.org
+ S: Maintained
+ F: hw/arm/mps2.c
+-F: hw/misc/mps2-scc.c
+-F: include/hw/misc/mps2-scc.h
++F: hw/arm/mps2-tz.c
++F: hw/misc/mps2-*.c
++F: include/hw/misc/mps2-*.h
++F: hw/arm/iotkit.c
++F: include/hw/arm/iotkit.h
+ Musicpal
+ M: Jan Kiszka <jan.kiszka@web.de>
+--
+.17.1

-[Qemu-devel] [PULL 18/21] target/arm: Implement vector shifted SCVF/UCVF for fp16
+[Qemu-devel] [PULL 03/25] hw/intc/arm_gicv3: Fix APxR<n> register dispatching
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Jan Kiszka <jan.kiszka@siemens.com>
-While we have some of the scalar paths for *CVF for fp16,
+There was a nasty flip in identifying which register group an access is
-we failed to decode the fp16 version of these instructions.
+targeting. The issue caused spuriously raised priorities of the guest
 when handing CPUs over in the Jailhouse hypervisor.
 Cc: qemu-stable@nongnu.org
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Jan Kiszka <jan.kiszka@siemens.com>
-Message-id: 20180502221552.3873-2-richard.henderson@linaro.org
+Message-id: 28b927d3-da58-bce4-cc13-bfec7f9b1cb9@siemens.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 33 ++++++++++++++++++++-------------
+ hw/intc/arm_gicv3_cpuif.c | 12 ++++++------
-file changed, 20 insertions(+), 13 deletions(-)
+file changed, 6 insertions(+), 6 deletions(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/hw/intc/arm_gicv3_cpuif.c b/hw/intc/arm_gicv3_cpuif.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/intc/arm_gicv3_cpuif.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/intc/arm_gicv3_cpuif.c
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_intfp_conv(DisasContext *s, bool is_scalar,
+@@ -XXX,XX +XXX,XX @@ static uint64_t icv_ap_read(CPUARMState *env, const ARMCPRegInfo *ri)
                                           int immh, int immb, int opcode,
                                           int rn, int rd)
  {
--    bool is_double = extract32(immh, 3, 1);
+     GICv3CPUState *cs = icc_cs_from_env(env);
--    int size = is_double ? MO_64 : MO_32;
+     int regno = ri->opc2 & 3;
--    int elements;
+-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
-+    int size, elements, fracbits;
++    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
-     int immhb = immh << 3 | immb;
+     uint64_t value = cs->ich_apr[grp][regno];
--    int fracbits = (is_double ? 128 : 64) - immhb;
+     trace_gicv3_icv_ap_read(ri->crm & 1, regno, gicv3_redist_affid(cs), value);
--    if (!extract32(immh, 2, 2)) {
+@@ -XXX,XX +XXX,XX @@ static void icv_ap_write(CPUARMState *env, const ARMCPRegInfo *ri,
-+    if (immh & 8) {
+ {
-+        size = MO_64;
+     GICv3CPUState *cs = icc_cs_from_env(env);
-+        if (!is_scalar && !is_q) {
+     int regno = ri->opc2 & 3;
-+            unallocated_encoding(s);
+-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
-+            return;
++    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
-+        }
-+    } else if (immh & 4) {
+     trace_gicv3_icv_ap_write(ri->crm & 1, regno, gicv3_redist_affid(cs), value);
-+        size = MO_32;
-+    } else if (immh & 2) {
+@@ -XXX,XX +XXX,XX @@ static uint64_t icc_ap_read(CPUARMState *env, const ARMCPRegInfo *ri)
-+        size = MO_16;
+     uint64_t value;
-+        if (!arm_dc_feature(s, ARM_FEATURE_V8_FP16)) {
-+            unallocated_encoding(s);
+     int regno = ri->opc2 & 3;
-+            return;
+-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1;
-+        }
++    int grp = (ri->crm & 1) ? GICV3_G1 : GICV3_G0;
-+    } else {
-+        /* immh == 0 would be a failure of the decode logic */
+     if (icv_access(env, grp == GICV3_G0 ? HCR_FMO : HCR_IMO)) {
-+        g_assert(immh == 1);
+         return icv_ap_read(env, ri);
-         unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static void icc_ap_write(CPUARMState *env, const ARMCPRegInfo *ri,
-         return;
+     GICv3CPUState *cs = icc_cs_from_env(env);
-     }
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_intfp_conv(DisasContext *s, bool is_scalar,
+     int regno = ri->opc2 & 3;
-     if (is_scalar) {
+-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1;
-         elements = 1;
++    int grp = (ri->crm & 1) ? GICV3_G1 : GICV3_G0;
-     } else {
--        elements = is_double ? 2 : is_q ? 4 : 2;
+     if (icv_access(env, grp == GICV3_G0 ? HCR_FMO : HCR_IMO)) {
--        if (is_double && !is_q) {
+         icv_ap_write(env, ri, value);
--            unallocated_encoding(s);
+@@ -XXX,XX +XXX,XX @@ static uint64_t ich_ap_read(CPUARMState *env, const ARMCPRegInfo *ri)
--            return;
+ {
--        }
+     GICv3CPUState *cs = icc_cs_from_env(env);
-+        elements = (8 << is_q) >> size;
+     int regno = ri->opc2 & 3;
-     }
+-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
-+    fracbits = (16 << size) - immhb;
++    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
+     uint64_t value;
-     if (!fp_access_check(s)) {
-         return;
+     value = cs->ich_apr[grp][regno];
-     }
+@@ -XXX,XX +XXX,XX @@ static void ich_ap_write(CPUARMState *env, const ARMCPRegInfo *ri,
+ {
--    /* immh == 0 would be a failure of the decode logic */
+     GICv3CPUState *cs = icc_cs_from_env(env);
--    g_assert(immh);
+     int regno = ri->opc2 & 3;
--
+-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
-     handle_simd_intfp_conv(s, rd, rn, elements, !is_u, fracbits, size);
++    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
- }
      trace_gicv3_ich_ap_write(ri->crm & 1, regno, gicv3_redist_affid(cs), value);
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 17/21] target/arm: Enable ARM_FEATURE_V8_ATOMICS for user-only
+[Qemu-devel] [PULL 04/25] arm_gicv3_kvm: increase clroffset accordingly
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Shannon Zhao <zhaoshenglong@huawei.com>
+It forgot to increase clroffset during the loop. So it only clear the
+first 4 bytes.
+Fixes: 367b9f527becdd20ddf116e17a3c0c2bbc486920
+Cc: qemu-stable@nongnu.org
+Signed-off-by: Shannon Zhao <zhaoshenglong@huawei.com>
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
+Message-id: 1527047633-12368-1-git-send-email-zhaoshenglong@huawei.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180508151437.4232-11-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu64.c | 1 +
+ hw/intc/arm_gicv3_kvm.c | 1 +
 file changed, 1 insertion(+)
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
+diff --git a/hw/intc/arm_gicv3_kvm.c b/hw/intc/arm_gicv3_kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu64.c
+--- a/hw/intc/arm_gicv3_kvm.c
-+++ b/target/arm/cpu64.c
++++ b/hw/intc/arm_gicv3_kvm.c
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ static void kvm_dist_putbmp(GICv3State *s, uint32_t offset,
-         set_feature(&cpu->env, ARM_FEATURE_V8_SM4);
+         if (clroffset != 0) {
-         set_feature(&cpu->env, ARM_FEATURE_V8_PMULL);
+             reg = 0;
-         set_feature(&cpu->env, ARM_FEATURE_CRC);
+             kvm_gicd_access(s, clroffset, &reg, true);
-+        set_feature(&cpu->env, ARM_FEATURE_V8_ATOMICS);
++            clroffset += 4;
-         set_feature(&cpu->env, ARM_FEATURE_V8_RDM);
+         }
-         set_feature(&cpu->env, ARM_FEATURE_V8_FP16);
+         reg = *gic_bmp_ptr32(bmp, irq);
-         set_feature(&cpu->env, ARM_FEATURE_V8_FCMA);
+         kvm_gicd_access(s, offset, &reg, true);
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 09/21] target/arm: Use new min/max expanders
+[Qemu-devel] [PULL 05/25] tcg: Fix helper function vs host abi for float16
 From: Richard Henderson <richard.henderson@linaro.org>
-The generic expanders replace nearly identical code in the translator.
+Depending on the host abi, float16, aka uint16_t, values are
+passed and returned either zero-extended in the host register
 or with garbage at the top of the host register.
 The tcg code generator has so far been assuming garbage, as that
 matches the x86 abi, but this is incorrect for other host abis.
 Further, target/arm has so far been assuming zero-extended results,
 so that it may store the 16-bit value into a 32-bit slot with the
 high 16-bits already clear.
 Rectify both problems by mapping "f16" in the helper definition
 to uint32_t instead of (a typedef for) uint16_t.  This forces
 the host compiler to assume garbage in the upper 16 bits on input
 and to zero-extend the result on output.
 Cc: qemu-stable@nongnu.org
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Tested-by: Laurent Desnogues <laurent.desnogues@gmail.com>
 Message-id: 20180522175629.24932-1-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180508151437.4232-3-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 46 ++++++++++++--------------------------
+ include/exec/helper-head.h |  2 +-
-file changed, 14 insertions(+), 32 deletions(-)
+ target/arm/helper-a64.c    | 35 +++++++++--------
+ target/arm/helper.c        | 80 +++++++++++++++++++-------------------
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+files changed, 59 insertions(+), 58 deletions(-)
 diff --git a/include/exec/helper-head.h b/include/exec/helper-head.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/include/exec/helper-head.h
-+++ b/target/arm/translate-a64.c
++++ b/include/exec/helper-head.h
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_across_lanes(DisasContext *s, uint32_t insn)
+@@ -XXX,XX +XXX,XX @@
-                 tcg_gen_add_i64(tcg_res, tcg_res, tcg_elt);
+ #define dh_ctype_int int
-                 break;
+ #define dh_ctype_i64 uint64_t
-             case 0x0a: /* SMAXV / UMAXV */
+ #define dh_ctype_s64 int64_t
--                tcg_gen_movcond_i64(is_u ? TCG_COND_GEU : TCG_COND_GE,
+-#define dh_ctype_f16 float16
--                                    tcg_res,
++#define dh_ctype_f16 uint32_t
--                                    tcg_res, tcg_elt, tcg_res, tcg_elt);
+ #define dh_ctype_f32 float32
-+                if (is_u) {
+ #define dh_ctype_f64 float64
-+                    tcg_gen_umax_i64(tcg_res, tcg_res, tcg_elt);
+ #define dh_ctype_ptr void *
-+                } else {
+diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
-+                    tcg_gen_smax_i64(tcg_res, tcg_res, tcg_elt);
+index XXXXXXX..XXXXXXX 100644
-+                }
+--- a/target/arm/helper-a64.c
-                 break;
++++ b/target/arm/helper-a64.c
-             case 0x1a: /* SMINV / UMINV */
+@@ -XXX,XX +XXX,XX @@ static inline uint32_t float_rel_to_flags(int res)
--                tcg_gen_movcond_i64(is_u ? TCG_COND_LEU : TCG_COND_LE,
+     return flags;
--                                    tcg_res,
+ }
--                                    tcg_res, tcg_elt, tcg_res, tcg_elt);
--                break;
+-uint64_t HELPER(vfp_cmph_a64)(float16 x, float16 y, void *fp_status)
-+                if (is_u) {
++uint64_t HELPER(vfp_cmph_a64)(uint32_t x, uint32_t y, void *fp_status)
-+                    tcg_gen_umin_i64(tcg_res, tcg_res, tcg_elt);
+ {
-+                } else {
+     return float_rel_to_flags(float16_compare_quiet(x, y, fp_status));
-+                    tcg_gen_smin_i64(tcg_res, tcg_res, tcg_elt);
+ }
-+                }
-                 break;
+-uint64_t HELPER(vfp_cmpeh_a64)(float16 x, float16 y, void *fp_status)
-             default:
++uint64_t HELPER(vfp_cmpeh_a64)(uint32_t x, uint32_t y, void *fp_status)
-                 g_assert_not_reached();
+ {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_logic(DisasContext *s, uint32_t insn)
+     return float_rel_to_flags(float16_compare(x, y, fp_status));
  }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, void *fpstp)
  #define float64_three make_float64(0x4008000000000000ULL)
  #define float64_one_point_five make_float64(0x3FF8000000000000ULL)
 -float16 HELPER(recpsf_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
@@ -XXX,XX +XXX,XX @@ float64 HELPER(recpsf_f64)(float64 a, float64 b, void *fpstp)
      return float64_muladd(a, b, float64_two, 0, fpst);
  }
 -float16 HELPER(rsqrtsf_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(rsqrtsf_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addlp_u16)(uint64_t a)
  }
  /* Floating-point reciprocal exponent - see FPRecpX in ARM ARM */
 -float16 HELPER(frecpx_f16)(float16 a, void *fpstp)
 +uint32_t HELPER(frecpx_f16)(uint32_t a, void *fpstp)
  {
      float_status *fpst = fpstp;
      uint16_t val16, sbit;
@@ -XXX,XX +XXX,XX @@ void HELPER(casp_be_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
  #define ADVSIMD_HELPER(name, suffix) HELPER(glue(glue(advsimd_, name), suffix))
  #define ADVSIMD_HALFOP(name) \
 -float16 ADVSIMD_HELPER(name, h)(float16 a, float16 b, void *fpstp) \
 +uint32_t ADVSIMD_HELPER(name, h)(uint32_t a, uint32_t b, void *fpstp) \
  { \
      float_status *fpst = fpstp; \
      return float16_ ## name(a, b, fpst);    \
@@ -XXX,XX +XXX,XX @@ ADVSIMD_HALFOP(mulx)
  ADVSIMD_TWOHALFOP(mulx)
  /* fused multiply-accumulate */
 -float16 HELPER(advsimd_muladdh)(float16 a, float16 b, float16 c, void *fpstp)
 +uint32_t HELPER(advsimd_muladdh)(uint32_t a, uint32_t b, uint32_t c,
 +                                 void *fpstp)
  {
      float_status *fpst = fpstp;
      return float16_muladd(a, b, c, 0, fpst);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_muladd2h)(uint32_t two_a, uint32_t two_b,
  #define ADVSIMD_CMPRES(test) (test) ? 0xffff : 0
 -uint32_t HELPER(advsimd_ceq_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(advsimd_ceq_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
      int compare = float16_compare_quiet(a, b, fpst);
      return ADVSIMD_CMPRES(compare == float_relation_equal);
  }
 -uint32_t HELPER(advsimd_cge_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(advsimd_cge_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
      int compare = float16_compare(a, b, fpst);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_cge_f16)(float16 a, float16 b, void *fpstp)
                            compare == float_relation_equal);
  }
 -uint32_t HELPER(advsimd_cgt_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(advsimd_cgt_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
      int compare = float16_compare(a, b, fpst);
      return ADVSIMD_CMPRES(compare == float_relation_greater);
  }
 -uint32_t HELPER(advsimd_acge_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(advsimd_acge_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
      float16 f0 = float16_abs(a);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_acge_f16)(float16 a, float16 b, void *fpstp)
                            compare == float_relation_equal);
  }
 -uint32_t HELPER(advsimd_acgt_f16)(float16 a, float16 b, void *fpstp)
 +uint32_t HELPER(advsimd_acgt_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
      float_status *fpst = fpstp;
      float16 f0 = float16_abs(a);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_acgt_f16)(float16 a, float16 b, void *fpstp)
  }
  /* round to integral */
 -float16 HELPER(advsimd_rinth_exact)(float16 x, void *fp_status)
 +uint32_t HELPER(advsimd_rinth_exact)(uint32_t x, void *fp_status)
  {
      return float16_round_to_int(x, fp_status);
  }
 -float16 HELPER(advsimd_rinth)(float16 x, void *fp_status)
 +uint32_t HELPER(advsimd_rinth)(uint32_t x, void *fp_status)
  {
      int old_flags = get_float_exception_flags(fp_status), new_flags;
      float16 ret;
@@ -XXX,XX +XXX,XX @@ float16 HELPER(advsimd_rinth)(float16 x, void *fp_status)
   * setting the mode appropriately before calling the helper.
   */
 -uint32_t HELPER(advsimd_f16tosinth)(float16 a, void *fpstp)
 +uint32_t HELPER(advsimd_f16tosinth)(uint32_t a, void *fpstp)
  {
      float_status *fpst = fpstp;
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_f16tosinth)(float16 a, void *fpstp)
      return float16_to_int16(a, fpst);
  }
 -uint32_t HELPER(advsimd_f16touinth)(float16 a, void *fpstp)
 +uint32_t HELPER(advsimd_f16touinth)(uint32_t a, void *fpstp)
  {
      float_status *fpst = fpstp;
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_f16touinth)(float16 a, void *fpstp)
   * Square Root and Reciprocal square root
   */
 -float16 HELPER(sqrt_f16)(float16 a, void *fpstp)
 +uint32_t HELPER(sqrt_f16)(uint32_t a, void *fpstp)
  {
      float_status *s = fpstp;
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ DO_VFP_cmp(d, float64)
  /* Integer to float and float to integer conversions */
 -#define CONV_ITOF(name, fsz, sign) \
 -    float##fsz HELPER(name)(uint32_t x, void *fpstp) \
 -{ \
 -    float_status *fpst = fpstp; \
 -    return sign##int32_to_##float##fsz((sign##int32_t)x, fpst); \
 +#define CONV_ITOF(name, ftype, fsz, sign)                           \
 +ftype HELPER(name)(uint32_t x, void *fpstp)                         \
 +{                                                                   \
 +    float_status *fpst = fpstp;                                     \
 +    return sign##int32_to_##float##fsz((sign##int32_t)x, fpst);     \
  }
 -#define CONV_FTOI(name, fsz, sign, round) \
 -uint32_t HELPER(name)(float##fsz x, void *fpstp) \
 -{ \
 -    float_status *fpst = fpstp; \
 -    if (float##fsz##_is_any_nan(x)) { \
 -        float_raise(float_flag_invalid, fpst); \
 -        return 0; \
 -    } \
 -    return float##fsz##_to_##sign##int32##round(x, fpst); \
 +#define CONV_FTOI(name, ftype, fsz, sign, round)                \
 +uint32_t HELPER(name)(ftype x, void *fpstp)                     \
 +{                                                               \
 +    float_status *fpst = fpstp;                                 \
 +    if (float##fsz##_is_any_nan(x)) {                           \
 +        float_raise(float_flag_invalid, fpst);                  \
 +        return 0;                                               \
 +    }                                                           \
 +    return float##fsz##_to_##sign##int32##round(x, fpst);       \
  }
 -#define FLOAT_CONVS(name, p, fsz, sign) \
 -CONV_ITOF(vfp_##name##to##p, fsz, sign) \
 -CONV_FTOI(vfp_to##name##p, fsz, sign, ) \
 -CONV_FTOI(vfp_to##name##z##p, fsz, sign, _round_to_zero)
 +#define FLOAT_CONVS(name, p, ftype, fsz, sign)            \
 +    CONV_ITOF(vfp_##name##to##p, ftype, fsz, sign)        \
 +    CONV_FTOI(vfp_to##name##p, ftype, fsz, sign, )        \
 +    CONV_FTOI(vfp_to##name##z##p, ftype, fsz, sign, _round_to_zero)
 -FLOAT_CONVS(si, h, 16, )
 -FLOAT_CONVS(si, s, 32, )
 -FLOAT_CONVS(si, d, 64, )
 -FLOAT_CONVS(ui, h, 16, u)
 -FLOAT_CONVS(ui, s, 32, u)
 -FLOAT_CONVS(ui, d, 64, u)
 +FLOAT_CONVS(si, h, uint32_t, 16, )
 +FLOAT_CONVS(si, s, float32, 32, )
 +FLOAT_CONVS(si, d, float64, 64, )
 +FLOAT_CONVS(ui, h, uint32_t, 16, u)
 +FLOAT_CONVS(ui, s, float32, 32, u)
 +FLOAT_CONVS(ui, d, float64, 64, u)
  #undef CONV_ITOF
  #undef CONV_FTOI
@@ -XXX,XX +XXX,XX @@ static float16 do_postscale_fp16(float64 f, int shift, float_status *fpst)
      return float64_to_float16(float64_scalbn(f, -shift, fpst), true, fpst);
  }
 -float16 HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
 +uint32_t HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
  {
      return do_postscale_fp16(int32_to_float64(x, fpst), shift, fpst);
  }
 -float16 HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
 +uint32_t HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
  {
      return do_postscale_fp16(uint32_to_float64(x, fpst), shift, fpst);
  }
 -float16 HELPER(vfp_sqtoh)(uint64_t x, uint32_t shift, void *fpst)
 +uint32_t HELPER(vfp_sqtoh)(uint64_t x, uint32_t shift, void *fpst)
  {
      return do_postscale_fp16(int64_to_float64(x, fpst), shift, fpst);
  }
 -float16 HELPER(vfp_uqtoh)(uint64_t x, uint32_t shift, void *fpst)
 +uint32_t HELPER(vfp_uqtoh)(uint64_t x, uint32_t shift, void *fpst)
  {
      return do_postscale_fp16(uint64_to_float64(x, fpst), shift, fpst);
  }
@@ -XXX,XX +XXX,XX @@ static float64 do_prescale_fp16(float16 f, int shift, float_status *fpst)
      }
  }
--/* Helper functions for 32 bit comparisons */
+-uint32_t HELPER(vfp_toshh)(float16 x, uint32_t shift, void *fpst)
--static void gen_max_s32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
++uint32_t HELPER(vfp_toshh)(uint32_t x, uint32_t shift, void *fpst)
--{
+ {
--    tcg_gen_movcond_i32(TCG_COND_GE, res, op1, op2, op1, op2);
+     return float64_to_int16(do_prescale_fp16(x, shift, fpst), fpst);
--}
+ }
--
--static void gen_max_u32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
+-uint32_t HELPER(vfp_touhh)(float16 x, uint32_t shift, void *fpst)
--{
++uint32_t HELPER(vfp_touhh)(uint32_t x, uint32_t shift, void *fpst)
--    tcg_gen_movcond_i32(TCG_COND_GEU, res, op1, op2, op1, op2);
+ {
--}
+     return float64_to_uint16(do_prescale_fp16(x, shift, fpst), fpst);
--
+ }
--static void gen_min_s32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
--{
+-uint32_t HELPER(vfp_toslh)(float16 x, uint32_t shift, void *fpst)
--    tcg_gen_movcond_i32(TCG_COND_LE, res, op1, op2, op1, op2);
++uint32_t HELPER(vfp_toslh)(uint32_t x, uint32_t shift, void *fpst)
--}
+ {
--
+     return float64_to_int32(do_prescale_fp16(x, shift, fpst), fpst);
--static void gen_min_u32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
+ }
--{
--    tcg_gen_movcond_i32(TCG_COND_LEU, res, op1, op2, op1, op2);
+-uint32_t HELPER(vfp_toulh)(float16 x, uint32_t shift, void *fpst)
--}
++uint32_t HELPER(vfp_toulh)(uint32_t x, uint32_t shift, void *fpst)
--
+ {
- /* Pairwise op subgroup of C3.6.16.
+     return float64_to_uint32(do_prescale_fp16(x, shift, fpst), fpst);
-  *
+ }
-  * This is called directly or via the handle_3same_float for float pairwise
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
+-uint64_t HELPER(vfp_tosqh)(float16 x, uint32_t shift, void *fpst)
-                 static NeonGenTwoOpFn * const fns[3][2] = {
++uint64_t HELPER(vfp_tosqh)(uint32_t x, uint32_t shift, void *fpst)
-                     { gen_helper_neon_pmax_s8, gen_helper_neon_pmax_u8 },
+ {
-                     { gen_helper_neon_pmax_s16, gen_helper_neon_pmax_u16 },
+     return float64_to_int64(do_prescale_fp16(x, shift, fpst), fpst);
--                    { gen_max_s32, gen_max_u32 },
+ }
-+                    { tcg_gen_smax_i32, tcg_gen_umax_i32 },
-                 };
+-uint64_t HELPER(vfp_touqh)(float16 x, uint32_t shift, void *fpst)
-                 genfn = fns[size][u];
++uint64_t HELPER(vfp_touqh)(uint32_t x, uint32_t shift, void *fpst)
-                 break;
+ {
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
+     return float64_to_uint64(do_prescale_fp16(x, shift, fpst), fpst);
-                 static NeonGenTwoOpFn * const fns[3][2] = {
+ }
-                     { gen_helper_neon_pmin_s8, gen_helper_neon_pmin_u8 },
+@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(set_neon_rmode)(uint32_t rmode, CPUARMState *env)
-                     { gen_helper_neon_pmin_s16, gen_helper_neon_pmin_u16 },
+ }
--                    { gen_min_s32, gen_min_u32 },
-+                    { tcg_gen_smin_i32, tcg_gen_umin_i32 },
+ /* Half precision conversions.  */
-                 };
+-float32 HELPER(vfp_fcvt_f16_to_f32)(float16 a, void *fpstp, uint32_t ahp_mode)
-                 genfn = fns[size][u];
++float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, void *fpstp, uint32_t ahp_mode)
-                 break;
+ {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
+     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
-                 static NeonGenTwoOpFn * const fns[3][2] = {
+      * it would affect flushing input denormals.
-                     { gen_helper_neon_max_s8, gen_helper_neon_max_u8 },
+@@ -XXX,XX +XXX,XX @@ float32 HELPER(vfp_fcvt_f16_to_f32)(float16 a, void *fpstp, uint32_t ahp_mode)
-                     { gen_helper_neon_max_s16, gen_helper_neon_max_u16 },
+     return r;
--                    { gen_max_s32, gen_max_u32 },
+ }
-+                    { tcg_gen_smax_i32, tcg_gen_umax_i32 },
-                 };
+-float16 HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
-                 genfn = fns[size][u];
++uint32_t HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
-                 break;
+ {
-@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
+     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
-                 static NeonGenTwoOpFn * const fns[3][2] = {
+      * it would affect flushing output denormals.
-                     { gen_helper_neon_min_s8, gen_helper_neon_min_u8 },
+@@ -XXX,XX +XXX,XX @@ float16 HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
-                     { gen_helper_neon_min_s16, gen_helper_neon_min_u16 },
+     return r;
--                    { gen_min_s32, gen_min_u32 },
+ }
-+                    { tcg_gen_smin_i32, tcg_gen_umin_i32 },
-                 };
+-float64 HELPER(vfp_fcvt_f16_to_f64)(float16 a, void *fpstp, uint32_t ahp_mode)
-                 genfn = fns[size][u];
++float64 HELPER(vfp_fcvt_f16_to_f64)(uint32_t a, void *fpstp, uint32_t ahp_mode)
-                 break;
+ {
      /* Squash FZ16 to 0 for the duration of conversion.  In this case,
       * it would affect flushing input denormals.
@@ -XXX,XX +XXX,XX @@ float64 HELPER(vfp_fcvt_f16_to_f64)(float16 a, void *fpstp, uint32_t ahp_mode)
      return r;
  }
 -float16 HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
 +uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
  {
      /* Squash FZ16 to 0 for the duration of conversion.  In this case,
       * it would affect flushing output denormals.
@@ -XXX,XX +XXX,XX @@ static bool round_to_inf(float_status *fpst, bool sign_bit)
      g_assert_not_reached();
  }
 -float16 HELPER(recpe_f16)(float16 input, void *fpstp)
 +uint32_t HELPER(recpe_f16)(uint32_t input, void *fpstp)
  {
      float_status *fpst = fpstp;
      float16 f16 = float16_squash_input_denormal(input, fpst);
@@ -XXX,XX +XXX,XX @@ static uint64_t recip_sqrt_estimate(int *exp , int exp_off, uint64_t frac)
      return extract64(estimate, 0, 8) << 44;
  }
 -float16 HELPER(rsqrte_f16)(float16 input, void *fpstp)
 +uint32_t HELPER(rsqrte_f16)(uint32_t input, void *fpstp)
  {
      float_status *s = fpstp;
      float16 f16 = float16_squash_input_denormal(input, s);
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 05/21] arm/boot: split load_dtb() from arm_load_kernel()
+[Qemu-devel] [PULL 06/25] arm: fix qemu crash on startup with -bios option
 From: Igor Mammedov <imammedo@redhat.com>
-load_dtb() depends on arm_load_kernel() to figure out place
+When QEMU is started with following CLI
-in RAM where it should be loaded, but it's not required for
+ -machine virt,gic-version=3,accel=kvm -cpu host -bios AAVMF_CODE.fd
-arm_load_kernel() to work. Sometimes it's neccesary for
+it crashes with abort at
-devices added with -device/device_add to be enumerated in
+ accel/kvm/kvm-all.c:2164:
-DTB as well, which's lead to [1] and surrounding commits to
+ KVM_SET_DEVICE_ATTR failed: Group 6 attr 0x000000000000c665: Invalid argument
 add 2 more machine_done notifiers with non obvious ordering
 to make dynamic sysbus devices initialization happen in
 the right order.
-However instead of moving whole arm_load_kernel() in to
+Which is caused by implicit dependency of kvm_arm_gicv3_reset() on
-machine_done, it's sufficient to move only load_dtb() into
+arm_gicv3_icc_reset() where the later is called by CPU reset
-virt_machine_done() notifier and remove ArmLoadKernelNotifier/
+reset callback.
 /PlatformBusFDTNotifierParams notifiers, which saves us ~90LOC
 and simplifies code flow quite a bit.
 Later would allow to consolidate DTB generation within one
 function for 'mach-virt' board and make it reentrant so it
 could generate updated DTB in device hotplug secenarios.
-While at it rename load_dtb() to arm_load_dtb() since it's
+However commit:
-public now.
+b77f6c arm/boot: split load_dtb() from arm_load_kernel()
 broke CPU reset callback registration in case
-Add additional field skip_dtb_autoload to struct arm_boot_info
+  arm_load_kernel()
-to allow manual DTB load later in mach-virt and to avoid touching
+      ...
-all other boards to explicitly call arm_load_dtb().
+      if (!info->kernel_filename || info->firmware_loaded)
-) (ac9d32e hw/arm/boot: arm_load_kernel implemented as a machine init done notifier)
+branch is taken, i.e. it's sufficient to provide a firmware
 or do not provide kernel on CLI to skip cpu reset callback
 registration, where before offending commit the callback
 has been registered unconditionally.
+Fix it by registering the callback right at the beginning of
+arm_load_kernel() unconditionally instead of doing it at the end.
+NOTE:
+ we probably should eliminate that dependency anyways as well as
+ separate arch CPU reset parts from arm_load_kernel() into CPU
+ itself, but that refactoring that I probably would have to do
+ anyways later for CPU hotplug to work.
+Reported-by: Auger Eric <eric.auger@redhat.com>
 Signed-off-by: Igor Mammedov <imammedo@redhat.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
-Reviewed-by: Andrew Jones <drjones@redhat.com>
+Tested-by: Eric Auger <eric.auger@redhat.com>
-Message-id: 1525691524-32265-4-git-send-email-imammedo@redhat.com
+Message-id: 1527070950-208350-1-git-send-email-imammedo@redhat.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/arm/arm.h        | 45 +++++++++++++++++------
+ hw/arm/boot.c | 18 +++++++++---------
- include/hw/arm/sysbus-fdt.h | 37 ++++---------------
+file changed, 9 insertions(+), 9 deletions(-)
  hw/arm/boot.c               | 72 ++++++++++---------------------------
  hw/arm/sysbus-fdt.c         | 61 +++----------------------------
  hw/arm/virt.c               | 64 ++++++++++++++++-----------------
 files changed, 94 insertions(+), 185 deletions(-)
-diff --git a/include/hw/arm/arm.h b/include/hw/arm/arm.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/arm.h
-+++ b/include/hw/arm/arm.h
-@@ -XXX,XX +XXX,XX @@ DeviceState *armv7m_init(MemoryRegion *system_memory, int mem_size, int num_irq,
-  */
- void armv7m_load_kernel(ARMCPU *cpu, const char *kernel_filename, int mem_size);
--/*
-- * struct used as a parameter of the arm_load_kernel machine init
-- * done notifier
-- */
--typedef struct {
--    Notifier notifier; /* actual notifier */
--    ARMCPU *cpu; /* handle to the first cpu object */
--} ArmLoadKernelNotifier;
--
- /* arm_boot.c */
- struct arm_boot_info {
-     uint64_t ram_size;
-@@ -XXX,XX +XXX,XX @@ struct arm_boot_info {
-     const char *initrd_filename;
-     const char *dtb_filename;
-     hwaddr loader_start;
-+    hwaddr dtb_start;
-+    hwaddr dtb_limit;
-+    /* If set to True, arm_load_kernel() will not load DTB.
-+     * It allows board to load DTB manually later.
-+     * (default: False)
-+     */
-+    bool skip_dtb_autoload;
-     /* multicore boards that use the default secondary core boot functions
-      * need to put the address of the secondary boot code, the boot reg,
-      * and the GIC address in the next 3 values, respectively. boards that
-@@ -XXX,XX +XXX,XX @@ struct arm_boot_info {
-      * the user it should implement this hook.
-      */
-     void (*modify_dtb)(const struct arm_boot_info *info, void *fdt);
--    /* machine init done notifier executing arm_load_dtb */
--    ArmLoadKernelNotifier load_kernel_notifier;
-     /* Used internally by arm_boot.c */
-     int is_linux;
-     hwaddr initrd_start;
-@@ -XXX,XX +XXX,XX @@ struct arm_boot_info {
-  */
- void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info);
-+AddressSpace *arm_boot_address_space(ARMCPU *cpu,
-+                                     const struct arm_boot_info *info);
-+
-+/**
-+ * arm_load_dtb() - load a device tree binary image into memory
-+ * @addr:       the address to load the image at
-+ * @binfo:      struct describing the boot environment
-+ * @addr_limit: upper limit of the available memory area at @addr
-+ * @as:         address space to load image to
-+ *
-+ * Load a device tree supplied by the machine or by the user  with the
-+ * '-dtb' command line option, and put it at offset @addr in target
-+ * memory.
-+ *
-+ * If @addr_limit contains a meaningful value (i.e., it is strictly greater
-+ * than @addr), the device tree is only loaded if its size does not exceed
-+ * the limit.
-+ *
-+ * Returns: the size of the device tree image on success,
-+ *          0 if the image size exceeds the limit,
-+ *          -1 on errors.
-+ *
-+ * Note: Must not be called unless have_dtb(binfo) is true.
-+ */
-+int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
-+                 hwaddr addr_limit, AddressSpace *as);
-+
- /* Write a secure board setup routine with a dummy handler for SMCs */
- void arm_write_secure_board_setup_dummy_smc(ARMCPU *cpu,
-                                             const struct arm_boot_info *info,
-diff --git a/include/hw/arm/sysbus-fdt.h b/include/hw/arm/sysbus-fdt.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/sysbus-fdt.h
-+++ b/include/hw/arm/sysbus-fdt.h
-@@ -XXX,XX +XXX,XX @@
- #ifndef HW_ARM_SYSBUS_FDT_H
- #define HW_ARM_SYSBUS_FDT_H
--#include "hw/arm/arm.h"
--#include "qemu-common.h"
--#include "hw/sysbus.h"
--
--/*
-- * struct that contains dimensioning parameters of the platform bus
-- */
--typedef struct {
--    hwaddr platform_bus_base; /* start address of the bus */
--    hwaddr platform_bus_size; /* size of the bus */
--    int platform_bus_first_irq; /* first hwirq assigned to the bus */
--    int platform_bus_num_irqs; /* number of hwirq assigned to the bus */
--} ARMPlatformBusSystemParams;
--
--/*
-- * struct that contains all relevant info to build the fdt nodes of
-- * platform bus and attached dynamic sysbus devices
-- * in the future might be augmented with additional info
-- * such as PHY, CLK handles ...
-- */
--typedef struct {
--    const ARMPlatformBusSystemParams *system_params;
--    struct arm_boot_info *binfo;
--    const char *intc; /* parent interrupt controller name */
--} ARMPlatformBusFDTParams;
-+#include "exec/hwaddr.h"
- /**
-- * arm_register_platform_bus_fdt_creator - register a machine init done
-- * notifier that creates the device tree nodes of the platform bus and
-- * associated dynamic sysbus devices
-+ * platform_bus_add_all_fdt_nodes - create all the platform bus nodes
-+ *
-+ * builds the parent platform bus node and all the nodes of dynamic
-+ * sysbus devices attached to it.
-  */
--void arm_register_platform_bus_fdt_creator(ARMPlatformBusFDTParams *fdt_params);
--
-+void platform_bus_add_all_fdt_nodes(void *fdt, const char *intc, hwaddr addr,
-+                                    hwaddr bus_size, int irq_start);
- #endif
 diff --git a/hw/arm/boot.c b/hw/arm/boot.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/boot.c
 +++ b/hw/arm/boot.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
  #define ARM64_TEXT_OFFSET_OFFSET    8
  #define ARM64_MAGIC_OFFSET          56
 -static AddressSpace *arm_boot_address_space(ARMCPU *cpu,
 -                                            const struct arm_boot_info *info)
 +AddressSpace *arm_boot_address_space(ARMCPU *cpu,
 +                                     const struct arm_boot_info *info)
  {
      /* Return the address space to use for bootloader reads and writes.
       * We prefer the secure address space if the CPU has it and we're
@@ -XXX,XX +XXX,XX @@ static void fdt_add_psci_node(void *fdt)
      qemu_fdt_setprop_cell(fdt, "/psci", "migrate", migrate_fn);
  }
 -/**
 - * load_dtb() - load a device tree binary image into memory
 - * @addr:       the address to load the image at
 - * @binfo:      struct describing the boot environment
 - * @addr_limit: upper limit of the available memory area at @addr
 - * @as:         address space to load image to
 - *
 - * Load a device tree supplied by the machine or by the user  with the
 - * '-dtb' command line option, and put it at offset @addr in target
 - * memory.
 - *
 - * If @addr_limit contains a meaningful value (i.e., it is strictly greater
 - * than @addr), the device tree is only loaded if its size does not exceed
 - * the limit.
 - *
 - * Returns: the size of the device tree image on success,
 - *          0 if the image size exceeds the limit,
 - *          -1 on errors.
 - *
 - * Note: Must not be called unless have_dtb(binfo) is true.
 - */
 -static int load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
 -                    hwaddr addr_limit, AddressSpace *as)
 +int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
 +                 hwaddr addr_limit, AddressSpace *as)
  {
      void *fdt = NULL;
      int size, rc;
@@ -XXX,XX +XXX,XX @@ static uint64_t load_aarch64_image(const char *filename, hwaddr mem_base,
      return size;
  }
 -static void arm_load_kernel_notify(Notifier *notifier, void *data)
 +void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
  {
      CPUState *cs;
      int kernel_size;
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
      int elf_machine;
      hwaddr entry;
      static const ARMInsnFixup *primary_loader;
--    ArmLoadKernelNotifier *n = DO_UPCAST(ArmLoadKernelNotifier,
--                                         notifier, notifier);
--    ARMCPU *cpu = n->cpu;
--    struct arm_boot_info *info =
--        container_of(n, struct arm_boot_info, load_kernel_notifier);
      AddressSpace *as = arm_boot_address_space(cpu, info);
++    /* CPU objects (unlike devices) are not automatically reset on system
++     * reset, so we must always register a handler to do so. If we're
++     * actually loading a kernel, the handler is also responsible for
++     * arranging that we start it correctly.
++     */
++    for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
++        qemu_register_reset(do_cpu_reset, ARM_CPU(cs));
++    }
++
      /* The board code is not supposed to set secure_board_setup unless
-@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
+      * running its code in secure mode is actually possible, and KVM
-     assert(!(info->secure_board_setup && kvm_enabled()));
+      * doesn't support secure.
+@@ -XXX,XX +XXX,XX @@ void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
      info->dtb_filename = qemu_opt_get(qemu_get_machine_opts(), "dtb");
 +    info->dtb_limit = 0;
      /* Load the kernel.  */
      if (!info->kernel_filename || info->firmware_loaded) {
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
               * the kernel is supposed to be loaded by the bootloader), copy the
               * DTB to the base of RAM for the bootloader to pick up.
               */
 -            if (load_dtb(info->loader_start, info, 0, as) < 0) {
 -                exit(1);
 -            }
 +            info->dtb_start = info->loader_start;
          }
          if (info->kernel_filename) {
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
           */
          if (elf_low_addr > info->loader_start
              || elf_high_addr < info->loader_start) {
 -            /* Pass elf_low_addr as address limit to load_dtb if it may be
 +            /* Set elf_low_addr as address limit for arm_load_dtb if it may be
               * pointing into RAM, otherwise pass '0' (no limit)
               */
              if (elf_low_addr < info->loader_start) {
                  elf_low_addr = 0;
              }
 -            if (load_dtb(info->loader_start, info, elf_low_addr, as) < 0) {
 -                exit(1);
 -            }
 +            info->dtb_start = info->loader_start;
 +            info->dtb_limit = elf_low_addr;
          }
      }
      entry = elf_entry;
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
           */
          if (have_dtb(info)) {
              hwaddr align;
 -            hwaddr dtb_start;
              if (elf_machine == EM_AARCH64) {
                  /*
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
              }
              /* Place the DTB after the initrd in memory with alignment. */
 -            dtb_start = QEMU_ALIGN_UP(info->initrd_start + initrd_size, align);
 -            if (load_dtb(dtb_start, info, 0, as) < 0) {
 -                exit(1);
 -            }
 -            fixupcontext[FIXUP_ARGPTR] = dtb_start;
 +            info->dtb_start = QEMU_ALIGN_UP(info->initrd_start + initrd_size,
 +                                           align);
 +            fixupcontext[FIXUP_ARGPTR] = info->dtb_start;
          } else {
              fixupcontext[FIXUP_ARGPTR] = info->loader_start + KERNEL_ARGS_ADDR;
              if (info->ram_size >= (1ULL << 32)) {
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
      for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
          ARM_CPU(cs)->env.boot_info = info;
      }
--}
 -    /* CPU objects (unlike devices) are not automatically reset on system
 -     * reset, so we must always register a handler to do so. If we're
 -     * actually loading a kernel, the handler is also responsible for
 -     * arranging that we start it correctly.
 -     */
 -    for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
 -        qemu_register_reset(do_cpu_reset, ARM_CPU(cs));
 -    }
 -
--void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
+     if (!info->skip_dtb_autoload && have_dtb(info)) {
--{
+         if (arm_load_dtb(info->dtb_start, info, info->dtb_limit, as) < 0) {
--    CPUState *cs;
+             exit(1);
 -
 -    info->load_kernel_notifier.cpu = cpu;
 -    info->load_kernel_notifier.notifier.notify = arm_load_kernel_notify;
 -    qemu_add_machine_init_done_notifier(&info->load_kernel_notifier.notifier);
      /* CPU objects (unlike devices) are not automatically reset on system
       * reset, so we must always register a handler to do so. If we're
@@ -XXX,XX +XXX,XX @@ void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
      for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
          qemu_register_reset(do_cpu_reset, ARM_CPU(cs));
      }
 +
 +    if (!info->skip_dtb_autoload && have_dtb(info)) {
 +        if (arm_load_dtb(info->dtb_start, info, info->dtb_limit, as) < 0) {
 +            exit(1);
 +        }
 +    }
  }
  static const TypeInfo arm_linux_boot_if_info = {
 diff --git a/hw/arm/sysbus-fdt.c b/hw/arm/sysbus-fdt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/sysbus-fdt.c
 +++ b/hw/arm/sysbus-fdt.c
@@ -XXX,XX +XXX,XX @@ typedef struct PlatformBusFDTData {
      PlatformBusDevice *pbus;
  } PlatformBusFDTData;
 -/*
 - * struct used when calling the machine init done notifier
 - * that constructs the fdt nodes of platform bus devices
 - */
 -typedef struct PlatformBusFDTNotifierParams {
 -    Notifier notifier;
 -    ARMPlatformBusFDTParams *fdt_params;
 -} PlatformBusFDTNotifierParams;
 -
  /* struct that associates a device type name and a node creation function */
  typedef struct NodeCreationPair {
      const char *typename;
@@ -XXX,XX +XXX,XX @@ static void add_fdt_node(SysBusDevice *sbdev, void *opaque)
      exit(1);
  }
 -/**
 - * add_all_platform_bus_fdt_nodes - create all the platform bus nodes
 - *
 - * builds the parent platform bus node and all the nodes of dynamic
 - * sysbus devices attached to it.
 - */
 -static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
 +void platform_bus_add_all_fdt_nodes(void *fdt, const char *intc, hwaddr addr,
 +                                    hwaddr bus_size, int irq_start)
  {
      const char platcomp[] = "qemu,platform\0simple-bus";
      PlatformBusDevice *pbus;
      DeviceState *dev;
      gchar *node;
 -    uint64_t addr, size;
 -    int irq_start, dtb_size;
 -    struct arm_boot_info *info = fdt_params->binfo;
 -    const ARMPlatformBusSystemParams *params = fdt_params->system_params;
 -    const char *intc = fdt_params->intc;
 -    void *fdt = info->get_dtb(info, &dtb_size);
 -
 -    /*
 -     * If the user provided a dtb, we assume the dynamic sysbus nodes
 -     * already are integrated there. This corresponds to a use case where
 -     * the dynamic sysbus nodes are complex and their generation is not yet
 -     * supported. In that case the user can take charge of the guest dt
 -     * while qemu takes charge of the qom stuff.
 -     */
 -    if (info->dtb_filename) {
 -        return;
 -    }
      assert(fdt);
 -    node = g_strdup_printf("/platform@%"PRIx64, params->platform_bus_base);
 -    addr = params->platform_bus_base;
 -    size = params->platform_bus_size;
 -    irq_start = params->platform_bus_first_irq;
 +    node = g_strdup_printf("/platform@%"PRIx64, addr);
      /* Create a /platform node that we can put all devices into */
      qemu_fdt_add_subnode(fdt, node);
@@ -XXX,XX +XXX,XX @@ static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
       */
      qemu_fdt_setprop_cells(fdt, node, "#size-cells", 1);
      qemu_fdt_setprop_cells(fdt, node, "#address-cells", 1);
 -    qemu_fdt_setprop_cells(fdt, node, "ranges", 0, addr >> 32, addr, size);
 +    qemu_fdt_setprop_cells(fdt, node, "ranges", 0, addr >> 32, addr, bus_size);
      qemu_fdt_setprop_phandle(fdt, node, "interrupt-parent", intc);
@@ -XXX,XX +XXX,XX @@ static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
      g_free(node);
  }
 -
 -static void platform_bus_fdt_notify(Notifier *notifier, void *data)
 -{
 -    PlatformBusFDTNotifierParams *p = DO_UPCAST(PlatformBusFDTNotifierParams,
 -                                                notifier, notifier);
 -
 -    add_all_platform_bus_fdt_nodes(p->fdt_params);
 -    g_free(p->fdt_params);
 -    g_free(p);
 -}
 -
 -void arm_register_platform_bus_fdt_creator(ARMPlatformBusFDTParams *fdt_params)
 -{
 -    PlatformBusFDTNotifierParams *p = g_new(PlatformBusFDTNotifierParams, 1);
 -
 -    p->fdt_params = fdt_params;
 -    p->notifier.notify = platform_bus_fdt_notify;
 -    qemu_add_machine_init_done_notifier(&p->notifier);
 -}
 diff --git a/hw/arm/virt.c b/hw/arm/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/virt.c
 +++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@
  #define PLATFORM_BUS_NUM_IRQS 64
 -static ARMPlatformBusSystemParams platform_bus_params;
 -
  /* RAM limit in GB. Since VIRT_MEM starts at the 1GB mark, this means
   * RAM can go up to the 256GB mark, leaving 256GB of the physical
   * address space unallocated and free for future use between 256G and 512G.
@@ -XXX,XX +XXX,XX @@ static void create_platform_bus(VirtMachineState *vms, qemu_irq *pic)
      DeviceState *dev;
      SysBusDevice *s;
      int i;
 -    ARMPlatformBusFDTParams *fdt_params = g_new(ARMPlatformBusFDTParams, 1);
      MemoryRegion *sysmem = get_system_memory();
 -    platform_bus_params.platform_bus_base = vms->memmap[VIRT_PLATFORM_BUS].base;
 -    platform_bus_params.platform_bus_size = vms->memmap[VIRT_PLATFORM_BUS].size;
 -    platform_bus_params.platform_bus_first_irq = vms->irqmap[VIRT_PLATFORM_BUS];
 -    platform_bus_params.platform_bus_num_irqs = PLATFORM_BUS_NUM_IRQS;
 -
 -    fdt_params->system_params = &platform_bus_params;
 -    fdt_params->binfo = &vms->bootinfo;
 -    fdt_params->intc = "/intc";
 -    /*
 -     * register a machine init done notifier that creates the device tree
 -     * nodes of the platform bus and its children dynamic sysbus devices
 -     */
 -    arm_register_platform_bus_fdt_creator(fdt_params);
 -
      dev = qdev_create(NULL, TYPE_PLATFORM_BUS_DEVICE);
      dev->id = TYPE_PLATFORM_BUS_DEVICE;
 -    qdev_prop_set_uint32(dev, "num_irqs",
 -        platform_bus_params.platform_bus_num_irqs);
 -    qdev_prop_set_uint32(dev, "mmio_size",
 -        platform_bus_params.platform_bus_size);
 +    qdev_prop_set_uint32(dev, "num_irqs", PLATFORM_BUS_NUM_IRQS);
 +    qdev_prop_set_uint32(dev, "mmio_size", vms->memmap[VIRT_PLATFORM_BUS].size);
      qdev_init_nofail(dev);
      vms->platform_bus_dev = dev;
 -    s = SYS_BUS_DEVICE(dev);
 -    for (i = 0; i < platform_bus_params.platform_bus_num_irqs; i++) {
 -        int irqn = platform_bus_params.platform_bus_first_irq + i;
 +    s = SYS_BUS_DEVICE(dev);
 +    for (i = 0; i < PLATFORM_BUS_NUM_IRQS; i++) {
 +        int irqn = vms->irqmap[VIRT_PLATFORM_BUS] + i;
          sysbus_connect_irq(s, i, pic[irqn]);
      }
      memory_region_add_subregion(sysmem,
 -                                platform_bus_params.platform_bus_base,
 +                                vms->memmap[VIRT_PLATFORM_BUS].base,
                                  sysbus_mmio_get_region(s, 0));
  }
@@ -XXX,XX +XXX,XX @@ void virt_machine_done(Notifier *notifier, void *data)
  {
      VirtMachineState *vms = container_of(notifier, VirtMachineState,
                                           machine_done);
 +    ARMCPU *cpu = ARM_CPU(first_cpu);
 +    struct arm_boot_info *info = &vms->bootinfo;
 +    AddressSpace *as = arm_boot_address_space(cpu, info);
 +
 +    /*
 +     * If the user provided a dtb, we assume the dynamic sysbus nodes
 +     * already are integrated there. This corresponds to a use case where
 +     * the dynamic sysbus nodes are complex and their generation is not yet
 +     * supported. In that case the user can take charge of the guest dt
 +     * while qemu takes charge of the qom stuff.
 +     */
 +    if (info->dtb_filename == NULL) {
 +        platform_bus_add_all_fdt_nodes(vms->fdt, "/intc",
 +                                       vms->memmap[VIRT_PLATFORM_BUS].base,
 +                                       vms->memmap[VIRT_PLATFORM_BUS].size,
 +                                       vms->irqmap[VIRT_PLATFORM_BUS]);
 +    }
 +    if (arm_load_dtb(info->dtb_start, info, info->dtb_limit, as) < 0) {
 +        exit(1);
 +    }
      virt_acpi_setup(vms);
      virt_build_smbios(vms);
@@ -XXX,XX +XXX,XX @@ static void machvirt_init(MachineState *machine)
      vms->fw_cfg = create_fw_cfg(vms, &address_space_memory);
      rom_set_fw(vms->fw_cfg);
 -    vms->machine_done.notify = virt_machine_done;
 -    qemu_add_machine_init_done_notifier(&vms->machine_done);
 +    create_platform_bus(vms, pic);
      vms->bootinfo.ram_size = machine->ram_size;
      vms->bootinfo.kernel_filename = machine->kernel_filename;
@@ -XXX,XX +XXX,XX @@ static void machvirt_init(MachineState *machine)
      vms->bootinfo.board_id = -1;
      vms->bootinfo.loader_start = vms->memmap[VIRT_MEM].base;
      vms->bootinfo.get_dtb = machvirt_dtb;
 +    vms->bootinfo.skip_dtb_autoload = true;
      vms->bootinfo.firmware_loaded = firmware_loaded;
      arm_load_kernel(ARM_CPU(first_cpu), &vms->bootinfo);
 -    /*
 -     * arm_load_kernel machine init done notifier registration must
 -     * happen before the platform_bus_create call. In this latter,
 -     * another notifier is registered which adds platform bus nodes.
 -     * Notifiers are executed in registration reverse order.
 -     */
 -    create_platform_bus(vms, pic);
 +    vms->machine_done.notify = virt_machine_done;
 +    qemu_add_machine_init_done_notifier(&vms->machine_done);
  }
  static bool virt_get_secure(Object *obj, Error **errp)
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 21/21] target/arm: Clear SVE high bits for FMOV
+[Qemu-devel] [PULL 07/25] arm: fix malloc type mismatch
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Paolo Bonzini <pbonzini@redhat.com>
-Use write_fp_dreg and clear_vec_high to zero the bits
+cpregs_keys is an uint32_t* so the allocation should use uint32_t.
-that need zeroing for these cases.
+g_new is even better because it is type-safe.
-Cc: qemu-stable@nongnu.org
+Signed-off-by: Paolo Bonzini <pbonzini@redhat.com>
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20180502221552.3873-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 17 +++++------------
+ target/arm/gdbstub.c | 3 +--
-file changed, 5 insertions(+), 12 deletions(-)
+file changed, 1 insertion(+), 2 deletions(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/target/arm/gdbstub.c
-+++ b/target/arm/translate-a64.c
++++ b/target/arm/gdbstub.c
-@@ -XXX,XX +XXX,XX @@ static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
+@@ -XXX,XX +XXX,XX @@ int arm_gen_dynamic_xml(CPUState *cs)
+     RegisterSysregXmlParam param = {cs, s};
-     if (itof) {
-         TCGv_i64 tcg_rn = cpu_reg(s, rn);
+     cpu->dyn_xml.num_cpregs = 0;
-+        TCGv_i64 tmp;
+-    cpu->dyn_xml.cpregs_keys = g_malloc(sizeof(uint32_t *) *
+-                                        g_hash_table_size(cpu->cp_regs));
-         switch (type) {
++    cpu->dyn_xml.cpregs_keys = g_new(uint32_t, g_hash_table_size(cpu->cp_regs));
-         case 0:
+     g_string_printf(s, "<?xml version=\"1.0\"?>");
--        {
+     g_string_append_printf(s, "<!DOCTYPE target SYSTEM \"gdb-target.dtd\">");
-             /* 32 bit */
+     g_string_append_printf(s, "<feature name=\"org.qemu.gdb.arm.sys.regs\">");
 -            TCGv_i64 tmp = tcg_temp_new_i64();
 +            tmp = tcg_temp_new_i64();
              tcg_gen_ext32u_i64(tmp, tcg_rn);
 -            tcg_gen_st_i64(tmp, cpu_env, fp_reg_offset(s, rd, MO_64));
 -            tcg_gen_movi_i64(tmp, 0);
 -            tcg_gen_st_i64(tmp, cpu_env, fp_reg_hi_offset(s, rd));
 +            write_fp_dreg(s, rd, tmp);
              tcg_temp_free_i64(tmp);
              break;
 -        }
          case 1:
 -        {
              /* 64 bit */
 -            TCGv_i64 tmp = tcg_const_i64(0);
 -            tcg_gen_st_i64(tcg_rn, cpu_env, fp_reg_offset(s, rd, MO_64));
 -            tcg_gen_st_i64(tmp, cpu_env, fp_reg_hi_offset(s, rd));
 -            tcg_temp_free_i64(tmp);
 +            write_fp_dreg(s, rd, tcg_rn);
              break;
 -        }
          case 2:
              /* 64 bit to top half. */
              tcg_gen_st_i64(tcg_rn, cpu_env, fp_reg_hi_offset(s, rd));
 +            clear_vec_high(s, true, rd);
              break;
          }
      } else {
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 14/21] target/arm: Introduce ARM_FEATURE_V8_ATOMICS and initial decode
+[Qemu-devel] [PULL 08/25] xlnx-zdma: Correct mem leaks and memset to zero on desc unaligned errors
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Francisco Iglesias <frasse.iglesias@gmail.com>
-The insns in the ARMv8.1-Atomics are added to the existing
+Coverity found that the string return by 'object_get_canonical_path' was not
-load/store exclusive and load/store reg opcode spaces.
+being freed at two locations in the model (CID 1391294 and CID 1391293) and
-Rearrange the top-level decoders for these to accomodate.
+also that a memset was being called with a value greater than the max of a byte
-The Atomics insns themselves still generate Unallocated.
+on the second argument (CID 1391286). This patch corrects this by adding the
 freeing of the strings and also changing to memset to zero instead on
 descriptor unaligned errors.
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Francisco Iglesias <frasse.iglesias@gmail.com>
-Message-id: 20180508151437.4232-8-richard.henderson@linaro.org
+Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
-[PMM: Drop the ARM_FEATURE_V8_1 feature flag]
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20180528184859.3530-1-frasse.iglesias@gmail.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/cpu.h           |   1 +
+ hw/dma/xlnx-zdma.c | 10 +++++++---
- linux-user/elfload.c       |   1 +
+file changed, 7 insertions(+), 3 deletions(-)
  target/arm/translate-a64.c | 182 +++++++++++++++++++++++++++----------
 files changed, 138 insertions(+), 46 deletions(-)
-diff --git a/target/arm/cpu.h b/target/arm/cpu.h
+diff --git a/hw/dma/xlnx-zdma.c b/hw/dma/xlnx-zdma.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.h
+--- a/hw/dma/xlnx-zdma.c
-+++ b/target/arm/cpu.h
++++ b/hw/dma/xlnx-zdma.c
-@@ -XXX,XX +XXX,XX @@ enum arm_features {
+@@ -XXX,XX +XXX,XX @@ static bool zdma_load_descriptor(XlnxZDMA *s, uint64_t addr, void *buf)
-     ARM_FEATURE_V8_SHA3, /* implements SHA3 part of v8 Crypto Extensions */
+         qemu_log_mask(LOG_GUEST_ERROR,
-     ARM_FEATURE_V8_SM3, /* implements SM3 part of v8 Crypto Extensions */
+                       "zdma: unaligned descriptor at %" PRIx64,
-     ARM_FEATURE_V8_SM4, /* implements SM4 part of v8 Crypto Extensions */
+                       addr);
-+    ARM_FEATURE_V8_ATOMICS, /* ARMv8.1-Atomics feature */
+-        memset(buf, 0xdeadbeef, sizeof(XlnxZDMADescr));
-     ARM_FEATURE_V8_RDM, /* implements v8.1 simd round multiply */
++        memset(buf, 0x0, sizeof(XlnxZDMADescr));
-     ARM_FEATURE_V8_FP16, /* implements v8.2 half-precision float */
+         s->error = true;
-     ARM_FEATURE_V8_FCMA, /* has complex number part of v8.3 extensions.  */
+         return false;
-diff --git a/linux-user/elfload.c b/linux-user/elfload.c
+     }
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static uint64_t zdma_read(void *opaque, hwaddr addr, unsigned size)
---- a/linux-user/elfload.c
+     RegisterInfo *r = &s->regs_info[addr / 4];
-+++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
+     if (!r->data) {
-     GET_FEATURE(ARM_FEATURE_V8_SHA512, ARM_HWCAP_A64_SHA512);
++        gchar *path = object_get_canonical_path(OBJECT(s));
-     GET_FEATURE(ARM_FEATURE_V8_FP16,
+         qemu_log("%s: Decode error: read from %" HWADDR_PRIx "\n",
-                 ARM_HWCAP_A64_FPHP | ARM_HWCAP_A64_ASIMDHP);
+-                 object_get_canonical_path(OBJECT(s)),
-+    GET_FEATURE(ARM_FEATURE_V8_ATOMICS, ARM_HWCAP_A64_ATOMICS);
++                 path,
-     GET_FEATURE(ARM_FEATURE_V8_RDM, ARM_HWCAP_A64_ASIMDRDM);
+                  addr);
-     GET_FEATURE(ARM_FEATURE_V8_FCMA, ARM_HWCAP_A64_FCMA);
++        g_free(path);
- #undef GET_FEATURE
+         ARRAY_FIELD_DP32(s->regs, ZDMA_CH_ISR, INV_APB, true);
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+         zdma_ch_imr_update_irq(s);
-index XXXXXXX..XXXXXXX 100644
+         return 0;
---- a/target/arm/translate-a64.c
+@@ -XXX,XX +XXX,XX @@ static void zdma_write(void *opaque, hwaddr addr, uint64_t value,
-+++ b/target/arm/translate-a64.c
+     RegisterInfo *r = &s->regs_info[addr / 4];
-@@ -XXX,XX +XXX,XX @@ static void disas_ldst_excl(DisasContext *s, uint32_t insn)
-     int rt = extract32(insn, 0, 5);
+     if (!r->data) {
-     int rn = extract32(insn, 5, 5);
++        gchar *path = object_get_canonical_path(OBJECT(s));
-     int rt2 = extract32(insn, 10, 5);
+         qemu_log("%s: Decode error: write to %" HWADDR_PRIx "=%" PRIx64 "\n",
--    int is_lasr = extract32(insn, 15, 1);
+-                 object_get_canonical_path(OBJECT(s)),
-     int rs = extract32(insn, 16, 5);
++                 path,
--    int is_pair = extract32(insn, 21, 1);
+                  addr, value);
--    int is_store = !extract32(insn, 22, 1);
++        g_free(path);
--    int is_excl = !extract32(insn, 23, 1);
+         ARRAY_FIELD_DP32(s->regs, ZDMA_CH_ISR, INV_APB, true);
-+    int is_lasr = extract32(insn, 15, 1);
+         zdma_ch_imr_update_irq(s);
 +    int o2_L_o1_o0 = extract32(insn, 21, 3) * 2 | is_lasr;
      int size = extract32(insn, 30, 2);
      TCGv_i64 tcg_addr;
 -    if ((!is_excl && !is_pair && !is_lasr) ||
 -        (!is_excl && is_pair) ||
 -        (is_pair && size < 2)) {
 -        unallocated_encoding(s);
 +    switch (o2_L_o1_o0) {
 +    case 0x0: /* STXR */
 +    case 0x1: /* STLXR */
 +        if (rn == 31) {
 +            gen_check_sp_alignment(s);
 +        }
 +        if (is_lasr) {
 +            tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
 +        }
 +        tcg_addr = read_cpu_reg_sp(s, rn, 1);
 +        gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, false);
          return;
--    }
--    if (rn == 31) {
--        gen_check_sp_alignment(s);
--    }
--    tcg_addr = read_cpu_reg_sp(s, rn, 1);
--
--    /* Note that since TCG is single threaded load-acquire/store-release
--     * semantics require no extra if (is_lasr) { ... } handling.
--     */
--
--    if (is_excl) {
--        if (!is_store) {
--            s->is_ldex = true;
--            gen_load_exclusive(s, rt, rt2, tcg_addr, size, is_pair);
--            if (is_lasr) {
--                tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
--            }
--        } else {
--            if (is_lasr) {
--                tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
--            }
--            gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, is_pair);
-+    case 0x4: /* LDXR */
-+    case 0x5: /* LDAXR */
-+        if (rn == 31) {
-+            gen_check_sp_alignment(s);
-         }
--    } else {
--        TCGv_i64 tcg_rt = cpu_reg(s, rt);
--        bool iss_sf = disas_ldst_compute_iss_sf(size, false, 0);
-+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
-+        s->is_ldex = true;
-+        gen_load_exclusive(s, rt, rt2, tcg_addr, size, false);
-+        if (is_lasr) {
-+            tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
-+        }
-+        return;
-+    case 0x9: /* STLR */
-         /* Generate ISS for non-exclusive accesses including LASR.  */
--        if (is_store) {
-+        if (rn == 31) {
-+            gen_check_sp_alignment(s);
-+        }
-+        tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
-+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
-+        do_gpr_st(s, cpu_reg(s, rt), tcg_addr, size, true, rt,
-+                  disas_ldst_compute_iss_sf(size, false, 0), is_lasr);
-+        return;
-+
-+    case 0xd: /* LDAR */
-+        /* Generate ISS for non-exclusive accesses including LASR.  */
-+        if (rn == 31) {
-+            gen_check_sp_alignment(s);
-+        }
-+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
-+        do_gpr_ld(s, cpu_reg(s, rt), tcg_addr, size, false, false, true, rt,
-+                  disas_ldst_compute_iss_sf(size, false, 0), is_lasr);
-+        tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
-+        return;
-+
-+    case 0x2: case 0x3: /* CASP / STXP */
-+        if (size & 2) { /* STXP / STLXP */
-+            if (rn == 31) {
-+                gen_check_sp_alignment(s);
-+            }
-             if (is_lasr) {
-                 tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
-             }
--            do_gpr_st(s, tcg_rt, tcg_addr, size,
--                      true, rt, iss_sf, is_lasr);
--        } else {
--            do_gpr_ld(s, tcg_rt, tcg_addr, size, false, false,
--                      true, rt, iss_sf, is_lasr);
-+            tcg_addr = read_cpu_reg_sp(s, rn, 1);
-+            gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, true);
-+            return;
-+        }
-+        /* CASP / CASPL */
-+        break;
-+
-+    case 0x6: case 0x7: /* CASP / LDXP */
-+        if (size & 2) { /* LDXP / LDAXP */
-+            if (rn == 31) {
-+                gen_check_sp_alignment(s);
-+            }
-+            tcg_addr = read_cpu_reg_sp(s, rn, 1);
-+            s->is_ldex = true;
-+            gen_load_exclusive(s, rt, rt2, tcg_addr, size, true);
-             if (is_lasr) {
-                 tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
-             }
-+            return;
-         }
-+        /* CASPA / CASPAL */
-+        break;
-+
-+    case 0xa: /* CAS */
-+    case 0xb: /* CASL */
-+    case 0xe: /* CASA */
-+    case 0xf: /* CASAL */
-+        break;
-     }
-+    unallocated_encoding(s);
- }
- /*
-@@ -XXX,XX +XXX,XX @@ static void disas_ldst_reg_unsigned_imm(DisasContext *s, uint32_t insn,
-     }
- }
-+/* Atomic memory operations
-+ *
-+ *  31  30      27  26    24    22  21   16   15    12    10    5     0
-+ * +------+-------+---+-----+-----+---+----+----+-----+-----+----+-----+
-+ * | size | 1 1 1 | V | 0 0 | A R | 1 | Rs | o3 | opc | 0 0 | Rn |  Rt |
-+ * +------+-------+---+-----+-----+--------+----+-----+-----+----+-----+
-+ *
-+ * Rt: the result register
-+ * Rn: base address or SP
-+ * Rs: the source register for the operation
-+ * V: vector flag (always 0 as of v8.3)
-+ * A: acquire flag
-+ * R: release flag
-+ */
-+static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
-+                              int size, int rt, bool is_vector)
-+{
-+    int rs = extract32(insn, 16, 5);
-+    int rn = extract32(insn, 5, 5);
-+    int o3_opc = extract32(insn, 12, 4);
-+    int feature = ARM_FEATURE_V8_ATOMICS;
-+
-+    if (is_vector) {
-+        unallocated_encoding(s);
-+        return;
-+    }
-+    switch (o3_opc) {
-+    case 000: /* LDADD */
-+    case 001: /* LDCLR */
-+    case 002: /* LDEOR */
-+    case 003: /* LDSET */
-+    case 004: /* LDSMAX */
-+    case 005: /* LDSMIN */
-+    case 006: /* LDUMAX */
-+    case 007: /* LDUMIN */
-+    case 010: /* SWP */
-+    default:
-+        unallocated_encoding(s);
-+        return;
-+    }
-+    if (!arm_dc_feature(s, feature)) {
-+        unallocated_encoding(s);
-+        return;
-+    }
-+
-+    (void)rs;
-+    (void)rn;
-+}
-+
- /* Load/store register (all forms) */
- static void disas_ldst_reg(DisasContext *s, uint32_t insn)
- {
-@@ -XXX,XX +XXX,XX @@ static void disas_ldst_reg(DisasContext *s, uint32_t insn)
-     switch (extract32(insn, 24, 2)) {
-     case 0:
--        if (extract32(insn, 21, 1) == 1 && extract32(insn, 10, 2) == 2) {
--            disas_ldst_reg_roffset(s, insn, opc, size, rt, is_vector);
--        } else {
-+        if (extract32(insn, 21, 1) == 0) {
-             /* Load/store register (unscaled immediate)
-              * Load/store immediate pre/post-indexed
-              * Load/store register unprivileged
-              */
-             disas_ldst_reg_imm9(s, insn, opc, size, rt, is_vector);
-+            return;
-+        }
-+        switch (extract32(insn, 10, 2)) {
-+        case 0:
-+            disas_ldst_atomic(s, insn, size, rt, is_vector);
-+            return;
-+        case 2:
-+            disas_ldst_reg_roffset(s, insn, opc, size, rt, is_vector);
-+            return;
-         }
-         break;
-     case 1:
-         disas_ldst_reg_unsigned_imm(s, insn, opc, size, rt, is_vector);
--        break;
--    default:
--        unallocated_encoding(s);
--        break;
-+        return;
-     }
-+    unallocated_encoding(s);
- }
- /* AdvSIMD load/store multiple structures
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 20/21] target/arm: Fix float16 to/from int16
+[Qemu-devel] [PULL 09/25] Correct CPACR reset value for v7 cores
-From: Richard Henderson <richard.henderson@linaro.org>
+In commit f0aff255700 we made cpacr_write() enforce that some CPACR
 bits are RAZ/WI and some are RAO/WI for ARMv7 cores. Unfortunately
 we forgot to also update the register's reset value. The effect
 was that (a) a guest that read CPACR on reset would not see ones in
 the RAO bits, and (b) if you did a migration before the guest did
 a write to the CPACR then the migration would fail because the
 destination would enforce the RAO bits and then complain that they
 didn't match the zero value from the source.
-The instruction "ucvtf v0.4h, v04h, #2", with input 0x8000u,
+Implement reset for the CPACR using a custom reset function
-overflows the intermediate float16 to infinity before we have a
+that just calls cpacr_write(), to avoid having to duplicate
-chance to scale the output.  Use float64 as the intermediate type
+the logic for which bits are RAO.
 so that no input argument (uint32_t in this case) can overflow
 or round before scaling.  Given the declared argument, the signed
 int32_t function has the same problem.
-When converting from float16 to integer, using u/int32_t instead
+This bug would affect migration for TCG CPUs which are ARMv7
-of u/int16_t means that the bounding is incorrect.
+with VFP but without one of Neon or VFPv3.
-Cc: qemu-stable@nongnu.org
+Reported-by: Cédric Le Goater <clg@kaod.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180502221552.3873-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Tested-by: Cédric Le Goater <clg@kaod.org>
+Message-id: 20180522173713.26282-1-peter.maydell@linaro.org
 ---
- target/arm/helper.h        |  4 +--
+ target/arm/helper.c | 10 +++++++++-
- target/arm/helper.c        | 53 ++++++++++++++++++++++++++++++++++++--
+file changed, 9 insertions(+), 1 deletion(-)
  target/arm/translate-a64.c |  4 +--
 files changed, 55 insertions(+), 6 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
-+++ b/target/arm/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_toshd_round_to_zero, i64, f64, i32, ptr)
- DEF_HELPER_3(vfp_tosld_round_to_zero, i64, f64, i32, ptr)
- DEF_HELPER_3(vfp_touhd_round_to_zero, i64, f64, i32, ptr)
- DEF_HELPER_3(vfp_tould_round_to_zero, i64, f64, i32, ptr)
--DEF_HELPER_3(vfp_toulh, i32, f16, i32, ptr)
--DEF_HELPER_3(vfp_toslh, i32, f16, i32, ptr)
-+DEF_HELPER_3(vfp_touhh, i32, f16, i32, ptr)
-+DEF_HELPER_3(vfp_toshh, i32, f16, i32, ptr)
- DEF_HELPER_3(vfp_toshs, i32, f32, i32, ptr)
- DEF_HELPER_3(vfp_tosls, i32, f32, i32, ptr)
- DEF_HELPER_3(vfp_tosqs, i64, f32, i32, ptr)
 diff --git a/target/arm/helper.c b/target/arm/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper.c
 +++ b/target/arm/helper.c
-@@ -XXX,XX +XXX,XX @@ VFP_CONV_FIX_A64(sq, s, 32, 64, int64)
+@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
- VFP_CONV_FIX(uh, s, 32, 32, uint16)
+     env->cp15.cpacr_el1 = value;
- VFP_CONV_FIX(ul, s, 32, 32, uint32)
+ }
- VFP_CONV_FIX_A64(uq, s, 32, 64, uint64)
--VFP_CONV_FIX_A64(sl, h, 16, 32, int32)
++static void cpacr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
 -VFP_CONV_FIX_A64(ul, h, 16, 32, uint32)
 +
  #undef VFP_CONV_FIX
  #undef VFP_CONV_FIX_FLOAT
  #undef VFP_CONV_FLOAT_FIX_ROUND
 +#undef VFP_CONV_FIX_A64
 +
 +/* Conversion to/from f16 can overflow to infinity before/after scaling.
 + * Therefore we convert to f64 (which does not round), scale,
 + * and then convert f64 to f16 (which may round).
 + */
 +
 +static float16 do_postscale_fp16(float64 f, int shift, float_status *fpst)
 +{
-+    return float64_to_float16(float64_scalbn(f, -shift, fpst), true, fpst);
++    /* Call cpacr_write() so that we reset with the correct RAO bits set
 +     * for our CPU features.
 +     */
 +    cpacr_write(env, ri, 0);
 +}
 +
-+float16 HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
+ static CPAccessResult cpacr_access(CPUARMState *env, const ARMCPRegInfo *ri,
-+{
+                                    bool isread)
-+    return do_postscale_fp16(int32_to_float64(x, fpst), shift, fpst);
+ {
-+}
+@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
-+
+     { .name = "CPACR", .state = ARM_CP_STATE_BOTH, .opc0 = 3,
-+float16 HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
+       .crn = 1, .crm = 0, .opc1 = 0, .opc2 = 2, .accessfn = cpacr_access,
-+{
+       .access = PL1_RW, .fieldoffset = offsetof(CPUARMState, cp15.cpacr_el1),
-+    return do_postscale_fp16(uint32_to_float64(x, fpst), shift, fpst);
+-      .resetvalue = 0, .writefn = cpacr_write },
-+}
++      .resetfn = cpacr_reset, .writefn = cpacr_write },
-+
+     REGINFO_SENTINEL
-+static float64 do_prescale_fp16(float16 f, int shift, float_status *fpst)
+ };
-+{
 +    if (unlikely(float16_is_any_nan(f))) {
 +        float_raise(float_flag_invalid, fpst);
 +        return 0;
 +    } else {
 +        int old_exc_flags = get_float_exception_flags(fpst);
 +        float64 ret;
 +
 +        ret = float16_to_float64(f, true, fpst);
 +        ret = float64_scalbn(ret, shift, fpst);
 +        old_exc_flags |= get_float_exception_flags(fpst)
 +            & float_flag_input_denormal;
 +        set_float_exception_flags(old_exc_flags, fpst);
 +
 +        return ret;
 +    }
 +}
 +
 +uint32_t HELPER(vfp_toshh)(float16 x, uint32_t shift, void *fpst)
 +{
 +    return float64_to_int16(do_prescale_fp16(x, shift, fpst), fpst);
 +}
 +
 +uint32_t HELPER(vfp_touhh)(float16 x, uint32_t shift, void *fpst)
 +{
 +    return float64_to_uint16(do_prescale_fp16(x, shift, fpst), fpst);
 +}
  /* Set the current fp rounding mode and return the old one.
   * The argument is a softfloat float_round_ value.
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
          switch (size) {
          case MO_16:
              if (is_u) {
 -                fn = gen_helper_vfp_toulh;
 +                fn = gen_helper_vfp_touhh;
              } else {
 -                fn = gen_helper_vfp_toslh;
 +                fn = gen_helper_vfp_toshh;
              }
              break;
          case MO_32:
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 07/21] atomic.h: Work around gcc spurious "unused value" warning
+[Qemu-devel] [PULL 10/25] memory.h: Improve IOMMU related documentation
-Some versions of gcc produce a spurious warning if the result of
+Add more detail to the documentation for memory_region_init_iommu()
-__atomic_compare_echange_n() is not used and the type involved
+and other IOMMU-related functions and data structures.
 is a signed 8 bit value:
   error: value computed is not used [-Werror=unused-value]
 This has been seen on at least
  gcc (Ubuntu 5.4.0-6ubuntu1~16.04.9) 5.4.0 20160609
 Work around this by using an explicit cast to void to indicate
 that we don't care about the return value.
 We don't currently use our atomic_cmpxchg() macro on any signed
 bit types, but the upcoming support for the Arm v8.1-Atomics
 will require it.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Message-id: 20180521140402.23318-2-peter.maydell@linaro.org
 ---
- include/qemu/atomic.h | 2 +-
+ include/exec/memory.h | 105 ++++++++++++++++++++++++++++++++++++++----
-file changed, 1 insertion(+), 1 deletion(-)
+file changed, 95 insertions(+), 10 deletions(-)
-diff --git a/include/qemu/atomic.h b/include/qemu/atomic.h
+diff --git a/include/exec/memory.h b/include/exec/memory.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/qemu/atomic.h
+--- a/include/exec/memory.h
-+++ b/include/qemu/atomic.h
++++ b/include/exec/memory.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ enum IOMMUMemoryRegionAttr {
- /* Returns the eventual value, failed or not */
+     IOMMU_ATTR_SPAPR_TCE_FD
- #define atomic_cmpxchg__nocheck(ptr, old, new)    ({                    \
+ };
-     typeof_strip_qual(*ptr) _old = (old);                               \
--    __atomic_compare_exchange_n(ptr, &_old, new, false,                 \
++/**
-+    (void)__atomic_compare_exchange_n(ptr, &_old, new, false,           \
++ * IOMMUMemoryRegionClass:
-                               __ATOMIC_SEQ_CST, __ATOMIC_SEQ_CST);      \
++ *
-     _old;                                                               \
++ * All IOMMU implementations need to subclass TYPE_IOMMU_MEMORY_REGION
- })
++ * and provide an implementation of at least the @translate method here
 + * to handle requests to the memory region. Other methods are optional.
 + *
 + * The IOMMU implementation must use the IOMMU notifier infrastructure
 + * to report whenever mappings are changed, by calling
 + * memory_region_notify_iommu() (or, if necessary, by calling
 + * memory_region_notify_one() for each registered notifier).
 + */
  typedef struct IOMMUMemoryRegionClass {
      /* private */
      struct DeviceClass parent_class;
      /*
 -     * Return a TLB entry that contains a given address. Flag should
 -     * be the access permission of this translation operation. We can
 -     * set flag to IOMMU_NONE to mean that we don't need any
 -     * read/write permission checks, like, when for region replay.
 +     * Return a TLB entry that contains a given address.
 +     *
 +     * The IOMMUAccessFlags indicated via @flag are optional and may
 +     * be specified as IOMMU_NONE to indicate that the caller needs
 +     * the full translation information for both reads and writes. If
 +     * the access flags are specified then the IOMMU implementation
 +     * may use this as an optimization, to stop doing a page table
 +     * walk as soon as it knows that the requested permissions are not
 +     * allowed. If IOMMU_NONE is passed then the IOMMU must do the
 +     * full page table walk and report the permissions in the returned
 +     * IOMMUTLBEntry. (Note that this implies that an IOMMU may not
 +     * return different mappings for reads and writes.)
 +     *
 +     * The returned information remains valid while the caller is
 +     * holding the big QEMU lock or is inside an RCU critical section;
 +     * if the caller wishes to cache the mapping beyond that it must
 +     * register an IOMMU notifier so it can invalidate its cached
 +     * information when the IOMMU mapping changes.
 +     *
 +     * @iommu: the IOMMUMemoryRegion
 +     * @hwaddr: address to be translated within the memory region
 +     * @flag: requested access permissions
       */
      IOMMUTLBEntry (*translate)(IOMMUMemoryRegion *iommu, hwaddr addr,
                                 IOMMUAccessFlags flag);
 -    /* Returns minimum supported page size */
 +    /* Returns minimum supported page size in bytes.
 +     * If this method is not provided then the minimum is assumed to
 +     * be TARGET_PAGE_SIZE.
 +     *
 +     * @iommu: the IOMMUMemoryRegion
 +     */
      uint64_t (*get_min_page_size)(IOMMUMemoryRegion *iommu);
 -    /* Called when IOMMU Notifier flag changed */
 +    /* Called when IOMMU Notifier flag changes (ie when the set of
 +     * events which IOMMU users are requesting notification for changes).
 +     * Optional method -- need not be provided if the IOMMU does not
 +     * need to know exactly which events must be notified.
 +     *
 +     * @iommu: the IOMMUMemoryRegion
 +     * @old_flags: events which previously needed to be notified
 +     * @new_flags: events which now need to be notified
 +     */
      void (*notify_flag_changed)(IOMMUMemoryRegion *iommu,
                                  IOMMUNotifierFlag old_flags,
                                  IOMMUNotifierFlag new_flags);
 -    /* Set this up to provide customized IOMMU replay function */
 +    /* Called to handle memory_region_iommu_replay().
 +     *
 +     * The default implementation of memory_region_iommu_replay() is to
 +     * call the IOMMU translate method for every page in the address space
 +     * with flag == IOMMU_NONE and then call the notifier if translate
 +     * returns a valid mapping. If this method is implemented then it
 +     * overrides the default behaviour, and must provide the full semantics
 +     * of memory_region_iommu_replay(), by calling @notifier for every
 +     * translation present in the IOMMU.
 +     *
 +     * Optional method -- an IOMMU only needs to provide this method
 +     * if the default is inefficient or produces undesirable side effects.
 +     *
 +     * Note: this is not related to record-and-replay functionality.
 +     */
      void (*replay)(IOMMUMemoryRegion *iommu, IOMMUNotifier *notifier);
 -    /* Get IOMMU misc attributes */
 -    int (*get_attr)(IOMMUMemoryRegion *iommu, enum IOMMUMemoryRegionAttr,
 +    /* Get IOMMU misc attributes. This is an optional method that
 +     * can be used to allow users of the IOMMU to get implementation-specific
 +     * information. The IOMMU implements this method to handle calls
 +     * by IOMMU users to memory_region_iommu_get_attr() by filling in
 +     * the arbitrary data pointer for any IOMMUMemoryRegionAttr values that
 +     * the IOMMU supports. If the method is unimplemented then
 +     * memory_region_iommu_get_attr() will always return -EINVAL.
 +     *
 +     * @iommu: the IOMMUMemoryRegion
 +     * @attr: attribute being queried
 +     * @data: memory to fill in with the attribute data
 +     *
 +     * Returns 0 on success, or a negative errno; in particular
 +     * returns -EINVAL for unrecognized or unimplemented attribute types.
 +     */
 +    int (*get_attr)(IOMMUMemoryRegion *iommu, enum IOMMUMemoryRegionAttr attr,
                      void *data);
  } IOMMUMemoryRegionClass;
@@ -XXX,XX +XXX,XX @@ static inline void memory_region_init_reservation(MemoryRegion *mr,
   * An IOMMU region translates addresses and forwards accesses to a target
   * memory region.
   *
 + * The IOMMU implementation must define a subclass of TYPE_IOMMU_MEMORY_REGION.
 + * @_iommu_mr should be a pointer to enough memory for an instance of
 + * that subclass, @instance_size is the size of that subclass, and
 + * @mrtypename is its name. This function will initialize @_iommu_mr as an
 + * instance of the subclass, and its methods will then be called to handle
 + * accesses to the memory region. See the documentation of
 + * #IOMMUMemoryRegionClass for further details.
 + *
   * @_iommu_mr: the #IOMMUMemoryRegion to be initialized
   * @instance_size: the IOMMUMemoryRegion subclass instance size
   * @mrtypename: the type name of the #IOMMUMemoryRegion
@@ -XXX,XX +XXX,XX @@ void memory_region_register_iommu_notifier(MemoryRegion *mr,
   * a notifier with the minimum page granularity returned by
   * mr->iommu_ops->get_page_size().
   *
 + * Note: this is not related to record-and-replay functionality.
 + *
   * @iommu_mr: the memory region to observe
   * @n: the notifier to which to replay iommu mappings
   */
@@ -XXX,XX +XXX,XX @@ void memory_region_iommu_replay(IOMMUMemoryRegion *iommu_mr, IOMMUNotifier *n);
   * memory_region_iommu_replay_all: replay existing IOMMU translations
   * to all the notifiers registered.
   *
 + * Note: this is not related to record-and-replay functionality.
 + *
   * @iommu_mr: the memory region to observe
   */
  void memory_region_iommu_replay_all(IOMMUMemoryRegion *iommu_mr);
@@ -XXX,XX +XXX,XX @@ void memory_region_unregister_iommu_notifier(MemoryRegion *mr,
   * memory_region_iommu_get_attr: return an IOMMU attr if get_attr() is
   * defined on the IOMMU.
   *
 - * Returns 0 if succeded, error code otherwise.
 + * Returns 0 on success, or a negative errno otherwise. In particular,
 + * -EINVAL indicates that the IOMMU does not support the requested
 + * attribute.
   *
   * @iommu_mr: the memory region
   * @attr: the requested attribute
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 02/21] softfloat: Handle default NaN mode after pickNaNMulAdd, not before
+[Qemu-devel] [PULL 11/25] Make tb_invalidate_phys_addr() take a MemTxAttrs argument
-It is implementation defined whether a multiply-add of
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
-(0,inf,qnan) or (inf,0,qnan) raises InvalidaOperation or
+add MemTxAttrs as an argument to tb_invalidate_phys_addr().
-not, so we let the target-specific pickNaNMulAdd function
+Its callers either have an attrs value to hand, or don't care
-handle this. This means that we must do the "return the
+and can use MEMTXATTRS_UNSPECIFIED.
 default NaN in default NaN mode" check after the call,
 not before. Correct the ordering, and restore the comment
 from the old propagateFloat64MulAddNaN() that warned about
 this corner case.
-This fixes a regression from 2.11 for Arm guests where we would
-incorrectly fail to set the Invalid flag for these cases.
-Cc: qemu-stable@nongnu.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Tested-by: Alex Bennée <alex.bennee@linaro.org>
+Message-id: 20180521140402.23318-3-peter.maydell@linaro.org
 Message-id: 20180504100547.14621-1-peter.maydell@linaro.org
 ---
- fpu/softfloat.c | 52 ++++++++++++++++++++++++++++---------------------
+ include/exec/exec-all.h   | 5 +++--
-file changed, 30 insertions(+), 22 deletions(-)
+ accel/tcg/translate-all.c | 2 +-
  exec.c                    | 2 +-
  target/xtensa/op_helper.c | 3 ++-
 files changed, 7 insertions(+), 5 deletions(-)
-diff --git a/fpu/softfloat.c b/fpu/softfloat.c
+diff --git a/include/exec/exec-all.h b/include/exec/exec-all.h
 index XXXXXXX..XXXXXXX 100644
---- a/fpu/softfloat.c
+--- a/include/exec/exec-all.h
-+++ b/fpu/softfloat.c
++++ b/include/exec/exec-all.h
-@@ -XXX,XX +XXX,XX @@ static FloatParts pick_nan(FloatParts a, FloatParts b, float_status *s)
+@@ -XXX,XX +XXX,XX @@ void tlb_set_page_with_attrs(CPUState *cpu, target_ulong vaddr,
- static FloatParts pick_nan_muladd(FloatParts a, FloatParts b, FloatParts c,
+ void tlb_set_page(CPUState *cpu, target_ulong vaddr,
-                                   bool inf_zero, float_status *s)
+                   hwaddr paddr, int prot,
                    int mmu_idx, target_ulong size);
 -void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr);
 +void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr, MemTxAttrs attrs);
  void probe_write(CPUArchState *env, target_ulong addr, int size, int mmu_idx,
                   uintptr_t retaddr);
  #else
@@ -XXX,XX +XXX,XX @@ static inline void tlb_flush_by_mmuidx_all_cpus_synced(CPUState *cpu,
                                                         uint16_t idxmap)
  {
-+    int which;
+ }
-+
+-static inline void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr)
-     if (is_snan(a.cls) || is_snan(b.cls) || is_snan(c.cls)) {
++static inline void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr,
-         s->float_exception_flags |= float_flag_invalid;
++                                           MemTxAttrs attrs)
  {
  }
  #endif
 diff --git a/accel/tcg/translate-all.c b/accel/tcg/translate-all.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/tcg/translate-all.c
 +++ b/accel/tcg/translate-all.c
@@ -XXX,XX +XXX,XX @@ static TranslationBlock *tb_find_pc(uintptr_t tc_ptr)
  }
  #if !defined(CONFIG_USER_ONLY)
 -void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr)
 +void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr, MemTxAttrs attrs)
  {
      ram_addr_t ram_addr;
      MemoryRegion *mr;
 diff --git a/exec.c b/exec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/exec.c
 +++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static void breakpoint_invalidate(CPUState *cpu, target_ulong pc)
      if (phys != -1) {
          /* Locks grabbed by tb_invalidate_phys_addr */
          tb_invalidate_phys_addr(cpu->cpu_ases[asidx].as,
 -                                phys | (pc & ~TARGET_PAGE_MASK));
 +                                phys | (pc & ~TARGET_PAGE_MASK), attrs);
      }
+ }
--    if (s->default_nan_mode) {
+ #endif
--        a.cls = float_class_dnan;
+diff --git a/target/xtensa/op_helper.c b/target/xtensa/op_helper.c
--    } else {
+index XXXXXXX..XXXXXXX 100644
--        switch (pickNaNMulAdd(is_qnan(a.cls), is_snan(a.cls),
+--- a/target/xtensa/op_helper.c
--                              is_qnan(b.cls), is_snan(b.cls),
++++ b/target/xtensa/op_helper.c
--                              is_qnan(c.cls), is_snan(c.cls),
+@@ -XXX,XX +XXX,XX @@ static void tb_invalidate_virtual_addr(CPUXtensaState *env, uint32_t vaddr)
--                              inf_zero, s)) {
+     int ret = xtensa_get_physical_addr(env, false, vaddr, 2, 0,
--        case 0:
+             &paddr, &page_size, &access);
--            break;
+     if (ret == 0) {
--        case 1:
+-        tb_invalidate_phys_addr(&address_space_memory, paddr);
--            a = b;
++        tb_invalidate_phys_addr(&address_space_memory, paddr,
--            break;
++                                MEMTXATTRS_UNSPECIFIED);
 -        case 2:
 -            a = c;
 -            break;
 -        case 3:
 -            a.cls = float_class_dnan;
 -            return a;
 -        default:
 -            g_assert_not_reached();
 -        }
 +    which = pickNaNMulAdd(is_qnan(a.cls), is_snan(a.cls),
 +                          is_qnan(b.cls), is_snan(b.cls),
 +                          is_qnan(c.cls), is_snan(c.cls),
 +                          inf_zero, s);
 -        a.cls = float_class_msnan;
 +    if (s->default_nan_mode) {
 +        /* Note that this check is after pickNaNMulAdd so that function
 +         * has an opportunity to set the Invalid flag.
 +         */
 +        a.cls = float_class_dnan;
 +        return a;
      }
-+
-+    switch (which) {
-+    case 0:
-+        break;
-+    case 1:
-+        a = b;
-+        break;
-+    case 2:
-+        a = c;
-+        break;
-+    case 3:
-+        a.cls = float_class_dnan;
-+        return a;
-+    default:
-+        g_assert_not_reached();
-+    }
-+    a.cls = float_class_msnan;
-+
-     return a;
  }
 --
-.17.0
+.17.1

-New patch
+[Qemu-devel] [PULL 12/25] Make address_space_translate{, _cached}() take a MemTxAttrs argument
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to address_space_translate()
 and address_space_translate_cached(). Callers either have an
 attrs value to hand, or don't care and can use MEMTXATTRS_UNSPECIFIED.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180521140402.23318-4-peter.maydell@linaro.org
 ---
  include/exec/memory.h     |  4 +++-
  accel/tcg/translate-all.c |  2 +-
  exec.c                    | 14 +++++++++-----
  hw/vfio/common.c          |  3 ++-
  memory_ldst.inc.c         | 18 +++++++++---------
  target/riscv/helper.c     |  2 +-
 files changed, 25 insertions(+), 18 deletions(-)
 diff --git a/include/exec/memory.h b/include/exec/memory.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/exec/memory.h
 +++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
   * #MemoryRegion.
   * @len: pointer to length
   * @is_write: indicates the transfer direction
 + * @attrs: memory attributes
   */
  MemoryRegion *flatview_translate(FlatView *fv,
                                   hwaddr addr, hwaddr *xlat,
@@ -XXX,XX +XXX,XX @@ MemoryRegion *flatview_translate(FlatView *fv,
  static inline MemoryRegion *address_space_translate(AddressSpace *as,
                                                      hwaddr addr, hwaddr *xlat,
 -                                                    hwaddr *len, bool is_write)
 +                                                    hwaddr *len, bool is_write,
 +                                                    MemTxAttrs attrs)
  {
      return flatview_translate(address_space_to_flatview(as),
                                addr, xlat, len, is_write);
 diff --git a/accel/tcg/translate-all.c b/accel/tcg/translate-all.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/tcg/translate-all.c
 +++ b/accel/tcg/translate-all.c
@@ -XXX,XX +XXX,XX @@ void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr, MemTxAttrs attrs)
      hwaddr l = 1;
      rcu_read_lock();
 -    mr = address_space_translate(as, addr, &addr, &l, false);
 +    mr = address_space_translate(as, addr, &addr, &l, false, attrs);
      if (!(memory_region_is_ram(mr)
            || memory_region_is_romd(mr))) {
          rcu_read_unlock();
 diff --git a/exec.c b/exec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/exec.c
 +++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static inline void cpu_physical_memory_write_rom_internal(AddressSpace *as,
      rcu_read_lock();
      while (len > 0) {
          l = len;
 -        mr = address_space_translate(as, addr, &addr1, &l, true);
 +        mr = address_space_translate(as, addr, &addr1, &l, true,
 +                                     MEMTXATTRS_UNSPECIFIED);
          if (!(memory_region_is_ram(mr) ||
                memory_region_is_romd(mr))) {
@@ -XXX,XX +XXX,XX @@ void address_space_cache_destroy(MemoryRegionCache *cache)
   */
  static inline MemoryRegion *address_space_translate_cached(
      MemoryRegionCache *cache, hwaddr addr, hwaddr *xlat,
 -    hwaddr *plen, bool is_write)
 +    hwaddr *plen, bool is_write, MemTxAttrs attrs)
  {
      MemoryRegionSection section;
      MemoryRegion *mr;
@@ -XXX,XX +XXX,XX @@ address_space_read_cached_slow(MemoryRegionCache *cache, hwaddr addr,
      MemoryRegion *mr;
      l = len;
 -    mr = address_space_translate_cached(cache, addr, &addr1, &l, false);
 +    mr = address_space_translate_cached(cache, addr, &addr1, &l, false,
 +                                        MEMTXATTRS_UNSPECIFIED);
      flatview_read_continue(cache->fv,
                             addr, MEMTXATTRS_UNSPECIFIED, buf, len,
                             addr1, l, mr);
@@ -XXX,XX +XXX,XX @@ address_space_write_cached_slow(MemoryRegionCache *cache, hwaddr addr,
      MemoryRegion *mr;
      l = len;
 -    mr = address_space_translate_cached(cache, addr, &addr1, &l, true);
 +    mr = address_space_translate_cached(cache, addr, &addr1, &l, true,
 +                                        MEMTXATTRS_UNSPECIFIED);
      flatview_write_continue(cache->fv,
                              addr, MEMTXATTRS_UNSPECIFIED, buf, len,
                              addr1, l, mr);
@@ -XXX,XX +XXX,XX @@ bool cpu_physical_memory_is_io(hwaddr phys_addr)
      rcu_read_lock();
      mr = address_space_translate(&address_space_memory,
 -                                 phys_addr, &phys_addr, &l, false);
 +                                 phys_addr, &phys_addr, &l, false,
 +                                 MEMTXATTRS_UNSPECIFIED);
      res = !(memory_region_is_ram(mr) || memory_region_is_romd(mr));
      rcu_read_unlock();
 diff --git a/hw/vfio/common.c b/hw/vfio/common.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/vfio/common.c
 +++ b/hw/vfio/common.c
@@ -XXX,XX +XXX,XX @@ static bool vfio_get_vaddr(IOMMUTLBEntry *iotlb, void **vaddr,
       */
      mr = address_space_translate(&address_space_memory,
                                   iotlb->translated_addr,
 -                                 &xlat, &len, writable);
 +                                 &xlat, &len, writable,
 +                                 MEMTXATTRS_UNSPECIFIED);
      if (!memory_region_is_ram(mr)) {
          error_report("iommu map to non memory area %"HWADDR_PRIx"",
                       xlat);
 diff --git a/memory_ldst.inc.c b/memory_ldst.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/memory_ldst.inc.c
 +++ b/memory_ldst.inc.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t glue(address_space_ldl_internal, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, false);
 +    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
      if (l < 4 || !IS_DIRECT(mr, false)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ static inline uint64_t glue(address_space_ldq_internal, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, false);
 +    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
      if (l < 8 || !IS_DIRECT(mr, false)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ uint32_t glue(address_space_ldub, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, false);
 +    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
      if (!IS_DIRECT(mr, false)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ static inline uint32_t glue(address_space_lduw_internal, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, false);
 +    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
      if (l < 2 || !IS_DIRECT(mr, false)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ void glue(address_space_stl_notdirty, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, true);
 +    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
      if (l < 4 || !IS_DIRECT(mr, true)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ static inline void glue(address_space_stl_internal, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, true);
 +    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
      if (l < 4 || !IS_DIRECT(mr, true)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ void glue(address_space_stb, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, true);
 +    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
      if (!IS_DIRECT(mr, true)) {
          release_lock |= prepare_mmio_access(mr);
          r = memory_region_dispatch_write(mr, addr1, val, 1, attrs);
@@ -XXX,XX +XXX,XX @@ static inline void glue(address_space_stw_internal, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, true);
 +    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
      if (l < 2 || !IS_DIRECT(mr, true)) {
          release_lock |= prepare_mmio_access(mr);
@@ -XXX,XX +XXX,XX @@ static void glue(address_space_stq_internal, SUFFIX)(ARG1_DECL,
      bool release_lock = false;
      RCU_READ_LOCK();
 -    mr = TRANSLATE(addr, &addr1, &l, true);
 +    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
      if (l < 8 || !IS_DIRECT(mr, true)) {
          release_lock |= prepare_mmio_access(mr);
 diff --git a/target/riscv/helper.c b/target/riscv/helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.c
 +++ b/target/riscv/helper.c
@@ -XXX,XX +XXX,XX @@ restart:
                  MemoryRegion *mr;
                  hwaddr l = sizeof(target_ulong), addr1;
                  mr = address_space_translate(cs->as, pte_addr,
 -                    &addr1, &l, false);
 +                    &addr1, &l, false, MEMTXATTRS_UNSPECIFIED);
                  if (memory_access_is_direct(mr, true)) {
                      target_ulong *pte_pa =
                          qemu_map_ram_ptr(mr->ram_block, addr1);
 --
 .17.1

-[Qemu-devel] [PULL 01/21] hw/arm/iotkit.c: fix minor memory leak
+[Qemu-devel] [PULL 13/25] Make address_space_map() take a MemTxAttrs argument
-Coverity (CID1390573) spots that we forgot to free the
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
-gpioname strings in a loop in the iotkit realize function.
+add MemTxAttrs as an argument to address_space_map().
-Correct the error.
+Its callers either have an attrs value to hand, or don't care
+and can use MEMTXATTRS_UNSPECIFIED.
 This isn't a significant leak, because this function
 only ever runs once.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-Reviewed-by: Peter Xu <peterx@redhat.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180427110137.19304-1-peter.maydell@linaro.org
+Message-id: 20180521140402.23318-5-peter.maydell@linaro.org
 ---
- hw/arm/iotkit.c | 1 +
+ include/exec/memory.h   | 3 ++-
-file changed, 1 insertion(+)
+ include/sysemu/dma.h    | 3 ++-
  exec.c                  | 6 ++++--
  target/ppc/mmu-hash64.c | 3 ++-
 files changed, 10 insertions(+), 5 deletions(-)
-diff --git a/hw/arm/iotkit.c b/hw/arm/iotkit.c
+diff --git a/include/exec/memory.h b/include/exec/memory.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/iotkit.c
+--- a/include/exec/memory.h
-+++ b/hw/arm/iotkit.c
++++ b/include/exec/memory.h
-@@ -XXX,XX +XXX,XX @@ static void iotkit_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@ bool address_space_access_valid(AddressSpace *as, hwaddr addr, int len, bool is_
-                               qdev_get_gpio_in(DEVICE(&s->ppc_irq_orgate), i));
+  * @addr: address within that address space
-         qdev_connect_gpio_out_named(DEVICE(ppc), "irq", 0,
+  * @plen: pointer to length of buffer; updated on return
-                                     qdev_get_gpio_in(devs, 0));
+  * @is_write: indicates the transfer direction
-+        g_free(gpioname);
++ * @attrs: memory attributes
   */
  void *address_space_map(AddressSpace *as, hwaddr addr,
 -                        hwaddr *plen, bool is_write);
 +                        hwaddr *plen, bool is_write, MemTxAttrs attrs);
  /* address_space_unmap: Unmaps a memory region previously mapped by address_space_map()
   *
 diff --git a/include/sysemu/dma.h b/include/sysemu/dma.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/sysemu/dma.h
 +++ b/include/sysemu/dma.h
@@ -XXX,XX +XXX,XX @@ static inline void *dma_memory_map(AddressSpace *as,
      hwaddr xlen = *len;
      void *p;
 -    p = address_space_map(as, addr, &xlen, dir == DMA_DIRECTION_FROM_DEVICE);
 +    p = address_space_map(as, addr, &xlen, dir == DMA_DIRECTION_FROM_DEVICE,
 +                          MEMTXATTRS_UNSPECIFIED);
      *len = xlen;
      return p;
  }
 diff --git a/exec.c b/exec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/exec.c
 +++ b/exec.c
@@ -XXX,XX +XXX,XX @@ flatview_extend_translation(FlatView *fv, hwaddr addr,
  void *address_space_map(AddressSpace *as,
                          hwaddr addr,
                          hwaddr *plen,
 -                        bool is_write)
 +                        bool is_write,
 +                        MemTxAttrs attrs)
  {
      hwaddr len = *plen;
      hwaddr l, xlat;
@@ -XXX,XX +XXX,XX @@ void *cpu_physical_memory_map(hwaddr addr,
                                hwaddr *plen,
                                int is_write)
  {
 -    return address_space_map(&address_space_memory, addr, plen, is_write);
 +    return address_space_map(&address_space_memory, addr, plen, is_write,
 +                             MEMTXATTRS_UNSPECIFIED);
  }
  void cpu_physical_memory_unmap(void *buffer, hwaddr len,
 diff --git a/target/ppc/mmu-hash64.c b/target/ppc/mmu-hash64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/ppc/mmu-hash64.c
 +++ b/target/ppc/mmu-hash64.c
@@ -XXX,XX +XXX,XX @@ const ppc_hash_pte64_t *ppc_hash64_map_hptes(PowerPCCPU *cpu,
          return NULL;
      }
-     iotkit_forward_sec_resp_cfg(s);
+-    hptes = address_space_map(CPU(cpu)->as, base + pte_offset, &plen, false);
 +    hptes = address_space_map(CPU(cpu)->as, base + pte_offset, &plen, false,
 +                              MEMTXATTRS_UNSPECIFIED);
      if (plen < (n * HASH_PTE_SIZE_64)) {
          hw_error("%s: Unable to map all requested HPTEs\n", __func__);
      }
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 16/21] target/arm: Implement CAS and CASP
+[Qemu-devel] [PULL 14/25] Make address_space_access_valid() take a MemTxAttrs argument
-From: Richard Henderson <richard.henderson@linaro.org>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to address_space_access_valid().
 Its callers either have an attrs value to hand, or don't care
 and can use MEMTXATTRS_UNSPECIFIED.
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180508151437.4232-10-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20180521140402.23318-6-peter.maydell@linaro.org
 ---
- target/arm/helper-a64.h    |   2 +
+ include/exec/memory.h      | 4 +++-
- target/arm/helper-a64.c    |  43 ++++++++++++++
+ include/sysemu/dma.h       | 3 ++-
- target/arm/translate-a64.c | 119 ++++++++++++++++++++++++++++++++++++-
+ exec.c                     | 3 ++-
-files changed, 161 insertions(+), 3 deletions(-)
+ target/s390x/diag.c        | 6 ++++--
  target/s390x/excp_helper.c | 3 ++-
  target/s390x/mmu_helper.c  | 3 ++-
  target/s390x/sigp.c        | 3 ++-
 files changed, 17 insertions(+), 8 deletions(-)
-diff --git a/target/arm/helper-a64.h b/target/arm/helper-a64.h
+diff --git a/include/exec/memory.h b/include/exec/memory.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.h
+--- a/include/exec/memory.h
-+++ b/target/arm/helper-a64.h
++++ b/include/exec/memory.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(paired_cmpxchg64_le_parallel, TCG_CALL_NO_WG,
+@@ -XXX,XX +XXX,XX @@ static inline MemoryRegion *address_space_translate(AddressSpace *as,
- DEF_HELPER_FLAGS_4(paired_cmpxchg64_be, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
+  * @addr: address within that address space
- DEF_HELPER_FLAGS_4(paired_cmpxchg64_be_parallel, TCG_CALL_NO_WG,
+  * @len: length of the area to be checked
-                    i64, env, i64, i64, i64)
+  * @is_write: indicates the transfer direction
-+DEF_HELPER_5(casp_le_parallel, void, env, i32, i64, i64, i64)
++ * @attrs: memory attributes
-+DEF_HELPER_5(casp_be_parallel, void, env, i32, i64, i64, i64)
+  */
- DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+-bool address_space_access_valid(AddressSpace *as, hwaddr addr, int len, bool is_write);
- DEF_HELPER_FLAGS_3(advsimd_minh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
++bool address_space_access_valid(AddressSpace *as, hwaddr addr, int len,
- DEF_HELPER_FLAGS_3(advsimd_maxnumh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
++                                bool is_write, MemTxAttrs attrs);
-diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
  /* address_space_map: map a physical memory region into a host virtual address
   *
 diff --git a/include/sysemu/dma.h b/include/sysemu/dma.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.c
+--- a/include/sysemu/dma.h
-+++ b/target/arm/helper-a64.c
++++ b/include/sysemu/dma.h
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(paired_cmpxchg64_be_parallel)(CPUARMState *env, uint64_t addr,
+@@ -XXX,XX +XXX,XX @@ static inline bool dma_memory_valid(AddressSpace *as,
-     return do_paired_cmpxchg64_be(env, addr, new_lo, new_hi, true, GETPC());
+                                     DMADirection dir)
  {
      return address_space_access_valid(as, addr, len,
 -                                      dir == DMA_DIRECTION_FROM_DEVICE);
 +                                      dir == DMA_DIRECTION_FROM_DEVICE,
 +                                      MEMTXATTRS_UNSPECIFIED);
  }
-+/* Writes back the old data into Rs.  */
+ static inline int dma_memory_rw_relaxed(AddressSpace *as, dma_addr_t addr,
-+void HELPER(casp_le_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
+diff --git a/exec.c b/exec.c
 +                              uint64_t new_lo, uint64_t new_hi)
 +{
 +    uintptr_t ra = GETPC();
 +#ifndef CONFIG_ATOMIC128
 +    cpu_loop_exit_atomic(ENV_GET_CPU(env), ra);
 +#else
 +    Int128 oldv, cmpv, newv;
 +
 +    cmpv = int128_make128(env->xregs[rs], env->xregs[rs + 1]);
 +    newv = int128_make128(new_lo, new_hi);
 +
 +    int mem_idx = cpu_mmu_index(env, false);
 +    TCGMemOpIdx oi = make_memop_idx(MO_LEQ | MO_ALIGN_16, mem_idx);
 +    oldv = helper_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv, oi, ra);
 +
 +    env->xregs[rs] = int128_getlo(oldv);
 +    env->xregs[rs + 1] = int128_gethi(oldv);
 +#endif
 +}
 +
 +void HELPER(casp_be_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
 +                              uint64_t new_hi, uint64_t new_lo)
 +{
 +    uintptr_t ra = GETPC();
 +#ifndef CONFIG_ATOMIC128
 +    cpu_loop_exit_atomic(ENV_GET_CPU(env), ra);
 +#else
 +    Int128 oldv, cmpv, newv;
 +
 +    cmpv = int128_make128(env->xregs[rs + 1], env->xregs[rs]);
 +    newv = int128_make128(new_lo, new_hi);
 +
 +    int mem_idx = cpu_mmu_index(env, false);
 +    TCGMemOpIdx oi = make_memop_idx(MO_LEQ | MO_ALIGN_16, mem_idx);
 +    oldv = helper_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
 +
 +    env->xregs[rs + 1] = int128_getlo(oldv);
 +    env->xregs[rs] = int128_gethi(oldv);
 +#endif
 +}
 +
  /*
   * AdvSIMD half-precision
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/exec.c
-+++ b/target/arm/translate-a64.c
++++ b/exec.c
-@@ -XXX,XX +XXX,XX @@ static void gen_store_exclusive(DisasContext *s, int rd, int rt, int rt2,
+@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
      tcg_gen_movi_i64(cpu_exclusive_addr, -1);
  }
-+static void gen_compare_and_swap(DisasContext *s, int rs, int rt,
+ bool address_space_access_valid(AddressSpace *as, hwaddr addr,
-+                                 int rn, int size)
+-                                int len, bool is_write)
-+{
++                                int len, bool is_write,
-+    TCGv_i64 tcg_rs = cpu_reg(s, rs);
++                                MemTxAttrs attrs)
-+    TCGv_i64 tcg_rt = cpu_reg(s, rt);
+ {
-+    int memidx = get_mem_index(s);
+     FlatView *fv;
-+    TCGv_i64 addr = cpu_reg_sp(s, rn);
+     bool result;
-+
+diff --git a/target/s390x/diag.c b/target/s390x/diag.c
-+    if (rn == 31) {
+index XXXXXXX..XXXXXXX 100644
-+        gen_check_sp_alignment(s);
+--- a/target/s390x/diag.c
-+    }
++++ b/target/s390x/diag.c
-+    tcg_gen_atomic_cmpxchg_i64(tcg_rs, addr, tcg_rs, tcg_rt, memidx,
+@@ -XXX,XX +XXX,XX @@ void handle_diag_308(CPUS390XState *env, uint64_t r1, uint64_t r3, uintptr_t ra)
 +                               size | MO_ALIGN | s->be_data);
 +}
 +
 +static void gen_compare_and_swap_pair(DisasContext *s, int rs, int rt,
 +                                      int rn, int size)
 +{
 +    TCGv_i64 s1 = cpu_reg(s, rs);
 +    TCGv_i64 s2 = cpu_reg(s, rs + 1);
 +    TCGv_i64 t1 = cpu_reg(s, rt);
 +    TCGv_i64 t2 = cpu_reg(s, rt + 1);
 +    TCGv_i64 addr = cpu_reg_sp(s, rn);
 +    int memidx = get_mem_index(s);
 +
 +    if (rn == 31) {
 +        gen_check_sp_alignment(s);
 +    }
 +
 +    if (size == 2) {
 +        TCGv_i64 cmp = tcg_temp_new_i64();
 +        TCGv_i64 val = tcg_temp_new_i64();
 +
 +        if (s->be_data == MO_LE) {
 +            tcg_gen_concat32_i64(val, t1, t2);
 +            tcg_gen_concat32_i64(cmp, s1, s2);
 +        } else {
 +            tcg_gen_concat32_i64(val, t2, t1);
 +            tcg_gen_concat32_i64(cmp, s2, s1);
 +        }
 +
 +        tcg_gen_atomic_cmpxchg_i64(cmp, addr, cmp, val, memidx,
 +                                   MO_64 | MO_ALIGN | s->be_data);
 +        tcg_temp_free_i64(val);
 +
 +        if (s->be_data == MO_LE) {
 +            tcg_gen_extr32_i64(s1, s2, cmp);
 +        } else {
 +            tcg_gen_extr32_i64(s2, s1, cmp);
 +        }
 +        tcg_temp_free_i64(cmp);
 +    } else if (tb_cflags(s->base.tb) & CF_PARALLEL) {
 +        TCGv_i32 tcg_rs = tcg_const_i32(rs);
 +
 +        if (s->be_data == MO_LE) {
 +            gen_helper_casp_le_parallel(cpu_env, tcg_rs, addr, t1, t2);
 +        } else {
 +            gen_helper_casp_be_parallel(cpu_env, tcg_rs, addr, t1, t2);
 +        }
 +        tcg_temp_free_i32(tcg_rs);
 +    } else {
 +        TCGv_i64 d1 = tcg_temp_new_i64();
 +        TCGv_i64 d2 = tcg_temp_new_i64();
 +        TCGv_i64 a2 = tcg_temp_new_i64();
 +        TCGv_i64 c1 = tcg_temp_new_i64();
 +        TCGv_i64 c2 = tcg_temp_new_i64();
 +        TCGv_i64 zero = tcg_const_i64(0);
 +
 +        /* Load the two words, in memory order.  */
 +        tcg_gen_qemu_ld_i64(d1, addr, memidx,
 +                            MO_64 | MO_ALIGN_16 | s->be_data);
 +        tcg_gen_addi_i64(a2, addr, 8);
 +        tcg_gen_qemu_ld_i64(d2, addr, memidx, MO_64 | s->be_data);
 +
 +        /* Compare the two words, also in memory order.  */
 +        tcg_gen_setcond_i64(TCG_COND_EQ, c1, d1, s1);
 +        tcg_gen_setcond_i64(TCG_COND_EQ, c2, d2, s2);
 +        tcg_gen_and_i64(c2, c2, c1);
 +
 +        /* If compare equal, write back new data, else write back old data.  */
 +        tcg_gen_movcond_i64(TCG_COND_NE, c1, c2, zero, t1, d1);
 +        tcg_gen_movcond_i64(TCG_COND_NE, c2, c2, zero, t2, d2);
 +        tcg_gen_qemu_st_i64(c1, addr, memidx, MO_64 | s->be_data);
 +        tcg_gen_qemu_st_i64(c2, a2, memidx, MO_64 | s->be_data);
 +        tcg_temp_free_i64(a2);
 +        tcg_temp_free_i64(c1);
 +        tcg_temp_free_i64(c2);
 +        tcg_temp_free_i64(zero);
 +
 +        /* Write back the data from memory to Rs.  */
 +        tcg_gen_mov_i64(s1, d1);
 +        tcg_gen_mov_i64(s2, d2);
 +        tcg_temp_free_i64(d1);
 +        tcg_temp_free_i64(d2);
 +    }
 +}
 +
  /* Update the Sixty-Four bit (SF) registersize. This logic is derived
   * from the ARMv8 specs for LDR (Shared decode for all encodings).
   */
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_excl(DisasContext *s, uint32_t insn)
              gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, true);
              return;
          }
--        /* CASP / CASPL */
+         if (!address_space_access_valid(&address_space_memory, addr,
-+        if (rt2 == 31
+-                                        sizeof(IplParameterBlock), false)) {
-+            && ((rt | rs) & 1) == 0
++                                        sizeof(IplParameterBlock), false,
-+            && arm_dc_feature(s, ARM_FEATURE_V8_ATOMICS)) {
++                                        MEMTXATTRS_UNSPECIFIED)) {
-+            /* CASP / CASPL */
+             s390_program_interrupt(env, PGM_ADDRESSING, ILEN_AUTO, ra);
 +            gen_compare_and_swap_pair(s, rs, rt, rn, size | 2);
 +            return;
 +        }
          break;
 -    case 0x6: case 0x7: /* CASP / LDXP */
 +    case 0x6: case 0x7: /* CASPA / LDXP */
          if (size & 2) { /* LDXP / LDAXP */
              if (rn == 31) {
                  gen_check_sp_alignment(s);
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_excl(DisasContext *s, uint32_t insn)
              }
              return;
          }
--        /* CASPA / CASPAL */
+@@ -XXX,XX +XXX,XX @@ out:
-+        if (rt2 == 31
+             return;
-+            && ((rt | rs) & 1) == 0
+         }
-+            && arm_dc_feature(s, ARM_FEATURE_V8_ATOMICS)) {
+         if (!address_space_access_valid(&address_space_memory, addr,
-+            /* CASPA / CASPAL */
+-                                        sizeof(IplParameterBlock), true)) {
-+            gen_compare_and_swap_pair(s, rs, rt, rn, size | 2);
++                                        sizeof(IplParameterBlock), true,
-+            return;
++                                        MEMTXATTRS_UNSPECIFIED)) {
-+        }
+             s390_program_interrupt(env, PGM_ADDRESSING, ILEN_AUTO, ra);
-         break;
+             return;
+         }
-     case 0xa: /* CAS */
+diff --git a/target/s390x/excp_helper.c b/target/s390x/excp_helper.c
-     case 0xb: /* CASL */
+index XXXXXXX..XXXXXXX 100644
-     case 0xe: /* CASA */
+--- a/target/s390x/excp_helper.c
-     case 0xf: /* CASAL */
++++ b/target/s390x/excp_helper.c
-+        if (rt2 == 31 && arm_dc_feature(s, ARM_FEATURE_V8_ATOMICS)) {
+@@ -XXX,XX +XXX,XX @@ int s390_cpu_handle_mmu_fault(CPUState *cs, vaddr orig_vaddr, int size,
-+            gen_compare_and_swap(s, rs, rt, rn, size);
-+            return;
+     /* check out of RAM access */
-+        }
+     if (!address_space_access_valid(&address_space_memory, raddr,
-         break;
+-                                    TARGET_PAGE_SIZE, rw)) {
 +                                    TARGET_PAGE_SIZE, rw,
 +                                    MEMTXATTRS_UNSPECIFIED)) {
          DPRINTF("%s: raddr %" PRIx64 " > ram_size %" PRIx64 "\n", __func__,
                  (uint64_t)raddr, (uint64_t)ram_size);
          trigger_pgm_exception(env, PGM_ADDRESSING, ILEN_AUTO);
 diff --git a/target/s390x/mmu_helper.c b/target/s390x/mmu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/mmu_helper.c
 +++ b/target/s390x/mmu_helper.c
@@ -XXX,XX +XXX,XX @@ static int translate_pages(S390CPU *cpu, vaddr addr, int nr_pages,
              return ret;
          }
          if (!address_space_access_valid(&address_space_memory, pages[i],
 -                                        TARGET_PAGE_SIZE, is_write)) {
 +                                        TARGET_PAGE_SIZE, is_write,
 +                                        MEMTXATTRS_UNSPECIFIED)) {
              trigger_access_exception(env, PGM_ADDRESSING, ILEN_AUTO, 0);
              return -EFAULT;
          }
 diff --git a/target/s390x/sigp.c b/target/s390x/sigp.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/sigp.c
 +++ b/target/s390x/sigp.c
@@ -XXX,XX +XXX,XX @@ static void sigp_set_prefix(CPUState *cs, run_on_cpu_data arg)
      cpu_synchronize_state(cs);
      if (!address_space_access_valid(&address_space_memory, addr,
 -                                    sizeof(struct LowCore), false)) {
 +                                    sizeof(struct LowCore), false,
 +                                    MEMTXATTRS_UNSPECIFIED)) {
          set_sigp_status(si, SIGP_STAT_INVALID_PARAMETER);
          return;
      }
-     unallocated_encoding(s);
 --
-.17.0
+.17.1

-New patch
+[Qemu-devel] [PULL 15/25] Make flatview_extend_translation() take a MemTxAttrs argument
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
+add MemTxAttrs as an argument to flatview_extend_translation().
+Its callers either have an attrs value to hand, or don't care
+and can use MEMTXATTRS_UNSPECIFIED.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20180521140402.23318-7-peter.maydell@linaro.org
+---
+ exec.c | 15 ++++++++++-----
+file changed, 10 insertions(+), 5 deletions(-)
+diff --git a/exec.c b/exec.c
+index XXXXXXX..XXXXXXX 100644
+--- a/exec.c
++++ b/exec.c
+@@ -XXX,XX +XXX,XX @@ bool address_space_access_valid(AddressSpace *as, hwaddr addr,
+ static hwaddr
+ flatview_extend_translation(FlatView *fv, hwaddr addr,
+-                                 hwaddr target_len,
+-                                 MemoryRegion *mr, hwaddr base, hwaddr len,
+-                                 bool is_write)
++                            hwaddr target_len,
++                            MemoryRegion *mr, hwaddr base, hwaddr len,
++                            bool is_write, MemTxAttrs attrs)
+ {
+     hwaddr done = 0;
+     hwaddr xlat;
+@@ -XXX,XX +XXX,XX @@ void *address_space_map(AddressSpace *as,
+     memory_region_ref(mr);
+     *plen = flatview_extend_translation(fv, addr, len, mr, xlat,
+-                                             l, is_write);
++                                        l, is_write, attrs);
+     ptr = qemu_ram_ptr_length(mr->ram_block, xlat, plen, true);
+     rcu_read_unlock();
+@@ -XXX,XX +XXX,XX @@ int64_t address_space_cache_init(MemoryRegionCache *cache,
+     mr = cache->mrs.mr;
+     memory_region_ref(mr);
+     if (memory_access_is_direct(mr, is_write)) {
++        /* We don't care about the memory attributes here as we're only
++         * doing this if we found actual RAM, which behaves the same
++         * regardless of attributes; so UNSPECIFIED is fine.
++         */
+         l = flatview_extend_translation(cache->fv, addr, len, mr,
+-                                        cache->xlat, l, is_write);
++                                        cache->xlat, l, is_write,
++                                        MEMTXATTRS_UNSPECIFIED);
+         cache->ptr = qemu_ram_ptr_length(mr->ram_block, cache->xlat, &l, true);
+     } else {
+         cache->ptr = NULL;
+--
+.17.1

-[Qemu-devel] [PULL 13/21] target/riscv: Use new atomic min/max expanders
+[Qemu-devel] [PULL 16/25] Make memory_region_access_valid() take a MemTxAttrs argument
-From: Richard Henderson <richard.henderson@linaro.org>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to memory_region_access_valid().
 Its callers either have an attrs value to hand, or don't care
 and can use MEMTXATTRS_UNSPECIFIED.
-Reviewed-by: Michael Clark <mjc@sifive.com>
+The callsite in flatview_access_valid() is part of a recursive
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+loop flatview_access_valid() -> memory_region_access_valid() ->
-Message-id: 20180508151437.4232-7-richard.henderson@linaro.org
+ subpage_accepts() -> flatview_access_valid(); we make it pass
 MEMTXATTRS_UNSPECIFIED for now, until the next several commits
 have plumbed an attrs parameter through the rest of the loop
 and we can add an attrs parameter to flatview_access_valid().
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20180521140402.23318-8-peter.maydell@linaro.org
 ---
- target/riscv/translate.c | 72 +++++++++++-----------------------------
+ include/exec/memory-internal.h | 3 ++-
-file changed, 20 insertions(+), 52 deletions(-)
+ exec.c                         | 4 +++-
  hw/s390x/s390-pci-inst.c       | 3 ++-
  memory.c                       | 7 ++++---
 files changed, 11 insertions(+), 6 deletions(-)
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+diff --git a/include/exec/memory-internal.h b/include/exec/memory-internal.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/include/exec/memory-internal.h
-+++ b/target/riscv/translate.c
++++ b/include/exec/memory-internal.h
-@@ -XXX,XX +XXX,XX @@ static void gen_atomic(DisasContext *ctx, uint32_t opc,
+@@ -XXX,XX +XXX,XX @@ void flatview_unref(FlatView *view);
-     TCGv src1, src2, dat;
+ extern const MemoryRegionOps unassigned_mem_ops;
-     TCGLabel *l1, *l2;
-     TCGMemOp mop;
+ bool memory_region_access_valid(MemoryRegion *mr, hwaddr addr,
--    TCGCond cond;
+-                                unsigned size, bool is_write);
-     bool aq, rl;
++                                unsigned size, bool is_write,
++                                MemTxAttrs attrs);
-     /* Extract the size of the atomic operation.  */
-@@ -XXX,XX +XXX,XX @@ static void gen_atomic(DisasContext *ctx, uint32_t opc,
+ void flatview_add_to_dispatch(FlatView *fv, MemoryRegionSection *section);
-         tcg_gen_atomic_fetch_or_tl(src2, src1, src2, ctx->mem_idx, mop);
+ AddressSpaceDispatch *address_space_dispatch_new(FlatView *fv);
-         gen_set_gpr(rd, src2);
+diff --git a/exec.c b/exec.c
-         break;
+index XXXXXXX..XXXXXXX 100644
--
+--- a/exec.c
-     case OPC_RISC_AMOMIN:
++++ b/exec.c
--        cond = TCG_COND_LT;
+@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
--        goto do_minmax;
+         mr = flatview_translate(fv, addr, &xlat, &l, is_write);
--    case OPC_RISC_AMOMAX:
+         if (!memory_access_is_direct(mr, is_write)) {
--        cond = TCG_COND_GT;
+             l = memory_access_size(mr, l, addr);
--        goto do_minmax;
+-            if (!memory_region_access_valid(mr, xlat, l, is_write)) {
--    case OPC_RISC_AMOMINU:
++            /* When our callers all have attrs we'll pass them through here */
--        cond = TCG_COND_LTU;
++            if (!memory_region_access_valid(mr, xlat, l, is_write,
--        goto do_minmax;
++                                            MEMTXATTRS_UNSPECIFIED)) {
--    case OPC_RISC_AMOMAXU:
+                 return false;
--        cond = TCG_COND_GTU;
+             }
--        goto do_minmax;
+         }
--    do_minmax:
+diff --git a/hw/s390x/s390-pci-inst.c b/hw/s390x/s390-pci-inst.c
--        /* Handle the RL barrier.  The AQ barrier is handled along the
+index XXXXXXX..XXXXXXX 100644
--           parallel path by the SC atomic cmpxchg.  On the serial path,
+--- a/hw/s390x/s390-pci-inst.c
--           of course, barriers do not matter.  */
++++ b/hw/s390x/s390-pci-inst.c
--        if (rl) {
+@@ -XXX,XX +XXX,XX @@ int pcistb_service_call(S390CPU *cpu, uint8_t r1, uint8_t r3, uint64_t gaddr,
--            tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
+     mr = s390_get_subregion(mr, offset, len);
--        }
+     offset -= mr->addr;
--        if (tb_cflags(ctx->tb) & CF_PARALLEL) {
--            l1 = gen_new_label();
+-    if (!memory_region_access_valid(mr, offset, len, true)) {
--            gen_set_label(l1);
++    if (!memory_region_access_valid(mr, offset, len, true,
--        } else {
++                                    MEMTXATTRS_UNSPECIFIED)) {
--            l1 = NULL;
+         s390_program_interrupt(env, PGM_OPERAND, 6, ra);
--        }
+         return 0;
--
+     }
-         gen_get_gpr(src1, rs1);
+diff --git a/memory.c b/memory.c
-         gen_get_gpr(src2, rs2);
+index XXXXXXX..XXXXXXX 100644
--        if ((mop & MO_SSIZE) == MO_SL) {
+--- a/memory.c
--            /* Sign-extend the register comparison input.  */
++++ b/memory.c
--            tcg_gen_ext32s_tl(src2, src2);
+@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps ram_device_mem_ops = {
--        }
+ bool memory_region_access_valid(MemoryRegion *mr,
--        dat = tcg_temp_local_new();
+                                 hwaddr addr,
--        tcg_gen_qemu_ld_tl(dat, src1, ctx->mem_idx, mop);
+                                 unsigned size,
--        tcg_gen_movcond_tl(cond, src2, dat, src2, dat, src2);
+-                                bool is_write)
--
++                                bool is_write,
--        if (tb_cflags(ctx->tb) & CF_PARALLEL) {
++                                MemTxAttrs attrs)
--            /* Parallel context.  Make this operation atomic by verifying
+ {
--               that the memory didn't change while we computed the result.  */
+     int access_size_min, access_size_max;
--            tcg_gen_atomic_cmpxchg_tl(src2, src1, dat, src2, ctx->mem_idx, mop);
+     int access_size, i;
--
+@@ -XXX,XX +XXX,XX @@ MemTxResult memory_region_dispatch_read(MemoryRegion *mr,
--            /* If the cmpxchg failed, retry. */
+ {
--            /* ??? There is an assumption here that this will eventually
+     MemTxResult r;
--               succeed, such that we don't live-lock.  This is not unlike
--               a similar loop that the compiler would generate for e.g.
+-    if (!memory_region_access_valid(mr, addr, size, false)) {
--               __atomic_fetch_and_xor, so don't worry about it.  */
++    if (!memory_region_access_valid(mr, addr, size, false, attrs)) {
--            tcg_gen_brcond_tl(TCG_COND_NE, dat, src2, l1);
+         *pval = unassigned_mem_read(mr, addr, size);
--        } else {
+         return MEMTX_DECODE_ERROR;
--            /* Serial context.  Directly store the result.  */
+     }
--            tcg_gen_qemu_st_tl(src2, src1, ctx->mem_idx, mop);
+@@ -XXX,XX +XXX,XX @@ MemTxResult memory_region_dispatch_write(MemoryRegion *mr,
--        }
+                                          unsigned size,
--        gen_set_gpr(rd, dat);
+                                          MemTxAttrs attrs)
--        tcg_temp_free(dat);
+ {
-+        tcg_gen_atomic_fetch_smin_tl(src2, src1, src2, ctx->mem_idx, mop);
+-    if (!memory_region_access_valid(mr, addr, size, true)) {
-+        gen_set_gpr(rd, src2);
++    if (!memory_region_access_valid(mr, addr, size, true, attrs)) {
-+        break;
+         unassigned_mem_write(mr, addr, data, size);
-+    case OPC_RISC_AMOMAX:
+         return MEMTX_DECODE_ERROR;
-+        gen_get_gpr(src1, rs1);
+     }
 +        gen_get_gpr(src2, rs2);
 +        tcg_gen_atomic_fetch_smax_tl(src2, src1, src2, ctx->mem_idx, mop);
 +        gen_set_gpr(rd, src2);
 +        break;
 +    case OPC_RISC_AMOMINU:
 +        gen_get_gpr(src1, rs1);
 +        gen_get_gpr(src2, rs2);
 +        tcg_gen_atomic_fetch_umin_tl(src2, src1, src2, ctx->mem_idx, mop);
 +        gen_set_gpr(rd, src2);
 +        break;
 +    case OPC_RISC_AMOMAXU:
 +        gen_get_gpr(src1, rs1);
 +        gen_get_gpr(src2, rs2);
 +        tcg_gen_atomic_fetch_umax_tl(src2, src1, src2, ctx->mem_idx, mop);
 +        gen_set_gpr(rd, src2);
          break;
      default:
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 04/21] platform-bus-device: use device plug callback instead of machine_done notifier
+[Qemu-devel] [PULL 17/25] Make MemoryRegion valid.accepts callback take a MemTxAttrs argument
-From: Igor Mammedov <imammedo@redhat.com>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to the MemoryRegion valid.accepts
 callback. We'll need this for subpage_accepts().
-platform-bus were using machine_done notifier to get and map
+We could take the approach we used with the read and write
-(assign irq/mmio resources) dynamically added sysbus devices
+callbacks and add new a new _with_attrs version, but since there
-after all '-device' options had been processed.
+are so few implementations of the accepts hook we just change
-That however creates non obvious dependencies on ordering of
+them all.
 machine_done notifiers and requires carefull line juggling
 to keep it working. For example see comment above
 create_platform_bus() and 'straitforward' arm_load_kernel()
 had to converted to machine_done notifier and that lead to
 yet another machine_done notifier to keep it working
 arm_register_platform_bus_fdt_creator().
-Instead of hiding resource assignment in platform-bus-device
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-to magically initialize sysbus devices, use device plug
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-callback and assign resources explicitly at board level
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-at the moment each -device option is being processed.
+Message-id: 20180521140402.23318-9-peter.maydell@linaro.org
 ---
  include/exec/memory.h |  3 ++-
  exec.c                |  9 ++++++---
  hw/hppa/dino.c        |  3 ++-
  hw/nvram/fw_cfg.c     | 12 ++++++++----
  hw/scsi/esp.c         |  3 ++-
  hw/xen/xen_pt_msi.c   |  3 ++-
  memory.c              |  5 +++--
 files changed, 25 insertions(+), 13 deletions(-)
-That adds a bunch of machine declaration boiler plate to
+diff --git a/include/exec/memory.h b/include/exec/memory.h
 e500plat board, similar to ARM/x86 but gets rid of hidden
 machine_done notifier and would allow to remove the dependent
 notifiers in ARM code simplifying it and making code flow
 easier to follow.
 Signed-off-by: Igor Mammedov <imammedo@redhat.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Acked-by: David Gibson <david@gibson.dropbear.id.au>
 Message-id: 1525691524-32265-3-git-send-email-imammedo@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  hw/ppc/e500.h             |  5 +++++
  include/hw/arm/virt.h     |  1 +
  include/hw/platform-bus.h |  4 ++--
  hw/arm/sysbus-fdt.c       |  3 ---
  hw/arm/virt.c             | 31 +++++++++++++++++++++++++++++++
  hw/core/platform-bus.c    | 29 +++++------------------------
  hw/ppc/e500.c             | 38 +++++++++++++++++---------------------
  hw/ppc/e500plat.c         | 31 +++++++++++++++++++++++++++++++
 files changed, 92 insertions(+), 50 deletions(-)
 diff --git a/hw/ppc/e500.h b/hw/ppc/e500.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/ppc/e500.h
+--- a/include/exec/memory.h
-+++ b/hw/ppc/e500.h
++++ b/include/exec/memory.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ struct MemoryRegionOps {
- #define PPCE500_H
+          * as a machine check exception).
+          */
- #include "hw/boards.h"
+         bool (*accepts)(void *opaque, hwaddr addr,
-+#include "hw/platform-bus.h"
+-                        unsigned size, bool is_write);
++                        unsigned size, bool is_write,
- typedef struct PPCE500MachineState {
++                        MemTxAttrs attrs);
-     /*< private >*/
+     } valid;
-     MachineState parent_obj;
+     /* Internal implementation constraints: */
+     struct {
-+    /* points to instance of TYPE_PLATFORM_BUS_DEVICE if
+diff --git a/exec.c b/exec.c
 +     * board supports dynamic sysbus devices
 +     */
 +    PlatformBusDevice *pbus_dev;
  } PPCE500MachineState;
  typedef struct PPCE500MachineClass {
 diff --git a/include/hw/arm/virt.h b/include/hw/arm/virt.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/arm/virt.h
+--- a/exec.c
-+++ b/include/hw/arm/virt.h
++++ b/exec.c
-@@ -XXX,XX +XXX,XX @@ typedef struct {
+@@ -XXX,XX +XXX,XX @@ static void notdirty_mem_write(void *opaque, hwaddr ram_addr,
- typedef struct {
+ }
-     MachineState parent;
-     Notifier machine_done;
+ static bool notdirty_mem_accepts(void *opaque, hwaddr addr,
-+    DeviceState *platform_bus_dev;
+-                                 unsigned size, bool is_write)
-     FWCfgState *fw_cfg;
++                                 unsigned size, bool is_write,
-     bool secure;
++                                 MemTxAttrs attrs)
-     bool highmem;
+ {
-diff --git a/include/hw/platform-bus.h b/include/hw/platform-bus.h
+     return is_write;
  }
@@ -XXX,XX +XXX,XX @@ static MemTxResult subpage_write(void *opaque, hwaddr addr,
  }
  static bool subpage_accepts(void *opaque, hwaddr addr,
 -                            unsigned len, bool is_write)
 +                            unsigned len, bool is_write,
 +                            MemTxAttrs attrs)
  {
      subpage_t *subpage = opaque;
  #if defined(DEBUG_SUBPAGE)
@@ -XXX,XX +XXX,XX @@ static void readonly_mem_write(void *opaque, hwaddr addr,
  }
  static bool readonly_mem_accepts(void *opaque, hwaddr addr,
 -                                 unsigned size, bool is_write)
 +                                 unsigned size, bool is_write,
 +                                 MemTxAttrs attrs)
  {
      return is_write;
  }
 diff --git a/hw/hppa/dino.c b/hw/hppa/dino.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/platform-bus.h
+--- a/hw/hppa/dino.c
-+++ b/include/hw/platform-bus.h
++++ b/hw/hppa/dino.c
-@@ -XXX,XX +XXX,XX @@ typedef struct PlatformBusDevice PlatformBusDevice;
+@@ -XXX,XX +XXX,XX @@ static void gsc_to_pci_forwarding(DinoState *s)
- struct PlatformBusDevice {
+ }
-     /*< private >*/
-     SysBusDevice parent_obj;
+ static bool dino_chip_mem_valid(void *opaque, hwaddr addr,
--    Notifier notifier;
+-                                unsigned size, bool is_write)
--    bool done_gathering;
++                                unsigned size, bool is_write,
++                                MemTxAttrs attrs)
-     /*< public >*/
+ {
-     uint32_t mmio_size;
+     switch (addr) {
-@@ -XXX,XX +XXX,XX @@ int platform_bus_get_irqn(PlatformBusDevice *platform_bus, SysBusDevice *sbdev,
+     case DINO_IAR0:
- hwaddr platform_bus_get_mmio_addr(PlatformBusDevice *pbus, SysBusDevice *sbdev,
+diff --git a/hw/nvram/fw_cfg.c b/hw/nvram/fw_cfg.c
                                    int n);
 +void platform_bus_link_device(PlatformBusDevice *pbus, SysBusDevice *sbdev);
 +
  #endif /* HW_PLATFORM_BUS_H */
 diff --git a/hw/arm/sysbus-fdt.c b/hw/arm/sysbus-fdt.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/sysbus-fdt.c
+--- a/hw/nvram/fw_cfg.c
-+++ b/hw/arm/sysbus-fdt.c
++++ b/hw/nvram/fw_cfg.c
-@@ -XXX,XX +XXX,XX @@ static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
+@@ -XXX,XX +XXX,XX @@ static void fw_cfg_dma_mem_write(void *opaque, hwaddr addr,
-     dev = qdev_find_recursive(sysbus_get_default(), TYPE_PLATFORM_BUS_DEVICE);
+ }
-     pbus = PLATFORM_BUS_DEVICE(dev);
+ static bool fw_cfg_dma_mem_valid(void *opaque, hwaddr addr,
--    /* We can only create dt nodes for dynamic devices when they're ready */
+-                                  unsigned size, bool is_write)
--    assert(pbus->done_gathering);
++                                 unsigned size, bool is_write,
--
++                                 MemTxAttrs attrs)
-     PlatformBusFDTData data = {
+ {
-         .fdt = fdt,
+     return !is_write || ((size == 4 && (addr == 0 || addr == 4)) ||
-         .irq_start = irq_start,
+                          (size == 8 && addr == 0));
-diff --git a/hw/arm/virt.c b/hw/arm/virt.c
+ }
  static bool fw_cfg_data_mem_valid(void *opaque, hwaddr addr,
 -                                  unsigned size, bool is_write)
 +                                  unsigned size, bool is_write,
 +                                  MemTxAttrs attrs)
  {
      return addr == 0;
  }
@@ -XXX,XX +XXX,XX @@ static void fw_cfg_ctl_mem_write(void *opaque, hwaddr addr,
  }
  static bool fw_cfg_ctl_mem_valid(void *opaque, hwaddr addr,
 -                                 unsigned size, bool is_write)
 +                                 unsigned size, bool is_write,
 +                                 MemTxAttrs attrs)
  {
      return is_write && size == 2;
  }
@@ -XXX,XX +XXX,XX @@ static void fw_cfg_comb_write(void *opaque, hwaddr addr,
  }
  static bool fw_cfg_comb_valid(void *opaque, hwaddr addr,
 -                                  unsigned size, bool is_write)
 +                              unsigned size, bool is_write,
 +                              MemTxAttrs attrs)
  {
      return (size == 1) || (is_write && size == 2);
  }
 diff --git a/hw/scsi/esp.c b/hw/scsi/esp.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/virt.c
+--- a/hw/scsi/esp.c
-+++ b/hw/arm/virt.c
++++ b/hw/scsi/esp.c
-@@ -XXX,XX +XXX,XX @@ static void create_platform_bus(VirtMachineState *vms, qemu_irq *pic)
+@@ -XXX,XX +XXX,XX @@ void esp_reg_write(ESPState *s, uint32_t saddr, uint64_t val)
      qdev_prop_set_uint32(dev, "mmio_size",
          platform_bus_params.platform_bus_size);
      qdev_init_nofail(dev);
 +    vms->platform_bus_dev = dev;
      s = SYS_BUS_DEVICE(dev);
      for (i = 0; i < platform_bus_params.platform_bus_num_irqs; i++) {
@@ -XXX,XX +XXX,XX @@ static const CPUArchIdList *virt_possible_cpu_arch_ids(MachineState *ms)
      return ms->possible_cpus;
  }
-+static void virt_machine_device_plug_cb(HotplugHandler *hotplug_dev,
+ static bool esp_mem_accepts(void *opaque, hwaddr addr,
-+                                        DeviceState *dev, Error **errp)
+-                            unsigned size, bool is_write)
-+{
++                            unsigned size, bool is_write,
-+    VirtMachineState *vms = VIRT_MACHINE(hotplug_dev);
++                            MemTxAttrs attrs)
 +
 +    if (vms->platform_bus_dev) {
 +        if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
 +            platform_bus_link_device(PLATFORM_BUS_DEVICE(vms->platform_bus_dev),
 +                                     SYS_BUS_DEVICE(dev));
 +        }
 +    }
 +}
 +
 +static HotplugHandler *virt_machine_get_hotplug_handler(MachineState *machine,
 +                                                        DeviceState *dev)
 +{
 +    if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
 +        return HOTPLUG_HANDLER(machine);
 +    }
 +
 +    return NULL;
 +}
 +
  static void virt_machine_class_init(ObjectClass *oc, void *data)
  {
-     MachineClass *mc = MACHINE_CLASS(oc);
+     return (size == 1) || (is_write && size == 4);
 +    HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
      mc->init = machvirt_init;
      /* Start max_cpus at the maximum QEMU supports. We'll further restrict
@@ -XXX,XX +XXX,XX @@ static void virt_machine_class_init(ObjectClass *oc, void *data)
      mc->cpu_index_to_instance_props = virt_cpu_index_to_props;
      mc->default_cpu_type = ARM_CPU_TYPE_NAME("cortex-a15");
      mc->get_default_cpu_node_id = virt_get_default_cpu_node_id;
 +    mc->get_hotplug_handler = virt_machine_get_hotplug_handler;
 +    hc->plug = virt_machine_device_plug_cb;
  }
+diff --git a/hw/xen/xen_pt_msi.c b/hw/xen/xen_pt_msi.c
  static const TypeInfo virt_machine_info = {
@@ -XXX,XX +XXX,XX @@ static const TypeInfo virt_machine_info = {
      .instance_size = sizeof(VirtMachineState),
      .class_size    = sizeof(VirtMachineClass),
      .class_init    = virt_machine_class_init,
 +    .interfaces = (InterfaceInfo[]) {
 +         { TYPE_HOTPLUG_HANDLER },
 +         { }
 +    },
  };
  static void machvirt_machine_init(void)
 diff --git a/hw/core/platform-bus.c b/hw/core/platform-bus.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/core/platform-bus.c
+--- a/hw/xen/xen_pt_msi.c
-+++ b/hw/core/platform-bus.c
++++ b/hw/xen/xen_pt_msi.c
-@@ -XXX,XX +XXX,XX @@ static void plaform_bus_refresh_irqs(PlatformBusDevice *pbus)
+@@ -XXX,XX +XXX,XX @@ static uint64_t pci_msix_read(void *opaque, hwaddr addr,
  }
  static bool pci_msix_accepts(void *opaque, hwaddr addr,
 -                             unsigned size, bool is_write)
 +                             unsigned size, bool is_write,
 +                             MemTxAttrs attrs)
  {
-     bitmap_zero(pbus->used_irqs, pbus->num_irqs);
+     return !(addr & (size - 1));
      foreach_dynamic_sysbus_device(platform_bus_count_irqs, pbus);
 -    pbus->done_gathering = true;
  }
+diff --git a/memory.c b/memory.c
- static void platform_bus_map_irq(PlatformBusDevice *pbus, SysBusDevice *sbdev,
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ static void platform_bus_map_mmio(PlatformBusDevice *pbus, SysBusDevice *sbdev,
+--- a/memory.c
 +++ b/memory.c
@@ -XXX,XX +XXX,XX @@ static void unassigned_mem_write(void *opaque, hwaddr addr,
  }
- /*
+ static bool unassigned_mem_accepts(void *opaque, hwaddr addr,
-- * For each sysbus device, look for unassigned IRQ lines as well as
+-                                   unsigned size, bool is_write)
-- * unassociated MMIO regions. Connect them to the platform bus if available.
++                                   unsigned size, bool is_write,
-+ * Look for unassigned IRQ lines as well as unassociated MMIO regions.
++                                   MemTxAttrs attrs)
 + * Connect them to the platform bus if available.
   */
 -static void link_sysbus_device(SysBusDevice *sbdev, void *opaque)
 +void platform_bus_link_device(PlatformBusDevice *pbus, SysBusDevice *sbdev)
  {
--    PlatformBusDevice *pbus = opaque;
+     return false;
-     int i;
+ }
+@@ -XXX,XX +XXX,XX @@ bool memory_region_access_valid(MemoryRegion *mr,
-     for (i = 0; sysbus_has_irq(sbdev, i); i++) {
+     access_size = MAX(MIN(size, access_size_max), access_size_min);
-@@ -XXX,XX +XXX,XX @@ static void link_sysbus_device(SysBusDevice *sbdev, void *opaque)
+     for (i = 0; i < size; i += access_size) {
          if (!mr->ops->valid.accepts(mr->opaque, addr + i, access_size,
 -                                    is_write)) {
 +                                    is_write, attrs)) {
              return false;
          }
      }
- }
--static void platform_bus_init_notify(Notifier *notifier, void *data)
--{
--    PlatformBusDevice *pb = container_of(notifier, PlatformBusDevice, notifier);
--
--    /*
--     * Generate a bitmap of used IRQ lines, as the user might have specified
--     * them on the command line.
--     */
--    plaform_bus_refresh_irqs(pb);
--
--    foreach_dynamic_sysbus_device(link_sysbus_device, pb);
--}
--
- static void platform_bus_realize(DeviceState *dev, Error **errp)
- {
-     PlatformBusDevice *pbus;
-@@ -XXX,XX +XXX,XX @@ static void platform_bus_realize(DeviceState *dev, Error **errp)
-         sysbus_init_irq(d, &pbus->irqs[i]);
-     }
--    /*
--     * Register notifier that allows us to gather dangling devices once the
--     * machine is completely assembled
--     */
--    pbus->notifier.notify = platform_bus_init_notify;
--    qemu_add_machine_init_done_notifier(&pbus->notifier);
-+    /* some devices might be initialized before so update used IRQs map */
-+    plaform_bus_refresh_irqs(pbus);
- }
- static Property platform_bus_properties[] = {
-diff --git a/hw/ppc/e500.c b/hw/ppc/e500.c
-index XXXXXXX..XXXXXXX 100644
---- a/hw/ppc/e500.c
-+++ b/hw/ppc/e500.c
-@@ -XXX,XX +XXX,XX @@ static void sysbus_device_create_devtree(SysBusDevice *sbdev, void *opaque)
-     }
- }
--static void platform_bus_create_devtree(const PPCE500MachineClass *pmc,
-+static void platform_bus_create_devtree(PPCE500MachineState *pms,
-                                         void *fdt, const char *mpic)
- {
-+    const PPCE500MachineClass *pmc = PPCE500_MACHINE_GET_CLASS(pms);
-     gchar *node = g_strdup_printf("/platform@%"PRIx64, pmc->platform_bus_base);
-     const char platcomp[] = "qemu,platform\0simple-bus";
-     uint64_t addr = pmc->platform_bus_base;
-     uint64_t size = pmc->platform_bus_size;
-     int irq_start = pmc->platform_bus_first_irq;
--    PlatformBusDevice *pbus;
--    DeviceState *dev;
-     /* Create a /platform node that we can put all devices into */
-@@ -XXX,XX +XXX,XX @@ static void platform_bus_create_devtree(const PPCE500MachineClass *pmc,
-     qemu_fdt_setprop_phandle(fdt, node, "interrupt-parent", mpic);
--    dev = qdev_find_recursive(sysbus_get_default(), TYPE_PLATFORM_BUS_DEVICE);
--    pbus = PLATFORM_BUS_DEVICE(dev);
-+    /* Create dt nodes for dynamic devices */
-+    PlatformDevtreeData data = {
-+        .fdt = fdt,
-+        .mpic = mpic,
-+        .irq_start = irq_start,
-+        .node = node,
-+        .pbus = pms->pbus_dev,
-+    };
--    /* We can only create dt nodes for dynamic devices when they're ready */
--    if (pbus->done_gathering) {
--        PlatformDevtreeData data = {
--            .fdt = fdt,
--            .mpic = mpic,
--            .irq_start = irq_start,
--            .node = node,
--            .pbus = pbus,
--        };
--
--        /* Loop through all dynamic sysbus devices and create nodes for them */
--        foreach_dynamic_sysbus_device(sysbus_device_create_devtree, &data);
--    }
-+    /* Loop through all dynamic sysbus devices and create nodes for them */
-+    foreach_dynamic_sysbus_device(sysbus_device_create_devtree, &data);
-     g_free(node);
- }
-@@ -XXX,XX +XXX,XX @@ static int ppce500_load_device_tree(PPCE500MachineState *pms,
-     }
-     g_free(soc);
--    if (pmc->has_platform_bus) {
--        platform_bus_create_devtree(pmc, fdt, mpic);
-+    if (pms->pbus_dev) {
-+        platform_bus_create_devtree(pms, fdt, mpic);
-     }
-     g_free(mpic);
-@@ -XXX,XX +XXX,XX @@ void ppce500_init(MachineState *machine)
-         qdev_prop_set_uint32(dev, "num_irqs", pmc->platform_bus_num_irqs);
-         qdev_prop_set_uint32(dev, "mmio_size", pmc->platform_bus_size);
-         qdev_init_nofail(dev);
--        s = SYS_BUS_DEVICE(dev);
-+        pms->pbus_dev = PLATFORM_BUS_DEVICE(dev);
-+        s = SYS_BUS_DEVICE(pms->pbus_dev);
-         for (i = 0; i < pmc->platform_bus_num_irqs; i++) {
-             int irqn = pmc->platform_bus_first_irq + i;
-             sysbus_connect_irq(s, i, qdev_get_gpio_in(mpicdev, irqn));
-@@ -XXX,XX +XXX,XX @@ static const TypeInfo ppce500_info = {
-     .name          = TYPE_PPCE500_MACHINE,
-     .parent        = TYPE_MACHINE,
-     .abstract      = true,
-+    .instance_size = sizeof(PPCE500MachineState),
-     .class_size    = sizeof(PPCE500MachineClass),
- };
-diff --git a/hw/ppc/e500plat.c b/hw/ppc/e500plat.c
-index XXXXXXX..XXXXXXX 100644
---- a/hw/ppc/e500plat.c
-+++ b/hw/ppc/e500plat.c
-@@ -XXX,XX +XXX,XX @@ static void e500plat_init(MachineState *machine)
-     ppce500_init(machine);
- }
-+static void e500plat_machine_device_plug_cb(HotplugHandler *hotplug_dev,
-+                                            DeviceState *dev, Error **errp)
-+{
-+    PPCE500MachineState *pms = PPCE500_MACHINE(hotplug_dev);
-+
-+    if (pms->pbus_dev) {
-+        if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
-+            platform_bus_link_device(pms->pbus_dev, SYS_BUS_DEVICE(dev));
-+        }
-+    }
-+}
-+
-+static
-+HotplugHandler *e500plat_machine_get_hotpug_handler(MachineState *machine,
-+                                                    DeviceState *dev)
-+{
-+    if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
-+        return HOTPLUG_HANDLER(machine);
-+    }
-+
-+    return NULL;
-+}
-+
- #define TYPE_E500PLAT_MACHINE  MACHINE_TYPE_NAME("ppce500")
- static void e500plat_machine_class_init(ObjectClass *oc, void *data)
- {
-     PPCE500MachineClass *pmc = PPCE500_MACHINE_CLASS(oc);
-+    HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
-     MachineClass *mc = MACHINE_CLASS(oc);
-+    mc->get_hotplug_handler = e500plat_machine_get_hotpug_handler;
-+    hc->plug = e500plat_machine_device_plug_cb;
-+
-     pmc->pci_first_slot = 0x1;
-     pmc->pci_nr_slots = PCI_SLOT_MAX - 1;
-     pmc->fixup_devtree = e500plat_fixup_devtree;
-@@ -XXX,XX +XXX,XX @@ static const TypeInfo e500plat_info = {
-     .name          = TYPE_E500PLAT_MACHINE,
-     .parent        = TYPE_PPCE500_MACHINE,
-     .class_init    = e500plat_machine_class_init,
-+    .interfaces    = (InterfaceInfo[]) {
-+         { TYPE_HOTPLUG_HANDLER },
-+         { }
-+    }
- };
- static void e500plat_register_types(void)
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 10/21] target/xtensa: Use new min/max expanders
+[Qemu-devel] [PULL 18/25] Make flatview_access_valid() take a MemTxAttrs argument
-From: Richard Henderson <richard.henderson@linaro.org>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to flatview_access_valid().
 Its callers now all have an attrs value to hand, so we can
 correct our earlier temporary use of MEMTXATTRS_UNSPECIFIED.
-The generic expanders replace nearly identical code in the translator.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180521140402.23318-10-peter.maydell@linaro.org
 ---
  exec.c | 12 +++++-------
 file changed, 5 insertions(+), 7 deletions(-)
-Acked-by: Max Filippov <jcmvbkbc@gmail.com>
+diff --git a/exec.c b/exec.c
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180508151437.4232-4-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/xtensa/translate.c | 50 ++++++++++++++++++++++++++-------------
 file changed, 33 insertions(+), 17 deletions(-)
 diff --git a/target/xtensa/translate.c b/target/xtensa/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/xtensa/translate.c
+--- a/exec.c
-+++ b/target/xtensa/translate.c
++++ b/exec.c
-@@ -XXX,XX +XXX,XX @@ static void translate_clamps(DisasContext *dc, const uint32_t arg[],
+@@ -XXX,XX +XXX,XX @@ static MemTxResult flatview_read(FlatView *fv, hwaddr addr,
-         TCGv_i32 tmp1 = tcg_const_i32(-1u << arg[2]);
+ static MemTxResult flatview_write(FlatView *fv, hwaddr addr, MemTxAttrs attrs,
-         TCGv_i32 tmp2 = tcg_const_i32((1 << arg[2]) - 1);
+                                   const uint8_t *buf, int len);
+ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
--        tcg_gen_movcond_i32(TCG_COND_GT, tmp1,
+-                                  bool is_write);
--                            cpu_R[arg[1]], tmp1, cpu_R[arg[1]], tmp1);
++                                  bool is_write, MemTxAttrs attrs);
--        tcg_gen_movcond_i32(TCG_COND_LT, cpu_R[arg[0]],
--                            tmp1, tmp2, tmp1, tmp2);
+ static MemTxResult subpage_read(void *opaque, hwaddr addr, uint64_t *data,
-+        tcg_gen_smax_i32(tmp1, tmp1, cpu_R[arg[1]]);
+                                 unsigned len, MemTxAttrs attrs)
-+        tcg_gen_smin_i32(cpu_R[arg[0]], tmp1, tmp2);
+@@ -XXX,XX +XXX,XX @@ static bool subpage_accepts(void *opaque, hwaddr addr,
-         tcg_temp_free(tmp1);
+ #endif
-         tcg_temp_free(tmp2);
-     }
+     return flatview_access_valid(subpage->fv, addr + subpage->base,
-@@ -XXX,XX +XXX,XX @@ static void translate_memw(DisasContext *dc, const uint32_t arg[],
+-                                 len, is_write);
-     tcg_gen_mb(TCG_BAR_SC | TCG_MO_ALL);
++                                 len, is_write, attrs);
  }
--static void translate_minmax(DisasContext *dc, const uint32_t arg[],
+ static const MemoryRegionOps subpage_ops = {
--                             const uint32_t par[])
+@@ -XXX,XX +XXX,XX @@ static void cpu_notify_map_clients(void)
-+static void translate_smin(DisasContext *dc, const uint32_t arg[],
+ }
-+                           const uint32_t par[])
  static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
 -                                  bool is_write)
 +                                  bool is_write, MemTxAttrs attrs)
  {
-     if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
+     MemoryRegion *mr;
--        tcg_gen_movcond_i32(par[0], cpu_R[arg[0]],
+     hwaddr l, xlat;
--                            cpu_R[arg[1]], cpu_R[arg[2]],
+@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
--                            cpu_R[arg[1]], cpu_R[arg[2]]);
+         mr = flatview_translate(fv, addr, &xlat, &l, is_write);
-+        tcg_gen_smin_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
+         if (!memory_access_is_direct(mr, is_write)) {
-+    }
+             l = memory_access_size(mr, l, addr);
-+}
+-            /* When our callers all have attrs we'll pass them through here */
-+
+-            if (!memory_region_access_valid(mr, xlat, l, is_write,
-+static void translate_umin(DisasContext *dc, const uint32_t arg[],
+-                                            MEMTXATTRS_UNSPECIFIED)) {
-+                           const uint32_t par[])
++            if (!memory_region_access_valid(mr, xlat, l, is_write, attrs)) {
-+{
+                 return false;
-+    if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
+             }
-+        tcg_gen_umin_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
+         }
-+    }
+@@ -XXX,XX +XXX,XX @@ bool address_space_access_valid(AddressSpace *as, hwaddr addr,
-+}
-+
+     rcu_read_lock();
-+static void translate_smax(DisasContext *dc, const uint32_t arg[],
+     fv = address_space_to_flatview(as);
-+                           const uint32_t par[])
+-    result = flatview_access_valid(fv, addr, len, is_write);
-+{
++    result = flatview_access_valid(fv, addr, len, is_write, attrs);
-+    if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
+     rcu_read_unlock();
-+        tcg_gen_smax_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
+     return result;
 +    }
 +}
 +
 +static void translate_umax(DisasContext *dc, const uint32_t arg[],
 +                           const uint32_t par[])
 +{
 +    if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
 +        tcg_gen_umax_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
      }
  }
-@@ -XXX,XX +XXX,XX @@ static const XtensaOpcodeOps core_ops[] = {
-         .par = (const uint32_t[]){TCG_COND_NE},
-     }, {
-         .name = "max",
--        .translate = translate_minmax,
--        .par = (const uint32_t[]){TCG_COND_GE},
-+        .translate = translate_smax,
-     }, {
-         .name = "maxu",
--        .translate = translate_minmax,
--        .par = (const uint32_t[]){TCG_COND_GEU},
-+        .translate = translate_umax,
-     }, {
-         .name = "memw",
-         .translate = translate_memw,
-     }, {
-         .name = "min",
--        .translate = translate_minmax,
--        .par = (const uint32_t[]){TCG_COND_LT},
-+        .translate = translate_smin,
-     }, {
-         .name = "minu",
--        .translate = translate_minmax,
--        .par = (const uint32_t[]){TCG_COND_LTU},
-+        .translate = translate_umin,
-     }, {
-         .name = "mov",
-         .translate = translate_mov,
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 15/21] target/arm: Fill in disas_ldst_atomic
+[Qemu-devel] [PULL 19/25] Make flatview_translate() take a MemTxAttrs argument
-From: Richard Henderson <richard.henderson@linaro.org>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to flatview_translate(); all its
 callers now have attrs available.
-This implements all of the v8.1-Atomics instructions except
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-for compare-and-swap, which is decoded elsewhere.
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180521140402.23318-11-peter.maydell@linaro.org
 ---
  include/exec/memory.h |  7 ++++---
  exec.c                | 17 +++++++++--------
 files changed, 13 insertions(+), 11 deletions(-)
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+diff --git a/include/exec/memory.h b/include/exec/memory.h
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180508151437.4232-9-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  target/arm/translate-a64.c | 38 ++++++++++++++++++++++++++++++++++++--
 file changed, 36 insertions(+), 2 deletions(-)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/include/exec/memory.h
-+++ b/target/arm/translate-a64.c
++++ b/include/exec/memory.h
-@@ -XXX,XX +XXX,XX @@ typedef void NeonGenOneOpFn(TCGv_i64, TCGv_i64);
+@@ -XXX,XX +XXX,XX @@ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
- typedef void CryptoTwoOpFn(TCGv_ptr, TCGv_ptr);
+  */
- typedef void CryptoThreeOpIntFn(TCGv_ptr, TCGv_ptr, TCGv_i32);
+ MemoryRegion *flatview_translate(FlatView *fv,
- typedef void CryptoThreeOpFn(TCGv_ptr, TCGv_ptr, TCGv_ptr);
+                                  hwaddr addr, hwaddr *xlat,
-+typedef void AtomicThreeOpFn(TCGv_i64, TCGv_i64, TCGv_i64, TCGArg, TCGMemOp);
+-                                 hwaddr *len, bool is_write);
++                                 hwaddr *len, bool is_write,
- /* Note that the gvec expanders operate on offsets + sizes.  */
++                                 MemTxAttrs attrs);
- typedef void GVecGen2Fn(unsigned, uint32_t, uint32_t, uint32_t, uint32_t);
-@@ -XXX,XX +XXX,XX @@ static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
+ static inline MemoryRegion *address_space_translate(AddressSpace *as,
-     int rn = extract32(insn, 5, 5);
+                                                     hwaddr addr, hwaddr *xlat,
-     int o3_opc = extract32(insn, 12, 4);
+@@ -XXX,XX +XXX,XX @@ static inline MemoryRegion *address_space_translate(AddressSpace *as,
-     int feature = ARM_FEATURE_V8_ATOMICS;
+                                                     MemTxAttrs attrs)
-+    TCGv_i64 tcg_rn, tcg_rs;
+ {
-+    AtomicThreeOpFn *fn;
+     return flatview_translate(address_space_to_flatview(as),
+-                              addr, xlat, len, is_write);
-     if (is_vector) {
++                              addr, xlat, len, is_write, attrs);
-         unallocated_encoding(s);
+ }
-@@ -XXX,XX +XXX,XX @@ static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
  /* address_space_access_valid: check for validity of accessing an address
@@ -XXX,XX +XXX,XX @@ MemTxResult address_space_read(AddressSpace *as, hwaddr addr,
              rcu_read_lock();
              fv = address_space_to_flatview(as);
              l = len;
 -            mr = flatview_translate(fv, addr, &addr1, &l, false);
 +            mr = flatview_translate(fv, addr, &addr1, &l, false, attrs);
              if (len == l && memory_access_is_direct(mr, false)) {
                  ptr = qemu_map_ram_ptr(mr->ram_block, addr1);
                  memcpy(buf, ptr, len);
 diff --git a/exec.c b/exec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/exec.c
 +++ b/exec.c
@@ -XXX,XX +XXX,XX @@ iotlb_fail:
  /* Called from RCU critical section */
  MemoryRegion *flatview_translate(FlatView *fv, hwaddr addr, hwaddr *xlat,
 -                                 hwaddr *plen, bool is_write)
 +                                 hwaddr *plen, bool is_write,
 +                                 MemTxAttrs attrs)
  {
      MemoryRegion *mr;
      MemoryRegionSection section;
@@ -XXX,XX +XXX,XX @@ static MemTxResult flatview_write_continue(FlatView *fv, hwaddr addr,
          }
          l = len;
 -        mr = flatview_translate(fv, addr, &addr1, &l, true);
 +        mr = flatview_translate(fv, addr, &addr1, &l, true, attrs);
      }
-     switch (o3_opc) {
-     case 000: /* LDADD */
+     return result;
-+        fn = tcg_gen_atomic_fetch_add_i64;
+@@ -XXX,XX +XXX,XX @@ static MemTxResult flatview_write(FlatView *fv, hwaddr addr, MemTxAttrs attrs,
-+        break;
+     MemTxResult result = MEMTX_OK;
-     case 001: /* LDCLR */
-+        fn = tcg_gen_atomic_fetch_and_i64;
+     l = len;
-+        break;
+-    mr = flatview_translate(fv, addr, &addr1, &l, true);
-     case 002: /* LDEOR */
++    mr = flatview_translate(fv, addr, &addr1, &l, true, attrs);
-+        fn = tcg_gen_atomic_fetch_xor_i64;
+     result = flatview_write_continue(fv, addr, attrs, buf, len,
-+        break;
+                                      addr1, l, mr);
-     case 003: /* LDSET */
-+        fn = tcg_gen_atomic_fetch_or_i64;
+@@ -XXX,XX +XXX,XX @@ MemTxResult flatview_read_continue(FlatView *fv, hwaddr addr,
-+        break;
+         }
-     case 004: /* LDSMAX */
-+        fn = tcg_gen_atomic_fetch_smax_i64;
+         l = len;
-+        break;
+-        mr = flatview_translate(fv, addr, &addr1, &l, false);
-     case 005: /* LDSMIN */
++        mr = flatview_translate(fv, addr, &addr1, &l, false, attrs);
 +        fn = tcg_gen_atomic_fetch_smin_i64;
 +        break;
      case 006: /* LDUMAX */
 +        fn = tcg_gen_atomic_fetch_umax_i64;
 +        break;
      case 007: /* LDUMIN */
 +        fn = tcg_gen_atomic_fetch_umin_i64;
 +        break;
      case 010: /* SWP */
 +        fn = tcg_gen_atomic_xchg_i64;
 +        break;
      default:
          unallocated_encoding(s);
          return;
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
          return;
      }
--    (void)rs;
+     return result;
--    (void)rn;
+@@ -XXX,XX +XXX,XX @@ static MemTxResult flatview_read(FlatView *fv, hwaddr addr,
-+    if (rn == 31) {
+     MemoryRegion *mr;
-+        gen_check_sp_alignment(s);
-+    }
+     l = len;
-+    tcg_rn = cpu_reg_sp(s, rn);
+-    mr = flatview_translate(fv, addr, &addr1, &l, false);
-+    tcg_rs = read_cpu_reg(s, rs, true);
++    mr = flatview_translate(fv, addr, &addr1, &l, false, attrs);
-+
+     return flatview_read_continue(fv, addr, attrs, buf, len,
-+    if (o3_opc == 1) { /* LDCLR */
+                                   addr1, l, mr);
 +        tcg_gen_not_i64(tcg_rs, tcg_rs);
 +    }
 +
 +    /* The tcg atomic primitives are all full barriers.  Therefore we
 +     * can ignore the Acquire and Release bits of this instruction.
 +     */
 +    fn(cpu_reg(s, rt), tcg_rn, tcg_rs, get_mem_index(s),
 +       s->be_data | size | MO_ALIGN);
  }
+@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
- /* Load/store register (all forms) */
      while (len > 0) {
          l = len;
 -        mr = flatview_translate(fv, addr, &xlat, &l, is_write);
 +        mr = flatview_translate(fv, addr, &xlat, &l, is_write, attrs);
          if (!memory_access_is_direct(mr, is_write)) {
              l = memory_access_size(mr, l, addr);
              if (!memory_region_access_valid(mr, xlat, l, is_write, attrs)) {
@@ -XXX,XX +XXX,XX @@ flatview_extend_translation(FlatView *fv, hwaddr addr,
          len = target_len;
          this_mr = flatview_translate(fv, addr, &xlat,
 -                                                   &len, is_write);
 +                                     &len, is_write, attrs);
          if (this_mr != mr || xlat != base + done) {
              return done;
          }
@@ -XXX,XX +XXX,XX @@ void *address_space_map(AddressSpace *as,
      l = len;
      rcu_read_lock();
      fv = address_space_to_flatview(as);
 -    mr = flatview_translate(fv, addr, &xlat, &l, is_write);
 +    mr = flatview_translate(fv, addr, &xlat, &l, is_write, attrs);
      if (!memory_access_is_direct(mr, is_write)) {
          if (atomic_xchg(&bounce.in_use, true)) {
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 11/21] tcg: Introduce atomic helpers for integer min/max
+[Qemu-devel] [PULL 20/25] Make address_space_get_iotlb_entry() take a MemTxAttrs argument
-From: Richard Henderson <richard.henderson@linaro.org>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to address_space_get_iotlb_entry().
-Given that this atomic operation will be used by both risc-v
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-and aarch64, let's not duplicate code across the two targets.
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180521140402.23318-12-peter.maydell@linaro.org
 ---
  include/exec/memory.h | 2 +-
  exec.c                | 2 +-
  hw/virtio/vhost.c     | 3 ++-
 files changed, 4 insertions(+), 3 deletions(-)
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+diff --git a/include/exec/memory.h b/include/exec/memory.h
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180508151437.4232-5-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  accel/tcg/atomic_template.h | 71 +++++++++++++++++++++++++++++++++++++
  accel/tcg/tcg-runtime.h     |  8 +++++
  tcg/tcg-op.h                | 34 ++++++++++++++++++
  tcg/tcg.h                   |  8 +++++
  tcg/tcg-op.c                |  8 +++++
 files changed, 129 insertions(+)
 diff --git a/accel/tcg/atomic_template.h b/accel/tcg/atomic_template.h
 index XXXXXXX..XXXXXXX 100644
---- a/accel/tcg/atomic_template.h
+--- a/include/exec/memory.h
-+++ b/accel/tcg/atomic_template.h
++++ b/include/exec/memory.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void address_space_cache_destroy(MemoryRegionCache *cache);
- #elif DATA_SIZE == 8
+  * entry. Should be called from an RCU critical section.
- # define SUFFIX     q
+  */
- # define DATA_TYPE  uint64_t
+ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
-+# define SDATA_TYPE int64_t
+-                                            bool is_write);
- # define BSWAP      bswap64
++                                            bool is_write, MemTxAttrs attrs);
- #elif DATA_SIZE == 4
- # define SUFFIX     l
+ /* address_space_translate: translate an address range into an address space
- # define DATA_TYPE  uint32_t
+  * into a MemoryRegion and an address range into that section.  Should be
-+# define SDATA_TYPE int32_t
+diff --git a/exec.c b/exec.c
  # define BSWAP      bswap32
  #elif DATA_SIZE == 2
  # define SUFFIX     w
  # define DATA_TYPE  uint16_t
 +# define SDATA_TYPE int16_t
  # define BSWAP      bswap16
  #elif DATA_SIZE == 1
  # define SUFFIX     b
  # define DATA_TYPE  uint8_t
 +# define SDATA_TYPE int8_t
  # define BSWAP
  #else
  # error unsupported data size
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER(or_fetch)
  GEN_ATOMIC_HELPER(xor_fetch)
  #undef GEN_ATOMIC_HELPER
 +
 +/* These helpers are, as a whole, full barriers.  Within the helper,
 + * the leading barrier is explicit and the trailing barrier is within
 + * cmpxchg primitive.
 + */
 +#define GEN_ATOMIC_HELPER_FN(X, FN, XDATA_TYPE, RET)                \
 +ABI_TYPE ATOMIC_NAME(X)(CPUArchState *env, target_ulong addr,       \
 +                        ABI_TYPE xval EXTRA_ARGS)                   \
 +{                                                                   \
 +    ATOMIC_MMU_DECLS;                                               \
 +    XDATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;                          \
 +    XDATA_TYPE cmp, old, new, val = xval;                           \
 +    smp_mb();                                                       \
 +    cmp = atomic_read__nocheck(haddr);                              \
 +    do {                                                            \
 +        old = cmp; new = FN(old, val);                              \
 +        cmp = atomic_cmpxchg__nocheck(haddr, old, new);             \
 +    } while (cmp != old);                                           \
 +    ATOMIC_MMU_CLEANUP;                                             \
 +    return RET;                                                     \
 +}
 +
 +GEN_ATOMIC_HELPER_FN(fetch_smin, MIN, SDATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(fetch_umin, MIN,  DATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(fetch_smax, MAX, SDATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(fetch_umax, MAX,  DATA_TYPE, old)
 +
 +GEN_ATOMIC_HELPER_FN(smin_fetch, MIN, SDATA_TYPE, new)
 +GEN_ATOMIC_HELPER_FN(umin_fetch, MIN,  DATA_TYPE, new)
 +GEN_ATOMIC_HELPER_FN(smax_fetch, MAX, SDATA_TYPE, new)
 +GEN_ATOMIC_HELPER_FN(umax_fetch, MAX,  DATA_TYPE, new)
 +
 +#undef GEN_ATOMIC_HELPER_FN
  #endif /* DATA SIZE >= 16 */
  #undef END
@@ -XXX,XX +XXX,XX @@ ABI_TYPE ATOMIC_NAME(add_fetch)(CPUArchState *env, target_ulong addr,
          ldo = ldn;
      }
  }
 +
 +/* These helpers are, as a whole, full barriers.  Within the helper,
 + * the leading barrier is explicit and the trailing barrier is within
 + * cmpxchg primitive.
 + */
 +#define GEN_ATOMIC_HELPER_FN(X, FN, XDATA_TYPE, RET)                \
 +ABI_TYPE ATOMIC_NAME(X)(CPUArchState *env, target_ulong addr,       \
 +                        ABI_TYPE xval EXTRA_ARGS)                   \
 +{                                                                   \
 +    ATOMIC_MMU_DECLS;                                               \
 +    XDATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;                          \
 +    XDATA_TYPE ldo, ldn, old, new, val = xval;                      \
 +    smp_mb();                                                       \
 +    ldn = atomic_read__nocheck(haddr);                              \
 +    do {                                                            \
 +        ldo = ldn; old = BSWAP(ldo); new = FN(old, val);            \
 +        ldn = atomic_cmpxchg__nocheck(haddr, ldo, BSWAP(new));      \
 +    } while (ldo != ldn);                                           \
 +    ATOMIC_MMU_CLEANUP;                                             \
 +    return RET;                                                     \
 +}
 +
 +GEN_ATOMIC_HELPER_FN(fetch_smin, MIN, SDATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(fetch_umin, MIN,  DATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(fetch_smax, MAX, SDATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(fetch_umax, MAX,  DATA_TYPE, old)
 +
 +GEN_ATOMIC_HELPER_FN(smin_fetch, MIN, SDATA_TYPE, new)
 +GEN_ATOMIC_HELPER_FN(umin_fetch, MIN,  DATA_TYPE, new)
 +GEN_ATOMIC_HELPER_FN(smax_fetch, MAX, SDATA_TYPE, new)
 +GEN_ATOMIC_HELPER_FN(umax_fetch, MAX,  DATA_TYPE, new)
 +
 +#undef GEN_ATOMIC_HELPER_FN
  #endif /* DATA_SIZE >= 16 */
  #undef END
@@ -XXX,XX +XXX,XX @@ ABI_TYPE ATOMIC_NAME(add_fetch)(CPUArchState *env, target_ulong addr,
  #undef BSWAP
  #undef ABI_TYPE
  #undef DATA_TYPE
 +#undef SDATA_TYPE
  #undef SUFFIX
  #undef DATA_SIZE
 diff --git a/accel/tcg/tcg-runtime.h b/accel/tcg/tcg-runtime.h
 index XXXXXXX..XXXXXXX 100644
---- a/accel/tcg/tcg-runtime.h
+--- a/exec.c
-+++ b/accel/tcg/tcg-runtime.h
++++ b/exec.c
-@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPERS(fetch_add)
+@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection flatview_do_translate(FlatView *fv,
- GEN_ATOMIC_HELPERS(fetch_and)
- GEN_ATOMIC_HELPERS(fetch_or)
+ /* Called from RCU critical section */
- GEN_ATOMIC_HELPERS(fetch_xor)
+ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
-+GEN_ATOMIC_HELPERS(fetch_smin)
+-                                            bool is_write)
-+GEN_ATOMIC_HELPERS(fetch_umin)
++                                            bool is_write, MemTxAttrs attrs)
-+GEN_ATOMIC_HELPERS(fetch_smax)
+ {
-+GEN_ATOMIC_HELPERS(fetch_umax)
+     MemoryRegionSection section;
+     hwaddr xlat, page_mask;
- GEN_ATOMIC_HELPERS(add_fetch)
+diff --git a/hw/virtio/vhost.c b/hw/virtio/vhost.c
  GEN_ATOMIC_HELPERS(and_fetch)
  GEN_ATOMIC_HELPERS(or_fetch)
  GEN_ATOMIC_HELPERS(xor_fetch)
 +GEN_ATOMIC_HELPERS(smin_fetch)
 +GEN_ATOMIC_HELPERS(umin_fetch)
 +GEN_ATOMIC_HELPERS(smax_fetch)
 +GEN_ATOMIC_HELPERS(umax_fetch)
  GEN_ATOMIC_HELPERS(xchg)
 diff --git a/tcg/tcg-op.h b/tcg/tcg-op.h
 index XXXXXXX..XXXXXXX 100644
---- a/tcg/tcg-op.h
+--- a/hw/virtio/vhost.c
-+++ b/tcg/tcg-op.h
++++ b/hw/virtio/vhost.c
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
+@@ -XXX,XX +XXX,XX @@ int vhost_device_iotlb_miss(struct vhost_dev *dev, uint64_t iova, int write)
+     trace_vhost_iotlb_miss(dev, 1);
- void tcg_gen_atomic_xchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
- void tcg_gen_atomic_xchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+     iotlb = address_space_get_iotlb_entry(dev->vdev->dma_as,
-+
+-                                          iova, write);
- void tcg_gen_atomic_fetch_add_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
++                                          iova, write,
- void tcg_gen_atomic_fetch_add_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
++                                          MEMTXATTRS_UNSPECIFIED);
- void tcg_gen_atomic_fetch_and_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+     if (iotlb.target_as != NULL) {
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_fetch_or_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+         ret = vhost_memory_region_lookup(dev, iotlb.translated_addr,
- void tcg_gen_atomic_fetch_or_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+                                          &uaddr, &len);
  void tcg_gen_atomic_fetch_xor_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
  void tcg_gen_atomic_fetch_xor_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_smin_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_smin_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_umin_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_umin_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_smax_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_smax_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_umax_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_fetch_umax_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +
  void tcg_gen_atomic_add_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
  void tcg_gen_atomic_add_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
  void tcg_gen_atomic_and_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_or_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
  void tcg_gen_atomic_or_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
  void tcg_gen_atomic_xor_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
  void tcg_gen_atomic_xor_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_smin_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_smin_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_umin_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_umin_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_smax_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_smax_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_umax_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 +void tcg_gen_atomic_umax_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
  void tcg_gen_mov_vec(TCGv_vec, TCGv_vec);
  void tcg_gen_dup_i32_vec(unsigned vece, TCGv_vec, TCGv_i32);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
  #define tcg_gen_atomic_fetch_and_tl tcg_gen_atomic_fetch_and_i64
  #define tcg_gen_atomic_fetch_or_tl tcg_gen_atomic_fetch_or_i64
  #define tcg_gen_atomic_fetch_xor_tl tcg_gen_atomic_fetch_xor_i64
 +#define tcg_gen_atomic_fetch_smin_tl tcg_gen_atomic_fetch_smin_i64
 +#define tcg_gen_atomic_fetch_umin_tl tcg_gen_atomic_fetch_umin_i64
 +#define tcg_gen_atomic_fetch_smax_tl tcg_gen_atomic_fetch_smax_i64
 +#define tcg_gen_atomic_fetch_umax_tl tcg_gen_atomic_fetch_umax_i64
  #define tcg_gen_atomic_add_fetch_tl tcg_gen_atomic_add_fetch_i64
  #define tcg_gen_atomic_and_fetch_tl tcg_gen_atomic_and_fetch_i64
  #define tcg_gen_atomic_or_fetch_tl tcg_gen_atomic_or_fetch_i64
  #define tcg_gen_atomic_xor_fetch_tl tcg_gen_atomic_xor_fetch_i64
 +#define tcg_gen_atomic_smin_fetch_tl tcg_gen_atomic_smin_fetch_i64
 +#define tcg_gen_atomic_umin_fetch_tl tcg_gen_atomic_umin_fetch_i64
 +#define tcg_gen_atomic_smax_fetch_tl tcg_gen_atomic_smax_fetch_i64
 +#define tcg_gen_atomic_umax_fetch_tl tcg_gen_atomic_umax_fetch_i64
  #define tcg_gen_dup_tl_vec  tcg_gen_dup_i64_vec
  #else
  #define tcg_gen_movi_tl tcg_gen_movi_i32
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
  #define tcg_gen_atomic_fetch_and_tl tcg_gen_atomic_fetch_and_i32
  #define tcg_gen_atomic_fetch_or_tl tcg_gen_atomic_fetch_or_i32
  #define tcg_gen_atomic_fetch_xor_tl tcg_gen_atomic_fetch_xor_i32
 +#define tcg_gen_atomic_fetch_smin_tl tcg_gen_atomic_fetch_smin_i32
 +#define tcg_gen_atomic_fetch_umin_tl tcg_gen_atomic_fetch_umin_i32
 +#define tcg_gen_atomic_fetch_smax_tl tcg_gen_atomic_fetch_smax_i32
 +#define tcg_gen_atomic_fetch_umax_tl tcg_gen_atomic_fetch_umax_i32
  #define tcg_gen_atomic_add_fetch_tl tcg_gen_atomic_add_fetch_i32
  #define tcg_gen_atomic_and_fetch_tl tcg_gen_atomic_and_fetch_i32
  #define tcg_gen_atomic_or_fetch_tl tcg_gen_atomic_or_fetch_i32
  #define tcg_gen_atomic_xor_fetch_tl tcg_gen_atomic_xor_fetch_i32
 +#define tcg_gen_atomic_smin_fetch_tl tcg_gen_atomic_smin_fetch_i32
 +#define tcg_gen_atomic_umin_fetch_tl tcg_gen_atomic_umin_fetch_i32
 +#define tcg_gen_atomic_smax_fetch_tl tcg_gen_atomic_smax_fetch_i32
 +#define tcg_gen_atomic_umax_fetch_tl tcg_gen_atomic_umax_fetch_i32
  #define tcg_gen_dup_tl_vec  tcg_gen_dup_i32_vec
  #endif
 diff --git a/tcg/tcg.h b/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.h
 +++ b/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER_ALL(fetch_sub)
  GEN_ATOMIC_HELPER_ALL(fetch_and)
  GEN_ATOMIC_HELPER_ALL(fetch_or)
  GEN_ATOMIC_HELPER_ALL(fetch_xor)
 +GEN_ATOMIC_HELPER_ALL(fetch_smin)
 +GEN_ATOMIC_HELPER_ALL(fetch_umin)
 +GEN_ATOMIC_HELPER_ALL(fetch_smax)
 +GEN_ATOMIC_HELPER_ALL(fetch_umax)
  GEN_ATOMIC_HELPER_ALL(add_fetch)
  GEN_ATOMIC_HELPER_ALL(sub_fetch)
  GEN_ATOMIC_HELPER_ALL(and_fetch)
  GEN_ATOMIC_HELPER_ALL(or_fetch)
  GEN_ATOMIC_HELPER_ALL(xor_fetch)
 +GEN_ATOMIC_HELPER_ALL(smin_fetch)
 +GEN_ATOMIC_HELPER_ALL(umin_fetch)
 +GEN_ATOMIC_HELPER_ALL(smax_fetch)
 +GEN_ATOMIC_HELPER_ALL(umax_fetch)
  GEN_ATOMIC_HELPER_ALL(xchg)
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER(fetch_add, add, 0)
  GEN_ATOMIC_HELPER(fetch_and, and, 0)
  GEN_ATOMIC_HELPER(fetch_or, or, 0)
  GEN_ATOMIC_HELPER(fetch_xor, xor, 0)
 +GEN_ATOMIC_HELPER(fetch_smin, smin, 0)
 +GEN_ATOMIC_HELPER(fetch_umin, umin, 0)
 +GEN_ATOMIC_HELPER(fetch_smax, smax, 0)
 +GEN_ATOMIC_HELPER(fetch_umax, umax, 0)
  GEN_ATOMIC_HELPER(add_fetch, add, 1)
  GEN_ATOMIC_HELPER(and_fetch, and, 1)
  GEN_ATOMIC_HELPER(or_fetch, or, 1)
  GEN_ATOMIC_HELPER(xor_fetch, xor, 1)
 +GEN_ATOMIC_HELPER(smin_fetch, smin, 1)
 +GEN_ATOMIC_HELPER(umin_fetch, umin, 1)
 +GEN_ATOMIC_HELPER(smax_fetch, smax, 1)
 +GEN_ATOMIC_HELPER(umax_fetch, umax, 1)
  static void tcg_gen_mov2_i32(TCGv_i32 r, TCGv_i32 a, TCGv_i32 b)
  {
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 06/21] make sure that we aren't overwriting mc->get_hotplug_handler by accident
+[Qemu-devel] [PULL 21/25] Make flatview_do_translate() take a MemTxAttrs argument
-From: Igor Mammedov <imammedo@redhat.com>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to flatview_do_translate().
-Suggested-by: Eduardo Habkost <ehabkost@redhat.com>
-Signed-off-by: Igor Mammedov <imammedo@redhat.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 1525691524-32265-5-git-send-email-imammedo@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20180521140402.23318-13-peter.maydell@linaro.org
 ---
- hw/arm/virt.c              | 1 +
+ exec.c | 9 ++++++---
- hw/i386/pc.c               | 1 +
+file changed, 6 insertions(+), 3 deletions(-)
  hw/ppc/e500plat.c          | 1 +
  hw/ppc/spapr.c             | 1 +
  hw/s390x/s390-virtio-ccw.c | 1 +
 files changed, 5 insertions(+)
-diff --git a/hw/arm/virt.c b/hw/arm/virt.c
+diff --git a/exec.c b/exec.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/virt.c
+--- a/exec.c
-+++ b/hw/arm/virt.c
++++ b/exec.c
-@@ -XXX,XX +XXX,XX @@ static void virt_machine_class_init(ObjectClass *oc, void *data)
+@@ -XXX,XX +XXX,XX @@ unassigned:
-     mc->cpu_index_to_instance_props = virt_cpu_index_to_props;
+  * @is_write: whether the translation operation is for write
-     mc->default_cpu_type = ARM_CPU_TYPE_NAME("cortex-a15");
+  * @is_mmio: whether this can be MMIO, set true if it can
-     mc->get_default_cpu_node_id = virt_get_default_cpu_node_id;
+  * @target_as: the address space targeted by the IOMMU
-+    assert(!mc->get_hotplug_handler);
++ * @attrs: memory transaction attributes
-     mc->get_hotplug_handler = virt_machine_get_hotplug_handler;
+  *
-     hc->plug = virt_machine_device_plug_cb;
+  * This function is called from RCU critical section
- }
+  */
-diff --git a/hw/i386/pc.c b/hw/i386/pc.c
+@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection flatview_do_translate(FlatView *fv,
-index XXXXXXX..XXXXXXX 100644
+                                                  hwaddr *page_mask_out,
---- a/hw/i386/pc.c
+                                                  bool is_write,
-+++ b/hw/i386/pc.c
+                                                  bool is_mmio,
-@@ -XXX,XX +XXX,XX @@ static void pc_machine_class_init(ObjectClass *oc, void *data)
+-                                                 AddressSpace **target_as)
-     pcmc->acpi_data_size = 0x20000 + 0x8000;
++                                                 AddressSpace **target_as,
-     pcmc->save_tsc_khz = true;
++                                                 MemTxAttrs attrs)
-     pcmc->linuxboot_dma_enabled = true;
+ {
-+    assert(!mc->get_hotplug_handler);
+     MemoryRegionSection *section;
-     mc->get_hotplug_handler = pc_get_hotpug_handler;
+     IOMMUMemoryRegion *iommu_mr;
-     mc->cpu_index_to_instance_props = pc_cpu_index_to_props;
+@@ -XXX,XX +XXX,XX @@ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
-     mc->get_default_cpu_node_id = pc_get_default_cpu_node_id;
+      * but page mask.
-diff --git a/hw/ppc/e500plat.c b/hw/ppc/e500plat.c
+      */
-index XXXXXXX..XXXXXXX 100644
+     section = flatview_do_translate(address_space_to_flatview(as), addr, &xlat,
---- a/hw/ppc/e500plat.c
+-                                    NULL, &page_mask, is_write, false, &as);
-+++ b/hw/ppc/e500plat.c
++                                    NULL, &page_mask, is_write, false, &as,
-@@ -XXX,XX +XXX,XX @@ static void e500plat_machine_class_init(ObjectClass *oc, void *data)
++                                    attrs);
-     HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
-     MachineClass *mc = MACHINE_CLASS(oc);
+     /* Illegal translation */
+     if (section.mr == &io_mem_unassigned) {
-+    assert(!mc->get_hotplug_handler);
+@@ -XXX,XX +XXX,XX @@ MemoryRegion *flatview_translate(FlatView *fv, hwaddr addr, hwaddr *xlat,
-     mc->get_hotplug_handler = e500plat_machine_get_hotpug_handler;
-     hc->plug = e500plat_machine_device_plug_cb;
+     /* This can be MMIO, so setup MMIO bit. */
+     section = flatview_do_translate(fv, addr, xlat, plen, NULL,
-diff --git a/hw/ppc/spapr.c b/hw/ppc/spapr.c
+-                                    is_write, true, &as);
-index XXXXXXX..XXXXXXX 100644
++                                    is_write, true, &as, attrs);
---- a/hw/ppc/spapr.c
+     mr = section.mr;
-+++ b/hw/ppc/spapr.c
-@@ -XXX,XX +XXX,XX @@ static void spapr_machine_class_init(ObjectClass *oc, void *data)
+     if (xen_enabled() && memory_access_is_direct(mr, is_write)) {
      mc->kvm_type = spapr_kvm_type;
      machine_class_allow_dynamic_sysbus_dev(mc, TYPE_SPAPR_PCI_HOST_BRIDGE);
      mc->pci_allow_0_address = true;
 +    assert(!mc->get_hotplug_handler);
      mc->get_hotplug_handler = spapr_get_hotplug_handler;
      hc->pre_plug = spapr_machine_device_pre_plug;
      hc->plug = spapr_machine_device_plug;
 diff --git a/hw/s390x/s390-virtio-ccw.c b/hw/s390x/s390-virtio-ccw.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/s390x/s390-virtio-ccw.c
 +++ b/hw/s390x/s390-virtio-ccw.c
@@ -XXX,XX +XXX,XX @@ static void ccw_machine_class_init(ObjectClass *oc, void *data)
      mc->no_sdcard = 1;
      mc->max_cpus = S390_MAX_CPUS;
      mc->has_hotpluggable_cpus = true;
 +    assert(!mc->get_hotplug_handler);
      mc->get_hotplug_handler = s390_get_hotplug_handler;
      mc->cpu_index_to_instance_props = s390_cpu_index_to_props;
      mc->possible_cpu_arch_ids = s390_possible_cpu_arch_ids;
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 08/21] tcg: Introduce helpers for integer min/max
+[Qemu-devel] [PULL 22/25] Make address_space_translate_iommu take a MemTxAttrs argument
-From: Richard Henderson <richard.henderson@linaro.org>
+As part of plumbing MemTxAttrs down to the IOMMU translate method,
 add MemTxAttrs as an argument to address_space_translate_iommu().
-These operations are re-invented by several targets so far.
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Several supported hosts have insns for these, so place the
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
-expanders out-of-line for a future introduction of tcg opcodes.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180521140402.23318-14-peter.maydell@linaro.org
 ---
  exec.c | 8 +++++---
 file changed, 5 insertions(+), 3 deletions(-)
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+diff --git a/exec.c b/exec.c
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20180508151437.4232-2-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  tcg/tcg-op.h | 16 ++++++++++++++++
  tcg/tcg-op.c | 40 ++++++++++++++++++++++++++++++++++++++++
 files changed, 56 insertions(+)
 diff --git a/tcg/tcg-op.h b/tcg/tcg-op.h
 index XXXXXXX..XXXXXXX 100644
---- a/tcg/tcg-op.h
+--- a/exec.c
-+++ b/tcg/tcg-op.h
++++ b/exec.c
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_ext8u_i32(TCGv_i32 ret, TCGv_i32 arg);
+@@ -XXX,XX +XXX,XX @@ address_space_translate_internal(AddressSpaceDispatch *d, hwaddr addr, hwaddr *x
- void tcg_gen_ext16u_i32(TCGv_i32 ret, TCGv_i32 arg);
+  * @is_write: whether the translation operation is for write
- void tcg_gen_bswap16_i32(TCGv_i32 ret, TCGv_i32 arg);
+  * @is_mmio: whether this can be MMIO, set true if it can
- void tcg_gen_bswap32_i32(TCGv_i32 ret, TCGv_i32 arg);
+  * @target_as: the address space targeted by the IOMMU
-+void tcg_gen_smin_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
++ * @attrs: transaction attributes
-+void tcg_gen_smax_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
+  *
-+void tcg_gen_umin_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
+  * This function is called from RCU critical section.  It is the common
-+void tcg_gen_umax_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
+  * part of flatview_do_translate and address_space_translate_cached.
+@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection address_space_translate_iommu(IOMMUMemoryRegion *iomm
- static inline void tcg_gen_discard_i32(TCGv_i32 arg)
+                                                          hwaddr *page_mask_out,
                                                           bool is_write,
                                                           bool is_mmio,
 -                                                         AddressSpace **target_as)
 +                                                         AddressSpace **target_as,
 +                                                         MemTxAttrs attrs)
  {
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_ext32u_i64(TCGv_i64 ret, TCGv_i64 arg);
+     MemoryRegionSection *section;
- void tcg_gen_bswap16_i64(TCGv_i64 ret, TCGv_i64 arg);
+     hwaddr page_mask = (hwaddr)-1;
- void tcg_gen_bswap32_i64(TCGv_i64 ret, TCGv_i64 arg);
+@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection flatview_do_translate(FlatView *fv,
- void tcg_gen_bswap64_i64(TCGv_i64 ret, TCGv_i64 arg);
+         return address_space_translate_iommu(iommu_mr, xlat,
-+void tcg_gen_smin_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
+                                              plen_out, page_mask_out,
-+void tcg_gen_smax_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
+                                              is_write, is_mmio,
-+void tcg_gen_umin_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
+-                                             target_as);
-+void tcg_gen_umax_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
++                                             target_as, attrs);
  #if TCG_TARGET_REG_BITS == 64
  static inline void tcg_gen_discard_i64(TCGv_i64 arg)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
  #define tcg_gen_mulu2_tl tcg_gen_mulu2_i64
  #define tcg_gen_muls2_tl tcg_gen_muls2_i64
  #define tcg_gen_mulsu2_tl tcg_gen_mulsu2_i64
 +#define tcg_gen_smin_tl tcg_gen_smin_i64
 +#define tcg_gen_umin_tl tcg_gen_umin_i64
 +#define tcg_gen_smax_tl tcg_gen_smax_i64
 +#define tcg_gen_umax_tl tcg_gen_umax_i64
  #define tcg_gen_atomic_cmpxchg_tl tcg_gen_atomic_cmpxchg_i64
  #define tcg_gen_atomic_xchg_tl tcg_gen_atomic_xchg_i64
  #define tcg_gen_atomic_fetch_add_tl tcg_gen_atomic_fetch_add_i64
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
  #define tcg_gen_mulu2_tl tcg_gen_mulu2_i32
  #define tcg_gen_muls2_tl tcg_gen_muls2_i32
  #define tcg_gen_mulsu2_tl tcg_gen_mulsu2_i32
 +#define tcg_gen_smin_tl tcg_gen_smin_i32
 +#define tcg_gen_umin_tl tcg_gen_umin_i32
 +#define tcg_gen_smax_tl tcg_gen_smax_i32
 +#define tcg_gen_umax_tl tcg_gen_umax_i32
  #define tcg_gen_atomic_cmpxchg_tl tcg_gen_atomic_cmpxchg_i32
  #define tcg_gen_atomic_xchg_tl tcg_gen_atomic_xchg_i32
  #define tcg_gen_atomic_fetch_add_tl tcg_gen_atomic_fetch_add_i32
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_bswap32_i32(TCGv_i32 ret, TCGv_i32 arg)
      }
+     if (page_mask_out) {
+         /* Not behind an IOMMU, use default page size. */
+@@ -XXX,XX +XXX,XX @@ static inline MemoryRegion *address_space_translate_cached(
+     section = address_space_translate_iommu(iommu_mr, xlat, plen,
+                                             NULL, is_write, true,
+-                                            &target_as);
++                                            &target_as, attrs);
+     return section.mr;
  }
-+void tcg_gen_smin_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
-+{
-+    tcg_gen_movcond_i32(TCG_COND_LT, ret, a, b, a, b);
-+}
-+
-+void tcg_gen_umin_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
-+{
-+    tcg_gen_movcond_i32(TCG_COND_LTU, ret, a, b, a, b);
-+}
-+
-+void tcg_gen_smax_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
-+{
-+    tcg_gen_movcond_i32(TCG_COND_LT, ret, a, b, b, a);
-+}
-+
-+void tcg_gen_umax_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
-+{
-+    tcg_gen_movcond_i32(TCG_COND_LTU, ret, a, b, b, a);
-+}
-+
- /* 64-bit ops */
- #if TCG_TARGET_REG_BITS == 32
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_mulsu2_i64(TCGv_i64 rl, TCGv_i64 rh, TCGv_i64 arg1, TCGv_i64 arg2)
-     tcg_temp_free_i64(t2);
- }
-+void tcg_gen_smin_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
-+{
-+    tcg_gen_movcond_i64(TCG_COND_LT, ret, a, b, a, b);
-+}
-+
-+void tcg_gen_umin_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
-+{
-+    tcg_gen_movcond_i64(TCG_COND_LTU, ret, a, b, a, b);
-+}
-+
-+void tcg_gen_smax_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
-+{
-+    tcg_gen_movcond_i64(TCG_COND_LT, ret, a, b, b, a);
-+}
-+
-+void tcg_gen_umax_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
-+{
-+    tcg_gen_movcond_i64(TCG_COND_LTU, ret, a, b, b, a);
-+}
-+
- /* Size changing operations.  */
- void tcg_gen_extrl_i64_i32(TCGv_i32 ret, TCGv_i64 arg)
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 12/21] tcg: Use GEN_ATOMIC_HELPER_FN for opposite endian atomic add
+[Qemu-devel] [PULL 23/25] vmstate.h: Provide VMSTATE_BOOL_SUB_ARRAY
-From: Richard Henderson <richard.henderson@linaro.org>
+Provide a VMSTATE_BOOL_SUB_ARRAY to go with VMSTATE_UINT8_SUB_ARRAY
 and friends.
-Suggested-by: Peter Maydell <peter.maydell@linaro.org>
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180508151437.4232-6-richard.henderson@linaro.org
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Message-id: 20180521140402.23318-23-peter.maydell@linaro.org
 ---
- accel/tcg/atomic_template.h | 49 ++++++-------------------------------
+ include/migration/vmstate.h | 3 +++
-file changed, 7 insertions(+), 42 deletions(-)
+file changed, 3 insertions(+)
-diff --git a/accel/tcg/atomic_template.h b/accel/tcg/atomic_template.h
+diff --git a/include/migration/vmstate.h b/include/migration/vmstate.h
 index XXXXXXX..XXXXXXX 100644
---- a/accel/tcg/atomic_template.h
+--- a/include/migration/vmstate.h
-+++ b/accel/tcg/atomic_template.h
++++ b/include/migration/vmstate.h
-@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER(xor_fetch)
+@@ -XXX,XX +XXX,XX @@ extern const VMStateInfo vmstate_info_qtailq;
+ #define VMSTATE_BOOL_ARRAY(_f, _s, _n)                               \
- #undef GEN_ATOMIC_HELPER
+     VMSTATE_BOOL_ARRAY_V(_f, _s, _n, 0)
--/* Note that for addition, we need to use a separate cmpxchg loop instead
++#define VMSTATE_BOOL_SUB_ARRAY(_f, _s, _start, _num)                \
--   of bswaps for the reverse-host-endian helpers.  */
++    VMSTATE_SUB_ARRAY(_f, _s, _start, _num, 0, vmstate_info_bool, bool)
 -ABI_TYPE ATOMIC_NAME(fetch_add)(CPUArchState *env, target_ulong addr,
 -                         ABI_TYPE val EXTRA_ARGS)
 -{
 -    ATOMIC_MMU_DECLS;
 -    DATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;
 -    DATA_TYPE ldo, ldn, ret, sto;
 -
 -    ldo = atomic_read__nocheck(haddr);
 -    while (1) {
 -        ret = BSWAP(ldo);
 -        sto = BSWAP(ret + val);
 -        ldn = atomic_cmpxchg__nocheck(haddr, ldo, sto);
 -        if (ldn == ldo) {
 -            ATOMIC_MMU_CLEANUP;
 -            return ret;
 -        }
 -        ldo = ldn;
 -    }
 -}
 -
 -ABI_TYPE ATOMIC_NAME(add_fetch)(CPUArchState *env, target_ulong addr,
 -                         ABI_TYPE val EXTRA_ARGS)
 -{
 -    ATOMIC_MMU_DECLS;
 -    DATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;
 -    DATA_TYPE ldo, ldn, ret, sto;
 -
 -    ldo = atomic_read__nocheck(haddr);
 -    while (1) {
 -        ret = BSWAP(ldo) + val;
 -        sto = BSWAP(ret);
 -        ldn = atomic_cmpxchg__nocheck(haddr, ldo, sto);
 -        if (ldn == ldo) {
 -            ATOMIC_MMU_CLEANUP;
 -            return ret;
 -        }
 -        ldo = ldn;
 -    }
 -}
 -
  /* These helpers are, as a whole, full barriers.  Within the helper,
   * the leading barrier is explicit and the trailing barrier is within
   * cmpxchg primitive.
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER_FN(umin_fetch, MIN,  DATA_TYPE, new)
  GEN_ATOMIC_HELPER_FN(smax_fetch, MAX, SDATA_TYPE, new)
  GEN_ATOMIC_HELPER_FN(umax_fetch, MAX,  DATA_TYPE, new)
 +/* Note that for addition, we need to use a separate cmpxchg loop instead
 +   of bswaps for the reverse-host-endian helpers.  */
 +#define ADD(X, Y)   (X + Y)
 +GEN_ATOMIC_HELPER_FN(fetch_add, ADD, DATA_TYPE, old)
 +GEN_ATOMIC_HELPER_FN(add_fetch, ADD, DATA_TYPE, new)
 +#undef ADD
 +
- #undef GEN_ATOMIC_HELPER_FN
+ #define VMSTATE_UINT16_ARRAY_V(_f, _s, _n, _v)                         \
- #endif /* DATA_SIZE >= 16 */
+     VMSTATE_ARRAY(_f, _s, _n, _v, vmstate_info_uint16, uint16_t)
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 03/21] pc: simplify MachineClass::get_hotplug_handler handling
+[Qemu-devel] [PULL 24/25] ARM: ACPI: Fix use-after-free due to memory realloc
-From: Igor Mammedov <imammedo@redhat.com>
+From: Shannon Zhao <zhaoshenglong@huawei.com>
-By default MachineClass::get_hotplug_handler is NULL and concrete board
+acpi_data_push uses g_array_set_size to resize the memory size. If there
-should set it to it's own handler.
+is no enough contiguous memory, the address will be changed. So previous
-Considering there isn't any default handler, drop saving empty
+pointer could not be used any more. It must update the pointer and use
-MachineClass::get_hotplug_handler in child class and make PC code
+the new one.
 consistent with spapr/s390x boards.
-We can bring this back when actual usecase surfaces and do it
+Also, previous codes wrongly use le32 conversion of iort->node_offset
-consistently across boards that use get_hotplug_handler().
+for subsequent computations that will result incorrect value if host is
 not litlle endian. So use the non-converted one instead.
-Suggested-by: David Gibson <david@gibson.dropbear.id.au>
+Signed-off-by: Shannon Zhao <zhaoshenglong@huawei.com>
-Signed-off-by: Igor Mammedov <imammedo@redhat.com>
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 1527663951-14552-1-git-send-email-zhaoshenglong@huawei.com
 Reviewed-by: Eduardo Habkost <ehabkost@redhat.com>
 Message-id: 1525691524-32265-2-git-send-email-imammedo@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- include/hw/i386/pc.h | 8 --------
+ hw/arm/virt-acpi-build.c | 20 +++++++++++++++-----
- hw/i386/pc.c         | 6 +-----
+file changed, 15 insertions(+), 5 deletions(-)
 files changed, 1 insertion(+), 13 deletions(-)
-diff --git a/include/hw/i386/pc.h b/include/hw/i386/pc.h
+diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/i386/pc.h
+--- a/hw/arm/virt-acpi-build.c
-+++ b/include/hw/i386/pc.h
++++ b/hw/arm/virt-acpi-build.c
-@@ -XXX,XX +XXX,XX @@ struct PCMachineState {
+@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
- /**
+     AcpiIortItsGroup *its;
-  * PCMachineClass:
+     AcpiIortTable *iort;
-  *
+     AcpiIortSmmu3 *smmu;
-- * Methods:
+-    size_t node_size, iort_length, smmu_offset = 0;
-- *
++    size_t node_size, iort_node_offset, iort_length, smmu_offset = 0;
-- * @get_hotplug_handler: pointer to parent class callback @get_hotplug_handler
+     AcpiIortRC *rc;
-- *
-  * Compat fields:
+     iort = acpi_data_push(table_data, sizeof(*iort));
-  *
+@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
-  * @enforce_aligned_dimm: check that DIMM's address/size is aligned by
-@@ -XXX,XX +XXX,XX @@ struct PCMachineClass {
+     iort_length = sizeof(*iort);
+     iort->node_count = cpu_to_le32(nb_nodes);
-     /*< public >*/
+-    iort->node_offset = cpu_to_le32(sizeof(*iort));
++    /*
--    /* Methods: */
++     * Use a copy in case table_data->data moves during acpi_data_push
--    HotplugHandler *(*get_hotplug_handler)(MachineState *machine,
++     * operations.
--                                           DeviceState *dev);
++     */
--
++    iort_node_offset = sizeof(*iort);
-     /* Device configuration: */
++    iort->node_offset = cpu_to_le32(iort_node_offset);
-     bool pci_enabled;
-     bool kvmclock_enabled;
+     /* ITS group node */
-diff --git a/hw/i386/pc.c b/hw/i386/pc.c
+     node_size =  sizeof(*its) + sizeof(uint32_t);
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
---- a/hw/i386/pc.c
+         int irq =  vms->irqmap[VIRT_SMMU];
-+++ b/hw/i386/pc.c
-@@ -XXX,XX +XXX,XX @@ static void pc_machine_device_unplug_cb(HotplugHandler *hotplug_dev,
+         /* SMMUv3 node */
- static HotplugHandler *pc_get_hotpug_handler(MachineState *machine,
+-        smmu_offset = iort->node_offset + node_size;
-                                              DeviceState *dev)
++        smmu_offset = iort_node_offset + node_size;
- {
+         node_size = sizeof(*smmu) + sizeof(*idmap);
--    PCMachineClass *pcmc = PC_MACHINE_GET_CLASS(machine);
+         iort_length += node_size;
--
+         smmu = acpi_data_push(table_data, node_size);
-     if (object_dynamic_cast(OBJECT(dev), TYPE_PC_DIMM) ||
+@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
-         object_dynamic_cast(OBJECT(dev), TYPE_CPU)) {
+         idmap->id_count = cpu_to_le32(0xFFFF);
-         return HOTPLUG_HANDLER(machine);
+         idmap->output_base = 0;
          /* output IORT node is the ITS group node (the first node) */
 -        idmap->output_reference = cpu_to_le32(iort->node_offset);
 +        idmap->output_reference = cpu_to_le32(iort_node_offset);
      }
--    return pcmc->get_hotplug_handler ?
+     /* Root Complex Node */
--        pcmc->get_hotplug_handler(machine, dev) : NULL;
+@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
-+    return NULL;
+         idmap->output_reference = cpu_to_le32(smmu_offset);
- }
+     } else {
+         /* output IORT node is the ITS group node (the first node) */
- static void
+-        idmap->output_reference = cpu_to_le32(iort->node_offset);
-@@ -XXX,XX +XXX,XX @@ static void pc_machine_class_init(ObjectClass *oc, void *data)
++        idmap->output_reference = cpu_to_le32(iort_node_offset);
-     HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
+     }
-     NMIClass *nc = NMI_CLASS(oc);
++    /*
--    pcmc->get_hotplug_handler = mc->get_hotplug_handler;
++     * Update the pointer address in case table_data->data moves during above
-     pcmc->pci_enabled = true;
++     * acpi_data_push operations.
-     pcmc->has_acpi_build = true;
++     */
-     pcmc->rsdp_in_ram = true;
++    iort = (AcpiIortTable *)(table_data->data + iort_start);
      iort->length = cpu_to_le32(iort_length);
      build_header(linker, table_data, (void *)(table_data->data + iort_start),
 --
-.17.0
+.17.1

-[Qemu-devel] [PULL 19/21] target/arm: Implement vector shifted FCVT for fp16
+[Qemu-devel] [PULL 25/25] KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice
-From: Richard Henderson <richard.henderson@linaro.org>
+From: Shannon Zhao <zhaoshenglong@huawei.com>
-While we have some of the scalar paths for FCVT for fp16,
+kvm_irqchip_create called by kvm_init will call kvm_init_irq_routing to
-we failed to decode the fp16 version of these instructions.
+initialize global capability variables. If we call kvm_init_irq_routing in
 GIC realize function, previous allocated memory will leak.
-Cc: qemu-stable@nongnu.org
+Fix this by deleting the unnecessary call.
-Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20180502221552.3873-3-richard.henderson@linaro.org
+Signed-off-by: Shannon Zhao <zhaoshenglong@huawei.com>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Reviewed-by: Eric Auger <eric.auger@redhat.com>
 Message-id: 1527750994-14360-1-git-send-email-zhaoshenglong@huawei.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- target/arm/translate-a64.c | 65 +++++++++++++++++++++++++++-----------
+ hw/intc/arm_gic_kvm.c   | 1 -
-file changed, 46 insertions(+), 19 deletions(-)
+ hw/intc/arm_gicv3_kvm.c | 1 -
 files changed, 2 deletions(-)
-diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
+diff --git a/hw/intc/arm_gic_kvm.c b/hw/intc/arm_gic_kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-a64.c
+--- a/hw/intc/arm_gic_kvm.c
-+++ b/target/arm/translate-a64.c
++++ b/hw/intc/arm_gic_kvm.c
-@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
+@@ -XXX,XX +XXX,XX @@ static void kvm_arm_gic_realize(DeviceState *dev, Error **errp)
-                                          bool is_q, bool is_u,
-                                          int immh, int immb, int rn, int rd)
+     if (kvm_has_gsi_routing()) {
- {
+         /* set up irq routing */
--    bool is_double = extract32(immh, 3, 1);
+-        kvm_init_irq_routing(kvm_state);
-     int immhb = immh << 3 | immb;
+         for (i = 0; i < s->num_irq - GIC_INTERNAL; ++i) {
--    int fracbits = (is_double ? 128 : 64) - immhb;
+             kvm_irqchip_add_irq_route(kvm_state, i, 0, i);
 -    int pass;
 +    int pass, size, fracbits;
      TCGv_ptr tcg_fpstatus;
      TCGv_i32 tcg_rmode, tcg_shift;
 -    if (!extract32(immh, 2, 2)) {
 -        unallocated_encoding(s);
 -        return;
 -    }
 -
 -    if (!is_scalar && !is_q && is_double) {
 +    if (immh & 0x8) {
 +        size = MO_64;
 +        if (!is_scalar && !is_q) {
 +            unallocated_encoding(s);
 +            return;
 +        }
 +    } else if (immh & 0x4) {
 +        size = MO_32;
 +    } else if (immh & 0x2) {
 +        size = MO_16;
 +        if (!arm_dc_feature(s, ARM_FEATURE_V8_FP16)) {
 +            unallocated_encoding(s);
 +            return;
 +        }
 +    } else {
 +        /* Should have split out AdvSIMD modified immediate earlier.  */
 +        assert(immh == 1);
          unallocated_encoding(s);
          return;
      }
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
      assert(!(is_scalar && is_q));
      tcg_rmode = tcg_const_i32(arm_rmode_to_sf(FPROUNDING_ZERO));
 -    tcg_fpstatus = get_fpstatus_ptr(false);
 +    tcg_fpstatus = get_fpstatus_ptr(size == MO_16);
      gen_helper_set_rmode(tcg_rmode, tcg_rmode, tcg_fpstatus);
 +    fracbits = (16 << size) - immhb;
      tcg_shift = tcg_const_i32(fracbits);
 -    if (is_double) {
 +    if (size == MO_64) {
          int maxpass = is_scalar ? 1 : 2;
          for (pass = 0; pass < maxpass; pass++) {
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
          }
-         clear_vec_high(s, is_q, rd);
+diff --git a/hw/intc/arm_gicv3_kvm.c b/hw/intc/arm_gicv3_kvm.c
-     } else {
+index XXXXXXX..XXXXXXX 100644
--        int maxpass = is_scalar ? 1 : is_q ? 4 : 2;
+--- a/hw/intc/arm_gicv3_kvm.c
-+        void (*fn)(TCGv_i32, TCGv_i32, TCGv_i32, TCGv_ptr);
++++ b/hw/intc/arm_gicv3_kvm.c
-+        int maxpass = is_scalar ? 1 : ((8 << is_q) >> size);
+@@ -XXX,XX +XXX,XX @@ static void kvm_arm_gicv3_realize(DeviceState *dev, Error **errp)
-+
-+        switch (size) {
+     if (kvm_has_gsi_routing()) {
-+        case MO_16:
+         /* set up irq routing */
-+            if (is_u) {
+-        kvm_init_irq_routing(kvm_state);
-+                fn = gen_helper_vfp_toulh;
+         for (i = 0; i < s->num_irq - GIC_INTERNAL; ++i) {
-+            } else {
+             kvm_irqchip_add_irq_route(kvm_state, i, 0, i);
 +                fn = gen_helper_vfp_toslh;
 +            }
 +            break;
 +        case MO_32:
 +            if (is_u) {
 +                fn = gen_helper_vfp_touls;
 +            } else {
 +                fn = gen_helper_vfp_tosls;
 +            }
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
 +
          for (pass = 0; pass < maxpass; pass++) {
              TCGv_i32 tcg_op = tcg_temp_new_i32();
 -            read_vec_element_i32(s, tcg_op, rn, pass, MO_32);
 -            if (is_u) {
 -                gen_helper_vfp_touls(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
 -            } else {
 -                gen_helper_vfp_tosls(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
 -            }
 +            read_vec_element_i32(s, tcg_op, rn, pass, size);
 +            fn(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
              if (is_scalar) {
                  write_fp_sreg(s, rd, tcg_op);
              } else {
 -                write_vec_element_i32(s, tcg_op, rd, pass, MO_32);
 +                write_vec_element_i32(s, tcg_op, rd, pass, size);
              }
              tcg_temp_free_i32(tcg_op);
          }
 --
-.17.0
+.17.1

The following changes since commit e5cd695266c5709308aa95b1baae499e4b5d4544:

Merge remote-tracking branch 'remotes/cody/tags/block-pull-request' into staging (2018-05-08 17:05:58 +0100)

are available in the Git repository at:

git://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20180510

for you to fetch changes up to 9a9f1f59521f46e8ff4527d9a2b52f83577e2aa3:

target/arm: Clear SVE high bits for FMOV (2018-05-10 18:10:58 +0100)

----------------------------------------------------------------
target-arm queue:
 * hw/arm/iotkit.c: fix minor memory leak
 * softfloat: fix wrong-exception-flags bug for multiply-add corner case
 * arm: isolate and clean up DTB generation
 * implement Arm v8.1-Atomics extension
 * Fix some bugs and missing instructions in the v8.2-FP16 extension

----------------------------------------------------------------
Igor Mammedov (4):
      pc: simplify MachineClass::get_hotplug_handler handling
      platform-bus-device: use device plug callback instead of machine_done notifier
      arm/boot: split load_dtb() from arm_load_kernel()
      make sure that we aren't overwriting mc->get_hotplug_handler by accident

Peter Maydell (3):
      hw/arm/iotkit.c: fix minor memory leak
      softfloat: Handle default NaN mode after pickNaNMulAdd, not before
      atomic.h: Work around gcc spurious "unused value" warning

Richard Henderson (14):
      tcg: Introduce helpers for integer min/max
      target/arm: Use new min/max expanders
      target/xtensa: Use new min/max expanders
      tcg: Introduce atomic helpers for integer min/max
      tcg: Use GEN_ATOMIC_HELPER_FN for opposite endian atomic add
      target/riscv: Use new atomic min/max expanders
      target/arm: Introduce ARM_FEATURE_V8_ATOMICS and initial decode
      target/arm: Fill in disas_ldst_atomic
      target/arm: Implement CAS and CASP
      target/arm: Enable ARM_FEATURE_V8_ATOMICS for user-only
      target/arm: Implement vector shifted SCVF/UCVF for fp16
      target/arm: Implement vector shifted FCVT for fp16
      target/arm: Fix float16 to/from int16
      target/arm: Clear SVE high bits for FMOV

It is implementation defined whether a multiply-add of
(0,inf,qnan) or (inf,0,qnan) raises InvalidaOperation or
not, so we let the target-specific pickNaNMulAdd function
handle this. This means that we must do the "return the
default NaN in default NaN mode" check after the call,
not before. Correct the ordering, and restore the comment
from the old propagateFloat64MulAddNaN() that warned about
this corner case.

This fixes a regression from 2.11 for Arm guests where we would
incorrectly fail to set the Invalid flag for these cases.

Cc: qemu-stable@nongnu.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Tested-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180504100547.14621-1-peter.maydell@linaro.org
---
 fpu/softfloat.c | 52 ++++++++++++++++++++++++++++---------------------
 1 file changed, 30 insertions(+), 22 deletions(-)

diff --git a/fpu/softfloat.c b/fpu/softfloat.c
index XXXXXXX..XXXXXXX 100644
--- a/fpu/softfloat.c
+++ b/fpu/softfloat.c
@@ -XXX,XX +XXX,XX @@ static FloatParts pick_nan(FloatParts a, FloatParts b, float_status *s)
 static FloatParts pick_nan_muladd(FloatParts a, FloatParts b, FloatParts c,
                                   bool inf_zero, float_status *s)
 {
+    int which;
+
     if (is_snan(a.cls) || is_snan(b.cls) || is_snan(c.cls)) {
         s->float_exception_flags |= float_flag_invalid;
     }
 
-    if (s->default_nan_mode) {
-        a.cls = float_class_dnan;
-    } else {
-        switch (pickNaNMulAdd(is_qnan(a.cls), is_snan(a.cls),
-                              is_qnan(b.cls), is_snan(b.cls),
-                              is_qnan(c.cls), is_snan(c.cls),
-                              inf_zero, s)) {
-        case 0:
-            break;
-        case 1:
-            a = b;
-            break;
-        case 2:
-            a = c;
-            break;
-        case 3:
-            a.cls = float_class_dnan;
-            return a;
-        default:
-            g_assert_not_reached();
-        }
+    which = pickNaNMulAdd(is_qnan(a.cls), is_snan(a.cls),
+                          is_qnan(b.cls), is_snan(b.cls),
+                          is_qnan(c.cls), is_snan(c.cls),
+                          inf_zero, s);
 
-        a.cls = float_class_msnan;
+    if (s->default_nan_mode) {
+        /* Note that this check is after pickNaNMulAdd so that function
+         * has an opportunity to set the Invalid flag.
+         */
+        a.cls = float_class_dnan;
+        return a;
     }
+
+    switch (which) {
+    case 0:
+        break;
+    case 1:
+        a = b;
+        break;
+    case 2:
+        a = c;
+        break;
+    case 3:
+        a.cls = float_class_dnan;
+        return a;
+    default:
+        g_assert_not_reached();
+    }
+    a.cls = float_class_msnan;
+
     return a;
 }
 
-- 
2.17.0

From: Igor Mammedov <imammedo@redhat.com>

By default MachineClass::get_hotplug_handler is NULL and concrete board
should set it to it's own handler.
Considering there isn't any default handler, drop saving empty
MachineClass::get_hotplug_handler in child class and make PC code
consistent with spapr/s390x boards.

We can bring this back when actual usecase surfaces and do it
consistently across boards that use get_hotplug_handler().

Suggested-by: David Gibson <david@gibson.dropbear.id.au>
Signed-off-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Eduardo Habkost <ehabkost@redhat.com>
Message-id: 1525691524-32265-2-git-send-email-imammedo@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/i386/pc.h | 8 --------
 hw/i386/pc.c         | 6 +-----
 2 files changed, 1 insertion(+), 13 deletions(-)

diff --git a/include/hw/i386/pc.h b/include/hw/i386/pc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/i386/pc.h
+++ b/include/hw/i386/pc.h
@@ -XXX,XX +XXX,XX @@ struct PCMachineState {
 /**
  * PCMachineClass:
  *
- * Methods:
- *
- * @get_hotplug_handler: pointer to parent class callback @get_hotplug_handler
- *
  * Compat fields:
  *
  * @enforce_aligned_dimm: check that DIMM's address/size is aligned by
@@ -XXX,XX +XXX,XX @@ struct PCMachineClass {
 
     /*< public >*/
 
-    /* Methods: */
-    HotplugHandler *(*get_hotplug_handler)(MachineState *machine,
-                                           DeviceState *dev);
-
     /* Device configuration: */
     bool pci_enabled;
     bool kvmclock_enabled;
diff --git a/hw/i386/pc.c b/hw/i386/pc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/i386/pc.c
+++ b/hw/i386/pc.c
@@ -XXX,XX +XXX,XX @@ static void pc_machine_device_unplug_cb(HotplugHandler *hotplug_dev,
 static HotplugHandler *pc_get_hotpug_handler(MachineState *machine,
                                              DeviceState *dev)
 {
-    PCMachineClass *pcmc = PC_MACHINE_GET_CLASS(machine);
-
     if (object_dynamic_cast(OBJECT(dev), TYPE_PC_DIMM) ||
         object_dynamic_cast(OBJECT(dev), TYPE_CPU)) {
         return HOTPLUG_HANDLER(machine);
     }
 
-    return pcmc->get_hotplug_handler ?
-        pcmc->get_hotplug_handler(machine, dev) : NULL;
+    return NULL;
 }
 
 static void
@@ -XXX,XX +XXX,XX @@ static void pc_machine_class_init(ObjectClass *oc, void *data)
     HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
     NMIClass *nc = NMI_CLASS(oc);
 
-    pcmc->get_hotplug_handler = mc->get_hotplug_handler;
     pcmc->pci_enabled = true;
     pcmc->has_acpi_build = true;
     pcmc->rsdp_in_ram = true;
-- 
2.17.0

From: Igor Mammedov <imammedo@redhat.com>

platform-bus were using machine_done notifier to get and map
(assign irq/mmio resources) dynamically added sysbus devices
after all '-device' options had been processed.
That however creates non obvious dependencies on ordering of
machine_done notifiers and requires carefull line juggling
to keep it working. For example see comment above
create_platform_bus() and 'straitforward' arm_load_kernel()
had to converted to machine_done notifier and that lead to
yet another machine_done notifier to keep it working
arm_register_platform_bus_fdt_creator().

Instead of hiding resource assignment in platform-bus-device
to magically initialize sysbus devices, use device plug
callback and assign resources explicitly at board level
at the moment each -device option is being processed.

That adds a bunch of machine declaration boiler plate to
e500plat board, similar to ARM/x86 but gets rid of hidden
machine_done notifier and would allow to remove the dependent
notifiers in ARM code simplifying it and making code flow
easier to follow.

Signed-off-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Acked-by: David Gibson <david@gibson.dropbear.id.au>
Message-id: 1525691524-32265-3-git-send-email-imammedo@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/ppc/e500.h             |  5 +++++
 include/hw/arm/virt.h     |  1 +
 include/hw/platform-bus.h |  4 ++--
 hw/arm/sysbus-fdt.c       |  3 ---
 hw/arm/virt.c             | 31 +++++++++++++++++++++++++++++++
 hw/core/platform-bus.c    | 29 +++++------------------------
 hw/ppc/e500.c             | 38 +++++++++++++++++---------------------
 hw/ppc/e500plat.c         | 31 +++++++++++++++++++++++++++++++
 8 files changed, 92 insertions(+), 50 deletions(-)

diff --git a/hw/ppc/e500.h b/hw/ppc/e500.h
index XXXXXXX..XXXXXXX 100644
--- a/hw/ppc/e500.h
+++ b/hw/ppc/e500.h
@@ -XXX,XX +XXX,XX @@
 #define PPCE500_H
 
 #include "hw/boards.h"
+#include "hw/platform-bus.h"
 
 typedef struct PPCE500MachineState {
     /*< private >*/
     MachineState parent_obj;
 
+    /* points to instance of TYPE_PLATFORM_BUS_DEVICE if
+     * board supports dynamic sysbus devices
+     */
+    PlatformBusDevice *pbus_dev;
 } PPCE500MachineState;
 
 typedef struct PPCE500MachineClass {
diff --git a/include/hw/arm/virt.h b/include/hw/arm/virt.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/virt.h
+++ b/include/hw/arm/virt.h
@@ -XXX,XX +XXX,XX @@ typedef struct {
 typedef struct {
     MachineState parent;
     Notifier machine_done;
+    DeviceState *platform_bus_dev;
     FWCfgState *fw_cfg;
     bool secure;
     bool highmem;
diff --git a/include/hw/platform-bus.h b/include/hw/platform-bus.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/platform-bus.h
+++ b/include/hw/platform-bus.h
@@ -XXX,XX +XXX,XX @@ typedef struct PlatformBusDevice PlatformBusDevice;
 struct PlatformBusDevice {
     /*< private >*/
     SysBusDevice parent_obj;
-    Notifier notifier;
-    bool done_gathering;
 
     /*< public >*/
     uint32_t mmio_size;
@@ -XXX,XX +XXX,XX @@ int platform_bus_get_irqn(PlatformBusDevice *platform_bus, SysBusDevice *sbdev,
 hwaddr platform_bus_get_mmio_addr(PlatformBusDevice *pbus, SysBusDevice *sbdev,
                                   int n);
 
+void platform_bus_link_device(PlatformBusDevice *pbus, SysBusDevice *sbdev);
+
 #endif /* HW_PLATFORM_BUS_H */
diff --git a/hw/arm/sysbus-fdt.c b/hw/arm/sysbus-fdt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sysbus-fdt.c
+++ b/hw/arm/sysbus-fdt.c
@@ -XXX,XX +XXX,XX @@ static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
     dev = qdev_find_recursive(sysbus_get_default(), TYPE_PLATFORM_BUS_DEVICE);
     pbus = PLATFORM_BUS_DEVICE(dev);
 
-    /* We can only create dt nodes for dynamic devices when they're ready */
-    assert(pbus->done_gathering);
-
     PlatformBusFDTData data = {
         .fdt = fdt,
         .irq_start = irq_start,
diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void create_platform_bus(VirtMachineState *vms, qemu_irq *pic)
     qdev_prop_set_uint32(dev, "mmio_size",
         platform_bus_params.platform_bus_size);
     qdev_init_nofail(dev);
+    vms->platform_bus_dev = dev;
     s = SYS_BUS_DEVICE(dev);
 
     for (i = 0; i < platform_bus_params.platform_bus_num_irqs; i++) {
@@ -XXX,XX +XXX,XX @@ static const CPUArchIdList *virt_possible_cpu_arch_ids(MachineState *ms)
     return ms->possible_cpus;
 }
 
+static void virt_machine_device_plug_cb(HotplugHandler *hotplug_dev,
+                                        DeviceState *dev, Error **errp)
+{
+    VirtMachineState *vms = VIRT_MACHINE(hotplug_dev);
+
+    if (vms->platform_bus_dev) {
+        if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
+            platform_bus_link_device(PLATFORM_BUS_DEVICE(vms->platform_bus_dev),
+                                     SYS_BUS_DEVICE(dev));
+        }
+    }
+}
+
+static HotplugHandler *virt_machine_get_hotplug_handler(MachineState *machine,
+                                                        DeviceState *dev)
+{
+    if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
+        return HOTPLUG_HANDLER(machine);
+    }
+
+    return NULL;
+}
+
 static void virt_machine_class_init(ObjectClass *oc, void *data)
 {
     MachineClass *mc = MACHINE_CLASS(oc);
+    HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
 
     mc->init = machvirt_init;
     /* Start max_cpus at the maximum QEMU supports. We'll further restrict
@@ -XXX,XX +XXX,XX @@ static void virt_machine_class_init(ObjectClass *oc, void *data)
     mc->cpu_index_to_instance_props = virt_cpu_index_to_props;
     mc->default_cpu_type = ARM_CPU_TYPE_NAME("cortex-a15");
     mc->get_default_cpu_node_id = virt_get_default_cpu_node_id;
+    mc->get_hotplug_handler = virt_machine_get_hotplug_handler;
+    hc->plug = virt_machine_device_plug_cb;
 }
 
 static const TypeInfo virt_machine_info = {
@@ -XXX,XX +XXX,XX @@ static const TypeInfo virt_machine_info = {
     .instance_size = sizeof(VirtMachineState),
     .class_size    = sizeof(VirtMachineClass),
     .class_init    = virt_machine_class_init,
+    .interfaces = (InterfaceInfo[]) {
+         { TYPE_HOTPLUG_HANDLER },
+         { }
+    },
 };
 
 static void machvirt_machine_init(void)
diff --git a/hw/core/platform-bus.c b/hw/core/platform-bus.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/platform-bus.c
+++ b/hw/core/platform-bus.c
@@ -XXX,XX +XXX,XX @@ static void plaform_bus_refresh_irqs(PlatformBusDevice *pbus)
 {
     bitmap_zero(pbus->used_irqs, pbus->num_irqs);
     foreach_dynamic_sysbus_device(platform_bus_count_irqs, pbus);
-    pbus->done_gathering = true;
 }
 
 static void platform_bus_map_irq(PlatformBusDevice *pbus, SysBusDevice *sbdev,
@@ -XXX,XX +XXX,XX @@ static void platform_bus_map_mmio(PlatformBusDevice *pbus, SysBusDevice *sbdev,
 }
 
 /*
- * For each sysbus device, look for unassigned IRQ lines as well as
- * unassociated MMIO regions. Connect them to the platform bus if available.
+ * Look for unassigned IRQ lines as well as unassociated MMIO regions.
+ * Connect them to the platform bus if available.
  */
-static void link_sysbus_device(SysBusDevice *sbdev, void *opaque)
+void platform_bus_link_device(PlatformBusDevice *pbus, SysBusDevice *sbdev)
 {
-    PlatformBusDevice *pbus = opaque;
     int i;
 
     for (i = 0; sysbus_has_irq(sbdev, i); i++) {
@@ -XXX,XX +XXX,XX @@ static void link_sysbus_device(SysBusDevice *sbdev, void *opaque)
     }
 }
 
-static void platform_bus_init_notify(Notifier *notifier, void *data)
-{
-    PlatformBusDevice *pb = container_of(notifier, PlatformBusDevice, notifier);
-
-    /*
-     * Generate a bitmap of used IRQ lines, as the user might have specified
-     * them on the command line.
-     */
-    plaform_bus_refresh_irqs(pb);
-
-    foreach_dynamic_sysbus_device(link_sysbus_device, pb);
-}
-
 static void platform_bus_realize(DeviceState *dev, Error **errp)
 {
     PlatformBusDevice *pbus;
@@ -XXX,XX +XXX,XX @@ static void platform_bus_realize(DeviceState *dev, Error **errp)
         sysbus_init_irq(d, &pbus->irqs[i]);
     }
 
-    /*
-     * Register notifier that allows us to gather dangling devices once the
-     * machine is completely assembled
-     */
-    pbus->notifier.notify = platform_bus_init_notify;
-    qemu_add_machine_init_done_notifier(&pbus->notifier);
+    /* some devices might be initialized before so update used IRQs map */
+    plaform_bus_refresh_irqs(pbus);
 }
 
 static Property platform_bus_properties[] = {
diff --git a/hw/ppc/e500.c b/hw/ppc/e500.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/ppc/e500.c
+++ b/hw/ppc/e500.c
@@ -XXX,XX +XXX,XX @@ static void sysbus_device_create_devtree(SysBusDevice *sbdev, void *opaque)
     }
 }
 
-static void platform_bus_create_devtree(const PPCE500MachineClass *pmc,
+static void platform_bus_create_devtree(PPCE500MachineState *pms,
                                         void *fdt, const char *mpic)
 {
+    const PPCE500MachineClass *pmc = PPCE500_MACHINE_GET_CLASS(pms);
     gchar *node = g_strdup_printf("/platform@%"PRIx64, pmc->platform_bus_base);
     const char platcomp[] = "qemu,platform\0simple-bus";
     uint64_t addr = pmc->platform_bus_base;
     uint64_t size = pmc->platform_bus_size;
     int irq_start = pmc->platform_bus_first_irq;
-    PlatformBusDevice *pbus;
-    DeviceState *dev;
 
     /* Create a /platform node that we can put all devices into */
 
@@ -XXX,XX +XXX,XX @@ static void platform_bus_create_devtree(const PPCE500MachineClass *pmc,
 
     qemu_fdt_setprop_phandle(fdt, node, "interrupt-parent", mpic);
 
-    dev = qdev_find_recursive(sysbus_get_default(), TYPE_PLATFORM_BUS_DEVICE);
-    pbus = PLATFORM_BUS_DEVICE(dev);
+    /* Create dt nodes for dynamic devices */
+    PlatformDevtreeData data = {
+        .fdt = fdt,
+        .mpic = mpic,
+        .irq_start = irq_start,
+        .node = node,
+        .pbus = pms->pbus_dev,
+    };
 
-    /* We can only create dt nodes for dynamic devices when they're ready */
-    if (pbus->done_gathering) {
-        PlatformDevtreeData data = {
-            .fdt = fdt,
-            .mpic = mpic,
-            .irq_start = irq_start,
-            .node = node,
-            .pbus = pbus,
-        };
-
-        /* Loop through all dynamic sysbus devices and create nodes for them */
-        foreach_dynamic_sysbus_device(sysbus_device_create_devtree, &data);
-    }
+    /* Loop through all dynamic sysbus devices and create nodes for them */
+    foreach_dynamic_sysbus_device(sysbus_device_create_devtree, &data);
 
     g_free(node);
 }
@@ -XXX,XX +XXX,XX @@ static int ppce500_load_device_tree(PPCE500MachineState *pms,
     }
     g_free(soc);
 
-    if (pmc->has_platform_bus) {
-        platform_bus_create_devtree(pmc, fdt, mpic);
+    if (pms->pbus_dev) {
+        platform_bus_create_devtree(pms, fdt, mpic);
     }
     g_free(mpic);
 
@@ -XXX,XX +XXX,XX @@ void ppce500_init(MachineState *machine)
         qdev_prop_set_uint32(dev, "num_irqs", pmc->platform_bus_num_irqs);
         qdev_prop_set_uint32(dev, "mmio_size", pmc->platform_bus_size);
         qdev_init_nofail(dev);
-        s = SYS_BUS_DEVICE(dev);
+        pms->pbus_dev = PLATFORM_BUS_DEVICE(dev);
 
+        s = SYS_BUS_DEVICE(pms->pbus_dev);
         for (i = 0; i < pmc->platform_bus_num_irqs; i++) {
             int irqn = pmc->platform_bus_first_irq + i;
             sysbus_connect_irq(s, i, qdev_get_gpio_in(mpicdev, irqn));
@@ -XXX,XX +XXX,XX @@ static const TypeInfo ppce500_info = {
     .name          = TYPE_PPCE500_MACHINE,
     .parent        = TYPE_MACHINE,
     .abstract      = true,
+    .instance_size = sizeof(PPCE500MachineState),
     .class_size    = sizeof(PPCE500MachineClass),
 };
 
diff --git a/hw/ppc/e500plat.c b/hw/ppc/e500plat.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/ppc/e500plat.c
+++ b/hw/ppc/e500plat.c
@@ -XXX,XX +XXX,XX @@ static void e500plat_init(MachineState *machine)
     ppce500_init(machine);
 }
 
+static void e500plat_machine_device_plug_cb(HotplugHandler *hotplug_dev,
+                                            DeviceState *dev, Error **errp)
+{
+    PPCE500MachineState *pms = PPCE500_MACHINE(hotplug_dev);
+
+    if (pms->pbus_dev) {
+        if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
+            platform_bus_link_device(pms->pbus_dev, SYS_BUS_DEVICE(dev));
+        }
+    }
+}
+
+static
+HotplugHandler *e500plat_machine_get_hotpug_handler(MachineState *machine,
+                                                    DeviceState *dev)
+{
+    if (object_dynamic_cast(OBJECT(dev), TYPE_SYS_BUS_DEVICE)) {
+        return HOTPLUG_HANDLER(machine);
+    }
+
+    return NULL;
+}
+
 #define TYPE_E500PLAT_MACHINE  MACHINE_TYPE_NAME("ppce500")
 
 static void e500plat_machine_class_init(ObjectClass *oc, void *data)
 {
     PPCE500MachineClass *pmc = PPCE500_MACHINE_CLASS(oc);
+    HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
     MachineClass *mc = MACHINE_CLASS(oc);
 
+    mc->get_hotplug_handler = e500plat_machine_get_hotpug_handler;
+    hc->plug = e500plat_machine_device_plug_cb;
+
     pmc->pci_first_slot = 0x1;
     pmc->pci_nr_slots = PCI_SLOT_MAX - 1;
     pmc->fixup_devtree = e500plat_fixup_devtree;
@@ -XXX,XX +XXX,XX @@ static const TypeInfo e500plat_info = {
     .name          = TYPE_E500PLAT_MACHINE,
     .parent        = TYPE_PPCE500_MACHINE,
     .class_init    = e500plat_machine_class_init,
+    .interfaces    = (InterfaceInfo[]) {
+         { TYPE_HOTPLUG_HANDLER },
+         { }
+    }
 };
 
 static void e500plat_register_types(void)
-- 
2.17.0

From: Igor Mammedov <imammedo@redhat.com>

load_dtb() depends on arm_load_kernel() to figure out place
in RAM where it should be loaded, but it's not required for
arm_load_kernel() to work. Sometimes it's neccesary for
devices added with -device/device_add to be enumerated in
DTB as well, which's lead to [1] and surrounding commits to
add 2 more machine_done notifiers with non obvious ordering
to make dynamic sysbus devices initialization happen in
the right order.

However instead of moving whole arm_load_kernel() in to
machine_done, it's sufficient to move only load_dtb() into
virt_machine_done() notifier and remove ArmLoadKernelNotifier/
/PlatformBusFDTNotifierParams notifiers, which saves us ~90LOC
and simplifies code flow quite a bit.
Later would allow to consolidate DTB generation within one
function for 'mach-virt' board and make it reentrant so it
could generate updated DTB in device hotplug secenarios.

While at it rename load_dtb() to arm_load_dtb() since it's
public now.

Add additional field skip_dtb_autoload to struct arm_boot_info
to allow manual DTB load later in mach-virt and to avoid touching
all other boards to explicitly call arm_load_dtb().

1) (ac9d32e hw/arm/boot: arm_load_kernel implemented as a machine init done notifier)

Signed-off-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Andrew Jones <drjones@redhat.com>
Message-id: 1525691524-32265-4-git-send-email-imammedo@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/arm.h        | 45 +++++++++++++++++------
 include/hw/arm/sysbus-fdt.h | 37 ++++---------------
 hw/arm/boot.c               | 72 ++++++++++---------------------------
 hw/arm/sysbus-fdt.c         | 61 +++----------------------------
 hw/arm/virt.c               | 64 ++++++++++++++++-----------------
 5 files changed, 94 insertions(+), 185 deletions(-)

diff --git a/include/hw/arm/arm.h b/include/hw/arm/arm.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/arm.h
+++ b/include/hw/arm/arm.h
@@ -XXX,XX +XXX,XX @@ DeviceState *armv7m_init(MemoryRegion *system_memory, int mem_size, int num_irq,
  */
 void armv7m_load_kernel(ARMCPU *cpu, const char *kernel_filename, int mem_size);
 
-/*
- * struct used as a parameter of the arm_load_kernel machine init
- * done notifier
- */
-typedef struct {
-    Notifier notifier; /* actual notifier */
-    ARMCPU *cpu; /* handle to the first cpu object */
-} ArmLoadKernelNotifier;
-
 /* arm_boot.c */
 struct arm_boot_info {
     uint64_t ram_size;
@@ -XXX,XX +XXX,XX @@ struct arm_boot_info {
     const char *initrd_filename;
     const char *dtb_filename;
     hwaddr loader_start;
+    hwaddr dtb_start;
+    hwaddr dtb_limit;
+    /* If set to True, arm_load_kernel() will not load DTB.
+     * It allows board to load DTB manually later.
+     * (default: False)
+     */
+    bool skip_dtb_autoload;
     /* multicore boards that use the default secondary core boot functions
      * need to put the address of the secondary boot code, the boot reg,
      * and the GIC address in the next 3 values, respectively. boards that
@@ -XXX,XX +XXX,XX @@ struct arm_boot_info {
      * the user it should implement this hook.
      */
     void (*modify_dtb)(const struct arm_boot_info *info, void *fdt);
-    /* machine init done notifier executing arm_load_dtb */
-    ArmLoadKernelNotifier load_kernel_notifier;
     /* Used internally by arm_boot.c */
     int is_linux;
     hwaddr initrd_start;
@@ -XXX,XX +XXX,XX @@ struct arm_boot_info {
  */
 void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info);
 
+AddressSpace *arm_boot_address_space(ARMCPU *cpu,
+                                     const struct arm_boot_info *info);
+
+/**
+ * arm_load_dtb() - load a device tree binary image into memory
+ * @addr:       the address to load the image at
+ * @binfo:      struct describing the boot environment
+ * @addr_limit: upper limit of the available memory area at @addr
+ * @as:         address space to load image to
+ *
+ * Load a device tree supplied by the machine or by the user  with the
+ * '-dtb' command line option, and put it at offset @addr in target
+ * memory.
+ *
+ * If @addr_limit contains a meaningful value (i.e., it is strictly greater
+ * than @addr), the device tree is only loaded if its size does not exceed
+ * the limit.
+ *
+ * Returns: the size of the device tree image on success,
+ *          0 if the image size exceeds the limit,
+ *          -1 on errors.
+ *
+ * Note: Must not be called unless have_dtb(binfo) is true.
+ */
+int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
+                 hwaddr addr_limit, AddressSpace *as);
+
 /* Write a secure board setup routine with a dummy handler for SMCs */
 void arm_write_secure_board_setup_dummy_smc(ARMCPU *cpu,
                                             const struct arm_boot_info *info,
diff --git a/include/hw/arm/sysbus-fdt.h b/include/hw/arm/sysbus-fdt.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/sysbus-fdt.h
+++ b/include/hw/arm/sysbus-fdt.h
@@ -XXX,XX +XXX,XX @@
 #ifndef HW_ARM_SYSBUS_FDT_H
 #define HW_ARM_SYSBUS_FDT_H
 
-#include "hw/arm/arm.h"
-#include "qemu-common.h"
-#include "hw/sysbus.h"
-
-/*
- * struct that contains dimensioning parameters of the platform bus
- */
-typedef struct {
-    hwaddr platform_bus_base; /* start address of the bus */
-    hwaddr platform_bus_size; /* size of the bus */
-    int platform_bus_first_irq; /* first hwirq assigned to the bus */
-    int platform_bus_num_irqs; /* number of hwirq assigned to the bus */
-} ARMPlatformBusSystemParams;
-
-/*
- * struct that contains all relevant info to build the fdt nodes of
- * platform bus and attached dynamic sysbus devices
- * in the future might be augmented with additional info
- * such as PHY, CLK handles ...
- */
-typedef struct {
-    const ARMPlatformBusSystemParams *system_params;
-    struct arm_boot_info *binfo;
-    const char *intc; /* parent interrupt controller name */
-} ARMPlatformBusFDTParams;
+#include "exec/hwaddr.h"
 
 /**
- * arm_register_platform_bus_fdt_creator - register a machine init done
- * notifier that creates the device tree nodes of the platform bus and
- * associated dynamic sysbus devices
+ * platform_bus_add_all_fdt_nodes - create all the platform bus nodes
+ *
+ * builds the parent platform bus node and all the nodes of dynamic
+ * sysbus devices attached to it.
  */
-void arm_register_platform_bus_fdt_creator(ARMPlatformBusFDTParams *fdt_params);
-
+void platform_bus_add_all_fdt_nodes(void *fdt, const char *intc, hwaddr addr,
+                                    hwaddr bus_size, int irq_start);
 #endif
diff --git a/hw/arm/boot.c b/hw/arm/boot.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/boot.c
+++ b/hw/arm/boot.c
@@ -XXX,XX +XXX,XX @@
 #define ARM64_TEXT_OFFSET_OFFSET    8
 #define ARM64_MAGIC_OFFSET          56
 
-static AddressSpace *arm_boot_address_space(ARMCPU *cpu,
-                                            const struct arm_boot_info *info)
+AddressSpace *arm_boot_address_space(ARMCPU *cpu,
+                                     const struct arm_boot_info *info)
 {
     /* Return the address space to use for bootloader reads and writes.
      * We prefer the secure address space if the CPU has it and we're
@@ -XXX,XX +XXX,XX @@ static void fdt_add_psci_node(void *fdt)
     qemu_fdt_setprop_cell(fdt, "/psci", "migrate", migrate_fn);
 }
 
-/**
- * load_dtb() - load a device tree binary image into memory
- * @addr:       the address to load the image at
- * @binfo:      struct describing the boot environment
- * @addr_limit: upper limit of the available memory area at @addr
- * @as:         address space to load image to
- *
- * Load a device tree supplied by the machine or by the user  with the
- * '-dtb' command line option, and put it at offset @addr in target
- * memory.
- *
- * If @addr_limit contains a meaningful value (i.e., it is strictly greater
- * than @addr), the device tree is only loaded if its size does not exceed
- * the limit.
- *
- * Returns: the size of the device tree image on success,
- *          0 if the image size exceeds the limit,
- *          -1 on errors.
- *
- * Note: Must not be called unless have_dtb(binfo) is true.
- */
-static int load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
-                    hwaddr addr_limit, AddressSpace *as)
+int arm_load_dtb(hwaddr addr, const struct arm_boot_info *binfo,
+                 hwaddr addr_limit, AddressSpace *as)
 {
     void *fdt = NULL;
     int size, rc;
@@ -XXX,XX +XXX,XX @@ static uint64_t load_aarch64_image(const char *filename, hwaddr mem_base,
     return size;
 }
 
-static void arm_load_kernel_notify(Notifier *notifier, void *data)
+void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
 {
     CPUState *cs;
     int kernel_size;
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
     int elf_machine;
     hwaddr entry;
     static const ARMInsnFixup *primary_loader;
-    ArmLoadKernelNotifier *n = DO_UPCAST(ArmLoadKernelNotifier,
-                                         notifier, notifier);
-    ARMCPU *cpu = n->cpu;
-    struct arm_boot_info *info =
-        container_of(n, struct arm_boot_info, load_kernel_notifier);
     AddressSpace *as = arm_boot_address_space(cpu, info);
 
     /* The board code is not supposed to set secure_board_setup unless
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
     assert(!(info->secure_board_setup && kvm_enabled()));
 
     info->dtb_filename = qemu_opt_get(qemu_get_machine_opts(), "dtb");
+    info->dtb_limit = 0;
 
     /* Load the kernel.  */
     if (!info->kernel_filename || info->firmware_loaded) {
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
              * the kernel is supposed to be loaded by the bootloader), copy the
              * DTB to the base of RAM for the bootloader to pick up.
              */
-            if (load_dtb(info->loader_start, info, 0, as) < 0) {
-                exit(1);
-            }
+            info->dtb_start = info->loader_start;
         }
 
         if (info->kernel_filename) {
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
          */
         if (elf_low_addr > info->loader_start
             || elf_high_addr < info->loader_start) {
-            /* Pass elf_low_addr as address limit to load_dtb if it may be
+            /* Set elf_low_addr as address limit for arm_load_dtb if it may be
              * pointing into RAM, otherwise pass '0' (no limit)
              */
             if (elf_low_addr < info->loader_start) {
                 elf_low_addr = 0;
             }
-            if (load_dtb(info->loader_start, info, elf_low_addr, as) < 0) {
-                exit(1);
-            }
+            info->dtb_start = info->loader_start;
+            info->dtb_limit = elf_low_addr;
         }
     }
     entry = elf_entry;
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
          */
         if (have_dtb(info)) {
             hwaddr align;
-            hwaddr dtb_start;
 
             if (elf_machine == EM_AARCH64) {
                 /*
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
             }
 
             /* Place the DTB after the initrd in memory with alignment. */
-            dtb_start = QEMU_ALIGN_UP(info->initrd_start + initrd_size, align);
-            if (load_dtb(dtb_start, info, 0, as) < 0) {
-                exit(1);
-            }
-            fixupcontext[FIXUP_ARGPTR] = dtb_start;
+            info->dtb_start = QEMU_ALIGN_UP(info->initrd_start + initrd_size,
+                                           align);
+            fixupcontext[FIXUP_ARGPTR] = info->dtb_start;
         } else {
             fixupcontext[FIXUP_ARGPTR] = info->loader_start + KERNEL_ARGS_ADDR;
             if (info->ram_size >= (1ULL << 32)) {
@@ -XXX,XX +XXX,XX @@ static void arm_load_kernel_notify(Notifier *notifier, void *data)
     for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
         ARM_CPU(cs)->env.boot_info = info;
     }
-}
-
-void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
-{
-    CPUState *cs;
-
-    info->load_kernel_notifier.cpu = cpu;
-    info->load_kernel_notifier.notifier.notify = arm_load_kernel_notify;
-    qemu_add_machine_init_done_notifier(&info->load_kernel_notifier.notifier);
 
     /* CPU objects (unlike devices) are not automatically reset on system
      * reset, so we must always register a handler to do so. If we're
@@ -XXX,XX +XXX,XX @@ void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
     for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
         qemu_register_reset(do_cpu_reset, ARM_CPU(cs));
     }
+
+    if (!info->skip_dtb_autoload && have_dtb(info)) {
+        if (arm_load_dtb(info->dtb_start, info, info->dtb_limit, as) < 0) {
+            exit(1);
+        }
+    }
 }
 
 static const TypeInfo arm_linux_boot_if_info = {
diff --git a/hw/arm/sysbus-fdt.c b/hw/arm/sysbus-fdt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sysbus-fdt.c
+++ b/hw/arm/sysbus-fdt.c
@@ -XXX,XX +XXX,XX @@ typedef struct PlatformBusFDTData {
     PlatformBusDevice *pbus;
 } PlatformBusFDTData;
 
-/*
- * struct used when calling the machine init done notifier
- * that constructs the fdt nodes of platform bus devices
- */
-typedef struct PlatformBusFDTNotifierParams {
-    Notifier notifier;
-    ARMPlatformBusFDTParams *fdt_params;
-} PlatformBusFDTNotifierParams;
-
 /* struct that associates a device type name and a node creation function */
 typedef struct NodeCreationPair {
     const char *typename;
@@ -XXX,XX +XXX,XX @@ static void add_fdt_node(SysBusDevice *sbdev, void *opaque)
     exit(1);
 }
 
-/**
- * add_all_platform_bus_fdt_nodes - create all the platform bus nodes
- *
- * builds the parent platform bus node and all the nodes of dynamic
- * sysbus devices attached to it.
- */
-static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
+void platform_bus_add_all_fdt_nodes(void *fdt, const char *intc, hwaddr addr,
+                                    hwaddr bus_size, int irq_start)
 {
     const char platcomp[] = "qemu,platform\0simple-bus";
     PlatformBusDevice *pbus;
     DeviceState *dev;
     gchar *node;
-    uint64_t addr, size;
-    int irq_start, dtb_size;
-    struct arm_boot_info *info = fdt_params->binfo;
-    const ARMPlatformBusSystemParams *params = fdt_params->system_params;
-    const char *intc = fdt_params->intc;
-    void *fdt = info->get_dtb(info, &dtb_size);
-
-    /*
-     * If the user provided a dtb, we assume the dynamic sysbus nodes
-     * already are integrated there. This corresponds to a use case where
-     * the dynamic sysbus nodes are complex and their generation is not yet
-     * supported. In that case the user can take charge of the guest dt
-     * while qemu takes charge of the qom stuff.
-     */
-    if (info->dtb_filename) {
-        return;
-    }
 
     assert(fdt);
 
-    node = g_strdup_printf("/platform@%"PRIx64, params->platform_bus_base);
-    addr = params->platform_bus_base;
-    size = params->platform_bus_size;
-    irq_start = params->platform_bus_first_irq;
+    node = g_strdup_printf("/platform@%"PRIx64, addr);
 
     /* Create a /platform node that we can put all devices into */
     qemu_fdt_add_subnode(fdt, node);
@@ -XXX,XX +XXX,XX @@ static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
      */
     qemu_fdt_setprop_cells(fdt, node, "#size-cells", 1);
     qemu_fdt_setprop_cells(fdt, node, "#address-cells", 1);
-    qemu_fdt_setprop_cells(fdt, node, "ranges", 0, addr >> 32, addr, size);
+    qemu_fdt_setprop_cells(fdt, node, "ranges", 0, addr >> 32, addr, bus_size);
 
     qemu_fdt_setprop_phandle(fdt, node, "interrupt-parent", intc);
 
@@ -XXX,XX +XXX,XX @@ static void add_all_platform_bus_fdt_nodes(ARMPlatformBusFDTParams *fdt_params)
 
     g_free(node);
 }
-
-static void platform_bus_fdt_notify(Notifier *notifier, void *data)
-{
-    PlatformBusFDTNotifierParams *p = DO_UPCAST(PlatformBusFDTNotifierParams,
-                                                notifier, notifier);
-
-    add_all_platform_bus_fdt_nodes(p->fdt_params);
-    g_free(p->fdt_params);
-    g_free(p);
-}
-
-void arm_register_platform_bus_fdt_creator(ARMPlatformBusFDTParams *fdt_params)
-{
-    PlatformBusFDTNotifierParams *p = g_new(PlatformBusFDTNotifierParams, 1);
-
-    p->fdt_params = fdt_params;
-    p->notifier.notify = platform_bus_fdt_notify;
-    qemu_add_machine_init_done_notifier(&p->notifier);
-}
diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@
 
 #define PLATFORM_BUS_NUM_IRQS 64
 
-static ARMPlatformBusSystemParams platform_bus_params;
-
 /* RAM limit in GB. Since VIRT_MEM starts at the 1GB mark, this means
  * RAM can go up to the 256GB mark, leaving 256GB of the physical
  * address space unallocated and free for future use between 256G and 512G.
@@ -XXX,XX +XXX,XX @@ static void create_platform_bus(VirtMachineState *vms, qemu_irq *pic)
     DeviceState *dev;
     SysBusDevice *s;
     int i;
-    ARMPlatformBusFDTParams *fdt_params = g_new(ARMPlatformBusFDTParams, 1);
     MemoryRegion *sysmem = get_system_memory();
 
-    platform_bus_params.platform_bus_base = vms->memmap[VIRT_PLATFORM_BUS].base;
-    platform_bus_params.platform_bus_size = vms->memmap[VIRT_PLATFORM_BUS].size;
-    platform_bus_params.platform_bus_first_irq = vms->irqmap[VIRT_PLATFORM_BUS];
-    platform_bus_params.platform_bus_num_irqs = PLATFORM_BUS_NUM_IRQS;
-
-    fdt_params->system_params = &platform_bus_params;
-    fdt_params->binfo = &vms->bootinfo;
-    fdt_params->intc = "/intc";
-    /*
-     * register a machine init done notifier that creates the device tree
-     * nodes of the platform bus and its children dynamic sysbus devices
-     */
-    arm_register_platform_bus_fdt_creator(fdt_params);
-
     dev = qdev_create(NULL, TYPE_PLATFORM_BUS_DEVICE);
     dev->id = TYPE_PLATFORM_BUS_DEVICE;
-    qdev_prop_set_uint32(dev, "num_irqs",
-        platform_bus_params.platform_bus_num_irqs);
-    qdev_prop_set_uint32(dev, "mmio_size",
-        platform_bus_params.platform_bus_size);
+    qdev_prop_set_uint32(dev, "num_irqs", PLATFORM_BUS_NUM_IRQS);
+    qdev_prop_set_uint32(dev, "mmio_size", vms->memmap[VIRT_PLATFORM_BUS].size);
     qdev_init_nofail(dev);
     vms->platform_bus_dev = dev;
-    s = SYS_BUS_DEVICE(dev);
 
-    for (i = 0; i < platform_bus_params.platform_bus_num_irqs; i++) {
-        int irqn = platform_bus_params.platform_bus_first_irq + i;
+    s = SYS_BUS_DEVICE(dev);
+    for (i = 0; i < PLATFORM_BUS_NUM_IRQS; i++) {
+        int irqn = vms->irqmap[VIRT_PLATFORM_BUS] + i;
         sysbus_connect_irq(s, i, pic[irqn]);
     }
 
     memory_region_add_subregion(sysmem,
-                                platform_bus_params.platform_bus_base,
+                                vms->memmap[VIRT_PLATFORM_BUS].base,
                                 sysbus_mmio_get_region(s, 0));
 }
 
@@ -XXX,XX +XXX,XX @@ void virt_machine_done(Notifier *notifier, void *data)
 {
     VirtMachineState *vms = container_of(notifier, VirtMachineState,
                                          machine_done);
+    ARMCPU *cpu = ARM_CPU(first_cpu);
+    struct arm_boot_info *info = &vms->bootinfo;
+    AddressSpace *as = arm_boot_address_space(cpu, info);
+
+    /*
+     * If the user provided a dtb, we assume the dynamic sysbus nodes
+     * already are integrated there. This corresponds to a use case where
+     * the dynamic sysbus nodes are complex and their generation is not yet
+     * supported. In that case the user can take charge of the guest dt
+     * while qemu takes charge of the qom stuff.
+     */
+    if (info->dtb_filename == NULL) {
+        platform_bus_add_all_fdt_nodes(vms->fdt, "/intc",
+                                       vms->memmap[VIRT_PLATFORM_BUS].base,
+                                       vms->memmap[VIRT_PLATFORM_BUS].size,
+                                       vms->irqmap[VIRT_PLATFORM_BUS]);
+    }
+    if (arm_load_dtb(info->dtb_start, info, info->dtb_limit, as) < 0) {
+        exit(1);
+    }
 
     virt_acpi_setup(vms);
     virt_build_smbios(vms);
@@ -XXX,XX +XXX,XX @@ static void machvirt_init(MachineState *machine)
     vms->fw_cfg = create_fw_cfg(vms, &address_space_memory);
     rom_set_fw(vms->fw_cfg);
 
-    vms->machine_done.notify = virt_machine_done;
-    qemu_add_machine_init_done_notifier(&vms->machine_done);
+    create_platform_bus(vms, pic);
 
     vms->bootinfo.ram_size = machine->ram_size;
     vms->bootinfo.kernel_filename = machine->kernel_filename;
@@ -XXX,XX +XXX,XX @@ static void machvirt_init(MachineState *machine)
     vms->bootinfo.board_id = -1;
     vms->bootinfo.loader_start = vms->memmap[VIRT_MEM].base;
     vms->bootinfo.get_dtb = machvirt_dtb;
+    vms->bootinfo.skip_dtb_autoload = true;
     vms->bootinfo.firmware_loaded = firmware_loaded;
     arm_load_kernel(ARM_CPU(first_cpu), &vms->bootinfo);
 
-    /*
-     * arm_load_kernel machine init done notifier registration must
-     * happen before the platform_bus_create call. In this latter,
-     * another notifier is registered which adds platform bus nodes.
-     * Notifiers are executed in registration reverse order.
-     */
-    create_platform_bus(vms, pic);
+    vms->machine_done.notify = virt_machine_done;
+    qemu_add_machine_init_done_notifier(&vms->machine_done);
 }
 
 static bool virt_get_secure(Object *obj, Error **errp)
-- 
2.17.0

From: Igor Mammedov <imammedo@redhat.com>

Suggested-by: Eduardo Habkost <ehabkost@redhat.com>
Signed-off-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 1525691524-32265-5-git-send-email-imammedo@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/virt.c              | 1 +
 hw/i386/pc.c               | 1 +
 hw/ppc/e500plat.c          | 1 +
 hw/ppc/spapr.c             | 1 +
 hw/s390x/s390-virtio-ccw.c | 1 +
 5 files changed, 5 insertions(+)

diff --git a/hw/arm/virt.c b/hw/arm/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt.c
+++ b/hw/arm/virt.c
@@ -XXX,XX +XXX,XX @@ static void virt_machine_class_init(ObjectClass *oc, void *data)
     mc->cpu_index_to_instance_props = virt_cpu_index_to_props;
     mc->default_cpu_type = ARM_CPU_TYPE_NAME("cortex-a15");
     mc->get_default_cpu_node_id = virt_get_default_cpu_node_id;
+    assert(!mc->get_hotplug_handler);
     mc->get_hotplug_handler = virt_machine_get_hotplug_handler;
     hc->plug = virt_machine_device_plug_cb;
 }
diff --git a/hw/i386/pc.c b/hw/i386/pc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/i386/pc.c
+++ b/hw/i386/pc.c
@@ -XXX,XX +XXX,XX @@ static void pc_machine_class_init(ObjectClass *oc, void *data)
     pcmc->acpi_data_size = 0x20000 + 0x8000;
     pcmc->save_tsc_khz = true;
     pcmc->linuxboot_dma_enabled = true;
+    assert(!mc->get_hotplug_handler);
     mc->get_hotplug_handler = pc_get_hotpug_handler;
     mc->cpu_index_to_instance_props = pc_cpu_index_to_props;
     mc->get_default_cpu_node_id = pc_get_default_cpu_node_id;
diff --git a/hw/ppc/e500plat.c b/hw/ppc/e500plat.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/ppc/e500plat.c
+++ b/hw/ppc/e500plat.c
@@ -XXX,XX +XXX,XX @@ static void e500plat_machine_class_init(ObjectClass *oc, void *data)
     HotplugHandlerClass *hc = HOTPLUG_HANDLER_CLASS(oc);
     MachineClass *mc = MACHINE_CLASS(oc);
 
+    assert(!mc->get_hotplug_handler);
     mc->get_hotplug_handler = e500plat_machine_get_hotpug_handler;
     hc->plug = e500plat_machine_device_plug_cb;
 
diff --git a/hw/ppc/spapr.c b/hw/ppc/spapr.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/ppc/spapr.c
+++ b/hw/ppc/spapr.c
@@ -XXX,XX +XXX,XX @@ static void spapr_machine_class_init(ObjectClass *oc, void *data)
     mc->kvm_type = spapr_kvm_type;
     machine_class_allow_dynamic_sysbus_dev(mc, TYPE_SPAPR_PCI_HOST_BRIDGE);
     mc->pci_allow_0_address = true;
+    assert(!mc->get_hotplug_handler);
     mc->get_hotplug_handler = spapr_get_hotplug_handler;
     hc->pre_plug = spapr_machine_device_pre_plug;
     hc->plug = spapr_machine_device_plug;
diff --git a/hw/s390x/s390-virtio-ccw.c b/hw/s390x/s390-virtio-ccw.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/s390x/s390-virtio-ccw.c
+++ b/hw/s390x/s390-virtio-ccw.c
@@ -XXX,XX +XXX,XX @@ static void ccw_machine_class_init(ObjectClass *oc, void *data)
     mc->no_sdcard = 1;
     mc->max_cpus = S390_MAX_CPUS;
     mc->has_hotpluggable_cpus = true;
+    assert(!mc->get_hotplug_handler);
     mc->get_hotplug_handler = s390_get_hotplug_handler;
     mc->cpu_index_to_instance_props = s390_cpu_index_to_props;
     mc->possible_cpu_arch_ids = s390_possible_cpu_arch_ids;
-- 
2.17.0

Some versions of gcc produce a spurious warning if the result of
__atomic_compare_echange_n() is not used and the type involved
is a signed 8 bit value:
  error: value computed is not used [-Werror=unused-value]
This has been seen on at least
 gcc (Ubuntu 5.4.0-6ubuntu1~16.04.9) 5.4.0 20160609

Work around this by using an explicit cast to void to indicate
that we don't care about the return value.

We don't currently use our atomic_cmpxchg() macro on any signed
8 bit types, but the upcoming support for the Arm v8.1-Atomics
will require it.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
---
 include/qemu/atomic.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/include/qemu/atomic.h b/include/qemu/atomic.h
index XXXXXXX..XXXXXXX 100644
--- a/include/qemu/atomic.h
+++ b/include/qemu/atomic.h
@@ -XXX,XX +XXX,XX @@
 /* Returns the eventual value, failed or not */
 #define atomic_cmpxchg__nocheck(ptr, old, new)    ({                    \
     typeof_strip_qual(*ptr) _old = (old);                               \
-    __atomic_compare_exchange_n(ptr, &_old, new, false,                 \
+    (void)__atomic_compare_exchange_n(ptr, &_old, new, false,           \
                               __ATOMIC_SEQ_CST, __ATOMIC_SEQ_CST);      \
     _old;                                                               \
 })
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

These operations are re-invented by several targets so far.
Several supported hosts have insns for these, so place the
expanders out-of-line for a future introduction of tcg opcodes.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tcg/tcg-op.h | 16 ++++++++++++++++
 tcg/tcg-op.c | 40 ++++++++++++++++++++++++++++++++++++++++
 2 files changed, 56 insertions(+)

diff --git a/tcg/tcg-op.h b/tcg/tcg-op.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.h
+++ b/tcg/tcg-op.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_ext8u_i32(TCGv_i32 ret, TCGv_i32 arg);
 void tcg_gen_ext16u_i32(TCGv_i32 ret, TCGv_i32 arg);
 void tcg_gen_bswap16_i32(TCGv_i32 ret, TCGv_i32 arg);
 void tcg_gen_bswap32_i32(TCGv_i32 ret, TCGv_i32 arg);
+void tcg_gen_smin_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
+void tcg_gen_smax_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
+void tcg_gen_umin_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
+void tcg_gen_umax_i32(TCGv_i32, TCGv_i32 arg1, TCGv_i32 arg2);
 
 static inline void tcg_gen_discard_i32(TCGv_i32 arg)
 {
@@ -XXX,XX +XXX,XX @@ void tcg_gen_ext32u_i64(TCGv_i64 ret, TCGv_i64 arg);
 void tcg_gen_bswap16_i64(TCGv_i64 ret, TCGv_i64 arg);
 void tcg_gen_bswap32_i64(TCGv_i64 ret, TCGv_i64 arg);
 void tcg_gen_bswap64_i64(TCGv_i64 ret, TCGv_i64 arg);
+void tcg_gen_smin_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
+void tcg_gen_smax_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
+void tcg_gen_umin_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
+void tcg_gen_umax_i64(TCGv_i64, TCGv_i64 arg1, TCGv_i64 arg2);
 
 #if TCG_TARGET_REG_BITS == 64
 static inline void tcg_gen_discard_i64(TCGv_i64 arg)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
 #define tcg_gen_mulu2_tl tcg_gen_mulu2_i64
 #define tcg_gen_muls2_tl tcg_gen_muls2_i64
 #define tcg_gen_mulsu2_tl tcg_gen_mulsu2_i64
+#define tcg_gen_smin_tl tcg_gen_smin_i64
+#define tcg_gen_umin_tl tcg_gen_umin_i64
+#define tcg_gen_smax_tl tcg_gen_smax_i64
+#define tcg_gen_umax_tl tcg_gen_umax_i64
 #define tcg_gen_atomic_cmpxchg_tl tcg_gen_atomic_cmpxchg_i64
 #define tcg_gen_atomic_xchg_tl tcg_gen_atomic_xchg_i64
 #define tcg_gen_atomic_fetch_add_tl tcg_gen_atomic_fetch_add_i64
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
 #define tcg_gen_mulu2_tl tcg_gen_mulu2_i32
 #define tcg_gen_muls2_tl tcg_gen_muls2_i32
 #define tcg_gen_mulsu2_tl tcg_gen_mulsu2_i32
+#define tcg_gen_smin_tl tcg_gen_smin_i32
+#define tcg_gen_umin_tl tcg_gen_umin_i32
+#define tcg_gen_smax_tl tcg_gen_smax_i32
+#define tcg_gen_umax_tl tcg_gen_umax_i32
 #define tcg_gen_atomic_cmpxchg_tl tcg_gen_atomic_cmpxchg_i32
 #define tcg_gen_atomic_xchg_tl tcg_gen_atomic_xchg_i32
 #define tcg_gen_atomic_fetch_add_tl tcg_gen_atomic_fetch_add_i32
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_bswap32_i32(TCGv_i32 ret, TCGv_i32 arg)
     }
 }
 
+void tcg_gen_smin_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
+{
+    tcg_gen_movcond_i32(TCG_COND_LT, ret, a, b, a, b);
+}
+
+void tcg_gen_umin_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
+{
+    tcg_gen_movcond_i32(TCG_COND_LTU, ret, a, b, a, b);
+}
+
+void tcg_gen_smax_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
+{
+    tcg_gen_movcond_i32(TCG_COND_LT, ret, a, b, b, a);
+}
+
+void tcg_gen_umax_i32(TCGv_i32 ret, TCGv_i32 a, TCGv_i32 b)
+{
+    tcg_gen_movcond_i32(TCG_COND_LTU, ret, a, b, b, a);
+}
+
 /* 64-bit ops */
 
 #if TCG_TARGET_REG_BITS == 32
@@ -XXX,XX +XXX,XX @@ void tcg_gen_mulsu2_i64(TCGv_i64 rl, TCGv_i64 rh, TCGv_i64 arg1, TCGv_i64 arg2)
     tcg_temp_free_i64(t2);
 }
 
+void tcg_gen_smin_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
+{
+    tcg_gen_movcond_i64(TCG_COND_LT, ret, a, b, a, b);
+}
+
+void tcg_gen_umin_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
+{
+    tcg_gen_movcond_i64(TCG_COND_LTU, ret, a, b, a, b);
+}
+
+void tcg_gen_smax_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
+{
+    tcg_gen_movcond_i64(TCG_COND_LT, ret, a, b, b, a);
+}
+
+void tcg_gen_umax_i64(TCGv_i64 ret, TCGv_i64 a, TCGv_i64 b)
+{
+    tcg_gen_movcond_i64(TCG_COND_LTU, ret, a, b, b, a);
+}
+
 /* Size changing operations.  */
 
 void tcg_gen_extrl_i64_i32(TCGv_i32 ret, TCGv_i64 arg)
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

The generic expanders replace nearly identical code in the translator.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 46 ++++++++++++--------------------------
 1 file changed, 14 insertions(+), 32 deletions(-)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_simd_across_lanes(DisasContext *s, uint32_t insn)
                 tcg_gen_add_i64(tcg_res, tcg_res, tcg_elt);
                 break;
             case 0x0a: /* SMAXV / UMAXV */
-                tcg_gen_movcond_i64(is_u ? TCG_COND_GEU : TCG_COND_GE,
-                                    tcg_res,
-                                    tcg_res, tcg_elt, tcg_res, tcg_elt);
+                if (is_u) {
+                    tcg_gen_umax_i64(tcg_res, tcg_res, tcg_elt);
+                } else {
+                    tcg_gen_smax_i64(tcg_res, tcg_res, tcg_elt);
+                }
                 break;
             case 0x1a: /* SMINV / UMINV */
-                tcg_gen_movcond_i64(is_u ? TCG_COND_LEU : TCG_COND_LE,
-                                    tcg_res,
-                                    tcg_res, tcg_elt, tcg_res, tcg_elt);
-                break;
+                if (is_u) {
+                    tcg_gen_umin_i64(tcg_res, tcg_res, tcg_elt);
+                } else {
+                    tcg_gen_smin_i64(tcg_res, tcg_res, tcg_elt);
+                }
                 break;
             default:
                 g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_logic(DisasContext *s, uint32_t insn)
     }
 }
 
-/* Helper functions for 32 bit comparisons */
-static void gen_max_s32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
-{
-    tcg_gen_movcond_i32(TCG_COND_GE, res, op1, op2, op1, op2);
-}
-
-static void gen_max_u32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
-{
-    tcg_gen_movcond_i32(TCG_COND_GEU, res, op1, op2, op1, op2);
-}
-
-static void gen_min_s32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
-{
-    tcg_gen_movcond_i32(TCG_COND_LE, res, op1, op2, op1, op2);
-}
-
-static void gen_min_u32(TCGv_i32 res, TCGv_i32 op1, TCGv_i32 op2)
-{
-    tcg_gen_movcond_i32(TCG_COND_LEU, res, op1, op2, op1, op2);
-}
-
 /* Pairwise op subgroup of C3.6.16.
  *
  * This is called directly or via the handle_3same_float for float pairwise
@@ -XXX,XX +XXX,XX @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
                 static NeonGenTwoOpFn * const fns[3][2] = {
                     { gen_helper_neon_pmax_s8, gen_helper_neon_pmax_u8 },
                     { gen_helper_neon_pmax_s16, gen_helper_neon_pmax_u16 },
-                    { gen_max_s32, gen_max_u32 },
+                    { tcg_gen_smax_i32, tcg_gen_umax_i32 },
                 };
                 genfn = fns[size][u];
                 break;
@@ -XXX,XX +XXX,XX @@ static void handle_simd_3same_pair(DisasContext *s, int is_q, int u, int opcode,
                 static NeonGenTwoOpFn * const fns[3][2] = {
                     { gen_helper_neon_pmin_s8, gen_helper_neon_pmin_u8 },
                     { gen_helper_neon_pmin_s16, gen_helper_neon_pmin_u16 },
-                    { gen_min_s32, gen_min_u32 },
+                    { tcg_gen_smin_i32, tcg_gen_umin_i32 },
                 };
                 genfn = fns[size][u];
                 break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                 static NeonGenTwoOpFn * const fns[3][2] = {
                     { gen_helper_neon_max_s8, gen_helper_neon_max_u8 },
                     { gen_helper_neon_max_s16, gen_helper_neon_max_u16 },
-                    { gen_max_s32, gen_max_u32 },
+                    { tcg_gen_smax_i32, tcg_gen_umax_i32 },
                 };
                 genfn = fns[size][u];
                 break;
@@ -XXX,XX +XXX,XX @@ static void disas_simd_3same_int(DisasContext *s, uint32_t insn)
                 static NeonGenTwoOpFn * const fns[3][2] = {
                     { gen_helper_neon_min_s8, gen_helper_neon_min_u8 },
                     { gen_helper_neon_min_s16, gen_helper_neon_min_u16 },
-                    { gen_min_s32, gen_min_u32 },
+                    { tcg_gen_smin_i32, tcg_gen_umin_i32 },
                 };
                 genfn = fns[size][u];
                 break;
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

The generic expanders replace nearly identical code in the translator.

Acked-by: Max Filippov <jcmvbkbc@gmail.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/xtensa/translate.c | 50 ++++++++++++++++++++++++++-------------
 1 file changed, 33 insertions(+), 17 deletions(-)

diff --git a/target/xtensa/translate.c b/target/xtensa/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/xtensa/translate.c
+++ b/target/xtensa/translate.c
@@ -XXX,XX +XXX,XX @@ static void translate_clamps(DisasContext *dc, const uint32_t arg[],
         TCGv_i32 tmp1 = tcg_const_i32(-1u << arg[2]);
         TCGv_i32 tmp2 = tcg_const_i32((1 << arg[2]) - 1);
 
-        tcg_gen_movcond_i32(TCG_COND_GT, tmp1,
-                            cpu_R[arg[1]], tmp1, cpu_R[arg[1]], tmp1);
-        tcg_gen_movcond_i32(TCG_COND_LT, cpu_R[arg[0]],
-                            tmp1, tmp2, tmp1, tmp2);
+        tcg_gen_smax_i32(tmp1, tmp1, cpu_R[arg[1]]);
+        tcg_gen_smin_i32(cpu_R[arg[0]], tmp1, tmp2);
         tcg_temp_free(tmp1);
         tcg_temp_free(tmp2);
     }
@@ -XXX,XX +XXX,XX @@ static void translate_memw(DisasContext *dc, const uint32_t arg[],
     tcg_gen_mb(TCG_BAR_SC | TCG_MO_ALL);
 }
 
-static void translate_minmax(DisasContext *dc, const uint32_t arg[],
-                             const uint32_t par[])
+static void translate_smin(DisasContext *dc, const uint32_t arg[],
+                           const uint32_t par[])
 {
     if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
-        tcg_gen_movcond_i32(par[0], cpu_R[arg[0]],
-                            cpu_R[arg[1]], cpu_R[arg[2]],
-                            cpu_R[arg[1]], cpu_R[arg[2]]);
+        tcg_gen_smin_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
+    }
+}
+
+static void translate_umin(DisasContext *dc, const uint32_t arg[],
+                           const uint32_t par[])
+{
+    if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
+        tcg_gen_umin_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
+    }
+}
+
+static void translate_smax(DisasContext *dc, const uint32_t arg[],
+                           const uint32_t par[])
+{
+    if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
+        tcg_gen_smax_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
+    }
+}
+
+static void translate_umax(DisasContext *dc, const uint32_t arg[],
+                           const uint32_t par[])
+{
+    if (gen_window_check3(dc, arg[0], arg[1], arg[2])) {
+        tcg_gen_umax_i32(cpu_R[arg[0]], cpu_R[arg[1]], cpu_R[arg[2]]);
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static const XtensaOpcodeOps core_ops[] = {
         .par = (const uint32_t[]){TCG_COND_NE},
     }, {
         .name = "max",
-        .translate = translate_minmax,
-        .par = (const uint32_t[]){TCG_COND_GE},
+        .translate = translate_smax,
     }, {
         .name = "maxu",
-        .translate = translate_minmax,
-        .par = (const uint32_t[]){TCG_COND_GEU},
+        .translate = translate_umax,
     }, {
         .name = "memw",
         .translate = translate_memw,
     }, {
         .name = "min",
-        .translate = translate_minmax,
-        .par = (const uint32_t[]){TCG_COND_LT},
+        .translate = translate_smin,
     }, {
         .name = "minu",
-        .translate = translate_minmax,
-        .par = (const uint32_t[]){TCG_COND_LTU},
+        .translate = translate_umin,
     }, {
         .name = "mov",
         .translate = translate_mov,
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

Given that this atomic operation will be used by both risc-v
and aarch64, let's not duplicate code across the two targets.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 accel/tcg/atomic_template.h | 71 +++++++++++++++++++++++++++++++++++++
 accel/tcg/tcg-runtime.h     |  8 +++++
 tcg/tcg-op.h                | 34 ++++++++++++++++++
 tcg/tcg.h                   |  8 +++++
 tcg/tcg-op.c                |  8 +++++
 5 files changed, 129 insertions(+)

diff --git a/accel/tcg/atomic_template.h b/accel/tcg/atomic_template.h
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/atomic_template.h
+++ b/accel/tcg/atomic_template.h
@@ -XXX,XX +XXX,XX @@
 #elif DATA_SIZE == 8
 # define SUFFIX     q
 # define DATA_TYPE  uint64_t
+# define SDATA_TYPE int64_t
 # define BSWAP      bswap64
 #elif DATA_SIZE == 4
 # define SUFFIX     l
 # define DATA_TYPE  uint32_t
+# define SDATA_TYPE int32_t
 # define BSWAP      bswap32
 #elif DATA_SIZE == 2
 # define SUFFIX     w
 # define DATA_TYPE  uint16_t
+# define SDATA_TYPE int16_t
 # define BSWAP      bswap16
 #elif DATA_SIZE == 1
 # define SUFFIX     b
 # define DATA_TYPE  uint8_t
+# define SDATA_TYPE int8_t
 # define BSWAP
 #else
 # error unsupported data size
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER(or_fetch)
 GEN_ATOMIC_HELPER(xor_fetch)
 
 #undef GEN_ATOMIC_HELPER
+
+/* These helpers are, as a whole, full barriers.  Within the helper,
+ * the leading barrier is explicit and the trailing barrier is within
+ * cmpxchg primitive.
+ */
+#define GEN_ATOMIC_HELPER_FN(X, FN, XDATA_TYPE, RET)                \
+ABI_TYPE ATOMIC_NAME(X)(CPUArchState *env, target_ulong addr,       \
+                        ABI_TYPE xval EXTRA_ARGS)                   \
+{                                                                   \
+    ATOMIC_MMU_DECLS;                                               \
+    XDATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;                          \
+    XDATA_TYPE cmp, old, new, val = xval;                           \
+    smp_mb();                                                       \
+    cmp = atomic_read__nocheck(haddr);                              \
+    do {                                                            \
+        old = cmp; new = FN(old, val);                              \
+        cmp = atomic_cmpxchg__nocheck(haddr, old, new);             \
+    } while (cmp != old);                                           \
+    ATOMIC_MMU_CLEANUP;                                             \
+    return RET;                                                     \
+}
+
+GEN_ATOMIC_HELPER_FN(fetch_smin, MIN, SDATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(fetch_umin, MIN,  DATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(fetch_smax, MAX, SDATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(fetch_umax, MAX,  DATA_TYPE, old)
+
+GEN_ATOMIC_HELPER_FN(smin_fetch, MIN, SDATA_TYPE, new)
+GEN_ATOMIC_HELPER_FN(umin_fetch, MIN,  DATA_TYPE, new)
+GEN_ATOMIC_HELPER_FN(smax_fetch, MAX, SDATA_TYPE, new)
+GEN_ATOMIC_HELPER_FN(umax_fetch, MAX,  DATA_TYPE, new)
+
+#undef GEN_ATOMIC_HELPER_FN
 #endif /* DATA SIZE >= 16 */
 
 #undef END
@@ -XXX,XX +XXX,XX @@ ABI_TYPE ATOMIC_NAME(add_fetch)(CPUArchState *env, target_ulong addr,
         ldo = ldn;
     }
 }
+
+/* These helpers are, as a whole, full barriers.  Within the helper,
+ * the leading barrier is explicit and the trailing barrier is within
+ * cmpxchg primitive.
+ */
+#define GEN_ATOMIC_HELPER_FN(X, FN, XDATA_TYPE, RET)                \
+ABI_TYPE ATOMIC_NAME(X)(CPUArchState *env, target_ulong addr,       \
+                        ABI_TYPE xval EXTRA_ARGS)                   \
+{                                                                   \
+    ATOMIC_MMU_DECLS;                                               \
+    XDATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;                          \
+    XDATA_TYPE ldo, ldn, old, new, val = xval;                      \
+    smp_mb();                                                       \
+    ldn = atomic_read__nocheck(haddr);                              \
+    do {                                                            \
+        ldo = ldn; old = BSWAP(ldo); new = FN(old, val);            \
+        ldn = atomic_cmpxchg__nocheck(haddr, ldo, BSWAP(new));      \
+    } while (ldo != ldn);                                           \
+    ATOMIC_MMU_CLEANUP;                                             \
+    return RET;                                                     \
+}
+
+GEN_ATOMIC_HELPER_FN(fetch_smin, MIN, SDATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(fetch_umin, MIN,  DATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(fetch_smax, MAX, SDATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(fetch_umax, MAX,  DATA_TYPE, old)
+
+GEN_ATOMIC_HELPER_FN(smin_fetch, MIN, SDATA_TYPE, new)
+GEN_ATOMIC_HELPER_FN(umin_fetch, MIN,  DATA_TYPE, new)
+GEN_ATOMIC_HELPER_FN(smax_fetch, MAX, SDATA_TYPE, new)
+GEN_ATOMIC_HELPER_FN(umax_fetch, MAX,  DATA_TYPE, new)
+
+#undef GEN_ATOMIC_HELPER_FN
 #endif /* DATA_SIZE >= 16 */
 
 #undef END
@@ -XXX,XX +XXX,XX @@ ABI_TYPE ATOMIC_NAME(add_fetch)(CPUArchState *env, target_ulong addr,
 #undef BSWAP
 #undef ABI_TYPE
 #undef DATA_TYPE
+#undef SDATA_TYPE
 #undef SUFFIX
 #undef DATA_SIZE
diff --git a/accel/tcg/tcg-runtime.h b/accel/tcg/tcg-runtime.h
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/tcg-runtime.h
+++ b/accel/tcg/tcg-runtime.h
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPERS(fetch_add)
 GEN_ATOMIC_HELPERS(fetch_and)
 GEN_ATOMIC_HELPERS(fetch_or)
 GEN_ATOMIC_HELPERS(fetch_xor)
+GEN_ATOMIC_HELPERS(fetch_smin)
+GEN_ATOMIC_HELPERS(fetch_umin)
+GEN_ATOMIC_HELPERS(fetch_smax)
+GEN_ATOMIC_HELPERS(fetch_umax)
 
 GEN_ATOMIC_HELPERS(add_fetch)
 GEN_ATOMIC_HELPERS(and_fetch)
 GEN_ATOMIC_HELPERS(or_fetch)
 GEN_ATOMIC_HELPERS(xor_fetch)
+GEN_ATOMIC_HELPERS(smin_fetch)
+GEN_ATOMIC_HELPERS(umin_fetch)
+GEN_ATOMIC_HELPERS(smax_fetch)
+GEN_ATOMIC_HELPERS(umax_fetch)
 
 GEN_ATOMIC_HELPERS(xchg)
 
diff --git a/tcg/tcg-op.h b/tcg/tcg-op.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.h
+++ b/tcg/tcg-op.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
 
 void tcg_gen_atomic_xchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_xchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+
 void tcg_gen_atomic_fetch_add_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_fetch_add_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 void tcg_gen_atomic_fetch_and_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_fetch_or_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_fetch_or_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 void tcg_gen_atomic_fetch_xor_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_fetch_xor_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_smin_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_smin_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_umin_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_umin_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_smax_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_smax_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_umax_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_fetch_umax_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+
 void tcg_gen_atomic_add_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_add_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 void tcg_gen_atomic_and_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_or_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_or_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 void tcg_gen_atomic_xor_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
 void tcg_gen_atomic_xor_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_smin_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_smin_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_umin_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_umin_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_smax_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_smax_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
+void tcg_gen_atomic_umax_fetch_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, TCGMemOp);
+void tcg_gen_atomic_umax_fetch_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, TCGMemOp);
 
 void tcg_gen_mov_vec(TCGv_vec, TCGv_vec);
 void tcg_gen_dup_i32_vec(unsigned vece, TCGv_vec, TCGv_i32);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
 #define tcg_gen_atomic_fetch_and_tl tcg_gen_atomic_fetch_and_i64
 #define tcg_gen_atomic_fetch_or_tl tcg_gen_atomic_fetch_or_i64
 #define tcg_gen_atomic_fetch_xor_tl tcg_gen_atomic_fetch_xor_i64
+#define tcg_gen_atomic_fetch_smin_tl tcg_gen_atomic_fetch_smin_i64
+#define tcg_gen_atomic_fetch_umin_tl tcg_gen_atomic_fetch_umin_i64
+#define tcg_gen_atomic_fetch_smax_tl tcg_gen_atomic_fetch_smax_i64
+#define tcg_gen_atomic_fetch_umax_tl tcg_gen_atomic_fetch_umax_i64
 #define tcg_gen_atomic_add_fetch_tl tcg_gen_atomic_add_fetch_i64
 #define tcg_gen_atomic_and_fetch_tl tcg_gen_atomic_and_fetch_i64
 #define tcg_gen_atomic_or_fetch_tl tcg_gen_atomic_or_fetch_i64
 #define tcg_gen_atomic_xor_fetch_tl tcg_gen_atomic_xor_fetch_i64
+#define tcg_gen_atomic_smin_fetch_tl tcg_gen_atomic_smin_fetch_i64
+#define tcg_gen_atomic_umin_fetch_tl tcg_gen_atomic_umin_fetch_i64
+#define tcg_gen_atomic_smax_fetch_tl tcg_gen_atomic_smax_fetch_i64
+#define tcg_gen_atomic_umax_fetch_tl tcg_gen_atomic_umax_fetch_i64
 #define tcg_gen_dup_tl_vec  tcg_gen_dup_i64_vec
 #else
 #define tcg_gen_movi_tl tcg_gen_movi_i32
@@ -XXX,XX +XXX,XX @@ void tcg_gen_stl_vec(TCGv_vec r, TCGv_ptr base, TCGArg offset, TCGType t);
 #define tcg_gen_atomic_fetch_and_tl tcg_gen_atomic_fetch_and_i32
 #define tcg_gen_atomic_fetch_or_tl tcg_gen_atomic_fetch_or_i32
 #define tcg_gen_atomic_fetch_xor_tl tcg_gen_atomic_fetch_xor_i32
+#define tcg_gen_atomic_fetch_smin_tl tcg_gen_atomic_fetch_smin_i32
+#define tcg_gen_atomic_fetch_umin_tl tcg_gen_atomic_fetch_umin_i32
+#define tcg_gen_atomic_fetch_smax_tl tcg_gen_atomic_fetch_smax_i32
+#define tcg_gen_atomic_fetch_umax_tl tcg_gen_atomic_fetch_umax_i32
 #define tcg_gen_atomic_add_fetch_tl tcg_gen_atomic_add_fetch_i32
 #define tcg_gen_atomic_and_fetch_tl tcg_gen_atomic_and_fetch_i32
 #define tcg_gen_atomic_or_fetch_tl tcg_gen_atomic_or_fetch_i32
 #define tcg_gen_atomic_xor_fetch_tl tcg_gen_atomic_xor_fetch_i32
+#define tcg_gen_atomic_smin_fetch_tl tcg_gen_atomic_smin_fetch_i32
+#define tcg_gen_atomic_umin_fetch_tl tcg_gen_atomic_umin_fetch_i32
+#define tcg_gen_atomic_smax_fetch_tl tcg_gen_atomic_smax_fetch_i32
+#define tcg_gen_atomic_umax_fetch_tl tcg_gen_atomic_umax_fetch_i32
 #define tcg_gen_dup_tl_vec  tcg_gen_dup_i32_vec
 #endif
 
diff --git a/tcg/tcg.h b/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.h
+++ b/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER_ALL(fetch_sub)
 GEN_ATOMIC_HELPER_ALL(fetch_and)
 GEN_ATOMIC_HELPER_ALL(fetch_or)
 GEN_ATOMIC_HELPER_ALL(fetch_xor)
+GEN_ATOMIC_HELPER_ALL(fetch_smin)
+GEN_ATOMIC_HELPER_ALL(fetch_umin)
+GEN_ATOMIC_HELPER_ALL(fetch_smax)
+GEN_ATOMIC_HELPER_ALL(fetch_umax)
 
 GEN_ATOMIC_HELPER_ALL(add_fetch)
 GEN_ATOMIC_HELPER_ALL(sub_fetch)
 GEN_ATOMIC_HELPER_ALL(and_fetch)
 GEN_ATOMIC_HELPER_ALL(or_fetch)
 GEN_ATOMIC_HELPER_ALL(xor_fetch)
+GEN_ATOMIC_HELPER_ALL(smin_fetch)
+GEN_ATOMIC_HELPER_ALL(umin_fetch)
+GEN_ATOMIC_HELPER_ALL(smax_fetch)
+GEN_ATOMIC_HELPER_ALL(umax_fetch)
 
 GEN_ATOMIC_HELPER_ALL(xchg)
 
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER(fetch_add, add, 0)
 GEN_ATOMIC_HELPER(fetch_and, and, 0)
 GEN_ATOMIC_HELPER(fetch_or, or, 0)
 GEN_ATOMIC_HELPER(fetch_xor, xor, 0)
+GEN_ATOMIC_HELPER(fetch_smin, smin, 0)
+GEN_ATOMIC_HELPER(fetch_umin, umin, 0)
+GEN_ATOMIC_HELPER(fetch_smax, smax, 0)
+GEN_ATOMIC_HELPER(fetch_umax, umax, 0)
 
 GEN_ATOMIC_HELPER(add_fetch, add, 1)
 GEN_ATOMIC_HELPER(and_fetch, and, 1)
 GEN_ATOMIC_HELPER(or_fetch, or, 1)
 GEN_ATOMIC_HELPER(xor_fetch, xor, 1)
+GEN_ATOMIC_HELPER(smin_fetch, smin, 1)
+GEN_ATOMIC_HELPER(umin_fetch, umin, 1)
+GEN_ATOMIC_HELPER(smax_fetch, smax, 1)
+GEN_ATOMIC_HELPER(umax_fetch, umax, 1)
 
 static void tcg_gen_mov2_i32(TCGv_i32 r, TCGv_i32 a, TCGv_i32 b)
 {
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

Suggested-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-6-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 accel/tcg/atomic_template.h | 49 ++++++-------------------------------
 1 file changed, 7 insertions(+), 42 deletions(-)

diff --git a/accel/tcg/atomic_template.h b/accel/tcg/atomic_template.h
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/atomic_template.h
+++ b/accel/tcg/atomic_template.h
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER(xor_fetch)
 
 #undef GEN_ATOMIC_HELPER
 
-/* Note that for addition, we need to use a separate cmpxchg loop instead
-   of bswaps for the reverse-host-endian helpers.  */
-ABI_TYPE ATOMIC_NAME(fetch_add)(CPUArchState *env, target_ulong addr,
-                         ABI_TYPE val EXTRA_ARGS)
-{
-    ATOMIC_MMU_DECLS;
-    DATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;
-    DATA_TYPE ldo, ldn, ret, sto;
-
-    ldo = atomic_read__nocheck(haddr);
-    while (1) {
-        ret = BSWAP(ldo);
-        sto = BSWAP(ret + val);
-        ldn = atomic_cmpxchg__nocheck(haddr, ldo, sto);
-        if (ldn == ldo) {
-            ATOMIC_MMU_CLEANUP;
-            return ret;
-        }
-        ldo = ldn;
-    }
-}
-
-ABI_TYPE ATOMIC_NAME(add_fetch)(CPUArchState *env, target_ulong addr,
-                         ABI_TYPE val EXTRA_ARGS)
-{
-    ATOMIC_MMU_DECLS;
-    DATA_TYPE *haddr = ATOMIC_MMU_LOOKUP;
-    DATA_TYPE ldo, ldn, ret, sto;
-
-    ldo = atomic_read__nocheck(haddr);
-    while (1) {
-        ret = BSWAP(ldo) + val;
-        sto = BSWAP(ret);
-        ldn = atomic_cmpxchg__nocheck(haddr, ldo, sto);
-        if (ldn == ldo) {
-            ATOMIC_MMU_CLEANUP;
-            return ret;
-        }
-        ldo = ldn;
-    }
-}
-
 /* These helpers are, as a whole, full barriers.  Within the helper,
  * the leading barrier is explicit and the trailing barrier is within
  * cmpxchg primitive.
@@ -XXX,XX +XXX,XX @@ GEN_ATOMIC_HELPER_FN(umin_fetch, MIN,  DATA_TYPE, new)
 GEN_ATOMIC_HELPER_FN(smax_fetch, MAX, SDATA_TYPE, new)
 GEN_ATOMIC_HELPER_FN(umax_fetch, MAX,  DATA_TYPE, new)
 
+/* Note that for addition, we need to use a separate cmpxchg loop instead
+   of bswaps for the reverse-host-endian helpers.  */
+#define ADD(X, Y)   (X + Y)
+GEN_ATOMIC_HELPER_FN(fetch_add, ADD, DATA_TYPE, old)
+GEN_ATOMIC_HELPER_FN(add_fetch, ADD, DATA_TYPE, new)
+#undef ADD
+
 #undef GEN_ATOMIC_HELPER_FN
 #endif /* DATA_SIZE >= 16 */
 
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Michael Clark <mjc@sifive.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-7-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/riscv/translate.c | 72 +++++++++++-----------------------------
 1 file changed, 20 insertions(+), 52 deletions(-)

diff --git a/target/riscv/translate.c b/target/riscv/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/translate.c
+++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_atomic(DisasContext *ctx, uint32_t opc,
     TCGv src1, src2, dat;
     TCGLabel *l1, *l2;
     TCGMemOp mop;
-    TCGCond cond;
     bool aq, rl;
 
     /* Extract the size of the atomic operation.  */
@@ -XXX,XX +XXX,XX @@ static void gen_atomic(DisasContext *ctx, uint32_t opc,
         tcg_gen_atomic_fetch_or_tl(src2, src1, src2, ctx->mem_idx, mop);
         gen_set_gpr(rd, src2);
         break;
-
     case OPC_RISC_AMOMIN:
-        cond = TCG_COND_LT;
-        goto do_minmax;
-    case OPC_RISC_AMOMAX:
-        cond = TCG_COND_GT;
-        goto do_minmax;
-    case OPC_RISC_AMOMINU:
-        cond = TCG_COND_LTU;
-        goto do_minmax;
-    case OPC_RISC_AMOMAXU:
-        cond = TCG_COND_GTU;
-        goto do_minmax;
-    do_minmax:
-        /* Handle the RL barrier.  The AQ barrier is handled along the
-           parallel path by the SC atomic cmpxchg.  On the serial path,
-           of course, barriers do not matter.  */
-        if (rl) {
-            tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
-        }
-        if (tb_cflags(ctx->tb) & CF_PARALLEL) {
-            l1 = gen_new_label();
-            gen_set_label(l1);
-        } else {
-            l1 = NULL;
-        }
-
         gen_get_gpr(src1, rs1);
         gen_get_gpr(src2, rs2);
-        if ((mop & MO_SSIZE) == MO_SL) {
-            /* Sign-extend the register comparison input.  */
-            tcg_gen_ext32s_tl(src2, src2);
-        }
-        dat = tcg_temp_local_new();
-        tcg_gen_qemu_ld_tl(dat, src1, ctx->mem_idx, mop);
-        tcg_gen_movcond_tl(cond, src2, dat, src2, dat, src2);
-
-        if (tb_cflags(ctx->tb) & CF_PARALLEL) {
-            /* Parallel context.  Make this operation atomic by verifying
-               that the memory didn't change while we computed the result.  */
-            tcg_gen_atomic_cmpxchg_tl(src2, src1, dat, src2, ctx->mem_idx, mop);
-
-            /* If the cmpxchg failed, retry. */
-            /* ??? There is an assumption here that this will eventually
-               succeed, such that we don't live-lock.  This is not unlike
-               a similar loop that the compiler would generate for e.g.
-               __atomic_fetch_and_xor, so don't worry about it.  */
-            tcg_gen_brcond_tl(TCG_COND_NE, dat, src2, l1);
-        } else {
-            /* Serial context.  Directly store the result.  */
-            tcg_gen_qemu_st_tl(src2, src1, ctx->mem_idx, mop);
-        }
-        gen_set_gpr(rd, dat);
-        tcg_temp_free(dat);
+        tcg_gen_atomic_fetch_smin_tl(src2, src1, src2, ctx->mem_idx, mop);
+        gen_set_gpr(rd, src2);
+        break;
+    case OPC_RISC_AMOMAX:
+        gen_get_gpr(src1, rs1);
+        gen_get_gpr(src2, rs2);
+        tcg_gen_atomic_fetch_smax_tl(src2, src1, src2, ctx->mem_idx, mop);
+        gen_set_gpr(rd, src2);
+        break;
+    case OPC_RISC_AMOMINU:
+        gen_get_gpr(src1, rs1);
+        gen_get_gpr(src2, rs2);
+        tcg_gen_atomic_fetch_umin_tl(src2, src1, src2, ctx->mem_idx, mop);
+        gen_set_gpr(rd, src2);
+        break;
+    case OPC_RISC_AMOMAXU:
+        gen_get_gpr(src1, rs1);
+        gen_get_gpr(src2, rs2);
+        tcg_gen_atomic_fetch_umax_tl(src2, src1, src2, ctx->mem_idx, mop);
+        gen_set_gpr(rd, src2);
         break;
 
     default:
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

The insns in the ARMv8.1-Atomics are added to the existing
load/store exclusive and load/store reg opcode spaces.
Rearrange the top-level decoders for these to accomodate.
The Atomics insns themselves still generate Unallocated.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-8-richard.henderson@linaro.org
[PMM: Drop the ARM_FEATURE_V8_1 feature flag]
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/cpu.h           |   1 +
 linux-user/elfload.c       |   1 +
 target/arm/translate-a64.c | 182 +++++++++++++++++++++++++++----------
 3 files changed, 138 insertions(+), 46 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ enum arm_features {
     ARM_FEATURE_V8_SHA3, /* implements SHA3 part of v8 Crypto Extensions */
     ARM_FEATURE_V8_SM3, /* implements SM3 part of v8 Crypto Extensions */
     ARM_FEATURE_V8_SM4, /* implements SM4 part of v8 Crypto Extensions */
+    ARM_FEATURE_V8_ATOMICS, /* ARMv8.1-Atomics feature */
     ARM_FEATURE_V8_RDM, /* implements v8.1 simd round multiply */
     ARM_FEATURE_V8_FP16, /* implements v8.2 half-precision float */
     ARM_FEATURE_V8_FCMA, /* has complex number part of v8.3 extensions.  */
diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static uint32_t get_elf_hwcap(void)
     GET_FEATURE(ARM_FEATURE_V8_SHA512, ARM_HWCAP_A64_SHA512);
     GET_FEATURE(ARM_FEATURE_V8_FP16,
                 ARM_HWCAP_A64_FPHP | ARM_HWCAP_A64_ASIMDHP);
+    GET_FEATURE(ARM_FEATURE_V8_ATOMICS, ARM_HWCAP_A64_ATOMICS);
     GET_FEATURE(ARM_FEATURE_V8_RDM, ARM_HWCAP_A64_ASIMDRDM);
     GET_FEATURE(ARM_FEATURE_V8_FCMA, ARM_HWCAP_A64_FCMA);
 #undef GET_FEATURE
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_excl(DisasContext *s, uint32_t insn)
     int rt = extract32(insn, 0, 5);
     int rn = extract32(insn, 5, 5);
     int rt2 = extract32(insn, 10, 5);
-    int is_lasr = extract32(insn, 15, 1);
     int rs = extract32(insn, 16, 5);
-    int is_pair = extract32(insn, 21, 1);
-    int is_store = !extract32(insn, 22, 1);
-    int is_excl = !extract32(insn, 23, 1);
+    int is_lasr = extract32(insn, 15, 1);
+    int o2_L_o1_o0 = extract32(insn, 21, 3) * 2 | is_lasr;
     int size = extract32(insn, 30, 2);
     TCGv_i64 tcg_addr;
 
-    if ((!is_excl && !is_pair && !is_lasr) ||
-        (!is_excl && is_pair) ||
-        (is_pair && size < 2)) {
-        unallocated_encoding(s);
+    switch (o2_L_o1_o0) {
+    case 0x0: /* STXR */
+    case 0x1: /* STLXR */
+        if (rn == 31) {
+            gen_check_sp_alignment(s);
+        }
+        if (is_lasr) {
+            tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
+        }
+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
+        gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, false);
         return;
-    }
 
-    if (rn == 31) {
-        gen_check_sp_alignment(s);
-    }
-    tcg_addr = read_cpu_reg_sp(s, rn, 1);
-
-    /* Note that since TCG is single threaded load-acquire/store-release
-     * semantics require no extra if (is_lasr) { ... } handling.
-     */
-
-    if (is_excl) {
-        if (!is_store) {
-            s->is_ldex = true;
-            gen_load_exclusive(s, rt, rt2, tcg_addr, size, is_pair);
-            if (is_lasr) {
-                tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
-            }
-        } else {
-            if (is_lasr) {
-                tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
-            }
-            gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, is_pair);
+    case 0x4: /* LDXR */
+    case 0x5: /* LDAXR */
+        if (rn == 31) {
+            gen_check_sp_alignment(s);
         }
-    } else {
-        TCGv_i64 tcg_rt = cpu_reg(s, rt);
-        bool iss_sf = disas_ldst_compute_iss_sf(size, false, 0);
+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
+        s->is_ldex = true;
+        gen_load_exclusive(s, rt, rt2, tcg_addr, size, false);
+        if (is_lasr) {
+            tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
+        }
+        return;
 
+    case 0x9: /* STLR */
         /* Generate ISS for non-exclusive accesses including LASR.  */
-        if (is_store) {
+        if (rn == 31) {
+            gen_check_sp_alignment(s);
+        }
+        tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
+        do_gpr_st(s, cpu_reg(s, rt), tcg_addr, size, true, rt,
+                  disas_ldst_compute_iss_sf(size, false, 0), is_lasr);
+        return;
+
+    case 0xd: /* LDAR */
+        /* Generate ISS for non-exclusive accesses including LASR.  */
+        if (rn == 31) {
+            gen_check_sp_alignment(s);
+        }
+        tcg_addr = read_cpu_reg_sp(s, rn, 1);
+        do_gpr_ld(s, cpu_reg(s, rt), tcg_addr, size, false, false, true, rt,
+                  disas_ldst_compute_iss_sf(size, false, 0), is_lasr);
+        tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
+        return;
+
+    case 0x2: case 0x3: /* CASP / STXP */
+        if (size & 2) { /* STXP / STLXP */
+            if (rn == 31) {
+                gen_check_sp_alignment(s);
+            }
             if (is_lasr) {
                 tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
             }
-            do_gpr_st(s, tcg_rt, tcg_addr, size,
-                      true, rt, iss_sf, is_lasr);
-        } else {
-            do_gpr_ld(s, tcg_rt, tcg_addr, size, false, false,
-                      true, rt, iss_sf, is_lasr);
+            tcg_addr = read_cpu_reg_sp(s, rn, 1);
+            gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, true);
+            return;
+        }
+        /* CASP / CASPL */
+        break;
+
+    case 0x6: case 0x7: /* CASP / LDXP */
+        if (size & 2) { /* LDXP / LDAXP */
+            if (rn == 31) {
+                gen_check_sp_alignment(s);
+            }
+            tcg_addr = read_cpu_reg_sp(s, rn, 1);
+            s->is_ldex = true;
+            gen_load_exclusive(s, rt, rt2, tcg_addr, size, true);
             if (is_lasr) {
                 tcg_gen_mb(TCG_MO_ALL | TCG_BAR_LDAQ);
             }
+            return;
         }
+        /* CASPA / CASPAL */
+        break;
+
+    case 0xa: /* CAS */
+    case 0xb: /* CASL */
+    case 0xe: /* CASA */
+    case 0xf: /* CASAL */
+        break;
     }
+    unallocated_encoding(s);
 }
 
 /*
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_reg_unsigned_imm(DisasContext *s, uint32_t insn,
     }
 }
 
+/* Atomic memory operations
+ *
+ *  31  30      27  26    24    22  21   16   15    12    10    5     0
+ * +------+-------+---+-----+-----+---+----+----+-----+-----+----+-----+
+ * | size | 1 1 1 | V | 0 0 | A R | 1 | Rs | o3 | opc | 0 0 | Rn |  Rt |
+ * +------+-------+---+-----+-----+--------+----+-----+-----+----+-----+
+ *
+ * Rt: the result register
+ * Rn: base address or SP
+ * Rs: the source register for the operation
+ * V: vector flag (always 0 as of v8.3)
+ * A: acquire flag
+ * R: release flag
+ */
+static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
+                              int size, int rt, bool is_vector)
+{
+    int rs = extract32(insn, 16, 5);
+    int rn = extract32(insn, 5, 5);
+    int o3_opc = extract32(insn, 12, 4);
+    int feature = ARM_FEATURE_V8_ATOMICS;
+
+    if (is_vector) {
+        unallocated_encoding(s);
+        return;
+    }
+    switch (o3_opc) {
+    case 000: /* LDADD */
+    case 001: /* LDCLR */
+    case 002: /* LDEOR */
+    case 003: /* LDSET */
+    case 004: /* LDSMAX */
+    case 005: /* LDSMIN */
+    case 006: /* LDUMAX */
+    case 007: /* LDUMIN */
+    case 010: /* SWP */
+    default:
+        unallocated_encoding(s);
+        return;
+    }
+    if (!arm_dc_feature(s, feature)) {
+        unallocated_encoding(s);
+        return;
+    }
+
+    (void)rs;
+    (void)rn;
+}
+
 /* Load/store register (all forms) */
 static void disas_ldst_reg(DisasContext *s, uint32_t insn)
 {
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_reg(DisasContext *s, uint32_t insn)
 
     switch (extract32(insn, 24, 2)) {
     case 0:
-        if (extract32(insn, 21, 1) == 1 && extract32(insn, 10, 2) == 2) {
-            disas_ldst_reg_roffset(s, insn, opc, size, rt, is_vector);
-        } else {
+        if (extract32(insn, 21, 1) == 0) {
             /* Load/store register (unscaled immediate)
              * Load/store immediate pre/post-indexed
              * Load/store register unprivileged
              */
             disas_ldst_reg_imm9(s, insn, opc, size, rt, is_vector);
+            return;
+        }
+        switch (extract32(insn, 10, 2)) {
+        case 0:
+            disas_ldst_atomic(s, insn, size, rt, is_vector);
+            return;
+        case 2:
+            disas_ldst_reg_roffset(s, insn, opc, size, rt, is_vector);
+            return;
         }
         break;
     case 1:
         disas_ldst_reg_unsigned_imm(s, insn, opc, size, rt, is_vector);
-        break;
-    default:
-        unallocated_encoding(s);
-        break;
+        return;
     }
+    unallocated_encoding(s);
 }
 
 /* AdvSIMD load/store multiple structures
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

This implements all of the v8.1-Atomics instructions except
for compare-and-swap, which is decoded elsewhere.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-9-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 38 ++++++++++++++++++++++++++++++++++++--
 1 file changed, 36 insertions(+), 2 deletions(-)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ typedef void NeonGenOneOpFn(TCGv_i64, TCGv_i64);
 typedef void CryptoTwoOpFn(TCGv_ptr, TCGv_ptr);
 typedef void CryptoThreeOpIntFn(TCGv_ptr, TCGv_ptr, TCGv_i32);
 typedef void CryptoThreeOpFn(TCGv_ptr, TCGv_ptr, TCGv_ptr);
+typedef void AtomicThreeOpFn(TCGv_i64, TCGv_i64, TCGv_i64, TCGArg, TCGMemOp);
 
 /* Note that the gvec expanders operate on offsets + sizes.  */
 typedef void GVecGen2Fn(unsigned, uint32_t, uint32_t, uint32_t, uint32_t);
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
     int rn = extract32(insn, 5, 5);
     int o3_opc = extract32(insn, 12, 4);
     int feature = ARM_FEATURE_V8_ATOMICS;
+    TCGv_i64 tcg_rn, tcg_rs;
+    AtomicThreeOpFn *fn;
 
     if (is_vector) {
         unallocated_encoding(s);
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
     }
     switch (o3_opc) {
     case 000: /* LDADD */
+        fn = tcg_gen_atomic_fetch_add_i64;
+        break;
     case 001: /* LDCLR */
+        fn = tcg_gen_atomic_fetch_and_i64;
+        break;
     case 002: /* LDEOR */
+        fn = tcg_gen_atomic_fetch_xor_i64;
+        break;
     case 003: /* LDSET */
+        fn = tcg_gen_atomic_fetch_or_i64;
+        break;
     case 004: /* LDSMAX */
+        fn = tcg_gen_atomic_fetch_smax_i64;
+        break;
     case 005: /* LDSMIN */
+        fn = tcg_gen_atomic_fetch_smin_i64;
+        break;
     case 006: /* LDUMAX */
+        fn = tcg_gen_atomic_fetch_umax_i64;
+        break;
     case 007: /* LDUMIN */
+        fn = tcg_gen_atomic_fetch_umin_i64;
+        break;
     case 010: /* SWP */
+        fn = tcg_gen_atomic_xchg_i64;
+        break;
     default:
         unallocated_encoding(s);
         return;
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_atomic(DisasContext *s, uint32_t insn,
         return;
     }
 
-    (void)rs;
-    (void)rn;
+    if (rn == 31) {
+        gen_check_sp_alignment(s);
+    }
+    tcg_rn = cpu_reg_sp(s, rn);
+    tcg_rs = read_cpu_reg(s, rs, true);
+
+    if (o3_opc == 1) { /* LDCLR */
+        tcg_gen_not_i64(tcg_rs, tcg_rs);
+    }
+
+    /* The tcg atomic primitives are all full barriers.  Therefore we
+     * can ignore the Acquire and Release bits of this instruction.
+     */
+    fn(cpu_reg(s, rt), tcg_rn, tcg_rs, get_mem_index(s),
+       s->be_data | size | MO_ALIGN);
 }
 
 /* Load/store register (all forms) */
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180508151437.4232-10-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper-a64.h    |   2 +
 target/arm/helper-a64.c    |  43 ++++++++++++++
 target/arm/translate-a64.c | 119 ++++++++++++++++++++++++++++++++++++-
 3 files changed, 161 insertions(+), 3 deletions(-)

diff --git a/target/arm/helper-a64.h b/target/arm/helper-a64.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.h
+++ b/target/arm/helper-a64.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(paired_cmpxchg64_le_parallel, TCG_CALL_NO_WG,
 DEF_HELPER_FLAGS_4(paired_cmpxchg64_be, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 DEF_HELPER_FLAGS_4(paired_cmpxchg64_be_parallel, TCG_CALL_NO_WG,
                    i64, env, i64, i64, i64)
+DEF_HELPER_5(casp_le_parallel, void, env, i32, i64, i64, i64)
+DEF_HELPER_5(casp_be_parallel, void, env, i32, i64, i64, i64)
 DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
 DEF_HELPER_FLAGS_3(advsimd_minh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
 DEF_HELPER_FLAGS_3(advsimd_maxnumh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.c
+++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(paired_cmpxchg64_be_parallel)(CPUARMState *env, uint64_t addr,
     return do_paired_cmpxchg64_be(env, addr, new_lo, new_hi, true, GETPC());
 }
 
+/* Writes back the old data into Rs.  */
+void HELPER(casp_le_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
+                              uint64_t new_lo, uint64_t new_hi)
+{
+    uintptr_t ra = GETPC();
+#ifndef CONFIG_ATOMIC128
+    cpu_loop_exit_atomic(ENV_GET_CPU(env), ra);
+#else
+    Int128 oldv, cmpv, newv;
+
+    cmpv = int128_make128(env->xregs[rs], env->xregs[rs + 1]);
+    newv = int128_make128(new_lo, new_hi);
+
+    int mem_idx = cpu_mmu_index(env, false);
+    TCGMemOpIdx oi = make_memop_idx(MO_LEQ | MO_ALIGN_16, mem_idx);
+    oldv = helper_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv, oi, ra);
+
+    env->xregs[rs] = int128_getlo(oldv);
+    env->xregs[rs + 1] = int128_gethi(oldv);
+#endif
+}
+
+void HELPER(casp_be_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
+                              uint64_t new_hi, uint64_t new_lo)
+{
+    uintptr_t ra = GETPC();
+#ifndef CONFIG_ATOMIC128
+    cpu_loop_exit_atomic(ENV_GET_CPU(env), ra);
+#else
+    Int128 oldv, cmpv, newv;
+
+    cmpv = int128_make128(env->xregs[rs + 1], env->xregs[rs]);
+    newv = int128_make128(new_lo, new_hi);
+
+    int mem_idx = cpu_mmu_index(env, false);
+    TCGMemOpIdx oi = make_memop_idx(MO_LEQ | MO_ALIGN_16, mem_idx);
+    oldv = helper_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
+
+    env->xregs[rs + 1] = int128_getlo(oldv);
+    env->xregs[rs] = int128_gethi(oldv);
+#endif
+}
+
 /*
  * AdvSIMD half-precision
  */
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_store_exclusive(DisasContext *s, int rd, int rt, int rt2,
     tcg_gen_movi_i64(cpu_exclusive_addr, -1);
 }
 
+static void gen_compare_and_swap(DisasContext *s, int rs, int rt,
+                                 int rn, int size)
+{
+    TCGv_i64 tcg_rs = cpu_reg(s, rs);
+    TCGv_i64 tcg_rt = cpu_reg(s, rt);
+    int memidx = get_mem_index(s);
+    TCGv_i64 addr = cpu_reg_sp(s, rn);
+
+    if (rn == 31) {
+        gen_check_sp_alignment(s);
+    }
+    tcg_gen_atomic_cmpxchg_i64(tcg_rs, addr, tcg_rs, tcg_rt, memidx,
+                               size | MO_ALIGN | s->be_data);
+}
+
+static void gen_compare_and_swap_pair(DisasContext *s, int rs, int rt,
+                                      int rn, int size)
+{
+    TCGv_i64 s1 = cpu_reg(s, rs);
+    TCGv_i64 s2 = cpu_reg(s, rs + 1);
+    TCGv_i64 t1 = cpu_reg(s, rt);
+    TCGv_i64 t2 = cpu_reg(s, rt + 1);
+    TCGv_i64 addr = cpu_reg_sp(s, rn);
+    int memidx = get_mem_index(s);
+
+    if (rn == 31) {
+        gen_check_sp_alignment(s);
+    }
+
+    if (size == 2) {
+        TCGv_i64 cmp = tcg_temp_new_i64();
+        TCGv_i64 val = tcg_temp_new_i64();
+
+        if (s->be_data == MO_LE) {
+            tcg_gen_concat32_i64(val, t1, t2);
+            tcg_gen_concat32_i64(cmp, s1, s2);
+        } else {
+            tcg_gen_concat32_i64(val, t2, t1);
+            tcg_gen_concat32_i64(cmp, s2, s1);
+        }
+
+        tcg_gen_atomic_cmpxchg_i64(cmp, addr, cmp, val, memidx,
+                                   MO_64 | MO_ALIGN | s->be_data);
+        tcg_temp_free_i64(val);
+
+        if (s->be_data == MO_LE) {
+            tcg_gen_extr32_i64(s1, s2, cmp);
+        } else {
+            tcg_gen_extr32_i64(s2, s1, cmp);
+        }
+        tcg_temp_free_i64(cmp);
+    } else if (tb_cflags(s->base.tb) & CF_PARALLEL) {
+        TCGv_i32 tcg_rs = tcg_const_i32(rs);
+
+        if (s->be_data == MO_LE) {
+            gen_helper_casp_le_parallel(cpu_env, tcg_rs, addr, t1, t2);
+        } else {
+            gen_helper_casp_be_parallel(cpu_env, tcg_rs, addr, t1, t2);
+        }
+        tcg_temp_free_i32(tcg_rs);
+    } else {
+        TCGv_i64 d1 = tcg_temp_new_i64();
+        TCGv_i64 d2 = tcg_temp_new_i64();
+        TCGv_i64 a2 = tcg_temp_new_i64();
+        TCGv_i64 c1 = tcg_temp_new_i64();
+        TCGv_i64 c2 = tcg_temp_new_i64();
+        TCGv_i64 zero = tcg_const_i64(0);
+
+        /* Load the two words, in memory order.  */
+        tcg_gen_qemu_ld_i64(d1, addr, memidx,
+                            MO_64 | MO_ALIGN_16 | s->be_data);
+        tcg_gen_addi_i64(a2, addr, 8);
+        tcg_gen_qemu_ld_i64(d2, addr, memidx, MO_64 | s->be_data);
+
+        /* Compare the two words, also in memory order.  */
+        tcg_gen_setcond_i64(TCG_COND_EQ, c1, d1, s1);
+        tcg_gen_setcond_i64(TCG_COND_EQ, c2, d2, s2);
+        tcg_gen_and_i64(c2, c2, c1);
+
+        /* If compare equal, write back new data, else write back old data.  */
+        tcg_gen_movcond_i64(TCG_COND_NE, c1, c2, zero, t1, d1);
+        tcg_gen_movcond_i64(TCG_COND_NE, c2, c2, zero, t2, d2);
+        tcg_gen_qemu_st_i64(c1, addr, memidx, MO_64 | s->be_data);
+        tcg_gen_qemu_st_i64(c2, a2, memidx, MO_64 | s->be_data);
+        tcg_temp_free_i64(a2);
+        tcg_temp_free_i64(c1);
+        tcg_temp_free_i64(c2);
+        tcg_temp_free_i64(zero);
+
+        /* Write back the data from memory to Rs.  */
+        tcg_gen_mov_i64(s1, d1);
+        tcg_gen_mov_i64(s2, d2);
+        tcg_temp_free_i64(d1);
+        tcg_temp_free_i64(d2);
+    }
+}
+
 /* Update the Sixty-Four bit (SF) registersize. This logic is derived
  * from the ARMv8 specs for LDR (Shared decode for all encodings).
  */
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_excl(DisasContext *s, uint32_t insn)
             gen_store_exclusive(s, rs, rt, rt2, tcg_addr, size, true);
             return;
         }
-        /* CASP / CASPL */
+        if (rt2 == 31
+            && ((rt | rs) & 1) == 0
+            && arm_dc_feature(s, ARM_FEATURE_V8_ATOMICS)) {
+            /* CASP / CASPL */
+            gen_compare_and_swap_pair(s, rs, rt, rn, size | 2);
+            return;
+        }
         break;
 
-    case 0x6: case 0x7: /* CASP / LDXP */
+    case 0x6: case 0x7: /* CASPA / LDXP */
         if (size & 2) { /* LDXP / LDAXP */
             if (rn == 31) {
                 gen_check_sp_alignment(s);
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_excl(DisasContext *s, uint32_t insn)
             }
             return;
         }
-        /* CASPA / CASPAL */
+        if (rt2 == 31
+            && ((rt | rs) & 1) == 0
+            && arm_dc_feature(s, ARM_FEATURE_V8_ATOMICS)) {
+            /* CASPA / CASPAL */
+            gen_compare_and_swap_pair(s, rs, rt, rn, size | 2);
+            return;
+        }
         break;
 
     case 0xa: /* CAS */
     case 0xb: /* CASL */
     case 0xe: /* CASA */
     case 0xf: /* CASAL */
+        if (rt2 == 31 && arm_dc_feature(s, ARM_FEATURE_V8_ATOMICS)) {
+            gen_compare_and_swap(s, rs, rt, rn, size);
+            return;
+        }
         break;
     }
     unallocated_encoding(s);
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

While we have some of the scalar paths for *CVF for fp16,
we failed to decode the fp16 version of these instructions.

Cc: qemu-stable@nongnu.org
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180502221552.3873-2-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 33 ++++++++++++++++++++-------------
 1 file changed, 20 insertions(+), 13 deletions(-)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_intfp_conv(DisasContext *s, bool is_scalar,
                                          int immh, int immb, int opcode,
                                          int rn, int rd)
 {
-    bool is_double = extract32(immh, 3, 1);
-    int size = is_double ? MO_64 : MO_32;
-    int elements;
+    int size, elements, fracbits;
     int immhb = immh << 3 | immb;
-    int fracbits = (is_double ? 128 : 64) - immhb;
 
-    if (!extract32(immh, 2, 2)) {
+    if (immh & 8) {
+        size = MO_64;
+        if (!is_scalar && !is_q) {
+            unallocated_encoding(s);
+            return;
+        }
+    } else if (immh & 4) {
+        size = MO_32;
+    } else if (immh & 2) {
+        size = MO_16;
+        if (!arm_dc_feature(s, ARM_FEATURE_V8_FP16)) {
+            unallocated_encoding(s);
+            return;
+        }
+    } else {
+        /* immh == 0 would be a failure of the decode logic */
+        g_assert(immh == 1);
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_intfp_conv(DisasContext *s, bool is_scalar,
     if (is_scalar) {
         elements = 1;
     } else {
-        elements = is_double ? 2 : is_q ? 4 : 2;
-        if (is_double && !is_q) {
-            unallocated_encoding(s);
-            return;
-        }
+        elements = (8 << is_q) >> size;
     }
+    fracbits = (16 << size) - immhb;
 
     if (!fp_access_check(s)) {
         return;
     }
 
-    /* immh == 0 would be a failure of the decode logic */
-    g_assert(immh);
-
     handle_simd_intfp_conv(s, rd, rn, elements, !is_u, fracbits, size);
 }
 
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

While we have some of the scalar paths for FCVT for fp16,
we failed to decode the fp16 version of these instructions.

Cc: qemu-stable@nongnu.org
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180502221552.3873-3-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 65 +++++++++++++++++++++++++++-----------
 1 file changed, 46 insertions(+), 19 deletions(-)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
                                          bool is_q, bool is_u,
                                          int immh, int immb, int rn, int rd)
 {
-    bool is_double = extract32(immh, 3, 1);
     int immhb = immh << 3 | immb;
-    int fracbits = (is_double ? 128 : 64) - immhb;
-    int pass;
+    int pass, size, fracbits;
     TCGv_ptr tcg_fpstatus;
     TCGv_i32 tcg_rmode, tcg_shift;
 
-    if (!extract32(immh, 2, 2)) {
-        unallocated_encoding(s);
-        return;
-    }
-
-    if (!is_scalar && !is_q && is_double) {
+    if (immh & 0x8) {
+        size = MO_64;
+        if (!is_scalar && !is_q) {
+            unallocated_encoding(s);
+            return;
+        }
+    } else if (immh & 0x4) {
+        size = MO_32;
+    } else if (immh & 0x2) {
+        size = MO_16;
+        if (!arm_dc_feature(s, ARM_FEATURE_V8_FP16)) {
+            unallocated_encoding(s);
+            return;
+        }
+    } else {
+        /* Should have split out AdvSIMD modified immediate earlier.  */
+        assert(immh == 1);
         unallocated_encoding(s);
         return;
     }
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
     assert(!(is_scalar && is_q));
 
     tcg_rmode = tcg_const_i32(arm_rmode_to_sf(FPROUNDING_ZERO));
-    tcg_fpstatus = get_fpstatus_ptr(false);
+    tcg_fpstatus = get_fpstatus_ptr(size == MO_16);
     gen_helper_set_rmode(tcg_rmode, tcg_rmode, tcg_fpstatus);
+    fracbits = (16 << size) - immhb;
     tcg_shift = tcg_const_i32(fracbits);
 
-    if (is_double) {
+    if (size == MO_64) {
         int maxpass = is_scalar ? 1 : 2;
 
         for (pass = 0; pass < maxpass; pass++) {
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
         }
         clear_vec_high(s, is_q, rd);
     } else {
-        int maxpass = is_scalar ? 1 : is_q ? 4 : 2;
+        void (*fn)(TCGv_i32, TCGv_i32, TCGv_i32, TCGv_ptr);
+        int maxpass = is_scalar ? 1 : ((8 << is_q) >> size);
+
+        switch (size) {
+        case MO_16:
+            if (is_u) {
+                fn = gen_helper_vfp_toulh;
+            } else {
+                fn = gen_helper_vfp_toslh;
+            }
+            break;
+        case MO_32:
+            if (is_u) {
+                fn = gen_helper_vfp_touls;
+            } else {
+                fn = gen_helper_vfp_tosls;
+            }
+            break;
+        default:
+            g_assert_not_reached();
+        }
+
         for (pass = 0; pass < maxpass; pass++) {
             TCGv_i32 tcg_op = tcg_temp_new_i32();
 
-            read_vec_element_i32(s, tcg_op, rn, pass, MO_32);
-            if (is_u) {
-                gen_helper_vfp_touls(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
-            } else {
-                gen_helper_vfp_tosls(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
-            }
+            read_vec_element_i32(s, tcg_op, rn, pass, size);
+            fn(tcg_op, tcg_op, tcg_shift, tcg_fpstatus);
             if (is_scalar) {
                 write_fp_sreg(s, rd, tcg_op);
             } else {
-                write_vec_element_i32(s, tcg_op, rd, pass, MO_32);
+                write_vec_element_i32(s, tcg_op, rd, pass, size);
             }
             tcg_temp_free_i32(tcg_op);
         }
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

The instruction "ucvtf v0.4h, v04h, #2", with input 0x8000u,
overflows the intermediate float16 to infinity before we have a
chance to scale the output.  Use float64 as the intermediate type
so that no input argument (uint32_t in this case) can overflow
or round before scaling.  Given the declared argument, the signed
int32_t function has the same problem.

When converting from float16 to integer, using u/int32_t instead
of u/int16_t means that the bounding is incorrect.

Cc: qemu-stable@nongnu.org
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180502221552.3873-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/helper.h        |  4 +--
 target/arm/helper.c        | 53 ++++++++++++++++++++++++++++++++++++--
 target/arm/translate-a64.c |  4 +--
 3 files changed, 55 insertions(+), 6 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_toshd_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_tosld_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_touhd_round_to_zero, i64, f64, i32, ptr)
 DEF_HELPER_3(vfp_tould_round_to_zero, i64, f64, i32, ptr)
-DEF_HELPER_3(vfp_toulh, i32, f16, i32, ptr)
-DEF_HELPER_3(vfp_toslh, i32, f16, i32, ptr)
+DEF_HELPER_3(vfp_touhh, i32, f16, i32, ptr)
+DEF_HELPER_3(vfp_toshh, i32, f16, i32, ptr)
 DEF_HELPER_3(vfp_toshs, i32, f32, i32, ptr)
 DEF_HELPER_3(vfp_tosls, i32, f32, i32, ptr)
 DEF_HELPER_3(vfp_tosqs, i64, f32, i32, ptr)
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ VFP_CONV_FIX_A64(sq, s, 32, 64, int64)
 VFP_CONV_FIX(uh, s, 32, 32, uint16)
 VFP_CONV_FIX(ul, s, 32, 32, uint32)
 VFP_CONV_FIX_A64(uq, s, 32, 64, uint64)
-VFP_CONV_FIX_A64(sl, h, 16, 32, int32)
-VFP_CONV_FIX_A64(ul, h, 16, 32, uint32)
+
 #undef VFP_CONV_FIX
 #undef VFP_CONV_FIX_FLOAT
 #undef VFP_CONV_FLOAT_FIX_ROUND
+#undef VFP_CONV_FIX_A64
+
+/* Conversion to/from f16 can overflow to infinity before/after scaling.
+ * Therefore we convert to f64 (which does not round), scale,
+ * and then convert f64 to f16 (which may round).
+ */
+
+static float16 do_postscale_fp16(float64 f, int shift, float_status *fpst)
+{
+    return float64_to_float16(float64_scalbn(f, -shift, fpst), true, fpst);
+}
+
+float16 HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
+{
+    return do_postscale_fp16(int32_to_float64(x, fpst), shift, fpst);
+}
+
+float16 HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
+{
+    return do_postscale_fp16(uint32_to_float64(x, fpst), shift, fpst);
+}
+
+static float64 do_prescale_fp16(float16 f, int shift, float_status *fpst)
+{
+    if (unlikely(float16_is_any_nan(f))) {
+        float_raise(float_flag_invalid, fpst);
+        return 0;
+    } else {
+        int old_exc_flags = get_float_exception_flags(fpst);
+        float64 ret;
+
+        ret = float16_to_float64(f, true, fpst);
+        ret = float64_scalbn(ret, shift, fpst);
+        old_exc_flags |= get_float_exception_flags(fpst)
+            & float_flag_input_denormal;
+        set_float_exception_flags(old_exc_flags, fpst);
+
+        return ret;
+    }
+}
+
+uint32_t HELPER(vfp_toshh)(float16 x, uint32_t shift, void *fpst)
+{
+    return float64_to_int16(do_prescale_fp16(x, shift, fpst), fpst);
+}
+
+uint32_t HELPER(vfp_touhh)(float16 x, uint32_t shift, void *fpst)
+{
+    return float64_to_uint16(do_prescale_fp16(x, shift, fpst), fpst);
+}
 
 /* Set the current fp rounding mode and return the old one.
  * The argument is a softfloat float_round_ value.
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_simd_shift_fpint_conv(DisasContext *s, bool is_scalar,
         switch (size) {
         case MO_16:
             if (is_u) {
-                fn = gen_helper_vfp_toulh;
+                fn = gen_helper_vfp_touhh;
             } else {
-                fn = gen_helper_vfp_toslh;
+                fn = gen_helper_vfp_toshh;
             }
             break;
         case MO_32:
-- 
2.17.0

From: Richard Henderson <richard.henderson@linaro.org>

Use write_fp_dreg and clear_vec_high to zero the bits
that need zeroing for these cases.

Cc: qemu-stable@nongnu.org
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180502221552.3873-5-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/translate-a64.c | 17 +++++------------
 1 file changed, 5 insertions(+), 12 deletions(-)

diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void handle_fmov(DisasContext *s, int rd, int rn, int type, bool itof)
 
     if (itof) {
         TCGv_i64 tcg_rn = cpu_reg(s, rn);
+        TCGv_i64 tmp;
 
         switch (type) {
         case 0:
-        {
             /* 32 bit */
-            TCGv_i64 tmp = tcg_temp_new_i64();
+            tmp = tcg_temp_new_i64();
             tcg_gen_ext32u_i64(tmp, tcg_rn);
-            tcg_gen_st_i64(tmp, cpu_env, fp_reg_offset(s, rd, MO_64));
-            tcg_gen_movi_i64(tmp, 0);
-            tcg_gen_st_i64(tmp, cpu_env, fp_reg_hi_offset(s, rd));
+            write_fp_dreg(s, rd, tmp);
             tcg_temp_free_i64(tmp);
             break;
-        }
         case 1:
-        {
             /* 64 bit */
-            TCGv_i64 tmp = tcg_const_i64(0);
-            tcg_gen_st_i64(tcg_rn, cpu_env, fp_reg_offset(s, rd, MO_64));
-            tcg_gen_st_i64(tmp, cpu_env, fp_reg_hi_offset(s, rd));
-            tcg_temp_free_i64(tmp);
+            write_fp_dreg(s, rd, tcg_rn);
             break;
-        }
         case 2:
             /* 64 bit to top half. */
             tcg_gen_st_i64(tcg_rn, cpu_env, fp_reg_hi_offset(s, rd));
+            clear_vec_high(s, true, rd);
             break;
         }
     } else {
-- 
2.17.0

target-arm queue. This has the "plumb txattrs through various
bits of exec.c" patches, and a collection of bug fixes from
various people.

thanks
-- PMM

The following changes since commit a3ac12fba028df90f7b3dbec924995c126c41022:

Merge remote-tracking branch 'remotes/ehabkost/tags/numa-next-pull-request' into staging (2018-05-31 11:12:36 +0100)

are available in the Git repository at:

git://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20180531

for you to fetch changes up to 49d1dca0520ea71bc21867fab6647f474fcf857b:

KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice (2018-05-31 14:52:53 +0100)

----------------------------------------------------------------
target-arm queue:
 * target/arm: Honour FPCR.FZ in FRECPX
 * MAINTAINERS: Add entries for newer MPS2 boards and devices
 * hw/intc/arm_gicv3: Fix APxR<n> register dispatching
 * arm_gicv3_kvm: fix bug in writing zero bits back to the in-kernel
   GIC state
 * tcg: Fix helper function vs host abi for float16
 * arm: fix qemu crash on startup with -bios option
 * arm: fix malloc type mismatch
 * xlnx-zdma: Correct mem leaks and memset to zero on desc unaligned errors
 * Correct CPACR reset value for v7 cores
 * memory.h: Improve IOMMU related documentation
 * exec: Plumb transaction attributes through various functions in
   preparation for allowing IOMMUs to see them
 * vmstate.h: Provide VMSTATE_BOOL_SUB_ARRAY
 * ARM: ACPI: Fix use-after-free due to memory realloc
 * KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice

----------------------------------------------------------------
Francisco Iglesias (1):
      xlnx-zdma: Correct mem leaks and memset to zero on desc unaligned errors

Igor Mammedov (1):
      arm: fix qemu crash on startup with -bios option

Jan Kiszka (1):
      hw/intc/arm_gicv3: Fix APxR<n> register dispatching

Paolo Bonzini (1):
      arm: fix malloc type mismatch

Peter Maydell (17):
      target/arm: Honour FPCR.FZ in FRECPX
      MAINTAINERS: Add entries for newer MPS2 boards and devices
      Correct CPACR reset value for v7 cores
      memory.h: Improve IOMMU related documentation
      Make tb_invalidate_phys_addr() take a MemTxAttrs argument
      Make address_space_translate{, _cached}() take a MemTxAttrs argument
      Make address_space_map() take a MemTxAttrs argument
      Make address_space_access_valid() take a MemTxAttrs argument
      Make flatview_extend_translation() take a MemTxAttrs argument
      Make memory_region_access_valid() take a MemTxAttrs argument
      Make MemoryRegion valid.accepts callback take a MemTxAttrs argument
      Make flatview_access_valid() take a MemTxAttrs argument
      Make flatview_translate() take a MemTxAttrs argument
      Make address_space_get_iotlb_entry() take a MemTxAttrs argument
      Make flatview_do_translate() take a MemTxAttrs argument
      Make address_space_translate_iommu take a MemTxAttrs argument
      vmstate.h: Provide VMSTATE_BOOL_SUB_ARRAY

Richard Henderson (1):
      tcg: Fix helper function vs host abi for float16

Shannon Zhao (3):
      arm_gicv3_kvm: increase clroffset accordingly
      ARM: ACPI: Fix use-after-free due to memory realloc
      KVM: GIC: Fix memory leak due to calling kvm_init_irq_routing twice

The FRECPX instructions should (like most other floating point operations)
honour the FPCR.FZ bit which specifies whether input denormals should
be flushed to zero (or FZ16 for the half-precision version).
We forgot to implement this, which doesn't affect the results (since
the calculation doesn't actually care about the mantissa bits) but did
mean we were failing to set the FPSR.IDC bit.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180521172712.19930-1-peter.maydell@linaro.org
---
 target/arm/helper-a64.c | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.c
+++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ float16 HELPER(frecpx_f16)(float16 a, void *fpstp)
         return nan;
     }
 
+    a = float16_squash_input_denormal(a, fpst);
+
     val16 = float16_val(a);
     sbit = 0x8000 & val16;
     exp = extract32(val16, 10, 5);
@@ -XXX,XX +XXX,XX @@ float32 HELPER(frecpx_f32)(float32 a, void *fpstp)
         return nan;
     }
 
+    a = float32_squash_input_denormal(a, fpst);
+
     val32 = float32_val(a);
     sbit = 0x80000000ULL & val32;
     exp = extract32(val32, 23, 8);
@@ -XXX,XX +XXX,XX @@ float64 HELPER(frecpx_f64)(float64 a, void *fpstp)
         return nan;
     }
 
+    a = float64_squash_input_denormal(a, fpst);
+
     val64 = float64_val(a);
     sbit = 0x8000000000000000ULL & val64;
     exp = extract64(float64_val(a), 52, 11);
-- 
2.17.1

Add entries to MAINTAINERS to cover the newer MPS2 boards and
the new devices they use.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20180518153157.14899-1-peter.maydell@linaro.org
---
 MAINTAINERS | 9 +++++++--
 1 file changed, 7 insertions(+), 2 deletions(-)

diff --git a/MAINTAINERS b/MAINTAINERS
index XXXXXXX..XXXXXXX 100644
--- a/MAINTAINERS
+++ b/MAINTAINERS
@@ -XXX,XX +XXX,XX @@ F: hw/timer/cmsdk-apb-timer.c
 F: include/hw/timer/cmsdk-apb-timer.h
 F: hw/char/cmsdk-apb-uart.c
 F: include/hw/char/cmsdk-apb-uart.h
+F: hw/misc/tz-ppc.c
+F: include/hw/misc/tz-ppc.h
 
 ARM cores
 M: Peter Maydell <peter.maydell@linaro.org>
@@ -XXX,XX +XXX,XX @@ M: Peter Maydell <peter.maydell@linaro.org>
 L: qemu-arm@nongnu.org
 S: Maintained
 F: hw/arm/mps2.c
-F: hw/misc/mps2-scc.c
-F: include/hw/misc/mps2-scc.h
+F: hw/arm/mps2-tz.c
+F: hw/misc/mps2-*.c
+F: include/hw/misc/mps2-*.h
+F: hw/arm/iotkit.c
+F: include/hw/arm/iotkit.h
 
 Musicpal
 M: Jan Kiszka <jan.kiszka@web.de>
-- 
2.17.1

From: Jan Kiszka <jan.kiszka@siemens.com>

There was a nasty flip in identifying which register group an access is
targeting. The issue caused spuriously raised priorities of the guest
when handing CPUs over in the Jailhouse hypervisor.

Cc: qemu-stable@nongnu.org
Signed-off-by: Jan Kiszka <jan.kiszka@siemens.com>
Message-id: 28b927d3-da58-bce4-cc13-bfec7f9b1cb9@siemens.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/intc/arm_gicv3_cpuif.c | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/hw/intc/arm_gicv3_cpuif.c b/hw/intc/arm_gicv3_cpuif.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gicv3_cpuif.c
+++ b/hw/intc/arm_gicv3_cpuif.c
@@ -XXX,XX +XXX,XX @@ static uint64_t icv_ap_read(CPUARMState *env, const ARMCPRegInfo *ri)
 {
     GICv3CPUState *cs = icc_cs_from_env(env);
     int regno = ri->opc2 & 3;
-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
+    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
     uint64_t value = cs->ich_apr[grp][regno];
 
     trace_gicv3_icv_ap_read(ri->crm & 1, regno, gicv3_redist_affid(cs), value);
@@ -XXX,XX +XXX,XX @@ static void icv_ap_write(CPUARMState *env, const ARMCPRegInfo *ri,
 {
     GICv3CPUState *cs = icc_cs_from_env(env);
     int regno = ri->opc2 & 3;
-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
+    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
 
     trace_gicv3_icv_ap_write(ri->crm & 1, regno, gicv3_redist_affid(cs), value);
 
@@ -XXX,XX +XXX,XX @@ static uint64_t icc_ap_read(CPUARMState *env, const ARMCPRegInfo *ri)
     uint64_t value;
 
     int regno = ri->opc2 & 3;
-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1;
+    int grp = (ri->crm & 1) ? GICV3_G1 : GICV3_G0;
 
     if (icv_access(env, grp == GICV3_G0 ? HCR_FMO : HCR_IMO)) {
         return icv_ap_read(env, ri);
@@ -XXX,XX +XXX,XX @@ static void icc_ap_write(CPUARMState *env, const ARMCPRegInfo *ri,
     GICv3CPUState *cs = icc_cs_from_env(env);
 
     int regno = ri->opc2 & 3;
-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1;
+    int grp = (ri->crm & 1) ? GICV3_G1 : GICV3_G0;
 
     if (icv_access(env, grp == GICV3_G0 ? HCR_FMO : HCR_IMO)) {
         icv_ap_write(env, ri, value);
@@ -XXX,XX +XXX,XX @@ static uint64_t ich_ap_read(CPUARMState *env, const ARMCPRegInfo *ri)
 {
     GICv3CPUState *cs = icc_cs_from_env(env);
     int regno = ri->opc2 & 3;
-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
+    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
     uint64_t value;
 
     value = cs->ich_apr[grp][regno];
@@ -XXX,XX +XXX,XX @@ static void ich_ap_write(CPUARMState *env, const ARMCPRegInfo *ri,
 {
     GICv3CPUState *cs = icc_cs_from_env(env);
     int regno = ri->opc2 & 3;
-    int grp = ri->crm & 1 ? GICV3_G0 : GICV3_G1NS;
+    int grp = (ri->crm & 1) ? GICV3_G1NS : GICV3_G0;
 
     trace_gicv3_ich_ap_write(ri->crm & 1, regno, gicv3_redist_affid(cs), value);
 
-- 
2.17.1

From: Shannon Zhao <zhaoshenglong@huawei.com>

It forgot to increase clroffset during the loop. So it only clear the
first 4 bytes.

Fixes: 367b9f527becdd20ddf116e17a3c0c2bbc486920
Cc: qemu-stable@nongnu.org
Signed-off-by: Shannon Zhao <zhaoshenglong@huawei.com>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Message-id: 1527047633-12368-1-git-send-email-zhaoshenglong@huawei.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/intc/arm_gicv3_kvm.c | 1 +
 1 file changed, 1 insertion(+)

diff --git a/hw/intc/arm_gicv3_kvm.c b/hw/intc/arm_gicv3_kvm.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gicv3_kvm.c
+++ b/hw/intc/arm_gicv3_kvm.c
@@ -XXX,XX +XXX,XX @@ static void kvm_dist_putbmp(GICv3State *s, uint32_t offset,
         if (clroffset != 0) {
             reg = 0;
             kvm_gicd_access(s, clroffset, &reg, true);
+            clroffset += 4;
         }
         reg = *gic_bmp_ptr32(bmp, irq);
         kvm_gicd_access(s, offset, &reg, true);
-- 
2.17.1

From: Richard Henderson <richard.henderson@linaro.org>

Depending on the host abi, float16, aka uint16_t, values are
passed and returned either zero-extended in the host register
or with garbage at the top of the host register.

The tcg code generator has so far been assuming garbage, as that
matches the x86 abi, but this is incorrect for other host abis.
Further, target/arm has so far been assuming zero-extended results,
so that it may store the 16-bit value into a 32-bit slot with the
high 16-bits already clear.

Rectify both problems by mapping "f16" in the helper definition
to uint32_t instead of (a typedef for) uint16_t.  This forces
the host compiler to assume garbage in the upper 16 bits on input
and to zero-extend the result on output.

Cc: qemu-stable@nongnu.org
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Tested-by: Laurent Desnogues <laurent.desnogues@gmail.com>
Message-id: 20180522175629.24932-1-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/exec/helper-head.h |  2 +-
 target/arm/helper-a64.c    | 35 +++++++++--------
 target/arm/helper.c        | 80 +++++++++++++++++++-------------------
 3 files changed, 59 insertions(+), 58 deletions(-)

diff --git a/include/exec/helper-head.h b/include/exec/helper-head.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/helper-head.h
+++ b/include/exec/helper-head.h
@@ -XXX,XX +XXX,XX @@
 #define dh_ctype_int int
 #define dh_ctype_i64 uint64_t
 #define dh_ctype_s64 int64_t
-#define dh_ctype_f16 float16
+#define dh_ctype_f16 uint32_t
 #define dh_ctype_f32 float32
 #define dh_ctype_f64 float64
 #define dh_ctype_ptr void *
diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.c
+++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t float_rel_to_flags(int res)
     return flags;
 }
 
-uint64_t HELPER(vfp_cmph_a64)(float16 x, float16 y, void *fp_status)
+uint64_t HELPER(vfp_cmph_a64)(uint32_t x, uint32_t y, void *fp_status)
 {
     return float_rel_to_flags(float16_compare_quiet(x, y, fp_status));
 }
 
-uint64_t HELPER(vfp_cmpeh_a64)(float16 x, float16 y, void *fp_status)
+uint64_t HELPER(vfp_cmpeh_a64)(uint32_t x, uint32_t y, void *fp_status)
 {
     return float_rel_to_flags(float16_compare(x, y, fp_status));
 }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, void *fpstp)
 #define float64_three make_float64(0x4008000000000000ULL)
 #define float64_one_point_five make_float64(0x3FF8000000000000ULL)
 
-float16 HELPER(recpsf_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
 
@@ -XXX,XX +XXX,XX @@ float64 HELPER(recpsf_f64)(float64 a, float64 b, void *fpstp)
     return float64_muladd(a, b, float64_two, 0, fpst);
 }
 
-float16 HELPER(rsqrtsf_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(rsqrtsf_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
 
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_addlp_u16)(uint64_t a)
 }
 
 /* Floating-point reciprocal exponent - see FPRecpX in ARM ARM */
-float16 HELPER(frecpx_f16)(float16 a, void *fpstp)
+uint32_t HELPER(frecpx_f16)(uint32_t a, void *fpstp)
 {
     float_status *fpst = fpstp;
     uint16_t val16, sbit;
@@ -XXX,XX +XXX,XX @@ void HELPER(casp_be_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
 #define ADVSIMD_HELPER(name, suffix) HELPER(glue(glue(advsimd_, name), suffix))
 
 #define ADVSIMD_HALFOP(name) \
-float16 ADVSIMD_HELPER(name, h)(float16 a, float16 b, void *fpstp) \
+uint32_t ADVSIMD_HELPER(name, h)(uint32_t a, uint32_t b, void *fpstp) \
 { \
     float_status *fpst = fpstp; \
     return float16_ ## name(a, b, fpst);    \
@@ -XXX,XX +XXX,XX @@ ADVSIMD_HALFOP(mulx)
 ADVSIMD_TWOHALFOP(mulx)
 
 /* fused multiply-accumulate */
-float16 HELPER(advsimd_muladdh)(float16 a, float16 b, float16 c, void *fpstp)
+uint32_t HELPER(advsimd_muladdh)(uint32_t a, uint32_t b, uint32_t c,
+                                 void *fpstp)
 {
     float_status *fpst = fpstp;
     return float16_muladd(a, b, c, 0, fpst);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_muladd2h)(uint32_t two_a, uint32_t two_b,
 
 #define ADVSIMD_CMPRES(test) (test) ? 0xffff : 0
 
-uint32_t HELPER(advsimd_ceq_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(advsimd_ceq_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
     int compare = float16_compare_quiet(a, b, fpst);
     return ADVSIMD_CMPRES(compare == float_relation_equal);
 }
 
-uint32_t HELPER(advsimd_cge_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(advsimd_cge_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
     int compare = float16_compare(a, b, fpst);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_cge_f16)(float16 a, float16 b, void *fpstp)
                           compare == float_relation_equal);
 }
 
-uint32_t HELPER(advsimd_cgt_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(advsimd_cgt_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
     int compare = float16_compare(a, b, fpst);
     return ADVSIMD_CMPRES(compare == float_relation_greater);
 }
 
-uint32_t HELPER(advsimd_acge_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(advsimd_acge_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
     float16 f0 = float16_abs(a);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_acge_f16)(float16 a, float16 b, void *fpstp)
                           compare == float_relation_equal);
 }
 
-uint32_t HELPER(advsimd_acgt_f16)(float16 a, float16 b, void *fpstp)
+uint32_t HELPER(advsimd_acgt_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
     float_status *fpst = fpstp;
     float16 f0 = float16_abs(a);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_acgt_f16)(float16 a, float16 b, void *fpstp)
 }
 
 /* round to integral */
-float16 HELPER(advsimd_rinth_exact)(float16 x, void *fp_status)
+uint32_t HELPER(advsimd_rinth_exact)(uint32_t x, void *fp_status)
 {
     return float16_round_to_int(x, fp_status);
 }
 
-float16 HELPER(advsimd_rinth)(float16 x, void *fp_status)
+uint32_t HELPER(advsimd_rinth)(uint32_t x, void *fp_status)
 {
     int old_flags = get_float_exception_flags(fp_status), new_flags;
     float16 ret;
@@ -XXX,XX +XXX,XX @@ float16 HELPER(advsimd_rinth)(float16 x, void *fp_status)
  * setting the mode appropriately before calling the helper.
  */
 
-uint32_t HELPER(advsimd_f16tosinth)(float16 a, void *fpstp)
+uint32_t HELPER(advsimd_f16tosinth)(uint32_t a, void *fpstp)
 {
     float_status *fpst = fpstp;
 
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_f16tosinth)(float16 a, void *fpstp)
     return float16_to_int16(a, fpst);
 }
 
-uint32_t HELPER(advsimd_f16touinth)(float16 a, void *fpstp)
+uint32_t HELPER(advsimd_f16touinth)(uint32_t a, void *fpstp)
 {
     float_status *fpst = fpstp;
 
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(advsimd_f16touinth)(float16 a, void *fpstp)
  * Square Root and Reciprocal square root
  */
 
-float16 HELPER(sqrt_f16)(float16 a, void *fpstp)
+uint32_t HELPER(sqrt_f16)(uint32_t a, void *fpstp)
 {
     float_status *s = fpstp;
 
diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ DO_VFP_cmp(d, float64)
 
 /* Integer to float and float to integer conversions */
 
-#define CONV_ITOF(name, fsz, sign) \
-    float##fsz HELPER(name)(uint32_t x, void *fpstp) \
-{ \
-    float_status *fpst = fpstp; \
-    return sign##int32_to_##float##fsz((sign##int32_t)x, fpst); \
+#define CONV_ITOF(name, ftype, fsz, sign)                           \
+ftype HELPER(name)(uint32_t x, void *fpstp)                         \
+{                                                                   \
+    float_status *fpst = fpstp;                                     \
+    return sign##int32_to_##float##fsz((sign##int32_t)x, fpst);     \
 }
 
-#define CONV_FTOI(name, fsz, sign, round) \
-uint32_t HELPER(name)(float##fsz x, void *fpstp) \
-{ \
-    float_status *fpst = fpstp; \
-    if (float##fsz##_is_any_nan(x)) { \
-        float_raise(float_flag_invalid, fpst); \
-        return 0; \
-    } \
-    return float##fsz##_to_##sign##int32##round(x, fpst); \
+#define CONV_FTOI(name, ftype, fsz, sign, round)                \
+uint32_t HELPER(name)(ftype x, void *fpstp)                     \
+{                                                               \
+    float_status *fpst = fpstp;                                 \
+    if (float##fsz##_is_any_nan(x)) {                           \
+        float_raise(float_flag_invalid, fpst);                  \
+        return 0;                                               \
+    }                                                           \
+    return float##fsz##_to_##sign##int32##round(x, fpst);       \
 }
 
-#define FLOAT_CONVS(name, p, fsz, sign) \
-CONV_ITOF(vfp_##name##to##p, fsz, sign) \
-CONV_FTOI(vfp_to##name##p, fsz, sign, ) \
-CONV_FTOI(vfp_to##name##z##p, fsz, sign, _round_to_zero)
+#define FLOAT_CONVS(name, p, ftype, fsz, sign)            \
+    CONV_ITOF(vfp_##name##to##p, ftype, fsz, sign)        \
+    CONV_FTOI(vfp_to##name##p, ftype, fsz, sign, )        \
+    CONV_FTOI(vfp_to##name##z##p, ftype, fsz, sign, _round_to_zero)
 
-FLOAT_CONVS(si, h, 16, )
-FLOAT_CONVS(si, s, 32, )
-FLOAT_CONVS(si, d, 64, )
-FLOAT_CONVS(ui, h, 16, u)
-FLOAT_CONVS(ui, s, 32, u)
-FLOAT_CONVS(ui, d, 64, u)
+FLOAT_CONVS(si, h, uint32_t, 16, )
+FLOAT_CONVS(si, s, float32, 32, )
+FLOAT_CONVS(si, d, float64, 64, )
+FLOAT_CONVS(ui, h, uint32_t, 16, u)
+FLOAT_CONVS(ui, s, float32, 32, u)
+FLOAT_CONVS(ui, d, float64, 64, u)
 
 #undef CONV_ITOF
 #undef CONV_FTOI
@@ -XXX,XX +XXX,XX @@ static float16 do_postscale_fp16(float64 f, int shift, float_status *fpst)
     return float64_to_float16(float64_scalbn(f, -shift, fpst), true, fpst);
 }
 
-float16 HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return do_postscale_fp16(int32_to_float64(x, fpst), shift, fpst);
 }
 
-float16 HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return do_postscale_fp16(uint32_to_float64(x, fpst), shift, fpst);
 }
 
-float16 HELPER(vfp_sqtoh)(uint64_t x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_sqtoh)(uint64_t x, uint32_t shift, void *fpst)
 {
     return do_postscale_fp16(int64_to_float64(x, fpst), shift, fpst);
 }
 
-float16 HELPER(vfp_uqtoh)(uint64_t x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_uqtoh)(uint64_t x, uint32_t shift, void *fpst)
 {
     return do_postscale_fp16(uint64_to_float64(x, fpst), shift, fpst);
 }
@@ -XXX,XX +XXX,XX @@ static float64 do_prescale_fp16(float16 f, int shift, float_status *fpst)
     }
 }
 
-uint32_t HELPER(vfp_toshh)(float16 x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_toshh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return float64_to_int16(do_prescale_fp16(x, shift, fpst), fpst);
 }
 
-uint32_t HELPER(vfp_touhh)(float16 x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_touhh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return float64_to_uint16(do_prescale_fp16(x, shift, fpst), fpst);
 }
 
-uint32_t HELPER(vfp_toslh)(float16 x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_toslh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return float64_to_int32(do_prescale_fp16(x, shift, fpst), fpst);
 }
 
-uint32_t HELPER(vfp_toulh)(float16 x, uint32_t shift, void *fpst)
+uint32_t HELPER(vfp_toulh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return float64_to_uint32(do_prescale_fp16(x, shift, fpst), fpst);
 }
 
-uint64_t HELPER(vfp_tosqh)(float16 x, uint32_t shift, void *fpst)
+uint64_t HELPER(vfp_tosqh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return float64_to_int64(do_prescale_fp16(x, shift, fpst), fpst);
 }
 
-uint64_t HELPER(vfp_touqh)(float16 x, uint32_t shift, void *fpst)
+uint64_t HELPER(vfp_touqh)(uint32_t x, uint32_t shift, void *fpst)
 {
     return float64_to_uint64(do_prescale_fp16(x, shift, fpst), fpst);
 }
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(set_neon_rmode)(uint32_t rmode, CPUARMState *env)
 }
 
 /* Half precision conversions.  */
-float32 HELPER(vfp_fcvt_f16_to_f32)(float16 a, void *fpstp, uint32_t ahp_mode)
+float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, void *fpstp, uint32_t ahp_mode)
 {
     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
      * it would affect flushing input denormals.
@@ -XXX,XX +XXX,XX @@ float32 HELPER(vfp_fcvt_f16_to_f32)(float16 a, void *fpstp, uint32_t ahp_mode)
     return r;
 }
 
-float16 HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
+uint32_t HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
 {
     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
      * it would affect flushing output denormals.
@@ -XXX,XX +XXX,XX @@ float16 HELPER(vfp_fcvt_f32_to_f16)(float32 a, void *fpstp, uint32_t ahp_mode)
     return r;
 }
 
-float64 HELPER(vfp_fcvt_f16_to_f64)(float16 a, void *fpstp, uint32_t ahp_mode)
+float64 HELPER(vfp_fcvt_f16_to_f64)(uint32_t a, void *fpstp, uint32_t ahp_mode)
 {
     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
      * it would affect flushing input denormals.
@@ -XXX,XX +XXX,XX @@ float64 HELPER(vfp_fcvt_f16_to_f64)(float16 a, void *fpstp, uint32_t ahp_mode)
     return r;
 }
 
-float16 HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
+uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
 {
     /* Squash FZ16 to 0 for the duration of conversion.  In this case,
      * it would affect flushing output denormals.
@@ -XXX,XX +XXX,XX @@ static bool round_to_inf(float_status *fpst, bool sign_bit)
     g_assert_not_reached();
 }
 
-float16 HELPER(recpe_f16)(float16 input, void *fpstp)
+uint32_t HELPER(recpe_f16)(uint32_t input, void *fpstp)
 {
     float_status *fpst = fpstp;
     float16 f16 = float16_squash_input_denormal(input, fpst);
@@ -XXX,XX +XXX,XX @@ static uint64_t recip_sqrt_estimate(int *exp , int exp_off, uint64_t frac)
     return extract64(estimate, 0, 8) << 44;
 }
 
-float16 HELPER(rsqrte_f16)(float16 input, void *fpstp)
+uint32_t HELPER(rsqrte_f16)(uint32_t input, void *fpstp)
 {
     float_status *s = fpstp;
     float16 f16 = float16_squash_input_denormal(input, s);
-- 
2.17.1

From: Igor Mammedov <imammedo@redhat.com>

When QEMU is started with following CLI
 -machine virt,gic-version=3,accel=kvm -cpu host -bios AAVMF_CODE.fd
it crashes with abort at
 accel/kvm/kvm-all.c:2164:
 KVM_SET_DEVICE_ATTR failed: Group 6 attr 0x000000000000c665: Invalid argument

Which is caused by implicit dependency of kvm_arm_gicv3_reset() on
arm_gicv3_icc_reset() where the later is called by CPU reset
reset callback.

However commit:
 3b77f6c arm/boot: split load_dtb() from arm_load_kernel()
broke CPU reset callback registration in case

arm_load_kernel()
      ...
      if (!info->kernel_filename || info->firmware_loaded)

branch is taken, i.e. it's sufficient to provide a firmware
or do not provide kernel on CLI to skip cpu reset callback
registration, where before offending commit the callback
has been registered unconditionally.

Fix it by registering the callback right at the beginning of
arm_load_kernel() unconditionally instead of doing it at the end.

NOTE:
 we probably should eliminate that dependency anyways as well as
 separate arch CPU reset parts from arm_load_kernel() into CPU
 itself, but that refactoring that I probably would have to do
 anyways later for CPU hotplug to work.

Reported-by: Auger Eric <eric.auger@redhat.com>
Signed-off-by: Igor Mammedov <imammedo@redhat.com>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Tested-by: Eric Auger <eric.auger@redhat.com>
Message-id: 1527070950-208350-1-git-send-email-imammedo@redhat.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/boot.c | 18 +++++++++---------
 1 file changed, 9 insertions(+), 9 deletions(-)

diff --git a/hw/arm/boot.c b/hw/arm/boot.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/boot.c
+++ b/hw/arm/boot.c
@@ -XXX,XX +XXX,XX @@ void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
     static const ARMInsnFixup *primary_loader;
     AddressSpace *as = arm_boot_address_space(cpu, info);
 
+    /* CPU objects (unlike devices) are not automatically reset on system
+     * reset, so we must always register a handler to do so. If we're
+     * actually loading a kernel, the handler is also responsible for
+     * arranging that we start it correctly.
+     */
+    for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
+        qemu_register_reset(do_cpu_reset, ARM_CPU(cs));
+    }
+
     /* The board code is not supposed to set secure_board_setup unless
      * running its code in secure mode is actually possible, and KVM
      * doesn't support secure.
@@ -XXX,XX +XXX,XX @@ void arm_load_kernel(ARMCPU *cpu, struct arm_boot_info *info)
         ARM_CPU(cs)->env.boot_info = info;
     }
 
-    /* CPU objects (unlike devices) are not automatically reset on system
-     * reset, so we must always register a handler to do so. If we're
-     * actually loading a kernel, the handler is also responsible for
-     * arranging that we start it correctly.
-     */
-    for (cs = first_cpu; cs; cs = CPU_NEXT(cs)) {
-        qemu_register_reset(do_cpu_reset, ARM_CPU(cs));
-    }
-
     if (!info->skip_dtb_autoload && have_dtb(info)) {
         if (arm_load_dtb(info->dtb_start, info, info->dtb_limit, as) < 0) {
             exit(1);
-- 
2.17.1

From: Paolo Bonzini <pbonzini@redhat.com>

cpregs_keys is an uint32_t* so the allocation should use uint32_t.
g_new is even better because it is type-safe.

Signed-off-by: Paolo Bonzini <pbonzini@redhat.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 target/arm/gdbstub.c | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/target/arm/gdbstub.c b/target/arm/gdbstub.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/gdbstub.c
+++ b/target/arm/gdbstub.c
@@ -XXX,XX +XXX,XX @@ int arm_gen_dynamic_xml(CPUState *cs)
     RegisterSysregXmlParam param = {cs, s};
 
     cpu->dyn_xml.num_cpregs = 0;
-    cpu->dyn_xml.cpregs_keys = g_malloc(sizeof(uint32_t *) *
-                                        g_hash_table_size(cpu->cp_regs));
+    cpu->dyn_xml.cpregs_keys = g_new(uint32_t, g_hash_table_size(cpu->cp_regs));
     g_string_printf(s, "<?xml version=\"1.0\"?>");
     g_string_append_printf(s, "<!DOCTYPE target SYSTEM \"gdb-target.dtd\">");
     g_string_append_printf(s, "<feature name=\"org.qemu.gdb.arm.sys.regs\">");
-- 
2.17.1

From: Francisco Iglesias <frasse.iglesias@gmail.com>

Coverity found that the string return by 'object_get_canonical_path' was not
being freed at two locations in the model (CID 1391294 and CID 1391293) and
also that a memset was being called with a value greater than the max of a byte
on the second argument (CID 1391286). This patch corrects this by adding the
freeing of the strings and also changing to memset to zero instead on
descriptor unaligned errors.

Signed-off-by: Francisco Iglesias <frasse.iglesias@gmail.com>
Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20180528184859.3530-1-frasse.iglesias@gmail.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/dma/xlnx-zdma.c | 10 +++++++---
 1 file changed, 7 insertions(+), 3 deletions(-)

diff --git a/hw/dma/xlnx-zdma.c b/hw/dma/xlnx-zdma.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/xlnx-zdma.c
+++ b/hw/dma/xlnx-zdma.c
@@ -XXX,XX +XXX,XX @@ static bool zdma_load_descriptor(XlnxZDMA *s, uint64_t addr, void *buf)
         qemu_log_mask(LOG_GUEST_ERROR,
                       "zdma: unaligned descriptor at %" PRIx64,
                       addr);
-        memset(buf, 0xdeadbeef, sizeof(XlnxZDMADescr));
+        memset(buf, 0x0, sizeof(XlnxZDMADescr));
         s->error = true;
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static uint64_t zdma_read(void *opaque, hwaddr addr, unsigned size)
     RegisterInfo *r = &s->regs_info[addr / 4];
 
     if (!r->data) {
+        gchar *path = object_get_canonical_path(OBJECT(s));
         qemu_log("%s: Decode error: read from %" HWADDR_PRIx "\n",
-                 object_get_canonical_path(OBJECT(s)),
+                 path,
                  addr);
+        g_free(path);
         ARRAY_FIELD_DP32(s->regs, ZDMA_CH_ISR, INV_APB, true);
         zdma_ch_imr_update_irq(s);
         return 0;
@@ -XXX,XX +XXX,XX @@ static void zdma_write(void *opaque, hwaddr addr, uint64_t value,
     RegisterInfo *r = &s->regs_info[addr / 4];
 
     if (!r->data) {
+        gchar *path = object_get_canonical_path(OBJECT(s));
         qemu_log("%s: Decode error: write to %" HWADDR_PRIx "=%" PRIx64 "\n",
-                 object_get_canonical_path(OBJECT(s)),
+                 path,
                  addr, value);
+        g_free(path);
         ARRAY_FIELD_DP32(s->regs, ZDMA_CH_ISR, INV_APB, true);
         zdma_ch_imr_update_irq(s);
         return;
-- 
2.17.1

In commit f0aff255700 we made cpacr_write() enforce that some CPACR
bits are RAZ/WI and some are RAO/WI for ARMv7 cores. Unfortunately
we forgot to also update the register's reset value. The effect
was that (a) a guest that read CPACR on reset would not see ones in
the RAO bits, and (b) if you did a migration before the guest did
a write to the CPACR then the migration would fail because the
destination would enforce the RAO bits and then complain that they
didn't match the zero value from the source.

Implement reset for the CPACR using a custom reset function
that just calls cpacr_write(), to avoid having to duplicate
the logic for which bits are RAO.

This bug would affect migration for TCG CPUs which are ARMv7
with VFP but without one of Neon or VFPv3.

Reported-by: Cédric Le Goater <clg@kaod.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Tested-by: Cédric Le Goater <clg@kaod.org>
Message-id: 20180522173713.26282-1-peter.maydell@linaro.org
---
 target/arm/helper.c | 10 +++++++++-
 1 file changed, 9 insertions(+), 1 deletion(-)

diff --git a/target/arm/helper.c b/target/arm/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.c
+++ b/target/arm/helper.c
@@ -XXX,XX +XXX,XX @@ static void cpacr_write(CPUARMState *env, const ARMCPRegInfo *ri,
     env->cp15.cpacr_el1 = value;
 }
 
+static void cpacr_reset(CPUARMState *env, const ARMCPRegInfo *ri)
+{
+    /* Call cpacr_write() so that we reset with the correct RAO bits set
+     * for our CPU features.
+     */
+    cpacr_write(env, ri, 0);
+}
+
 static CPAccessResult cpacr_access(CPUARMState *env, const ARMCPRegInfo *ri,
                                    bool isread)
 {
@@ -XXX,XX +XXX,XX @@ static const ARMCPRegInfo v6_cp_reginfo[] = {
     { .name = "CPACR", .state = ARM_CP_STATE_BOTH, .opc0 = 3,
       .crn = 1, .crm = 0, .opc1 = 0, .opc2 = 2, .accessfn = cpacr_access,
       .access = PL1_RW, .fieldoffset = offsetof(CPUARMState, cp15.cpacr_el1),
-      .resetvalue = 0, .writefn = cpacr_write },
+      .resetfn = cpacr_reset, .writefn = cpacr_write },
     REGINFO_SENTINEL
 };
 
-- 
2.17.1

Add more detail to the documentation for memory_region_init_iommu()
and other IOMMU-related functions and data structures.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Message-id: 20180521140402.23318-2-peter.maydell@linaro.org
---
 include/exec/memory.h | 105 ++++++++++++++++++++++++++++++++++++++----
 1 file changed, 95 insertions(+), 10 deletions(-)

diff --git a/include/exec/memory.h b/include/exec/memory.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory.h
+++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ enum IOMMUMemoryRegionAttr {
     IOMMU_ATTR_SPAPR_TCE_FD
 };
 
+/**
+ * IOMMUMemoryRegionClass:
+ *
+ * All IOMMU implementations need to subclass TYPE_IOMMU_MEMORY_REGION
+ * and provide an implementation of at least the @translate method here
+ * to handle requests to the memory region. Other methods are optional.
+ *
+ * The IOMMU implementation must use the IOMMU notifier infrastructure
+ * to report whenever mappings are changed, by calling
+ * memory_region_notify_iommu() (or, if necessary, by calling
+ * memory_region_notify_one() for each registered notifier).
+ */
 typedef struct IOMMUMemoryRegionClass {
     /* private */
     struct DeviceClass parent_class;
 
     /*
-     * Return a TLB entry that contains a given address. Flag should
-     * be the access permission of this translation operation. We can
-     * set flag to IOMMU_NONE to mean that we don't need any
-     * read/write permission checks, like, when for region replay.
+     * Return a TLB entry that contains a given address.
+     *
+     * The IOMMUAccessFlags indicated via @flag are optional and may
+     * be specified as IOMMU_NONE to indicate that the caller needs
+     * the full translation information for both reads and writes. If
+     * the access flags are specified then the IOMMU implementation
+     * may use this as an optimization, to stop doing a page table
+     * walk as soon as it knows that the requested permissions are not
+     * allowed. If IOMMU_NONE is passed then the IOMMU must do the
+     * full page table walk and report the permissions in the returned
+     * IOMMUTLBEntry. (Note that this implies that an IOMMU may not
+     * return different mappings for reads and writes.)
+     *
+     * The returned information remains valid while the caller is
+     * holding the big QEMU lock or is inside an RCU critical section;
+     * if the caller wishes to cache the mapping beyond that it must
+     * register an IOMMU notifier so it can invalidate its cached
+     * information when the IOMMU mapping changes.
+     *
+     * @iommu: the IOMMUMemoryRegion
+     * @hwaddr: address to be translated within the memory region
+     * @flag: requested access permissions
      */
     IOMMUTLBEntry (*translate)(IOMMUMemoryRegion *iommu, hwaddr addr,
                                IOMMUAccessFlags flag);
-    /* Returns minimum supported page size */
+    /* Returns minimum supported page size in bytes.
+     * If this method is not provided then the minimum is assumed to
+     * be TARGET_PAGE_SIZE.
+     *
+     * @iommu: the IOMMUMemoryRegion
+     */
     uint64_t (*get_min_page_size)(IOMMUMemoryRegion *iommu);
-    /* Called when IOMMU Notifier flag changed */
+    /* Called when IOMMU Notifier flag changes (ie when the set of
+     * events which IOMMU users are requesting notification for changes).
+     * Optional method -- need not be provided if the IOMMU does not
+     * need to know exactly which events must be notified.
+     *
+     * @iommu: the IOMMUMemoryRegion
+     * @old_flags: events which previously needed to be notified
+     * @new_flags: events which now need to be notified
+     */
     void (*notify_flag_changed)(IOMMUMemoryRegion *iommu,
                                 IOMMUNotifierFlag old_flags,
                                 IOMMUNotifierFlag new_flags);
-    /* Set this up to provide customized IOMMU replay function */
+    /* Called to handle memory_region_iommu_replay().
+     *
+     * The default implementation of memory_region_iommu_replay() is to
+     * call the IOMMU translate method for every page in the address space
+     * with flag == IOMMU_NONE and then call the notifier if translate
+     * returns a valid mapping. If this method is implemented then it
+     * overrides the default behaviour, and must provide the full semantics
+     * of memory_region_iommu_replay(), by calling @notifier for every
+     * translation present in the IOMMU.
+     *
+     * Optional method -- an IOMMU only needs to provide this method
+     * if the default is inefficient or produces undesirable side effects.
+     *
+     * Note: this is not related to record-and-replay functionality.
+     */
     void (*replay)(IOMMUMemoryRegion *iommu, IOMMUNotifier *notifier);
 
-    /* Get IOMMU misc attributes */
-    int (*get_attr)(IOMMUMemoryRegion *iommu, enum IOMMUMemoryRegionAttr,
+    /* Get IOMMU misc attributes. This is an optional method that
+     * can be used to allow users of the IOMMU to get implementation-specific
+     * information. The IOMMU implements this method to handle calls
+     * by IOMMU users to memory_region_iommu_get_attr() by filling in
+     * the arbitrary data pointer for any IOMMUMemoryRegionAttr values that
+     * the IOMMU supports. If the method is unimplemented then
+     * memory_region_iommu_get_attr() will always return -EINVAL.
+     *
+     * @iommu: the IOMMUMemoryRegion
+     * @attr: attribute being queried
+     * @data: memory to fill in with the attribute data
+     *
+     * Returns 0 on success, or a negative errno; in particular
+     * returns -EINVAL for unrecognized or unimplemented attribute types.
+     */
+    int (*get_attr)(IOMMUMemoryRegion *iommu, enum IOMMUMemoryRegionAttr attr,
                     void *data);
 } IOMMUMemoryRegionClass;
 
@@ -XXX,XX +XXX,XX @@ static inline void memory_region_init_reservation(MemoryRegion *mr,
  * An IOMMU region translates addresses and forwards accesses to a target
  * memory region.
  *
+ * The IOMMU implementation must define a subclass of TYPE_IOMMU_MEMORY_REGION.
+ * @_iommu_mr should be a pointer to enough memory for an instance of
+ * that subclass, @instance_size is the size of that subclass, and
+ * @mrtypename is its name. This function will initialize @_iommu_mr as an
+ * instance of the subclass, and its methods will then be called to handle
+ * accesses to the memory region. See the documentation of
+ * #IOMMUMemoryRegionClass for further details.
+ *
  * @_iommu_mr: the #IOMMUMemoryRegion to be initialized
  * @instance_size: the IOMMUMemoryRegion subclass instance size
  * @mrtypename: the type name of the #IOMMUMemoryRegion
@@ -XXX,XX +XXX,XX @@ void memory_region_register_iommu_notifier(MemoryRegion *mr,
  * a notifier with the minimum page granularity returned by
  * mr->iommu_ops->get_page_size().
  *
+ * Note: this is not related to record-and-replay functionality.
+ *
  * @iommu_mr: the memory region to observe
  * @n: the notifier to which to replay iommu mappings
  */
@@ -XXX,XX +XXX,XX @@ void memory_region_iommu_replay(IOMMUMemoryRegion *iommu_mr, IOMMUNotifier *n);
  * memory_region_iommu_replay_all: replay existing IOMMU translations
  * to all the notifiers registered.
  *
+ * Note: this is not related to record-and-replay functionality.
+ *
  * @iommu_mr: the memory region to observe
  */
 void memory_region_iommu_replay_all(IOMMUMemoryRegion *iommu_mr);
@@ -XXX,XX +XXX,XX @@ void memory_region_unregister_iommu_notifier(MemoryRegion *mr,
  * memory_region_iommu_get_attr: return an IOMMU attr if get_attr() is
  * defined on the IOMMU.
  *
- * Returns 0 if succeded, error code otherwise.
+ * Returns 0 on success, or a negative errno otherwise. In particular,
+ * -EINVAL indicates that the IOMMU does not support the requested
+ * attribute.
  *
  * @iommu_mr: the memory region
  * @attr: the requested attribute
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to tb_invalidate_phys_addr().
Its callers either have an attrs value to hand, or don't care
and can use MEMTXATTRS_UNSPECIFIED.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Message-id: 20180521140402.23318-3-peter.maydell@linaro.org
---
 include/exec/exec-all.h   | 5 +++--
 accel/tcg/translate-all.c | 2 +-
 exec.c                    | 2 +-
 target/xtensa/op_helper.c | 3 ++-
 4 files changed, 7 insertions(+), 5 deletions(-)

diff --git a/include/exec/exec-all.h b/include/exec/exec-all.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/exec-all.h
+++ b/include/exec/exec-all.h
@@ -XXX,XX +XXX,XX @@ void tlb_set_page_with_attrs(CPUState *cpu, target_ulong vaddr,
 void tlb_set_page(CPUState *cpu, target_ulong vaddr,
                   hwaddr paddr, int prot,
                   int mmu_idx, target_ulong size);
-void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr);
+void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr, MemTxAttrs attrs);
 void probe_write(CPUArchState *env, target_ulong addr, int size, int mmu_idx,
                  uintptr_t retaddr);
 #else
@@ -XXX,XX +XXX,XX @@ static inline void tlb_flush_by_mmuidx_all_cpus_synced(CPUState *cpu,
                                                        uint16_t idxmap)
 {
 }
-static inline void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr)
+static inline void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr,
+                                           MemTxAttrs attrs)
 {
 }
 #endif
diff --git a/accel/tcg/translate-all.c b/accel/tcg/translate-all.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/translate-all.c
+++ b/accel/tcg/translate-all.c
@@ -XXX,XX +XXX,XX @@ static TranslationBlock *tb_find_pc(uintptr_t tc_ptr)
 }
 
 #if !defined(CONFIG_USER_ONLY)
-void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr)
+void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr, MemTxAttrs attrs)
 {
     ram_addr_t ram_addr;
     MemoryRegion *mr;
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static void breakpoint_invalidate(CPUState *cpu, target_ulong pc)
     if (phys != -1) {
         /* Locks grabbed by tb_invalidate_phys_addr */
         tb_invalidate_phys_addr(cpu->cpu_ases[asidx].as,
-                                phys | (pc & ~TARGET_PAGE_MASK));
+                                phys | (pc & ~TARGET_PAGE_MASK), attrs);
     }
 }
 #endif
diff --git a/target/xtensa/op_helper.c b/target/xtensa/op_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/xtensa/op_helper.c
+++ b/target/xtensa/op_helper.c
@@ -XXX,XX +XXX,XX @@ static void tb_invalidate_virtual_addr(CPUXtensaState *env, uint32_t vaddr)
     int ret = xtensa_get_physical_addr(env, false, vaddr, 2, 0,
             &paddr, &page_size, &access);
     if (ret == 0) {
-        tb_invalidate_phys_addr(&address_space_memory, paddr);
+        tb_invalidate_phys_addr(&address_space_memory, paddr,
+                                MEMTXATTRS_UNSPECIFIED);
     }
 }
 
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to address_space_translate()
and address_space_translate_cached(). Callers either have an
attrs value to hand, or don't care and can use MEMTXATTRS_UNSPECIFIED.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180521140402.23318-4-peter.maydell@linaro.org
---
 include/exec/memory.h     |  4 +++-
 accel/tcg/translate-all.c |  2 +-
 exec.c                    | 14 +++++++++-----
 hw/vfio/common.c          |  3 ++-
 memory_ldst.inc.c         | 18 +++++++++---------
 target/riscv/helper.c     |  2 +-
 6 files changed, 25 insertions(+), 18 deletions(-)

diff --git a/include/exec/memory.h b/include/exec/memory.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory.h
+++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
  * #MemoryRegion.
  * @len: pointer to length
  * @is_write: indicates the transfer direction
+ * @attrs: memory attributes
  */
 MemoryRegion *flatview_translate(FlatView *fv,
                                  hwaddr addr, hwaddr *xlat,
@@ -XXX,XX +XXX,XX @@ MemoryRegion *flatview_translate(FlatView *fv,
 
 static inline MemoryRegion *address_space_translate(AddressSpace *as,
                                                     hwaddr addr, hwaddr *xlat,
-                                                    hwaddr *len, bool is_write)
+                                                    hwaddr *len, bool is_write,
+                                                    MemTxAttrs attrs)
 {
     return flatview_translate(address_space_to_flatview(as),
                               addr, xlat, len, is_write);
diff --git a/accel/tcg/translate-all.c b/accel/tcg/translate-all.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/translate-all.c
+++ b/accel/tcg/translate-all.c
@@ -XXX,XX +XXX,XX @@ void tb_invalidate_phys_addr(AddressSpace *as, hwaddr addr, MemTxAttrs attrs)
     hwaddr l = 1;
 
     rcu_read_lock();
-    mr = address_space_translate(as, addr, &addr, &l, false);
+    mr = address_space_translate(as, addr, &addr, &l, false, attrs);
     if (!(memory_region_is_ram(mr)
           || memory_region_is_romd(mr))) {
         rcu_read_unlock();
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static inline void cpu_physical_memory_write_rom_internal(AddressSpace *as,
     rcu_read_lock();
     while (len > 0) {
         l = len;
-        mr = address_space_translate(as, addr, &addr1, &l, true);
+        mr = address_space_translate(as, addr, &addr1, &l, true,
+                                     MEMTXATTRS_UNSPECIFIED);
 
         if (!(memory_region_is_ram(mr) ||
               memory_region_is_romd(mr))) {
@@ -XXX,XX +XXX,XX @@ void address_space_cache_destroy(MemoryRegionCache *cache)
  */
 static inline MemoryRegion *address_space_translate_cached(
     MemoryRegionCache *cache, hwaddr addr, hwaddr *xlat,
-    hwaddr *plen, bool is_write)
+    hwaddr *plen, bool is_write, MemTxAttrs attrs)
 {
     MemoryRegionSection section;
     MemoryRegion *mr;
@@ -XXX,XX +XXX,XX @@ address_space_read_cached_slow(MemoryRegionCache *cache, hwaddr addr,
     MemoryRegion *mr;
 
     l = len;
-    mr = address_space_translate_cached(cache, addr, &addr1, &l, false);
+    mr = address_space_translate_cached(cache, addr, &addr1, &l, false,
+                                        MEMTXATTRS_UNSPECIFIED);
     flatview_read_continue(cache->fv,
                            addr, MEMTXATTRS_UNSPECIFIED, buf, len,
                            addr1, l, mr);
@@ -XXX,XX +XXX,XX @@ address_space_write_cached_slow(MemoryRegionCache *cache, hwaddr addr,
     MemoryRegion *mr;
 
     l = len;
-    mr = address_space_translate_cached(cache, addr, &addr1, &l, true);
+    mr = address_space_translate_cached(cache, addr, &addr1, &l, true,
+                                        MEMTXATTRS_UNSPECIFIED);
     flatview_write_continue(cache->fv,
                             addr, MEMTXATTRS_UNSPECIFIED, buf, len,
                             addr1, l, mr);
@@ -XXX,XX +XXX,XX @@ bool cpu_physical_memory_is_io(hwaddr phys_addr)
 
     rcu_read_lock();
     mr = address_space_translate(&address_space_memory,
-                                 phys_addr, &phys_addr, &l, false);
+                                 phys_addr, &phys_addr, &l, false,
+                                 MEMTXATTRS_UNSPECIFIED);
 
     res = !(memory_region_is_ram(mr) || memory_region_is_romd(mr));
     rcu_read_unlock();
diff --git a/hw/vfio/common.c b/hw/vfio/common.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/vfio/common.c
+++ b/hw/vfio/common.c
@@ -XXX,XX +XXX,XX @@ static bool vfio_get_vaddr(IOMMUTLBEntry *iotlb, void **vaddr,
      */
     mr = address_space_translate(&address_space_memory,
                                  iotlb->translated_addr,
-                                 &xlat, &len, writable);
+                                 &xlat, &len, writable,
+                                 MEMTXATTRS_UNSPECIFIED);
     if (!memory_region_is_ram(mr)) {
         error_report("iommu map to non memory area %"HWADDR_PRIx"",
                      xlat);
diff --git a/memory_ldst.inc.c b/memory_ldst.inc.c
index XXXXXXX..XXXXXXX 100644
--- a/memory_ldst.inc.c
+++ b/memory_ldst.inc.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t glue(address_space_ldl_internal, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, false);
+    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
     if (l < 4 || !IS_DIRECT(mr, false)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ static inline uint64_t glue(address_space_ldq_internal, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, false);
+    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
     if (l < 8 || !IS_DIRECT(mr, false)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ uint32_t glue(address_space_ldub, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, false);
+    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
     if (!IS_DIRECT(mr, false)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ static inline uint32_t glue(address_space_lduw_internal, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, false);
+    mr = TRANSLATE(addr, &addr1, &l, false, attrs);
     if (l < 2 || !IS_DIRECT(mr, false)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ void glue(address_space_stl_notdirty, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, true);
+    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
     if (l < 4 || !IS_DIRECT(mr, true)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ static inline void glue(address_space_stl_internal, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, true);
+    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
     if (l < 4 || !IS_DIRECT(mr, true)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ void glue(address_space_stb, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, true);
+    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
     if (!IS_DIRECT(mr, true)) {
         release_lock |= prepare_mmio_access(mr);
         r = memory_region_dispatch_write(mr, addr1, val, 1, attrs);
@@ -XXX,XX +XXX,XX @@ static inline void glue(address_space_stw_internal, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, true);
+    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
     if (l < 2 || !IS_DIRECT(mr, true)) {
         release_lock |= prepare_mmio_access(mr);
 
@@ -XXX,XX +XXX,XX @@ static void glue(address_space_stq_internal, SUFFIX)(ARG1_DECL,
     bool release_lock = false;
 
     RCU_READ_LOCK();
-    mr = TRANSLATE(addr, &addr1, &l, true);
+    mr = TRANSLATE(addr, &addr1, &l, true, attrs);
     if (l < 8 || !IS_DIRECT(mr, true)) {
         release_lock |= prepare_mmio_access(mr);
 
diff --git a/target/riscv/helper.c b/target/riscv/helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/helper.c
+++ b/target/riscv/helper.c
@@ -XXX,XX +XXX,XX @@ restart:
                 MemoryRegion *mr;
                 hwaddr l = sizeof(target_ulong), addr1;
                 mr = address_space_translate(cs->as, pte_addr,
-                    &addr1, &l, false);
+                    &addr1, &l, false, MEMTXATTRS_UNSPECIFIED);
                 if (memory_access_is_direct(mr, true)) {
                     target_ulong *pte_pa =
                         qemu_map_ram_ptr(mr->ram_block, addr1);
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to address_space_map().
Its callers either have an attrs value to hand, or don't care
and can use MEMTXATTRS_UNSPECIFIED.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180521140402.23318-5-peter.maydell@linaro.org
---
 include/exec/memory.h   | 3 ++-
 include/sysemu/dma.h    | 3 ++-
 exec.c                  | 6 ++++--
 target/ppc/mmu-hash64.c | 3 ++-
 4 files changed, 10 insertions(+), 5 deletions(-)

diff --git a/include/exec/memory.h b/include/exec/memory.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory.h
+++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ bool address_space_access_valid(AddressSpace *as, hwaddr addr, int len, bool is_
  * @addr: address within that address space
  * @plen: pointer to length of buffer; updated on return
  * @is_write: indicates the transfer direction
+ * @attrs: memory attributes
  */
 void *address_space_map(AddressSpace *as, hwaddr addr,
-                        hwaddr *plen, bool is_write);
+                        hwaddr *plen, bool is_write, MemTxAttrs attrs);
 
 /* address_space_unmap: Unmaps a memory region previously mapped by address_space_map()
  *
diff --git a/include/sysemu/dma.h b/include/sysemu/dma.h
index XXXXXXX..XXXXXXX 100644
--- a/include/sysemu/dma.h
+++ b/include/sysemu/dma.h
@@ -XXX,XX +XXX,XX @@ static inline void *dma_memory_map(AddressSpace *as,
     hwaddr xlen = *len;
     void *p;
 
-    p = address_space_map(as, addr, &xlen, dir == DMA_DIRECTION_FROM_DEVICE);
+    p = address_space_map(as, addr, &xlen, dir == DMA_DIRECTION_FROM_DEVICE,
+                          MEMTXATTRS_UNSPECIFIED);
     *len = xlen;
     return p;
 }
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ flatview_extend_translation(FlatView *fv, hwaddr addr,
 void *address_space_map(AddressSpace *as,
                         hwaddr addr,
                         hwaddr *plen,
-                        bool is_write)
+                        bool is_write,
+                        MemTxAttrs attrs)
 {
     hwaddr len = *plen;
     hwaddr l, xlat;
@@ -XXX,XX +XXX,XX @@ void *cpu_physical_memory_map(hwaddr addr,
                               hwaddr *plen,
                               int is_write)
 {
-    return address_space_map(&address_space_memory, addr, plen, is_write);
+    return address_space_map(&address_space_memory, addr, plen, is_write,
+                             MEMTXATTRS_UNSPECIFIED);
 }
 
 void cpu_physical_memory_unmap(void *buffer, hwaddr len,
diff --git a/target/ppc/mmu-hash64.c b/target/ppc/mmu-hash64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/ppc/mmu-hash64.c
+++ b/target/ppc/mmu-hash64.c
@@ -XXX,XX +XXX,XX @@ const ppc_hash_pte64_t *ppc_hash64_map_hptes(PowerPCCPU *cpu,
         return NULL;
     }
 
-    hptes = address_space_map(CPU(cpu)->as, base + pte_offset, &plen, false);
+    hptes = address_space_map(CPU(cpu)->as, base + pte_offset, &plen, false,
+                              MEMTXATTRS_UNSPECIFIED);
     if (plen < (n * HASH_PTE_SIZE_64)) {
         hw_error("%s: Unable to map all requested HPTEs\n", __func__);
     }
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to address_space_access_valid().
Its callers either have an attrs value to hand, or don't care
and can use MEMTXATTRS_UNSPECIFIED.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180521140402.23318-6-peter.maydell@linaro.org
---
 include/exec/memory.h      | 4 +++-
 include/sysemu/dma.h       | 3 ++-
 exec.c                     | 3 ++-
 target/s390x/diag.c        | 6 ++++--
 target/s390x/excp_helper.c | 3 ++-
 target/s390x/mmu_helper.c  | 3 ++-
 target/s390x/sigp.c        | 3 ++-
 7 files changed, 17 insertions(+), 8 deletions(-)

diff --git a/include/exec/memory.h b/include/exec/memory.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory.h
+++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ static inline MemoryRegion *address_space_translate(AddressSpace *as,
  * @addr: address within that address space
  * @len: length of the area to be checked
  * @is_write: indicates the transfer direction
+ * @attrs: memory attributes
  */
-bool address_space_access_valid(AddressSpace *as, hwaddr addr, int len, bool is_write);
+bool address_space_access_valid(AddressSpace *as, hwaddr addr, int len,
+                                bool is_write, MemTxAttrs attrs);
 
 /* address_space_map: map a physical memory region into a host virtual address
  *
diff --git a/include/sysemu/dma.h b/include/sysemu/dma.h
index XXXXXXX..XXXXXXX 100644
--- a/include/sysemu/dma.h
+++ b/include/sysemu/dma.h
@@ -XXX,XX +XXX,XX @@ static inline bool dma_memory_valid(AddressSpace *as,
                                     DMADirection dir)
 {
     return address_space_access_valid(as, addr, len,
-                                      dir == DMA_DIRECTION_FROM_DEVICE);
+                                      dir == DMA_DIRECTION_FROM_DEVICE,
+                                      MEMTXATTRS_UNSPECIFIED);
 }
 
 static inline int dma_memory_rw_relaxed(AddressSpace *as, dma_addr_t addr,
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
 }
 
 bool address_space_access_valid(AddressSpace *as, hwaddr addr,
-                                int len, bool is_write)
+                                int len, bool is_write,
+                                MemTxAttrs attrs)
 {
     FlatView *fv;
     bool result;
diff --git a/target/s390x/diag.c b/target/s390x/diag.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/diag.c
+++ b/target/s390x/diag.c
@@ -XXX,XX +XXX,XX @@ void handle_diag_308(CPUS390XState *env, uint64_t r1, uint64_t r3, uintptr_t ra)
             return;
         }
         if (!address_space_access_valid(&address_space_memory, addr,
-                                        sizeof(IplParameterBlock), false)) {
+                                        sizeof(IplParameterBlock), false,
+                                        MEMTXATTRS_UNSPECIFIED)) {
             s390_program_interrupt(env, PGM_ADDRESSING, ILEN_AUTO, ra);
             return;
         }
@@ -XXX,XX +XXX,XX @@ out:
             return;
         }
         if (!address_space_access_valid(&address_space_memory, addr,
-                                        sizeof(IplParameterBlock), true)) {
+                                        sizeof(IplParameterBlock), true,
+                                        MEMTXATTRS_UNSPECIFIED)) {
             s390_program_interrupt(env, PGM_ADDRESSING, ILEN_AUTO, ra);
             return;
         }
diff --git a/target/s390x/excp_helper.c b/target/s390x/excp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/excp_helper.c
+++ b/target/s390x/excp_helper.c
@@ -XXX,XX +XXX,XX @@ int s390_cpu_handle_mmu_fault(CPUState *cs, vaddr orig_vaddr, int size,
 
     /* check out of RAM access */
     if (!address_space_access_valid(&address_space_memory, raddr,
-                                    TARGET_PAGE_SIZE, rw)) {
+                                    TARGET_PAGE_SIZE, rw,
+                                    MEMTXATTRS_UNSPECIFIED)) {
         DPRINTF("%s: raddr %" PRIx64 " > ram_size %" PRIx64 "\n", __func__,
                 (uint64_t)raddr, (uint64_t)ram_size);
         trigger_pgm_exception(env, PGM_ADDRESSING, ILEN_AUTO);
diff --git a/target/s390x/mmu_helper.c b/target/s390x/mmu_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/mmu_helper.c
+++ b/target/s390x/mmu_helper.c
@@ -XXX,XX +XXX,XX @@ static int translate_pages(S390CPU *cpu, vaddr addr, int nr_pages,
             return ret;
         }
         if (!address_space_access_valid(&address_space_memory, pages[i],
-                                        TARGET_PAGE_SIZE, is_write)) {
+                                        TARGET_PAGE_SIZE, is_write,
+                                        MEMTXATTRS_UNSPECIFIED)) {
             trigger_access_exception(env, PGM_ADDRESSING, ILEN_AUTO, 0);
             return -EFAULT;
         }
diff --git a/target/s390x/sigp.c b/target/s390x/sigp.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/sigp.c
+++ b/target/s390x/sigp.c
@@ -XXX,XX +XXX,XX @@ static void sigp_set_prefix(CPUState *cs, run_on_cpu_data arg)
     cpu_synchronize_state(cs);
 
     if (!address_space_access_valid(&address_space_memory, addr,
-                                    sizeof(struct LowCore), false)) {
+                                    sizeof(struct LowCore), false,
+                                    MEMTXATTRS_UNSPECIFIED)) {
         set_sigp_status(si, SIGP_STAT_INVALID_PARAMETER);
         return;
     }
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to flatview_extend_translation().
Its callers either have an attrs value to hand, or don't care
and can use MEMTXATTRS_UNSPECIFIED.

diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ bool address_space_access_valid(AddressSpace *as, hwaddr addr,
 
 static hwaddr
 flatview_extend_translation(FlatView *fv, hwaddr addr,
-                                 hwaddr target_len,
-                                 MemoryRegion *mr, hwaddr base, hwaddr len,
-                                 bool is_write)
+                            hwaddr target_len,
+                            MemoryRegion *mr, hwaddr base, hwaddr len,
+                            bool is_write, MemTxAttrs attrs)
 {
     hwaddr done = 0;
     hwaddr xlat;
@@ -XXX,XX +XXX,XX @@ void *address_space_map(AddressSpace *as,
 
     memory_region_ref(mr);
     *plen = flatview_extend_translation(fv, addr, len, mr, xlat,
-                                             l, is_write);
+                                        l, is_write, attrs);
     ptr = qemu_ram_ptr_length(mr->ram_block, xlat, plen, true);
     rcu_read_unlock();
 
@@ -XXX,XX +XXX,XX @@ int64_t address_space_cache_init(MemoryRegionCache *cache,
     mr = cache->mrs.mr;
     memory_region_ref(mr);
     if (memory_access_is_direct(mr, is_write)) {
+        /* We don't care about the memory attributes here as we're only
+         * doing this if we found actual RAM, which behaves the same
+         * regardless of attributes; so UNSPECIFIED is fine.
+         */
         l = flatview_extend_translation(cache->fv, addr, len, mr,
-                                        cache->xlat, l, is_write);
+                                        cache->xlat, l, is_write,
+                                        MEMTXATTRS_UNSPECIFIED);
         cache->ptr = qemu_ram_ptr_length(mr->ram_block, cache->xlat, &l, true);
     } else {
         cache->ptr = NULL;
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to memory_region_access_valid().
Its callers either have an attrs value to hand, or don't care
and can use MEMTXATTRS_UNSPECIFIED.

The callsite in flatview_access_valid() is part of a recursive
loop flatview_access_valid() -> memory_region_access_valid() ->
 subpage_accepts() -> flatview_access_valid(); we make it pass
MEMTXATTRS_UNSPECIFIED for now, until the next several commits
have plumbed an attrs parameter through the rest of the loop
and we can add an attrs parameter to flatview_access_valid().

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180521140402.23318-8-peter.maydell@linaro.org
---
 include/exec/memory-internal.h | 3 ++-
 exec.c                         | 4 +++-
 hw/s390x/s390-pci-inst.c       | 3 ++-
 memory.c                       | 7 ++++---
 4 files changed, 11 insertions(+), 6 deletions(-)

diff --git a/include/exec/memory-internal.h b/include/exec/memory-internal.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory-internal.h
+++ b/include/exec/memory-internal.h
@@ -XXX,XX +XXX,XX @@ void flatview_unref(FlatView *view);
 extern const MemoryRegionOps unassigned_mem_ops;
 
 bool memory_region_access_valid(MemoryRegion *mr, hwaddr addr,
-                                unsigned size, bool is_write);
+                                unsigned size, bool is_write,
+                                MemTxAttrs attrs);
 
 void flatview_add_to_dispatch(FlatView *fv, MemoryRegionSection *section);
 AddressSpaceDispatch *address_space_dispatch_new(FlatView *fv);
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
         mr = flatview_translate(fv, addr, &xlat, &l, is_write);
         if (!memory_access_is_direct(mr, is_write)) {
             l = memory_access_size(mr, l, addr);
-            if (!memory_region_access_valid(mr, xlat, l, is_write)) {
+            /* When our callers all have attrs we'll pass them through here */
+            if (!memory_region_access_valid(mr, xlat, l, is_write,
+                                            MEMTXATTRS_UNSPECIFIED)) {
                 return false;
             }
         }
diff --git a/hw/s390x/s390-pci-inst.c b/hw/s390x/s390-pci-inst.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/s390x/s390-pci-inst.c
+++ b/hw/s390x/s390-pci-inst.c
@@ -XXX,XX +XXX,XX @@ int pcistb_service_call(S390CPU *cpu, uint8_t r1, uint8_t r3, uint64_t gaddr,
     mr = s390_get_subregion(mr, offset, len);
     offset -= mr->addr;
 
-    if (!memory_region_access_valid(mr, offset, len, true)) {
+    if (!memory_region_access_valid(mr, offset, len, true,
+                                    MEMTXATTRS_UNSPECIFIED)) {
         s390_program_interrupt(env, PGM_OPERAND, 6, ra);
         return 0;
     }
diff --git a/memory.c b/memory.c
index XXXXXXX..XXXXXXX 100644
--- a/memory.c
+++ b/memory.c
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps ram_device_mem_ops = {
 bool memory_region_access_valid(MemoryRegion *mr,
                                 hwaddr addr,
                                 unsigned size,
-                                bool is_write)
+                                bool is_write,
+                                MemTxAttrs attrs)
 {
     int access_size_min, access_size_max;
     int access_size, i;
@@ -XXX,XX +XXX,XX @@ MemTxResult memory_region_dispatch_read(MemoryRegion *mr,
 {
     MemTxResult r;
 
-    if (!memory_region_access_valid(mr, addr, size, false)) {
+    if (!memory_region_access_valid(mr, addr, size, false, attrs)) {
         *pval = unassigned_mem_read(mr, addr, size);
         return MEMTX_DECODE_ERROR;
     }
@@ -XXX,XX +XXX,XX @@ MemTxResult memory_region_dispatch_write(MemoryRegion *mr,
                                          unsigned size,
                                          MemTxAttrs attrs)
 {
-    if (!memory_region_access_valid(mr, addr, size, true)) {
+    if (!memory_region_access_valid(mr, addr, size, true, attrs)) {
         unassigned_mem_write(mr, addr, data, size);
         return MEMTX_DECODE_ERROR;
     }
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to the MemoryRegion valid.accepts
callback. We'll need this for subpage_accepts().

We could take the approach we used with the read and write
callbacks and add new a new _with_attrs version, but since there
are so few implementations of the accepts hook we just change
them all.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20180521140402.23318-9-peter.maydell@linaro.org
---
 include/exec/memory.h |  3 ++-
 exec.c                |  9 ++++++---
 hw/hppa/dino.c        |  3 ++-
 hw/nvram/fw_cfg.c     | 12 ++++++++----
 hw/scsi/esp.c         |  3 ++-
 hw/xen/xen_pt_msi.c   |  3 ++-
 memory.c              |  5 +++--
 7 files changed, 25 insertions(+), 13 deletions(-)

diff --git a/include/exec/memory.h b/include/exec/memory.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory.h
+++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ struct MemoryRegionOps {
          * as a machine check exception).
          */
         bool (*accepts)(void *opaque, hwaddr addr,
-                        unsigned size, bool is_write);
+                        unsigned size, bool is_write,
+                        MemTxAttrs attrs);
     } valid;
     /* Internal implementation constraints: */
     struct {
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static void notdirty_mem_write(void *opaque, hwaddr ram_addr,
 }
 
 static bool notdirty_mem_accepts(void *opaque, hwaddr addr,
-                                 unsigned size, bool is_write)
+                                 unsigned size, bool is_write,
+                                 MemTxAttrs attrs)
 {
     return is_write;
 }
@@ -XXX,XX +XXX,XX @@ static MemTxResult subpage_write(void *opaque, hwaddr addr,
 }
 
 static bool subpage_accepts(void *opaque, hwaddr addr,
-                            unsigned len, bool is_write)
+                            unsigned len, bool is_write,
+                            MemTxAttrs attrs)
 {
     subpage_t *subpage = opaque;
 #if defined(DEBUG_SUBPAGE)
@@ -XXX,XX +XXX,XX @@ static void readonly_mem_write(void *opaque, hwaddr addr,
 }
 
 static bool readonly_mem_accepts(void *opaque, hwaddr addr,
-                                 unsigned size, bool is_write)
+                                 unsigned size, bool is_write,
+                                 MemTxAttrs attrs)
 {
     return is_write;
 }
diff --git a/hw/hppa/dino.c b/hw/hppa/dino.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/hppa/dino.c
+++ b/hw/hppa/dino.c
@@ -XXX,XX +XXX,XX @@ static void gsc_to_pci_forwarding(DinoState *s)
 }
 
 static bool dino_chip_mem_valid(void *opaque, hwaddr addr,
-                                unsigned size, bool is_write)
+                                unsigned size, bool is_write,
+                                MemTxAttrs attrs)
 {
     switch (addr) {
     case DINO_IAR0:
diff --git a/hw/nvram/fw_cfg.c b/hw/nvram/fw_cfg.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/nvram/fw_cfg.c
+++ b/hw/nvram/fw_cfg.c
@@ -XXX,XX +XXX,XX @@ static void fw_cfg_dma_mem_write(void *opaque, hwaddr addr,
 }
 
 static bool fw_cfg_dma_mem_valid(void *opaque, hwaddr addr,
-                                  unsigned size, bool is_write)
+                                 unsigned size, bool is_write,
+                                 MemTxAttrs attrs)
 {
     return !is_write || ((size == 4 && (addr == 0 || addr == 4)) ||
                          (size == 8 && addr == 0));
 }
 
 static bool fw_cfg_data_mem_valid(void *opaque, hwaddr addr,
-                                  unsigned size, bool is_write)
+                                  unsigned size, bool is_write,
+                                  MemTxAttrs attrs)
 {
     return addr == 0;
 }
@@ -XXX,XX +XXX,XX @@ static void fw_cfg_ctl_mem_write(void *opaque, hwaddr addr,
 }
 
 static bool fw_cfg_ctl_mem_valid(void *opaque, hwaddr addr,
-                                 unsigned size, bool is_write)
+                                 unsigned size, bool is_write,
+                                 MemTxAttrs attrs)
 {
     return is_write && size == 2;
 }
@@ -XXX,XX +XXX,XX @@ static void fw_cfg_comb_write(void *opaque, hwaddr addr,
 }
 
 static bool fw_cfg_comb_valid(void *opaque, hwaddr addr,
-                                  unsigned size, bool is_write)
+                              unsigned size, bool is_write,
+                              MemTxAttrs attrs)
 {
     return (size == 1) || (is_write && size == 2);
 }
diff --git a/hw/scsi/esp.c b/hw/scsi/esp.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/scsi/esp.c
+++ b/hw/scsi/esp.c
@@ -XXX,XX +XXX,XX @@ void esp_reg_write(ESPState *s, uint32_t saddr, uint64_t val)
 }
 
 static bool esp_mem_accepts(void *opaque, hwaddr addr,
-                            unsigned size, bool is_write)
+                            unsigned size, bool is_write,
+                            MemTxAttrs attrs)
 {
     return (size == 1) || (is_write && size == 4);
 }
diff --git a/hw/xen/xen_pt_msi.c b/hw/xen/xen_pt_msi.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/xen/xen_pt_msi.c
+++ b/hw/xen/xen_pt_msi.c
@@ -XXX,XX +XXX,XX @@ static uint64_t pci_msix_read(void *opaque, hwaddr addr,
 }
 
 static bool pci_msix_accepts(void *opaque, hwaddr addr,
-                             unsigned size, bool is_write)
+                             unsigned size, bool is_write,
+                             MemTxAttrs attrs)
 {
     return !(addr & (size - 1));
 }
diff --git a/memory.c b/memory.c
index XXXXXXX..XXXXXXX 100644
--- a/memory.c
+++ b/memory.c
@@ -XXX,XX +XXX,XX @@ static void unassigned_mem_write(void *opaque, hwaddr addr,
 }
 
 static bool unassigned_mem_accepts(void *opaque, hwaddr addr,
-                                   unsigned size, bool is_write)
+                                   unsigned size, bool is_write,
+                                   MemTxAttrs attrs)
 {
     return false;
 }
@@ -XXX,XX +XXX,XX @@ bool memory_region_access_valid(MemoryRegion *mr,
     access_size = MAX(MIN(size, access_size_max), access_size_min);
     for (i = 0; i < size; i += access_size) {
         if (!mr->ops->valid.accepts(mr->opaque, addr + i, access_size,
-                                    is_write)) {
+                                    is_write, attrs)) {
             return false;
         }
     }
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to flatview_access_valid().
Its callers now all have an attrs value to hand, so we can
correct our earlier temporary use of MEMTXATTRS_UNSPECIFIED.

diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static MemTxResult flatview_read(FlatView *fv, hwaddr addr,
 static MemTxResult flatview_write(FlatView *fv, hwaddr addr, MemTxAttrs attrs,
                                   const uint8_t *buf, int len);
 static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
-                                  bool is_write);
+                                  bool is_write, MemTxAttrs attrs);
 
 static MemTxResult subpage_read(void *opaque, hwaddr addr, uint64_t *data,
                                 unsigned len, MemTxAttrs attrs)
@@ -XXX,XX +XXX,XX @@ static bool subpage_accepts(void *opaque, hwaddr addr,
 #endif
 
     return flatview_access_valid(subpage->fv, addr + subpage->base,
-                                 len, is_write);
+                                 len, is_write, attrs);
 }
 
 static const MemoryRegionOps subpage_ops = {
@@ -XXX,XX +XXX,XX @@ static void cpu_notify_map_clients(void)
 }
 
 static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
-                                  bool is_write)
+                                  bool is_write, MemTxAttrs attrs)
 {
     MemoryRegion *mr;
     hwaddr l, xlat;
@@ -XXX,XX +XXX,XX @@ static bool flatview_access_valid(FlatView *fv, hwaddr addr, int len,
         mr = flatview_translate(fv, addr, &xlat, &l, is_write);
         if (!memory_access_is_direct(mr, is_write)) {
             l = memory_access_size(mr, l, addr);
-            /* When our callers all have attrs we'll pass them through here */
-            if (!memory_region_access_valid(mr, xlat, l, is_write,
-                                            MEMTXATTRS_UNSPECIFIED)) {
+            if (!memory_region_access_valid(mr, xlat, l, is_write, attrs)) {
                 return false;
             }
         }
@@ -XXX,XX +XXX,XX @@ bool address_space_access_valid(AddressSpace *as, hwaddr addr,
 
     rcu_read_lock();
     fv = address_space_to_flatview(as);
-    result = flatview_access_valid(fv, addr, len, is_write);
+    result = flatview_access_valid(fv, addr, len, is_write, attrs);
     rcu_read_unlock();
     return result;
 }
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to flatview_translate(); all its
callers now have attrs available.

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to address_space_get_iotlb_entry().

diff --git a/include/exec/memory.h b/include/exec/memory.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/memory.h
+++ b/include/exec/memory.h
@@ -XXX,XX +XXX,XX @@ void address_space_cache_destroy(MemoryRegionCache *cache);
  * entry. Should be called from an RCU critical section.
  */
 IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
-                                            bool is_write);
+                                            bool is_write, MemTxAttrs attrs);
 
 /* address_space_translate: translate an address range into an address space
  * into a MemoryRegion and an address range into that section.  Should be
diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection flatview_do_translate(FlatView *fv,
 
 /* Called from RCU critical section */
 IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
-                                            bool is_write)
+                                            bool is_write, MemTxAttrs attrs)
 {
     MemoryRegionSection section;
     hwaddr xlat, page_mask;
diff --git a/hw/virtio/vhost.c b/hw/virtio/vhost.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/virtio/vhost.c
+++ b/hw/virtio/vhost.c
@@ -XXX,XX +XXX,XX @@ int vhost_device_iotlb_miss(struct vhost_dev *dev, uint64_t iova, int write)
     trace_vhost_iotlb_miss(dev, 1);
 
     iotlb = address_space_get_iotlb_entry(dev->vdev->dma_as,
-                                          iova, write);
+                                          iova, write,
+                                          MEMTXATTRS_UNSPECIFIED);
     if (iotlb.target_as != NULL) {
         ret = vhost_memory_region_lookup(dev, iotlb.translated_addr,
                                          &uaddr, &len);
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to flatview_do_translate().

diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ unassigned:
  * @is_write: whether the translation operation is for write
  * @is_mmio: whether this can be MMIO, set true if it can
  * @target_as: the address space targeted by the IOMMU
+ * @attrs: memory transaction attributes
  *
  * This function is called from RCU critical section
  */
@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection flatview_do_translate(FlatView *fv,
                                                  hwaddr *page_mask_out,
                                                  bool is_write,
                                                  bool is_mmio,
-                                                 AddressSpace **target_as)
+                                                 AddressSpace **target_as,
+                                                 MemTxAttrs attrs)
 {
     MemoryRegionSection *section;
     IOMMUMemoryRegion *iommu_mr;
@@ -XXX,XX +XXX,XX @@ IOMMUTLBEntry address_space_get_iotlb_entry(AddressSpace *as, hwaddr addr,
      * but page mask.
      */
     section = flatview_do_translate(address_space_to_flatview(as), addr, &xlat,
-                                    NULL, &page_mask, is_write, false, &as);
+                                    NULL, &page_mask, is_write, false, &as,
+                                    attrs);
 
     /* Illegal translation */
     if (section.mr == &io_mem_unassigned) {
@@ -XXX,XX +XXX,XX @@ MemoryRegion *flatview_translate(FlatView *fv, hwaddr addr, hwaddr *xlat,
 
     /* This can be MMIO, so setup MMIO bit. */
     section = flatview_do_translate(fv, addr, xlat, plen, NULL,
-                                    is_write, true, &as);
+                                    is_write, true, &as, attrs);
     mr = section.mr;
 
     if (xen_enabled() && memory_access_is_direct(mr, is_write)) {
-- 
2.17.1

As part of plumbing MemTxAttrs down to the IOMMU translate method,
add MemTxAttrs as an argument to address_space_translate_iommu().

diff --git a/exec.c b/exec.c
index XXXXXXX..XXXXXXX 100644
--- a/exec.c
+++ b/exec.c
@@ -XXX,XX +XXX,XX @@ address_space_translate_internal(AddressSpaceDispatch *d, hwaddr addr, hwaddr *x
  * @is_write: whether the translation operation is for write
  * @is_mmio: whether this can be MMIO, set true if it can
  * @target_as: the address space targeted by the IOMMU
+ * @attrs: transaction attributes
  *
  * This function is called from RCU critical section.  It is the common
  * part of flatview_do_translate and address_space_translate_cached.
@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection address_space_translate_iommu(IOMMUMemoryRegion *iomm
                                                          hwaddr *page_mask_out,
                                                          bool is_write,
                                                          bool is_mmio,
-                                                         AddressSpace **target_as)
+                                                         AddressSpace **target_as,
+                                                         MemTxAttrs attrs)
 {
     MemoryRegionSection *section;
     hwaddr page_mask = (hwaddr)-1;
@@ -XXX,XX +XXX,XX @@ static MemoryRegionSection flatview_do_translate(FlatView *fv,
         return address_space_translate_iommu(iommu_mr, xlat,
                                              plen_out, page_mask_out,
                                              is_write, is_mmio,
-                                             target_as);
+                                             target_as, attrs);
     }
     if (page_mask_out) {
         /* Not behind an IOMMU, use default page size. */
@@ -XXX,XX +XXX,XX @@ static inline MemoryRegion *address_space_translate_cached(
 
     section = address_space_translate_iommu(iommu_mr, xlat, plen,
                                             NULL, is_write, true,
-                                            &target_as);
+                                            &target_as, attrs);
     return section.mr;
 }
 
-- 
2.17.1

From: Shannon Zhao <zhaoshenglong@huawei.com>

acpi_data_push uses g_array_set_size to resize the memory size. If there
is no enough contiguous memory, the address will be changed. So previous
pointer could not be used any more. It must update the pointer and use
the new one.

Also, previous codes wrongly use le32 conversion of iort->node_offset
for subsequent computations that will result incorrect value if host is
not litlle endian. So use the non-converted one instead.

Signed-off-by: Shannon Zhao <zhaoshenglong@huawei.com>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Message-id: 1527663951-14552-1-git-send-email-zhaoshenglong@huawei.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/virt-acpi-build.c | 20 +++++++++++++++-----
 1 file changed, 15 insertions(+), 5 deletions(-)

diff --git a/hw/arm/virt-acpi-build.c b/hw/arm/virt-acpi-build.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/virt-acpi-build.c
+++ b/hw/arm/virt-acpi-build.c
@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
     AcpiIortItsGroup *its;
     AcpiIortTable *iort;
     AcpiIortSmmu3 *smmu;
-    size_t node_size, iort_length, smmu_offset = 0;
+    size_t node_size, iort_node_offset, iort_length, smmu_offset = 0;
     AcpiIortRC *rc;
 
     iort = acpi_data_push(table_data, sizeof(*iort));
@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
 
     iort_length = sizeof(*iort);
     iort->node_count = cpu_to_le32(nb_nodes);
-    iort->node_offset = cpu_to_le32(sizeof(*iort));
+    /*
+     * Use a copy in case table_data->data moves during acpi_data_push
+     * operations.
+     */
+    iort_node_offset = sizeof(*iort);
+    iort->node_offset = cpu_to_le32(iort_node_offset);
 
     /* ITS group node */
     node_size =  sizeof(*its) + sizeof(uint32_t);
@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
         int irq =  vms->irqmap[VIRT_SMMU];
 
         /* SMMUv3 node */
-        smmu_offset = iort->node_offset + node_size;
+        smmu_offset = iort_node_offset + node_size;
         node_size = sizeof(*smmu) + sizeof(*idmap);
         iort_length += node_size;
         smmu = acpi_data_push(table_data, node_size);
@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
         idmap->id_count = cpu_to_le32(0xFFFF);
         idmap->output_base = 0;
         /* output IORT node is the ITS group node (the first node) */
-        idmap->output_reference = cpu_to_le32(iort->node_offset);
+        idmap->output_reference = cpu_to_le32(iort_node_offset);
     }
 
     /* Root Complex Node */
@@ -XXX,XX +XXX,XX @@ build_iort(GArray *table_data, BIOSLinker *linker, VirtMachineState *vms)
         idmap->output_reference = cpu_to_le32(smmu_offset);
     } else {
         /* output IORT node is the ITS group node (the first node) */
-        idmap->output_reference = cpu_to_le32(iort->node_offset);
+        idmap->output_reference = cpu_to_le32(iort_node_offset);
     }
 
+    /*
+     * Update the pointer address in case table_data->data moves during above
+     * acpi_data_push operations.
+     */
+    iort = (AcpiIortTable *)(table_data->data + iort_start);
     iort->length = cpu_to_le32(iort_length);
 
     build_header(linker, table_data, (void *)(table_data->data + iort_start),
-- 
2.17.1

From: Shannon Zhao <zhaoshenglong@huawei.com>

kvm_irqchip_create called by kvm_init will call kvm_init_irq_routing to
initialize global capability variables. If we call kvm_init_irq_routing in
GIC realize function, previous allocated memory will leak.

Fix this by deleting the unnecessary call.

Signed-off-by: Shannon Zhao <zhaoshenglong@huawei.com>
Reviewed-by: Eric Auger <eric.auger@redhat.com>
Message-id: 1527750994-14360-1-git-send-email-zhaoshenglong@huawei.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/intc/arm_gic_kvm.c   | 1 -
 hw/intc/arm_gicv3_kvm.c | 1 -
 2 files changed, 2 deletions(-)

diff --git a/hw/intc/arm_gic_kvm.c b/hw/intc/arm_gic_kvm.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gic_kvm.c
+++ b/hw/intc/arm_gic_kvm.c
@@ -XXX,XX +XXX,XX @@ static void kvm_arm_gic_realize(DeviceState *dev, Error **errp)
 
     if (kvm_has_gsi_routing()) {
         /* set up irq routing */
-        kvm_init_irq_routing(kvm_state);
         for (i = 0; i < s->num_irq - GIC_INTERNAL; ++i) {
             kvm_irqchip_add_irq_route(kvm_state, i, 0, i);
         }
diff --git a/hw/intc/arm_gicv3_kvm.c b/hw/intc/arm_gicv3_kvm.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/arm_gicv3_kvm.c
+++ b/hw/intc/arm_gicv3_kvm.c
@@ -XXX,XX +XXX,XX @@ static void kvm_arm_gicv3_realize(DeviceState *dev, Error **errp)
 
     if (kvm_has_gsi_routing()) {
         /* set up irq routing */
-        kvm_init_irq_routing(kvm_state);
         for (i = 0; i < s->num_irq - GIC_INTERNAL; ++i) {
             kvm_irqchip_add_irq_route(kvm_state, i, 0, i);
         }
-- 
2.17.1