Series comparison

-[PULL 00/47] target-arm queue
+[PULL 00/48] target-arm queue
-Just my fp16 work, plus some small stuff for the sbsa-ref board;
+Last minute pullreq for arm related patches; quite large because
-but my rule of thumb is to send a pullreq once I get over about
+there were several series that only just made it through code review
-patches...
+in time.
+thanks
 -- PMM
-The following changes since commit 2f4c51c0f384d7888a04b4815861e6d5fd244d75:
+The following changes since commit 091e3e3dbc499d84c004e1c50bc9870af37f6e99:
-  Merge remote-tracking branch 'remotes/kraxel/tags/usb-20200831-pull-request' into staging (2020-08-31 19:39:13 +0100)
+  Merge remote-tracking branch 'remotes/ericb/tags/pull-bitmaps-2020-10-26' into staging (2020-10-26 22:36:35 +0000)
 are available in the Git repository at:
-  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200901
+  https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20201027-1
-for you to fetch changes up to 3f462bf0f6ea6382dd1502d4eb1fcd33c8e774f5:
+for you to fetch changes up to 32bd322a0134ed89db00f2b9b3894982db3dedcb:
-  hw/arm/sbsa-ref : Add embedded controller in secure memory (2020-09-01 14:01:34 +0100)
+  hw/timer/armv7m_systick: Rewrite to use ptimers (2020-10-27 11:15:31 +0000)
 ----------------------------------------------------------------
 target-arm queue:
- * Implement fp16 support for AArch32 VFP and Neon
+ * raspi: add model of cprman clock manager
- * hw/arm/sbsa-ref: add "reg" property to DT cpu nodes
+ * sbsa-ref: add an SBSA generic watchdog device
- * hw/arm/sbsa-ref : Add embedded controller in secure memory
+ * arm/trace: Fix hex printing
  * raspi: Add models of Pi 3 model A+, Pi Zero and Pi A+
  * hw/arm/smmuv3: Set the restoration priority of the vSMMUv3 explicitly
  * Nuvoton NPCM7xx: Add USB, RNG, GPIO and watchdog support
  * hw/arm: fix min_cpus for xlnx-versal-virt platform
  * hw/arm/highbank: Silence warnings about missing fallthrough statements
  * linux-user: Support Aarch64 BTI
  * Armv7M systick: fix corner case bugs by rewriting to use ptimer
 ----------------------------------------------------------------
-Graeme Gregory (2):
+Dr. David Alan Gilbert (1):
-      hw/misc/sbsa_ec : Add an embedded controller for sbsa-ref
+      arm/trace: Fix hex printing
       hw/arm/sbsa-ref : Add embedded controller in secure memory
-Leif Lindholm (1):
+Hao Wu (1):
-      hw/arm/sbsa-ref: add "reg" property to DT cpu nodes
+      hw/timer: Adding watchdog for NPCM7XX Timer.
-Peter Maydell (44):
+Havard Skinnemoen (4):
-      target/arm: Remove local definitions of float constants
+      Move npcm7xx_timer_reached_zero call out of npcm7xx_timer_pause
-      target/arm: Use correct ID register check for aa32_fp16_arith
+      hw/misc: Add npcm7xx random number generator
-      target/arm: Implement VFP fp16 for VFP_BINOP operations
+      hw/arm/npcm7xx: Add EHCI and OHCI controllers
-      target/arm: Implement VFP fp16 VMLA, VMLS, VNMLS, VNMLA, VNMUL
+      hw/gpio: Add GPIO model for Nuvoton NPCM7xx
       target/arm: Macroify trans functions for VFMA, VFMS, VFNMA, VFNMS
       target/arm: Implement VFP fp16 for fused-multiply-add
       target/arm: Macroify uses of do_vfp_2op_sp() and do_vfp_2op_dp()
       target/arm: Implement VFP fp16 for VABS, VNEG, VSQRT
       target/arm: Implement VFP fp16 for VMOV immediate
       target/arm: Implement VFP fp16 VCMP
       target/arm: Implement VFP fp16 VLDR and VSTR
       target/arm: Implement VFP fp16 VCVT between float and integer
       target/arm: Make VFP_CONV_FIX macros take separate float type and float size
       target/arm: Use macros instead of open-coding fp16 conversion helpers
       target/arm: Implement VFP fp16 VCVT between float and fixed-point
       target/arm: Implement VFP vp16 VCVT-with-specified-rounding-mode
       target/arm: Implement VFP fp16 VSEL
       target/arm: Implement VFP fp16 VRINT*
       target/arm: Implement new VFP fp16 insn VINS
       target/arm: Implement new VFP fp16 insn VMOVX
       target/arm: Implement VFP fp16 VMOV between gp and halfprec registers
       target/arm: Implement FP16 for Neon VADD, VSUB, VABD, VMUL
       target/arm: Implement fp16 for Neon VRECPE, VRSQRTE using gvec
       target/arm: Implement fp16 for Neon VABS, VNEG of floats
       target/arm: Implement fp16 for VCEQ, VCGE, VCGT comparisons
       target/arm: Implement fp16 for VACGE, VACGT
       target/arm: Implement fp16 for Neon VMAX, VMIN
       target/arm: Implement fp16 for Neon VMAXNM, VMINNM
       target/arm: Implement fp16 for Neon VMLA, VMLS operations
       target/arm: Implement fp16 for Neon VFMA, VMFS
       target/arm: Implement fp16 for Neon fp compare-vs-0
       target/arm: Implement fp16 for Neon VRECPS
       target/arm: Implement fp16 for Neon VRSQRTS
       target/arm: Implement fp16 for Neon pairwise fp ops
       target/arm: Implement fp16 for Neon float-integer VCVT
       target/arm: Convert Neon VCVT fixed-point to gvec
       target/arm: Implement fp16 for Neon VCVT fixed-point
       target/arm: Implement fp16 for Neon VCVT with rounding modes
       target/arm: Implement fp16 for Neon VRINT-with-specified-rounding-mode
       target/arm: Implement fp16 for Neon VRINTX
       target/arm/vec_helper: Handle oprsz less than 16 bytes in indexed operations
       target/arm/vec_helper: Add gvec fp indexed multiply-and-add operations
       target/arm: Implement fp16 for Neon VMUL, VMLA, VMLS
       target/arm: Enable FP16 in '-cpu max'
- target/arm/cpu.h                |   7 +-
+Luc Michel (14):
- target/arm/helper.h             | 133 ++++++-
+      hw/core/clock: provide the VMSTATE_ARRAY_CLOCK macro
- target/arm/neon-dp.decode       |   8 +-
+      hw/core/clock: trace clock values in Hz instead of ns
- target/arm/vfp-uncond.decode    |  27 +-
+      hw/arm/raspi: fix CPRMAN base address
- target/arm/vfp.decode           |  34 +-
+      hw/arm/raspi: add a skeleton implementation of the CPRMAN
- hw/arm/sbsa-ref.c               |  43 ++-
+      hw/misc/bcm2835_cprman: add a PLL skeleton implementation
- hw/misc/sbsa_ec.c               |  98 +++++
+      hw/misc/bcm2835_cprman: implement PLLs behaviour
- target/arm/cpu.c                |   3 +-
+      hw/misc/bcm2835_cprman: add a PLL channel skeleton implementation
- target/arm/cpu64.c              |  10 +-
+      hw/misc/bcm2835_cprman: implement PLL channels behaviour
- target/arm/helper-a64.c         |  11 -
+      hw/misc/bcm2835_cprman: add a clock mux skeleton implementation
- target/arm/translate-sve.c      |   4 -
+      hw/misc/bcm2835_cprman: implement clock mux behaviour
- target/arm/vec_helper.c         | 431 ++++++++++++++++++++-
+      hw/misc/bcm2835_cprman: add the DSI0HSCK multiplexer
- target/arm/vfp_helper.c         | 244 +++++-------
+      hw/misc/bcm2835_cprman: add sane reset values to the registers
- hw/misc/meson.build             |   2 +
+      hw/char/pl011: add a clock input
- target/arm/translate-neon.c.inc | 755 +++++++++++++------------------------
+      hw/arm/bcm2835_peripherals: connect the UART clock
  target/arm/translate-vfp.c.inc  | 810 ++++++++++++++++++++++++++++++++++++----
 files changed, 1819 insertions(+), 801 deletions(-)
  create mode 100644 hw/misc/sbsa_ec.c
+Pavel Dovgalyuk (1):
+      hw/arm: fix min_cpus for xlnx-versal-virt platform
+Peter Maydell (2):
+      hw/core/ptimer: Support ptimer being disabled by timer callback
+      hw/timer/armv7m_systick: Rewrite to use ptimers
+Philippe Mathieu-Daudé (10):
+      linux-user/elfload: Avoid leaking interp_name using GLib memory API
+      hw/arm/bcm2836: Restrict BCM283XInfo declaration to C source
+      hw/arm/bcm2836: QOM'ify more by adding class_init() to each SoC type
+      hw/arm/bcm2836: Introduce BCM283XClass::core_count
+      hw/arm/bcm2836: Only provide "enabled-cpus" property to multicore SoCs
+      hw/arm/bcm2836: Split out common realize() code
+      hw/arm/bcm2836: Introduce the BCM2835 SoC
+      hw/arm/raspi: Add the Raspberry Pi A+ machine
+      hw/arm/raspi: Add the Raspberry Pi Zero machine
+      hw/arm/raspi: Add the Raspberry Pi 3 model A+
+Richard Henderson (11):
+      linux-user/aarch64: Reset btype for signals
+      linux-user: Set PAGE_TARGET_1 for TARGET_PROT_BTI
+      include/elf: Add defines related to GNU property notes for AArch64
+      linux-user/elfload: Fix coding style in load_elf_image
+      linux-user/elfload: Adjust iteration over phdr
+      linux-user/elfload: Move PT_INTERP detection to first loop
+      linux-user/elfload: Use Error for load_elf_image
+      linux-user/elfload: Use Error for load_elf_interp
+      linux-user/elfload: Parse NT_GNU_PROPERTY_TYPE_0 notes
+      linux-user/elfload: Parse GNU_PROPERTY_AARCH64_FEATURE_1_AND
+      tests/tcg/aarch64: Add bti smoke tests
+Shashi Mallela (2):
+      hw/watchdog: Implement SBSA watchdog device
+      hw/arm/sbsa-ref: add SBSA watchdog device
+Thomas Huth (1):
+      hw/arm/highbank: Silence warnings about missing fallthrough statements
+Zenghui Yu (1):
+      hw/arm/smmuv3: Set the restoration priority of the vSMMUv3 explicitly
+ docs/system/arm/nuvoton.rst                |    6 +-
+ hw/usb/hcd-ehci.h                          |    1 +
+ include/elf.h                              |   22 +
+ include/exec/cpu-all.h                     |    2 +
+ include/hw/arm/bcm2835_peripherals.h       |    5 +-
+ include/hw/arm/bcm2836.h                   |    9 +-
+ include/hw/arm/npcm7xx.h                   |    8 +
+ include/hw/arm/raspi_platform.h            |    5 +-
+ include/hw/char/pl011.h                    |    1 +
+ include/hw/clock.h                         |    5 +
+ include/hw/gpio/npcm7xx_gpio.h             |   55 ++
+ include/hw/misc/bcm2835_cprman.h           |  210 ++++++
+ include/hw/misc/bcm2835_cprman_internals.h | 1019 ++++++++++++++++++++++++++++
+ include/hw/misc/npcm7xx_clk.h              |    2 +
+ include/hw/misc/npcm7xx_rng.h              |   34 +
+ include/hw/timer/armv7m_systick.h          |    3 +-
+ include/hw/timer/npcm7xx_timer.h           |   48 +-
+ include/hw/watchdog/sbsa_gwdt.h            |   79 +++
+ linux-user/qemu.h                          |    4 +
+ linux-user/syscall_defs.h                  |    4 +
+ target/arm/cpu.h                           |    5 +
+ hw/arm/bcm2835_peripherals.c               |   15 +-
+ hw/arm/bcm2836.c                           |  182 +++--
+ hw/arm/highbank.c                          |    2 +
+ hw/arm/npcm7xx.c                           |  126 +++-
+ hw/arm/raspi.c                             |   41 ++
+ hw/arm/sbsa-ref.c                          |   23 +
+ hw/arm/smmuv3.c                            |    1 +
+ hw/arm/xlnx-versal-virt.c                  |    1 +
+ hw/char/pl011.c                            |   45 ++
+ hw/core/clock.c                            |    6 +-
+ hw/core/ptimer.c                           |    4 +
+ hw/gpio/npcm7xx_gpio.c                     |  424 ++++++++++++
+ hw/misc/bcm2835_cprman.c                   |  808 ++++++++++++++++++++++
+ hw/misc/npcm7xx_clk.c                      |   28 +
+ hw/misc/npcm7xx_rng.c                      |  180 +++++
+ hw/timer/armv7m_systick.c                  |  124 ++--
+ hw/timer/npcm7xx_timer.c                   |  270 ++++++--
+ hw/usb/hcd-ehci-sysbus.c                   |   19 +
+ hw/watchdog/sbsa_gwdt.c                    |  293 ++++++++
+ linux-user/aarch64/signal.c                |   10 +-
+ linux-user/elfload.c                       |  326 +++++++--
+ linux-user/mmap.c                          |   16 +
+ target/arm/translate-a64.c                 |    6 +-
+ tests/qtest/npcm7xx_gpio-test.c            |  385 +++++++++++
+ tests/qtest/npcm7xx_rng-test.c             |  278 ++++++++
+ tests/qtest/npcm7xx_watchdog_timer-test.c  |  319 +++++++++
+ tests/tcg/aarch64/bti-1.c                  |   62 ++
+ tests/tcg/aarch64/bti-2.c                  |  116 ++++
+ tests/tcg/aarch64/bti-crt.inc.c            |   51 ++
+ MAINTAINERS                                |    1 +
+ hw/arm/Kconfig                             |    1 +
+ hw/arm/trace-events                        |    2 +-
+ hw/char/trace-events                       |    1 +
+ hw/core/trace-events                       |    4 +-
+ hw/gpio/meson.build                        |    1 +
+ hw/gpio/trace-events                       |    7 +
+ hw/misc/meson.build                        |    2 +
+ hw/misc/trace-events                       |    9 +
+ hw/watchdog/Kconfig                        |    3 +
+ hw/watchdog/meson.build                    |    1 +
+ tests/qtest/meson.build                    |    6 +-
+ tests/tcg/aarch64/Makefile.target          |   10 +
+ tests/tcg/configure.sh                     |    4 +
+files changed, 5461 insertions(+), 279 deletions(-)
+ create mode 100644 include/hw/gpio/npcm7xx_gpio.h
+ create mode 100644 include/hw/misc/bcm2835_cprman.h
+ create mode 100644 include/hw/misc/bcm2835_cprman_internals.h
+ create mode 100644 include/hw/misc/npcm7xx_rng.h
+ create mode 100644 include/hw/watchdog/sbsa_gwdt.h
+ create mode 100644 hw/gpio/npcm7xx_gpio.c
+ create mode 100644 hw/misc/bcm2835_cprman.c
+ create mode 100644 hw/misc/npcm7xx_rng.c
+ create mode 100644 hw/watchdog/sbsa_gwdt.c
+ create mode 100644 tests/qtest/npcm7xx_gpio-test.c
+ create mode 100644 tests/qtest/npcm7xx_rng-test.c
+ create mode 100644 tests/qtest/npcm7xx_watchdog_timer-test.c
+ create mode 100644 tests/tcg/aarch64/bti-1.c
+ create mode 100644 tests/tcg/aarch64/bti-2.c
+ create mode 100644 tests/tcg/aarch64/bti-crt.inc.c

-[PULL 39/47] target/arm: Implement fp16 for Neon VRINT-with-specified-rounding-mode
+[PULL 01/48] linux-user/aarch64: Reset btype for signals
-Convert the Neon VRINT-with-specified-rounding-mode insns to gvec,
+From: Richard Henderson <richard.henderson@linaro.org>
 and use this to implement the fp16 versions.
+The kernel sets btype for the signal handler as if for a call.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-2-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-41-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  4 +-
+ linux-user/aarch64/signal.c | 10 ++++++++--
- target/arm/vec_helper.c         | 21 +++++++++++
+file changed, 8 insertions(+), 2 deletions(-)
  target/arm/vfp_helper.c         | 17 ---------
  target/arm/translate-neon.c.inc | 67 +++------------------------------
 files changed, 30 insertions(+), 79 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/linux-user/aarch64/signal.c b/linux-user/aarch64/signal.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/linux-user/aarch64/signal.c
-+++ b/target/arm/helper.h
++++ b/linux-user/aarch64/signal.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_sqtoh, f16, i64, i32, ptr)
+@@ -XXX,XX +XXX,XX @@ static void target_setup_frame(int usig, struct target_sigaction *ka,
- DEF_HELPER_3(vfp_uqtoh, f16, i64, i32, ptr)
+             + offsetof(struct target_rt_frame_record, tramp);
+     }
- DEF_HELPER_FLAGS_2(set_rmode, TCG_CALL_NO_RWG, i32, i32, ptr)
+     env->xregs[0] = usig;
--DEF_HELPER_FLAGS_2(set_neon_rmode, TCG_CALL_NO_RWG, i32, i32, env)
+-    env->xregs[31] = frame_addr;
+     env->xregs[29] = frame_addr + fr_ofs;
- DEF_HELPER_FLAGS_3(vfp_fcvt_f16_to_f32, TCG_CALL_NO_RWG, f32, f16, ptr, i32)
+-    env->pc = ka->_sa_handler;
- DEF_HELPER_FLAGS_3(vfp_fcvt_f32_to_f16, TCG_CALL_NO_RWG, f16, f32, ptr, i32)
+     env->xregs[30] = return_addr;
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    env->xregs[31] = frame_addr;
- DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    env->pc = ka->_sa_handler;
  DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_vrint_rm_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_vrint_rm_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
- DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    /* Invoke the signal handler as if by indirect call.  */
- DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    if (cpu_isar_feature(aa64_bti, env_archcpu(env))) {
- DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++        env->btype = 2;
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_RMODE(gvec_vcvt_rm_sh, helper_vfp_toshh, uint16_t)
  DO_VCVT_RMODE(gvec_vcvt_rm_uh, helper_vfp_touhh, uint16_t)
  #undef DO_VCVT_RMODE
 +
 +#define DO_VRINT_RMODE(NAME, FUNC, TYPE)                                \
 +    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
 +    {                                                                   \
 +        float_status *fpst = stat;                                      \
 +        intptr_t i, oprsz = simd_oprsz(desc);                           \
 +        uint32_t rmode = simd_data(desc);                               \
 +        uint32_t prev_rmode = get_float_rounding_mode(fpst);            \
 +        TYPE *d = vd, *n = vn;                                          \
 +        set_float_rounding_mode(rmode, fpst);                           \
 +        for (i = 0; i < oprsz / sizeof(TYPE); i++) {                    \
 +            d[i] = FUNC(n[i], fpst);                                    \
 +        }                                                               \
 +        set_float_rounding_mode(prev_rmode, fpst);                      \
 +        clear_tail(d, oprsz, simd_maxsz(desc));                         \
 +    }
 +
-+DO_VRINT_RMODE(gvec_vrint_rm_h, helper_rinth, uint16_t)
+     if (info) {
-+DO_VRINT_RMODE(gvec_vrint_rm_s, helper_rints, uint32_t)
+         tswap_siginfo(&frame->info, info);
-+
+         env->xregs[1] = frame_addr + offsetof(struct target_rt_sigframe, info);
 +#undef DO_VRINT_RMODE
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(set_rmode)(uint32_t rmode, void *fpstp)
      return prev_rmode;
  }
 -/* Set the current fp rounding mode in the standard fp status and return
 - * the old one. This is for NEON instructions that need to change the
 - * rounding mode but wish to use the standard FPSCR values for everything
 - * else. Always set the rounding mode back to the correct value after
 - * modifying it.
 - * The argument is a softfloat float_round_ value.
 - */
 -uint32_t HELPER(set_neon_rmode)(uint32_t rmode, CPUARMState *env)
 -{
 -    float_status *fp_status = &env->vfp.standard_fp_status;
 -
 -    uint32_t prev_rmode = get_float_rounding_mode(fp_status);
 -    set_float_rounding_mode(rmode, fp_status);
 -
 -    return prev_rmode;
 -}
 -
  /* Half precision conversions.  */
  float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, void *fpstp, uint32_t ahp_mode)
  {
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
      return do_2misc_fp(s, a, gen_helper_rints_exact);
  }
 -static bool do_vrint(DisasContext *s, arg_2misc *a, int rmode)
 -{
 -    /*
 -     * Handle a VRINT* operation by iterating 32 bits at a time,
 -     * with a specified rounding mode in operation.
 -     */
 -    int pass;
 -    TCGv_ptr fpst;
 -    TCGv_i32 tcg_rmode;
 -
 -    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 -        !arm_dc_feature(s, ARM_FEATURE_V8)) {
 -        return false;
 -    }
 -
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vd | a->vm) & 0x10)) {
 -        return false;
 -    }
 -
 -    if (a->size != 2) {
 -        /* TODO: FP16 will be the size == 1 case */
 -        return false;
 -    }
 -
 -    if ((a->vd | a->vm) & a->q) {
 -        return false;
 -    }
 -
 -    if (!vfp_access_check(s)) {
 -        return true;
 -    }
 -
 -    fpst = fpstatus_ptr(FPST_STD);
 -    tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rmode));
 -    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
 -    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
 -        TCGv_i32 tmp = neon_load_reg(a->vm, pass);
 -        gen_helper_rints(tmp, tmp, fpst);
 -        neon_store_reg(a->vd, pass, tmp);
 -    }
 -    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
 -    tcg_temp_free_i32(tcg_rmode);
 -    tcg_temp_free_ptr(fpst);
 -
 -    return true;
 -}
 -
 -#define DO_VRINT(INSN, RMODE)                                   \
 -    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
 -    {                                                           \
 -        return do_vrint(s, a, RMODE);                           \
 -    }
 -
 -DO_VRINT(VRINTN, FPROUNDING_TIEEVEN)
 -DO_VRINT(VRINTA, FPROUNDING_TIEAWAY)
 -DO_VRINT(VRINTZ, FPROUNDING_ZERO)
 -DO_VRINT(VRINTM, FPROUNDING_NEGINF)
 -DO_VRINT(VRINTP, FPROUNDING_POSINF)
 -
  #define DO_VEC_RMODE(INSN, RMODE, OP)                                   \
      static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
                             uint32_t rm_ofs,                             \
@@ -XXX,XX +XXX,XX @@ DO_VEC_RMODE(VCVTPS, FPROUNDING_POSINF, vcvt_rm_s)
  DO_VEC_RMODE(VCVTMU, FPROUNDING_NEGINF, vcvt_rm_u)
  DO_VEC_RMODE(VCVTMS, FPROUNDING_NEGINF, vcvt_rm_s)
 +DO_VEC_RMODE(VRINTN, FPROUNDING_TIEEVEN, vrint_rm_)
 +DO_VEC_RMODE(VRINTA, FPROUNDING_TIEAWAY, vrint_rm_)
 +DO_VEC_RMODE(VRINTZ, FPROUNDING_ZERO, vrint_rm_)
 +DO_VEC_RMODE(VRINTM, FPROUNDING_NEGINF, vrint_rm_)
 +DO_VEC_RMODE(VRINTP, FPROUNDING_POSINF, vrint_rm_)
 +
  static bool trans_VSWP(DisasContext *s, arg_2misc *a)
  {
      TCGv_i64 rm, rd;
 --
 .20.1

-[PULL 02/47] target/arm: Use correct ID register check for aa32_fp16_arith
+[PULL 02/48] linux-user: Set PAGE_TARGET_1 for TARGET_PROT_BTI
-The aa32_fp16_arith feature check function currently looks at the
+From: Richard Henderson <richard.henderson@linaro.org>
 AArch64 ID_AA64PFR0 register. This is (as the comment notes) not
 correct. The bogus check was put in mostly to allow testing of the
 fp16 variants of the VCMLA instructions and it was something of
 a mistake that we allowed them to exist in master.
-Switch the feature check function to testing VMFR1.FPHP, which is
+Transform the prot bit to a qemu internal page bit, and save
-what it ought to be.
+it in the page tables.
-This will remove emulation of the VCMLA and VCADD insns from
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
-AArch32 code running on an AArch64 '-cpu max' using system emulation.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-(They were never enabled for aarch32 linux-user and system-emulation.)
+Message-id: 20201021173749.111103-3-richard.henderson@linaro.org
-Since we weren't advertising their existence via the AArch32 ID
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-register, well-behaved guests wouldn't have been using them anyway.
+---
  include/exec/cpu-all.h     |  2 ++
  linux-user/syscall_defs.h  |  4 ++++
  target/arm/cpu.h           |  5 +++++
  linux-user/mmap.c          | 16 ++++++++++++++++
  target/arm/translate-a64.c |  6 +++---
 files changed, 30 insertions(+), 3 deletions(-)
-Once we have implemented all the AArch32 support for the FP16 extension
+diff --git a/include/exec/cpu-all.h b/include/exec/cpu-all.h
-we will advertise it in the MVFR1 ID register field, which will reenable
+index XXXXXXX..XXXXXXX 100644
-these insns along with all the others.
+--- a/include/exec/cpu-all.h
++++ b/include/exec/cpu-all.h
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+@@ -XXX,XX +XXX,XX @@ extern intptr_t qemu_host_page_mask;
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+ /* FIXME: Code that sets/uses this is broken and needs to go away.  */
-Message-id: 20200828183354.27913-3-peter.maydell@linaro.org
+ #define PAGE_RESERVED  0x0020
----
+ #endif
- target/arm/cpu.h | 7 +------
++/* Target-specific bits that will be used via page_get_flags().  */
-file changed, 1 insertion(+), 6 deletions(-)
++#define PAGE_TARGET_1  0x0080
  #if defined(CONFIG_USER_ONLY)
  void page_dump(FILE *f);
 diff --git a/linux-user/syscall_defs.h b/linux-user/syscall_defs.h
 index XXXXXXX..XXXXXXX 100644
 --- a/linux-user/syscall_defs.h
 +++ b/linux-user/syscall_defs.h
@@ -XXX,XX +XXX,XX @@ struct target_winsize {
  #define TARGET_PROT_SEM         0x08
  #endif
 +#ifdef TARGET_AARCH64
 +#define TARGET_PROT_BTI         0x10
 +#endif
 +
  /* Common */
  #define TARGET_MAP_SHARED    0x01        /* Share changes */
  #define TARGET_MAP_PRIVATE    0x02        /* Changes are private */
 diff --git a/target/arm/cpu.h b/target/arm/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/cpu.h
 +++ b/target/arm/cpu.h
-@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_predinv(const ARMISARegisters *id)
+@@ -XXX,XX +XXX,XX @@ static inline MemTxAttrs *typecheck_memtxattrs(MemTxAttrs *x)
+ #define arm_tlb_bti_gp(x) (typecheck_memtxattrs(x)->target_tlb_bit0)
- static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
+ #define arm_tlb_mte_tagged(x) (typecheck_memtxattrs(x)->target_tlb_bit1)
 +/*
 + * AArch64 usage of the PAGE_TARGET_* bits for linux-user.
 + */
 +#define PAGE_BTI  PAGE_TARGET_1
 +
  /*
   * Naming convention for isar_feature functions:
   * Functions which test 32-bit ID registers should have _aa32_ in
 diff --git a/linux-user/mmap.c b/linux-user/mmap.c
 index XXXXXXX..XXXXXXX 100644
 --- a/linux-user/mmap.c
 +++ b/linux-user/mmap.c
@@ -XXX,XX +XXX,XX @@ static int validate_prot_to_pageflags(int *host_prot, int prot)
      *host_prot = (prot & (PROT_READ | PROT_WRITE))
                 | (prot & PROT_EXEC ? PROT_READ : 0);
 +#ifdef TARGET_AARCH64
 +    /*
 +     * The PROT_BTI bit is only accepted if the cpu supports the feature.
 +     * Since this is the unusual case, don't bother checking unless
 +     * the bit has been requested.  If set and valid, record the bit
 +     * within QEMU's page_flags.
 +     */
 +    if (prot & TARGET_PROT_BTI) {
 +        ARMCPU *cpu = ARM_CPU(thread_cpu);
 +        if (cpu_isar_feature(aa64_bti, cpu)) {
 +            valid |= TARGET_PROT_BTI;
 +            page_flags |= PAGE_BTI;
 +        }
 +    }
 +#endif
 +
      return prot & ~valid ? 0 : page_flags;
  }
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_simd_fp(DisasContext *s, uint32_t insn)
   */
  static bool is_guarded_page(CPUARMState *env, DisasContext *s)
  {
--    /*
+-#ifdef CONFIG_USER_ONLY
--     * This is a placeholder for use by VCMA until the rest of
+-    return false;  /* FIXME */
--     * the ARMv8.2-FP16 extension is implemented for aa32 mode.
+-#else
--     * At which point we can properly set and check MVFR1.FPHP.
+     uint64_t addr = s->base.pc_first;
--     */
++#ifdef CONFIG_USER_ONLY
--    return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, FP) == 1;
++    return page_get_flags(addr) & PAGE_BTI;
-+    return FIELD_EX32(id->mvfr1, MVFR1, FPHP) >= 3;
++#else
- }
+     int mmu_idx = arm_to_core_mmu_idx(s->mmu_idx);
+     unsigned int index = tlb_index(env, mmu_idx, addr);
- static inline bool isar_feature_aa32_vfp_simd(const ARMISARegisters *id)
+     CPUTLBEntry *entry = tlb_entry(env, mmu_idx, addr);
 --
 .20.1

-New patch
+[PULL 03/48] include/elf: Add defines related to GNU property notes for AArch64
+From: Richard Henderson <richard.henderson@linaro.org>
+These are all of the defines required to parse
+GNU_PROPERTY_AARCH64_FEATURE_1_AND, copied from binutils.
+Other missing defines related to other GNU program headers
+and notes are elided for now.
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-4-richard.henderson@linaro.org
+Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+---
+ include/elf.h | 22 ++++++++++++++++++++++
+file changed, 22 insertions(+)
+diff --git a/include/elf.h b/include/elf.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/elf.h
++++ b/include/elf.h
+@@ -XXX,XX +XXX,XX @@ typedef int64_t  Elf64_Sxword;
+ #define PT_NOTE    4
+ #define PT_SHLIB   5
+ #define PT_PHDR    6
++#define PT_LOOS    0x60000000
++#define PT_HIOS    0x6fffffff
+ #define PT_LOPROC  0x70000000
+ #define PT_HIPROC  0x7fffffff
++#define PT_GNU_PROPERTY   (PT_LOOS + 0x474e553)
++
+ #define PT_MIPS_REGINFO   0x70000000
+ #define PT_MIPS_RTPROC    0x70000001
+ #define PT_MIPS_OPTIONS   0x70000002
+@@ -XXX,XX +XXX,XX @@ typedef struct elf64_shdr {
+ #define NT_ARM_SYSTEM_CALL      0x404   /* ARM system call number */
+ #define NT_ARM_SVE      0x405           /* ARM Scalable Vector Extension regs */
++/* Defined note types for GNU systems.  */
++
++#define NT_GNU_PROPERTY_TYPE_0  5       /* Program property */
++
++/* Values used in GNU .note.gnu.property notes (NT_GNU_PROPERTY_TYPE_0).  */
++
++#define GNU_PROPERTY_STACK_SIZE                 1
++#define GNU_PROPERTY_NO_COPY_ON_PROTECTED       2
++
++#define GNU_PROPERTY_LOPROC                     0xc0000000
++#define GNU_PROPERTY_HIPROC                     0xdfffffff
++#define GNU_PROPERTY_LOUSER                     0xe0000000
++#define GNU_PROPERTY_HIUSER                     0xffffffff
++
++#define GNU_PROPERTY_AARCH64_FEATURE_1_AND      0xc0000000
++#define GNU_PROPERTY_AARCH64_FEATURE_1_BTI      (1u << 0)
++#define GNU_PROPERTY_AARCH64_FEATURE_1_PAC      (1u << 1)
++
+ /*
+  * Physical entry point into the kernel.
+  *
+--
+.20.1

-[PULL 38/47] target/arm: Implement fp16 for Neon VCVT with rounding modes
+[PULL 04/48] linux-user/elfload: Avoid leaking interp_name using GLib memory API
-Convert the Neon VCVT with-specified-rounding-mode instructions
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 to gvec, and use this to implement fp16 support for them.
+Fix an unlikely memory leak in load_elf_image().
+Fixes: bf858897b7 ("linux-user: Re-use load_elf_image for the main binary.")
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-5-richard.henderson@linaro.org
+Message-Id: <20201003174944.1972444-1-f4bug@amsat.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-40-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |   5 ++
+ linux-user/elfload.c | 8 ++++----
- target/arm/vec_helper.c         |  23 +++++++
+file changed, 4 insertions(+), 4 deletions(-)
  target/arm/translate-neon.c.inc | 105 ++++++++++++--------------------
 files changed, 66 insertions(+), 67 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/linux-user/elfload.c
-+++ b/target/arm/helper.h
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
- DEF_HELPER_FLAGS_4(gvec_vcvt_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+                 info->brk = vaddr_em;
- DEF_HELPER_FLAGS_4(gvec_vcvt_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             }
+         } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
-+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-            char *interp_name;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            g_autofree char *interp_name = NULL;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             if (*pinterp_name) {
-+
+                 errmsg = "Multiple PT_INTERP entries";
- DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+                 goto exit_errmsg;
- DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             }
- DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-            interp_name = malloc(eppnt->p_filesz);
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++            interp_name = g_malloc(eppnt->p_filesz);
-index XXXXXXX..XXXXXXX 100644
+             if (!interp_name) {
---- a/target/arm/vec_helper.c
+                 goto exit_perror;
-+++ b/target/arm/vec_helper.c
+             }
-@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_hs, helper_vfp_toshh_round_to_zero, uint16_t)
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
- DO_VCVT_FIXED(gvec_vcvt_hu, helper_vfp_touhh_round_to_zero, uint16_t)
+                 errmsg = "Invalid PT_INTERP entry";
+                 goto exit_errmsg;
- #undef DO_VCVT_FIXED
+             }
-+
+-            *pinterp_name = interp_name;
-+#define DO_VCVT_RMODE(NAME, FUNC, TYPE)                                 \
++            *pinterp_name = g_steal_pointer(&interp_name);
-+    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
+ #ifdef TARGET_MIPS
-+    {                                                                   \
+         } else if (eppnt->p_type == PT_MIPS_ABIFLAGS) {
-+        float_status *fpst = stat;                                      \
+             Mips_elf_abiflags_v0 abiflags;
-+        intptr_t i, oprsz = simd_oprsz(desc);                           \
+@@ -XXX,XX +XXX,XX @@ int load_elf_binary(struct linux_binprm *bprm, struct image_info *info)
-+        uint32_t rmode = simd_data(desc);                               \
+     if (elf_interpreter) {
-+        uint32_t prev_rmode = get_float_rounding_mode(fpst);            \
+         info->load_bias = interp_info.load_bias;
-+        TYPE *d = vd, *n = vn;                                          \
+         info->entry = interp_info.entry;
-+        set_float_rounding_mode(rmode, fpst);                           \
+-        free(elf_interpreter);
-+        for (i = 0; i < oprsz / sizeof(TYPE); i++) {                    \
++        g_free(elf_interpreter);
 +            d[i] = FUNC(n[i], 0, fpst);                                 \
 +        }                                                               \
 +        set_float_rounding_mode(prev_rmode, fpst);                      \
 +        clear_tail(d, oprsz, simd_maxsz(desc));                         \
 +    }
 +
 +DO_VCVT_RMODE(gvec_vcvt_rm_ss, helper_vfp_tosls, uint32_t)
 +DO_VCVT_RMODE(gvec_vcvt_rm_us, helper_vfp_touls, uint32_t)
 +DO_VCVT_RMODE(gvec_vcvt_rm_sh, helper_vfp_toshh, uint16_t)
 +DO_VCVT_RMODE(gvec_vcvt_rm_uh, helper_vfp_touhh, uint16_t)
 +
 +#undef DO_VCVT_RMODE
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_VRINT(VRINTZ, FPROUNDING_ZERO)
  DO_VRINT(VRINTM, FPROUNDING_NEGINF)
  DO_VRINT(VRINTP, FPROUNDING_POSINF)
 -static bool do_vcvt(DisasContext *s, arg_2misc *a, int rmode, bool is_signed)
 -{
 -    /*
 -     * Handle a VCVT* operation by iterating 32 bits at a time,
 -     * with a specified rounding mode in operation.
 -     */
 -    int pass;
 -    TCGv_ptr fpst;
 -    TCGv_i32 tcg_rmode, tcg_shift;
 -
 -    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
 -        !arm_dc_feature(s, ARM_FEATURE_V8)) {
 -        return false;
 +#define DO_VEC_RMODE(INSN, RMODE, OP)                                   \
 +    static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
 +                           uint32_t rm_ofs,                             \
 +                           uint32_t oprsz, uint32_t maxsz)              \
 +    {                                                                   \
 +        static gen_helper_gvec_2_ptr * const fns[4] = {                 \
 +            NULL,                                                       \
 +            gen_helper_gvec_##OP##h,                                    \
 +            gen_helper_gvec_##OP##s,                                    \
 +            NULL,                                                       \
 +        };                                                              \
 +        TCGv_ptr fpst;                                                  \
 +        fpst = fpstatus_ptr(vece == 1 ? FPST_STD_F16 : FPST_STD);       \
 +        tcg_gen_gvec_2_ptr(rd_ofs, rm_ofs, fpst, oprsz, maxsz,          \
 +                           arm_rmode_to_sf(RMODE), fns[vece]);          \
 +        tcg_temp_free_ptr(fpst);                                        \
 +    }                                                                   \
 +    static bool trans_##INSN(DisasContext *s, arg_2misc *a)             \
 +    {                                                                   \
 +        if (!arm_dc_feature(s, ARM_FEATURE_V8)) {                       \
 +            return false;                                               \
 +        }                                                               \
 +        if (a->size == MO_16) {                                         \
 +            if (!dc_isar_feature(aa32_fp16_arith, s)) {                 \
 +                return false;                                           \
 +            }                                                           \
 +        } else if (a->size != MO_32) {                                  \
 +            return false;                                               \
 +        }                                                               \
 +        return do_2misc_vec(s, a, gen_##INSN);                          \
      }
--    /* UNDEF accesses to D16-D31 if they don't exist. */
+ #ifdef USE_ELF_CORE_DUMP
 -    if (!dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vd | a->vm) & 0x10)) {
 -        return false;
 -    }
 -
 -    if (a->size != 2) {
 -        /* TODO: FP16 will be the size == 1 case */
 -        return false;
 -    }
 -
 -    if ((a->vd | a->vm) & a->q) {
 -        return false;
 -    }
 -
 -    if (!vfp_access_check(s)) {
 -        return true;
 -    }
 -
 -    fpst = fpstatus_ptr(FPST_STD);
 -    tcg_shift = tcg_const_i32(0);
 -    tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rmode));
 -    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
 -    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
 -        TCGv_i32 tmp = neon_load_reg(a->vm, pass);
 -        if (is_signed) {
 -            gen_helper_vfp_tosls(tmp, tmp, tcg_shift, fpst);
 -        } else {
 -            gen_helper_vfp_touls(tmp, tmp, tcg_shift, fpst);
 -        }
 -        neon_store_reg(a->vd, pass, tmp);
 -    }
 -    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
 -    tcg_temp_free_i32(tcg_rmode);
 -    tcg_temp_free_i32(tcg_shift);
 -    tcg_temp_free_ptr(fpst);
 -
 -    return true;
 -}
 -
 -#define DO_VCVT(INSN, RMODE, SIGNED)                            \
 -    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
 -    {                                                           \
 -        return do_vcvt(s, a, RMODE, SIGNED);                    \
 -    }
 -
 -DO_VCVT(VCVTAU, FPROUNDING_TIEAWAY, false)
 -DO_VCVT(VCVTAS, FPROUNDING_TIEAWAY, true)
 -DO_VCVT(VCVTNU, FPROUNDING_TIEEVEN, false)
 -DO_VCVT(VCVTNS, FPROUNDING_TIEEVEN, true)
 -DO_VCVT(VCVTPU, FPROUNDING_POSINF, false)
 -DO_VCVT(VCVTPS, FPROUNDING_POSINF, true)
 -DO_VCVT(VCVTMU, FPROUNDING_NEGINF, false)
 -DO_VCVT(VCVTMS, FPROUNDING_NEGINF, true)
 +DO_VEC_RMODE(VCVTAU, FPROUNDING_TIEAWAY, vcvt_rm_u)
 +DO_VEC_RMODE(VCVTAS, FPROUNDING_TIEAWAY, vcvt_rm_s)
 +DO_VEC_RMODE(VCVTNU, FPROUNDING_TIEEVEN, vcvt_rm_u)
 +DO_VEC_RMODE(VCVTNS, FPROUNDING_TIEEVEN, vcvt_rm_s)
 +DO_VEC_RMODE(VCVTPU, FPROUNDING_POSINF, vcvt_rm_u)
 +DO_VEC_RMODE(VCVTPS, FPROUNDING_POSINF, vcvt_rm_s)
 +DO_VEC_RMODE(VCVTMU, FPROUNDING_NEGINF, vcvt_rm_u)
 +DO_VEC_RMODE(VCVTMS, FPROUNDING_NEGINF, vcvt_rm_s)
  static bool trans_VSWP(DisasContext *s, arg_2misc *a)
  {
 --
 .20.1

-[PULL 44/47] target/arm: Enable FP16 in '-cpu max'
+[PULL 05/48] linux-user/elfload: Fix coding style in load_elf_image
-Set the MVFR1 ID register FPHP and SIMDHP fields to indicate
+From: Richard Henderson <richard.henderson@linaro.org>
 that our "-cpu max" has v8.2-FP16.
+Fixing this now will clarify following patches.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-6-richard.henderson@linaro.org
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-46-peter.maydell@linaro.org
 ---
- target/arm/cpu.c   |  3 ++-
+ linux-user/elfload.c | 12 +++++++++---
- target/arm/cpu64.c | 10 ++++------
+file changed, 9 insertions(+), 3 deletions(-)
 files changed, 6 insertions(+), 7 deletions(-)
-diff --git a/target/arm/cpu.c b/target/arm/cpu.c
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/cpu.c
+--- a/linux-user/elfload.c
-+++ b/target/arm/cpu.c
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
-             cpu->isar.id_isar6 = t;
+             abi_ulong vaddr, vaddr_po, vaddr_ps, vaddr_ef, vaddr_em, vaddr_len;
+             int elf_prot = 0;
-             t = cpu->isar.mvfr1;
--            t = FIELD_DP32(t, MVFR1, FPHP, 2);     /* v8.0 FP support */
+-            if (eppnt->p_flags & PF_R) elf_prot =  PROT_READ;
-+            t = FIELD_DP32(t, MVFR1, FPHP, 3);     /* v8.2-FP16 */
+-            if (eppnt->p_flags & PF_W) elf_prot |= PROT_WRITE;
-+            t = FIELD_DP32(t, MVFR1, SIMDHP, 2);   /* v8.2-FP16 */
+-            if (eppnt->p_flags & PF_X) elf_prot |= PROT_EXEC;
-             cpu->isar.mvfr1 = t;
++            if (eppnt->p_flags & PF_R) {
++                elf_prot |= PROT_READ;
-             t = cpu->isar.mvfr2;
++            }
-diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
++            if (eppnt->p_flags & PF_W) {
-index XXXXXXX..XXXXXXX 100644
++                elf_prot |= PROT_WRITE;
---- a/target/arm/cpu64.c
++            }
-+++ b/target/arm/cpu64.c
++            if (eppnt->p_flags & PF_X) {
-@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
++                elf_prot |= PROT_EXEC;
-         u = FIELD_DP32(u, ID_DFR0, PERFMON, 5); /* v8.4-PMU */
++            }
-         cpu->isar.id_dfr0 = u;
+             vaddr = load_bias + eppnt->p_vaddr;
--        /*
+             vaddr_po = TARGET_ELF_PAGEOFFSET(vaddr);
 -         * FIXME: We do not yet support ARMv8.2-fp16 for AArch32 yet,
 -         * so do not set MVFR1.FPHP.  Strictly speaking this is not legal,
 -         * but it is also not legal to enable SVE without support for FP16,
 -         * and enabling SVE in system mode is more useful in the short term.
 -         */
 +        u = cpu->isar.mvfr1;
 +        u = FIELD_DP32(u, MVFR1, FPHP, 3);      /* v8.2-FP16 */
 +        u = FIELD_DP32(u, MVFR1, SIMDHP, 2);    /* v8.2-FP16 */
 +        cpu->isar.mvfr1 = u;
  #ifdef CONFIG_USER_ONLY
          /* For usermode -cpu max we can use a larger and more efficient DCZ
 --
 .20.1

-[PULL 34/47] target/arm: Implement fp16 for Neon pairwise fp ops
+[PULL 06/48] linux-user/elfload: Adjust iteration over phdr
-Convert the Neon pairwise fp ops to use a single gvic-style
+From: Richard Henderson <richard.henderson@linaro.org>
 helper to do the full operation instead of one helper call
 for each 32-bit part. This allows us to use the same
 framework to implement the fp16.
+The second loop uses a loop induction variable, and the first
+does not.  Transform the first to match the second, to simplify
+a following patch moving code between them.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-7-richard.henderson@linaro.org
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-36-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  7 +++++
+ linux-user/elfload.c | 9 +++++----
- target/arm/vec_helper.c         | 45 +++++++++++++++++++++++++++++++++
+file changed, 5 insertions(+), 4 deletions(-)
  target/arm/translate-neon.c.inc | 42 ++++++++++++------------------
 files changed, 68 insertions(+), 26 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/linux-user/elfload.c
-+++ b/target/arm/helper.h
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fcmlas_idx, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
- DEF_HELPER_FLAGS_5(gvec_fcmlad, TCG_CALL_NO_RWG,
+     loaddr = -1, hiaddr = 0;
-                    void, ptr, ptr, ptr, ptr, i32)
+     info->alignment = 0;
+     for (i = 0; i < ehdr->e_phnum; ++i) {
-+DEF_HELPER_FLAGS_5(neon_paddh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-        if (phdr[i].p_type == PT_LOAD) {
-+DEF_HELPER_FLAGS_5(neon_pmaxh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-            abi_ulong a = phdr[i].p_vaddr - phdr[i].p_offset;
-+DEF_HELPER_FLAGS_5(neon_pminh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++        struct elf_phdr *eppnt = phdr + i;
-+DEF_HELPER_FLAGS_5(neon_padds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++        if (eppnt->p_type == PT_LOAD) {
-+DEF_HELPER_FLAGS_5(neon_pmaxs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++            abi_ulong a = eppnt->p_vaddr - eppnt->p_offset;
-+DEF_HELPER_FLAGS_5(neon_pmins, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+             if (a < loaddr) {
-+
+                 loaddr = a;
- DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+             }
- DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-            a = phdr[i].p_vaddr + phdr[i].p_memsz;
- DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++            a = eppnt->p_vaddr + eppnt->p_memsz;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+             if (a > hiaddr) {
-index XXXXXXX..XXXXXXX 100644
+                 hiaddr = a;
---- a/target/arm/vec_helper.c
+             }
-+++ b/target/arm/vec_helper.c
+             ++info->nsegs;
-@@ -XXX,XX +XXX,XX @@ DO_ABA(gvec_uaba_s, uint32_t)
+-            info->alignment |= phdr[i].p_align;
- DO_ABA(gvec_uaba_d, uint64_t)
++            info->alignment |= eppnt->p_align;
+         }
  #undef DO_ABA
 +
 +#define DO_NEON_PAIRWISE(NAME, OP)                                      \
 +    void HELPER(NAME##s)(void *vd, void *vn, void *vm,                  \
 +                         void *stat, uint32_t oprsz)                    \
 +    {                                                                   \
 +        float_status *fpst = stat;                                      \
 +        float32 *d = vd;                                                \
 +        float32 *n = vn;                                                \
 +        float32 *m = vm;                                                \
 +        float32 r0, r1;                                                 \
 +                                                                        \
 +        /* Read all inputs before writing outputs in case vm == vd */   \
 +        r0 = float32_##OP(n[H4(0)], n[H4(1)], fpst);                    \
 +        r1 = float32_##OP(m[H4(0)], m[H4(1)], fpst);                    \
 +                                                                        \
 +        d[H4(0)] = r0;                                                  \
 +        d[H4(1)] = r1;                                                  \
 +    }                                                                   \
 +                                                                        \
 +    void HELPER(NAME##h)(void *vd, void *vn, void *vm,                  \
 +                         void *stat, uint32_t oprsz)                    \
 +    {                                                                   \
 +        float_status *fpst = stat;                                      \
 +        float16 *d = vd;                                                \
 +        float16 *n = vn;                                                \
 +        float16 *m = vm;                                                \
 +        float16 r0, r1, r2, r3;                                         \
 +                                                                        \
 +        /* Read all inputs before writing outputs in case vm == vd */   \
 +        r0 = float16_##OP(n[H2(0)], n[H2(1)], fpst);                    \
 +        r1 = float16_##OP(n[H2(2)], n[H2(3)], fpst);                    \
 +        r2 = float16_##OP(m[H2(0)], m[H2(1)], fpst);                    \
 +        r3 = float16_##OP(m[H2(2)], m[H2(3)], fpst);                    \
 +                                                                        \
 +        d[H4(0)] = r0;                                                  \
 +        d[H4(1)] = r1;                                                  \
 +        d[H4(2)] = r2;                                                  \
 +        d[H4(3)] = r3;                                                  \
 +    }
 +
 +DO_NEON_PAIRWISE(neon_padd, add)
 +DO_NEON_PAIRWISE(neon_pmax, max)
 +DO_NEON_PAIRWISE(neon_pmin, min)
 +
 +#undef DO_NEON_PAIRWISE
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VMINNM_fp32_3s);
  }
 -static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
 +static bool do_3same_fp_pair(DisasContext *s, arg_3same *a,
 +                             gen_helper_gvec_3_ptr *fn)
  {
 -    /* FP operations handled pairwise 32 bits at a time */
 -    TCGv_i32 tmp, tmp2, tmp3;
 +    /* FP pairwise operations */
      TCGv_ptr fpstatus;
      if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
@@ -XXX,XX +XXX,XX @@ static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
      assert(a->q == 0); /* enforced by decode patterns */
 -    /*
 -     * Note that we have to be careful not to clobber the source operands
 -     * in the "vm == vd" case by storing the result of the first pass too
 -     * early. Since Q is 0 there are always just two passes, so instead
 -     * of a complicated loop over each pass we just unroll.
 -     */
 -    fpstatus = fpstatus_ptr(FPST_STD);
 -    tmp = neon_load_reg(a->vn, 0);
 -    tmp2 = neon_load_reg(a->vn, 1);
 -    fn(tmp, tmp, tmp2, fpstatus);
 -    tcg_temp_free_i32(tmp2);
 -    tmp3 = neon_load_reg(a->vm, 0);
 -    tmp2 = neon_load_reg(a->vm, 1);
 -    fn(tmp3, tmp3, tmp2, fpstatus);
 -    tcg_temp_free_i32(tmp2);
 +    fpstatus = fpstatus_ptr(a->size != 0 ? FPST_STD_F16 : FPST_STD);
 +    tcg_gen_gvec_3_ptr(vfp_reg_offset(1, a->vd),
 +                       vfp_reg_offset(1, a->vn),
 +                       vfp_reg_offset(1, a->vm),
 +                       fpstatus, 8, 8, 0, fn);
      tcg_temp_free_ptr(fpstatus);
 -    neon_store_reg(a->vd, 0, tmp);
 -    neon_store_reg(a->vd, 1, tmp3);
      return true;
  }
@@ -XXX,XX +XXX,XX @@ static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
      static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
      {                                                               \
          if (a->size != 0) {                                         \
 -            /* TODO fp16 support */                                 \
 -            return false;                                           \
 +            if (!dc_isar_feature(aa32_fp16_arith, s)) {             \
 +                return false;                                       \
 +            }                                                       \
 +            return do_3same_fp_pair(s, a, FUNC##h);                 \
          }                                                           \
 -        return do_3same_fp_pair(s, a, FUNC);                        \
 +        return do_3same_fp_pair(s, a, FUNC##s);                     \
      }
--DO_3S_FP_PAIR(VPADD, gen_helper_vfp_adds)
--DO_3S_FP_PAIR(VPMAX, gen_helper_vfp_maxs)
--DO_3S_FP_PAIR(VPMIN, gen_helper_vfp_mins)
-+DO_3S_FP_PAIR(VPADD, gen_helper_neon_padd)
-+DO_3S_FP_PAIR(VPMAX, gen_helper_neon_pmax)
-+DO_3S_FP_PAIR(VPMIN, gen_helper_neon_pmin)
- static bool do_vector_2sh(DisasContext *s, arg_2reg_shift *a, GVecGen2iFn *fn)
- {
 --
 .20.1

-[PULL 28/47] target/arm: Implement fp16 for Neon VMAXNM, VMINNM
+[PULL 07/48] linux-user/elfload: Move PT_INTERP detection to first loop
-Convert the Neon floating point VMAXNM and VMINNM insns to
+From: Richard Henderson <richard.henderson@linaro.org>
 using a gvec helper and use this to implement the fp16 case.
+For BTI, we need to know if the executable is static or dynamic,
+which means looking for PT_INTERP earlier.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-8-richard.henderson@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-30-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  6 ++++++
+ linux-user/elfload.c | 60 +++++++++++++++++++++++---------------------
- target/arm/vec_helper.c         |  6 ++++++
+file changed, 31 insertions(+), 29 deletions(-)
  target/arm/translate-neon.c.inc | 23 +++++++++++++++--------
 files changed, 27 insertions(+), 8 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/linux-user/elfload.c
-+++ b/target/arm/helper.h
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmax_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
- DEF_HELPER_FLAGS_5(gvec_fmin_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_fmin_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     mmap_lock();
-+DEF_HELPER_FLAGS_5(gvec_fmaxnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-    /* Find the maximum size of the image and allocate an appropriate
-+DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-       amount of memory to handle that.  */
 +    /*
 +     * Find the maximum size of the image and allocate an appropriate
 +     * amount of memory to handle that.  Locate the interpreter, if any.
 +     */
      loaddr = -1, hiaddr = 0;
      info->alignment = 0;
      for (i = 0; i < ehdr->e_phnum; ++i) {
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
              }
              ++info->nsegs;
              info->alignment |= eppnt->p_align;
 +        } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
 +            g_autofree char *interp_name = NULL;
 +
-+DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++            if (*pinterp_name) {
-+DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++                errmsg = "Multiple PT_INTERP entries";
 +                goto exit_errmsg;
 +            }
 +            interp_name = g_malloc(eppnt->p_filesz);
 +            if (!interp_name) {
 +                goto exit_perror;
 +            }
 +
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
++            if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
-                    void, ptr, ptr, ptr, ptr, i32)
++                memcpy(interp_name, bprm_buf + eppnt->p_offset,
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
++                       eppnt->p_filesz);
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++            } else {
-index XXXXXXX..XXXXXXX 100644
++                retval = pread(image_fd, interp_name, eppnt->p_filesz,
---- a/target/arm/vec_helper.c
++                               eppnt->p_offset);
-+++ b/target/arm/vec_helper.c
++                if (retval != eppnt->p_filesz) {
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_fmax_s, float32_max, float32)
++                    goto exit_perror;
- DO_3OP(gvec_fmin_h, float16_min, float16)
++                }
- DO_3OP(gvec_fmin_s, float32_min, float32)
++            }
++            if (interp_name[eppnt->p_filesz - 1] != 0) {
-+DO_3OP(gvec_fmaxnum_h, float16_maxnum, float16)
++                errmsg = "Invalid PT_INTERP entry";
-+DO_3OP(gvec_fmaxnum_s, float32_maxnum, float32)
++                goto exit_errmsg;
-+
++            }
-+DO_3OP(gvec_fminnum_h, float16_minnum, float16)
++            *pinterp_name = g_steal_pointer(&interp_name);
-+DO_3OP(gvec_fminnum_s, float32_minnum, float32)
+         }
 +
  #ifdef TARGET_AARCH64
  DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
  DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
  DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
 +WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
 +WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
 +WRAP_FP_GVEC(gen_VMINNM_fp32_3s, FPST_STD, gen_helper_gvec_fminnum_s)
 +WRAP_FP_GVEC(gen_VMINNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fminnum_h)
 +
  static bool trans_VMAXNM_fp_3s(DisasContext *s, arg_3same *a)
  {
      if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
@@ -XXX,XX +XXX,XX @@ static bool trans_VMAXNM_fp_3s(DisasContext *s, arg_3same *a)
      }
-     if (a->size != 0) {
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
--        /* TODO fp16 support */
+             if (vaddr_em > info->brk) {
--        return false;
+                 info->brk = vaddr_em;
-+        if (!dc_isar_feature(aa32_fp16_arith, s)) {
+             }
-+            return false;
+-        } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
-+        }
+-            g_autofree char *interp_name = NULL;
 +        return do_3same(s, a, gen_VMAXNM_fp16_3s);
      }
 -
--    return do_3same_fp(s, a, gen_helper_vfp_maxnums, false);
+-            if (*pinterp_name) {
-+    return do_3same(s, a, gen_VMAXNM_fp32_3s);
+-                errmsg = "Multiple PT_INTERP entries";
- }
+-                goto exit_errmsg;
+-            }
- static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
+-            interp_name = g_malloc(eppnt->p_filesz);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
+-            if (!interp_name) {
-     }
+-                goto exit_perror;
+-            }
      if (a->size != 0) {
 -        /* TODO fp16 support */
 -        return false;
 +        if (!dc_isar_feature(aa32_fp16_arith, s)) {
 +            return false;
 +        }
 +        return do_3same(s, a, gen_VMINNM_fp16_3s);
      }
 -
--    return do_3same_fp(s, a, gen_helper_vfp_minnums, false);
+-            if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
-+    return do_3same(s, a, gen_VMINNM_fp32_3s);
+-                memcpy(interp_name, bprm_buf + eppnt->p_offset,
- }
+-                       eppnt->p_filesz);
+-            } else {
- WRAP_ENV_FN(gen_VRECPS_tramp, gen_helper_recps_f32)
+-                retval = pread(image_fd, interp_name, eppnt->p_filesz,
 -                               eppnt->p_offset);
 -                if (retval != eppnt->p_filesz) {
 -                    goto exit_perror;
 -                }
 -            }
 -            if (interp_name[eppnt->p_filesz - 1] != 0) {
 -                errmsg = "Invalid PT_INTERP entry";
 -                goto exit_errmsg;
 -            }
 -            *pinterp_name = g_steal_pointer(&interp_name);
  #ifdef TARGET_MIPS
          } else if (eppnt->p_type == PT_MIPS_ABIFLAGS) {
              Mips_elf_abiflags_v0 abiflags;
 --
 .20.1

-[PULL 42/47] target/arm/vec_helper: Add gvec fp indexed multiply-and-add operations
+[PULL 08/48] linux-user/elfload: Use Error for load_elf_image
-Add gvec helpers for doing Neon-style indexed non-fused fp
+From: Richard Henderson <richard.henderson@linaro.org>
 multiply-and-accumulate operations.
+This is a bit clearer than open-coding some of this
+with a bare c string.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-9-richard.henderson@linaro.org
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Message-id: 20200828183354.27913-44-peter.maydell@linaro.org
 ---
- target/arm/helper.h     | 10 ++++++++++
+ linux-user/elfload.c | 37 ++++++++++++++++++++-----------------
- target/arm/vec_helper.c | 27 ++++++++++++++++++++++-----
+file changed, 20 insertions(+), 17 deletions(-)
 files changed, 32 insertions(+), 5 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/linux-user/elfload.c
-+++ b/target/arm/helper.h
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_idx_s, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_5(gvec_fmul_idx_d, TCG_CALL_NO_RWG,
+ #include "qemu/guest-random.h"
-                    void, ptr, ptr, ptr, ptr, i32)
+ #include "qemu/units.h"
+ #include "qemu/selfmap.h"
-+DEF_HELPER_FLAGS_5(gvec_fmla_nf_idx_h, TCG_CALL_NO_RWG,
++#include "qapi/error.h"
-+                   void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(gvec_fmla_nf_idx_s, TCG_CALL_NO_RWG,
+ #ifdef _ARCH_PPC64
-+                   void, ptr, ptr, ptr, ptr, i32)
+ #undef ARCH_DLINFO
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
      struct elf_phdr *phdr;
      abi_ulong load_addr, load_bias, loaddr, hiaddr, error;
      int i, retval;
 -    const char *errmsg;
 +    Error *err = NULL;
      /* First of all, some simple consistency checks */
 -    errmsg = "Invalid ELF image for this architecture";
      if (!elf_check_ident(ehdr)) {
 +        error_setg(&err, "Invalid ELF image for this architecture");
          goto exit_errmsg;
      }
      bswap_ehdr(ehdr);
      if (!elf_check_ehdr(ehdr)) {
 +        error_setg(&err, "Invalid ELF image for this architecture");
          goto exit_errmsg;
      }
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
              g_autofree char *interp_name = NULL;
              if (*pinterp_name) {
 -                errmsg = "Multiple PT_INTERP entries";
 +                error_setg(&err, "Multiple PT_INTERP entries");
                  goto exit_errmsg;
              }
 +
-+DEF_HELPER_FLAGS_5(gvec_fmls_nf_idx_h, TCG_CALL_NO_RWG,
+             interp_name = g_malloc(eppnt->p_filesz);
-+                   void, ptr, ptr, ptr, ptr, i32)
+-            if (!interp_name) {
-+DEF_HELPER_FLAGS_5(gvec_fmls_nf_idx_s, TCG_CALL_NO_RWG,
+-                goto exit_perror;
-+                   void, ptr, ptr, ptr, ptr, i32)
+-            }
-+
- DEF_HELPER_FLAGS_6(gvec_fmla_idx_h, TCG_CALL_NO_RWG,
+             if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
-                    void, ptr, ptr, ptr, ptr, ptr, i32)
+                 memcpy(interp_name, bprm_buf + eppnt->p_offset,
- DEF_HELPER_FLAGS_6(gvec_fmla_idx_s, TCG_CALL_NO_RWG,
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+                 retval = pread(image_fd, interp_name, eppnt->p_filesz,
-index XXXXXXX..XXXXXXX 100644
+                                eppnt->p_offset);
---- a/target/arm/vec_helper.c
+                 if (retval != eppnt->p_filesz) {
-+++ b/target/arm/vec_helper.c
+-                    goto exit_perror;
-@@ -XXX,XX +XXX,XX @@ DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -,   )
++                    goto exit_read;
+                 }
- #undef DO_MLA_IDX
+             }
+             if (interp_name[eppnt->p_filesz - 1] != 0) {
--#define DO_FMUL_IDX(NAME, TYPE, H) \
+-                errmsg = "Invalid PT_INTERP entry";
-+#define DO_FMUL_IDX(NAME, ADD, TYPE, H)                                    \
++                error_setg(&err, "Invalid PT_INTERP entry");
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+                 goto exit_errmsg;
- {                                                                          \
+             }
-     intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+             *pinterp_name = g_steal_pointer(&interp_name);
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
-     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+                             (ehdr->e_type == ET_EXEC ? MAP_FIXED : 0),
-         TYPE mm = m[H(i + idx)];                                           \
+                             -1, 0);
-         for (j = 0; j < segment; j++) {                                    \
+     if (load_addr == -1) {
--            d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
+-        goto exit_perror;
-+            d[i + j] = TYPE##_##ADD(d[i + j],                              \
++        goto exit_mmap;
-+                                    TYPE##_mul(n[i + j], mm, stat), stat); \
+     }
-         }                                                                  \
+     load_bias = load_addr - loaddr;
-     }                                                                      \
-     clear_tail(d, oprsz, simd_maxsz(desc));                                \
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                                      image_fd, eppnt->p_offset - vaddr_po);
                  if (error == -1) {
 -                    goto exit_perror;
 +                    goto exit_mmap;
                  }
              }
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
          } else if (eppnt->p_type == PT_MIPS_ABIFLAGS) {
              Mips_elf_abiflags_v0 abiflags;
              if (eppnt->p_filesz < sizeof(Mips_elf_abiflags_v0)) {
 -                errmsg = "Invalid PT_MIPS_ABIFLAGS entry";
 +                error_setg(&err, "Invalid PT_MIPS_ABIFLAGS entry");
                  goto exit_errmsg;
              }
              if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                  retval = pread(image_fd, &abiflags, sizeof(Mips_elf_abiflags_v0),
                                 eppnt->p_offset);
                  if (retval != sizeof(Mips_elf_abiflags_v0)) {
 -                    goto exit_perror;
 +                    goto exit_read;
                  }
              }
              bswap_mips_abiflags(&abiflags);
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
   exit_read:
      if (retval >= 0) {
 -        errmsg = "Incomplete read of file header";
 -        goto exit_errmsg;
 +        error_setg(&err, "Incomplete read of file header");
 +    } else {
 +        error_setg_errno(&err, errno, "Error reading file header");
      }
 - exit_perror:
 -    errmsg = strerror(errno);
 +    goto exit_errmsg;
 + exit_mmap:
 +    error_setg_errno(&err, errno, "Error mapping file");
 +    goto exit_errmsg;
   exit_errmsg:
 -    fprintf(stderr, "%s: %s\n", image_name, errmsg);
 +    error_reportf_err(err, "%s: ", image_name);
      exit(-1);
  }
--DO_FMUL_IDX(gvec_fmul_idx_h, float16, H2)
--DO_FMUL_IDX(gvec_fmul_idx_s, float32, H4)
--DO_FMUL_IDX(gvec_fmul_idx_d, float64, )
-+#define float16_nop(N, M, S) (M)
-+#define float32_nop(N, M, S) (M)
-+#define float64_nop(N, M, S) (M)
-+DO_FMUL_IDX(gvec_fmul_idx_h, nop, float16, H2)
-+DO_FMUL_IDX(gvec_fmul_idx_s, nop, float32, H4)
-+DO_FMUL_IDX(gvec_fmul_idx_d, nop, float64, )
-+
-+/*
-+ * Non-fused multiply-accumulate operations, for Neon. NB that unlike
-+ * the fused ops below they assume accumulate both from and into Vd.
-+ */
-+DO_FMUL_IDX(gvec_fmla_nf_idx_h, add, float16, H2)
-+DO_FMUL_IDX(gvec_fmla_nf_idx_s, add, float32, H4)
-+DO_FMUL_IDX(gvec_fmls_nf_idx_h, sub, float16, H2)
-+DO_FMUL_IDX(gvec_fmls_nf_idx_s, sub, float32, H4)
-+
-+#undef float16_nop
-+#undef float32_nop
-+#undef float64_nop
- #undef DO_FMUL_IDX
- #define DO_FMLA_IDX(NAME, TYPE, H)                                         \
 --
 .20.1

-[PULL 17/47] target/arm: Implement VFP fp16 VSEL
+[PULL 09/48] linux-user/elfload: Use Error for load_elf_interp
-Implement the fp16 versions of the VFP VSEL instruction.
+From: Richard Henderson <richard.henderson@linaro.org>
+This is slightly clearer than just using strerror, though
+the different forms produced by error_setg_file_open and
+error_setg_errno isn't entirely convenient.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-10-richard.henderson@linaro.org
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-18-peter.maydell@linaro.org
 ---
- target/arm/vfp-uncond.decode   |  6 ++++--
+ linux-user/elfload.c | 15 ++++++++-------
- target/arm/translate-vfp.c.inc | 16 ++++++++++++----
+file changed, 8 insertions(+), 7 deletions(-)
 files changed, 16 insertions(+), 6 deletions(-)
-diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp-uncond.decode
+--- a/linux-user/elfload.c
-+++ b/target/arm/vfp-uncond.decode
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void load_elf_interp(const char *filename, struct image_info *info,
- @vfp_dnm_s   ................................ vm=%vm_sp vn=%vn_sp vd=%vd_sp
+                             char bprm_buf[BPRM_BUF_SIZE])
  @vfp_dnm_d   ................................ vm=%vm_dp vn=%vn_dp vd=%vd_dp
 +VSEL        1111 1110 0. cc:2 .... .... 1001 .0.0 .... \
 +            vm=%vm_sp vn=%vn_sp vd=%vd_sp sz=1
  VSEL        1111 1110 0. cc:2 .... .... 1010 .0.0 .... \
 -            vm=%vm_sp vn=%vn_sp vd=%vd_sp dp=0
 +            vm=%vm_sp vn=%vn_sp vd=%vd_sp sz=2
  VSEL        1111 1110 0. cc:2 .... .... 1011 .0.0 .... \
 -            vm=%vm_dp vn=%vn_dp vd=%vd_dp dp=1
 +            vm=%vm_dp vn=%vn_dp vd=%vd_dp sz=3
  VMAXNM_hp   1111 1110 1.00 .... .... 1001 .0.0 ....         @vfp_dnm_s
  VMINNM_hp   1111 1110 1.00 .... .... 1001 .1.0 ....         @vfp_dnm_s
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vfp_access_check(DisasContext *s)
  static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
  {
-     uint32_t rd, rn, rm;
+     int fd, retval;
--    bool dp = a->dp;
++    Error *err = NULL;
-+    int sz = a->sz;
+     fd = open(path(filename), O_RDONLY);
-     if (!dc_isar_feature(aa32_vsel, s)) {
+     if (fd < 0) {
-         return false;
+-        goto exit_perror;
 +        error_setg_file_open(&err, errno, filename);
 +        error_report_err(err);
 +        exit(-1);
      }
--    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+     retval = read(fd, bprm_buf, BPRM_BUF_SIZE);
-+    if (sz == 3 && !dc_isar_feature(aa32_fpdp_v2, s)) {
+     if (retval < 0) {
-+        return false;
+-        goto exit_perror;
-+    }
++        error_setg_errno(&err, errno, "Error reading file header");
 +        error_reportf_err(err, "%s: ", filename);
 +        exit(-1);
      }
 +
-+    if (sz == 1 && !dc_isar_feature(aa32_fp16_arith, s)) {
+     if (retval < BPRM_BUF_SIZE) {
-         return false;
+         memset(bprm_buf + retval, 0, BPRM_BUF_SIZE - retval);
      }
-     /* UNDEF accesses to D16-D31 if they don't exist */
+     load_elf_image(filename, fd, info, NULL, bprm_buf);
--    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+-    return;
-+    if (sz == 3 && !dc_isar_feature(aa32_simd_r32, s) &&
+-
-         ((a->vm | a->vn | a->vd) & 0x10)) {
+- exit_perror:
-         return false;
+-    fprintf(stderr, "%s: %s\n", filename, strerror(errno));
-     }
+-    exit(-1);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
+ }
-         return true;
-     }
+ static int symfind(const void *s0, const void *s1)
 -    if (dp) {
 +    if (sz == 3) {
          TCGv_i64 frn, frm, dest;
          TCGv_i64 tmp, zero, zf, nf, vf;
@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
              tcg_temp_free_i32(tmp);
              break;
          }
 +        /* For fp16 the top half is always zeroes */
 +        if (sz == 1) {
 +            tcg_gen_andi_i32(dest, dest, 0xffff);
 +        }
          neon_store_reg32(dest, rd);
          tcg_temp_free_i32(frn);
          tcg_temp_free_i32(frm);
 --
 .20.1

-[PULL 06/47] target/arm: Implement VFP fp16 for fused-multiply-add
+[PULL 10/48] linux-user/elfload: Parse NT_GNU_PROPERTY_TYPE_0 notes
-Implement VFP fp16 support for fused multiply-add insns
+From: Richard Henderson <richard.henderson@linaro.org>
-VFNMA, VFNMS, VFMA, VFMS.
+This is generic support, with the code disabled for all targets.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20201021173749.111103-11-richard.henderson@linaro.org
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-7-peter.maydell@linaro.org
 ---
- target/arm/helper.h            |  1 +
+ linux-user/qemu.h    |   4 ++
- target/arm/vfp.decode          |  5 +++
+ linux-user/elfload.c | 157 +++++++++++++++++++++++++++++++++++++++++++
- target/arm/vfp_helper.c        |  7 ++++
+files changed, 161 insertions(+)
- target/arm/translate-vfp.c.inc | 64 ++++++++++++++++++++++++++++++++++
-files changed, 77 insertions(+)
+diff --git a/linux-user/qemu.h b/linux-user/qemu.h
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/linux-user/qemu.h
-+++ b/target/arm/helper.h
++++ b/linux-user/qemu.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ struct image_info {
+         abi_ulong       interpreter_loadmap_addr;
- DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
+         abi_ulong       interpreter_pt_dynamic_addr;
- DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+         struct image_info *other_info;
-+DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
++
++        /* For target-specific processing of NT_GNU_PROPERTY_TYPE_0. */
- DEF_HELPER_3(recps_f32, f32, env, f32, f32)
++        uint32_t        note_flags;
- DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
++
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
+ #ifdef TARGET_MIPS
          int             fp_abi;
          int             interp_fp_abi;
 diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/linux-user/elfload.c
-+++ b/target/arm/vfp.decode
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ VDIV_hp      ---- 1110 1.00 .... .... 1001 .0.0 ....        @vfp_dnm_s
+@@ -XXX,XX +XXX,XX @@ static void elf_core_copy_regs(target_elf_gregset_t *regs,
- VDIV_sp      ---- 1110 1.00 .... .... 1010 .0.0 ....        @vfp_dnm_s
- VDIV_dp      ---- 1110 1.00 .... .... 1011 .0.0 ....        @vfp_dnm_d
+ #include "elf.h"
-+VFMA_hp      ---- 1110 1.10 .... .... 1001 .0. 0 ....       @vfp_dnm_s
++static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
-+VFMS_hp      ---- 1110 1.10 .... .... 1001 .1. 0 ....       @vfp_dnm_s
++                                    const uint32_t *data,
-+VFNMA_hp     ---- 1110 1.01 .... .... 1001 .0. 0 ....       @vfp_dnm_s
++                                    struct image_info *info,
-+VFNMS_hp     ---- 1110 1.01 .... .... 1001 .1. 0 ....       @vfp_dnm_s
++                                    Error **errp)
-+
++{
- VFMA_sp      ---- 1110 1.10 .... .... 1010 .0. 0 ....       @vfp_dnm_s
++    g_assert_not_reached();
- VFMS_sp      ---- 1110 1.10 .... .... 1010 .1. 0 ....       @vfp_dnm_s
++}
- VFNMA_sp     ---- 1110 1.01 .... .... 1010 .0. 0 ....       @vfp_dnm_s
++#define ARCH_USE_GNU_PROPERTY 0
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
++
-index XXXXXXX..XXXXXXX 100644
+ struct exec
---- a/target/arm/vfp_helper.c
+ {
-+++ b/target/arm/vfp_helper.c
+     unsigned int a_info;   /* Use macros N_MAGIC, etc for access */
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(rsqrte_u32)(uint32_t a)
+@@ -XXX,XX +XXX,XX @@ void probe_guest_base(const char *image_name, abi_ulong guest_loaddr,
                    "@ 0x%" PRIx64 "\n", (uint64_t)guest_base);
  }
- /* VFPv4 fused multiply-accumulate */
++enum {
-+dh_ctype_f16 VFP_HELPER(muladd, h)(dh_ctype_f16 a, dh_ctype_f16 b,
++    /* The string "GNU\0" as a magic number. */
-+                                   dh_ctype_f16 c, void *fpstp)
++    GNU0_MAGIC = const_le32('G' | 'N' << 8 | 'U' << 16),
 +    NOTE_DATA_SZ = 1 * KiB,
 +    NOTE_NAME_SZ = 4,
 +    ELF_GNU_PROPERTY_ALIGN = ELF_CLASS == ELFCLASS32 ? 4 : 8,
 +};
 +
 +/*
 + * Process a single gnu_property entry.
 + * Return false for error.
 + */
 +static bool parse_elf_property(const uint32_t *data, int *off, int datasz,
 +                               struct image_info *info, bool have_prev_type,
 +                               uint32_t *prev_type, Error **errp)
 +{
-+    float_status *fpst = fpstp;
++    uint32_t pr_type, pr_datasz, step;
-+    return float16_muladd(a, b, c, 0, fpst);
++
 +    if (*off > datasz || !QEMU_IS_ALIGNED(*off, ELF_GNU_PROPERTY_ALIGN)) {
 +        goto error_data;
 +    }
 +    datasz -= *off;
 +    data += *off / sizeof(uint32_t);
 +
 +    if (datasz < 2 * sizeof(uint32_t)) {
 +        goto error_data;
 +    }
 +    pr_type = data[0];
 +    pr_datasz = data[1];
 +    data += 2;
 +    datasz -= 2 * sizeof(uint32_t);
 +    step = ROUND_UP(pr_datasz, ELF_GNU_PROPERTY_ALIGN);
 +    if (step > datasz) {
 +        goto error_data;
 +    }
 +
 +    /* Properties are supposed to be unique and sorted on pr_type. */
 +    if (have_prev_type && pr_type <= *prev_type) {
 +        if (pr_type == *prev_type) {
 +            error_setg(errp, "Duplicate property in PT_GNU_PROPERTY");
 +        } else {
 +            error_setg(errp, "Unsorted property in PT_GNU_PROPERTY");
 +        }
 +        return false;
 +    }
 +    *prev_type = pr_type;
 +
 +    if (!arch_parse_elf_property(pr_type, pr_datasz, data, info, errp)) {
 +        return false;
 +    }
 +
 +    *off += 2 * sizeof(uint32_t) + step;
 +    return true;
 +
 + error_data:
 +    error_setg(errp, "Ill-formed property in PT_GNU_PROPERTY");
 +    return false;
 +}
 +
- float32 VFP_HELPER(muladd, s)(float32 a, float32 b, float32 c, void *fpstp)
++/* Process NT_GNU_PROPERTY_TYPE_0. */
- {
++static bool parse_elf_properties(int image_fd,
-     float_status *fpst = fpstp;
++                                 struct image_info *info,
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
++                                 const struct elf_phdr *phdr,
-index XXXXXXX..XXXXXXX 100644
++                                 char bprm_buf[BPRM_BUF_SIZE],
---- a/target/arm/translate-vfp.c.inc
++                                 Error **errp)
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMAXNM_dp(DisasContext *s, arg_VMAXNM_dp *a)
                           a->vd, a->vn, a->vm, false);
  }
 +static bool do_vfm_hp(DisasContext *s, arg_VFMA_sp *a, bool neg_n, bool neg_d)
 +{
++    union {
++        struct elf_note nhdr;
++        uint32_t data[NOTE_DATA_SZ / sizeof(uint32_t)];
++    } note;
++
++    int n, off, datasz;
++    bool have_prev_type;
++    uint32_t prev_type;
++
++    /* Unless the arch requires properties, ignore them. */
++    if (!ARCH_USE_GNU_PROPERTY) {
++        return true;
++    }
++
++    /* If the properties are crazy large, that's too bad. */
++    n = phdr->p_filesz;
++    if (n > sizeof(note)) {
++        error_setg(errp, "PT_GNU_PROPERTY too large");
++        return false;
++    }
++    if (n < sizeof(note.nhdr)) {
++        error_setg(errp, "PT_GNU_PROPERTY too small");
++        return false;
++    }
++
++    if (phdr->p_offset + n <= BPRM_BUF_SIZE) {
++        memcpy(&note, bprm_buf + phdr->p_offset, n);
++    } else {
++        ssize_t len = pread(image_fd, &note, n, phdr->p_offset);
++        if (len != n) {
++            error_setg_errno(errp, errno, "Error reading file header");
++            return false;
++        }
++    }
++
 +    /*
-+     * VFNMA : fd = muladd(-fd,  fn, fm)
++     * The contents of a valid PT_GNU_PROPERTY is a sequence
-+     * VFNMS : fd = muladd(-fd, -fn, fm)
++     * of uint32_t -- swap them all now.
 +     * VFMA  : fd = muladd( fd,  fn, fm)
 +     * VFMS  : fd = muladd( fd, -fn, fm)
 +     *
 +     * These are fused multiply-add, and must be done as one floating
 +     * point operation with no rounding between the multiplication and
 +     * addition steps.  NB that doing the negations here as separate
 +     * steps is correct : an input NaN should come out with its sign
 +     * bit flipped if it is a negated-input.
 +     */
-+    TCGv_ptr fpst;
++#ifdef BSWAP_NEEDED
-+    TCGv_i32 vn, vm, vd;
++    for (int i = 0; i < n / 4; i++) {
 +        bswap32s(note.data + i);
 +    }
 +#endif
 +
 +    /*
-+     * Present in VFPv4 only, and only with the FP16 extension.
++     * Note that nhdr is 3 words, and that the "name" described by namesz
-+     * Note that we can't rely on the SIMDFMAC check alone, because
++     * immediately follows nhdr and is thus at the 4th word.  Further, all
-+     * in a Neon-no-VFP core that ID register field will be non-zero.
++     * of the inputs to the kernel's round_up are multiples of 4.
 +     */
-+    if (!dc_isar_feature(aa32_fp16_arith, s) ||
++    if (note.nhdr.n_type != NT_GNU_PROPERTY_TYPE_0 ||
-+        !dc_isar_feature(aa32_simdfmac, s) ||
++        note.nhdr.n_namesz != NOTE_NAME_SZ ||
-+        !dc_isar_feature(aa32_fpsp_v2, s)) {
++        note.data[3] != GNU0_MAGIC) {
-+        return false;
++        error_setg(errp, "Invalid note in PT_GNU_PROPERTY");
-+    }
++        return false;
-+
++    }
-+    if (s->vec_len != 0 || s->vec_stride != 0) {
++    off = sizeof(note.nhdr) + NOTE_NAME_SZ;
-+        return false;
++
-+    }
++    datasz = note.nhdr.n_descsz + off;
-+
++    if (datasz > n) {
-+    if (!vfp_access_check(s)) {
++        error_setg(errp, "Invalid note size in PT_GNU_PROPERTY");
-+        return true;
++        return false;
 +    }
 +
-+    vn = tcg_temp_new_i32();
++    have_prev_type = false;
-+    vm = tcg_temp_new_i32();
++    prev_type = 0;
-+    vd = tcg_temp_new_i32();
++    while (1) {
-+
++        if (off == datasz) {
-+    neon_load_reg32(vn, a->vn);
++            return true;  /* end, exit ok */
-+    neon_load_reg32(vm, a->vm);
++        }
-+    if (neg_n) {
++        if (!parse_elf_property(note.data, &off, datasz, info,
-+        /* VFNMS, VFMS */
++                                have_prev_type, &prev_type, errp)) {
-+        gen_helper_vfp_negh(vn, vn);
++            return false;
-+    }
++        }
-+    neon_load_reg32(vd, a->vd);
++        have_prev_type = true;
-+    if (neg_d) {
++    }
 +        /* VFNMA, VFNMS */
 +        gen_helper_vfp_negh(vd, vd);
 +    }
 +    fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    gen_helper_vfp_muladdh(vd, vn, vm, vd, fpst);
 +    neon_store_reg32(vd, a->vd);
 +
 +    tcg_temp_free_ptr(fpst);
 +    tcg_temp_free_i32(vn);
 +    tcg_temp_free_i32(vm);
 +    tcg_temp_free_i32(vd);
 +
 +    return true;
 +}
 +
- static bool do_vfm_sp(DisasContext *s, arg_VFMA_sp *a, bool neg_n, bool neg_d)
+ /* Load an ELF image into the address space.
- {
-     /*
+    IMAGE_NAME is the filename of the image, to use in error messages.
-@@ -XXX,XX +XXX,XX @@ static bool do_vfm_dp(DisasContext *s, arg_VFMA_dp *a, bool neg_n, bool neg_d)
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
-     MAKE_ONE_VFM_TRANS_FN(VFNMA, PREC, false, true) \
+                 goto exit_errmsg;
-     MAKE_ONE_VFM_TRANS_FN(VFNMS, PREC, true, true)
+             }
+             *pinterp_name = g_steal_pointer(&interp_name);
-+MAKE_VFM_TRANS_FNS(hp)
++        } else if (eppnt->p_type == PT_GNU_PROPERTY) {
- MAKE_VFM_TRANS_FNS(sp)
++            if (!parse_elf_properties(image_fd, info, eppnt, bprm_buf, &err)) {
- MAKE_VFM_TRANS_FNS(dp)
++                goto exit_errmsg;
 +            }
          }
      }
 --
 .20.1

-[PULL 20/47] target/arm: Implement new VFP fp16 insn VMOVX
+[PULL 11/48] linux-user/elfload: Parse GNU_PROPERTY_AARCH64_FEATURE_1_AND
-The fp16 extension includes a new instruction VMOVX, which copies the
+From: Richard Henderson <richard.henderson@linaro.org>
 upper 16 bits of a 32-bit source VFP register into the lower 16
 bits of the destination and zeroes the high half of the destination.
 Implement it.
+Use the new generic support for NT_GNU_PROPERTY_TYPE_0.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-id: 20201021173749.111103-12-richard.henderson@linaro.org
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-21-peter.maydell@linaro.org
 ---
- target/arm/vfp-uncond.decode   |  3 +++
+ linux-user/elfload.c | 48 ++++++++++++++++++++++++++++++++++++++++++--
- target/arm/translate-vfp.c.inc | 25 +++++++++++++++++++++++++
+file changed, 46 insertions(+), 2 deletions(-)
 files changed, 28 insertions(+)
-diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
+diff --git a/linux-user/elfload.c b/linux-user/elfload.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp-uncond.decode
+--- a/linux-user/elfload.c
-+++ b/target/arm/vfp-uncond.decode
++++ b/linux-user/elfload.c
-@@ -XXX,XX +XXX,XX @@ VCVT        1111 1110 1.11 11 rm:2 .... 1010 op:1 1.0 .... \
+@@ -XXX,XX +XXX,XX @@ static void elf_core_copy_regs(target_elf_gregset_t *regs,
- VCVT        1111 1110 1.11 11 rm:2 .... 1011 op:1 1.0 .... \
-             vm=%vm_dp vd=%vd_sp sz=3
+ #include "elf.h"
-+VMOVX       1111 1110 1.11 0000 .... 1010 01 . 0 .... \
++/* We must delay the following stanzas until after "elf.h". */
-+            vd=%vd_sp vm=%vm_sp
++#if defined(TARGET_AARCH64)
 +
- VINS        1111 1110 1.11 0000 .... 1010 11 . 0 .... \
++static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
-             vd=%vd_sp vm=%vm_sp
++                                    const uint32_t *data,
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
++                                    struct image_info *info,
-index XXXXXXX..XXXXXXX 100644
++                                    Error **errp)
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VINS(DisasContext *s, arg_VINS *a)
      tcg_temp_free_i32(rd);
      return true;
  }
 +
 +static bool trans_VMOVX(DisasContext *s, arg_VINS *a)
 +{
-+    TCGv_i32 rm;
++    if (pr_type == GNU_PROPERTY_AARCH64_FEATURE_1_AND) {
-+
++        if (pr_datasz != sizeof(uint32_t)) {
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++            error_setg(errp, "Ill-formed GNU_PROPERTY_AARCH64_FEATURE_1_AND");
-+        return false;
++            return false;
 +        }
 +        /* We will extract GNU_PROPERTY_AARCH64_FEATURE_1_BTI later. */
 +        info->note_flags = *data;
 +    }
-+
-+    if (s->vec_len != 0 || s->vec_stride != 0) {
-+        return false;
-+    }
-+
-+    if (!vfp_access_check(s)) {
-+        return true;
-+    }
-+
-+    /* Set Vd to high half of Vm */
-+    rm = tcg_temp_new_i32();
-+    neon_load_reg32(rm, a->vm);
-+    tcg_gen_shri_i32(rm, rm, 16);
-+    neon_store_reg32(rm, a->vd);
-+    tcg_temp_free_i32(rm);
 +    return true;
 +}
++#define ARCH_USE_GNU_PROPERTY 1
++
++#else
++
+ static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
+                                     const uint32_t *data,
+                                     struct image_info *info,
+@@ -XXX,XX +XXX,XX @@ static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
+ }
+ #define ARCH_USE_GNU_PROPERTY 0
++#endif
++
+ struct exec
+ {
+     unsigned int a_info;   /* Use macros N_MAGIC, etc for access */
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
+     struct elfhdr *ehdr = (struct elfhdr *)bprm_buf;
+     struct elf_phdr *phdr;
+     abi_ulong load_addr, load_bias, loaddr, hiaddr, error;
+-    int i, retval;
++    int i, retval, prot_exec;
+     Error *err = NULL;
+     /* First of all, some simple consistency checks */
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
+     info->brk = 0;
+     info->elf_flags = ehdr->e_flags;
++    prot_exec = PROT_EXEC;
++#ifdef TARGET_AARCH64
++    /*
++     * If the BTI feature is present, this indicates that the executable
++     * pages of the startup binary should be mapped with PROT_BTI, so that
++     * branch targets are enforced.
++     *
++     * The startup binary is either the interpreter or the static executable.
++     * The interpreter is responsible for all pages of a dynamic executable.
++     *
++     * Elf notes are backward compatible to older cpus.
++     * Do not enable BTI unless it is supported.
++     */
++    if ((info->note_flags & GNU_PROPERTY_AARCH64_FEATURE_1_BTI)
++        && (pinterp_name == NULL || *pinterp_name == 0)
++        && cpu_isar_feature(aa64_bti, ARM_CPU(thread_cpu))) {
++        prot_exec |= TARGET_PROT_BTI;
++    }
++#endif
++
+     for (i = 0; i < ehdr->e_phnum; i++) {
+         struct elf_phdr *eppnt = phdr + i;
+         if (eppnt->p_type == PT_LOAD) {
+@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
+                 elf_prot |= PROT_WRITE;
+             }
+             if (eppnt->p_flags & PF_X) {
+-                elf_prot |= PROT_EXEC;
++                elf_prot |= prot_exec;
+             }
+             vaddr = load_bias + eppnt->p_vaddr;
 --
 .20.1

-[PULL 41/47] target/arm/vec_helper: Handle oprsz less than 16 bytes in indexed operations
+[PULL 12/48] tests/tcg/aarch64: Add bti smoke tests
-In the gvec helper functions for indexed operations, for AArch32
+From: Richard Henderson <richard.henderson@linaro.org>
-Neon the oprsz (total size of the vector) can be less than 16 bytes
-if the operation is on a D reg. Since the inner loop in these
+The note test requires gcc 10 for -mbranch-protection=standard.
-helpers always goes from 0 to segment, we must clamp it based
+The mmap test uses PROT_BTI and does not require special compiler support.
-on oprsz to avoid processing a full 16 byte segment when asked to
-handle an 8 byte wide vector.
+Acked-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20201021173749.111103-13-richard.henderson@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-43-peter.maydell@linaro.org
 ---
- target/arm/vec_helper.c | 12 ++++++++----
+ tests/tcg/aarch64/bti-1.c         |  62 ++++++++++++++++
-file changed, 8 insertions(+), 4 deletions(-)
+ tests/tcg/aarch64/bti-2.c         | 116 ++++++++++++++++++++++++++++++
+ tests/tcg/aarch64/bti-crt.inc.c   |  51 +++++++++++++
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+ tests/tcg/aarch64/Makefile.target |  10 +++
  tests/tcg/configure.sh            |   4 ++
 files changed, 243 insertions(+)
  create mode 100644 tests/tcg/aarch64/bti-1.c
  create mode 100644 tests/tcg/aarch64/bti-2.c
  create mode 100644 tests/tcg/aarch64/bti-crt.inc.c
 diff --git a/tests/tcg/aarch64/bti-1.c b/tests/tcg/aarch64/bti-1.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/tcg/aarch64/bti-1.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Branch target identification, basic notskip cases.
 + */
 +
 +#include "bti-crt.inc.c"
 +
 +static void skip2_sigill(int sig, siginfo_t *info, ucontext_t *uc)
 +{
 +    uc->uc_mcontext.pc += 8;
 +    uc->uc_mcontext.pstate = 1;
 +}
 +
 +#define NOP       "nop"
 +#define BTI_N     "hint #32"
 +#define BTI_C     "hint #34"
 +#define BTI_J     "hint #36"
 +#define BTI_JC    "hint #38"
 +
 +#define BTYPE_1(DEST) \
 +    asm("mov %0,#1; adr x16, 1f; br x16; 1: " DEST "; mov %0,#0" \
 +        : "=r"(skipped) : : "x16")
 +
 +#define BTYPE_2(DEST) \
 +    asm("mov %0,#1; adr x16, 1f; blr x16; 1: " DEST "; mov %0,#0" \
 +        : "=r"(skipped) : : "x16", "x30")
 +
 +#define BTYPE_3(DEST) \
 +    asm("mov %0,#1; adr x15, 1f; br x15; 1: " DEST "; mov %0,#0" \
 +        : "=r"(skipped) : : "x15")
 +
 +#define TEST(WHICH, DEST, EXPECT) \
 +    do { WHICH(DEST); fail += skipped ^ EXPECT; } while (0)
 +
 +
 +int main()
 +{
 +    int fail = 0;
 +    int skipped;
 +
 +    /* Signal-like with SA_SIGINFO.  */
 +    signal_info(SIGILL, skip2_sigill);
 +
 +    TEST(BTYPE_1, NOP, 1);
 +    TEST(BTYPE_1, BTI_N, 1);
 +    TEST(BTYPE_1, BTI_C, 0);
 +    TEST(BTYPE_1, BTI_J, 0);
 +    TEST(BTYPE_1, BTI_JC, 0);
 +
 +    TEST(BTYPE_2, NOP, 1);
 +    TEST(BTYPE_2, BTI_N, 1);
 +    TEST(BTYPE_2, BTI_C, 0);
 +    TEST(BTYPE_2, BTI_J, 1);
 +    TEST(BTYPE_2, BTI_JC, 0);
 +
 +    TEST(BTYPE_3, NOP, 1);
 +    TEST(BTYPE_3, BTI_N, 1);
 +    TEST(BTYPE_3, BTI_C, 1);
 +    TEST(BTYPE_3, BTI_J, 0);
 +    TEST(BTYPE_3, BTI_JC, 0);
 +
 +    return fail;
 +}
 diff --git a/tests/tcg/aarch64/bti-2.c b/tests/tcg/aarch64/bti-2.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/tcg/aarch64/bti-2.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Branch target identification, basic notskip cases.
 + */
 +
 +#include <stdio.h>
 +#include <signal.h>
 +#include <string.h>
 +#include <unistd.h>
 +#include <sys/mman.h>
 +
 +#ifndef PROT_BTI
 +#define PROT_BTI  0x10
 +#endif
 +
 +static void skip2_sigill(int sig, siginfo_t *info, void *vuc)
 +{
 +    ucontext_t *uc = vuc;
 +    uc->uc_mcontext.pc += 8;
 +    uc->uc_mcontext.pstate = 1;
 +}
 +
 +#define NOP       "nop"
 +#define BTI_N     "hint #32"
 +#define BTI_C     "hint #34"
 +#define BTI_J     "hint #36"
 +#define BTI_JC    "hint #38"
 +
 +#define BTYPE_1(DEST)    \
 +    "mov x1, #1\n\t"     \
 +    "adr x16, 1f\n\t"    \
 +    "br x16\n"           \
 +"1: " DEST "\n\t"        \
 +    "mov x1, #0"
 +
 +#define BTYPE_2(DEST)    \
 +    "mov x1, #1\n\t"     \
 +    "adr x16, 1f\n\t"    \
 +    "blr x16\n"          \
 +"1: " DEST "\n\t"        \
 +    "mov x1, #0"
 +
 +#define BTYPE_3(DEST)    \
 +    "mov x1, #1\n\t"     \
 +    "adr x15, 1f\n\t"    \
 +    "br x15\n"           \
 +"1: " DEST "\n\t"        \
 +    "mov x1, #0"
 +
 +#define TEST(WHICH, DEST, EXPECT) \
 +    WHICH(DEST) "\n"              \
 +    ".if " #EXPECT "\n\t"         \
 +    "eor x1, x1," #EXPECT "\n"    \
 +    ".endif\n\t"                  \
 +    "add x0, x0, x1\n\t"
 +
 +asm("\n"
 +"test_begin:\n\t"
 +    BTI_C "\n\t"
 +    "mov x2, x30\n\t"
 +    "mov x0, #0\n\t"
 +
 +    TEST(BTYPE_1, NOP, 1)
 +    TEST(BTYPE_1, BTI_N, 1)
 +    TEST(BTYPE_1, BTI_C, 0)
 +    TEST(BTYPE_1, BTI_J, 0)
 +    TEST(BTYPE_1, BTI_JC, 0)
 +
 +    TEST(BTYPE_2, NOP, 1)
 +    TEST(BTYPE_2, BTI_N, 1)
 +    TEST(BTYPE_2, BTI_C, 0)
 +    TEST(BTYPE_2, BTI_J, 1)
 +    TEST(BTYPE_2, BTI_JC, 0)
 +
 +    TEST(BTYPE_3, NOP, 1)
 +    TEST(BTYPE_3, BTI_N, 1)
 +    TEST(BTYPE_3, BTI_C, 1)
 +    TEST(BTYPE_3, BTI_J, 0)
 +    TEST(BTYPE_3, BTI_JC, 0)
 +
 +    "ret x2\n"
 +"test_end:"
 +);
 +
 +int main()
 +{
 +    struct sigaction sa;
 +    void *tb, *te;
 +
 +    void *p = mmap(0, getpagesize(),
 +                   PROT_EXEC | PROT_READ | PROT_WRITE | PROT_BTI,
 +                   MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);
 +    if (p == MAP_FAILED) {
 +        perror("mmap");
 +        return 1;
 +    }
 +
 +    memset(&sa, 0, sizeof(sa));
 +    sa.sa_sigaction = skip2_sigill;
 +    sa.sa_flags = SA_SIGINFO;
 +    if (sigaction(SIGILL, &sa, NULL) < 0) {
 +        perror("sigaction");
 +        return 1;
 +    }
 +
 +    /*
 +     * ??? With "extern char test_begin[]", some compiler versions
 +     * will use :got references, and some linker versions will
 +     * resolve this reference to a static symbol incorrectly.
 +     * Bypass this error by using a pc-relative reference directly.
 +     */
 +    asm("adr %0, test_begin; adr %1, test_end" : "=r"(tb), "=r"(te));
 +
 +    memcpy(p, tb, te - tb);
 +
 +    return ((int (*)(void))p)();
 +}
 diff --git a/tests/tcg/aarch64/bti-crt.inc.c b/tests/tcg/aarch64/bti-crt.inc.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/tcg/aarch64/bti-crt.inc.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Minimal user-environment for testing BTI.
 + *
 + * Normal libc is not (yet) built with BTI support enabled,
 + * and so could generate a BTI TRAP before ever reaching main.
 + */
 +
 +#include <stdlib.h>
 +#include <signal.h>
 +#include <ucontext.h>
 +#include <asm/unistd.h>
 +
 +int main(void);
 +
 +void _start(void)
 +{
 +    exit(main());
 +}
 +
 +void exit(int ret)
 +{
 +    register int x0 __asm__("x0") = ret;
 +    register int x8 __asm__("x8") = __NR_exit;
 +
 +    asm volatile("svc #0" : : "r"(x0), "r"(x8));
 +    __builtin_unreachable();
 +}
 +
 +/*
 + * Irritatingly, the user API struct sigaction does not match the
 + * kernel API struct sigaction.  So for simplicity, isolate the
 + * kernel ABI here, and make this act like signal.
 + */
 +void signal_info(int sig, void (*fn)(int, siginfo_t *, ucontext_t *))
 +{
 +    struct kernel_sigaction {
 +        void (*handler)(int, siginfo_t *, ucontext_t *);
 +        unsigned long flags;
 +        unsigned long restorer;
 +        unsigned long mask;
 +    } sa = { fn, SA_SIGINFO, 0, 0 };
 +
 +    register int x0 __asm__("x0") = sig;
 +    register void *x1 __asm__("x1") = &sa;
 +    register void *x2 __asm__("x2") = 0;
 +    register int x3 __asm__("x3") = sizeof(unsigned long);
 +    register int x8 __asm__("x8") = __NR_rt_sigaction;
 +
 +    asm volatile("svc #0"
 +                 : : "r"(x0), "r"(x1), "r"(x2), "r"(x3), "r"(x8) : "memory");
 +}
 diff --git a/tests/tcg/aarch64/Makefile.target b/tests/tcg/aarch64/Makefile.target
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/tests/tcg/aarch64/Makefile.target
-+++ b/target/arm/vec_helper.c
++++ b/tests/tcg/aarch64/Makefile.target
-@@ -XXX,XX +XXX,XX @@ DO_MULADD(gvec_vfms_s, float32_mulsub_f, float32)
+@@ -XXX,XX +XXX,XX @@ run-pauth-%: QEMU_OPTS += -cpu max
- #define DO_MUL_IDX(NAME, TYPE, H) \
+ run-plugin-pauth-%: QEMU_OPTS += -cpu max
- void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc) \
+ endif
- {                                                                          \
--    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
++# BTI Tests
-+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
++# bti-1 tests the elf notes, so we require special compiler support.
-+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
++ifneq ($(DOCKER_IMAGE)$(CROSS_CC_HAS_ARMV8_BTI),)
-     intptr_t idx = simd_data(desc);                                        \
++AARCH64_TESTS += bti-1
-     TYPE *d = vd, *n = vn, *m = vm;                                        \
++bti-1: CFLAGS += -mbranch-protection=standard
-     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
++bti-1: LDFLAGS += -nostdlib
-@@ -XXX,XX +XXX,XX @@ DO_MUL_IDX(gvec_mul_idx_d, uint64_t, )
++endif
- #define DO_MLA_IDX(NAME, TYPE, OP, H) \
++# bti-2 tests PROT_BTI, so no special compiler support required.
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *va, uint32_t desc)   \
++AARCH64_TESTS += bti-2
- {                                                                          \
++
--    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+ # Semihosting smoke test for linux-user
-+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+ AARCH64_TESTS += semihosting
-+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
+ run-semihosting: semihosting
-     intptr_t idx = simd_data(desc);                                        \
+diff --git a/tests/tcg/configure.sh b/tests/tcg/configure.sh
-     TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
+index XXXXXXX..XXXXXXX 100755
-     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+--- a/tests/tcg/configure.sh
-@@ -XXX,XX +XXX,XX @@ DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -,   )
++++ b/tests/tcg/configure.sh
- #define DO_FMUL_IDX(NAME, TYPE, H) \
+@@ -XXX,XX +XXX,XX @@ for target in $target_list; do
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+                -march=armv8.3-a -o $TMPE $TMPC; then
- {                                                                          \
+                 echo "CROSS_CC_HAS_ARMV8_3=y" >> $config_target_mak
--    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+             fi
-+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
++            if do_compiler "$target_compiler" $target_compiler_cflags \
-+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
++               -mbranch-protection=standard -o $TMPE $TMPC; then
-     intptr_t idx = simd_data(desc);                                        \
++                echo "CROSS_CC_HAS_ARMV8_BTI=y" >> $config_target_mak
-     TYPE *d = vd, *n = vn, *m = vm;                                        \
++            fi
-     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
+         ;;
-@@ -XXX,XX +XXX,XX @@ DO_FMUL_IDX(gvec_fmul_idx_d, float64, )
+     esac
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
                    void *stat, uint32_t desc)                               \
  {                                                                          \
 -    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
 +    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
 +    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
      TYPE op1_neg = extract32(desc, SIMD_DATA_SHIFT, 1);                    \
      intptr_t idx = desc >> (SIMD_DATA_SHIFT + 1);                          \
      TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
 --
 .20.1

-[PULL 40/47] target/arm: Implement fp16 for Neon VRINTX
+[PULL 13/48] hw/arm/highbank: Silence warnings about missing fallthrough statements
-Convert the Neon VRINTX insn to use gvec, and use this to implement
+From: Thomas Huth <thuth@redhat.com>
 fp16 support for it.
+When compiling with -Werror=implicit-fallthrough, gcc complains about
+missing fallthrough annotations in this file. Looking at the code,
+the fallthrough is very likely intended here, so add some comments
+to silence the compiler warnings.
+Signed-off-by: Thomas Huth <thuth@redhat.com>
+Message-id: 20201020105938.23209-1-thuth@redhat.com
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-42-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  3 +++
+ hw/arm/highbank.c | 2 ++
- target/arm/vec_helper.c         |  3 +++
+file changed, 2 insertions(+)
  target/arm/translate-neon.c.inc | 45 +++------------------------------
 files changed, 9 insertions(+), 42 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/highbank.c b/hw/arm/highbank.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/highbank.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/highbank.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void hb_reset_secondary(ARMCPU *cpu, const struct arm_boot_info *info)
- DEF_HELPER_FLAGS_4(gvec_vrint_rm_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+         address_space_stl_notdirty(&address_space_memory,
- DEF_HELPER_FLAGS_4(gvec_vrint_rm_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+                                    SMP_BOOT_REG + 0x30, 0,
+                                    MEMTXATTRS_UNSPECIFIED, NULL);
-+DEF_HELPER_FLAGS_4(gvec_vrintx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++        /* fallthrough */
-+DEF_HELPER_FLAGS_4(gvec_vrintx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     case 3:
-+
+         address_space_stl_notdirty(&address_space_memory,
- DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+                                    SMP_BOOT_REG + 0x20, 0,
- DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+                                    MEMTXATTRS_UNSPECIFIED, NULL);
- DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++        /* fallthrough */
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+     case 2:
-index XXXXXXX..XXXXXXX 100644
+         address_space_stl_notdirty(&address_space_memory,
---- a/target/arm/vec_helper.c
+                                    SMP_BOOT_REG + 0x10, 0,
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
  DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
  DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
 +DO_2OP(gvec_vrintx_h, float16_round_to_int, float16)
 +DO_2OP(gvec_vrintx_s, float32_round_to_int, float32)
 +
  DO_2OP(gvec_sitos, helper_vfp_sitos, int32_t)
  DO_2OP(gvec_uitos, helper_vfp_uitos, uint32_t)
  DO_2OP(gvec_tosizs, helper_vfp_tosizs, float32)
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VQNEG(DisasContext *s, arg_2misc *a)
      return do_2misc(s, a, fn[a->size]);
  }
 -static bool do_2misc_fp(DisasContext *s, arg_2misc *a,
 -                        NeonGenOneSingleOpFn *fn)
 -{
 -    int pass;
 -    TCGv_ptr fpst;
 -
 -    /* Handle a 2-reg-misc operation by iterating 32 bits at a time */
 -    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
 -        return false;
 -    }
 -
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vd | a->vm) & 0x10)) {
 -        return false;
 -    }
 -
 -    if (a->size != 2) {
 -        /* TODO: FP16 will be the size == 1 case */
 -        return false;
 -    }
 -
 -    if ((a->vd | a->vm) & a->q) {
 -        return false;
 -    }
 -
 -    if (!vfp_access_check(s)) {
 -        return true;
 -    }
 -
 -    fpst = fpstatus_ptr(FPST_STD);
 -    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
 -        TCGv_i32 tmp = neon_load_reg(a->vm, pass);
 -        fn(tmp, tmp, fpst);
 -        neon_store_reg(a->vd, pass, tmp);
 -    }
 -    tcg_temp_free_ptr(fpst);
 -
 -    return true;
 -}
 -
  #define DO_2MISC_FP_VEC(INSN, HFUNC, SFUNC)                             \
      static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
                             uint32_t rm_ofs,                             \
@@ -XXX,XX +XXX,XX @@ DO_2MISC_FP_VEC(VCVT_FU, gen_helper_gvec_ustoh, gen_helper_gvec_uitos)
  DO_2MISC_FP_VEC(VCVT_SF, gen_helper_gvec_tosszh, gen_helper_gvec_tosizs)
  DO_2MISC_FP_VEC(VCVT_UF, gen_helper_gvec_touszh, gen_helper_gvec_touizs)
 +DO_2MISC_FP_VEC(VRINTX_impl, gen_helper_gvec_vrintx_h, gen_helper_gvec_vrintx_s)
 +
  static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
  {
      if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
          return false;
      }
 -    return do_2misc_fp(s, a, gen_helper_rints_exact);
 +    return trans_VRINTX_impl(s, a);
  }
  #define DO_VEC_RMODE(INSN, RMODE, OP)                                   \
 --
 .20.1

-[PULL 37/47] target/arm: Implement fp16 for Neon VCVT fixed-point
+[PULL 14/48] hw/arm: fix min_cpus for xlnx-versal-virt platform
-Implement fp16 for the Neon VCVT insns which convert between
+From: Pavel Dovgalyuk <pavel.dovgalyuk@ispras.ru>
 float and fixed-point.
+This patch sets min_cpus field for xlnx-versal-virt platform,
+because it always creates XLNX_VERSAL_NR_ACPUS cpus even with
+-smp 1 command line option.
+Signed-off-by: Pavel Dovgalyuk <pavel.dovgalyuk@ispras.ru>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
+Message-id: 160343854912.8460.17915238517799132371.stgit@pasha-ThinkPad-X280
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-39-peter.maydell@linaro.org
 ---
- target/arm/helper.h             | 5 +++++
+ hw/arm/xlnx-versal-virt.c | 1 +
- target/arm/neon-dp.decode       | 8 +++++++-
+file changed, 1 insertion(+)
  target/arm/vec_helper.c         | 4 ++++
  target/arm/translate-neon.c.inc | 5 +++++
 files changed, 21 insertions(+), 1 deletion(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/xlnx-versal-virt.c b/hw/arm/xlnx-versal-virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/xlnx-versal-virt.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/xlnx-versal-virt.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void versal_virt_machine_class_init(ObjectClass *oc, void *data)
- DEF_HELPER_FLAGS_4(gvec_vcvt_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_4(gvec_vcvt_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     mc->desc = "Xilinx Versal Virtual development board";
+     mc->init = versal_virt_init;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    mc->min_cpus = XLNX_VERSAL_NR_ACPUS;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     mc->max_cpus = XLNX_VERSAL_NR_ACPUS;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     mc->default_cpus = XLNX_VERSAL_NR_ACPUS;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     mc->no_cdrom = true;
 +
  DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/neon-dp.decode
 +++ b/target/arm/neon-dp.decode
@@ -XXX,XX +XXX,XX @@ VMINNM_fp_3s     1111 001 1 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
  # We use size=0 for fp32 and size=1 for fp16 to match the 3-same encodings.
  @2reg_vcvt       .... ... . . . 1 ..... .... .... . q:1 . . .... \
                   &2reg_shift vm=%vm_dp vd=%vd_dp size=0 shift=%neon_rshift_i5
 +@2reg_vcvt_f16   .... ... . . . 11 .... .... .... . q:1 . . .... \
 +                 &2reg_shift vm=%vm_dp vd=%vd_dp size=1 shift=%neon_rshift_i4
  VSHR_S_2sh       1111 001 0 1 . ...... .... 0000 . . . 1 .... @2reg_shr_d
  VSHR_S_2sh       1111 001 0 1 . ...... .... 0000 . . . 1 .... @2reg_shr_s
@@ -XXX,XX +XXX,XX @@ VSHLL_U_2sh      1111 001 1 1 . ...... .... 1010 . 0 . 1 .... @2reg_shll_h
  VSHLL_U_2sh      1111 001 1 1 . ...... .... 1010 . 0 . 1 .... @2reg_shll_b
  # VCVT fixed<->float conversions
 -# TODO: FP16 fixed<->float conversions are opc==0b1100 and 0b1101
 +VCVT_SH_2sh      1111 001 0 1 . ...... .... 1100 0 . . 1 .... @2reg_vcvt_f16
 +VCVT_UH_2sh      1111 001 1 1 . ...... .... 1100 0 . . 1 .... @2reg_vcvt_f16
 +VCVT_HS_2sh      1111 001 0 1 . ...... .... 1101 0 . . 1 .... @2reg_vcvt_f16
 +VCVT_HU_2sh      1111 001 1 1 . ...... .... 1101 0 . . 1 .... @2reg_vcvt_f16
 +
  VCVT_SF_2sh      1111 001 0 1 . ...... .... 1110 0 . . 1 .... @2reg_vcvt
  VCVT_UF_2sh      1111 001 1 1 . ...... .... 1110 0 . . 1 .... @2reg_vcvt
  VCVT_FS_2sh      1111 001 0 1 . ...... .... 1111 0 . . 1 .... @2reg_vcvt
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_fs, helper_vfp_tosls_round_to_zero, uint32_t)
  DO_VCVT_FIXED(gvec_vcvt_fu, helper_vfp_touls_round_to_zero, uint32_t)
 +DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
 +DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
 +DO_VCVT_FIXED(gvec_vcvt_hs, helper_vfp_toshh_round_to_zero, uint16_t)
 +DO_VCVT_FIXED(gvec_vcvt_hu, helper_vfp_touhh_round_to_zero, uint16_t)
  #undef DO_VCVT_FIXED
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_FP_2SH(VCVT_UF, gen_helper_gvec_vcvt_uf)
  DO_FP_2SH(VCVT_FS, gen_helper_gvec_vcvt_fs)
  DO_FP_2SH(VCVT_FU, gen_helper_gvec_vcvt_fu)
 +DO_FP_2SH(VCVT_SH, gen_helper_gvec_vcvt_sh)
 +DO_FP_2SH(VCVT_UH, gen_helper_gvec_vcvt_uh)
 +DO_FP_2SH(VCVT_HS, gen_helper_gvec_vcvt_hs)
 +DO_FP_2SH(VCVT_HU, gen_helper_gvec_vcvt_hu)
 +
  static uint64_t asimd_imm_const(uint32_t imm, int cmode, int op)
  {
      /*
 --
 .20.1

-[PULL 35/47] target/arm: Implement fp16 for Neon float-integer VCVT
+[PULL 15/48] Move npcm7xx_timer_reached_zero call out of npcm7xx_timer_pause
-Convert the Neon float-integer VCVT insns to gvec, and use this
+From: Havard Skinnemoen <hskinnemoen@google.com>
 to implement fp16 support for them.
-Note that unlike the VFP int<->fp16 VCVT insns we converted
+This allows us to reuse npcm7xx_timer_pause for the watchdog timer.
 earlier and which convert to/from a 32-bit integer, these
 Neon insns convert to/from 16-bit integers. So we can use
 the existing vfp conversion helpers for the f32<->u32/i32
 case but need to provide our own for f16<->u16/i16.
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-37-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  9 +++++++++
+ hw/timer/npcm7xx_timer.c | 6 +++---
- target/arm/vec_helper.c         | 29 +++++++++++++++++++++++++++++
+file changed, 3 insertions(+), 3 deletions(-)
  target/arm/translate-neon.c.inc | 15 ++++-----------
 files changed, 42 insertions(+), 11 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/timer/npcm7xx_timer.c b/hw/timer/npcm7xx_timer.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/timer/npcm7xx_timer.c
-+++ b/target/arm/helper.h
++++ b/hw/timer/npcm7xx_timer.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(neon_padds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_pause(NPCM7xxTimer *t)
- DEF_HELPER_FLAGS_5(neon_pmaxs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     timer_del(&t->qtimer);
- DEF_HELPER_FLAGS_5(neon_pmins, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
+     t->remaining_ns = t->expires_ns - now;
-+DEF_HELPER_FLAGS_4(gvec_sstoh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-    if (t->remaining_ns <= 0) {
-+DEF_HELPER_FLAGS_4(gvec_sitos, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-        npcm7xx_timer_reached_zero(t);
-+DEF_HELPER_FLAGS_4(gvec_ustoh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+-    }
 +DEF_HELPER_FLAGS_4(gvec_uitos, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_tosszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_tosizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_touszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
  DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t float32_acgt(float32 op1, float32 op2, float_status *stat)
      return -float32_lt(float32_abs(op2), float32_abs(op1), stat);
  }
-+static int16_t vfp_tosszh(float16 x, void *fpstp)
+ /*
-+{
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
-+    float_status *fpst = fpstp;
+         } else {
-+    if (float16_is_any_nan(x)) {
+             t->tcsr &= ~NPCM7XX_TCSR_CACT;
-+        float_raise(float_flag_invalid, fpst);
+             npcm7xx_timer_pause(t);
-+        return 0;
++            if (t->remaining_ns <= 0) {
-+    }
++                npcm7xx_timer_reached_zero(t);
-+    return float16_to_int16_round_to_zero(x, fpst);
++            }
-+}
+         }
-+
+     }
 +static uint16_t vfp_touszh(float16 x, void *fpstp)
 +{
 +    float_status *fpst = fpstp;
 +    if (float16_is_any_nan(x)) {
 +        float_raise(float_flag_invalid, fpst);
 +        return 0;
 +    }
 +    return float16_to_uint16_round_to_zero(x, fpst);
 +}
 +
  #define DO_2OP(NAME, FUNC, TYPE) \
  void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
  {                                                                 \
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
  DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
  DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
 +DO_2OP(gvec_sitos, helper_vfp_sitos, int32_t)
 +DO_2OP(gvec_uitos, helper_vfp_uitos, uint32_t)
 +DO_2OP(gvec_tosizs, helper_vfp_tosizs, float32)
 +DO_2OP(gvec_touizs, helper_vfp_touizs, float32)
 +DO_2OP(gvec_sstoh, int16_to_float16, int16_t)
 +DO_2OP(gvec_ustoh, uint16_to_float16, uint16_t)
 +DO_2OP(gvec_tosszh, vfp_tosszh, float16)
 +DO_2OP(gvec_touszh, vfp_touszh, float16)
 +
  #define WRAP_CMP0_FWD(FN, CMPOP, TYPE)                          \
      static TYPE TYPE##_##FN##0(TYPE op, float_status *stat)     \
      {                                                           \
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_2misc_fp(DisasContext *s, arg_2misc *a,
      return true;
  }
--#define DO_2MISC_FP(INSN, FUNC)                                 \
--    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
--    {                                                           \
--        return do_2misc_fp(s, a, FUNC);                         \
--    }
--
--DO_2MISC_FP(VCVT_FS, gen_helper_vfp_sitos)
--DO_2MISC_FP(VCVT_FU, gen_helper_vfp_uitos)
--DO_2MISC_FP(VCVT_SF, gen_helper_vfp_tosizs)
--DO_2MISC_FP(VCVT_UF, gen_helper_vfp_touizs)
--
- #define DO_2MISC_FP_VEC(INSN, HFUNC, SFUNC)                             \
-     static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
-                            uint32_t rm_ofs,                             \
-@@ -XXX,XX +XXX,XX @@ DO_2MISC_FP_VEC(VCGE0_F, gen_helper_gvec_fcge0_h, gen_helper_gvec_fcge0_s)
- DO_2MISC_FP_VEC(VCEQ0_F, gen_helper_gvec_fceq0_h, gen_helper_gvec_fceq0_s)
- DO_2MISC_FP_VEC(VCLT0_F, gen_helper_gvec_fclt0_h, gen_helper_gvec_fclt0_s)
- DO_2MISC_FP_VEC(VCLE0_F, gen_helper_gvec_fcle0_h, gen_helper_gvec_fcle0_s)
-+DO_2MISC_FP_VEC(VCVT_FS, gen_helper_gvec_sstoh, gen_helper_gvec_sitos)
-+DO_2MISC_FP_VEC(VCVT_FU, gen_helper_gvec_ustoh, gen_helper_gvec_uitos)
-+DO_2MISC_FP_VEC(VCVT_SF, gen_helper_gvec_tosszh, gen_helper_gvec_tosizs)
-+DO_2MISC_FP_VEC(VCVT_UF, gen_helper_gvec_touszh, gen_helper_gvec_touizs)
- static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
- {
 --
 .20.1

-[PULL 03/47] target/arm: Implement VFP fp16 for VFP_BINOP operations
+[PULL 16/48] hw/timer: Adding watchdog for NPCM7XX Timer.
-Implmeent VFP fp16 support for simple binary-operator VFP insns VADD,
+From: Hao Wu <wuhaotsh@google.com>
 VSUB, VMUL, VDIV, VMINNM and VMAXNM:
- * make the VFP_BINOP() macro generate float16 helpers as well as
+The watchdog is part of NPCM7XX's timer module. Its behavior is
-   float32 and float64
+controlled by the WTCR register in the timer.
  * implement a do_vfp_3op_hp() function similar to the existing
    do_vfp_3op_sp()
  * add decode for the half-precision insn patterns
-Note that the VFP_BINOP macro use creates a couple of unused helper
+When enabled, the watchdog issues an interrupt signal after a pre-set
-functions vfp_maxh and vfp_minh, but they're small so it's not worth
+amount of cycles, and issues a reset signal shortly after that.
 splitting the BINOP operations into "needs halfprec" and "no
 halfprec" groups.
+Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
+Signed-off-by: Hao Wu <wuhaotsh@google.com>
+Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+[PMM: deleted blank line at end of npcm_watchdog_timer-test.c]
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-4-peter.maydell@linaro.org
 ---
- target/arm/helper.h            |  8 ++++
+ include/hw/misc/npcm7xx_clk.h             |   2 +
- target/arm/vfp-uncond.decode   |  3 ++
+ include/hw/timer/npcm7xx_timer.h          |  48 +++-
- target/arm/vfp.decode          |  4 ++
+ hw/arm/npcm7xx.c                          |  12 +
- target/arm/vfp_helper.c        |  5 ++
+ hw/misc/npcm7xx_clk.c                     |  28 ++
- target/arm/translate-vfp.c.inc | 86 ++++++++++++++++++++++++++++++++++
+ hw/timer/npcm7xx_timer.c                  | 266 ++++++++++++++----
-files changed, 106 insertions(+)
+ tests/qtest/npcm7xx_watchdog_timer-test.c | 319 ++++++++++++++++++++++
  MAINTAINERS                               |   1 +
  tests/qtest/meson.build                   |   2 +-
 files changed, 624 insertions(+), 54 deletions(-)
  create mode 100644 tests/qtest/npcm7xx_watchdog_timer-test.c
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/misc/npcm7xx_clk.h b/include/hw/misc/npcm7xx_clk.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/npcm7xx_clk.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/npcm7xx_clk.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(probe_access, TCG_CALL_NO_WG, void, env, tl, i32, i32, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_1(vfp_get_fpscr, i32, env)
+  */
- DEF_HELPER_2(vfp_set_fpscr, void, env, i32)
+ #define NPCM7XX_CLK_NR_REGS             (0x70 / sizeof(uint32_t))
-+DEF_HELPER_3(vfp_addh, f16, f16, f16, ptr)
++#define NPCM7XX_WATCHDOG_RESET_GPIO_IN "npcm7xx-clk-watchdog-reset-gpio-in"
- DEF_HELPER_3(vfp_adds, f32, f32, f32, ptr)
++
- DEF_HELPER_3(vfp_addd, f64, f64, f64, ptr)
+ typedef struct NPCM7xxCLKState {
-+DEF_HELPER_3(vfp_subh, f16, f16, f16, ptr)
+     SysBusDevice parent;
- DEF_HELPER_3(vfp_subs, f32, f32, f32, ptr)
- DEF_HELPER_3(vfp_subd, f64, f64, f64, ptr)
+diff --git a/include/hw/timer/npcm7xx_timer.h b/include/hw/timer/npcm7xx_timer.h
 +DEF_HELPER_3(vfp_mulh, f16, f16, f16, ptr)
  DEF_HELPER_3(vfp_muls, f32, f32, f32, ptr)
  DEF_HELPER_3(vfp_muld, f64, f64, f64, ptr)
 +DEF_HELPER_3(vfp_divh, f16, f16, f16, ptr)
  DEF_HELPER_3(vfp_divs, f32, f32, f32, ptr)
  DEF_HELPER_3(vfp_divd, f64, f64, f64, ptr)
 +DEF_HELPER_3(vfp_maxh, f16, f16, f16, ptr)
  DEF_HELPER_3(vfp_maxs, f32, f32, f32, ptr)
  DEF_HELPER_3(vfp_maxd, f64, f64, f64, ptr)
 +DEF_HELPER_3(vfp_minh, f16, f16, f16, ptr)
  DEF_HELPER_3(vfp_mins, f32, f32, f32, ptr)
  DEF_HELPER_3(vfp_mind, f64, f64, f64, ptr)
 +DEF_HELPER_3(vfp_maxnumh, f16, f16, f16, ptr)
  DEF_HELPER_3(vfp_maxnums, f32, f32, f32, ptr)
  DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
 +DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
  DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
  DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
  DEF_HELPER_1(vfp_negs, f32, f32)
 diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp-uncond.decode
+--- a/include/hw/timer/npcm7xx_timer.h
-+++ b/target/arm/vfp-uncond.decode
++++ b/include/hw/timer/npcm7xx_timer.h
-@@ -XXX,XX +XXX,XX @@ VSEL        1111 1110 0. cc:2 .... .... 1010 .0.0 .... \
+@@ -XXX,XX +XXX,XX @@
- VSEL        1111 1110 0. cc:2 .... .... 1011 .0.0 .... \
+  */
-             vm=%vm_dp vn=%vn_dp vd=%vd_dp dp=1
+ #define NPCM7XX_TIMER_NR_REGS (0x54 / sizeof(uint32_t))
-+VMAXNM_hp   1111 1110 1.00 .... .... 1001 .0.0 ....         @vfp_dnm_s
++/* The basic watchdog timer period is 2^14 clock cycles. */
-+VMINNM_hp   1111 1110 1.00 .... .... 1001 .1.0 ....         @vfp_dnm_s
++#define NPCM7XX_WATCHDOG_BASETIME_SHIFT 14
 +
- VMAXNM_sp   1111 1110 1.00 .... .... 1010 .0.0 ....         @vfp_dnm_s
++#define NPCM7XX_WATCHDOG_RESET_GPIO_OUT "npcm7xx-clk-watchdog-reset-gpio-out"
- VMINNM_sp   1111 1110 1.00 .... .... 1010 .1.0 ....         @vfp_dnm_s
++
+ typedef struct NPCM7xxTimerCtrlState NPCM7xxTimerCtrlState;
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
  /**
 - * struct NPCM7xxTimer - Individual timer state.
 - * @irq: GIC interrupt line to fire on expiration (if enabled).
 + * struct NPCM7xxBaseTimer - Basic functionality that both regular timer and
 + * watchdog timer use.
   * @qtimer: QEMU timer that notifies us on expiration.
   * @expires_ns: Absolute virtual expiration time.
   * @remaining_ns: Remaining time until expiration if timer is paused.
 + */
 +typedef struct NPCM7xxBaseTimer {
 +    QEMUTimer   qtimer;
 +    int64_t     expires_ns;
 +    int64_t     remaining_ns;
 +} NPCM7xxBaseTimer;
 +
 +/**
 + * struct NPCM7xxTimer - Individual timer state.
 + * @ctrl: The timer module that owns this timer.
 + * @irq: GIC interrupt line to fire on expiration (if enabled).
 + * @base_timer: The basic timer functionality for this timer.
   * @tcsr: The Timer Control and Status Register.
   * @ticr: The Timer Initial Count Register.
   */
@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxTimer {
      NPCM7xxTimerCtrlState *ctrl;
      qemu_irq    irq;
 -    QEMUTimer   qtimer;
 -    int64_t     expires_ns;
 -    int64_t     remaining_ns;
 +    NPCM7xxBaseTimer base_timer;
      uint32_t    tcsr;
      uint32_t    ticr;
  } NPCM7xxTimer;
 +/**
 + * struct NPCM7xxWatchdogTimer - The watchdog timer state.
 + * @ctrl: The timer module that owns this timer.
 + * @irq: GIC interrupt line to fire on expiration (if enabled).
 + * @reset_signal: The GPIO used to send a reset signal.
 + * @base_timer: The basic timer functionality for this timer.
 + * @wtcr: The Watchdog Timer Control Register.
 + */
 +typedef struct NPCM7xxWatchdogTimer {
 +    NPCM7xxTimerCtrlState *ctrl;
 +
 +    qemu_irq            irq;
 +    qemu_irq            reset_signal;
 +    NPCM7xxBaseTimer base_timer;
 +
 +    uint32_t            wtcr;
 +} NPCM7xxWatchdogTimer;
 +
  /**
   * struct NPCM7xxTimerCtrlState - Timer Module device state.
   * @parent: System bus device.
   * @iomem: Memory region through which registers are accessed.
 + * @index: The index of this timer module.
   * @tisr: The Timer Interrupt Status Register.
 - * @wtcr: The Watchdog Timer Control Register.
   * @timer: The five individual timers managed by this module.
 + * @watchdog_timer: The watchdog timer managed by this module.
   */
  struct NPCM7xxTimerCtrlState {
      SysBusDevice parent;
@@ -XXX,XX +XXX,XX @@ struct NPCM7xxTimerCtrlState {
      MemoryRegion iomem;
      uint32_t    tisr;
 -    uint32_t    wtcr;
      NPCM7xxTimer timer[NPCM7XX_TIMERS_PER_CTRL];
 +    NPCM7xxWatchdogTimer watchdog_timer;
  };
  #define TYPE_NPCM7XX_TIMER "npcm7xx-timer"
 diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/hw/arm/npcm7xx.c
-+++ b/target/arm/vfp.decode
++++ b/hw/arm/npcm7xx.c
-@@ -XXX,XX +XXX,XX @@ VNMLS_dp     ---- 1110 0.01 .... .... 1011 .0.0 ....        @vfp_dnm_d
+@@ -XXX,XX +XXX,XX @@ enum NPCM7xxInterrupt {
- VNMLA_sp     ---- 1110 0.01 .... .... 1010 .1.0 ....        @vfp_dnm_s
+     NPCM7XX_TIMER12_IRQ,
- VNMLA_dp     ---- 1110 0.01 .... .... 1011 .1.0 ....        @vfp_dnm_d
+     NPCM7XX_TIMER13_IRQ,
+     NPCM7XX_TIMER14_IRQ,
-+VMUL_hp      ---- 1110 0.10 .... .... 1001 .0.0 ....        @vfp_dnm_s
++    NPCM7XX_WDG0_IRQ            = 47,   /* Timer Module 0 Watchdog */
- VMUL_sp      ---- 1110 0.10 .... .... 1010 .0.0 ....        @vfp_dnm_s
++    NPCM7XX_WDG1_IRQ,                   /* Timer Module 1 Watchdog */
- VMUL_dp      ---- 1110 0.10 .... .... 1011 .0.0 ....        @vfp_dnm_d
++    NPCM7XX_WDG2_IRQ,                   /* Timer Module 2 Watchdog */
+ };
- VNMUL_sp     ---- 1110 0.10 .... .... 1010 .1.0 ....        @vfp_dnm_s
- VNMUL_dp     ---- 1110 0.10 .... .... 1011 .1.0 ....        @vfp_dnm_d
+ /* Total number of GIC interrupts, including internal Cortex-A9 interrupts. */
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
-+VADD_hp      ---- 1110 0.11 .... .... 1001 .0.0 ....        @vfp_dnm_s
+             qemu_irq irq = npcm7xx_irq(s, first_irq + j);
- VADD_sp      ---- 1110 0.11 .... .... 1010 .0.0 ....        @vfp_dnm_s
+             sysbus_connect_irq(sbd, j, irq);
- VADD_dp      ---- 1110 0.11 .... .... 1011 .0.0 ....        @vfp_dnm_d
+         }
++
-+VSUB_hp      ---- 1110 0.11 .... .... 1001 .1.0 ....        @vfp_dnm_s
++        /* IRQ for watchdogs */
- VSUB_sp      ---- 1110 0.11 .... .... 1010 .1.0 ....        @vfp_dnm_s
++        sysbus_connect_irq(sbd, NPCM7XX_TIMERS_PER_CTRL,
- VSUB_dp      ---- 1110 0.11 .... .... 1011 .1.0 ....        @vfp_dnm_d
++                npcm7xx_irq(s, NPCM7XX_WDG0_IRQ + i));
++        /* GPIO that connects clk module with watchdog */
-+VDIV_hp      ---- 1110 1.00 .... .... 1001 .0.0 ....        @vfp_dnm_s
++        qdev_connect_gpio_out_named(DEVICE(&s->tim[i]),
- VDIV_sp      ---- 1110 1.00 .... .... 1010 .0.0 ....        @vfp_dnm_s
++                NPCM7XX_WATCHDOG_RESET_GPIO_OUT, 0,
- VDIV_dp      ---- 1110 1.00 .... .... 1011 .0.0 ....        @vfp_dnm_d
++                qdev_get_gpio_in_named(DEVICE(&s->clk),
++                        NPCM7XX_WATCHDOG_RESET_GPIO_IN, i));
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
+     }
      /* UART0..3 (16550 compatible) */
 diff --git a/hw/misc/npcm7xx_clk.c b/hw/misc/npcm7xx_clk.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp_helper.c
+--- a/hw/misc/npcm7xx_clk.c
-+++ b/target/arm/vfp_helper.c
++++ b/hw/misc/npcm7xx_clk.c
-@@ -XXX,XX +XXX,XX @@ void vfp_set_fpscr(CPUARMState *env, uint32_t val)
+@@ -XXX,XX +XXX,XX @@
- #define VFP_HELPER(name, p) HELPER(glue(glue(vfp_,name),p))
+ #include "qemu/osdep.h"
- #define VFP_BINOP(name) \
+ #include "hw/misc/npcm7xx_clk.h"
-+dh_ctype_f16 VFP_HELPER(name, h)(dh_ctype_f16 a, dh_ctype_f16 b, void *fpstp) \
++#include "hw/timer/npcm7xx_timer.h"
-+{ \
+ #include "migration/vmstate.h"
-+    float_status *fpst = fpstp; \
+ #include "qemu/error-report.h"
-+    return float16_ ## name(a, b, fpst); \
+ #include "qemu/log.h"
-+} \
+@@ -XXX,XX +XXX,XX @@
- float32 VFP_HELPER(name, s)(float32 a, float32 b, void *fpstp) \
+ #include "qemu/timer.h"
- { \
+ #include "qemu/units.h"
-     float_status *fpst = fpstp; \
+ #include "trace.h"
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
++#include "sysemu/watchdog.h"
  #define PLLCON_LOKI     BIT(31)
  #define PLLCON_LOKS     BIT(30)
@@ -XXX,XX +XXX,XX @@ static const uint32_t cold_reset_values[NPCM7XX_CLK_NR_REGS] = {
      [NPCM7XX_CLK_AHBCKFI]       = 0x000000c8,
  };
 +/* Register Field Definitions */
 +#define NPCM7XX_CLK_WDRCR_CA9C  BIT(0) /* Cortex A9 Cores */
 +
 +/* The number of watchdogs that can trigger a reset. */
 +#define NPCM7XX_NR_WATCHDOGS    (3)
 +
  static uint64_t npcm7xx_clk_read(void *opaque, hwaddr offset, unsigned size)
  {
      uint32_t reg = offset / sizeof(uint32_t);
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_clk_write(void *opaque, hwaddr offset,
      s->regs[reg] = value;
  }
 +/* Perform reset action triggered by a watchdog */
 +static void npcm7xx_clk_perform_watchdog_reset(void *opaque, int n,
 +        int level)
 +{
 +    NPCM7xxCLKState *clk = NPCM7XX_CLK(opaque);
 +    uint32_t rcr;
 +
 +    g_assert(n >= 0 && n <= NPCM7XX_NR_WATCHDOGS);
 +    rcr = clk->regs[NPCM7XX_CLK_WD0RCR + n];
 +    if (rcr & NPCM7XX_CLK_WDRCR_CA9C) {
 +        watchdog_perform_action();
 +    } else {
 +        qemu_log_mask(LOG_UNIMP,
 +                "%s: only CPU reset is implemented. (requested 0x%" PRIx32")\n",
 +                __func__, rcr);
 +    }
 +}
 +
  static const struct MemoryRegionOps npcm7xx_clk_ops = {
      .read       = npcm7xx_clk_read,
      .write      = npcm7xx_clk_write,
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_clk_init(Object *obj)
      memory_region_init_io(&s->iomem, obj, &npcm7xx_clk_ops, s,
                            TYPE_NPCM7XX_CLK, 4 * KiB);
      sysbus_init_mmio(&s->parent, &s->iomem);
 +    qdev_init_gpio_in_named(DEVICE(s), npcm7xx_clk_perform_watchdog_reset,
 +            NPCM7XX_WATCHDOG_RESET_GPIO_IN, NPCM7XX_NR_WATCHDOGS);
  }
  static const VMStateDescription vmstate_npcm7xx_clk = {
 diff --git a/hw/timer/npcm7xx_timer.c b/hw/timer/npcm7xx_timer.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.c.inc
+--- a/hw/timer/npcm7xx_timer.c
-+++ b/target/arm/translate-vfp.c.inc
++++ b/hw/timer/npcm7xx_timer.c
-@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_sp(DisasContext *s, VFPGen3OpSPFn *fn,
+@@ -XXX,XX +XXX,XX @@
-     return true;
+ #include "qemu/osdep.h"
  #include "hw/irq.h"
 +#include "hw/qdev-properties.h"
  #include "hw/misc/npcm7xx_clk.h"
  #include "hw/timer/npcm7xx_timer.h"
  #include "migration/vmstate.h"
@@ -XXX,XX +XXX,XX @@ enum NPCM7xxTimerRegisters {
  #define NPCM7XX_TCSR_PRESCALE_START     0
  #define NPCM7XX_TCSR_PRESCALE_LEN       8
 +#define NPCM7XX_WTCR_WTCLK(rv)          extract32(rv, 10, 2)
 +#define NPCM7XX_WTCR_FREEZE_EN          BIT(9)
 +#define NPCM7XX_WTCR_WTE                BIT(7)
 +#define NPCM7XX_WTCR_WTIE               BIT(6)
 +#define NPCM7XX_WTCR_WTIS(rv)           extract32(rv, 4, 2)
 +#define NPCM7XX_WTCR_WTIF               BIT(3)
 +#define NPCM7XX_WTCR_WTRF               BIT(2)
 +#define NPCM7XX_WTCR_WTRE               BIT(1)
 +#define NPCM7XX_WTCR_WTR                BIT(0)
 +
 +/*
 + * The number of clock cycles between interrupt and reset in watchdog, used
 + * by the software to handle the interrupt before system is reset.
 + */
 +#define NPCM7XX_WATCHDOG_INTERRUPT_TO_RESET_CYCLES 1024
 +
 +/* Start or resume the timer. */
 +static void npcm7xx_timer_start(NPCM7xxBaseTimer *t)
 +{
 +    int64_t now;
 +
 +    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 +    t->expires_ns = now + t->remaining_ns;
 +    timer_mod(&t->qtimer, t->expires_ns);
 +}
 +
 +/* Stop counting. Record the time remaining so we can continue later. */
 +static void npcm7xx_timer_pause(NPCM7xxBaseTimer *t)
 +{
 +    int64_t now;
 +
 +    timer_del(&t->qtimer);
 +    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 +    t->remaining_ns = t->expires_ns - now;
 +}
 +
 +/* Delete the timer and reset it to default state. */
 +static void npcm7xx_timer_clear(NPCM7xxBaseTimer *t)
 +{
 +    timer_del(&t->qtimer);
 +    t->expires_ns = 0;
 +    t->remaining_ns = 0;
 +}
 +
  /*
   * Returns the index of timer in the tc->timer array. This can be used to
   * locate the registers that belong to this timer.
@@ -XXX,XX +XXX,XX @@ static uint32_t npcm7xx_timer_ns_to_count(NPCM7xxTimer *t, int64_t ns)
      return count;
  }
-+static bool do_vfp_3op_hp(DisasContext *s, VFPGen3OpSPFn *fn,
++static uint32_t npcm7xx_watchdog_timer_prescaler(const NPCM7xxWatchdogTimer *t)
-+                          int vd, int vn, int vm, bool reads_vd)
++{
-+{
++    switch (NPCM7XX_WTCR_WTCLK(t->wtcr)) {
 +    case 0:
 +        return 1;
 +    case 1:
 +        return 256;
 +    case 2:
 +        return 2048;
 +    case 3:
 +        return 65536;
 +    default:
 +        g_assert_not_reached();
 +    }
 +}
 +
 +static void npcm7xx_watchdog_timer_reset_cycles(NPCM7xxWatchdogTimer *t,
 +        int64_t cycles)
 +{
 +    uint32_t prescaler = npcm7xx_watchdog_timer_prescaler(t);
 +    int64_t ns = (NANOSECONDS_PER_SECOND / NPCM7XX_TIMER_REF_HZ) * cycles;
 +
 +    /*
-+     * Do a half-precision operation. Functionally this is
++     * The reset function always clears the current timer. The caller of the
-+     * the same as do_vfp_3op_sp(), except:
++     * this needs to decide whether to start the watchdog timer based on
-+     *  - it uses the FPST_FPCR_F16
++     * specific flag in WTCR.
 +     *  - it doesn't need the VFP vector handling (fp16 is a
 +     *    v8 feature, and in v8 VFP vectors don't exist)
 +     *  - it does the aa32_fp16_arith feature test
 +     */
-+    TCGv_i32 f0, f1, fd;
++    npcm7xx_timer_clear(&t->base_timer);
-+    TCGv_ptr fpst;
++
-+
++    ns *= prescaler;
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++    t->base_timer.remaining_ns = ns;
-+        return false;
++}
 +
 +static void npcm7xx_watchdog_timer_reset(NPCM7xxWatchdogTimer *t)
 +{
 +    int64_t cycles = 1;
 +    uint32_t s = NPCM7XX_WTCR_WTIS(t->wtcr);
 +
 +    g_assert(s <= 3);
 +
 +    cycles <<= NPCM7XX_WATCHDOG_BASETIME_SHIFT;
 +    cycles <<= 2 * s;
 +
 +    npcm7xx_watchdog_timer_reset_cycles(t, cycles);
 +}
 +
  /*
   * Raise the interrupt line if there's a pending interrupt and interrupts are
   * enabled for this timer. If not, lower it.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_check_interrupt(NPCM7xxTimer *t)
      trace_npcm7xx_timer_irq(DEVICE(tc)->canonical_path, index, pending);
  }
 -/* Start or resume the timer. */
 -static void npcm7xx_timer_start(NPCM7xxTimer *t)
 -{
 -    int64_t now;
 -
 -    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 -    t->expires_ns = now + t->remaining_ns;
 -    timer_mod(&t->qtimer, t->expires_ns);
 -}
 -
  /*
   * Called when the counter reaches zero. Sets the interrupt flag, and either
   * restarts or disables the timer.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_reached_zero(NPCM7xxTimer *t)
      tc->tisr |= BIT(index);
      if (t->tcsr & NPCM7XX_TCSR_PERIODIC) {
 -        t->remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
 +        t->base_timer.remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
          if (t->tcsr & NPCM7XX_TCSR_CEN) {
 -            npcm7xx_timer_start(t);
 +            npcm7xx_timer_start(&t->base_timer);
          }
      } else {
          t->tcsr &= ~(NPCM7XX_TCSR_CEN | NPCM7XX_TCSR_CACT);
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_reached_zero(NPCM7xxTimer *t)
      npcm7xx_timer_check_interrupt(t);
  }
 -/* Stop counting. Record the time remaining so we can continue later. */
 -static void npcm7xx_timer_pause(NPCM7xxTimer *t)
 -{
 -    int64_t now;
 -
 -    timer_del(&t->qtimer);
 -    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 -    t->remaining_ns = t->expires_ns - now;
 -}
  /*
   * Restart the timer from its initial value. If the timer was enabled and stays
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_pause(NPCM7xxTimer *t)
   */
  static void npcm7xx_timer_restart(NPCM7xxTimer *t, uint32_t old_tcsr)
  {
 -    t->remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
 +    t->base_timer.remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
      if (old_tcsr & t->tcsr & NPCM7XX_TCSR_CEN) {
 -        npcm7xx_timer_start(t);
 +        npcm7xx_timer_start(&t->base_timer);
      }
  }
@@ -XXX,XX +XXX,XX @@ static uint32_t npcm7xx_timer_read_tdr(NPCM7xxTimer *t)
      if (t->tcsr & NPCM7XX_TCSR_CEN) {
          int64_t now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 -        return npcm7xx_timer_ns_to_count(t, t->expires_ns - now);
 +        return npcm7xx_timer_ns_to_count(t, t->base_timer.expires_ns - now);
      }
 -    return npcm7xx_timer_ns_to_count(t, t->remaining_ns);
 +    return npcm7xx_timer_ns_to_count(t, t->base_timer.remaining_ns);
  }
  static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
      if (npcm7xx_tcsr_prescaler(old_tcsr) != npcm7xx_tcsr_prescaler(new_tcsr)) {
          /* Recalculate time remaining based on the current TDR value. */
 -        t->remaining_ns = npcm7xx_timer_count_to_ns(t, tdr);
 +        t->base_timer.remaining_ns = npcm7xx_timer_count_to_ns(t, tdr);
          if (old_tcsr & t->tcsr & NPCM7XX_TCSR_CEN) {
 -            npcm7xx_timer_start(t);
 +            npcm7xx_timer_start(&t->base_timer);
          }
      }
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
      if ((old_tcsr ^ new_tcsr) & NPCM7XX_TCSR_CEN) {
          if (new_tcsr & NPCM7XX_TCSR_CEN) {
              t->tcsr |= NPCM7XX_TCSR_CACT;
 -            npcm7xx_timer_start(t);
 +            npcm7xx_timer_start(&t->base_timer);
          } else {
              t->tcsr &= ~NPCM7XX_TCSR_CACT;
 -            npcm7xx_timer_pause(t);
 -            if (t->remaining_ns <= 0) {
 +            npcm7xx_timer_pause(&t->base_timer);
 +            if (t->base_timer.remaining_ns <= 0) {
                  npcm7xx_timer_reached_zero(t);
              }
          }
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tisr(NPCM7xxTimerCtrlState *s, uint32_t value)
          if (value & (1U << i)) {
              npcm7xx_timer_check_interrupt(&s->timer[i]);
          }
 +
      }
  }
 +static void npcm7xx_timer_write_wtcr(NPCM7xxWatchdogTimer *t, uint32_t new_wtcr)
 +{
 +    uint32_t old_wtcr = t->wtcr;
 +
 +    /*
 +     * WTIF and WTRF are cleared by writing 1. Writing 0 makes these bits
 +     * unchanged.
 +     */
 +    if (new_wtcr & NPCM7XX_WTCR_WTIF) {
 +        new_wtcr &= ~NPCM7XX_WTCR_WTIF;
 +    } else if (old_wtcr & NPCM7XX_WTCR_WTIF) {
 +        new_wtcr |= NPCM7XX_WTCR_WTIF;
 +    }
-+
++    if (new_wtcr & NPCM7XX_WTCR_WTRF) {
-+    if (s->vec_len != 0 || s->vec_stride != 0) {
++        new_wtcr &= ~NPCM7XX_WTCR_WTRF;
-+        return false;
++    } else if (old_wtcr & NPCM7XX_WTCR_WTRF) {
 +        new_wtcr |= NPCM7XX_WTCR_WTRF;
 +    }
 +
-+    if (!vfp_access_check(s)) {
++    t->wtcr = new_wtcr;
-+        return true;
++
 +    if (new_wtcr & NPCM7XX_WTCR_WTR) {
 +        t->wtcr &= ~NPCM7XX_WTCR_WTR;
 +        npcm7xx_watchdog_timer_reset(t);
 +        if (new_wtcr & NPCM7XX_WTCR_WTE) {
 +            npcm7xx_timer_start(&t->base_timer);
 +        }
 +    } else if ((old_wtcr ^ new_wtcr) & NPCM7XX_WTCR_WTE) {
 +        if (new_wtcr & NPCM7XX_WTCR_WTE) {
 +            npcm7xx_timer_start(&t->base_timer);
 +        } else {
 +            npcm7xx_timer_pause(&t->base_timer);
 +        }
 +    }
 +
-+    f0 = tcg_temp_new_i32();
++}
-+    f1 = tcg_temp_new_i32();
++
-+    fd = tcg_temp_new_i32();
+ static hwaddr npcm7xx_tcsr_index(hwaddr reg)
-+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+ {
-+
+     switch (reg) {
-+    neon_load_reg32(f0, vn);
+@@ -XXX,XX +XXX,XX @@ static uint64_t npcm7xx_timer_read(void *opaque, hwaddr offset, unsigned size)
-+    neon_load_reg32(f1, vm);
+         break;
-+
-+    if (reads_vd) {
+     case NPCM7XX_TIMER_WTCR:
-+        neon_load_reg32(fd, vd);
+-        value = s->wtcr;
 +        value = s->watchdog_timer.wtcr;
          break;
      default:
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write(void *opaque, hwaddr offset,
          return;
      case NPCM7XX_TIMER_WTCR:
 -        qemu_log_mask(LOG_UNIMP, "%s: WTCR write not implemented: 0x%08x\n",
 -                      __func__, value);
 +        npcm7xx_timer_write_wtcr(&s->watchdog_timer, value);
          return;
      }
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_enter_reset(Object *obj, ResetType type)
      for (i = 0; i < NPCM7XX_TIMERS_PER_CTRL; i++) {
          NPCM7xxTimer *t = &s->timer[i];
 -        timer_del(&t->qtimer);
 -        t->expires_ns = 0;
 -        t->remaining_ns = 0;
 +        npcm7xx_timer_clear(&t->base_timer);
          t->tcsr = 0x00000005;
          t->ticr = 0x00000000;
      }
      s->tisr = 0x00000000;
 -    s->wtcr = 0x00000400;
 +    /*
 +     * Set WTCLK to 1(default) and reset all flags except WTRF.
 +     * WTRF is not reset during a core domain reset.
 +     */
 +    s->watchdog_timer.wtcr = 0x00000400 | (s->watchdog_timer.wtcr &
 +            NPCM7XX_WTCR_WTRF);
 +}
 +
 +static void npcm7xx_watchdog_timer_expired(void *opaque)
 +{
 +    NPCM7xxWatchdogTimer *t = opaque;
 +
 +    if (t->wtcr & NPCM7XX_WTCR_WTE) {
 +        if (t->wtcr & NPCM7XX_WTCR_WTIF) {
 +            if (t->wtcr & NPCM7XX_WTCR_WTRE) {
 +                t->wtcr |= NPCM7XX_WTCR_WTRF;
 +                /* send reset signal to CLK module*/
 +                qemu_irq_raise(t->reset_signal);
 +            }
 +        } else {
 +            t->wtcr |= NPCM7XX_WTCR_WTIF;
 +            if (t->wtcr & NPCM7XX_WTCR_WTIE) {
 +                /* send interrupt */
 +                qemu_irq_raise(t->irq);
 +            }
 +            npcm7xx_watchdog_timer_reset_cycles(t,
 +                    NPCM7XX_WATCHDOG_INTERRUPT_TO_RESET_CYCLES);
 +            npcm7xx_timer_start(&t->base_timer);
 +        }
 +    }
-+    fn(fd, f0, f1, fpst);
-+    neon_store_reg32(fd, vd);
-+
-+    tcg_temp_free_i32(f0);
-+    tcg_temp_free_i32(f1);
-+    tcg_temp_free_i32(fd);
-+    tcg_temp_free_ptr(fpst);
-+
-+    return true;
-+}
-+
- static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
-                           int vd, int vn, int vm, bool reads_vd)
- {
-@@ -XXX,XX +XXX,XX @@ static bool trans_VNMLA_dp(DisasContext *s, arg_VNMLA_dp *a)
-     return do_vfp_3op_dp(s, gen_VNMLA_dp, a->vd, a->vn, a->vm, true);
  }
-+static bool trans_VMUL_hp(DisasContext *s, arg_VMUL_sp *a)
+ static void npcm7xx_timer_hold_reset(Object *obj)
-+{
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_hold_reset(Object *obj)
-+    return do_vfp_3op_hp(s, gen_helper_vfp_mulh, a->vd, a->vn, a->vm, false);
+     for (i = 0; i < NPCM7XX_TIMERS_PER_CTRL; i++) {
-+}
+         qemu_irq_lower(s->timer[i].irq);
-+
+     }
- static bool trans_VMUL_sp(DisasContext *s, arg_VMUL_sp *a)
++    qemu_irq_lower(s->watchdog_timer.irq);
  {
      return do_vfp_3op_sp(s, gen_helper_vfp_muls, a->vd, a->vn, a->vm, false);
@@ -XXX,XX +XXX,XX @@ static bool trans_VNMUL_dp(DisasContext *s, arg_VNMUL_dp *a)
      return do_vfp_3op_dp(s, gen_VNMUL_dp, a->vd, a->vn, a->vm, false);
  }
-+static bool trans_VADD_hp(DisasContext *s, arg_VADD_sp *a)
+ static void npcm7xx_timer_realize(DeviceState *dev, Error **errp)
-+{
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_realize(DeviceState *dev, Error **errp)
-+    return do_vfp_3op_hp(s, gen_helper_vfp_addh, a->vd, a->vn, a->vm, false);
+     NPCM7xxTimerCtrlState *s = NPCM7XX_TIMER(dev);
-+}
+     SysBusDevice *sbd = &s->parent;
-+
+     int i;
- static bool trans_VADD_sp(DisasContext *s, arg_VADD_sp *a)
++    NPCM7xxWatchdogTimer *w;
- {
-     return do_vfp_3op_sp(s, gen_helper_vfp_adds, a->vd, a->vn, a->vm, false);
+     for (i = 0; i < NPCM7XX_TIMERS_PER_CTRL; i++) {
-@@ -XXX,XX +XXX,XX @@ static bool trans_VADD_dp(DisasContext *s, arg_VADD_dp *a)
+         NPCM7xxTimer *t = &s->timer[i];
-     return do_vfp_3op_dp(s, gen_helper_vfp_addd, a->vd, a->vn, a->vm, false);
+         t->ctrl = s;
 -        timer_init_ns(&t->qtimer, QEMU_CLOCK_VIRTUAL, npcm7xx_timer_expired, t);
 +        timer_init_ns(&t->base_timer.qtimer, QEMU_CLOCK_VIRTUAL,
 +                npcm7xx_timer_expired, t);
          sysbus_init_irq(sbd, &t->irq);
      }
 +    w = &s->watchdog_timer;
 +    w->ctrl = s;
 +    timer_init_ns(&w->base_timer.qtimer, QEMU_CLOCK_VIRTUAL,
 +            npcm7xx_watchdog_timer_expired, w);
 +    sysbus_init_irq(sbd, &w->irq);
 +
      memory_region_init_io(&s->iomem, OBJECT(s), &npcm7xx_timer_ops, s,
                            TYPE_NPCM7XX_TIMER, 4 * KiB);
      sysbus_init_mmio(sbd, &s->iomem);
 +    qdev_init_gpio_out_named(dev, &w->reset_signal,
 +            NPCM7XX_WATCHDOG_RESET_GPIO_OUT, 1);
  }
-+static bool trans_VSUB_hp(DisasContext *s, arg_VSUB_sp *a)
+-static const VMStateDescription vmstate_npcm7xx_timer = {
-+{
+-    .name = "npcm7xx-timer",
-+    return do_vfp_3op_hp(s, gen_helper_vfp_subh, a->vd, a->vn, a->vm, false);
++static const VMStateDescription vmstate_npcm7xx_base_timer = {
-+}
++    .name = "npcm7xx-base-timer",
-+
+     .version_id = 0,
- static bool trans_VSUB_sp(DisasContext *s, arg_VSUB_sp *a)
+     .minimum_version_id = 0,
- {
+     .fields = (VMStateField[]) {
-     return do_vfp_3op_sp(s, gen_helper_vfp_subs, a->vd, a->vn, a->vm, false);
+-        VMSTATE_TIMER(qtimer, NPCM7xxTimer),
-@@ -XXX,XX +XXX,XX @@ static bool trans_VSUB_dp(DisasContext *s, arg_VSUB_dp *a)
+-        VMSTATE_INT64(expires_ns, NPCM7xxTimer),
-     return do_vfp_3op_dp(s, gen_helper_vfp_subd, a->vd, a->vn, a->vm, false);
+-        VMSTATE_INT64(remaining_ns, NPCM7xxTimer),
- }
++        VMSTATE_TIMER(qtimer, NPCM7xxBaseTimer),
++        VMSTATE_INT64(expires_ns, NPCM7xxBaseTimer),
-+static bool trans_VDIV_hp(DisasContext *s, arg_VDIV_sp *a)
++        VMSTATE_INT64(remaining_ns, NPCM7xxBaseTimer),
-+{
++        VMSTATE_END_OF_LIST(),
-+    return do_vfp_3op_hp(s, gen_helper_vfp_divh, a->vd, a->vn, a->vm, false);
++    },
-+}
++};
 +
- static bool trans_VDIV_sp(DisasContext *s, arg_VDIV_sp *a)
++static const VMStateDescription vmstate_npcm7xx_timer = {
- {
++    .name = "npcm7xx-timer",
-     return do_vfp_3op_sp(s, gen_helper_vfp_divs, a->vd, a->vn, a->vm, false);
++    .version_id = 1,
-@@ -XXX,XX +XXX,XX @@ static bool trans_VDIV_dp(DisasContext *s, arg_VDIV_dp *a)
++    .minimum_version_id = 1,
-     return do_vfp_3op_dp(s, gen_helper_vfp_divd, a->vd, a->vn, a->vm, false);
++    .fields = (VMStateField[]) {
- }
++        VMSTATE_STRUCT(base_timer, NPCM7xxTimer,
++                             0, vmstate_npcm7xx_base_timer,
-+static bool trans_VMINNM_hp(DisasContext *s, arg_VMINNM_sp *a)
++                             NPCM7xxBaseTimer),
-+{
+         VMSTATE_UINT32(tcsr, NPCM7xxTimer),
-+    if (!dc_isar_feature(aa32_vminmaxnm, s)) {
+         VMSTATE_UINT32(ticr, NPCM7xxTimer),
-+        return false;
+         VMSTATE_END_OF_LIST(),
      },
  };
 -static const VMStateDescription vmstate_npcm7xx_timer_ctrl = {
 -    .name = "npcm7xx-timer-ctrl",
 +static const VMStateDescription vmstate_npcm7xx_watchdog_timer = {
 +    .name = "npcm7xx-watchdog-timer",
      .version_id = 0,
      .minimum_version_id = 0,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_STRUCT(base_timer, NPCM7xxWatchdogTimer,
 +                             0, vmstate_npcm7xx_base_timer,
 +                             NPCM7xxBaseTimer),
 +        VMSTATE_UINT32(wtcr, NPCM7xxWatchdogTimer),
 +        VMSTATE_END_OF_LIST(),
 +    },
 +};
 +
 +static const VMStateDescription vmstate_npcm7xx_timer_ctrl = {
 +    .name = "npcm7xx-timer-ctrl",
 +    .version_id = 1,
 +    .minimum_version_id = 1,
      .fields = (VMStateField[]) {
          VMSTATE_UINT32(tisr, NPCM7xxTimerCtrlState),
 -        VMSTATE_UINT32(wtcr, NPCM7xxTimerCtrlState),
          VMSTATE_STRUCT_ARRAY(timer, NPCM7xxTimerCtrlState,
                               NPCM7XX_TIMERS_PER_CTRL, 0, vmstate_npcm7xx_timer,
                               NPCM7xxTimer),
 +        VMSTATE_STRUCT(watchdog_timer, NPCM7xxTimerCtrlState,
 +                             0, vmstate_npcm7xx_watchdog_timer,
 +                             NPCM7xxWatchdogTimer),
          VMSTATE_END_OF_LIST(),
      },
  };
 diff --git a/tests/qtest/npcm7xx_watchdog_timer-test.c b/tests/qtest/npcm7xx_watchdog_timer-test.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/qtest/npcm7xx_watchdog_timer-test.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * QTests for Nuvoton NPCM7xx Timer Watchdog Modules.
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
 + * for more details.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/timer.h"
 +
 +#include "libqos/libqtest.h"
 +#include "qapi/qmp/qdict.h"
 +
 +#define WTCR_OFFSET     0x1c
 +#define REF_HZ          (25000000)
 +
 +/* WTCR bit fields */
 +#define WTCLK(rv)       ((rv) << 10)
 +#define WTE             BIT(7)
 +#define WTIE            BIT(6)
 +#define WTIS(rv)        ((rv) << 4)
 +#define WTIF            BIT(3)
 +#define WTRF            BIT(2)
 +#define WTRE            BIT(1)
 +#define WTR             BIT(0)
 +
 +typedef struct Watchdog {
 +    int irq;
 +    uint64_t base_addr;
 +} Watchdog;
 +
 +static const Watchdog watchdog_list[] = {
 +    {
 +        .irq        = 47,
 +        .base_addr  = 0xf0008000
 +    },
 +    {
 +        .irq        = 48,
 +        .base_addr  = 0xf0009000
 +    },
 +    {
 +        .irq        = 49,
 +        .base_addr  = 0xf000a000
 +    }
-+    return do_vfp_3op_hp(s, gen_helper_vfp_minnumh,
++};
-+                         a->vd, a->vn, a->vm, false);
++
-+}
++static int watchdog_index(const Watchdog *wd)
-+
++{
-+static bool trans_VMAXNM_hp(DisasContext *s, arg_VMAXNM_sp *a)
++    ptrdiff_t diff = wd - watchdog_list;
-+{
++
-+    if (!dc_isar_feature(aa32_vminmaxnm, s)) {
++    g_assert(diff >= 0 && diff < ARRAY_SIZE(watchdog_list));
-+        return false;
++
 +    return diff;
 +}
 +
 +static uint32_t watchdog_read_wtcr(QTestState *qts, const Watchdog *wd)
 +{
 +    return qtest_readl(qts, wd->base_addr + WTCR_OFFSET);
 +}
 +
 +static void watchdog_write_wtcr(QTestState *qts, const Watchdog *wd,
 +        uint32_t value)
 +{
 +    qtest_writel(qts, wd->base_addr + WTCR_OFFSET, value);
 +}
 +
 +static uint32_t watchdog_prescaler(QTestState *qts, const Watchdog *wd)
 +{
 +    switch (extract32(watchdog_read_wtcr(qts, wd), 10, 2)) {
 +    case 0:
 +        return 1;
 +    case 1:
 +        return 256;
 +    case 2:
 +        return 2048;
 +    case 3:
 +        return 65536;
 +    default:
 +        g_assert_not_reached();
 +    }
-+    return do_vfp_3op_hp(s, gen_helper_vfp_maxnumh,
++}
-+                         a->vd, a->vn, a->vm, false);
++
-+}
++static QDict *get_watchdog_action(QTestState *qts)
-+
++{
- static bool trans_VMINNM_sp(DisasContext *s, arg_VMINNM_sp *a)
++    QDict *ev = qtest_qmp_eventwait_ref(qts, "WATCHDOG");
- {
++    QDict *data;
-     if (!dc_isar_feature(aa32_vminmaxnm, s)) {
++
 +    data = qdict_get_qdict(ev, "data");
 +    qobject_ref(data);
 +    qobject_unref(ev);
 +    return data;
 +}
 +
 +#define RESET_CYCLES 1024
 +static uint32_t watchdog_interrupt_cycles(QTestState *qts, const Watchdog *wd)
 +{
 +    uint32_t wtis = extract32(watchdog_read_wtcr(qts, wd), 4, 2);
 +    return 1 << (14 + 2 * wtis);
 +}
 +
 +static int64_t watchdog_calculate_steps(uint32_t count, uint32_t prescale)
 +{
 +    return (NANOSECONDS_PER_SECOND / REF_HZ) * count * prescale;
 +}
 +
 +static int64_t watchdog_interrupt_steps(QTestState *qts, const Watchdog *wd)
 +{
 +    return watchdog_calculate_steps(watchdog_interrupt_cycles(qts, wd),
 +            watchdog_prescaler(qts, wd));
 +}
 +
 +/* Check wtcr can be reset to default value */
 +static void test_init(gconstpointer watchdog)
 +{
 +    const Watchdog *wd = watchdog;
 +    QTestState *qts = qtest_init("-machine quanta-gsj");
 +
 +    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +
 +    watchdog_write_wtcr(qts, wd, WTCLK(1) | WTRF | WTIF | WTR);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(1));
 +
 +    qtest_quit(qts);
 +}
 +
 +/* Check a watchdog can generate interrupt and reset actions */
 +static void test_reset_action(gconstpointer watchdog)
 +{
 +    const Watchdog *wd = watchdog;
 +    QTestState *qts = qtest_init("-machine quanta-gsj");
 +    QDict *ad;
 +
 +    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +
 +    watchdog_write_wtcr(qts, wd,
 +            WTCLK(0) | WTE | WTRF | WTRE | WTIF | WTIE | WTR);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==,
 +            WTCLK(0) | WTE | WTRE | WTIE);
 +
 +    /* Check a watchdog can generate an interrupt */
 +    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==,
 +            WTCLK(0) | WTE | WTIF | WTIE | WTRE);
 +    g_assert_true(qtest_get_irq(qts, wd->irq));
 +
 +    /* Check a watchdog can generate a reset signal */
 +    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
 +                watchdog_prescaler(qts, wd)));
 +    ad = get_watchdog_action(qts);
 +    /* The signal is a reset signal */
 +    g_assert_false(strcmp(qdict_get_str(ad, "action"), "reset"));
 +    qobject_unref(ad);
 +    qtest_qmp_eventwait(qts, "RESET");
 +    /*
 +     * Make sure WTCR is reset to default except for WTRF bit which shouldn't
 +     * be reset.
 +     */
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(1) | WTRF);
 +    qtest_quit(qts);
 +}
 +
 +/* Check a watchdog works with all possible WTCLK prescalers and WTIS cycles */
 +static void test_prescaler(gconstpointer watchdog)
 +{
 +    const Watchdog *wd = watchdog;
 +
 +    for (int wtclk = 0; wtclk < 4; ++wtclk) {
 +        for (int wtis = 0; wtis < 4; ++wtis) {
 +            QTestState *qts = qtest_init("-machine quanta-gsj");
 +
 +            qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +            watchdog_write_wtcr(qts, wd,
 +                    WTCLK(wtclk) | WTE | WTIF | WTIS(wtis) | WTIE | WTR);
 +            /*
 +             * The interrupt doesn't fire until watchdog_interrupt_steps()
 +             * cycles passed
 +             */
 +            qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd) - 1);
 +            g_assert_false(watchdog_read_wtcr(qts, wd) & WTIF);
 +            g_assert_false(qtest_get_irq(qts, wd->irq));
 +            qtest_clock_step(qts, 1);
 +            g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
 +            g_assert_true(qtest_get_irq(qts, wd->irq));
 +
 +            qtest_quit(qts);
 +        }
 +    }
 +}
 +
 +/*
 + * Check a watchdog doesn't fire if corresponding flags (WTIE and WTRE) are not
 + * set.
 + */
 +static void test_enabling_flags(gconstpointer watchdog)
 +{
 +    const Watchdog *wd = watchdog;
 +    QTestState *qts;
 +
 +    /* Neither WTIE or WTRE is set, no interrupt or reset should happen */
 +    qts = qtest_init("-machine quanta-gsj");
 +    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTRF | WTR);
 +    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
 +    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
 +    g_assert_false(qtest_get_irq(qts, wd->irq));
 +    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
 +                watchdog_prescaler(qts, wd)));
 +    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
 +    g_assert_false(watchdog_read_wtcr(qts, wd) & WTRF);
 +    qtest_quit(qts);
 +
 +    /* Only WTIE is set, interrupt is triggered but reset should not happen */
 +    qts = qtest_init("-machine quanta-gsj");
 +    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTIE | WTRF | WTR);
 +    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
 +    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
 +    g_assert_true(qtest_get_irq(qts, wd->irq));
 +    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
 +                watchdog_prescaler(qts, wd)));
 +    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
 +    g_assert_false(watchdog_read_wtcr(qts, wd) & WTRF);
 +    qtest_quit(qts);
 +
 +    /* Only WTRE is set, interrupt is triggered but reset should not happen */
 +    qts = qtest_init("-machine quanta-gsj");
 +    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTRE | WTRF | WTR);
 +    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
 +    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
 +    g_assert_false(qtest_get_irq(qts, wd->irq));
 +    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
 +                watchdog_prescaler(qts, wd)));
 +    g_assert_false(strcmp(qdict_get_str(get_watchdog_action(qts), "action"),
 +                "reset"));
 +    qtest_qmp_eventwait(qts, "RESET");
 +    qtest_quit(qts);
 +
 +    /*
 +     * The case when both flags are set is already tested in
 +     * test_reset_action().
 +     */
 +}
 +
 +/* Check a watchdog can pause and resume by setting WTE bits */
 +static void test_pause(gconstpointer watchdog)
 +{
 +    const Watchdog *wd = watchdog;
 +    QTestState *qts;
 +    int64_t remaining_steps, steps;
 +
 +    qts = qtest_init("-machine quanta-gsj");
 +    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
 +    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTIE | WTRF | WTR);
 +    remaining_steps = watchdog_interrupt_steps(qts, wd);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTE | WTIE);
 +
 +    /* Run for half of the execution period. */
 +    steps = remaining_steps / 2;
 +    remaining_steps -= steps;
 +    qtest_clock_step(qts, steps);
 +
 +    /* Pause the watchdog */
 +    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTIE);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTIE);
 +
 +    /* Run for a long period of time, the watchdog shouldn't fire */
 +    qtest_clock_step(qts, steps << 4);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTIE);
 +    g_assert_false(qtest_get_irq(qts, wd->irq));
 +
 +    /* Resume the watchdog */
 +    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIE);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTE | WTIE);
 +
 +    /* Run for the reset of the execution period, the watchdog should fire */
 +    qtest_clock_step(qts, remaining_steps);
 +    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==,
 +            WTCLK(0) | WTE | WTIF | WTIE);
 +    g_assert_true(qtest_get_irq(qts, wd->irq));
 +
 +    qtest_quit(qts);
 +}
 +
 +static void watchdog_add_test(const char *name, const Watchdog* wd,
 +        GTestDataFunc fn)
 +{
 +    g_autofree char *full_name = g_strdup_printf(
 +            "npcm7xx_watchdog_timer[%d]/%s", watchdog_index(wd), name);
 +    qtest_add_data_func(full_name, wd, fn);
 +}
 +#define add_test(name, td) watchdog_add_test(#name, td, test_##name)
 +
 +int main(int argc, char **argv)
 +{
 +    g_test_init(&argc, &argv, NULL);
 +    g_test_set_nonfatal_assertions();
 +
 +    for (int i = 0; i < ARRAY_SIZE(watchdog_list); ++i) {
 +        const Watchdog *wd = &watchdog_list[i];
 +
 +        add_test(init, wd);
 +        add_test(reset_action, wd);
 +        add_test(prescaler, wd);
 +        add_test(enabling_flags, wd);
 +        add_test(pause, wd);
 +    }
 +
 +    return g_test_run();
 +}
 diff --git a/MAINTAINERS b/MAINTAINERS
 index XXXXXXX..XXXXXXX 100644
 --- a/MAINTAINERS
 +++ b/MAINTAINERS
@@ -XXX,XX +XXX,XX @@ L: qemu-arm@nongnu.org
  S: Supported
  F: hw/*/npcm7xx*
  F: include/hw/*/npcm7xx*
 +F: tests/qtest/npcm7xx*
  F: pc-bios/npcm7xx_bootrom.bin
  F: roms/vbootrom
 diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/qtest/meson.build
 +++ b/tests/qtest/meson.build
@@ -XXX,XX +XXX,XX @@ qtests_sparc64 = \
    (config_all_devices.has_key('CONFIG_ISA_TESTDEV') ? ['endianness-test'] : []) +            \
    ['prom-env-test', 'boot-serial-test']
 -qtests_npcm7xx = ['npcm7xx_timer-test']
 +qtests_npcm7xx = ['npcm7xx_timer-test', 'npcm7xx_watchdog_timer-test']
  qtests_arm = \
    (config_all_devices.has_key('CONFIG_PFLASH_CFI02') ? ['pflash-cfi02-test'] : []) +         \
    (config_all_devices.has_key('CONFIG_NPCM7XX') ? qtests_npcm7xx : []) + \
 --
 .20.1

-[PULL 27/47] target/arm: Implement fp16 for Neon VMAX, VMIN
+[PULL 17/48] hw/misc: Add npcm7xx random number generator
-Convert the Neon float-point VMAX and VMIN insns over to using
+From: Havard Skinnemoen <hskinnemoen@google.com>
 a gvec helper, and use this to implement the fp16 case.
+The RNG module returns a byte of randomness when the Data Valid bit is
+set.
+This implementation ignores the prescaler setting, and loads a new value
+into RNGD every time RNGCS is read while the RNG is enabled and random
+data is available.
+A qtest featuring some simple randomness tests is included.
+Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-29-peter.maydell@linaro.org
 ---
- target/arm/helper.h             | 6 ++++++
+ docs/system/arm/nuvoton.rst    |   2 +-
- target/arm/vec_helper.c         | 6 ++++++
+ include/hw/arm/npcm7xx.h       |   2 +
- target/arm/translate-neon.c.inc | 5 ++---
+ include/hw/misc/npcm7xx_rng.h  |  34 ++++
-files changed, 14 insertions(+), 3 deletions(-)
+ hw/arm/npcm7xx.c               |   7 +-
  hw/misc/npcm7xx_rng.c          | 180 +++++++++++++++++++++
  tests/qtest/npcm7xx_rng-test.c | 278 +++++++++++++++++++++++++++++++++
  hw/misc/meson.build            |   1 +
  hw/misc/trace-events           |   4 +
  tests/qtest/meson.build        |   5 +-
 files changed, 510 insertions(+), 3 deletions(-)
  create mode 100644 include/hw/misc/npcm7xx_rng.h
  create mode 100644 hw/misc/npcm7xx_rng.c
  create mode 100644 tests/qtest/npcm7xx_rng-test.c
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/docs/system/arm/nuvoton.rst b/docs/system/arm/nuvoton.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/docs/system/arm/nuvoton.rst
-+++ b/target/arm/helper.h
++++ b/docs/system/arm/nuvoton.rst
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_facge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ Supported devices
- DEF_HELPER_FLAGS_5(gvec_facgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+  * DDR4 memory controller (dummy interface indicating memory training is done)
- DEF_HELPER_FLAGS_5(gvec_facgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+  * OTP controllers (no protection features)
+  * Flash Interface Unit (FIU; no protection features)
-+DEF_HELPER_FLAGS_5(gvec_fmax_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++ * Random Number Generator (RNG)
-+DEF_HELPER_FLAGS_5(gvec_fmax_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+
+ Missing devices
-+DEF_HELPER_FLAGS_5(gvec_fmin_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ ---------------
-+DEF_HELPER_FLAGS_5(gvec_fmin_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ Missing devices
-+
+  * Peripheral SPI controller (PSPI)
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
+  * Analog to Digital Converter (ADC)
-                    void, ptr, ptr, ptr, ptr, i32)
+  * SD/MMC host
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
+- * Random Number Generator (RNG)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+  * PECI interface
   * Pulse Width Modulation (PWM)
   * Tachometer
 diff --git a/include/hw/arm/npcm7xx.h b/include/hw/arm/npcm7xx.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/include/hw/arm/npcm7xx.h
-+++ b/target/arm/vec_helper.c
++++ b/include/hw/arm/npcm7xx.h
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_facge_s, float32_acge, float32)
+@@ -XXX,XX +XXX,XX @@
- DO_3OP(gvec_facgt_h, float16_acgt, float16)
+ #include "hw/mem/npcm7xx_mc.h"
- DO_3OP(gvec_facgt_s, float32_acgt, float32)
+ #include "hw/misc/npcm7xx_clk.h"
+ #include "hw/misc/npcm7xx_gcr.h"
-+DO_3OP(gvec_fmax_h, float16_max, float16)
++#include "hw/misc/npcm7xx_rng.h"
-+DO_3OP(gvec_fmax_s, float32_max, float32)
+ #include "hw/nvram/npcm7xx_otp.h"
-+
+ #include "hw/timer/npcm7xx_timer.h"
-+DO_3OP(gvec_fmin_h, float16_min, float16)
+ #include "hw/ssi/npcm7xx_fiu.h"
-+DO_3OP(gvec_fmin_s, float32_min, float32)
+@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxState {
-+
+     NPCM7xxOTPState     key_storage;
- #ifdef TARGET_AARCH64
+     NPCM7xxOTPState     fuse_array;
+     NPCM7xxMCState      mc;
- DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
++    NPCM7xxRNGState     rng;
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
+     NPCM7xxFIUState     fiu[2];
  } NPCM7xxState;
 diff --git a/include/hw/misc/npcm7xx_rng.h b/include/hw/misc/npcm7xx_rng.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/include/hw/misc/npcm7xx_rng.h
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Nuvoton NPCM7xx Random Number Generator.
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
 + * for more details.
 + */
 +#ifndef NPCM7XX_RNG_H
 +#define NPCM7XX_RNG_H
 +
 +#include "hw/sysbus.h"
 +
 +typedef struct NPCM7xxRNGState {
 +    SysBusDevice parent;
 +
 +    MemoryRegion iomem;
 +
 +    uint8_t rngcs;
 +    uint8_t rngd;
 +    uint8_t rngmode;
 +} NPCM7xxRNGState;
 +
 +#define TYPE_NPCM7XX_RNG "npcm7xx-rng"
 +#define NPCM7XX_RNG(obj) OBJECT_CHECK(NPCM7xxRNGState, (obj), TYPE_NPCM7XX_RNG)
 +
 +#endif /* NPCM7XX_RNG_H */
 diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.c.inc
+--- a/hw/arm/npcm7xx.c
-+++ b/target/arm/translate-neon.c.inc
++++ b/hw/arm/npcm7xx.c
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VCGE, gen_helper_gvec_fcge_s, gen_helper_gvec_fcge_h)
+@@ -XXX,XX +XXX,XX @@
- DO_3S_FP_GVEC(VCGT, gen_helper_gvec_fcgt_s, gen_helper_gvec_fcgt_h)
+ #define NPCM7XX_GCR_BA          (0xf0800000)
- DO_3S_FP_GVEC(VACGE, gen_helper_gvec_facge_s, gen_helper_gvec_facge_h)
+ #define NPCM7XX_CLK_BA          (0xf0801000)
- DO_3S_FP_GVEC(VACGT, gen_helper_gvec_facgt_s, gen_helper_gvec_facgt_h)
+ #define NPCM7XX_MC_BA           (0xf0824000)
-+DO_3S_FP_GVEC(VMAX, gen_helper_gvec_fmax_s, gen_helper_gvec_fmax_h)
++#define NPCM7XX_RNG_BA          (0xf000b000)
-+DO_3S_FP_GVEC(VMIN, gen_helper_gvec_fmin_s, gen_helper_gvec_fmin_h)
+ /* Internal AHB SRAM */
- /*
+ #define NPCM7XX_RAM3_BA         (0xc0008000)
-  * For all the functions using this macro, size == 1 means fp16,
+@@ -XXX,XX +XXX,XX @@ static void npcm7xx_init(Object *obj)
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VACGT, gen_helper_gvec_facgt_s, gen_helper_gvec_facgt_h)
+     object_initialize_child(obj, "otp2", &s->fuse_array,
-         return do_3same_fp(s, a, FUNC, READS_VD);                   \
+                             TYPE_NPCM7XX_FUSE_ARRAY);
      object_initialize_child(obj, "mc", &s->mc, TYPE_NPCM7XX_MC);
 +    object_initialize_child(obj, "rng", &s->rng, TYPE_NPCM7XX_RNG);
      for (i = 0; i < ARRAY_SIZE(s->tim); i++) {
          object_initialize_child(obj, "tim[*]", &s->tim[i], TYPE_NPCM7XX_TIMER);
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
                         serial_hd(i), DEVICE_LITTLE_ENDIAN);
      }
--DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
++    /* Random Number Generator. Cannot fail. */
--DO_3S_FP(VMIN, gen_helper_vfp_mins, false)
++    sysbus_realize(SYS_BUS_DEVICE(&s->rng), &error_abort);
--
++    sysbus_mmio_map(SYS_BUS_DEVICE(&s->rng), 0, NPCM7XX_RNG_BA);
- static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
++
-                             TCGv_ptr fpstatus)
+     /*
- {
+      * Flash Interface Unit (FIU). Can fail if incorrect number of chip selects
       * specified, but this is a programming error.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
      create_unimplemented_device("npcm7xx.vdmx",         0xe0800000,   4 * KiB);
      create_unimplemented_device("npcm7xx.pcierc",       0xe1000000,  64 * KiB);
      create_unimplemented_device("npcm7xx.kcs",          0xf0007000,   4 * KiB);
 -    create_unimplemented_device("npcm7xx.rng",          0xf000b000,   4 * KiB);
      create_unimplemented_device("npcm7xx.adc",          0xf000c000,   4 * KiB);
      create_unimplemented_device("npcm7xx.gfxi",         0xf000e000,   4 * KiB);
      create_unimplemented_device("npcm7xx.gpio[0]",      0xf0010000,   4 * KiB);
 diff --git a/hw/misc/npcm7xx_rng.c b/hw/misc/npcm7xx_rng.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/misc/npcm7xx_rng.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Nuvoton NPCM7xx Random Number Generator.
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
 + * for more details.
 + */
 +
 +#include "qemu/osdep.h"
 +
 +#include "hw/misc/npcm7xx_rng.h"
 +#include "migration/vmstate.h"
 +#include "qemu/bitops.h"
 +#include "qemu/guest-random.h"
 +#include "qemu/log.h"
 +#include "qemu/module.h"
 +#include "qemu/units.h"
 +
 +#include "trace.h"
 +
 +#define NPCM7XX_RNG_REGS_SIZE   (4 * KiB)
 +
 +#define NPCM7XX_RNGCS           (0x00)
 +#define NPCM7XX_RNGCS_CLKP(rv)      extract32(rv, 2, 4)
 +#define NPCM7XX_RNGCS_DVALID        BIT(1)
 +#define NPCM7XX_RNGCS_RNGE          BIT(0)
 +
 +#define NPCM7XX_RNGD            (0x04)
 +#define NPCM7XX_RNGMODE         (0x08)
 +#define NPCM7XX_RNGMODE_NORMAL      (0x02)
 +
 +static bool npcm7xx_rng_is_enabled(NPCM7xxRNGState *s)
 +{
 +    return (s->rngcs & NPCM7XX_RNGCS_RNGE) &&
 +        (s->rngmode == NPCM7XX_RNGMODE_NORMAL);
 +}
 +
 +static uint64_t npcm7xx_rng_read(void *opaque, hwaddr offset, unsigned size)
 +{
 +    NPCM7xxRNGState *s = opaque;
 +    uint64_t value = 0;
 +
 +    switch (offset) {
 +    case NPCM7XX_RNGCS:
 +        /*
 +         * If the RNG is enabled, but we don't have any valid random data, try
 +         * obtaining some and update the DVALID bit accordingly.
 +         */
 +        if (!npcm7xx_rng_is_enabled(s)) {
 +            s->rngcs &= ~NPCM7XX_RNGCS_DVALID;
 +        } else if (!(s->rngcs & NPCM7XX_RNGCS_DVALID)) {
 +            uint8_t byte = 0;
 +
 +            if (qemu_guest_getrandom(&byte, sizeof(byte), NULL) == 0) {
 +                s->rngd = byte;
 +                s->rngcs |= NPCM7XX_RNGCS_DVALID;
 +            }
 +        }
 +        value = s->rngcs;
 +        break;
 +    case NPCM7XX_RNGD:
 +        if (npcm7xx_rng_is_enabled(s) && s->rngcs & NPCM7XX_RNGCS_DVALID) {
 +            s->rngcs &= ~NPCM7XX_RNGCS_DVALID;
 +            value = s->rngd;
 +            s->rngd = 0;
 +        }
 +        break;
 +    case NPCM7XX_RNGMODE:
 +        value = s->rngmode;
 +        break;
 +
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: read from invalid offset 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, offset);
 +        break;
 +    }
 +
 +    trace_npcm7xx_rng_read(offset, value, size);
 +
 +    return value;
 +}
 +
 +static void npcm7xx_rng_write(void *opaque, hwaddr offset, uint64_t value,
 +                              unsigned size)
 +{
 +    NPCM7xxRNGState *s = opaque;
 +
 +    trace_npcm7xx_rng_write(offset, value, size);
 +
 +    switch (offset) {
 +    case NPCM7XX_RNGCS:
 +        s->rngcs &= NPCM7XX_RNGCS_DVALID;
 +        s->rngcs |= value & ~NPCM7XX_RNGCS_DVALID;
 +        break;
 +    case NPCM7XX_RNGD:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: write to read-only register @ 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, offset);
 +        break;
 +    case NPCM7XX_RNGMODE:
 +        s->rngmode = value;
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: write to invalid offset 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, offset);
 +        break;
 +    }
 +}
 +
 +static const MemoryRegionOps npcm7xx_rng_ops = {
 +    .read = npcm7xx_rng_read,
 +    .write = npcm7xx_rng_write,
 +    .endianness = DEVICE_LITTLE_ENDIAN,
 +    .valid = {
 +        .min_access_size = 1,
 +        .max_access_size = 4,
 +        .unaligned = false,
 +    },
 +};
 +
 +static void npcm7xx_rng_enter_reset(Object *obj, ResetType type)
 +{
 +    NPCM7xxRNGState *s = NPCM7XX_RNG(obj);
 +
 +    s->rngcs = 0;
 +    s->rngd = 0;
 +    s->rngmode = 0;
 +}
 +
 +static void npcm7xx_rng_init(Object *obj)
 +{
 +    NPCM7xxRNGState *s = NPCM7XX_RNG(obj);
 +
 +    memory_region_init_io(&s->iomem, obj, &npcm7xx_rng_ops, s, "regs",
 +                          NPCM7XX_RNG_REGS_SIZE);
 +    sysbus_init_mmio(&s->parent, &s->iomem);
 +}
 +
 +static const VMStateDescription vmstate_npcm7xx_rng = {
 +    .name = "npcm7xx-rng",
 +    .version_id = 0,
 +    .minimum_version_id = 0,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_UINT8(rngcs, NPCM7xxRNGState),
 +        VMSTATE_UINT8(rngd, NPCM7xxRNGState),
 +        VMSTATE_UINT8(rngmode, NPCM7xxRNGState),
 +        VMSTATE_END_OF_LIST(),
 +    },
 +};
 +
 +static void npcm7xx_rng_class_init(ObjectClass *klass, void *data)
 +{
 +    ResettableClass *rc = RESETTABLE_CLASS(klass);
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    dc->desc = "NPCM7xx Random Number Generator";
 +    dc->vmsd = &vmstate_npcm7xx_rng;
 +    rc->phases.enter = npcm7xx_rng_enter_reset;
 +}
 +
 +static const TypeInfo npcm7xx_rng_types[] = {
 +    {
 +        .name = TYPE_NPCM7XX_RNG,
 +        .parent = TYPE_SYS_BUS_DEVICE,
 +        .instance_size = sizeof(NPCM7xxRNGState),
 +        .class_init = npcm7xx_rng_class_init,
 +        .instance_init = npcm7xx_rng_init,
 +    },
 +};
 +DEFINE_TYPES(npcm7xx_rng_types);
 diff --git a/tests/qtest/npcm7xx_rng-test.c b/tests/qtest/npcm7xx_rng-test.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/qtest/npcm7xx_rng-test.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * QTest testcase for the Nuvoton NPCM7xx Random Number Generator
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
 + * for more details.
 + */
 +
 +#include "qemu/osdep.h"
 +
 +#include <math.h>
 +
 +#include "libqtest-single.h"
 +#include "qemu/bitops.h"
 +
 +#define RNG_BASE_ADDR   0xf000b000
 +
 +/* Control and Status Register */
 +#define RNGCS   0x00
 +# define DVALID     BIT(1)  /* Data Valid */
 +# define RNGE       BIT(0)  /* RNG Enable */
 +/* Data Register */
 +#define RNGD    0x04
 +/* Mode Register */
 +#define RNGMODE 0x08
 +# define ROSEL_NORMAL   (2) /* RNG only works in this mode */
 +
 +/* Number of bits to collect for randomness tests. */
 +#define TEST_INPUT_BITS  (128)
 +
 +static void rng_writeb(unsigned int offset, uint8_t value)
 +{
 +    writeb(RNG_BASE_ADDR + offset, value);
 +}
 +
 +static uint8_t rng_readb(unsigned int offset)
 +{
 +    return readb(RNG_BASE_ADDR + offset);
 +}
 +
 +/* Disable RNG and set normal ring oscillator mode. */
 +static void rng_reset(void)
 +{
 +    rng_writeb(RNGCS, 0);
 +    rng_writeb(RNGMODE, ROSEL_NORMAL);
 +}
 +
 +/* Reset RNG and then enable it. */
 +static void rng_reset_enable(void)
 +{
 +    rng_reset();
 +    rng_writeb(RNGCS, RNGE);
 +}
 +
 +/* Wait until Data Valid bit is set. */
 +static bool rng_wait_ready(void)
 +{
 +    /* qemu_guest_getrandom may fail. Assume it won't fail 10 times in a row. */
 +    int retries = 10;
 +
 +    while (retries-- > 0) {
 +        if (rng_readb(RNGCS) & DVALID) {
 +            return true;
 +        }
 +    }
 +
 +    return false;
 +}
 +
 +/*
 + * Perform a frequency (monobit) test, as defined by NIST SP 800-22, on the
 + * sequence in buf and return the P-value. This represents the probability of a
 + * truly random sequence having the same proportion of zeros and ones as the
 + * sequence in buf.
 + *
 + * An RNG which always returns 0x00 or 0xff, or has some bits stuck at 0 or 1,
 + * will fail this test. However, an RNG which always returns 0x55, 0xf0 or some
 + * other value with an equal number of zeroes and ones will pass.
 + */
 +static double calc_monobit_p(const uint8_t *buf, unsigned int len)
 +{
 +    unsigned int i;
 +    double s_obs;
 +    int sn = 0;
 +
 +    for (i = 0; i < len; i++) {
 +        /*
 +         * Each 1 counts as 1, each 0 counts as -1.
 +         * s = cp - (8 - cp) = 2 * cp - 8
 +         */
 +        sn += 2 * ctpop8(buf[i]) - 8;
 +    }
 +
 +    s_obs = abs(sn) / sqrt(len * BITS_PER_BYTE);
 +
 +    return erfc(s_obs / sqrt(2));
 +}
 +
 +/*
 + * Perform a runs test, as defined by NIST SP 800-22, and return the P-value.
 + * This represents the probability of a truly random sequence having the same
 + * number of runs (i.e. uninterrupted sequences of identical bits) as the
 + * sequence in buf.
 + */
 +static double calc_runs_p(const unsigned long *buf, unsigned int nr_bits)
 +{
 +    unsigned int j;
 +    unsigned int k;
 +    int nr_ones = 0;
 +    int vn_obs = 0;
 +    double pi;
 +
 +    g_assert(nr_bits % BITS_PER_LONG == 0);
 +
 +    for (j = 0; j < nr_bits / BITS_PER_LONG; j++) {
 +        nr_ones += __builtin_popcountl(buf[j]);
 +    }
 +    pi = (double)nr_ones / nr_bits;
 +
 +    for (k = 0; k < nr_bits - 1; k++) {
 +        vn_obs += !(test_bit(k, buf) ^ test_bit(k + 1, buf));
 +    }
 +    vn_obs += 1;
 +
 +    return erfc(fabs(vn_obs - 2 * nr_bits * pi * (1.0 - pi))
 +                / (2 * sqrt(2 * nr_bits) * pi * (1.0 - pi)));
 +}
 +
 +/*
 + * Verifies that DVALID is clear, and RNGD reads zero, when RNGE is cleared,
 + * and DVALID eventually becomes set when RNGE is set.
 + */
 +static void test_enable_disable(void)
 +{
 +    /* Disable: DVALID should not be set, and RNGD should read zero */
 +    rng_reset();
 +    g_assert_cmphex(rng_readb(RNGCS), ==, 0);
 +    g_assert_cmphex(rng_readb(RNGD), ==, 0);
 +
 +    /* Enable: DVALID should be set, but we can't make assumptions about RNGD */
 +    rng_writeb(RNGCS, RNGE);
 +    g_assert_true(rng_wait_ready());
 +    g_assert_cmphex(rng_readb(RNGCS), ==, DVALID | RNGE);
 +
 +    /* Disable: DVALID should not be set, and RNGD should read zero */
 +    rng_writeb(RNGCS, 0);
 +    g_assert_cmphex(rng_readb(RNGCS), ==, 0);
 +    g_assert_cmphex(rng_readb(RNGD), ==, 0);
 +}
 +
 +/*
 + * Verifies that the RNG only produces data when RNGMODE is set to 'normal'
 + * ring oscillator mode.
 + */
 +static void test_rosel(void)
 +{
 +    rng_reset_enable();
 +    g_assert_true(rng_wait_ready());
 +    rng_writeb(RNGMODE, 0);
 +    g_assert_false(rng_wait_ready());
 +    rng_writeb(RNGMODE, ROSEL_NORMAL);
 +    g_assert_true(rng_wait_ready());
 +    rng_writeb(RNGMODE, 0);
 +    g_assert_false(rng_wait_ready());
 +}
 +
 +/*
 + * Verifies that a continuous sequence of bits collected after enabling the RNG
 + * satisfies a monobit test.
 + */
 +static void test_continuous_monobit(void)
 +{
 +    uint8_t buf[TEST_INPUT_BITS / BITS_PER_BYTE];
 +    unsigned int i;
 +
 +    rng_reset_enable();
 +    for (i = 0; i < sizeof(buf); i++) {
 +        g_assert_true(rng_wait_ready());
 +        buf[i] = rng_readb(RNGD);
 +    }
 +
 +    g_assert_cmpfloat(calc_monobit_p(buf, sizeof(buf)), >, 0.01);
 +}
 +
 +/*
 + * Verifies that a continuous sequence of bits collected after enabling the RNG
 + * satisfies a runs test.
 + */
 +static void test_continuous_runs(void)
 +{
 +    union {
 +        unsigned long l[TEST_INPUT_BITS / BITS_PER_LONG];
 +        uint8_t c[TEST_INPUT_BITS / BITS_PER_BYTE];
 +    } buf;
 +    unsigned int i;
 +
 +    rng_reset_enable();
 +    for (i = 0; i < sizeof(buf); i++) {
 +        g_assert_true(rng_wait_ready());
 +        buf.c[i] = rng_readb(RNGD);
 +    }
 +
 +    g_assert_cmpfloat(calc_runs_p(buf.l, sizeof(buf) * BITS_PER_BYTE), >, 0.01);
 +}
 +
 +/*
 + * Verifies that the first data byte collected after enabling the RNG satisfies
 + * a monobit test.
 + */
 +static void test_first_byte_monobit(void)
 +{
 +    /* Enable, collect one byte, disable. Repeat until we have 100 bits. */
 +    uint8_t buf[TEST_INPUT_BITS / BITS_PER_BYTE];
 +    unsigned int i;
 +
 +    rng_reset();
 +    for (i = 0; i < sizeof(buf); i++) {
 +        rng_writeb(RNGCS, RNGE);
 +        g_assert_true(rng_wait_ready());
 +        buf[i] = rng_readb(RNGD);
 +        rng_writeb(RNGCS, 0);
 +    }
 +
 +    g_assert_cmpfloat(calc_monobit_p(buf, sizeof(buf)), >, 0.01);
 +}
 +
 +/*
 + * Verifies that the first data byte collected after enabling the RNG satisfies
 + * a runs test.
 + */
 +static void test_first_byte_runs(void)
 +{
 +    /* Enable, collect one byte, disable. Repeat until we have 100 bits. */
 +    union {
 +        unsigned long l[TEST_INPUT_BITS / BITS_PER_LONG];
 +        uint8_t c[TEST_INPUT_BITS / BITS_PER_BYTE];
 +    } buf;
 +    unsigned int i;
 +
 +    rng_reset();
 +    for (i = 0; i < sizeof(buf); i++) {
 +        rng_writeb(RNGCS, RNGE);
 +        g_assert_true(rng_wait_ready());
 +        buf.c[i] = rng_readb(RNGD);
 +        rng_writeb(RNGCS, 0);
 +    }
 +
 +    g_assert_cmpfloat(calc_runs_p(buf.l, sizeof(buf) * BITS_PER_BYTE), >, 0.01);
 +}
 +
 +int main(int argc, char **argv)
 +{
 +    int ret;
 +
 +    g_test_init(&argc, &argv, NULL);
 +    g_test_set_nonfatal_assertions();
 +
 +    qtest_add_func("npcm7xx_rng/enable_disable", test_enable_disable);
 +    qtest_add_func("npcm7xx_rng/rosel", test_rosel);
 +    qtest_add_func("npcm7xx_rng/continuous/monobit", test_continuous_monobit);
 +    qtest_add_func("npcm7xx_rng/continuous/runs", test_continuous_runs);
 +    qtest_add_func("npcm7xx_rng/first_byte/monobit", test_first_byte_monobit);
 +    qtest_add_func("npcm7xx_rng/first_byte/runs", test_first_byte_runs);
 +
 +    qtest_start("-machine npcm750-evb");
 +    ret = g_test_run();
 +    qtest_end();
 +
 +    return ret;
 +}
 diff --git a/hw/misc/meson.build b/hw/misc/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/meson.build
 +++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_MAINSTONE', if_true: files('mst_fpga.c'))
  softmmu_ss.add(when: 'CONFIG_NPCM7XX', if_true: files(
    'npcm7xx_clk.c',
    'npcm7xx_gcr.c',
 +  'npcm7xx_rng.c',
  ))
  softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files(
    'omap_clk.c',
 diff --git a/hw/misc/trace-events b/hw/misc/trace-events
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/trace-events
 +++ b/hw/misc/trace-events
@@ -XXX,XX +XXX,XX @@ npcm7xx_clk_write(uint64_t offset, uint32_t value) "offset: 0x%04" PRIx64 " valu
  npcm7xx_gcr_read(uint64_t offset, uint32_t value) " offset: 0x%04" PRIx64 " value: 0x%08" PRIx32
  npcm7xx_gcr_write(uint64_t offset, uint32_t value) "offset: 0x%04" PRIx64 " value: 0x%08" PRIx32
 +# npcm7xx_rng.c
 +npcm7xx_rng_read(uint64_t offset, uint64_t value, unsigned size) "offset: 0x%04" PRIx64 " value: 0x%02" PRIx64 " size: %u"
 +npcm7xx_rng_write(uint64_t offset, uint64_t value, unsigned size) "offset: 0x%04" PRIx64 " value: 0x%02" PRIx64 " size: %u"
 +
  # stm32f4xx_syscfg.c
  stm32f4xx_syscfg_set_irq(int gpio, int line, int level) "Interupt: GPIO: %d, Line: %d; Level: %d"
  stm32f4xx_pulse_exti(int irq) "Pulse EXTI: %d"
 diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/qtest/meson.build
 +++ b/tests/qtest/meson.build
@@ -XXX,XX +XXX,XX @@ qtests_sparc64 = \
    (config_all_devices.has_key('CONFIG_ISA_TESTDEV') ? ['endianness-test'] : []) +            \
    ['prom-env-test', 'boot-serial-test']
 -qtests_npcm7xx = ['npcm7xx_timer-test', 'npcm7xx_watchdog_timer-test']
 +qtests_npcm7xx = \
 +  ['npcm7xx_rng-test',
 +   'npcm7xx_timer-test',
 +   'npcm7xx_watchdog_timer-test']
  qtests_arm = \
    (config_all_devices.has_key('CONFIG_PFLASH_CFI02') ? ['pflash-cfi02-test'] : []) +         \
    (config_all_devices.has_key('CONFIG_NPCM7XX') ? qtests_npcm7xx : []) + \
 --
 .20.1

-[PULL 33/47] target/arm: Implement fp16 for Neon VRSQRTS
+[PULL 18/48] hw/arm/npcm7xx: Add EHCI and OHCI controllers
-Convert the Neon VRSQRTS insn to using a gvec helper,
+From: Havard Skinnemoen <hskinnemoen@google.com>
 and use this to implement the fp16 case.
-As with VRECPS, we adjust the phrasing of the new implementation
+The NPCM730 and NPCM750 chips have a single USB host port shared between
-slightly so that the fp32 version parallels the fp16 one.
+a USB 2.0 EHCI host controller and a USB 1.1 OHCI host controller. This
 adds support for both of them.
+Testing notes:
+  * With -device usb-kbd, qemu will automatically insert a full-speed
+    hub, and the keyboard becomes controlled by the OHCI controller.
+  * With -device usb-kbd,bus=usb-bus.0,port=1, the keyboard is directly
+    attached to the port without any hubs, and the device becomes
+    controlled by the EHCI controller since it's high speed capable.
+  * With -device usb-kbd,bus=usb-bus.0,port=1,usb_version=1, the
+    keyboard is directly attached to the port, but it only advertises
+    itself as full-speed capable, so it becomes controlled by the OHCI
+    controller.
+In all cases, the keyboard device enumerates correctly.
+Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
+Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
+Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-35-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  4 +++-
+ docs/system/arm/nuvoton.rst |  2 +-
- target/arm/vec_helper.c         | 30 ++++++++++++++++++++++++++++++
+ hw/usb/hcd-ehci.h           |  1 +
- target/arm/vfp_helper.c         | 15 ---------------
+ include/hw/arm/npcm7xx.h    |  4 ++++
- target/arm/translate-neon.c.inc | 21 +--------------------
+ hw/arm/npcm7xx.c            | 27 +++++++++++++++++++++++++--
-files changed, 34 insertions(+), 36 deletions(-)
+ hw/usb/hcd-ehci-sysbus.c    | 19 +++++++++++++++++++
 files changed, 50 insertions(+), 3 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/docs/system/arm/nuvoton.rst b/docs/system/arm/nuvoton.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/docs/system/arm/nuvoton.rst
-+++ b/target/arm/helper.h
++++ b/docs/system/arm/nuvoton.rst
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@ Supported devices
- DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+  * OTP controllers (no protection features)
- DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
+  * Flash Interface Unit (FIU; no protection features)
+  * Random Number Generator (RNG)
--DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
++ * USB host (USBH)
- DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
- DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
+ Missing devices
- DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
+ ---------------
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i3
+@@ -XXX,XX +XXX,XX @@ Missing devices
- DEF_HELPER_FLAGS_5(gvec_recps_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+    * eSPI slave interface
- DEF_HELPER_FLAGS_5(gvec_recps_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+  * Ethernet controllers (GMAC and EMC)
-+DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+- * USB host (USBH)
-+DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+  * USB device (USBD)
   * SMBus controller (SMBF)
   * Peripheral SPI controller (PSPI)
 diff --git a/hw/usb/hcd-ehci.h b/hw/usb/hcd-ehci.h
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/usb/hcd-ehci.h
 +++ b/hw/usb/hcd-ehci.h
@@ -XXX,XX +XXX,XX @@ struct EHCIPCIState {
  #define TYPE_PLATFORM_EHCI "platform-ehci-usb"
  #define TYPE_EXYNOS4210_EHCI "exynos4210-ehci-usb"
  #define TYPE_AW_H3_EHCI "aw-h3-ehci-usb"
 +#define TYPE_NPCM7XX_EHCI "npcm7xx-ehci-usb"
  #define TYPE_TEGRA2_EHCI "tegra2-ehci-usb"
  #define TYPE_PPC4xx_EHCI "ppc4xx-ehci-usb"
  #define TYPE_FUSBH200_EHCI "fusbh200-ehci-usb"
 diff --git a/include/hw/arm/npcm7xx.h b/include/hw/arm/npcm7xx.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/hw/arm/npcm7xx.h
 +++ b/include/hw/arm/npcm7xx.h
@@ -XXX,XX +XXX,XX @@
  #include "hw/nvram/npcm7xx_otp.h"
  #include "hw/timer/npcm7xx_timer.h"
  #include "hw/ssi/npcm7xx_fiu.h"
 +#include "hw/usb/hcd-ehci.h"
 +#include "hw/usb/hcd-ohci.h"
  #include "target/arm/cpu.h"
  #define NPCM7XX_MAX_NUM_CPUS    (2)
@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxState {
      NPCM7xxOTPState     fuse_array;
      NPCM7xxMCState      mc;
      NPCM7xxRNGState     rng;
 +    EHCISysBusState     ehci;
 +    OHCISysBusState     ohci;
      NPCM7xxFIUState     fiu[2];
  } NPCM7xxState;
 diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/npcm7xx.c
 +++ b/hw/arm/npcm7xx.c
@@ -XXX,XX +XXX,XX @@
  #define NPCM7XX_MC_BA           (0xf0824000)
  #define NPCM7XX_RNG_BA          (0xf000b000)
 +/* USB Host modules */
 +#define NPCM7XX_EHCI_BA         (0xf0806000)
 +#define NPCM7XX_OHCI_BA         (0xf0807000)
 +
- DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ /* Internal AHB SRAM */
- DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ #define NPCM7XX_RAM3_BA         (0xc0008000)
+ #define NPCM7XX_RAM3_SZ         (4 * KiB)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ enum NPCM7xxInterrupt {
      NPCM7XX_WDG0_IRQ            = 47,   /* Timer Module 0 Watchdog */
      NPCM7XX_WDG1_IRQ,                   /* Timer Module 1 Watchdog */
      NPCM7XX_WDG2_IRQ,                   /* Timer Module 2 Watchdog */
 +    NPCM7XX_EHCI_IRQ            = 61,
 +    NPCM7XX_OHCI_IRQ            = 62,
  };
  /* Total number of GIC interrupts, including internal Cortex-A9 interrupts. */
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_init(Object *obj)
          object_initialize_child(obj, "tim[*]", &s->tim[i], TYPE_NPCM7XX_TIMER);
      }
 +    object_initialize_child(obj, "ehci", &s->ehci, TYPE_NPCM7XX_EHCI);
 +    object_initialize_child(obj, "ohci", &s->ohci, TYPE_SYSBUS_OHCI);
 +
      QEMU_BUILD_BUG_ON(ARRAY_SIZE(npcm7xx_fiu) != ARRAY_SIZE(s->fiu));
      for (i = 0; i < ARRAY_SIZE(s->fiu); i++) {
          object_initialize_child(obj, npcm7xx_fiu[i].name, &s->fiu[i],
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
      sysbus_realize(SYS_BUS_DEVICE(&s->rng), &error_abort);
      sysbus_mmio_map(SYS_BUS_DEVICE(&s->rng), 0, NPCM7XX_RNG_BA);
 +    /* USB Host */
 +    object_property_set_bool(OBJECT(&s->ehci), "companion-enable", true,
 +                             &error_abort);
 +    sysbus_realize(SYS_BUS_DEVICE(&s->ehci), &error_abort);
 +    sysbus_mmio_map(SYS_BUS_DEVICE(&s->ehci), 0, NPCM7XX_EHCI_BA);
 +    sysbus_connect_irq(SYS_BUS_DEVICE(&s->ehci), 0,
 +                       npcm7xx_irq(s, NPCM7XX_EHCI_IRQ));
 +
 +    object_property_set_str(OBJECT(&s->ohci), "masterbus", "usb-bus.0",
 +                            &error_abort);
 +    object_property_set_uint(OBJECT(&s->ohci), "num-ports", 1, &error_abort);
 +    sysbus_realize(SYS_BUS_DEVICE(&s->ohci), &error_abort);
 +    sysbus_mmio_map(SYS_BUS_DEVICE(&s->ohci), 0, NPCM7XX_OHCI_BA);
 +    sysbus_connect_irq(SYS_BUS_DEVICE(&s->ohci), 0,
 +                       npcm7xx_irq(s, NPCM7XX_OHCI_IRQ));
 +
      /*
       * Flash Interface Unit (FIU). Can fail if incorrect number of chip selects
       * specified, but this is a programming error.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
      create_unimplemented_device("npcm7xx.mcphy",        0xf05f0000,  64 * KiB);
      create_unimplemented_device("npcm7xx.gmac1",        0xf0802000,   8 * KiB);
      create_unimplemented_device("npcm7xx.gmac2",        0xf0804000,   8 * KiB);
 -    create_unimplemented_device("npcm7xx.ehci",         0xf0806000,   4 * KiB);
 -    create_unimplemented_device("npcm7xx.ohci",         0xf0807000,   4 * KiB);
      create_unimplemented_device("npcm7xx.vcd",          0xf0810000,  64 * KiB);
      create_unimplemented_device("npcm7xx.ece",          0xf0820000,   8 * KiB);
      create_unimplemented_device("npcm7xx.vdma",         0xf0822000,   8 * KiB);
 diff --git a/hw/usb/hcd-ehci-sysbus.c b/hw/usb/hcd-ehci-sysbus.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/hw/usb/hcd-ehci-sysbus.c
-+++ b/target/arm/vec_helper.c
++++ b/hw/usb/hcd-ehci-sysbus.c
-@@ -XXX,XX +XXX,XX @@ static float32 float32_recps_nf(float32 op1, float32 op2, float_status *stat)
+@@ -XXX,XX +XXX,XX @@ static const TypeInfo ehci_aw_h3_type_info = {
-     return float32_sub(float32_two, float32_mul(op1, op2, stat), stat);
+     .class_init    = ehci_aw_h3_class_init,
- }
+ };
-+/* Reciprocal square-root step. AArch32 non-fused semantics. */
++static void ehci_npcm7xx_class_init(ObjectClass *oc, void *data)
 +static float16 float16_rsqrts_nf(float16 op1, float16 op2, float_status *stat)
 +{
-+    op1 = float16_squash_input_denormal(op1, stat);
++    SysBusEHCIClass *sec = SYS_BUS_EHCI_CLASS(oc);
-+    op2 = float16_squash_input_denormal(op2, stat);
++    DeviceClass *dc = DEVICE_CLASS(oc);
 +
-+    if ((float16_is_infinity(op1) && float16_is_zero(op2)) ||
++    sec->capsbase = 0x0;
-+        (float16_is_infinity(op2) && float16_is_zero(op1))) {
++    sec->opregbase = 0x10;
-+        return float16_one_point_five;
++    sec->portscbase = 0x44;
-+    }
++    sec->portnr = 1;
-+    op1 = float16_sub(float16_three, float16_mul(op1, op2, stat), stat);
++    set_bit(DEVICE_CATEGORY_USB, dc->categories);
 +    return float16_div(op1, float16_two, stat);
 +}
 +
-+static float32 float32_rsqrts_nf(float32 op1, float32 op2, float_status *stat)
++static const TypeInfo ehci_npcm7xx_type_info = {
-+{
++    .name          = TYPE_NPCM7XX_EHCI,
-+    op1 = float32_squash_input_denormal(op1, stat);
++    .parent        = TYPE_SYS_BUS_EHCI,
-+    op2 = float32_squash_input_denormal(op2, stat);
++    .class_init    = ehci_npcm7xx_class_init,
 +};
 +
-+    if ((float32_is_infinity(op1) && float32_is_zero(op2)) ||
+ static void ehci_tegra2_class_init(ObjectClass *oc, void *data)
 +        (float32_is_infinity(op2) && float32_is_zero(op1))) {
 +        return float32_one_point_five;
 +    }
 +    op1 = float32_sub(float32_three, float32_mul(op1, op2, stat), stat);
 +    return float32_div(op1, float32_two, stat);
 +}
 +
  #define DO_3OP(NAME, FUNC, TYPE) \
  void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
  {                                                                          \
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_fminnum_s, float32_minnum, float32)
  DO_3OP(gvec_recps_nf_h, float16_recps_nf, float16)
  DO_3OP(gvec_recps_nf_s, float32_recps_nf, float32)
 +DO_3OP(gvec_rsqrts_nf_h, float16_rsqrts_nf, float16)
 +DO_3OP(gvec_rsqrts_nf_s, float32_rsqrts_nf, float32)
 +
  #ifdef TARGET_AARCH64
  DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
      return r;
  }
 -float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
 -{
 -    float_status *s = &env->vfp.standard_fp_status;
 -    float32 product;
 -    if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
 -        (float32_is_infinity(b) && float32_is_zero_or_denormal(a))) {
 -        if (!(float32_is_zero(a) || float32_is_zero(b))) {
 -            float_raise(float_flag_input_denormal, s);
 -        }
 -        return float32_one_point_five;
 -    }
 -    product = float32_mul(a, b, s);
 -    return float32_div(float32_sub(float32_three, product, s), float32_two, s);
 -}
 -
  /* NEON helpers.  */
  /* Constants 256 and 512 are used in some helpers; we avoid relying on
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
  DO_3S_FP_GVEC(VFMA, gen_helper_gvec_vfma_s, gen_helper_gvec_vfma_h)
  DO_3S_FP_GVEC(VFMS, gen_helper_gvec_vfms_s, gen_helper_gvec_vfms_h)
  DO_3S_FP_GVEC(VRECPS, gen_helper_gvec_recps_nf_s, gen_helper_gvec_recps_nf_h)
 +DO_3S_FP_GVEC(VRSQRTS, gen_helper_gvec_rsqrts_nf_s, gen_helper_gvec_rsqrts_nf_h)
  WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
  WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VMINNM_fp32_3s);
  }
 -WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
 -
 -static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
 -                              uint32_t rn_ofs, uint32_t rm_ofs,
 -                              uint32_t oprsz, uint32_t maxsz)
 -{
 -    static const GVecGen3 ops = { .fni4 = gen_VRSQRTS_tramp };
 -    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
 -}
 -
 -static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
 -{
 -    if (a->size != 0) {
 -        /* TODO fp16 support */
 -        return false;
 -    }
 -
 -    return do_3same(s, a, gen_VRSQRTS_fp_3s);
 -}
 -
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
-     /* FP operations handled pairwise 32 bits at a time */
+     SysBusEHCIClass *sec = SYS_BUS_EHCI_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void ehci_sysbus_register_types(void)
      type_register_static(&ehci_platform_type_info);
      type_register_static(&ehci_exynos4210_type_info);
      type_register_static(&ehci_aw_h3_type_info);
 +    type_register_static(&ehci_npcm7xx_type_info);
      type_register_static(&ehci_tegra2_type_info);
      type_register_static(&ehci_ppc4xx_type_info);
      type_register_static(&ehci_fusbh200_type_info);
 --
 .20.1

-[PULL 21/47] target/arm: Implement VFP fp16 VMOV between gp and halfprec registers
+[PULL 19/48] hw/gpio: Add GPIO model for Nuvoton NPCM7xx
-Implement the VFP fp16 variant of VMOV that transfers a 16-bit
+From: Havard Skinnemoen <hskinnemoen@google.com>
 value between a general purpose register and a VFP register.
-Note that Rt == 15 is UNPREDICTABLE; since this insn is v8 and later
+The NPCM7xx chips have multiple GPIO controllers that are mostly
-only we have no need to replicate the old "updates CPSR.NZCV"
+identical except for some minor differences like the reset values of
-behaviour that the singleprec version of this insn does.
+some registers. Each controller controls up to 32 pins.
+Each individual pin is modeled as a pair of unnamed GPIOs -- one for
+emitting the actual pin state, and one for driving the pin externally.
+Like the nRF51 GPIO controller, a gpio level may be negative, which
+means the pin is not driven, or floating.
+Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
+Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
+Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-22-peter.maydell@linaro.org
 ---
- target/arm/vfp.decode          |  1 +
+ docs/system/arm/nuvoton.rst     |   2 +-
- target/arm/translate-vfp.c.inc | 34 ++++++++++++++++++++++++++++++++++
+ include/hw/arm/npcm7xx.h        |   2 +
-files changed, 35 insertions(+)
+ include/hw/gpio/npcm7xx_gpio.h  |  55 +++++
  hw/arm/npcm7xx.c                |  80 ++++++
  hw/gpio/npcm7xx_gpio.c          | 424 ++++++++++++++++++++++++++++++++
  tests/qtest/npcm7xx_gpio-test.c | 385 +++++++++++++++++++++++++++++
  hw/gpio/meson.build             |   1 +
  hw/gpio/trace-events            |   7 +
  tests/qtest/meson.build         |   3 +-
 files changed, 957 insertions(+), 2 deletions(-)
  create mode 100644 include/hw/gpio/npcm7xx_gpio.h
  create mode 100644 hw/gpio/npcm7xx_gpio.c
  create mode 100644 tests/qtest/npcm7xx_gpio-test.c
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
+diff --git a/docs/system/arm/nuvoton.rst b/docs/system/arm/nuvoton.rst
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/docs/system/arm/nuvoton.rst
-+++ b/target/arm/vfp.decode
++++ b/docs/system/arm/nuvoton.rst
-@@ -XXX,XX +XXX,XX @@ VDUP         ---- 1110 1 b:1 q:1 0 .... rt:4 1011 . 0 e:1 1 0000 \
+@@ -XXX,XX +XXX,XX @@ Supported devices
-              vn=%vn_dp
+  * Flash Interface Unit (FIU; no protection features)
+  * Random Number Generator (RNG)
- VMSR_VMRS    ---- 1110 111 l:1 reg:4 rt:4 1010 0001 0000
+  * USB host (USBH)
-+VMOV_half    ---- 1110 000 l:1 .... rt:4 1001 . 001 0000    vn=%vn_sp
++ * GPIO controller
- VMOV_single  ---- 1110 000 l:1 .... rt:4 1010 . 001 0000    vn=%vn_sp
+ Missing devices
- VMOV_64_sp   ---- 1100 010 op:1 rt2:4 rt:4 1010 00.1 ....   vm=%vm_sp
+ ---------------
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 - * GPIO controller
   * LPC/eSPI host-to-BMC interface, including
     * Keyboard and mouse controller interface (KBCI)
 diff --git a/include/hw/arm/npcm7xx.h b/include/hw/arm/npcm7xx.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.c.inc
+--- a/include/hw/arm/npcm7xx.h
-+++ b/target/arm/translate-vfp.c.inc
++++ b/include/hw/arm/npcm7xx.h
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
+@@ -XXX,XX +XXX,XX @@
-     return true;
- }
+ #include "hw/boards.h"
+ #include "hw/cpu/a9mpcore.h"
-+static bool trans_VMOV_half(DisasContext *s, arg_VMOV_single *a)
++#include "hw/gpio/npcm7xx_gpio.h"
-+{
+ #include "hw/mem/npcm7xx_mc.h"
-+    TCGv_i32 tmp;
+ #include "hw/misc/npcm7xx_clk.h"
-+
+ #include "hw/misc/npcm7xx_gcr.h"
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxState {
-+        return false;
+     NPCM7xxOTPState     fuse_array;
      NPCM7xxMCState      mc;
      NPCM7xxRNGState     rng;
 +    NPCM7xxGPIOState    gpio[8];
      EHCISysBusState     ehci;
      OHCISysBusState     ohci;
      NPCM7xxFIUState     fiu[2];
 diff --git a/include/hw/gpio/npcm7xx_gpio.h b/include/hw/gpio/npcm7xx_gpio.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/include/hw/gpio/npcm7xx_gpio.h
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Nuvoton NPCM7xx General Purpose Input / Output (GPIO)
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License
 + * version 2 as published by the Free Software Foundation.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
 + * GNU General Public License for more details.
 + */
 +#ifndef NPCM7XX_GPIO_H
 +#define NPCM7XX_GPIO_H
 +
 +#include "exec/memory.h"
 +#include "hw/sysbus.h"
 +
 +/* Number of pins managed by each controller. */
 +#define NPCM7XX_GPIO_NR_PINS (32)
 +
 +/*
 + * Number of registers in our device state structure. Don't change this without
 + * incrementing the version_id in the vmstate.
 + */
 +#define NPCM7XX_GPIO_NR_REGS (0x80 / sizeof(uint32_t))
 +
 +typedef struct NPCM7xxGPIOState {
 +    SysBusDevice parent;
 +
 +    /* Properties to be defined by the SoC */
 +    uint32_t reset_pu;
 +    uint32_t reset_pd;
 +    uint32_t reset_osrc;
 +    uint32_t reset_odsc;
 +
 +    MemoryRegion mmio;
 +
 +    qemu_irq irq;
 +    qemu_irq output[NPCM7XX_GPIO_NR_PINS];
 +
 +    uint32_t pin_level;
 +    uint32_t ext_level;
 +    uint32_t ext_driven;
 +
 +    uint32_t regs[NPCM7XX_GPIO_NR_REGS];
 +} NPCM7xxGPIOState;
 +
 +#define TYPE_NPCM7XX_GPIO "npcm7xx-gpio"
 +#define NPCM7XX_GPIO(obj) \
 +    OBJECT_CHECK(NPCM7xxGPIOState, (obj), TYPE_NPCM7XX_GPIO)
 +
 +#endif /* NPCM7XX_GPIO_H */
 diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/npcm7xx.c
 +++ b/hw/arm/npcm7xx.c
@@ -XXX,XX +XXX,XX @@ enum NPCM7xxInterrupt {
      NPCM7XX_WDG2_IRQ,                   /* Timer Module 2 Watchdog */
      NPCM7XX_EHCI_IRQ            = 61,
      NPCM7XX_OHCI_IRQ            = 62,
 +    NPCM7XX_GPIO0_IRQ           = 116,
 +    NPCM7XX_GPIO1_IRQ,
 +    NPCM7XX_GPIO2_IRQ,
 +    NPCM7XX_GPIO3_IRQ,
 +    NPCM7XX_GPIO4_IRQ,
 +    NPCM7XX_GPIO5_IRQ,
 +    NPCM7XX_GPIO6_IRQ,
 +    NPCM7XX_GPIO7_IRQ,
  };
  /* Total number of GIC interrupts, including internal Cortex-A9 interrupts. */
@@ -XXX,XX +XXX,XX @@ static const hwaddr npcm7xx_fiu3_flash_addr[] = {
 xb8000000, /* CS3 */
  };
 +static const struct {
 +    hwaddr regs_addr;
 +    uint32_t unconnected_pins;
 +    uint32_t reset_pu;
 +    uint32_t reset_pd;
 +    uint32_t reset_osrc;
 +    uint32_t reset_odsc;
 +} npcm7xx_gpio[] = {
 +    {
 +        .regs_addr = 0xf0010000,
 +        .reset_pu = 0xff03ffff,
 +        .reset_pd = 0x00fc0000,
 +    }, {
 +        .regs_addr = 0xf0011000,
 +        .unconnected_pins = 0x0000001e,
 +        .reset_pu = 0xfefffe07,
 +        .reset_pd = 0x010001e0,
 +    }, {
 +        .regs_addr = 0xf0012000,
 +        .reset_pu = 0x780fffff,
 +        .reset_pd = 0x07f00000,
 +        .reset_odsc = 0x00700000,
 +    }, {
 +        .regs_addr = 0xf0013000,
 +        .reset_pu = 0x00fc0000,
 +        .reset_pd = 0xff000000,
 +    }, {
 +        .regs_addr = 0xf0014000,
 +        .reset_pu = 0xffffffff,
 +    }, {
 +        .regs_addr = 0xf0015000,
 +        .reset_pu = 0xbf83f801,
 +        .reset_pd = 0x007c0000,
 +        .reset_osrc = 0x000000f1,
 +        .reset_odsc = 0x3f9f80f1,
 +    }, {
 +        .regs_addr = 0xf0016000,
 +        .reset_pu = 0xfc00f801,
 +        .reset_pd = 0x000007fe,
 +        .reset_odsc = 0x00000800,
 +    }, {
 +        .regs_addr = 0xf0017000,
 +        .unconnected_pins = 0xffffff00,
 +        .reset_pu = 0x0000007f,
 +        .reset_osrc = 0x0000007f,
 +        .reset_odsc = 0x0000007f,
 +    },
 +};
 +
  static const struct {
      const char *name;
      hwaddr regs_addr;
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_init(Object *obj)
          object_initialize_child(obj, "tim[*]", &s->tim[i], TYPE_NPCM7XX_TIMER);
      }
 +    for (i = 0; i < ARRAY_SIZE(s->gpio); i++) {
 +        object_initialize_child(obj, "gpio[*]", &s->gpio[i], TYPE_NPCM7XX_GPIO);
 +    }
 +
-+    if (a->rt == 15) {
+     object_initialize_child(obj, "ehci", &s->ehci, TYPE_NPCM7XX_EHCI);
-+        /* UNPREDICTABLE; we choose to UNDEF */
+     object_initialize_child(obj, "ohci", &s->ohci, TYPE_SYSBUS_OHCI);
-+        return false;
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
      sysbus_realize(SYS_BUS_DEVICE(&s->rng), &error_abort);
      sysbus_mmio_map(SYS_BUS_DEVICE(&s->rng), 0, NPCM7XX_RNG_BA);
 +    /* GPIO modules. Cannot fail. */
 +    QEMU_BUILD_BUG_ON(ARRAY_SIZE(npcm7xx_gpio) != ARRAY_SIZE(s->gpio));
 +    for (i = 0; i < ARRAY_SIZE(s->gpio); i++) {
 +        Object *obj = OBJECT(&s->gpio[i]);
 +
 +        object_property_set_uint(obj, "reset-pullup",
 +                                 npcm7xx_gpio[i].reset_pu, &error_abort);
 +        object_property_set_uint(obj, "reset-pulldown",
 +                                 npcm7xx_gpio[i].reset_pd, &error_abort);
 +        object_property_set_uint(obj, "reset-osrc",
 +                                 npcm7xx_gpio[i].reset_osrc, &error_abort);
 +        object_property_set_uint(obj, "reset-odsc",
 +                                 npcm7xx_gpio[i].reset_odsc, &error_abort);
 +        sysbus_realize(SYS_BUS_DEVICE(obj), &error_abort);
 +        sysbus_mmio_map(SYS_BUS_DEVICE(obj), 0, npcm7xx_gpio[i].regs_addr);
 +        sysbus_connect_irq(SYS_BUS_DEVICE(obj), 0,
 +                           npcm7xx_irq(s, NPCM7XX_GPIO0_IRQ + i));
 +    }
 +
-+    if (!vfp_access_check(s)) {
+     /* USB Host */
-+        return true;
+     object_property_set_bool(OBJECT(&s->ehci), "companion-enable", true,
                               &error_abort);
 diff --git a/hw/gpio/npcm7xx_gpio.c b/hw/gpio/npcm7xx_gpio.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/gpio/npcm7xx_gpio.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Nuvoton NPCM7xx General Purpose Input / Output (GPIO)
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License
 + * version 2 as published by the Free Software Foundation.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
 + * GNU General Public License for more details.
 + */
 +
 +#include "qemu/osdep.h"
 +
 +#include "hw/gpio/npcm7xx_gpio.h"
 +#include "hw/irq.h"
 +#include "hw/qdev-properties.h"
 +#include "migration/vmstate.h"
 +#include "qapi/error.h"
 +#include "qemu/log.h"
 +#include "qemu/module.h"
 +#include "qemu/units.h"
 +#include "trace.h"
 +
 +/* 32-bit register indices. */
 +enum NPCM7xxGPIORegister {
 +    NPCM7XX_GPIO_TLOCK1,
 +    NPCM7XX_GPIO_DIN,
 +    NPCM7XX_GPIO_POL,
 +    NPCM7XX_GPIO_DOUT,
 +    NPCM7XX_GPIO_OE,
 +    NPCM7XX_GPIO_OTYP,
 +    NPCM7XX_GPIO_MP,
 +    NPCM7XX_GPIO_PU,
 +    NPCM7XX_GPIO_PD,
 +    NPCM7XX_GPIO_DBNC,
 +    NPCM7XX_GPIO_EVTYP,
 +    NPCM7XX_GPIO_EVBE,
 +    NPCM7XX_GPIO_OBL0,
 +    NPCM7XX_GPIO_OBL1,
 +    NPCM7XX_GPIO_OBL2,
 +    NPCM7XX_GPIO_OBL3,
 +    NPCM7XX_GPIO_EVEN,
 +    NPCM7XX_GPIO_EVENS,
 +    NPCM7XX_GPIO_EVENC,
 +    NPCM7XX_GPIO_EVST,
 +    NPCM7XX_GPIO_SPLCK,
 +    NPCM7XX_GPIO_MPLCK,
 +    NPCM7XX_GPIO_IEM,
 +    NPCM7XX_GPIO_OSRC,
 +    NPCM7XX_GPIO_ODSC,
 +    NPCM7XX_GPIO_DOS = 0x68 / sizeof(uint32_t),
 +    NPCM7XX_GPIO_DOC,
 +    NPCM7XX_GPIO_OES,
 +    NPCM7XX_GPIO_OEC,
 +    NPCM7XX_GPIO_TLOCK2 = 0x7c / sizeof(uint32_t),
 +    NPCM7XX_GPIO_REGS_END,
 +};
 +
 +#define NPCM7XX_GPIO_REGS_SIZE (4 * KiB)
 +
 +#define NPCM7XX_GPIO_LOCK_MAGIC1 (0xc0defa73)
 +#define NPCM7XX_GPIO_LOCK_MAGIC2 (0xc0de1248)
 +
 +static void npcm7xx_gpio_update_events(NPCM7xxGPIOState *s, uint32_t din_diff)
 +{
 +    uint32_t din_new = s->regs[NPCM7XX_GPIO_DIN];
 +
 +    /* Trigger on high level */
 +    s->regs[NPCM7XX_GPIO_EVST] |= din_new & ~s->regs[NPCM7XX_GPIO_EVTYP];
 +    /* Trigger on both edges */
 +    s->regs[NPCM7XX_GPIO_EVST] |= (din_diff & s->regs[NPCM7XX_GPIO_EVTYP]
 +                                   & s->regs[NPCM7XX_GPIO_EVBE]);
 +    /* Trigger on rising edge */
 +    s->regs[NPCM7XX_GPIO_EVST] |= (din_diff & din_new
 +                                   & s->regs[NPCM7XX_GPIO_EVTYP]);
 +
 +    trace_npcm7xx_gpio_update_events(DEVICE(s)->canonical_path,
 +                                     s->regs[NPCM7XX_GPIO_EVST],
 +                                     s->regs[NPCM7XX_GPIO_EVEN]);
 +    qemu_set_irq(s->irq, !!(s->regs[NPCM7XX_GPIO_EVST]
 +                            & s->regs[NPCM7XX_GPIO_EVEN]));
 +}
 +
 +static void npcm7xx_gpio_update_pins(NPCM7xxGPIOState *s, uint32_t diff)
 +{
 +    uint32_t drive_en;
 +    uint32_t drive_lvl;
 +    uint32_t not_driven;
 +    uint32_t undefined;
 +    uint32_t pin_diff;
 +    uint32_t din_old;
 +
 +    /* Calculate level of each pin driven by GPIO controller. */
 +    drive_lvl = s->regs[NPCM7XX_GPIO_DOUT] ^ s->regs[NPCM7XX_GPIO_POL];
 +    /* If OTYP=1, only drive low (open drain) */
 +    drive_en = s->regs[NPCM7XX_GPIO_OE] & ~(s->regs[NPCM7XX_GPIO_OTYP]
 +                                            & drive_lvl);
 +    /*
 +     * If a pin is driven to opposite levels by the GPIO controller and the
 +     * external driver, the result is undefined.
 +     */
 +    undefined = drive_en & s->ext_driven & (drive_lvl ^ s->ext_level);
 +    if (undefined) {
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: pins have multiple drivers: 0x%" PRIx32 "\n",
 +                      DEVICE(s)->canonical_path, undefined);
 +    }
 +
-+    if (a->l) {
++    not_driven = ~(drive_en | s->ext_driven);
-+        /* VFP to general purpose register */
++    pin_diff = s->pin_level;
-+        tmp = tcg_temp_new_i32();
++
-+        neon_load_reg32(tmp, a->vn);
++    /* Set pins to externally driven level. */
-+        tcg_gen_andi_i32(tmp, tmp, 0xffff);
++    s->pin_level = s->ext_level & s->ext_driven;
-+        store_reg(s, a->rt, tmp);
++    /* Set internally driven pins, ignoring any conflicts. */
-+    } else {
++    s->pin_level |= drive_lvl & drive_en;
-+        /* general purpose register to VFP */
++    /* Pull up undriven pins with internal pull-up enabled. */
-+        tmp = load_reg(s, a->rt);
++    s->pin_level |= not_driven & s->regs[NPCM7XX_GPIO_PU];
-+        tcg_gen_andi_i32(tmp, tmp, 0xffff);
++    /* Pins not driven, pulled up or pulled down are undefined */
-+        neon_store_reg32(tmp, a->vn);
++    undefined |= not_driven & ~(s->regs[NPCM7XX_GPIO_PU]
-+        tcg_temp_free_i32(tmp);
++                                | s->regs[NPCM7XX_GPIO_PD]);
 +
 +    /* If any pins changed state, update the outgoing GPIOs. */
 +    pin_diff ^= s->pin_level;
 +    pin_diff |= undefined & diff;
 +    if (pin_diff) {
 +        int i;
 +
 +        for (i = 0; i < NPCM7XX_GPIO_NR_PINS; i++) {
 +            uint32_t mask = BIT(i);
 +            if (pin_diff & mask) {
 +                int level = (undefined & mask) ? -1 : !!(s->pin_level & mask);
 +                trace_npcm7xx_gpio_set_output(DEVICE(s)->canonical_path,
 +                                              i, level);
 +                qemu_set_irq(s->output[i], level);
 +            }
 +        }
 +    }
 +
-+    return true;
++    /* Calculate new value of DIN after masking and polarity setting. */
-+}
++    din_old = s->regs[NPCM7XX_GPIO_DIN];
-+
++    s->regs[NPCM7XX_GPIO_DIN] = ((s->pin_level & s->regs[NPCM7XX_GPIO_IEM])
- static bool trans_VMOV_single(DisasContext *s, arg_VMOV_single *a)
++                                 ^ s->regs[NPCM7XX_GPIO_POL]);
- {
++
-     TCGv_i32 tmp;
++    /* See if any new events triggered because of all this. */
 +    npcm7xx_gpio_update_events(s, din_old ^ s->regs[NPCM7XX_GPIO_DIN]);
 +}
 +
 +static bool npcm7xx_gpio_is_locked(NPCM7xxGPIOState *s)
 +{
 +    return s->regs[NPCM7XX_GPIO_TLOCK1] == 1;
 +}
 +
 +static uint64_t npcm7xx_gpio_regs_read(void *opaque, hwaddr addr,
 +                                       unsigned int size)
 +{
 +    hwaddr reg = addr / sizeof(uint32_t);
 +    NPCM7xxGPIOState *s = opaque;
 +    uint64_t value = 0;
 +
 +    switch (reg) {
 +    case NPCM7XX_GPIO_TLOCK1 ... NPCM7XX_GPIO_EVEN:
 +    case NPCM7XX_GPIO_EVST ... NPCM7XX_GPIO_ODSC:
 +        value = s->regs[reg];
 +        break;
 +
 +    case NPCM7XX_GPIO_EVENS ... NPCM7XX_GPIO_EVENC:
 +    case NPCM7XX_GPIO_DOS ... NPCM7XX_GPIO_TLOCK2:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: read from write-only register 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, addr);
 +        break;
 +
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: read from invalid offset 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, addr);
 +        break;
 +    }
 +
 +    trace_npcm7xx_gpio_read(DEVICE(s)->canonical_path, addr, value);
 +
 +    return value;
 +}
 +
 +static void npcm7xx_gpio_regs_write(void *opaque, hwaddr addr, uint64_t v,
 +                                    unsigned int size)
 +{
 +    hwaddr reg = addr / sizeof(uint32_t);
 +    NPCM7xxGPIOState *s = opaque;
 +    uint32_t value = v;
 +    uint32_t diff;
 +
 +    trace_npcm7xx_gpio_write(DEVICE(s)->canonical_path, addr, v);
 +
 +    if (npcm7xx_gpio_is_locked(s)) {
 +        switch (reg) {
 +        case NPCM7XX_GPIO_TLOCK1:
 +            if (s->regs[NPCM7XX_GPIO_TLOCK2] == NPCM7XX_GPIO_LOCK_MAGIC2 &&
 +                value == NPCM7XX_GPIO_LOCK_MAGIC1) {
 +                s->regs[NPCM7XX_GPIO_TLOCK1] = 0;
 +                s->regs[NPCM7XX_GPIO_TLOCK2] = 0;
 +            }
 +            break;
 +
 +        case NPCM7XX_GPIO_TLOCK2:
 +            s->regs[reg] = value;
 +            break;
 +
 +        default:
 +            qemu_log_mask(LOG_GUEST_ERROR,
 +                          "%s: write to locked register @ 0x%" HWADDR_PRIx "\n",
 +                          DEVICE(s)->canonical_path, addr);
 +            break;
 +        }
 +
 +        return;
 +    }
 +
 +    diff = s->regs[reg] ^ value;
 +
 +    switch (reg) {
 +    case NPCM7XX_GPIO_TLOCK1:
 +    case NPCM7XX_GPIO_TLOCK2:
 +        s->regs[NPCM7XX_GPIO_TLOCK1] = 1;
 +        s->regs[NPCM7XX_GPIO_TLOCK2] = 0;
 +        break;
 +
 +    case NPCM7XX_GPIO_DIN:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: write to read-only register @ 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, addr);
 +        break;
 +
 +    case NPCM7XX_GPIO_POL:
 +    case NPCM7XX_GPIO_DOUT:
 +    case NPCM7XX_GPIO_OE:
 +    case NPCM7XX_GPIO_OTYP:
 +    case NPCM7XX_GPIO_PU:
 +    case NPCM7XX_GPIO_PD:
 +    case NPCM7XX_GPIO_IEM:
 +        s->regs[reg] = value;
 +        npcm7xx_gpio_update_pins(s, diff);
 +        break;
 +
 +    case NPCM7XX_GPIO_DOS:
 +        s->regs[NPCM7XX_GPIO_DOUT] |= value;
 +        npcm7xx_gpio_update_pins(s, value);
 +        break;
 +    case NPCM7XX_GPIO_DOC:
 +        s->regs[NPCM7XX_GPIO_DOUT] &= ~value;
 +        npcm7xx_gpio_update_pins(s, value);
 +        break;
 +    case NPCM7XX_GPIO_OES:
 +        s->regs[NPCM7XX_GPIO_OE] |= value;
 +        npcm7xx_gpio_update_pins(s, value);
 +        break;
 +    case NPCM7XX_GPIO_OEC:
 +        s->regs[NPCM7XX_GPIO_OE] &= ~value;
 +        npcm7xx_gpio_update_pins(s, value);
 +        break;
 +
 +    case NPCM7XX_GPIO_EVTYP:
 +    case NPCM7XX_GPIO_EVBE:
 +    case NPCM7XX_GPIO_EVEN:
 +        s->regs[reg] = value;
 +        npcm7xx_gpio_update_events(s, 0);
 +        break;
 +
 +    case NPCM7XX_GPIO_EVENS:
 +        s->regs[NPCM7XX_GPIO_EVEN] |= value;
 +        npcm7xx_gpio_update_events(s, 0);
 +        break;
 +    case NPCM7XX_GPIO_EVENC:
 +        s->regs[NPCM7XX_GPIO_EVEN] &= ~value;
 +        npcm7xx_gpio_update_events(s, 0);
 +        break;
 +
 +    case NPCM7XX_GPIO_EVST:
 +        s->regs[reg] &= ~value;
 +        npcm7xx_gpio_update_events(s, 0);
 +        break;
 +
 +    case NPCM7XX_GPIO_MP:
 +    case NPCM7XX_GPIO_DBNC:
 +    case NPCM7XX_GPIO_OSRC:
 +    case NPCM7XX_GPIO_ODSC:
 +        /* Nothing to do; just store the value. */
 +        s->regs[reg] = value;
 +        break;
 +
 +    case NPCM7XX_GPIO_OBL0:
 +    case NPCM7XX_GPIO_OBL1:
 +    case NPCM7XX_GPIO_OBL2:
 +    case NPCM7XX_GPIO_OBL3:
 +        s->regs[reg] = value;
 +        qemu_log_mask(LOG_UNIMP, "%s: Blinking is not implemented\n",
 +                      __func__);
 +        break;
 +
 +    case NPCM7XX_GPIO_SPLCK:
 +    case NPCM7XX_GPIO_MPLCK:
 +        qemu_log_mask(LOG_UNIMP, "%s: Per-pin lock is not implemented\n",
 +                      __func__);
 +        break;
 +
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: write to invalid offset 0x%" HWADDR_PRIx "\n",
 +                      DEVICE(s)->canonical_path, addr);
 +        break;
 +    }
 +}
 +
 +static const MemoryRegionOps npcm7xx_gpio_regs_ops = {
 +    .read = npcm7xx_gpio_regs_read,
 +    .write = npcm7xx_gpio_regs_write,
 +    .endianness = DEVICE_NATIVE_ENDIAN,
 +    .valid = {
 +        .min_access_size = 4,
 +        .max_access_size = 4,
 +        .unaligned = false,
 +    },
 +};
 +
 +static void npcm7xx_gpio_set_input(void *opaque, int line, int level)
 +{
 +    NPCM7xxGPIOState *s = opaque;
 +
 +    trace_npcm7xx_gpio_set_input(DEVICE(s)->canonical_path, line, level);
 +
 +    g_assert(line >= 0 && line < NPCM7XX_GPIO_NR_PINS);
 +
 +    s->ext_driven = deposit32(s->ext_driven, line, 1, level >= 0);
 +    s->ext_level = deposit32(s->ext_level, line, 1, level > 0);
 +
 +    npcm7xx_gpio_update_pins(s, BIT(line));
 +}
 +
 +static void npcm7xx_gpio_enter_reset(Object *obj, ResetType type)
 +{
 +    NPCM7xxGPIOState *s = NPCM7XX_GPIO(obj);
 +
 +    memset(s->regs, 0, sizeof(s->regs));
 +
 +    s->regs[NPCM7XX_GPIO_PU] = s->reset_pu;
 +    s->regs[NPCM7XX_GPIO_PD] = s->reset_pd;
 +    s->regs[NPCM7XX_GPIO_OSRC] = s->reset_osrc;
 +    s->regs[NPCM7XX_GPIO_ODSC] = s->reset_odsc;
 +}
 +
 +static void npcm7xx_gpio_hold_reset(Object *obj)
 +{
 +    NPCM7xxGPIOState *s = NPCM7XX_GPIO(obj);
 +
 +    npcm7xx_gpio_update_pins(s, -1);
 +}
 +
 +static void npcm7xx_gpio_init(Object *obj)
 +{
 +    NPCM7xxGPIOState *s = NPCM7XX_GPIO(obj);
 +    DeviceState *dev = DEVICE(obj);
 +
 +    memory_region_init_io(&s->mmio, obj, &npcm7xx_gpio_regs_ops, s,
 +                          "regs", NPCM7XX_GPIO_REGS_SIZE);
 +    sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->mmio);
 +    sysbus_init_irq(SYS_BUS_DEVICE(obj), &s->irq);
 +
 +    qdev_init_gpio_in(dev, npcm7xx_gpio_set_input, NPCM7XX_GPIO_NR_PINS);
 +    qdev_init_gpio_out(dev, s->output, NPCM7XX_GPIO_NR_PINS);
 +}
 +
 +static const VMStateDescription vmstate_npcm7xx_gpio = {
 +    .name = "npcm7xx-gpio",
 +    .version_id = 0,
 +    .minimum_version_id = 0,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_UINT32(pin_level, NPCM7xxGPIOState),
 +        VMSTATE_UINT32(ext_level, NPCM7xxGPIOState),
 +        VMSTATE_UINT32(ext_driven, NPCM7xxGPIOState),
 +        VMSTATE_UINT32_ARRAY(regs, NPCM7xxGPIOState, NPCM7XX_GPIO_NR_REGS),
 +        VMSTATE_END_OF_LIST(),
 +    },
 +};
 +
 +static Property npcm7xx_gpio_properties[] = {
 +    /* Bit n set => pin n has pullup enabled by default. */
 +    DEFINE_PROP_UINT32("reset-pullup", NPCM7xxGPIOState, reset_pu, 0),
 +    /* Bit n set => pin n has pulldown enabled by default. */
 +    DEFINE_PROP_UINT32("reset-pulldown", NPCM7xxGPIOState, reset_pd, 0),
 +    /* Bit n set => pin n has high slew rate by default. */
 +    DEFINE_PROP_UINT32("reset-osrc", NPCM7xxGPIOState, reset_osrc, 0),
 +    /* Bit n set => pin n has high drive strength by default. */
 +    DEFINE_PROP_UINT32("reset-odsc", NPCM7xxGPIOState, reset_odsc, 0),
 +    DEFINE_PROP_END_OF_LIST(),
 +};
 +
 +static void npcm7xx_gpio_class_init(ObjectClass *klass, void *data)
 +{
 +    ResettableClass *reset = RESETTABLE_CLASS(klass);
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    QEMU_BUILD_BUG_ON(NPCM7XX_GPIO_REGS_END > NPCM7XX_GPIO_NR_REGS);
 +
 +    dc->desc = "NPCM7xx GPIO Controller";
 +    dc->vmsd = &vmstate_npcm7xx_gpio;
 +    reset->phases.enter = npcm7xx_gpio_enter_reset;
 +    reset->phases.hold = npcm7xx_gpio_hold_reset;
 +    device_class_set_props(dc, npcm7xx_gpio_properties);
 +}
 +
 +static const TypeInfo npcm7xx_gpio_types[] = {
 +    {
 +        .name = TYPE_NPCM7XX_GPIO,
 +        .parent = TYPE_SYS_BUS_DEVICE,
 +        .instance_size = sizeof(NPCM7xxGPIOState),
 +        .class_init = npcm7xx_gpio_class_init,
 +        .instance_init = npcm7xx_gpio_init,
 +    },
 +};
 +DEFINE_TYPES(npcm7xx_gpio_types);
 diff --git a/tests/qtest/npcm7xx_gpio-test.c b/tests/qtest/npcm7xx_gpio-test.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tests/qtest/npcm7xx_gpio-test.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * QTest testcase for the Nuvoton NPCM7xx GPIO modules.
 + *
 + * Copyright 2020 Google LLC
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms of the GNU General Public License as published by the
 + * Free Software Foundation; either version 2 of the License, or
 + * (at your option) any later version.
 + *
 + * This program is distributed in the hope that it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
 + * for more details.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "libqtest-single.h"
 +
 +#define NR_GPIO_DEVICES (8)
 +#define GPIO(x)         (0xf0010000 + (x) * 0x1000)
 +#define GPIO_IRQ(x)     (116 + (x))
 +
 +/* GPIO registers */
 +#define GP_N_TLOCK1     0x00
 +#define GP_N_DIN        0x04 /* Data IN */
 +#define GP_N_POL        0x08 /* Polarity */
 +#define GP_N_DOUT       0x0c /* Data OUT */
 +#define GP_N_OE         0x10 /* Output Enable */
 +#define GP_N_OTYP       0x14
 +#define GP_N_MP         0x18
 +#define GP_N_PU         0x1c /* Pull-up */
 +#define GP_N_PD         0x20 /* Pull-down */
 +#define GP_N_DBNC       0x24 /* Debounce */
 +#define GP_N_EVTYP      0x28 /* Event Type */
 +#define GP_N_EVBE       0x2c /* Event Both Edge */
 +#define GP_N_OBL0       0x30
 +#define GP_N_OBL1       0x34
 +#define GP_N_OBL2       0x38
 +#define GP_N_OBL3       0x3c
 +#define GP_N_EVEN       0x40 /* Event Enable */
 +#define GP_N_EVENS      0x44 /* Event Set (enable) */
 +#define GP_N_EVENC      0x48 /* Event Clear (disable) */
 +#define GP_N_EVST       0x4c /* Event Status */
 +#define GP_N_SPLCK      0x50
 +#define GP_N_MPLCK      0x54
 +#define GP_N_IEM        0x58 /* Input Enable */
 +#define GP_N_OSRC       0x5c
 +#define GP_N_ODSC       0x60
 +#define GP_N_DOS        0x68 /* Data OUT Set */
 +#define GP_N_DOC        0x6c /* Data OUT Clear */
 +#define GP_N_OES        0x70 /* Output Enable Set */
 +#define GP_N_OEC        0x74 /* Output Enable Clear */
 +#define GP_N_TLOCK2     0x7c
 +
 +static void gpio_unlock(int n)
 +{
 +    if (readl(GPIO(n) + GP_N_TLOCK1) != 0) {
 +        writel(GPIO(n) + GP_N_TLOCK2, 0xc0de1248);
 +        writel(GPIO(n) + GP_N_TLOCK1, 0xc0defa73);
 +    }
 +}
 +
 +/* Restore the GPIO controller to a sensible default state. */
 +static void gpio_reset(int n)
 +{
 +    gpio_unlock(0);
 +
 +    writel(GPIO(n) + GP_N_EVEN, 0x00000000);
 +    writel(GPIO(n) + GP_N_EVST, 0xffffffff);
 +    writel(GPIO(n) + GP_N_POL, 0x00000000);
 +    writel(GPIO(n) + GP_N_DOUT, 0x00000000);
 +    writel(GPIO(n) + GP_N_OE, 0x00000000);
 +    writel(GPIO(n) + GP_N_OTYP, 0x00000000);
 +    writel(GPIO(n) + GP_N_PU, 0xffffffff);
 +    writel(GPIO(n) + GP_N_PD, 0x00000000);
 +    writel(GPIO(n) + GP_N_IEM, 0xffffffff);
 +}
 +
 +static void test_dout_to_din(void)
 +{
 +    gpio_reset(0);
 +
 +    /* When output is enabled, DOUT should be reflected on DIN. */
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    /* PU and PD shouldn't have any impact on DIN. */
 +    writel(GPIO(0) + GP_N_PU, 0xffff0000);
 +    writel(GPIO(0) + GP_N_PD, 0x0000ffff);
 +    writel(GPIO(0) + GP_N_DOUT, 0x12345678);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0x12345678);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x12345678);
 +}
 +
 +static void test_pullup_pulldown(void)
 +{
 +    gpio_reset(0);
 +
 +    /*
 +     * When output is disabled, and PD is the inverse of PU, PU should be
 +     * reflected on DIN. If PD is not the inverse of PU, the state of DIN is
 +     * undefined, so we don't test that.
 +     */
 +    writel(GPIO(0) + GP_N_OE, 0x00000000);
 +    /* DOUT shouldn't have any impact on DIN. */
 +    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
 +    writel(GPIO(0) + GP_N_PU, 0x23456789);
 +    writel(GPIO(0) + GP_N_PD, ~0x23456789U);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_PU), ==, 0x23456789);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_PD), ==, ~0x23456789U);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x23456789);
 +}
 +
 +static void test_output_enable(void)
 +{
 +    gpio_reset(0);
 +
 +    /*
 +     * With all pins weakly pulled down, and DOUT all-ones, OE should be
 +     * reflected on DIN.
 +     */
 +    writel(GPIO(0) + GP_N_DOUT, 0xffffffff);
 +    writel(GPIO(0) + GP_N_PU, 0x00000000);
 +    writel(GPIO(0) + GP_N_PD, 0xffffffff);
 +    writel(GPIO(0) + GP_N_OE, 0x3456789a);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_OE), ==, 0x3456789a);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x3456789a);
 +
 +    writel(GPIO(0) + GP_N_OEC, 0x00030002);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_OE), ==, 0x34547898);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x34547898);
 +
 +    writel(GPIO(0) + GP_N_OES, 0x0000f001);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_OE), ==, 0x3454f899);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x3454f899);
 +}
 +
 +static void test_open_drain(void)
 +{
 +    gpio_reset(0);
 +
 +    /*
 +     * Upper half of DOUT drives a 1 only if the corresponding bit in OTYP is
 +     * not set. If OTYP is set, DIN is determined by PU/PD. Lower half of
 +     * DOUT always drives a 0 regardless of OTYP; PU/PD have no effect.  When
 +     * OE is 0, output is determined by PU/PD; OTYP has no effect.
 +     */
 +    writel(GPIO(0) + GP_N_OTYP, 0x456789ab);
 +    writel(GPIO(0) + GP_N_OE, 0xf0f0f0f0);
 +    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
 +    writel(GPIO(0) + GP_N_PU, 0xff00ff00);
 +    writel(GPIO(0) + GP_N_PD, 0x00ff00ff);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_OTYP), ==, 0x456789ab);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0xff900f00);
 +}
 +
 +static void test_polarity(void)
 +{
 +    gpio_reset(0);
 +
 +    /*
 +     * In push-pull mode, DIN should reflect DOUT because the signal is
 +     * inverted in both directions.
 +     */
 +    writel(GPIO(0) + GP_N_OTYP, 0x00000000);
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_DOUT, 0x56789abc);
 +    writel(GPIO(0) + GP_N_POL, 0x6789abcd);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_POL), ==, 0x6789abcd);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x56789abc);
 +
 +    /*
 +     * When turning off the drivers, DIN should reflect the inverse of the
 +     * pulled-up lines.
 +     */
 +    writel(GPIO(0) + GP_N_OE, 0x00000000);
 +    writel(GPIO(0) + GP_N_POL, 0xffffffff);
 +    writel(GPIO(0) + GP_N_PU, 0x789abcde);
 +    writel(GPIO(0) + GP_N_PD, ~0x789abcdeU);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, ~0x789abcdeU);
 +
 +    /*
 +     * In open-drain mode, DOUT=1 will appear to drive the pin high (since DIN
 +     * is inverted), while DOUT=0 will leave the pin floating.
 +     */
 +    writel(GPIO(0) + GP_N_OTYP, 0xffffffff);
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_PU, 0xffff0000);
 +    writel(GPIO(0) + GP_N_PD, 0x0000ffff);
 +    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0xff00ffff);
 +}
 +
 +static void test_input_mask(void)
 +{
 +    gpio_reset(0);
 +
 +    /* IEM=0 forces the input to zero before polarity inversion. */
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
 +    writel(GPIO(0) + GP_N_POL, 0xffff0000);
 +    writel(GPIO(0) + GP_N_IEM, 0x87654321);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0xff9a4300);
 +}
 +
 +static void test_temp_lock(void)
 +{
 +    gpio_reset(0);
 +
 +    writel(GPIO(0) + GP_N_DOUT, 0x98765432);
 +
 +    /* Make sure we're unlocked initially. */
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 0);
 +    /* Writing any value to TLOCK1 will lock. */
 +    writel(GPIO(0) + GP_N_TLOCK1, 0);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 1);
 +    writel(GPIO(0) + GP_N_DOUT, 0xa9876543);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0x98765432);
 +    /* Now, try to unlock. */
 +    gpio_unlock(0);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 0);
 +    writel(GPIO(0) + GP_N_DOUT, 0xa9876543);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0xa9876543);
 +
 +    /* Try it again, but write TLOCK2 to lock. */
 +    writel(GPIO(0) + GP_N_TLOCK2, 0);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 1);
 +    writel(GPIO(0) + GP_N_DOUT, 0x98765432);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0xa9876543);
 +    /* Now, try to unlock. */
 +    gpio_unlock(0);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 0);
 +    writel(GPIO(0) + GP_N_DOUT, 0x98765432);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0x98765432);
 +}
 +
 +static void test_events_level(void)
 +{
 +    gpio_reset(0);
 +
 +    writel(GPIO(0) + GP_N_EVTYP, 0x00000000);
 +    writel(GPIO(0) + GP_N_DOUT, 0xba987654);
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_EVST, 0xffffffff);
 +
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0xba987654);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_DOUT, 0x00000000);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0xba987654);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_EVST, 0x00007654);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0xba980000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_EVST, 0xba980000);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +}
 +
 +static void test_events_rising_edge(void)
 +{
 +    gpio_reset(0);
 +
 +    writel(GPIO(0) + GP_N_EVTYP, 0xffffffff);
 +    writel(GPIO(0) + GP_N_EVBE, 0x00000000);
 +    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_EVST, 0xffffffff);
 +
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x0000ff00);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_DOUT, 0x00ff0000);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00ffff00);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_EVST, 0x0000f000);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00ff0f00);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_EVST, 0x00ff0f00);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +}
 +
 +static void test_events_both_edges(void)
 +{
 +    gpio_reset(0);
 +
 +    writel(GPIO(0) + GP_N_EVTYP, 0xffffffff);
 +    writel(GPIO(0) + GP_N_EVBE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
 +    writel(GPIO(0) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(0) + GP_N_EVST, 0xffffffff);
 +
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00ffff00);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_DOUT, 0xef00ff08);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x10ffff08);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_EVST, 0x0000f000);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x10ff0f08);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +    writel(GPIO(0) + GP_N_EVST, 0x10ff0f08);
 +    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
 +}
 +
 +static void test_gpion_irq(gconstpointer test_data)
 +{
 +    intptr_t n = (intptr_t)test_data;
 +
 +    gpio_reset(n);
 +
 +    writel(GPIO(n) + GP_N_EVTYP, 0x00000000);
 +    writel(GPIO(n) + GP_N_DOUT, 0x00000000);
 +    writel(GPIO(n) + GP_N_OE, 0xffffffff);
 +    writel(GPIO(n) + GP_N_EVST, 0xffffffff);
 +    writel(GPIO(n) + GP_N_EVEN, 0x00000000);
 +
 +    /* Trigger an event; interrupts are masked. */
 +    g_assert_cmphex(readl(GPIO(n) + GP_N_EVST), ==, 0x00000000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +    writel(GPIO(n) + GP_N_DOS, 0x00008000);
 +    g_assert_cmphex(readl(GPIO(n) + GP_N_EVST), ==, 0x00008000);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +
 +    /* Unmask all event interrupts; verify that the interrupt fired. */
 +    writel(GPIO(n) + GP_N_EVEN, 0xffffffff);
 +    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +
 +    /* Clear the current bit, set a new bit, irq stays asserted. */
 +    writel(GPIO(n) + GP_N_DOC, 0x00008000);
 +    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +    writel(GPIO(n) + GP_N_DOS, 0x00000200);
 +    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +    writel(GPIO(n) + GP_N_EVST, 0x00008000);
 +    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +
 +    /* Mask/unmask the event that's currently active. */
 +    writel(GPIO(n) + GP_N_EVENC, 0x00000200);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +    writel(GPIO(n) + GP_N_EVENS, 0x00000200);
 +    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +
 +    /* Clear the input and the status bit, irq is deasserted. */
 +    writel(GPIO(n) + GP_N_DOC, 0x00000200);
 +    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +    writel(GPIO(n) + GP_N_EVST, 0x00000200);
 +    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
 +}
 +
 +int main(int argc, char **argv)
 +{
 +    int ret;
 +    int i;
 +
 +    g_test_init(&argc, &argv, NULL);
 +    g_test_set_nonfatal_assertions();
 +
 +    qtest_add_func("/npcm7xx_gpio/dout_to_din", test_dout_to_din);
 +    qtest_add_func("/npcm7xx_gpio/pullup_pulldown", test_pullup_pulldown);
 +    qtest_add_func("/npcm7xx_gpio/output_enable", test_output_enable);
 +    qtest_add_func("/npcm7xx_gpio/open_drain", test_open_drain);
 +    qtest_add_func("/npcm7xx_gpio/polarity", test_polarity);
 +    qtest_add_func("/npcm7xx_gpio/input_mask", test_input_mask);
 +    qtest_add_func("/npcm7xx_gpio/temp_lock", test_temp_lock);
 +    qtest_add_func("/npcm7xx_gpio/events/level", test_events_level);
 +    qtest_add_func("/npcm7xx_gpio/events/rising_edge", test_events_rising_edge);
 +    qtest_add_func("/npcm7xx_gpio/events/both_edges", test_events_both_edges);
 +
 +    for (i = 0; i < NR_GPIO_DEVICES; i++) {
 +        g_autofree char *test_name =
 +            g_strdup_printf("/npcm7xx_gpio/gpio[%d]/irq", i);
 +        qtest_add_data_func(test_name, (void *)(intptr_t)i, test_gpion_irq);
 +    }
 +
 +    qtest_start("-machine npcm750-evb");
 +    qtest_irq_intercept_in(global_qtest, "/machine/soc/a9mpcore/gic");
 +    ret = g_test_run();
 +    qtest_end();
 +
 +    return ret;
 +}
 diff --git a/hw/gpio/meson.build b/hw/gpio/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/gpio/meson.build
 +++ b/hw/gpio/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_PUV3', if_true: files('puv3_gpio.c'))
  softmmu_ss.add(when: 'CONFIG_ZAURUS', if_true: files('zaurus.c'))
  softmmu_ss.add(when: 'CONFIG_IMX', if_true: files('imx_gpio.c'))
 +softmmu_ss.add(when: 'CONFIG_NPCM7XX', if_true: files('npcm7xx_gpio.c'))
  softmmu_ss.add(when: 'CONFIG_NRF51_SOC', if_true: files('nrf51_gpio.c'))
  softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_gpio.c'))
  softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_gpio.c'))
 diff --git a/hw/gpio/trace-events b/hw/gpio/trace-events
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/gpio/trace-events
 +++ b/hw/gpio/trace-events
@@ -XXX,XX +XXX,XX @@
  # See docs/devel/tracing.txt for syntax documentation.
 +# npcm7xx_gpio.c
 +npcm7xx_gpio_read(const char *id, uint64_t offset, uint64_t value) " %s offset: 0x%04" PRIx64 " value 0x%08" PRIx64
 +npcm7xx_gpio_write(const char *id, uint64_t offset, uint64_t value) "%s offset: 0x%04" PRIx64 " value 0x%08" PRIx64
 +npcm7xx_gpio_set_input(const char *id, int32_t line, int32_t level) "%s line: %" PRIi32 " level: %" PRIi32
 +npcm7xx_gpio_set_output(const char *id, int32_t line, int32_t level) "%s line: %" PRIi32 " level: %" PRIi32
 +npcm7xx_gpio_update_events(const char *id, uint32_t evst, uint32_t even) "%s evst: 0x%08" PRIx32 " even: 0x%08" PRIx32
 +
  # nrf51_gpio.c
  nrf51_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PRIx64
  nrf51_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
 diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/qtest/meson.build
 +++ b/tests/qtest/meson.build
@@ -XXX,XX +XXX,XX @@ qtests_sparc64 = \
    ['prom-env-test', 'boot-serial-test']
  qtests_npcm7xx = \
 -  ['npcm7xx_rng-test',
 +  ['npcm7xx_gpio-test',
 +   'npcm7xx_rng-test',
     'npcm7xx_timer-test',
     'npcm7xx_watchdog_timer-test']
  qtests_arm = \
 --
 .20.1

-[PULL 31/47] target/arm: Implement fp16 for Neon fp compare-vs-0
+[PULL 20/48] hw/arm/smmuv3: Set the restoration priority of the vSMMUv3 explicitly
-Convert the neon floating-point vector compare-vs-0 insns VCEQ0,
+From: Zenghui Yu <yuzenghui@huawei.com>
 VCGT0, VCLE0, VCGE0 and VCLT0 to use a gvec helper, and use this to
 implement the fp16 case.
+Ensure the vSMMUv3 will be restored before all PCIe devices so that DMA
+translation can work properly during migration.
+Signed-off-by: Zenghui Yu <yuzenghui@huawei.com>
+Message-id: 20201019091508.197-1-yuzenghui@huawei.com
+Acked-by: Eric Auger <eric.auger@redhat.com>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-33-peter.maydell@linaro.org
 ---
- target/arm/helper.h             | 15 +++++++++++++++
+ hw/arm/smmuv3.c | 1 +
- target/arm/vec_helper.c         | 25 +++++++++++++++++++++++++
+file changed, 1 insertion(+)
  target/arm/translate-neon.c.inc | 33 +++++----------------------------
 files changed, 45 insertions(+), 28 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/smmuv3.c b/hw/arm/smmuv3.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/smmuv3.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/smmuv3.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_smmuv3 = {
- DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     .name = "smmuv3",
- DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     .version_id = 1,
+     .minimum_version_id = 1,
-+DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    .priority = MIG_PRI_IOMMU,
-+DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     .fields = (VMStateField[]) {
-+
+         VMSTATE_UINT32(features, SMMUv3State),
-+DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+         VMSTATE_UINT8(sid_size, SMMUv3State),
 +DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
 +DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 +
  DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
  DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vec_helper.c
 +++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
  DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
  DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
 +#define WRAP_CMP0_FWD(FN, CMPOP, TYPE)                          \
 +    static TYPE TYPE##_##FN##0(TYPE op, float_status *stat)     \
 +    {                                                           \
 +        return TYPE##_##CMPOP(op, TYPE##_zero, stat);           \
 +    }
 +
 +#define WRAP_CMP0_REV(FN, CMPOP, TYPE)                          \
 +    static TYPE TYPE##_##FN##0(TYPE op, float_status *stat)    \
 +    {                                                           \
 +        return TYPE##_##CMPOP(TYPE##_zero, op, stat);           \
 +    }
 +
 +#define DO_2OP_CMP0(FN, CMPOP, DIRN)                    \
 +    WRAP_CMP0_##DIRN(FN, CMPOP, float16)                \
 +    WRAP_CMP0_##DIRN(FN, CMPOP, float32)                \
 +    DO_2OP(gvec_f##FN##0_h, float16_##FN##0, float16)   \
 +    DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)
 +
 +DO_2OP_CMP0(cgt, cgt, FWD)
 +DO_2OP_CMP0(cge, cge, FWD)
 +DO_2OP_CMP0(ceq, ceq, FWD)
 +DO_2OP_CMP0(clt, cgt, REV)
 +DO_2OP_CMP0(cle, cge, REV)
 +
  #undef DO_2OP
 +#undef DO_2OP_CMP0
  /* Floating-point trigonometric starting value.
   * See the ARM ARM pseudocode function FPTrigSMul.
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_2MISC_FP(VCVT_UF, gen_helper_vfp_touizs)
  DO_2MISC_FP_VEC(VRECPE_F, gen_helper_gvec_frecpe_h, gen_helper_gvec_frecpe_s)
  DO_2MISC_FP_VEC(VRSQRTE_F, gen_helper_gvec_frsqrte_h, gen_helper_gvec_frsqrte_s)
 +DO_2MISC_FP_VEC(VCGT0_F, gen_helper_gvec_fcgt0_h, gen_helper_gvec_fcgt0_s)
 +DO_2MISC_FP_VEC(VCGE0_F, gen_helper_gvec_fcge0_h, gen_helper_gvec_fcge0_s)
 +DO_2MISC_FP_VEC(VCEQ0_F, gen_helper_gvec_fceq0_h, gen_helper_gvec_fceq0_s)
 +DO_2MISC_FP_VEC(VCLT0_F, gen_helper_gvec_fclt0_h, gen_helper_gvec_fclt0_s)
 +DO_2MISC_FP_VEC(VCLE0_F, gen_helper_gvec_fcle0_h, gen_helper_gvec_fcle0_s)
  static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
      return do_2misc_fp(s, a, gen_helper_rints_exact);
  }
 -#define WRAP_FP_CMP0_FWD(WRAPNAME, FUNC)                        \
 -    static void WRAPNAME(TCGv_i32 d, TCGv_i32 m, TCGv_ptr fpst) \
 -    {                                                           \
 -        TCGv_i32 zero = tcg_const_i32(0);                       \
 -        FUNC(d, m, zero, fpst);                                 \
 -        tcg_temp_free_i32(zero);                                \
 -    }
 -#define WRAP_FP_CMP0_REV(WRAPNAME, FUNC)                        \
 -    static void WRAPNAME(TCGv_i32 d, TCGv_i32 m, TCGv_ptr fpst) \
 -    {                                                           \
 -        TCGv_i32 zero = tcg_const_i32(0);                       \
 -        FUNC(d, zero, m, fpst);                                 \
 -        tcg_temp_free_i32(zero);                                \
 -    }
 -
 -#define DO_FP_CMP0(INSN, FUNC, REV)                             \
 -    WRAP_FP_CMP0_##REV(gen_##INSN, FUNC)                        \
 -    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
 -    {                                                           \
 -        return do_2misc_fp(s, a, gen_##INSN);                   \
 -    }
 -
 -DO_FP_CMP0(VCGT0_F, gen_helper_neon_cgt_f32, FWD)
 -DO_FP_CMP0(VCGE0_F, gen_helper_neon_cge_f32, FWD)
 -DO_FP_CMP0(VCEQ0_F, gen_helper_neon_ceq_f32, FWD)
 -DO_FP_CMP0(VCLE0_F, gen_helper_neon_cge_f32, REV)
 -DO_FP_CMP0(VCLT0_F, gen_helper_neon_cgt_f32, REV)
 -
  static bool do_vrint(DisasContext *s, arg_2misc *a, int rmode)
  {
      /*
 --
 .20.1

-[PULL 30/47] target/arm: Implement fp16 for Neon VFMA, VMFS
+[PULL 21/48] hw/arm/bcm2836: Restrict BCM283XInfo declaration to C source
-Convert the neon floating-point vector operations VFMA and VFMS
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 to use a gvec helper, and use this to implement the fp16 case.
-This is the last use of do_3same_fp() so we can now delete
+No code out of bcm2836.c uses (or requires) the BCM283XInfo
-that function.
+declarations. Move it locally to the C source file.
+Reviewed-by: Luc Michel <luc.michel@greensocs.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-2-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-32-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  6 +++
+ include/hw/arm/bcm2836.h |  8 --------
- target/arm/vec_helper.c         | 33 +++++++++++-
+ hw/arm/bcm2836.c         | 14 ++++++++++++++
- target/arm/translate-neon.c.inc | 92 +--------------------------------
+files changed, 14 insertions(+), 8 deletions(-)
 files changed, 40 insertions(+), 91 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/arm/bcm2836.h b/include/hw/arm/bcm2836.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/arm/bcm2836.h
-+++ b/target/arm/helper.h
++++ b/include/hw/arm/bcm2836.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ struct BCM283XState {
- DEF_HELPER_FLAGS_5(gvec_fmls_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     BCM2835PeripheralState peripherals;
- DEF_HELPER_FLAGS_5(gvec_fmls_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ };
-+DEF_HELPER_FLAGS_5(gvec_vfma_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-typedef struct BCM283XInfo BCM283XInfo;
-+DEF_HELPER_FLAGS_5(gvec_vfma_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+-
 -struct BCM283XClass {
 -    DeviceClass parent_class;
 -    const BCM283XInfo *info;
 -};
 -
 -
  #endif /* BCM2836_H */
 diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/bcm2836.c
 +++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/arm/raspi_platform.h"
  #include "hw/sysbus.h"
 +typedef struct BCM283XInfo BCM283XInfo;
 +
-+DEF_HELPER_FLAGS_5(gvec_vfms_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++typedef struct BCM283XClass {
-+DEF_HELPER_FLAGS_5(gvec_vfms_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    /*< private >*/
 +    DeviceClass parent_class;
 +    /*< public >*/
 +    const BCM283XInfo *info;
 +} BCM283XClass;
 +
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
+ struct BCM283XInfo {
-                    void, ptr, ptr, ptr, ptr, i32)
+     const char *name;
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
+     const char *cpu_type;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ struct BCM283XInfo {
-index XXXXXXX..XXXXXXX 100644
+     int clusterid;
---- a/target/arm/vec_helper.c
+ };
-+++ b/target/arm/vec_helper.c
-@@ -XXX,XX +XXX,XX @@ static float32 float32_mulsub_nf(float32 dest, float32 op1, float32 op2,
++#define BCM283X_CLASS(klass) \
-     return float32_sub(dest, float32_mul(op1, op2, stat), stat);
++    OBJECT_CLASS_CHECK(BCM283XClass, (klass), TYPE_BCM283X)
- }
++#define BCM283X_GET_CLASS(obj) \
++    OBJECT_GET_CLASS(BCM283XClass, (obj), TYPE_BCM283X)
 -#define DO_MULADD(NAME, FUNC, TYPE) \
 +/* Fused versions; these have the semantics Neon VFMA/VFMS want */
 +static float16 float16_muladd_f(float16 dest, float16 op1, float16 op2,
 +                                float_status *stat)
 +{
 +    return float16_muladd(op1, op2, dest, 0, stat);
 +}
 +
-+static float32 float32_muladd_f(float32 dest, float32 op1, float32 op2,
+ static const BCM283XInfo bcm283x_socs[] = {
-+                                 float_status *stat)
+     {
-+{
+         .name = TYPE_BCM2836,
 +    return float32_muladd(op1, op2, dest, 0, stat);
 +}
 +
 +static float16 float16_mulsub_f(float16 dest, float16 op1, float16 op2,
 +                                 float_status *stat)
 +{
 +    return float16_muladd(float16_chs(op1), op2, dest, 0, stat);
 +}
 +
 +static float32 float32_mulsub_f(float32 dest, float32 op1, float32 op2,
 +                                 float_status *stat)
 +{
 +    return float32_muladd(float32_chs(op1), op2, dest, 0, stat);
 +}
 +
 +#define DO_MULADD(NAME, FUNC, TYPE)                                     \
  void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
  {                                                                          \
      intptr_t i, oprsz = simd_oprsz(desc);                                  \
@@ -XXX,XX +XXX,XX @@ DO_MULADD(gvec_fmla_s, float32_muladd_nf, float32)
  DO_MULADD(gvec_fmls_h, float16_mulsub_nf, float16)
  DO_MULADD(gvec_fmls_s, float32_mulsub_nf, float32)
 +DO_MULADD(gvec_vfma_h, float16_muladd_f, float16)
 +DO_MULADD(gvec_vfma_s, float32_muladd_f, float32)
 +
 +DO_MULADD(gvec_vfms_h, float16_mulsub_f, float16)
 +DO_MULADD(gvec_vfms_s, float32_mulsub_f, float32)
 +
  /* For the indexed ops, SVE applies the index per 128-bit vector segment.
   * For AdvSIMD, there is of course only one such vector segment.
   */
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
  DO_3SAME_VQDMULH(VQDMULH, qdmulh)
  DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
 -static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
 -                        bool reads_vd)
 -{
 -    /*
 -     * FP operations handled elementwise 32 bits at a time.
 -     * If reads_vd is true then the old value of Vd will be
 -     * loaded before calling the callback function. This is
 -     * used for multiply-accumulate type operations.
 -     */
 -    TCGv_i32 tmp, tmp2;
 -    int pass;
 -
 -    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
 -        return false;
 -    }
 -
 -    /* UNDEF accesses to D16-D31 if they don't exist. */
 -    if (!dc_isar_feature(aa32_simd_r32, s) &&
 -        ((a->vd | a->vn | a->vm) & 0x10)) {
 -        return false;
 -    }
 -
 -    if ((a->vn | a->vm | a->vd) & a->q) {
 -        return false;
 -    }
 -
 -    if (!vfp_access_check(s)) {
 -        return true;
 -    }
 -
 -    TCGv_ptr fpstatus = fpstatus_ptr(FPST_STD);
 -    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
 -        tmp = neon_load_reg(a->vn, pass);
 -        tmp2 = neon_load_reg(a->vm, pass);
 -        if (reads_vd) {
 -            TCGv_i32 tmp_rd = neon_load_reg(a->vd, pass);
 -            fn(tmp_rd, tmp, tmp2, fpstatus);
 -            neon_store_reg(a->vd, pass, tmp_rd);
 -            tcg_temp_free_i32(tmp);
 -        } else {
 -            fn(tmp, tmp, tmp2, fpstatus);
 -            neon_store_reg(a->vd, pass, tmp);
 -        }
 -        tcg_temp_free_i32(tmp2);
 -    }
 -    tcg_temp_free_ptr(fpstatus);
 -    return true;
 -}
 -
  #define WRAP_FP_GVEC(WRAPNAME, FPST, FUNC)                              \
      static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
                           uint32_t rn_ofs, uint32_t rm_ofs,              \
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMAX, gen_helper_gvec_fmax_s, gen_helper_gvec_fmax_h)
  DO_3S_FP_GVEC(VMIN, gen_helper_gvec_fmin_s, gen_helper_gvec_fmin_h)
  DO_3S_FP_GVEC(VMLA, gen_helper_gvec_fmla_s, gen_helper_gvec_fmla_h)
  DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
 +DO_3S_FP_GVEC(VFMA, gen_helper_gvec_vfma_s, gen_helper_gvec_vfma_h)
 +DO_3S_FP_GVEC(VFMS, gen_helper_gvec_vfms_s, gen_helper_gvec_vfms_h)
  WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
  WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
@@ -XXX,XX +XXX,XX @@ static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VRSQRTS_fp_3s);
  }
 -static void gen_VFMA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 -                            TCGv_ptr fpstatus)
 -{
 -    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 -}
 -
 -static bool trans_VFMA_fp_3s(DisasContext *s, arg_3same *a)
 -{
 -    if (!dc_isar_feature(aa32_simdfmac, s)) {
 -        return false;
 -    }
 -
 -    if (a->size != 0) {
 -        /* TODO fp16 support */
 -        return false;
 -    }
 -
 -    return do_3same_fp(s, a, gen_VFMA_fp_3s, true);
 -}
 -
 -static void gen_VFMS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 -                            TCGv_ptr fpstatus)
 -{
 -    gen_helper_vfp_negs(vn, vn);
 -    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
 -}
 -
 -static bool trans_VFMS_fp_3s(DisasContext *s, arg_3same *a)
 -{
 -    if (!dc_isar_feature(aa32_simdfmac, s)) {
 -        return false;
 -    }
 -
 -    if (a->size != 0) {
 -        /* TODO fp16 support */
 -        return false;
 -    }
 -
 -    return do_3same_fp(s, a, gen_VFMS_fp_3s, true);
 -}
 -
  static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
  {
      /* FP operations handled pairwise 32 bits at a time */
 --
 .20.1

-[PULL 23/47] target/arm: Implement fp16 for Neon VRECPE, VRSQRTE using gvec
+[PULL 22/48] hw/arm/bcm2836: QOM'ify more by adding class_init() to each SoC type
-We already have gvec helpers for floating point VRECPE and
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-VRQSRTE, so convert the Neon decoder to use them and
-add the fp16 support.
+Remove usage of TypeInfo::class_data. Instead fill the fields in
+the corresponding class_init().
 So far all children use the same values for almost all fields,
 but we are going to add the BCM2711/BCM2838 SoC for the raspi4
 machine which use different fields.
 Reviewed-by: Igor Mammedov <imammedo@redhat.com>
 Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20201024170127.3592182-3-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-25-peter.maydell@linaro.org
 ---
- target/arm/translate-neon.c.inc | 31 +++++++++++++++++++++++++++++--
+ hw/arm/bcm2836.c | 108 ++++++++++++++++++++++-------------------------
-file changed, 29 insertions(+), 2 deletions(-)
+file changed, 51 insertions(+), 57 deletions(-)
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
+diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.c.inc
+--- a/hw/arm/bcm2836.c
-+++ b/target/arm/translate-neon.c.inc
++++ b/hw/arm/bcm2836.c
-@@ -XXX,XX +XXX,XX @@ static bool do_2misc_fp(DisasContext *s, arg_2misc *a,
+@@ -XXX,XX +XXX,XX @@
-         return do_2misc_fp(s, a, FUNC);                         \
+ #include "hw/arm/raspi_platform.h"
  #include "hw/sysbus.h"
 -typedef struct BCM283XInfo BCM283XInfo;
 -
  typedef struct BCM283XClass {
      /*< private >*/
      DeviceClass parent_class;
      /*< public >*/
 -    const BCM283XInfo *info;
 -} BCM283XClass;
 -
 -struct BCM283XInfo {
      const char *name;
      const char *cpu_type;
      hwaddr peri_base; /* Peripheral base address seen by the CPU */
      hwaddr ctrl_base; /* Interrupt controller and mailboxes etc. */
      int clusterid;
 -};
 +} BCM283XClass;
  #define BCM283X_CLASS(klass) \
      OBJECT_CLASS_CHECK(BCM283XClass, (klass), TYPE_BCM283X)
  #define BCM283X_GET_CLASS(obj) \
      OBJECT_GET_CLASS(BCM283XClass, (obj), TYPE_BCM283X)
 -static const BCM283XInfo bcm283x_socs[] = {
 -    {
 -        .name = TYPE_BCM2836,
 -        .cpu_type = ARM_CPU_TYPE_NAME("cortex-a7"),
 -        .peri_base = 0x3f000000,
 -        .ctrl_base = 0x40000000,
 -        .clusterid = 0xf,
 -    },
 -#ifdef TARGET_AARCH64
 -    {
 -        .name = TYPE_BCM2837,
 -        .cpu_type = ARM_CPU_TYPE_NAME("cortex-a53"),
 -        .peri_base = 0x3f000000,
 -        .ctrl_base = 0x40000000,
 -        .clusterid = 0x0,
 -    },
 -#endif
 -};
 -
  static void bcm2836_init(Object *obj)
  {
      BCM283XState *s = BCM283X(obj);
      BCM283XClass *bc = BCM283X_GET_CLASS(obj);
 -    const BCM283XInfo *info = bc->info;
      int n;
      for (n = 0; n < BCM283X_NCPUS; n++) {
          object_initialize_child(obj, "cpu[*]", &s->cpu[n].core,
 -                                info->cpu_type);
 +                                bc->cpu_type);
      }
--DO_2MISC_FP(VRECPE_F, gen_helper_recpe_f32)
+     object_initialize_child(obj, "control", &s->control, TYPE_BCM2836_CONTROL);
--DO_2MISC_FP(VRSQRTE_F, gen_helper_rsqrte_f32)
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
- DO_2MISC_FP(VCVT_FS, gen_helper_vfp_sitos)
+ {
- DO_2MISC_FP(VCVT_FU, gen_helper_vfp_uitos)
+     BCM283XState *s = BCM283X(dev);
- DO_2MISC_FP(VCVT_SF, gen_helper_vfp_tosizs)
+     BCM283XClass *bc = BCM283X_GET_CLASS(dev);
- DO_2MISC_FP(VCVT_UF, gen_helper_vfp_touizs)
+-    const BCM283XInfo *info = bc->info;
+     Object *obj;
-+#define DO_2MISC_FP_VEC(INSN, HFUNC, SFUNC)                             \
+     int n;
-+    static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
-+                           uint32_t rm_ofs,                             \
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
-+                           uint32_t oprsz, uint32_t maxsz)              \
+                               "sd-bus");
-+    {                                                                   \
-+        static gen_helper_gvec_2_ptr * const fns[4] = {                 \
+     sysbus_mmio_map_overlap(SYS_BUS_DEVICE(&s->peripherals), 0,
-+            NULL, HFUNC, SFUNC, NULL,                                   \
+-                            info->peri_base, 1);
-+        };                                                              \
++                            bc->peri_base, 1);
-+        TCGv_ptr fpst;                                                  \
-+        fpst = fpstatus_ptr(vece == MO_16 ? FPST_STD_F16 : FPST_STD);   \
+     /* bcm2836 interrupt controller (and mailboxes, etc.) */
-+        tcg_gen_gvec_2_ptr(rd_ofs, rm_ofs, fpst, oprsz, maxsz, 0,       \
+     if (!sysbus_realize(SYS_BUS_DEVICE(&s->control), errp)) {
-+                           fns[vece]);                                  \
+         return;
-+        tcg_temp_free_ptr(fpst);                                        \
+     }
-+    }                                                                   \
-+    static bool trans_##INSN(DisasContext *s, arg_2misc *a)             \
+-    sysbus_mmio_map(SYS_BUS_DEVICE(&s->control), 0, info->ctrl_base);
-+    {                                                                   \
++    sysbus_mmio_map(SYS_BUS_DEVICE(&s->control), 0, bc->ctrl_base);
-+        if (a->size == MO_16) {                                         \
-+            if (!dc_isar_feature(aa32_fp16_arith, s)) {                 \
+     sysbus_connect_irq(SYS_BUS_DEVICE(&s->peripherals), 0,
-+                return false;                                           \
+         qdev_get_gpio_in_named(DEVICE(&s->control), "gpu-irq", 0));
-+            }                                                           \
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
-+        } else if (a->size != MO_32) {                                  \
-+            return false;                                               \
+     for (n = 0; n < BCM283X_NCPUS; n++) {
-+        }                                                               \
+         /* TODO: this should be converted to a property of ARM_CPU */
-+        return do_2misc_vec(s, a, gen_##INSN);                          \
+-        s->cpu[n].core.mp_affinity = (info->clusterid << 8) | n;
-+    }
++        s->cpu[n].core.mp_affinity = (bc->clusterid << 8) | n;
          /* set periphbase/CBAR value for CPU-local registers */
          if (!object_property_set_int(OBJECT(&s->cpu[n].core), "reset-cbar",
 -                                     info->peri_base, errp)) {
 +                                     bc->peri_base, errp)) {
              return;
          }
@@ -XXX,XX +XXX,XX @@ static Property bcm2836_props[] = {
  static void bcm283x_class_init(ObjectClass *oc, void *data)
  {
      DeviceClass *dc = DEVICE_CLASS(oc);
 -    BCM283XClass *bc = BCM283X_CLASS(oc);
 -    bc->info = data;
 -    dc->realize = bcm2836_realize;
 -    device_class_set_props(dc, bcm2836_props);
      /* Reason: Must be wired up in code (see raspi_init() function) */
      dc->user_creatable = false;
  }
 -static const TypeInfo bcm283x_type_info = {
 -    .name = TYPE_BCM283X,
 -    .parent = TYPE_DEVICE,
 -    .instance_size = sizeof(BCM283XState),
 -    .instance_init = bcm2836_init,
 -    .class_size = sizeof(BCM283XClass),
 -    .abstract = true,
 +static void bcm2836_class_init(ObjectClass *oc, void *data)
 +{
 +    DeviceClass *dc = DEVICE_CLASS(oc);
 +    BCM283XClass *bc = BCM283X_CLASS(oc);
 +
-+DO_2MISC_FP_VEC(VRECPE_F, gen_helper_gvec_frecpe_h, gen_helper_gvec_frecpe_s)
++    bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a7");
-+DO_2MISC_FP_VEC(VRSQRTE_F, gen_helper_gvec_frsqrte_h, gen_helper_gvec_frsqrte_s)
++    bc->peri_base = 0x3f000000;
 +    bc->ctrl_base = 0x40000000;
 +    bc->clusterid = 0xf;
 +    dc->realize = bcm2836_realize;
 +    device_class_set_props(dc, bcm2836_props);
  };
 -static void bcm2836_register_types(void)
 +#ifdef TARGET_AARCH64
 +static void bcm2837_class_init(ObjectClass *oc, void *data)
  {
 -    int i;
 +    DeviceClass *dc = DEVICE_CLASS(oc);
 +    BCM283XClass *bc = BCM283X_CLASS(oc);
 -    type_register_static(&bcm283x_type_info);
 -    for (i = 0; i < ARRAY_SIZE(bcm283x_socs); i++) {
 -        TypeInfo ti = {
 -            .name = bcm283x_socs[i].name,
 -            .parent = TYPE_BCM283X,
 -            .class_init = bcm283x_class_init,
 -            .class_data = (void *) &bcm283x_socs[i],
 -        };
 -        type_register(&ti);
 +    bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a53");
 +    bc->peri_base = 0x3f000000;
 +    bc->ctrl_base = 0x40000000;
 +    bc->clusterid = 0x0;
 +    dc->realize = bcm2836_realize;
 +    device_class_set_props(dc, bcm2836_props);
 +};
 +#endif
 +
- static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
++static const TypeInfo bcm283x_types[] = {
- {
++    {
-     if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
++        .name           = TYPE_BCM2836,
 +        .parent         = TYPE_BCM283X,
 +        .class_init     = bcm2836_class_init,
 +#ifdef TARGET_AARCH64
 +    }, {
 +        .name           = TYPE_BCM2837,
 +        .parent         = TYPE_BCM283X,
 +        .class_init     = bcm2837_class_init,
 +#endif
 +    }, {
 +        .name           = TYPE_BCM283X,
 +        .parent         = TYPE_DEVICE,
 +        .instance_size  = sizeof(BCM283XState),
 +        .instance_init  = bcm2836_init,
 +        .class_size     = sizeof(BCM283XClass),
 +        .class_init     = bcm283x_class_init,
 +        .abstract       = true,
      }
 -}
 +};
 -type_init(bcm2836_register_types)
 +DEFINE_TYPES(bcm283x_types)
 --
 .20.1

-[PULL 29/47] target/arm: Implement fp16 for Neon VMLA, VMLS operations
+[PULL 23/48] hw/arm/bcm2836: Introduce BCM283XClass::core_count
-Convert the Neon floating-point VMLA and VMLS insns over to using a
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 gvec helper, and use this to implement the fp16 case.
+The BCM2835 has only one core. Introduce the core_count field to
+be able to use values different than BCM283X_NCPUS (4).
+Reviewed-by: Luc Michel <luc.michel@greensocs.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-4-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-31-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  6 +++++
+ hw/arm/bcm2836.c | 5 ++++-
- target/arm/vec_helper.c         | 42 +++++++++++++++++++++++++++++++++
+file changed, 4 insertions(+), 1 deletion(-)
  target/arm/translate-neon.c.inc | 33 ++------------------------
 files changed, 50 insertions(+), 31 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/bcm2836.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/bcm2836.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i3
+@@ -XXX,XX +XXX,XX @@ typedef struct BCM283XClass {
- DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     /*< public >*/
- DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     const char *name;
+     const char *cpu_type;
-+DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    unsigned core_count;
-+DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     hwaddr peri_base; /* Peripheral base address seen by the CPU */
-+
+     hwaddr ctrl_base; /* Interrupt controller and mailboxes etc. */
-+DEF_HELPER_FLAGS_5(gvec_fmls_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     int clusterid;
-+DEF_HELPER_FLAGS_5(gvec_fmls_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
-+
+     BCM283XClass *bc = BCM283X_GET_CLASS(obj);
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
+     int n;
-                    void, ptr, ptr, ptr, ptr, i32)
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
+-    for (n = 0; n < BCM283X_NCPUS; n++) {
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++    for (n = 0; n < bc->core_count; n++) {
-index XXXXXXX..XXXXXXX 100644
+         object_initialize_child(obj, "cpu[*]", &s->cpu[n].core,
---- a/target/arm/vec_helper.c
+                                 bc->cpu_type);
-+++ b/target/arm/vec_helper.c
+     }
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_rsqrts_d, helper_rsqrtsf_f64, float64)
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_class_init(ObjectClass *oc, void *data)
- #endif
+     BCM283XClass *bc = BCM283X_CLASS(oc);
- #undef DO_3OP
+     bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a7");
-+/* Non-fused multiply-add (unlike float16_muladd etc, which are fused) */
++    bc->core_count = BCM283X_NCPUS;
-+static float16 float16_muladd_nf(float16 dest, float16 op1, float16 op2,
+     bc->peri_base = 0x3f000000;
-+                                 float_status *stat)
+     bc->ctrl_base = 0x40000000;
-+{
+     bc->clusterid = 0xf;
-+    return float16_add(dest, float16_mul(op1, op2, stat), stat);
+@@ -XXX,XX +XXX,XX @@ static void bcm2837_class_init(ObjectClass *oc, void *data)
-+}
+     BCM283XClass *bc = BCM283X_CLASS(oc);
-+
-+static float32 float32_muladd_nf(float32 dest, float32 op1, float32 op2,
+     bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a53");
-+                                 float_status *stat)
++    bc->core_count = BCM283X_NCPUS;
-+{
+     bc->peri_base = 0x3f000000;
-+    return float32_add(dest, float32_mul(op1, op2, stat), stat);
+     bc->ctrl_base = 0x40000000;
-+}
+     bc->clusterid = 0x0;
 +
 +static float16 float16_mulsub_nf(float16 dest, float16 op1, float16 op2,
 +                                 float_status *stat)
 +{
 +    return float16_sub(dest, float16_mul(op1, op2, stat), stat);
 +}
 +
 +static float32 float32_mulsub_nf(float32 dest, float32 op1, float32 op2,
 +                                 float_status *stat)
 +{
 +    return float32_sub(dest, float32_mul(op1, op2, stat), stat);
 +}
 +
 +#define DO_MULADD(NAME, FUNC, TYPE) \
 +void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 +{                                                                          \
 +    intptr_t i, oprsz = simd_oprsz(desc);                                  \
 +    TYPE *d = vd, *n = vn, *m = vm;                                        \
 +    for (i = 0; i < oprsz / sizeof(TYPE); i++) {                           \
 +        d[i] = FUNC(d[i], n[i], m[i], stat);                               \
 +    }                                                                      \
 +    clear_tail(d, oprsz, simd_maxsz(desc));                                \
 +}
 +
 +DO_MULADD(gvec_fmla_h, float16_muladd_nf, float16)
 +DO_MULADD(gvec_fmla_s, float32_muladd_nf, float32)
 +
 +DO_MULADD(gvec_fmls_h, float16_mulsub_nf, float16)
 +DO_MULADD(gvec_fmls_s, float32_mulsub_nf, float32)
 +
  /* For the indexed ops, SVE applies the index per 128-bit vector segment.
   * For AdvSIMD, there is of course only one such vector segment.
   */
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VACGE, gen_helper_gvec_facge_s, gen_helper_gvec_facge_h)
  DO_3S_FP_GVEC(VACGT, gen_helper_gvec_facgt_s, gen_helper_gvec_facgt_h)
  DO_3S_FP_GVEC(VMAX, gen_helper_gvec_fmax_s, gen_helper_gvec_fmax_h)
  DO_3S_FP_GVEC(VMIN, gen_helper_gvec_fmin_s, gen_helper_gvec_fmin_h)
 -
 -/*
 - * For all the functions using this macro, size == 1 means fp16,
 - * which is an architecture extension we don't implement yet.
 - */
 -#define DO_3S_FP(INSN,FUNC,READS_VD)                                \
 -    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
 -    {                                                               \
 -        if (a->size != 0) {                                         \
 -            /* TODO fp16 support */                                 \
 -            return false;                                           \
 -        }                                                           \
 -        return do_3same_fp(s, a, FUNC, READS_VD);                   \
 -    }
 -
 -static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 -                            TCGv_ptr fpstatus)
 -{
 -    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
 -    gen_helper_vfp_adds(vd, vd, vn, fpstatus);
 -}
 -
 -static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
 -                            TCGv_ptr fpstatus)
 -{
 -    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
 -    gen_helper_vfp_subs(vd, vd, vn, fpstatus);
 -}
 -
 -DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
 -DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
 +DO_3S_FP_GVEC(VMLA, gen_helper_gvec_fmla_s, gen_helper_gvec_fmla_h)
 +DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
  WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
  WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
 --
 .20.1

-[PULL 22/47] target/arm: Implement FP16 for Neon VADD, VSUB, VABD, VMUL
+[PULL 24/48] hw/arm/bcm2836: Only provide "enabled-cpus" property to multicore SoCs
-Implement FP16 support for the Neon insns which use the DO_3S_FP_GVEC
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 macro: VADD, VSUB, VABD, VMUL.
-For VABD this requires us to implement a new gvec_fabd_h helper
+It makes no sense to set enabled-cpus=0 on single core SoCs.
 using the machinery we have already for the other helpers.
+Reviewed-by: Luc Michel <luc.michel@greensocs.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-5-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-24-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  1 +
+ hw/arm/bcm2836.c | 15 +++++++--------
- target/arm/vec_helper.c         |  6 ++++++
+file changed, 7 insertions(+), 8 deletions(-)
  target/arm/translate-neon.c.inc | 36 +++++++++++++++++----------------
 files changed, 26 insertions(+), 17 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/bcm2836.c
-+++ b/target/arm/helper.h
++++ b/hw/arm/bcm2836.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ typedef struct BCM283XClass {
- DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ #define BCM283X_GET_CLASS(obj) \
- DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     OBJECT_GET_CLASS(BCM283XClass, (obj), TYPE_BCM283X)
-+DEF_HELPER_FLAGS_5(gvec_fabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++static Property bcm2836_enabled_cores_property =
- DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    DEFINE_PROP_UINT32("enabled-cpus", BCM283XState, enabled_cpus, 0);
++
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
+ static void bcm2836_init(Object *obj)
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
+ {
-index XXXXXXX..XXXXXXX 100644
+     BCM283XState *s = BCM283X(obj);
---- a/target/arm/vec_helper.c
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
-+++ b/target/arm/vec_helper.c
+         object_initialize_child(obj, "cpu[*]", &s->cpu[n].core,
-@@ -XXX,XX +XXX,XX @@ static float64 float64_ftsmul(float64 op1, uint64_t op2, float_status *stat)
+                                 bc->cpu_type);
-     return result;
+     }
 +    if (bc->core_count > 1) {
 +        qdev_property_add_static(DEVICE(obj), &bcm2836_enabled_cores_property);
 +        qdev_prop_set_uint32(DEVICE(obj), "enabled-cpus", bc->core_count);
 +    }
      object_initialize_child(obj, "control", &s->control, TYPE_BCM2836_CONTROL);
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
      }
  }
-+static float16 float16_abd(float16 op1, float16 op2, float_status *stat)
+-static Property bcm2836_props[] = {
-+{
+-    DEFINE_PROP_UINT32("enabled-cpus", BCM283XState, enabled_cpus,
-+    return float16_abs(float16_sub(op1, op2, stat));
+-                       BCM283X_NCPUS),
-+}
+-    DEFINE_PROP_END_OF_LIST()
-+
+-};
- static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
+-
  static void bcm283x_class_init(ObjectClass *oc, void *data)
  {
-     return float32_abs(float32_sub(op1, op2, stat));
+     DeviceClass *dc = DEVICE_CLASS(oc);
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_h, float16_ftsmul, float16)
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_class_init(ObjectClass *oc, void *data)
- DO_3OP(gvec_ftsmul_s, float32_ftsmul, float32)
+     bc->ctrl_base = 0x40000000;
- DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
+     bc->clusterid = 0xf;
+     dc->realize = bcm2836_realize;
-+DO_3OP(gvec_fabd_h, float16_abd, float16)
+-    device_class_set_props(dc, bcm2836_props);
- DO_3OP(gvec_fabd_s, float32_abd, float32)
+ };
  #ifdef TARGET_AARCH64
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
+@@ -XXX,XX +XXX,XX @@ static void bcm2837_class_init(ObjectClass *oc, void *data)
-index XXXXXXX..XXXXXXX 100644
+     bc->ctrl_base = 0x40000000;
---- a/target/arm/translate-neon.c.inc
+     bc->clusterid = 0x0;
-+++ b/target/arm/translate-neon.c.inc
+     dc->realize = bcm2836_realize;
-@@ -XXX,XX +XXX,XX @@ static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
+-    device_class_set_props(dc, bcm2836_props);
-     return true;
+ };
- }
+ #endif
 -/*
 - * For all the functions using this macro, size == 1 means fp16,
 - * which is an architecture extension we don't implement yet.
 - */
 -#define DO_3S_FP_GVEC(INSN,FUNC)                                        \
 -    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
 -                                uint32_t rn_ofs, uint32_t rm_ofs,       \
 -                                uint32_t oprsz, uint32_t maxsz)         \
 +#define WRAP_FP_GVEC(WRAPNAME, FPST, FUNC)                              \
 +    static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
 +                         uint32_t rn_ofs, uint32_t rm_ofs,              \
 +                         uint32_t oprsz, uint32_t maxsz)                \
      {                                                                   \
 -        TCGv_ptr fpst = fpstatus_ptr(FPST_STD);                         \
 +        TCGv_ptr fpst = fpstatus_ptr(FPST);                             \
          tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpst,                \
                             oprsz, maxsz, 0, FUNC);                      \
          tcg_temp_free_ptr(fpst);                                        \
 -    }                                                                   \
 +    }
 +
 +#define DO_3S_FP_GVEC(INSN,SFUNC,HFUNC)                                 \
 +    WRAP_FP_GVEC(gen_##INSN##_fp32_3s, FPST_STD, SFUNC)                 \
 +    WRAP_FP_GVEC(gen_##INSN##_fp16_3s, FPST_STD_F16, HFUNC)             \
      static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a)     \
      {                                                                   \
          if (a->size != 0) {                                             \
 -            /* TODO fp16 support */                                     \
 -            return false;                                               \
 +            if (!dc_isar_feature(aa32_fp16_arith, s)) {                 \
 +                return false;                                           \
 +            }                                                           \
 +            return do_3same(s, a, gen_##INSN##_fp16_3s);                \
          }                                                               \
 -        return do_3same(s, a, gen_##INSN##_3s);                         \
 +        return do_3same(s, a, gen_##INSN##_fp32_3s);                    \
      }
 -DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
 -DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
 -DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
 -DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
 +DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s, gen_helper_gvec_fadd_h)
 +DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s, gen_helper_gvec_fsub_h)
 +DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s, gen_helper_gvec_fabd_h)
 +DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
  /*
   * For all the functions using this macro, size == 1 means fp16,
 --
 .20.1

-[PULL 43/47] target/arm: Implement fp16 for Neon VMUL, VMLA, VMLS
+[PULL 25/48] hw/arm/bcm2836: Split out common realize() code
-Convert the Neon floating-point VMUL, VMLA and VMLS to use gvec,
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 and use this to implement fp16 support.
+The realize() function is clearly composed of two parts,
+each described by a comment:
+  void realize()
+  {
+     /* common peripherals from bcm2835 */
+     ...
+     /* bcm2836 interrupt controller (and mailboxes, etc.) */
+     ...
+   }
+Split the two part, so we can reuse the common part with other
+SoCs from this family.
+Reviewed-by: Luc Michel <luc.michel@greensocs.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-6-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-45-peter.maydell@linaro.org
 ---
- target/arm/translate-neon.c.inc | 114 ++++++++++++++++----------------
+ hw/arm/bcm2836.c | 22 ++++++++++++++++++----
-file changed, 57 insertions(+), 57 deletions(-)
+file changed, 18 insertions(+), 4 deletions(-)
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
+diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.c.inc
+--- a/hw/arm/bcm2836.c
-+++ b/target/arm/translate-neon.c.inc
++++ b/hw/arm/bcm2836.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMLS_2sc(DisasContext *s, arg_2scalar *a)
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
-     return do_2scalar(s, a, opfn[a->size], accfn[a->size]);
+         qdev_prop_set_uint32(DEVICE(obj), "enabled-cpus", bc->core_count);
      }
 -    object_initialize_child(obj, "control", &s->control, TYPE_BCM2836_CONTROL);
 +    if (bc->ctrl_base) {
 +        object_initialize_child(obj, "control", &s->control,
 +                                TYPE_BCM2836_CONTROL);
 +    }
      object_initialize_child(obj, "peripherals", &s->peripherals,
                              TYPE_BCM2835_PERIPHERALS);
@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
                                "vcram-size");
  }
--/*
+-static void bcm2836_realize(DeviceState *dev, Error **errp)
-- * Rather than have a float-specific version of do_2scalar just for
++static bool bcm283x_common_realize(DeviceState *dev, Error **errp)
-- * three insns, we wrap a NeonGenTwoSingleOpFn to turn it into
+ {
-- * a NeonGenTwoOpFn.
+     BCM283XState *s = BCM283X(dev);
-- */
+     BCM283XClass *bc = BCM283X_GET_CLASS(dev);
--#define WRAP_FP_FN(WRAPNAME, FUNC)                              \
+     Object *obj;
--    static void WRAPNAME(TCGv_i32 rd, TCGv_i32 rn, TCGv_i32 rm) \
+-    int n;
--    {                                                           \
--        TCGv_ptr fpstatus = fpstatus_ptr(FPST_STD);             \
+     /* common peripherals from bcm2835 */
--        FUNC(rd, rn, rm, fpstatus);                             \
--        tcg_temp_free_ptr(fpstatus);                            \
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
-+static bool do_2scalar_fp_vec(DisasContext *s, arg_2scalar *a,
+     object_property_add_const_link(OBJECT(&s->peripherals), "ram", obj);
-+                              gen_helper_gvec_3_ptr *fn)
-+{
+     if (!sysbus_realize(SYS_BUS_DEVICE(&s->peripherals), errp)) {
-+    /* Two registers and a scalar, using gvec */
+-        return;
 +    int vec_size = a->q ? 16 : 8;
 +    int rd_ofs = neon_reg_offset(a->vd, 0);
 +    int rn_ofs = neon_reg_offset(a->vn, 0);
 +    int rm_ofs;
 +    int idx;
 +    TCGv_ptr fpstatus;
 +
 +    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
 +        return false;
      }
--WRAP_FP_FN(gen_VMUL_F_mul, gen_helper_vfp_muls)
+     object_property_add_alias(OBJECT(s), "sd-bus", OBJECT(&s->peripherals),
--WRAP_FP_FN(gen_VMUL_F_add, gen_helper_vfp_adds)
+@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
--WRAP_FP_FN(gen_VMUL_F_sub, gen_helper_vfp_subs)
-+    /* UNDEF accesses to D16-D31 if they don't exist. */
+     sysbus_mmio_map_overlap(SYS_BUS_DEVICE(&s->peripherals), 0,
-+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+                             bc->peri_base, 1);
-+        ((a->vd | a->vn | a->vm) & 0x10)) {
++    return true;
-+        return false;
++}
 +
 +static void bcm2836_realize(DeviceState *dev, Error **errp)
 +{
 +    BCM283XState *s = BCM283X(dev);
 +    BCM283XClass *bc = BCM283X_GET_CLASS(dev);
 +    int n;
 +
 +    if (!bcm283x_common_realize(dev, errp)) {
 +        return;
 +    }
--static bool trans_VMUL_F_2sc(DisasContext *s, arg_2scalar *a)
+     /* bcm2836 interrupt controller (and mailboxes, etc.) */
--{
+     if (!sysbus_realize(SYS_BUS_DEVICE(&s->control), errp)) {
 -    static NeonGenTwoOpFn * const opfn[] = {
 -        NULL,
 -        NULL, /* TODO: fp16 support */
 -        gen_VMUL_F_mul,
 -        NULL,
 -    };
 +    if (!fn) {
 +        /* Bad size (including size == 3, which is a different insn group) */
 +        return false;
 +    }
 -    return do_2scalar(s, a, opfn[a->size], NULL);
 +    if (a->q && ((a->vd | a->vn) & 1)) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    /* a->vm is M:Vm, which encodes both register and index */
 +    idx = extract32(a->vm, a->size + 2, 2);
 +    a->vm = extract32(a->vm, 0, a->size + 2);
 +    rm_ofs = neon_reg_offset(a->vm, 0);
 +
 +    fpstatus = fpstatus_ptr(a->size == 1 ? FPST_STD_F16 : FPST_STD);
 +    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpstatus,
 +                       vec_size, vec_size, idx, fn);
 +    tcg_temp_free_ptr(fpstatus);
 +    return true;
  }
 -static bool trans_VMLA_F_2sc(DisasContext *s, arg_2scalar *a)
 -{
 -    static NeonGenTwoOpFn * const opfn[] = {
 -        NULL,
 -        NULL, /* TODO: fp16 support */
 -        gen_VMUL_F_mul,
 -        NULL,
 -    };
 -    static NeonGenTwoOpFn * const accfn[] = {
 -        NULL,
 -        NULL, /* TODO: fp16 support */
 -        gen_VMUL_F_add,
 -        NULL,
 -    };
 +#define DO_VMUL_F_2sc(NAME, FUNC)                                       \
 +    static bool trans_##NAME##_F_2sc(DisasContext *s, arg_2scalar *a)   \
 +    {                                                                   \
 +        static gen_helper_gvec_3_ptr * const opfn[] = {                 \
 +            NULL,                                                       \
 +            gen_helper_##FUNC##_h,                                      \
 +            gen_helper_##FUNC##_s,                                      \
 +            NULL,                                                       \
 +        };                                                              \
 +        if (a->size == MO_16 && !dc_isar_feature(aa32_fp16_arith, s)) { \
 +            return false;                                               \
 +        }                                                               \
 +        return do_2scalar_fp_vec(s, a, opfn[a->size]);                  \
 +    }
 -    return do_2scalar(s, a, opfn[a->size], accfn[a->size]);
 -}
 -
 -static bool trans_VMLS_F_2sc(DisasContext *s, arg_2scalar *a)
 -{
 -    static NeonGenTwoOpFn * const opfn[] = {
 -        NULL,
 -        NULL, /* TODO: fp16 support */
 -        gen_VMUL_F_mul,
 -        NULL,
 -    };
 -    static NeonGenTwoOpFn * const accfn[] = {
 -        NULL,
 -        NULL, /* TODO: fp16 support */
 -        gen_VMUL_F_sub,
 -        NULL,
 -    };
 -
 -    return do_2scalar(s, a, opfn[a->size], accfn[a->size]);
 -}
 +DO_VMUL_F_2sc(VMUL, gvec_fmul_idx)
 +DO_VMUL_F_2sc(VMLA, gvec_fmla_nf_idx)
 +DO_VMUL_F_2sc(VMLS, gvec_fmls_nf_idx)
  WRAP_ENV_FN(gen_VQDMULH_16, gen_helper_neon_qdmulh_s16)
  WRAP_ENV_FN(gen_VQDMULH_32, gen_helper_neon_qdmulh_s32)
 --
 .20.1

-[PULL 12/47] target/arm: Implement VFP fp16 VCVT between float and integer
+[PULL 26/48] hw/arm/bcm2836: Introduce the BCM2835 SoC
-Implement the fp16 versions of the VFP VCVT instruction forms which
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 convert between floating point and integer.
+Reviewed-by: Luc Michel <luc.michel@greensocs.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-7-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-13-peter.maydell@linaro.org
 ---
- target/arm/vfp.decode          |  4 +++
+ include/hw/arm/bcm2836.h |  1 +
- target/arm/translate-vfp.c.inc | 65 ++++++++++++++++++++++++++++++++++
+ hw/arm/bcm2836.c         | 34 ++++++++++++++++++++++++++++++++++
-files changed, 69 insertions(+)
+ hw/arm/raspi.c           |  2 ++
 files changed, 37 insertions(+)
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
+diff --git a/include/hw/arm/bcm2836.h b/include/hw/arm/bcm2836.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/include/hw/arm/bcm2836.h
-+++ b/target/arm/vfp.decode
++++ b/include/hw/arm/bcm2836.h
-@@ -XXX,XX +XXX,XX @@ VCVT_sp      ---- 1110 1.11 0111 .... 1010 11.0 ....        @vfp_dm_ds
+@@ -XXX,XX +XXX,XX @@ OBJECT_DECLARE_TYPE(BCM283XState, BCM283XClass, BCM283X)
- VCVT_dp      ---- 1110 1.11 0111 .... 1011 11.0 ....        @vfp_dm_sd
+  * them, code using these devices should always handle them via the
+  * BCM283x base class, so they have no BCM2836(obj) etc macros.
- # VCVT from integer to floating point: Vm always single; Vd depends on size
+  */
-+VCVT_int_hp  ---- 1110 1.11 1000 .... 1001 s:1 1.0 .... \
++#define TYPE_BCM2835 "bcm2835"
-+             vd=%vd_sp vm=%vm_sp
+ #define TYPE_BCM2836 "bcm2836"
- VCVT_int_sp  ---- 1110 1.11 1000 .... 1010 s:1 1.0 .... \
+ #define TYPE_BCM2837 "bcm2837"
-              vd=%vd_sp vm=%vm_sp
- VCVT_int_dp  ---- 1110 1.11 1000 .... 1011 s:1 1.0 .... \
+diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@ VCVT_fix_dp  ---- 1110 1.11 1.1. .... 1011 .1.0 .... \
               vd=%vd_dp imm=%vm_sp opc=%vcvt_fix_op
  # VCVT float to integer (VCVT and VCVTR): Vd always single; Vd depends on size
 +VCVT_hp_int  ---- 1110 1.11 110 s:1 .... 1001 rz:1 1.0 .... \
 +             vd=%vd_sp vm=%vm_sp
  VCVT_sp_int  ---- 1110 1.11 110 s:1 .... 1010 rz:1 1.0 .... \
               vd=%vd_sp vm=%vm_sp
  VCVT_dp_int  ---- 1110 1.11 110 s:1 .... 1011 rz:1 1.0 .... \
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.c.inc
+--- a/hw/arm/bcm2836.c
-+++ b/target/arm/translate-vfp.c.inc
++++ b/hw/arm/bcm2836.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
+@@ -XXX,XX +XXX,XX @@ static bool bcm283x_common_realize(DeviceState *dev, Error **errp)
      return true;
  }
-+static bool trans_VCVT_int_hp(DisasContext *s, arg_VCVT_int_sp *a)
++static void bcm2835_realize(DeviceState *dev, Error **errp)
 +{
-+    TCGv_i32 vm;
++    BCM283XState *s = BCM283X(dev);
 +    TCGv_ptr fpst;
 +
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++    if (!bcm283x_common_realize(dev, errp)) {
-+        return false;
++        return;
 +    }
 +
-+    if (!vfp_access_check(s)) {
++    if (!qdev_realize(DEVICE(&s->cpu[0].core), NULL, errp)) {
-+        return true;
++        return;
 +    }
 +
-+    vm = tcg_temp_new_i32();
++    /* Connect irq/fiq outputs from the interrupt controller. */
-+    neon_load_reg32(vm, a->vm);
++    sysbus_connect_irq(SYS_BUS_DEVICE(&s->peripherals), 0,
-+    fpst = fpstatus_ptr(FPST_FPCR_F16);
++            qdev_get_gpio_in(DEVICE(&s->cpu[0].core), ARM_CPU_IRQ));
-+    if (a->s) {
++    sysbus_connect_irq(SYS_BUS_DEVICE(&s->peripherals), 1,
-+        /* i32 -> f16 */
++            qdev_get_gpio_in(DEVICE(&s->cpu[0].core), ARM_CPU_FIQ));
 +        gen_helper_vfp_sitoh(vm, vm, fpst);
 +    } else {
 +        /* u32 -> f16 */
 +        gen_helper_vfp_uitoh(vm, vm, fpst);
 +    }
 +    neon_store_reg32(vm, a->vd);
 +    tcg_temp_free_i32(vm);
 +    tcg_temp_free_ptr(fpst);
 +    return true;
 +}
 +
- static bool trans_VCVT_int_sp(DisasContext *s, arg_VCVT_int_sp *a)
+ static void bcm2836_realize(DeviceState *dev, Error **errp)
  {
-     TCGv_i32 vm;
+     BCM283XState *s = BCM283X(dev);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
+@@ -XXX,XX +XXX,XX @@ static void bcm283x_class_init(ObjectClass *oc, void *data)
-     return true;
+     dc->user_creatable = false;
  }
-+static bool trans_VCVT_hp_int(DisasContext *s, arg_VCVT_sp_int *a)
++static void bcm2835_class_init(ObjectClass *oc, void *data)
 +{
-+    TCGv_i32 vm;
++    DeviceClass *dc = DEVICE_CLASS(oc);
-+    TCGv_ptr fpst;
++    BCM283XClass *bc = BCM283X_CLASS(oc);
 +
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++    bc->cpu_type = ARM_CPU_TYPE_NAME("arm1176");
-+        return false;
++    bc->core_count = 1;
-+    }
++    bc->peri_base = 0x20000000;
 +    dc->realize = bcm2835_realize;
 +};
 +
-+    if (!vfp_access_check(s)) {
+ static void bcm2836_class_init(ObjectClass *oc, void *data)
 +        return true;
 +    }
 +
 +    fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    vm = tcg_temp_new_i32();
 +    neon_load_reg32(vm, a->vm);
 +
 +    if (a->s) {
 +        if (a->rz) {
 +            gen_helper_vfp_tosizh(vm, vm, fpst);
 +        } else {
 +            gen_helper_vfp_tosih(vm, vm, fpst);
 +        }
 +    } else {
 +        if (a->rz) {
 +            gen_helper_vfp_touizh(vm, vm, fpst);
 +        } else {
 +            gen_helper_vfp_touih(vm, vm, fpst);
 +        }
 +    }
 +    neon_store_reg32(vm, a->vd);
 +    tcg_temp_free_i32(vm);
 +    tcg_temp_free_ptr(fpst);
 +    return true;
 +}
 +
  static bool trans_VCVT_sp_int(DisasContext *s, arg_VCVT_sp_int *a)
  {
-     TCGv_i32 vm;
+     DeviceClass *dc = DEVICE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void bcm2837_class_init(ObjectClass *oc, void *data)
  static const TypeInfo bcm283x_types[] = {
      {
 +        .name           = TYPE_BCM2835,
 +        .parent         = TYPE_BCM283X,
 +        .class_init     = bcm2835_class_init,
 +    }, {
          .name           = TYPE_BCM2836,
          .parent         = TYPE_BCM283X,
          .class_init     = bcm2836_class_init,
 diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/raspi.c
 +++ b/hw/arm/raspi.c
@@ -XXX,XX +XXX,XX @@ FIELD(REV_CODE, MEMORY_SIZE,       20, 3);
  FIELD(REV_CODE, STYLE,             23, 1);
  typedef enum RaspiProcessorId {
 +    PROCESSOR_ID_BCM2835 = 0,
      PROCESSOR_ID_BCM2836 = 1,
      PROCESSOR_ID_BCM2837 = 2,
  } RaspiProcessorId;
@@ -XXX,XX +XXX,XX @@ static const struct {
      const char *type;
      int cores_count;
  } soc_property[] = {
 +    [PROCESSOR_ID_BCM2835] = {TYPE_BCM2835, 1},
      [PROCESSOR_ID_BCM2836] = {TYPE_BCM2836, BCM283X_NCPUS},
      [PROCESSOR_ID_BCM2837] = {TYPE_BCM2837, BCM283X_NCPUS},
  };
 --
 .20.1

-[PULL 19/47] target/arm: Implement new VFP fp16 insn VINS
+[PULL 27/48] hw/arm/raspi: Add the Raspberry Pi A+ machine
-The fp16 extension includes a new instruction VINS, which copies the
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 lower 16 bits of a 32-bit source VFP register into the upper 16 bits
 of the destination.  Implement it.
+The Pi A is almost the first machine released.
+It uses a BCM2835 SoC which includes a ARMv6Z core.
+Example booting the machine using content from [*]
+(we use the device tree from the B model):
+  $ qemu-system-arm -M raspi1ap -serial stdio \
+      -kernel raspberrypi/firmware/boot/kernel.img \
+      -dtb raspberrypi/firmware/boot/bcm2708-rpi-b-plus.dtb \
+      -append 'earlycon=pl011,0x20201000 console=ttyAMA0'
+  [    0.000000] Booting Linux on physical CPU 0x0
+  [    0.000000] Linux version 4.19.118+ (dom@buildbot) (gcc version 4.9.3 (crosstool-NG crosstool-ng-1.22.0-88-g8460611)) #1311 Mon Apr 27 14:16:15 BST 2020
+  [    0.000000] CPU: ARMv6-compatible processor [410fb767] revision 7 (ARMv7), cr=00c5387d
+  [    0.000000] CPU: VIPT aliasing data cache, unknown instruction cache
+  [    0.000000] OF: fdt: Machine model: Raspberry Pi Model B+
+  ...
+[*] http://archive.raspberrypi.org/debian/pool/main/r/raspberrypi-firmware/raspberrypi-kernel_1.20200512-2_armhf.deb
+Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-8-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-20-peter.maydell@linaro.org
 ---
- target/arm/vfp-uncond.decode   |  3 +++
+ hw/arm/raspi.c | 13 +++++++++++++
- target/arm/translate-vfp.c.inc | 28 ++++++++++++++++++++++++++++
+file changed, 13 insertions(+)
 files changed, 31 insertions(+)
-diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
+diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp-uncond.decode
+--- a/hw/arm/raspi.c
-+++ b/target/arm/vfp-uncond.decode
++++ b/hw/arm/raspi.c
-@@ -XXX,XX +XXX,XX @@ VCVT        1111 1110 1.11 11 rm:2 .... 1010 op:1 1.0 .... \
+@@ -XXX,XX +XXX,XX @@ static void raspi_machine_class_common_init(MachineClass *mc,
-             vm=%vm_sp vd=%vd_sp sz=2
+     mc->default_ram_id = "ram";
- VCVT        1111 1110 1.11 11 rm:2 .... 1011 op:1 1.0 .... \
+ };
-             vm=%vm_dp vd=%vd_sp sz=3
 +static void raspi1ap_machine_class_init(ObjectClass *oc, void *data)
 +{
 +    MachineClass *mc = MACHINE_CLASS(oc);
 +    RaspiMachineClass *rmc = RASPI_MACHINE_CLASS(oc);
 +
-+VINS        1111 1110 1.11 0000 .... 1010 11 . 0 .... \
++    rmc->board_rev = 0x900021; /* Revision 1.1 */
-+            vd=%vd_sp vm=%vm_sp
++    raspi_machine_class_common_init(mc, rmc->board_rev);
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
++};
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_NOCP(DisasContext *s, arg_NOCP *a)
      return false;
  }
 +
-+static bool trans_VINS(DisasContext *s, arg_VINS *a)
+ static void raspi2b_machine_class_init(ObjectClass *oc, void *data)
-+{
+ {
-+    TCGv_i32 rd, rm;
+     MachineClass *mc = MACHINE_CLASS(oc);
-+
+@@ -XXX,XX +XXX,XX @@ static void raspi3b_machine_class_init(ObjectClass *oc, void *data)
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
-+        return false;
+ static const TypeInfo raspi_machine_types[] = {
-+    }
+     {
-+
++        .name           = MACHINE_TYPE_NAME("raspi1ap"),
-+    if (s->vec_len != 0 || s->vec_stride != 0) {
++        .parent         = TYPE_RASPI_MACHINE,
-+        return false;
++        .class_init     = raspi1ap_machine_class_init,
-+    }
++    }, {
-+
+         .name           = MACHINE_TYPE_NAME("raspi2b"),
-+    if (!vfp_access_check(s)) {
+         .parent         = TYPE_RASPI_MACHINE,
-+        return true;
+         .class_init     = raspi2b_machine_class_init,
 +    }
 +
 +    /* Insert low half of Vm into high half of Vd */
 +    rm = tcg_temp_new_i32();
 +    rd = tcg_temp_new_i32();
 +    neon_load_reg32(rm, a->vm);
 +    neon_load_reg32(rd, a->vd);
 +    tcg_gen_deposit_i32(rd, rd, rm, 16, 16);
 +    neon_store_reg32(rd, a->vd);
 +    tcg_temp_free_i32(rm);
 +    tcg_temp_free_i32(rd);
 +    return true;
 +}
 --
 .20.1

-[PULL 15/47] target/arm: Implement VFP fp16 VCVT between float and fixed-point
+[PULL 28/48] hw/arm/raspi: Add the Raspberry Pi Zero machine
-Implement the fp16 versions of the VFP VCVT instruction forms which
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
 convert between floating point and fixed-point.
+Similarly to the Pi A, the Pi Zero uses a BCM2835 SoC (ARMv6Z core).
+The only difference between the revision 1.2 and 1.3 is the latter
+exposes a CSI camera connector. As we do not implement the Unicam
+peripheral, there is no point in exposing a camera connector :)
+Therefore we choose to model the 1.2 revision.
+Example booting the machine using content from [*]:
+  $ qemu-system-arm -M raspi0 -serial stdio \
+      -kernel raspberrypi/firmware/boot/kernel.img \
+      -dtb raspberrypi/firmware/boot/bcm2708-rpi-zero.dtb \
+      -append 'printk.time=0 earlycon=pl011,0x20201000 console=ttyAMA0'
+  [    0.000000] Booting Linux on physical CPU 0x0
+  [    0.000000] Linux version 4.19.118+ (dom@buildbot) (gcc version 4.9.3 (crosstool-NG crosstool-ng-1.22.0-88-g8460611)) #1311 Mon Apr 27 14:16:15 BST 2020
+  [    0.000000] CPU: ARMv6-compatible processor [410fb767] revision 7 (ARMv7), cr=00c5387d
+  [    0.000000] CPU: VIPT aliasing data cache, unknown instruction cache
+  [    0.000000] OF: fdt: Machine model: Raspberry Pi Zero
+  ...
+[*] http://archive.raspberrypi.org/debian/pool/main/r/raspberrypi-firmware/raspberrypi-kernel_1.20200512-2_armhf.deb
+Reviewed-by: Luc Michel <luc.michel@greensocs.com>
+Reviewed-by: Igor Mammedov <imammedo@redhat.com>
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-9-f4bug@amsat.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-16-peter.maydell@linaro.org
 ---
- target/arm/vfp.decode          |  2 ++
+ hw/arm/raspi.c | 13 +++++++++++++
- target/arm/translate-vfp.c.inc | 59 ++++++++++++++++++++++++++++++++++
+file changed, 13 insertions(+)
 files changed, 61 insertions(+)
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
+diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/hw/arm/raspi.c
-+++ b/target/arm/vfp.decode
++++ b/hw/arm/raspi.c
-@@ -XXX,XX +XXX,XX @@ VJCVT        ---- 1110 1.11 1001 .... 1011 11.0 ....        @vfp_dm_sd
+@@ -XXX,XX +XXX,XX @@ static void raspi_machine_class_common_init(MachineClass *mc,
- # We assemble bits 18 (op), 16 (u) and 7 (sx) into a single opc field
+     mc->default_ram_id = "ram";
- # for the convenience of the trans_VCVT_fix functions.
+ };
- %vcvt_fix_op 18:1 16:1 7:1
-+VCVT_fix_hp  ---- 1110 1.11 1.1. .... 1001 .1.0 .... \
++static void raspi0_machine_class_init(ObjectClass *oc, void *data)
 +             vd=%vd_sp imm=%vm_sp opc=%vcvt_fix_op
  VCVT_fix_sp  ---- 1110 1.11 1.1. .... 1010 .1.0 .... \
               vd=%vd_sp imm=%vm_sp opc=%vcvt_fix_op
  VCVT_fix_dp  ---- 1110 1.11 1.1. .... 1011 .1.0 .... \
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
      return true;
  }
 +static bool trans_VCVT_fix_hp(DisasContext *s, arg_VCVT_fix_sp *a)
 +{
-+    TCGv_i32 vd, shift;
++    MachineClass *mc = MACHINE_CLASS(oc);
-+    TCGv_ptr fpst;
++    RaspiMachineClass *rmc = RASPI_MACHINE_CLASS(oc);
 +    int frac_bits;
 +
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++    rmc->board_rev = 0x920092; /* Revision 1.2 */
-+        return false;
++    raspi_machine_class_common_init(mc, rmc->board_rev);
-+    }
++};
 +
-+    if (!vfp_access_check(s)) {
+ static void raspi1ap_machine_class_init(ObjectClass *oc, void *data)
 +        return true;
 +    }
 +
 +    frac_bits = (a->opc & 1) ? (32 - a->imm) : (16 - a->imm);
 +
 +    vd = tcg_temp_new_i32();
 +    neon_load_reg32(vd, a->vd);
 +
 +    fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    shift = tcg_const_i32(frac_bits);
 +
 +    /* Switch on op:U:sx bits */
 +    switch (a->opc) {
 +    case 0:
 +        gen_helper_vfp_shtoh(vd, vd, shift, fpst);
 +        break;
 +    case 1:
 +        gen_helper_vfp_sltoh(vd, vd, shift, fpst);
 +        break;
 +    case 2:
 +        gen_helper_vfp_uhtoh(vd, vd, shift, fpst);
 +        break;
 +    case 3:
 +        gen_helper_vfp_ultoh(vd, vd, shift, fpst);
 +        break;
 +    case 4:
 +        gen_helper_vfp_toshh_round_to_zero(vd, vd, shift, fpst);
 +        break;
 +    case 5:
 +        gen_helper_vfp_toslh_round_to_zero(vd, vd, shift, fpst);
 +        break;
 +    case 6:
 +        gen_helper_vfp_touhh_round_to_zero(vd, vd, shift, fpst);
 +        break;
 +    case 7:
 +        gen_helper_vfp_toulh_round_to_zero(vd, vd, shift, fpst);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +    }
 +
 +    neon_store_reg32(vd, a->vd);
 +    tcg_temp_free_i32(vd);
 +    tcg_temp_free_i32(shift);
 +    tcg_temp_free_ptr(fpst);
 +    return true;
 +}
 +
  static bool trans_VCVT_fix_sp(DisasContext *s, arg_VCVT_fix_sp *a)
  {
-     TCGv_i32 vd, shift;
+     MachineClass *mc = MACHINE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void raspi3b_machine_class_init(ObjectClass *oc, void *data)
  static const TypeInfo raspi_machine_types[] = {
      {
 +        .name           = MACHINE_TYPE_NAME("raspi0"),
 +        .parent         = TYPE_RASPI_MACHINE,
 +        .class_init     = raspi0_machine_class_init,
 +    }, {
          .name           = MACHINE_TYPE_NAME("raspi1ap"),
          .parent         = TYPE_RASPI_MACHINE,
          .class_init     = raspi1ap_machine_class_init,
 --
 .20.1

-[PULL 45/47] hw/arm/sbsa-ref: add "reg" property to DT cpu nodes
+[PULL 29/48] hw/arm/raspi: Add the Raspberry Pi 3 model A+
-From: Leif Lindholm <leif@nuviainc.com>
+From: Philippe Mathieu-Daudé <f4bug@amsat.org>
-The sbsa-ref platform uses a minimal device tree to pass amount of memory
+The Pi 3A+ is a stripped down version of the 3B:
-as well as number of cpus to the firmware. However, when dumping that
+- 512 MiB of RAM instead of 1 GiB
-minimal dtb (with -M sbsa-virt,dumpdtb=<file>), the resulting blob
+- no on-board ethernet chipset
 generates a warning when decompiled by dtc due to lack of reg property.
-Add a simple reg property per cpu, representing a 64-bit MPIDR_EL1.
+Add it as it is a closer match to what we model.
-This also ends up being cleaner than having the firmware calculating its
+Reviewed-by: Igor Mammedov <imammedo@redhat.com>
-own IDs for generating APCI.
+Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-id: 20201024170127.3592182-10-f4bug@amsat.org
 Signed-off-by: Leif Lindholm <leif@nuviainc.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-id: 20200827124335.30586-1-leif@nuviainc.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/sbsa-ref.c | 29 +++++++++++++++++++++++------
+ hw/arm/raspi.c | 13 +++++++++++++
-file changed, 23 insertions(+), 6 deletions(-)
+file changed, 13 insertions(+)
-diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
+diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/sbsa-ref.c
+--- a/hw/arm/raspi.c
-+++ b/hw/arm/sbsa-ref.c
++++ b/hw/arm/raspi.c
-@@ -XXX,XX +XXX,XX @@ static const int sbsa_ref_irqmap[] = {
+@@ -XXX,XX +XXX,XX @@ static void raspi2b_machine_class_init(ObjectClass *oc, void *data)
      [SBSA_EHCI] = 11,
  };
-+static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
+ #ifdef TARGET_AARCH64
 +static void raspi3ap_machine_class_init(ObjectClass *oc, void *data)
 +{
-+    uint8_t clustersz = ARM_DEFAULT_CPUS_PER_CLUSTER;
++    MachineClass *mc = MACHINE_CLASS(oc);
-+    return arm_cpu_mp_affinity(idx, clustersz);
++    RaspiMachineClass *rmc = RASPI_MACHINE_CLASS(oc);
 +}
 +
- /*
++    rmc->board_rev = 0x9020e0; /* Revision 1.0 */
-  * Firmware on this machine only uses ACPI table to load OS, these limited
++    raspi_machine_class_common_init(mc, rmc->board_rev);
-  * device tree nodes are just to let firmware know the info which varies from
++};
-@@ -XXX,XX +XXX,XX @@ static void create_fdt(SBSAMachineState *sms)
++
-         g_free(matrix);
+ static void raspi3b_machine_class_init(ObjectClass *oc, void *data)
      }
 +    /*
 +     * From Documentation/devicetree/bindings/arm/cpus.yaml
 +     *  On ARM v8 64-bit systems this property is required
 +     *    and matches the MPIDR_EL1 register affinity bits.
 +     *
 +     *    * If cpus node's #address-cells property is set to 2
 +     *
 +     *      The first reg cell bits [7:0] must be set to
 +     *      bits [39:32] of MPIDR_EL1.
 +     *
 +     *      The second reg cell bits [23:0] must be set to
 +     *      bits [23:0] of MPIDR_EL1.
 +     */
      qemu_fdt_add_subnode(sms->fdt, "/cpus");
 +    qemu_fdt_setprop_cell(sms->fdt, "/cpus", "#address-cells", 2);
 +    qemu_fdt_setprop_cell(sms->fdt, "/cpus", "#size-cells", 0x0);
      for (cpu = sms->smp_cpus - 1; cpu >= 0; cpu--) {
          char *nodename = g_strdup_printf("/cpus/cpu@%d", cpu);
          ARMCPU *armcpu = ARM_CPU(qemu_get_cpu(cpu));
          CPUState *cs = CPU(armcpu);
 +        uint64_t mpidr = sbsa_ref_cpu_mp_affinity(sms, cpu);
          qemu_fdt_add_subnode(sms->fdt, nodename);
 +        qemu_fdt_setprop_u64(sms->fdt, nodename, "reg", mpidr);
          if (ms->possible_cpus->cpus[cs->cpu_index].props.has_node_id) {
              qemu_fdt_setprop_cell(sms->fdt, nodename, "numa-node-id",
@@ -XXX,XX +XXX,XX @@ static void sbsa_ref_init(MachineState *machine)
      arm_load_kernel(ARM_CPU(first_cpu), machine, &sms->bootinfo);
  }
 -static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
 -{
 -    uint8_t clustersz = ARM_DEFAULT_CPUS_PER_CLUSTER;
 -    return arm_cpu_mp_affinity(idx, clustersz);
 -}
 -
  static const CPUArchIdList *sbsa_ref_possible_cpu_arch_ids(MachineState *ms)
  {
-     unsigned int max_cpus = ms->smp.max_cpus;
+     MachineClass *mc = MACHINE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static const TypeInfo raspi_machine_types[] = {
          .parent         = TYPE_RASPI_MACHINE,
          .class_init     = raspi2b_machine_class_init,
  #ifdef TARGET_AARCH64
 +    }, {
 +        .name           = MACHINE_TYPE_NAME("raspi3ap"),
 +        .parent         = TYPE_RASPI_MACHINE,
 +        .class_init     = raspi3ap_machine_class_init,
      }, {
          .name           = MACHINE_TYPE_NAME("raspi3b"),
          .parent         = TYPE_RASPI_MACHINE,
 --
 .20.1

-[PULL 14/47] target/arm: Use macros instead of open-coding fp16 conversion helpers
+[PULL 30/48] arm/trace: Fix hex printing
-Now the VFP_CONV_FIX macros can handle fp16's distinction between the
+From: "Dr. David Alan Gilbert" <dgilbert@redhat.com>
 width of the operation and the width of the type used to pass operands,
 use the macros rather than the open-coded functions.
-This creates an extra six helper functions, all of which we are going
+Use of 0x%d - make up our mind as 0x%x
 to need for the AArch32 VFP fp16 instructions.
+Signed-off-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Acked-by: Eric Auger <eric.auger@redhat.com>
+Message-id: 20201014193355.53074-1-dgilbert@redhat.com
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-15-peter.maydell@linaro.org
 ---
- target/arm/helper.h     |  6 +++
+ hw/arm/trace-events | 2 +-
- target/arm/vfp_helper.c | 86 +++--------------------------------------
+file changed, 1 insertion(+), 1 deletion(-)
 files changed, 12 insertions(+), 80 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/arm/trace-events b/hw/arm/trace-events
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/arm/trace-events
-+++ b/target/arm/helper.h
++++ b/hw/arm/trace-events
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(vfp_tosizh, s32, f16, ptr)
+@@ -XXX,XX +XXX,XX @@ smmuv3_get_cd(uint64_t addr) "CD addr: 0x%"PRIx64
- DEF_HELPER_2(vfp_tosizs, s32, f32, ptr)
+ smmuv3_decode_cd(uint32_t oas) "oas=%d"
- DEF_HELPER_2(vfp_tosizd, s32, f64, ptr)
+ smmuv3_decode_cd_tt(int i, uint32_t tsz, uint64_t ttb, uint32_t granule_sz, bool had) "TT[%d]:tsz:%d ttb:0x%"PRIx64" granule_sz:%d had:%d"
+ smmuv3_cmdq_cfgi_ste(int streamid) "streamid =%d"
-+DEF_HELPER_3(vfp_toshh_round_to_zero, i32, f16, i32, ptr)
+-smmuv3_cmdq_cfgi_ste_range(int start, int end) "start=0x%d - end=0x%d"
-+DEF_HELPER_3(vfp_toslh_round_to_zero, i32, f16, i32, ptr)
++smmuv3_cmdq_cfgi_ste_range(int start, int end) "start=0x%x - end=0x%x"
-+DEF_HELPER_3(vfp_touhh_round_to_zero, i32, f16, i32, ptr)
+ smmuv3_cmdq_cfgi_cd(uint32_t sid) "streamid = %d"
-+DEF_HELPER_3(vfp_toulh_round_to_zero, i32, f16, i32, ptr)
+ smmuv3_config_cache_hit(uint32_t sid, uint32_t hits, uint32_t misses, uint32_t perc) "Config cache HIT for sid %d (hits=%d, misses=%d, hit rate=%d)"
- DEF_HELPER_3(vfp_toshs_round_to_zero, i32, f32, i32, ptr)
+ smmuv3_config_cache_miss(uint32_t sid, uint32_t hits, uint32_t misses, uint32_t perc) "Config cache MISS for sid %d (hits=%d, misses=%d, hit rate=%d)"
  DEF_HELPER_3(vfp_tosls_round_to_zero, i32, f32, i32, ptr)
  DEF_HELPER_3(vfp_touhs_round_to_zero, i32, f32, i32, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_sqtod, f64, i64, i32, ptr)
  DEF_HELPER_3(vfp_uhtod, f64, i64, i32, ptr)
  DEF_HELPER_3(vfp_ultod, f64, i64, i32, ptr)
  DEF_HELPER_3(vfp_uqtod, f64, i64, i32, ptr)
 +DEF_HELPER_3(vfp_shtoh, f16, i32, i32, ptr)
 +DEF_HELPER_3(vfp_uhtoh, f16, i32, i32, ptr)
  DEF_HELPER_3(vfp_sltoh, f16, i32, i32, ptr)
  DEF_HELPER_3(vfp_ultoh, f16, i32, i32, ptr)
  DEF_HELPER_3(vfp_sqtoh, f16, i64, i32, ptr)
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ VFP_CONV_FIX_A64(sq, s, 32, float32, 64, int64)
  VFP_CONV_FIX(uh, s, 32, float32, 32, uint16)
  VFP_CONV_FIX(ul, s, 32, float32, 32, uint32)
  VFP_CONV_FIX_A64(uq, s, 32, float32, 64, uint64)
 +VFP_CONV_FIX(sh, h, 16, dh_ctype_f16, 32, int16)
 +VFP_CONV_FIX(sl, h, 16, dh_ctype_f16, 32, int32)
 +VFP_CONV_FIX_A64(sq, h, 16, dh_ctype_f16, 64, int64)
 +VFP_CONV_FIX(uh, h, 16, dh_ctype_f16, 32, uint16)
 +VFP_CONV_FIX(ul, h, 16, dh_ctype_f16, 32, uint32)
 +VFP_CONV_FIX_A64(uq, h, 16, dh_ctype_f16, 64, uint64)
  #undef VFP_CONV_FIX
  #undef VFP_CONV_FIX_FLOAT
  #undef VFP_CONV_FLOAT_FIX_ROUND
  #undef VFP_CONV_FIX_A64
 -uint32_t HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    return int32_to_float16_scalbn(x, -shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    return uint32_to_float16_scalbn(x, -shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_sqtoh)(uint64_t x, uint32_t shift, void *fpst)
 -{
 -    return int64_to_float16_scalbn(x, -shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_uqtoh)(uint64_t x, uint32_t shift, void *fpst)
 -{
 -    return uint64_to_float16_scalbn(x, -shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_toshh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    if (unlikely(float16_is_any_nan(x))) {
 -        float_raise(float_flag_invalid, fpst);
 -        return 0;
 -    }
 -    return float16_to_int16_scalbn(x, get_float_rounding_mode(fpst),
 -                                   shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_touhh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    if (unlikely(float16_is_any_nan(x))) {
 -        float_raise(float_flag_invalid, fpst);
 -        return 0;
 -    }
 -    return float16_to_uint16_scalbn(x, get_float_rounding_mode(fpst),
 -                                    shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_toslh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    if (unlikely(float16_is_any_nan(x))) {
 -        float_raise(float_flag_invalid, fpst);
 -        return 0;
 -    }
 -    return float16_to_int32_scalbn(x, get_float_rounding_mode(fpst),
 -                                   shift, fpst);
 -}
 -
 -uint32_t HELPER(vfp_toulh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    if (unlikely(float16_is_any_nan(x))) {
 -        float_raise(float_flag_invalid, fpst);
 -        return 0;
 -    }
 -    return float16_to_uint32_scalbn(x, get_float_rounding_mode(fpst),
 -                                    shift, fpst);
 -}
 -
 -uint64_t HELPER(vfp_tosqh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    if (unlikely(float16_is_any_nan(x))) {
 -        float_raise(float_flag_invalid, fpst);
 -        return 0;
 -    }
 -    return float16_to_int64_scalbn(x, get_float_rounding_mode(fpst),
 -                                   shift, fpst);
 -}
 -
 -uint64_t HELPER(vfp_touqh)(uint32_t x, uint32_t shift, void *fpst)
 -{
 -    if (unlikely(float16_is_any_nan(x))) {
 -        float_raise(float_flag_invalid, fpst);
 -        return 0;
 -    }
 -    return float16_to_uint64_scalbn(x, get_float_rounding_mode(fpst),
 -                                    shift, fpst);
 -}
 -
  /* Set the current fp rounding mode and return the old one.
   * The argument is a softfloat float_round_ value.
   */
 --
 .20.1

-[PULL 13/47] target/arm: Make VFP_CONV_FIX macros take separate float type and float size
+[PULL 31/48] hw/core/clock: provide the VMSTATE_ARRAY_CLOCK macro
-Currently the VFP_CONV_FIX macros take a single fsz argument for the
+From: Luc Michel <luc@lmichel.fr>
 size of the float type, which is used both to select the name of
 the functions to call (eg float32_is_any_nan()) and also for the
 type to use for the float inputs and outputs (eg float32).
-Separate these into fsz and ftype arguments, so that we can use them
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-for fp16, which uses 'float16' in the function names but is still
+Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
-passing inputs and outputs in a 32-bit sized type.
+Signed-off-by: Luc Michel <luc@lmichel.fr>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
  include/hw/clock.h | 5 +++++
 file changed, 5 insertions(+)
-Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
+diff --git a/include/hw/clock.h b/include/hw/clock.h
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-id: 20200828183354.27913-14-peter.maydell@linaro.org
 ---
  target/arm/vfp_helper.c | 46 ++++++++++++++++++++---------------------
 file changed, 23 insertions(+), 23 deletions(-)
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp_helper.c
+--- a/include/hw/clock.h
-+++ b/target/arm/vfp_helper.c
++++ b/include/hw/clock.h
-@@ -XXX,XX +XXX,XX @@ float32 VFP_HELPER(fcvts, d)(float64 x, CPUARMState *env)
+@@ -XXX,XX +XXX,XX @@ extern const VMStateDescription vmstate_clock;
- }
+     VMSTATE_CLOCK_V(field, state, 0)
+ #define VMSTATE_CLOCK_V(field, state, version) \
- /* VFP3 fixed point conversion.  */
+     VMSTATE_STRUCT_POINTER_V(field, state, version, vmstate_clock, Clock)
--#define VFP_CONV_FIX_FLOAT(name, p, fsz, isz, itype) \
++#define VMSTATE_ARRAY_CLOCK(field, state, num) \
--float##fsz HELPER(vfp_##name##to##p)(uint##isz##_t  x, uint32_t shift, \
++    VMSTATE_ARRAY_CLOCK_V(field, state, num, 0)
-+#define VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)            \
++#define VMSTATE_ARRAY_CLOCK_V(field, state, num, version)          \
-+ftype HELPER(vfp_##name##to##p)(uint##isz##_t  x, uint32_t shift,      \
++    VMSTATE_ARRAY_OF_POINTER_TO_STRUCT(field, state, num, version, \
-                                      void *fpstp) \
++                                       vmstate_clock, Clock)
- { return itype##_to_##float##fsz##_scalbn(x, -shift, fpstp); }
+ /**
--#define VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype, ROUND, suff)   \
+  * clock_setup_canonical_path:
 -uint##isz##_t HELPER(vfp_to##name##p##suff)(float##fsz x, uint32_t shift, \
 +#define VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype, ROUND, suff) \
 +uint##isz##_t HELPER(vfp_to##name##p##suff)(ftype x, uint32_t shift,      \
                                              void *fpst)                   \
  {                                                                         \
      if (unlikely(float##fsz##_is_any_nan(x))) {                           \
@@ -XXX,XX +XXX,XX @@ uint##isz##_t HELPER(vfp_to##name##p##suff)(float##fsz x, uint32_t shift, \
      return float##fsz##_to_##itype##_scalbn(x, ROUND, shift, fpst);       \
  }
 -#define VFP_CONV_FIX(name, p, fsz, isz, itype)                   \
 -VFP_CONV_FIX_FLOAT(name, p, fsz, isz, itype)                     \
 -VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype,               \
 +#define VFP_CONV_FIX(name, p, fsz, ftype, isz, itype)            \
 +VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)              \
 +VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype,        \
                           float_round_to_zero, _round_to_zero)    \
 -VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype,               \
 +VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype,        \
                           get_float_rounding_mode(fpst), )
 -#define VFP_CONV_FIX_A64(name, p, fsz, isz, itype)               \
 -VFP_CONV_FIX_FLOAT(name, p, fsz, isz, itype)                     \
 -VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype,               \
 +#define VFP_CONV_FIX_A64(name, p, fsz, ftype, isz, itype)        \
 +VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)              \
 +VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype,        \
                           get_float_rounding_mode(fpst), )
 -VFP_CONV_FIX(sh, d, 64, 64, int16)
 -VFP_CONV_FIX(sl, d, 64, 64, int32)
 -VFP_CONV_FIX_A64(sq, d, 64, 64, int64)
 -VFP_CONV_FIX(uh, d, 64, 64, uint16)
 -VFP_CONV_FIX(ul, d, 64, 64, uint32)
 -VFP_CONV_FIX_A64(uq, d, 64, 64, uint64)
 -VFP_CONV_FIX(sh, s, 32, 32, int16)
 -VFP_CONV_FIX(sl, s, 32, 32, int32)
 -VFP_CONV_FIX_A64(sq, s, 32, 64, int64)
 -VFP_CONV_FIX(uh, s, 32, 32, uint16)
 -VFP_CONV_FIX(ul, s, 32, 32, uint32)
 -VFP_CONV_FIX_A64(uq, s, 32, 64, uint64)
 +VFP_CONV_FIX(sh, d, 64, float64, 64, int16)
 +VFP_CONV_FIX(sl, d, 64, float64, 64, int32)
 +VFP_CONV_FIX_A64(sq, d, 64, float64, 64, int64)
 +VFP_CONV_FIX(uh, d, 64, float64, 64, uint16)
 +VFP_CONV_FIX(ul, d, 64, float64, 64, uint32)
 +VFP_CONV_FIX_A64(uq, d, 64, float64, 64, uint64)
 +VFP_CONV_FIX(sh, s, 32, float32, 32, int16)
 +VFP_CONV_FIX(sl, s, 32, float32, 32, int32)
 +VFP_CONV_FIX_A64(sq, s, 32, float32, 64, int64)
 +VFP_CONV_FIX(uh, s, 32, float32, 32, uint16)
 +VFP_CONV_FIX(ul, s, 32, float32, 32, uint32)
 +VFP_CONV_FIX_A64(uq, s, 32, float32, 64, uint64)
  #undef VFP_CONV_FIX
  #undef VFP_CONV_FIX_FLOAT
 --
 .20.1

-[PULL 24/47] target/arm: Implement fp16 for Neon VABS, VNEG of floats
+[PULL 32/48] hw/core/clock: trace clock values in Hz instead of ns
-Rewrite Neon VABS/VNEG of floats to use gvec logical AND and XOR, so
+From: Luc Michel <luc@lmichel.fr>
 that we can implement the fp16 version of the insns.
+The nanosecond unit greatly limits the dynamic range we can display in
+clock value traces, for values in the order of 1GHz and more. The
+internal representation can go way beyond this value and it is quite
+common for today's clocks to be within those ranges.
+For example, a frequency between 500MHz+ and 1GHz will be displayed as
+ns. Beyond 1GHz, it will show up as 0ns.
+Replace nanosecond periods traces with frequencies in the Hz unit
+to have more dynamic range in the trace output.
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-26-peter.maydell@linaro.org
 ---
- target/arm/translate-neon.c.inc | 34 +++++++++++++++++++++++++++------
+ hw/core/clock.c      | 6 +++---
-file changed, 28 insertions(+), 6 deletions(-)
+ hw/core/trace-events | 4 ++--
 files changed, 5 insertions(+), 5 deletions(-)
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
+diff --git a/hw/core/clock.c b/hw/core/clock.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-neon.c.inc
+--- a/hw/core/clock.c
-+++ b/target/arm/translate-neon.c.inc
++++ b/hw/core/clock.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VCNT(DisasContext *s, arg_2misc *a)
+@@ -XXX,XX +XXX,XX @@ bool clock_set(Clock *clk, uint64_t period)
-     return do_2misc(s, a, gen_helper_neon_cnt_u8);
+     if (clk->period == period) {
  }
 +static void gen_VABS_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
 +                       uint32_t oprsz, uint32_t maxsz)
 +{
 +    tcg_gen_gvec_andi(vece, rd_ofs, rm_ofs,
 +                      vece == MO_16 ? 0x7fff : 0x7fffffff,
 +                      oprsz, maxsz);
 +}
 +
  static bool trans_VABS_F(DisasContext *s, arg_2misc *a)
  {
 -    if (a->size != 2) {
 +    if (a->size == MO_16) {
 +        if (!dc_isar_feature(aa32_fp16_arith, s)) {
 +            return false;
 +        }
 +    } else if (a->size != MO_32) {
          return false;
      }
--    /* TODO: FP16 : size == 1 */
+-    trace_clock_set(CLOCK_PATH(clk), CLOCK_PERIOD_TO_NS(clk->period),
--    return do_2misc(s, a, gen_helper_vfp_abss);
+-                    CLOCK_PERIOD_TO_NS(period));
-+    return do_2misc_vec(s, a, gen_VABS_F);
++    trace_clock_set(CLOCK_PATH(clk), CLOCK_PERIOD_TO_HZ(clk->period),
-+}
++                    CLOCK_PERIOD_TO_HZ(period));
-+
+     clk->period = period;
-+static void gen_VNEG_F(unsigned vece, uint32_t rd_ofs, uint32_t rm_ofs,
-+                       uint32_t oprsz, uint32_t maxsz)
+     return true;
-+{
+@@ -XXX,XX +XXX,XX @@ static void clock_propagate_period(Clock *clk, bool call_callbacks)
-+    tcg_gen_gvec_xori(vece, rd_ofs, rm_ofs,
+         if (child->period != clk->period) {
-+                      vece == MO_16 ? 0x8000 : 0x80000000,
+             child->period = clk->period;
-+                      oprsz, maxsz);
+             trace_clock_update(CLOCK_PATH(child), CLOCK_PATH(clk),
- }
+-                               CLOCK_PERIOD_TO_NS(clk->period),
++                               CLOCK_PERIOD_TO_HZ(clk->period),
- static bool trans_VNEG_F(DisasContext *s, arg_2misc *a)
+                                call_callbacks);
- {
+             if (call_callbacks && child->callback) {
--    if (a->size != 2) {
+                 child->callback(child->callback_opaque);
-+    if (a->size == MO_16) {
+diff --git a/hw/core/trace-events b/hw/core/trace-events
-+        if (!dc_isar_feature(aa32_fp16_arith, s)) {
+index XXXXXXX..XXXXXXX 100644
-+            return false;
+--- a/hw/core/trace-events
-+        }
++++ b/hw/core/trace-events
-+    } else if (a->size != MO_32) {
+@@ -XXX,XX +XXX,XX @@ resettable_transitional_function(void *obj, const char *objtype) "obj=%p(%s)"
-         return false;
+ # clock.c
-     }
+ clock_set_source(const char *clk, const char *src) "'%s', src='%s'"
--    /* TODO: FP16 : size == 1 */
+ clock_disconnect(const char *clk) "'%s'"
--    return do_2misc(s, a, gen_helper_vfp_negs);
+-clock_set(const char *clk, uint64_t old, uint64_t new) "'%s', ns=%"PRIu64"->%"PRIu64
-+    return do_2misc_vec(s, a, gen_VNEG_F);
++clock_set(const char *clk, uint64_t old, uint64_t new) "'%s', %"PRIu64"Hz->%"PRIu64"Hz"
- }
+ clock_propagate(const char *clk) "'%s'"
+-clock_update(const char *clk, const char *src, uint64_t val, int cb) "'%s', src='%s', ns=%"PRIu64", cb=%d"
- static bool trans_VRECPE(DisasContext *s, arg_2misc *a)
++clock_update(const char *clk, const char *src, uint64_t hz, int cb) "'%s', src='%s', val=%"PRIu64"Hz cb=%d"
 --
 .20.1

-[PULL 07/47] target/arm: Macroify uses of do_vfp_2op_sp() and do_vfp_2op_dp()
+[PULL 33/48] hw/arm/raspi: fix CPRMAN base address
-Macroify the uses of do_vfp_2op_sp() and do_vfp_2op_dp(); this will
+From: Luc Michel <luc@lmichel.fr>
 make it easier to add the halfprec support.
+The CPRMAN (clock controller) was mapped at the watchdog/power manager
+address. It was also split into two unimplemented peripherals (CM and
+A2W) but this is really the same one, as shown by this extract of the
+Raspberry Pi 3 Linux device tree:
+    watchdog@7e100000 {
+            compatible = "brcm,bcm2835-pm\0brcm,bcm2835-pm-wdt";
+            [...]
+            reg = <0x7e100000 0x114 0x7e00a000 0x24>;
+            [...]
+    };
+    [...]
+    cprman@7e101000 {
+            compatible = "brcm,bcm2835-cprman";
+            [...]
+            reg = <0x7e101000 0x2000>;
+            [...]
+    };
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-8-peter.maydell@linaro.org
 ---
- target/arm/translate-vfp.c.inc | 49 ++++++++++------------------------
+ include/hw/arm/bcm2835_peripherals.h | 2 +-
-file changed, 14 insertions(+), 35 deletions(-)
+ include/hw/arm/raspi_platform.h      | 5 ++---
  hw/arm/bcm2835_peripherals.c         | 4 ++--
 files changed, 5 insertions(+), 6 deletions(-)
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
+diff --git a/include/hw/arm/bcm2835_peripherals.h b/include/hw/arm/bcm2835_peripherals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.c.inc
+--- a/include/hw/arm/bcm2835_peripherals.h
-+++ b/target/arm/translate-vfp.c.inc
++++ b/include/hw/arm/bcm2835_peripherals.h
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
+@@ -XXX,XX +XXX,XX @@ struct BCM2835PeripheralState {
-     return true;
+     BCM2835MphiState mphi;
- }
+     UnimplementedDeviceState txp;
+     UnimplementedDeviceState armtmr;
--static bool trans_VMOV_reg_sp(DisasContext *s, arg_VMOV_reg_sp *a)
++    UnimplementedDeviceState powermgt;
--{
+     UnimplementedDeviceState cprman;
--    return do_vfp_2op_sp(s, tcg_gen_mov_i32, a->vd, a->vm);
+-    UnimplementedDeviceState a2w;
--}
+     PL011State uart0;
-+#define DO_VFP_2OP(INSN, PREC, FN)                              \
+     BCM2835AuxState aux;
-+    static bool trans_##INSN##_##PREC(DisasContext *s,          \
+     BCM2835FBState fb;
-+                                      arg_##INSN##_##PREC *a)   \
+diff --git a/include/hw/arm/raspi_platform.h b/include/hw/arm/raspi_platform.h
-+    {                                                           \
+index XXXXXXX..XXXXXXX 100644
-+        return do_vfp_2op_##PREC(s, FN, a->vd, a->vm);          \
+--- a/include/hw/arm/raspi_platform.h
-+    }
++++ b/include/hw/arm/raspi_platform.h
+@@ -XXX,XX +XXX,XX @@
--static bool trans_VMOV_reg_dp(DisasContext *s, arg_VMOV_reg_dp *a)
+ #define ARMCTRL_TIMER0_1_OFFSET (ARM_OFFSET + 0x400) /* Timer 0 and 1 (SP804) */
--{
+ #define ARMCTRL_0_SBM_OFFSET    (ARM_OFFSET + 0x800) /* User 0 (ARM) Semaphores
--    return do_vfp_2op_dp(s, tcg_gen_mov_i64, a->vd, a->vm);
+                                                       * Doorbells & Mailboxes */
--}
+-#define CPRMAN_OFFSET           0x100000 /* Power Management, Watchdog */
-+DO_VFP_2OP(VMOV_reg, sp, tcg_gen_mov_i32)
+-#define CM_OFFSET               0x101000 /* Clock Management */
-+DO_VFP_2OP(VMOV_reg, dp, tcg_gen_mov_i64)
+-#define A2W_OFFSET              0x102000 /* Reset controller */
++#define PM_OFFSET               0x100000 /* Power Management */
--static bool trans_VABS_sp(DisasContext *s, arg_VABS_sp *a)
++#define CPRMAN_OFFSET           0x101000 /* Clock Management */
--{
+ #define AVS_OFFSET              0x103000 /* Audio Video Standard */
--    return do_vfp_2op_sp(s, gen_helper_vfp_abss, a->vd, a->vm);
+ #define RNG_OFFSET              0x104000
--}
+ #define GPIO_OFFSET             0x200000
-+DO_VFP_2OP(VABS, sp, gen_helper_vfp_abss)
+diff --git a/hw/arm/bcm2835_peripherals.c b/hw/arm/bcm2835_peripherals.c
-+DO_VFP_2OP(VABS, dp, gen_helper_vfp_absd)
+index XXXXXXX..XXXXXXX 100644
+--- a/hw/arm/bcm2835_peripherals.c
--static bool trans_VABS_dp(DisasContext *s, arg_VABS_dp *a)
++++ b/hw/arm/bcm2835_peripherals.c
--{
+@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
--    return do_vfp_2op_dp(s, gen_helper_vfp_absd, a->vd, a->vm);
--}
+     create_unimp(s, &s->txp, "bcm2835-txp", TXP_OFFSET, 0x1000);
--
+     create_unimp(s, &s->armtmr, "bcm2835-sp804", ARMCTRL_TIMER0_1_OFFSET, 0x40);
--static bool trans_VNEG_sp(DisasContext *s, arg_VNEG_sp *a)
+-    create_unimp(s, &s->cprman, "bcm2835-cprman", CPRMAN_OFFSET, 0x1000);
--{
+-    create_unimp(s, &s->a2w, "bcm2835-a2w", A2W_OFFSET, 0x1000);
--    return do_vfp_2op_sp(s, gen_helper_vfp_negs, a->vd, a->vm);
++    create_unimp(s, &s->powermgt, "bcm2835-powermgt", PM_OFFSET, 0x114);
--}
++    create_unimp(s, &s->cprman, "bcm2835-cprman", CPRMAN_OFFSET, 0x2000);
--
+     create_unimp(s, &s->i2s, "bcm2835-i2s", I2S_OFFSET, 0x100);
--static bool trans_VNEG_dp(DisasContext *s, arg_VNEG_dp *a)
+     create_unimp(s, &s->smi, "bcm2835-smi", SMI_OFFSET, 0x100);
--{
+     create_unimp(s, &s->spi[0], "bcm2835-spi0", SPI0_OFFSET, 0x20);
 -    return do_vfp_2op_dp(s, gen_helper_vfp_negd, a->vd, a->vm);
 -}
 +DO_VFP_2OP(VNEG, sp, gen_helper_vfp_negs)
 +DO_VFP_2OP(VNEG, dp, gen_helper_vfp_negd)
  static void gen_VSQRT_sp(TCGv_i32 vd, TCGv_i32 vm)
  {
      gen_helper_vfp_sqrts(vd, vm, cpu_env);
  }
 -static bool trans_VSQRT_sp(DisasContext *s, arg_VSQRT_sp *a)
 -{
 -    return do_vfp_2op_sp(s, gen_VSQRT_sp, a->vd, a->vm);
 -}
 -
  static void gen_VSQRT_dp(TCGv_i64 vd, TCGv_i64 vm)
  {
      gen_helper_vfp_sqrtd(vd, vm, cpu_env);
  }
 -static bool trans_VSQRT_dp(DisasContext *s, arg_VSQRT_dp *a)
 -{
 -    return do_vfp_2op_dp(s, gen_VSQRT_dp, a->vd, a->vm);
 -}
 +DO_VFP_2OP(VSQRT, sp, gen_VSQRT_sp)
 +DO_VFP_2OP(VSQRT, dp, gen_VSQRT_dp)
  static bool trans_VCMP_sp(DisasContext *s, arg_VCMP_sp *a)
  {
 --
 .20.1

-[PULL 11/47] target/arm: Implement VFP fp16 VLDR and VSTR
+[PULL 34/48] hw/arm/raspi: add a skeleton implementation of the CPRMAN
-Implement the fp16 versions of the VFP VLDR/VSTR (immediate).
+From: Luc Michel <luc@lmichel.fr>
 The BCM2835 CPRMAN is the clock manager of the SoC. It is composed of a
 main oscillator, and several sub-components (PLLs, multiplexers, ...) to
 generate the BCM2835 clock tree.
 This commit adds a skeleton of the CPRMAN, with a dummy register
 read/write implementation. It embeds the main oscillator (xosc) from
 which all the clocks will be derived.
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Luc Michel <luc@lmichel.fr>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-12-peter.maydell@linaro.org
 ---
- target/arm/vfp.decode          |  3 +--
+ include/hw/arm/bcm2835_peripherals.h       |   3 +-
- target/arm/translate-vfp.c.inc | 35 ++++++++++++++++++++++++++++++++++
+ include/hw/misc/bcm2835_cprman.h           |  37 +++++
-files changed, 36 insertions(+), 2 deletions(-)
+ include/hw/misc/bcm2835_cprman_internals.h |  24 +++
+ hw/arm/bcm2835_peripherals.c               |  11 +-
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
+ hw/misc/bcm2835_cprman.c                   | 163 +++++++++++++++++++++
  hw/misc/meson.build                        |   1 +
  hw/misc/trace-events                       |   5 +
 files changed, 242 insertions(+), 2 deletions(-)
  create mode 100644 include/hw/misc/bcm2835_cprman.h
  create mode 100644 include/hw/misc/bcm2835_cprman_internals.h
  create mode 100644 hw/misc/bcm2835_cprman.c
 diff --git a/include/hw/arm/bcm2835_peripherals.h b/include/hw/arm/bcm2835_peripherals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/include/hw/arm/bcm2835_peripherals.h
-+++ b/target/arm/vfp.decode
++++ b/include/hw/arm/bcm2835_peripherals.h
-@@ -XXX,XX +XXX,XX @@ VMOV_single  ---- 1110 000 l:1 .... rt:4 1010 . 001 0000    vn=%vn_sp
+@@ -XXX,XX +XXX,XX @@
- VMOV_64_sp   ---- 1100 010 op:1 rt2:4 rt:4 1010 00.1 ....   vm=%vm_sp
+ #include "hw/misc/bcm2835_mbox.h"
- VMOV_64_dp   ---- 1100 010 op:1 rt2:4 rt:4 1011 00.1 ....   vm=%vm_dp
+ #include "hw/misc/bcm2835_mphi.h"
+ #include "hw/misc/bcm2835_thermal.h"
--# Note that the half-precision variants of VLDR and VSTR are
++#include "hw/misc/bcm2835_cprman.h"
--# not part of this decodetree at all because they have bits [9:8] == 0b01
+ #include "hw/sd/sdhci.h"
-+VLDR_VSTR_hp ---- 1101 u:1 .0 l:1 rn:4 .... 1001 imm:8      vd=%vd_sp
+ #include "hw/sd/bcm2835_sdhost.h"
- VLDR_VSTR_sp ---- 1101 u:1 .0 l:1 rn:4 .... 1010 imm:8      vd=%vd_sp
+ #include "hw/gpio/bcm2835_gpio.h"
- VLDR_VSTR_dp ---- 1101 u:1 .0 l:1 rn:4 .... 1011 imm:8      vd=%vd_dp
+@@ -XXX,XX +XXX,XX @@ struct BCM2835PeripheralState {
+     UnimplementedDeviceState txp;
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
+     UnimplementedDeviceState armtmr;
      UnimplementedDeviceState powermgt;
 -    UnimplementedDeviceState cprman;
 +    BCM2835CprmanState cprman;
      PL011State uart0;
      BCM2835AuxState aux;
      BCM2835FBState fb;
 diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/include/hw/misc/bcm2835_cprman.h
@@ -XXX,XX +XXX,XX @@
 +/*
 + * BCM2835 CPRMAN clock manager
 + *
 + * Copyright (c) 2020 Luc Michel <luc@lmichel.fr>
 + *
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + */
 +
 +#ifndef HW_MISC_CPRMAN_H
 +#define HW_MISC_CPRMAN_H
 +
 +#include "hw/sysbus.h"
 +#include "hw/qdev-clock.h"
 +
 +#define TYPE_BCM2835_CPRMAN "bcm2835-cprman"
 +
 +typedef struct BCM2835CprmanState BCM2835CprmanState;
 +
 +DECLARE_INSTANCE_CHECKER(BCM2835CprmanState, CPRMAN,
 +                         TYPE_BCM2835_CPRMAN)
 +
 +#define CPRMAN_NUM_REGS (0x2000 / sizeof(uint32_t))
 +
 +struct BCM2835CprmanState {
 +    /*< private >*/
 +    SysBusDevice parent_obj;
 +
 +    /*< public >*/
 +    MemoryRegion iomem;
 +
 +    uint32_t regs[CPRMAN_NUM_REGS];
 +    uint32_t xosc_freq;
 +
 +    Clock *xosc;
 +};
 +
 +#endif
 diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@
 +/*
 + * BCM2835 CPRMAN clock manager
 + *
 + * Copyright (c) 2020 Luc Michel <luc@lmichel.fr>
 + *
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + */
 +
 +#ifndef HW_MISC_CPRMAN_INTERNALS_H
 +#define HW_MISC_CPRMAN_INTERNALS_H
 +
 +#include "hw/registerfields.h"
 +#include "hw/misc/bcm2835_cprman.h"
 +
 +/* Register map */
 +
 +/*
 + * This field is common to all registers. Each register write value must match
 + * the CPRMAN_PASSWORD magic value in its 8 MSB.
 + */
 +FIELD(CPRMAN, PASSWORD, 24, 8)
 +#define CPRMAN_PASSWORD 0x5a
 +
 +#endif
 diff --git a/hw/arm/bcm2835_peripherals.c b/hw/arm/bcm2835_peripherals.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.c.inc
+--- a/hw/arm/bcm2835_peripherals.c
-+++ b/target/arm/translate-vfp.c.inc
++++ b/hw/arm/bcm2835_peripherals.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_64_dp(DisasContext *s, arg_VMOV_64_dp *a)
+@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_init(Object *obj)
-     return true;
+     /* DWC2 */
      object_initialize_child(obj, "dwc2", &s->dwc2, TYPE_DWC2_USB);
 +    /* CPRMAN clock manager */
 +    object_initialize_child(obj, "cprman", &s->cprman, TYPE_BCM2835_CPRMAN);
 +
      object_property_add_const_link(OBJECT(&s->dwc2), "dma-mr",
                                     OBJECT(&s->gpu_bus_mr));
  }
+@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
-+static bool trans_VLDR_VSTR_hp(DisasContext *s, arg_VLDR_VSTR_sp *a)
+         return;
-+{
+     }
-+    uint32_t offset;
-+    TCGv_i32 addr, tmp;
++    /* CPRMAN clock manager */
-+
++    if (!sysbus_realize(SYS_BUS_DEVICE(&s->cprman), errp)) {
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++        return;
 +        return false;
 +    }
-+
++    memory_region_add_subregion(&s->peri_mr, CPRMAN_OFFSET,
-+    if (!vfp_access_check(s)) {
++                sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->cprman), 0));
-+        return true;
++
      memory_region_add_subregion(&s->peri_mr, ARMCTRL_IC_OFFSET,
                  sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->ic), 0));
      sysbus_pass_irq(SYS_BUS_DEVICE(s), SYS_BUS_DEVICE(&s->ic));
@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
      create_unimp(s, &s->txp, "bcm2835-txp", TXP_OFFSET, 0x1000);
      create_unimp(s, &s->armtmr, "bcm2835-sp804", ARMCTRL_TIMER0_1_OFFSET, 0x40);
      create_unimp(s, &s->powermgt, "bcm2835-powermgt", PM_OFFSET, 0x114);
 -    create_unimp(s, &s->cprman, "bcm2835-cprman", CPRMAN_OFFSET, 0x2000);
      create_unimp(s, &s->i2s, "bcm2835-i2s", I2S_OFFSET, 0x100);
      create_unimp(s, &s->smi, "bcm2835-smi", SMI_OFFSET, 0x100);
      create_unimp(s, &s->spi[0], "bcm2835-spi0", SPI0_OFFSET, 0x20);
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * BCM2835 CPRMAN clock manager
 + *
 + * Copyright (c) 2020 Luc Michel <luc@lmichel.fr>
 + *
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + */
 +
 +/*
 + * This peripheral is roughly divided into 3 main parts:
 + *   - the PLLs
 + *   - the PLL channels
 + *   - the clock muxes
 + *
 + * A main oscillator (xosc) feeds all the PLLs. Each PLLs has one or more
 + * channels. Those channel are then connected to the clock muxes. Each mux has
 + * multiples sources (usually the xosc, some of the PLL channels and some "test
 + * debug" clocks). A mux is configured to select a given source through its
 + * control register. Each mux has one output clock that also goes out of the
 + * CPRMAN. This output clock usually connects to another peripheral in the SoC
 + * (so a given mux is dedicated to a peripheral).
 + *
 + * At each level (PLL, channel and mux), the clock can be altered through
 + * dividers (and multipliers in case of the PLLs), and can be disabled (in this
 + * case, the next levels see no clock).
 + *
 + * This can be sum-up as follows (this is an example and not the actual BCM2835
 + * clock tree):
 + *
 + *          /-->[PLL]-|->[PLL channel]--...            [mux]--> to peripherals
 + *          |         |->[PLL channel]  muxes takes    [mux]
 + *          |         \->[PLL channel]  inputs from    [mux]
 + *          |                           some channels  [mux]
 + * [xosc]---|-->[PLL]-|->[PLL channel]  and other srcs [mux]
 + *          |         \->[PLL channel]           ...-->[mux]
 + *          |                                          [mux]
 + *          \-->[PLL]--->[PLL channel]                 [mux]
 + *
 + * The page at https://elinux.org/The_Undocumented_Pi gives the actual clock
 + * tree configuration.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/log.h"
 +#include "migration/vmstate.h"
 +#include "hw/qdev-properties.h"
 +#include "hw/misc/bcm2835_cprman.h"
 +#include "hw/misc/bcm2835_cprman_internals.h"
 +#include "trace.h"
 +
 +/* CPRMAN "top level" model */
 +
 +static uint64_t cprman_read(void *opaque, hwaddr offset,
 +                            unsigned size)
 +{
 +    BCM2835CprmanState *s = CPRMAN(opaque);
 +    uint64_t r = 0;
 +    size_t idx = offset / sizeof(uint32_t);
 +
 +    switch (idx) {
 +    default:
 +        r = s->regs[idx];
 +    }
 +
-+    /* imm8 field is offset/2 for fp16, unlike fp32 and fp64 */
++    trace_bcm2835_cprman_read(offset, r);
-+    offset = a->imm << 1;
++    return r;
-+    if (!a->u) {
++}
-+        offset = -offset;
++
 +static void cprman_write(void *opaque, hwaddr offset,
 +                         uint64_t value, unsigned size)
 +{
 +    BCM2835CprmanState *s = CPRMAN(opaque);
 +    size_t idx = offset / sizeof(uint32_t);
 +
 +    if (FIELD_EX32(value, CPRMAN, PASSWORD) != CPRMAN_PASSWORD) {
 +        trace_bcm2835_cprman_write_invalid_magic(offset, value);
 +        return;
 +    }
 +
-+    /* For thumb, use of PC is UNPREDICTABLE.  */
++    value &= ~R_CPRMAN_PASSWORD_MASK;
-+    addr = add_reg_for_lit(s, a->rn, offset);
++
-+    tmp = tcg_temp_new_i32();
++    trace_bcm2835_cprman_write(offset, value);
-+    if (a->l) {
++    s->regs[idx] = value;
-+        gen_aa32_ld16u(s, tmp, addr, get_mem_index(s));
++
-+        neon_store_reg32(tmp, a->vd);
++}
-+    } else {
++
-+        neon_load_reg32(tmp, a->vd);
++static const MemoryRegionOps cprman_ops = {
-+        gen_aa32_st16(s, tmp, addr, get_mem_index(s));
++    .read = cprman_read,
 +    .write = cprman_write,
 +    .endianness = DEVICE_LITTLE_ENDIAN,
 +    .valid = {
 +        /*
 +         * Although this hasn't been checked against real hardware, nor the
 +         * information can be found in a datasheet, it seems reasonable because
 +         * of the "PASSWORD" magic value found in every registers.
 +         */
 +        .min_access_size        = 4,
 +        .max_access_size        = 4,
 +        .unaligned              = false,
 +    },
 +    .impl = {
 +        .max_access_size = 4,
 +    },
 +};
 +
 +static void cprman_reset(DeviceState *dev)
 +{
 +    BCM2835CprmanState *s = CPRMAN(dev);
 +
 +    memset(s->regs, 0, sizeof(s->regs));
 +
 +    clock_update_hz(s->xosc, s->xosc_freq);
 +}
 +
 +static void cprman_init(Object *obj)
 +{
 +    BCM2835CprmanState *s = CPRMAN(obj);
 +
 +    s->xosc = clock_new(obj, "xosc");
 +
 +    memory_region_init_io(&s->iomem, obj, &cprman_ops,
 +                          s, "bcm2835-cprman", 0x2000);
 +    sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
 +}
 +
 +static const VMStateDescription cprman_vmstate = {
 +    .name = TYPE_BCM2835_CPRMAN,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_UINT32_ARRAY(regs, BCM2835CprmanState, CPRMAN_NUM_REGS),
 +        VMSTATE_END_OF_LIST()
 +    }
-+    tcg_temp_free_i32(tmp);
++};
-+    tcg_temp_free_i32(addr);
++
-+
++static Property cprman_properties[] = {
-+    return true;
++    DEFINE_PROP_UINT32("xosc-freq-hz", BCM2835CprmanState, xosc_freq, 19200000),
-+}
++    DEFINE_PROP_END_OF_LIST()
-+
++};
- static bool trans_VLDR_VSTR_sp(DisasContext *s, arg_VLDR_VSTR_sp *a)
++
- {
++static void cprman_class_init(ObjectClass *klass, void *data)
-     uint32_t offset;
++{
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    dc->reset = cprman_reset;
 +    dc->vmsd = &cprman_vmstate;
 +    device_class_set_props(dc, cprman_properties);
 +}
 +
 +static const TypeInfo cprman_info = {
 +    .name = TYPE_BCM2835_CPRMAN,
 +    .parent = TYPE_SYS_BUS_DEVICE,
 +    .instance_size = sizeof(BCM2835CprmanState),
 +    .class_init = cprman_class_init,
 +    .instance_init = cprman_init,
 +};
 +
 +static void cprman_register_types(void)
 +{
 +    type_register_static(&cprman_info);
 +}
 +
 +type_init(cprman_register_types);
 diff --git a/hw/misc/meson.build b/hw/misc/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/meson.build
 +++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files(
    'bcm2835_property.c',
    'bcm2835_rng.c',
    'bcm2835_thermal.c',
 +  'bcm2835_cprman.c',
  ))
  softmmu_ss.add(when: 'CONFIG_SLAVIO', if_true: files('slavio_misc.c'))
  softmmu_ss.add(when: 'CONFIG_ZYNQ', if_true: files('zynq_slcr.c', 'zynq-xadc.c'))
 diff --git a/hw/misc/trace-events b/hw/misc/trace-events
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/trace-events
 +++ b/hw/misc/trace-events
@@ -XXX,XX +XXX,XX @@ grlib_apb_pnp_read(uint64_t addr, uint32_t value) "APB PnP read addr:0x%03"PRIx6
  # pca9552.c
  pca955x_gpio_status(const char *description, const char *buf) "%s GPIOs 0-15 [%s]"
  pca955x_gpio_change(const char *description, unsigned id, unsigned prev_state, unsigned current_state) "%s GPIO id:%u status: %u -> %u"
 +
 +# bcm2835_cprman.c
 +bcm2835_cprman_read(uint64_t offset, uint64_t value) "offset:0x%" PRIx64 " value:0x%" PRIx64
 +bcm2835_cprman_write(uint64_t offset, uint64_t value) "offset:0x%" PRIx64 " value:0x%" PRIx64
 +bcm2835_cprman_write_invalid_magic(uint64_t offset, uint64_t value) "offset:0x%" PRIx64 " value:0x%" PRIx64
 --
 .20.1

-[PULL 04/47] target/arm: Implement VFP fp16 VMLA, VMLS, VNMLS, VNMLA, VNMUL
+[PULL 35/48] hw/misc/bcm2835_cprman: add a PLL skeleton implementation
-Implement fp16 versions of the VFP VMLA, VMLS, VNMLS, VNMLA, VNMUL
+From: Luc Michel <luc@lmichel.fr>
-instructions. (These are all the remaining ones which we implement
-via do_vfp_3op_[hsd]p().)
+There are 5 PLLs in the CPRMAN, namely PLL A, C, D, H and B. All of them
+take the xosc clock as input and produce a new clock.
 This commit adds a skeleton implementation for the PLLs as sub-devices
 of the CPRMAN. The PLLs are instantiated and connected internally to the
 main oscillator.
 Each PLL has 6 registers : CM, A2W_CTRL, A2W_ANA[0,1,2,3], A2W_FRAC. A
 write to any of them triggers a call to the (not yet implemented)
 pll_update function.
 If the main oscillator changes frequency, an update is also triggered.
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Luc Michel <luc@lmichel.fr>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-5-peter.maydell@linaro.org
 ---
- target/arm/helper.h            |  1 +
+ include/hw/misc/bcm2835_cprman.h           |  29 +++++
- target/arm/vfp.decode          |  5 ++
+ include/hw/misc/bcm2835_cprman_internals.h | 144 +++++++++++++++++++++
- target/arm/vfp_helper.c        |  5 ++
+ hw/misc/bcm2835_cprman.c                   | 108 ++++++++++++++++
- target/arm/translate-vfp.c.inc | 84 ++++++++++++++++++++++++++++++++++
+files changed, 281 insertions(+)
-files changed, 95 insertions(+)
+diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/bcm2835_cprman.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/bcm2835_cprman.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@ DECLARE_INSTANCE_CHECKER(BCM2835CprmanState, CPRMAN,
- DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
- DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
+ #define CPRMAN_NUM_REGS (0x2000 / sizeof(uint32_t))
- DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
-+DEF_HELPER_1(vfp_negh, f16, f16)
++typedef enum CprmanPll {
- DEF_HELPER_1(vfp_negs, f32, f32)
++    CPRMAN_PLLA = 0,
- DEF_HELPER_1(vfp_negd, f64, f64)
++    CPRMAN_PLLC,
- DEF_HELPER_1(vfp_abss, f32, f32)
++    CPRMAN_PLLD,
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
++    CPRMAN_PLLH,
 +    CPRMAN_PLLB,
 +
 +    CPRMAN_NUM_PLL
 +} CprmanPll;
 +
 +typedef struct CprmanPllState {
 +    /*< private >*/
 +    DeviceState parent_obj;
 +
 +    /*< public >*/
 +    CprmanPll id;
 +
 +    uint32_t *reg_cm;
 +    uint32_t *reg_a2w_ctrl;
 +    uint32_t *reg_a2w_ana; /* ANA[0] .. ANA[3] */
 +    uint32_t prediv_mask; /* prediv bit in ana[1] */
 +    uint32_t *reg_a2w_frac;
 +
 +    Clock *xosc_in;
 +    Clock *out;
 +} CprmanPllState;
 +
  struct BCM2835CprmanState {
      /*< private >*/
      SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
      /*< public >*/
      MemoryRegion iomem;
 +    CprmanPllState plls[CPRMAN_NUM_PLL];
 +
      uint32_t regs[CPRMAN_NUM_REGS];
      uint32_t xosc_freq;
 diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/include/hw/misc/bcm2835_cprman_internals.h
-+++ b/target/arm/vfp.decode
++++ b/include/hw/misc/bcm2835_cprman_internals.h
-@@ -XXX,XX +XXX,XX @@ VLDM_VSTM_dp ---- 1101 0.1 l:1 rn:4 .... 1011 imm:8 \
+@@ -XXX,XX +XXX,XX @@
-              vd=%vd_dp p=1 u=0 w=1
+ #include "hw/registerfields.h"
+ #include "hw/misc/bcm2835_cprman.h"
- # 3-register VFP data-processing; bits [23,21:20,6] identify the operation.
-+VMLA_hp      ---- 1110 0.00 .... .... 1001 .0.0 ....        @vfp_dnm_s
++#define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
- VMLA_sp      ---- 1110 0.00 .... .... 1010 .0.0 ....        @vfp_dnm_s
++
- VMLA_dp      ---- 1110 0.00 .... .... 1011 .0.0 ....        @vfp_dnm_d
++DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
++                         TYPE_CPRMAN_PLL)
-+VMLS_hp      ---- 1110 0.00 .... .... 1001 .1.0 ....        @vfp_dnm_s
++
- VMLS_sp      ---- 1110 0.00 .... .... 1010 .1.0 ....        @vfp_dnm_s
+ /* Register map */
- VMLS_dp      ---- 1110 0.00 .... .... 1011 .1.0 ....        @vfp_dnm_d
++/* PLLs */
-+VNMLS_hp     ---- 1110 0.01 .... .... 1001 .0.0 ....        @vfp_dnm_s
++REG32(CM_PLLA, 0x104)
- VNMLS_sp     ---- 1110 0.01 .... .... 1010 .0.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLA, LOADDSI0, 0, 1)
- VNMLS_dp     ---- 1110 0.01 .... .... 1011 .0.0 ....        @vfp_dnm_d
++    FIELD(CM_PLLA, HOLDDSI0, 1, 1)
++    FIELD(CM_PLLA, LOADCCP2, 2, 1)
-+VNMLA_hp     ---- 1110 0.01 .... .... 1001 .1.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLA, HOLDCCP2, 3, 1)
- VNMLA_sp     ---- 1110 0.01 .... .... 1010 .1.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLA, LOADCORE, 4, 1)
- VNMLA_dp     ---- 1110 0.01 .... .... 1011 .1.0 ....        @vfp_dnm_d
++    FIELD(CM_PLLA, HOLDCORE, 5, 1)
++    FIELD(CM_PLLA, LOADPER, 6, 1)
-@@ -XXX,XX +XXX,XX @@ VMUL_hp      ---- 1110 0.10 .... .... 1001 .0.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLA, HOLDPER, 7, 1)
- VMUL_sp      ---- 1110 0.10 .... .... 1010 .0.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLx, ANARST, 8, 1)
- VMUL_dp      ---- 1110 0.10 .... .... 1011 .0.0 ....        @vfp_dnm_d
++REG32(CM_PLLC, 0x108)
++    FIELD(CM_PLLC, LOADCORE0, 0, 1)
-+VNMUL_hp     ---- 1110 0.10 .... .... 1001 .1.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLC, HOLDCORE0, 1, 1)
- VNMUL_sp     ---- 1110 0.10 .... .... 1010 .1.0 ....        @vfp_dnm_s
++    FIELD(CM_PLLC, LOADCORE1, 2, 1)
- VNMUL_dp     ---- 1110 0.10 .... .... 1011 .1.0 ....        @vfp_dnm_d
++    FIELD(CM_PLLC, HOLDCORE1, 3, 1)
++    FIELD(CM_PLLC, LOADCORE2, 4, 1)
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
++    FIELD(CM_PLLC, HOLDCORE2, 5, 1)
 +    FIELD(CM_PLLC, LOADPER, 6, 1)
 +    FIELD(CM_PLLC, HOLDPER, 7, 1)
 +REG32(CM_PLLD, 0x10c)
 +    FIELD(CM_PLLD, LOADDSI0, 0, 1)
 +    FIELD(CM_PLLD, HOLDDSI0, 1, 1)
 +    FIELD(CM_PLLD, LOADDSI1, 2, 1)
 +    FIELD(CM_PLLD, HOLDDSI1, 3, 1)
 +    FIELD(CM_PLLD, LOADCORE, 4, 1)
 +    FIELD(CM_PLLD, HOLDCORE, 5, 1)
 +    FIELD(CM_PLLD, LOADPER, 6, 1)
 +    FIELD(CM_PLLD, HOLDPER, 7, 1)
 +REG32(CM_PLLH, 0x110)
 +    FIELD(CM_PLLH, LOADPIX, 0, 1)
 +    FIELD(CM_PLLH, LOADAUX, 1, 1)
 +    FIELD(CM_PLLH, LOADRCAL, 2, 1)
 +REG32(CM_PLLB, 0x170)
 +    FIELD(CM_PLLB, LOADARM, 0, 1)
 +    FIELD(CM_PLLB, HOLDARM, 1, 1)
 +
 +REG32(A2W_PLLA_CTRL, 0x1100)
 +    FIELD(A2W_PLLx_CTRL, NDIV, 0, 10)
 +    FIELD(A2W_PLLx_CTRL, PDIV, 12, 3)
 +    FIELD(A2W_PLLx_CTRL, PWRDN, 16, 1)
 +    FIELD(A2W_PLLx_CTRL, PRST_DISABLE, 17, 1)
 +REG32(A2W_PLLC_CTRL, 0x1120)
 +REG32(A2W_PLLD_CTRL, 0x1140)
 +REG32(A2W_PLLH_CTRL, 0x1160)
 +REG32(A2W_PLLB_CTRL, 0x11e0)
 +
 +REG32(A2W_PLLA_ANA0, 0x1010)
 +REG32(A2W_PLLA_ANA1, 0x1014)
 +    FIELD(A2W_PLLx_ANA1, FB_PREDIV, 14, 1)
 +REG32(A2W_PLLA_ANA2, 0x1018)
 +REG32(A2W_PLLA_ANA3, 0x101c)
 +
 +REG32(A2W_PLLC_ANA0, 0x1030)
 +REG32(A2W_PLLC_ANA1, 0x1034)
 +REG32(A2W_PLLC_ANA2, 0x1038)
 +REG32(A2W_PLLC_ANA3, 0x103c)
 +
 +REG32(A2W_PLLD_ANA0, 0x1050)
 +REG32(A2W_PLLD_ANA1, 0x1054)
 +REG32(A2W_PLLD_ANA2, 0x1058)
 +REG32(A2W_PLLD_ANA3, 0x105c)
 +
 +REG32(A2W_PLLH_ANA0, 0x1070)
 +REG32(A2W_PLLH_ANA1, 0x1074)
 +    FIELD(A2W_PLLH_ANA1, FB_PREDIV, 11, 1)
 +REG32(A2W_PLLH_ANA2, 0x1078)
 +REG32(A2W_PLLH_ANA3, 0x107c)
 +
 +REG32(A2W_PLLB_ANA0, 0x10f0)
 +REG32(A2W_PLLB_ANA1, 0x10f4)
 +REG32(A2W_PLLB_ANA2, 0x10f8)
 +REG32(A2W_PLLB_ANA3, 0x10fc)
 +
 +REG32(A2W_PLLA_FRAC, 0x1200)
 +    FIELD(A2W_PLLx_FRAC, FRAC, 0, 20)
 +REG32(A2W_PLLC_FRAC, 0x1220)
 +REG32(A2W_PLLD_FRAC, 0x1240)
 +REG32(A2W_PLLH_FRAC, 0x1260)
 +REG32(A2W_PLLB_FRAC, 0x12e0)
 +
  /*
   * This field is common to all registers. Each register write value must match
   * the CPRMAN_PASSWORD magic value in its 8 MSB.
@@ -XXX,XX +XXX,XX @@
  FIELD(CPRMAN, PASSWORD, 24, 8)
  #define CPRMAN_PASSWORD 0x5a
 +/* PLL init info */
 +typedef struct PLLInitInfo {
 +    const char *name;
 +    size_t cm_offset;
 +    size_t a2w_ctrl_offset;
 +    size_t a2w_ana_offset;
 +    uint32_t prediv_mask; /* Prediv bit in ana[1] */
 +    size_t a2w_frac_offset;
 +} PLLInitInfo;
 +
 +#define FILL_PLL_INIT_INFO(pll_)                \
 +    .cm_offset = R_CM_ ## pll_,                 \
 +    .a2w_ctrl_offset = R_A2W_ ## pll_ ## _CTRL, \
 +    .a2w_ana_offset = R_A2W_ ## pll_ ## _ANA0,  \
 +    .a2w_frac_offset = R_A2W_ ## pll_ ## _FRAC
 +
 +static const PLLInitInfo PLL_INIT_INFO[] = {
 +    [CPRMAN_PLLA] = {
 +        .name = "plla",
 +        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
 +        FILL_PLL_INIT_INFO(PLLA),
 +    },
 +    [CPRMAN_PLLC] = {
 +        .name = "pllc",
 +        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
 +        FILL_PLL_INIT_INFO(PLLC),
 +    },
 +    [CPRMAN_PLLD] = {
 +        .name = "plld",
 +        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
 +        FILL_PLL_INIT_INFO(PLLD),
 +    },
 +    [CPRMAN_PLLH] = {
 +        .name = "pllh",
 +        .prediv_mask = R_A2W_PLLH_ANA1_FB_PREDIV_MASK,
 +        FILL_PLL_INIT_INFO(PLLH),
 +    },
 +    [CPRMAN_PLLB] = {
 +        .name = "pllb",
 +        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
 +        FILL_PLL_INIT_INFO(PLLB),
 +    },
 +};
 +
 +#undef FILL_PLL_CHANNEL_INIT_INFO
 +
 +static inline void set_pll_init_info(BCM2835CprmanState *s,
 +                                     CprmanPllState *pll,
 +                                     CprmanPll id)
 +{
 +    pll->id = id;
 +    pll->reg_cm = &s->regs[PLL_INIT_INFO[id].cm_offset];
 +    pll->reg_a2w_ctrl = &s->regs[PLL_INIT_INFO[id].a2w_ctrl_offset];
 +    pll->reg_a2w_ana = &s->regs[PLL_INIT_INFO[id].a2w_ana_offset];
 +    pll->prediv_mask = PLL_INIT_INFO[id].prediv_mask;
 +    pll->reg_a2w_frac = &s->regs[PLL_INIT_INFO[id].a2w_frac_offset];
 +}
 +
  #endif
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp_helper.c
+--- a/hw/misc/bcm2835_cprman.c
-+++ b/target/arm/vfp_helper.c
++++ b/hw/misc/bcm2835_cprman.c
-@@ -XXX,XX +XXX,XX @@ VFP_BINOP(minnum)
+@@ -XXX,XX +XXX,XX @@
- VFP_BINOP(maxnum)
+ #include "hw/misc/bcm2835_cprman_internals.h"
- #undef VFP_BINOP
+ #include "trace.h"
-+dh_ctype_f16 VFP_HELPER(neg, h)(dh_ctype_f16 a)
++/* PLL */
-+{
++
-+    return float16_chs(a);
++static void pll_update(CprmanPllState *pll)
-+}
++{
-+
++    clock_update(pll->out, 0);
- float32 VFP_HELPER(neg, s)(float32 a)
++}
 +
 +static void pll_xosc_update(void *opaque)
 +{
 +    pll_update(CPRMAN_PLL(opaque));
 +}
 +
 +static void pll_init(Object *obj)
 +{
 +    CprmanPllState *s = CPRMAN_PLL(obj);
 +
 +    s->xosc_in = qdev_init_clock_in(DEVICE(s), "xosc-in", pll_xosc_update, s);
 +    s->out = qdev_init_clock_out(DEVICE(s), "out");
 +}
 +
 +static const VMStateDescription pll_vmstate = {
 +    .name = TYPE_CPRMAN_PLL,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_CLOCK(xosc_in, CprmanPllState),
 +        VMSTATE_END_OF_LIST()
 +    }
 +};
 +
 +static void pll_class_init(ObjectClass *klass, void *data)
 +{
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    dc->vmsd = &pll_vmstate;
 +}
 +
 +static const TypeInfo cprman_pll_info = {
 +    .name = TYPE_CPRMAN_PLL,
 +    .parent = TYPE_DEVICE,
 +    .instance_size = sizeof(CprmanPllState),
 +    .class_init = pll_class_init,
 +    .instance_init = pll_init,
 +};
 +
 +
  /* CPRMAN "top level" model */
  static uint64_t cprman_read(void *opaque, hwaddr offset,
@@ -XXX,XX +XXX,XX @@ static uint64_t cprman_read(void *opaque, hwaddr offset,
      return r;
  }
 +#define CASE_PLL_REGS(pll_)       \
 +    case R_CM_ ## pll_:           \
 +    case R_A2W_ ## pll_ ## _CTRL: \
 +    case R_A2W_ ## pll_ ## _ANA0: \
 +    case R_A2W_ ## pll_ ## _ANA1: \
 +    case R_A2W_ ## pll_ ## _ANA2: \
 +    case R_A2W_ ## pll_ ## _ANA3: \
 +    case R_A2W_ ## pll_ ## _FRAC
 +
  static void cprman_write(void *opaque, hwaddr offset,
                           uint64_t value, unsigned size)
  {
-     return float32_chs(a);
+@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
+     trace_bcm2835_cprman_write(offset, value);
-index XXXXXXX..XXXXXXX 100644
+     s->regs[idx] = value;
---- a/target/arm/translate-vfp.c.inc
-+++ b/target/arm/translate-vfp.c.inc
++    switch (idx) {
-@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
++    CASE_PLL_REGS(PLLA) :
-     return true;
++        pll_update(&s->plls[CPRMAN_PLLA]);
 +        break;
 +
 +    CASE_PLL_REGS(PLLC) :
 +        pll_update(&s->plls[CPRMAN_PLLC]);
 +        break;
 +
 +    CASE_PLL_REGS(PLLD) :
 +        pll_update(&s->plls[CPRMAN_PLLD]);
 +        break;
 +
 +    CASE_PLL_REGS(PLLH) :
 +        pll_update(&s->plls[CPRMAN_PLLH]);
 +        break;
 +
 +    CASE_PLL_REGS(PLLB) :
 +        pll_update(&s->plls[CPRMAN_PLLB]);
 +        break;
 +    }
  }
-+static void gen_VMLA_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
++#undef CASE_PLL_REGS
-+{
++
-+    /* Note that order of inputs to the add matters for NaNs */
+ static const MemoryRegionOps cprman_ops = {
-+    TCGv_i32 tmp = tcg_temp_new_i32();
+     .read = cprman_read,
-+
+     .write = cprman_write,
-+    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
+@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps cprman_ops = {
-+    gen_helper_vfp_addh(vd, vd, tmp, fpst);
+ static void cprman_reset(DeviceState *dev)
 +    tcg_temp_free_i32(tmp);
 +}
 +
 +static bool trans_VMLA_hp(DisasContext *s, arg_VMLA_sp *a)
 +{
 +    return do_vfp_3op_hp(s, gen_VMLA_hp, a->vd, a->vn, a->vm, true);
 +}
 +
  static void gen_VMLA_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
  {
-     /* Note that order of inputs to the add matters for NaNs */
+     BCM2835CprmanState *s = CPRMAN(dev);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMLA_dp(DisasContext *s, arg_VMLA_dp *a)
++    size_t i;
-     return do_vfp_3op_dp(s, gen_VMLA_dp, a->vd, a->vn, a->vm, true);
      memset(s->regs, 0, sizeof(s->regs));
 +    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
 +        device_cold_reset(DEVICE(&s->plls[i]));
 +    }
 +
      clock_update_hz(s->xosc, s->xosc_freq);
  }
-+static void gen_VMLS_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+ static void cprman_init(Object *obj)
 +{
 +    /*
 +     * VMLS: vd = vd + -(vn * vm)
 +     * Note that order of inputs to the add matters for NaNs.
 +     */
 +    TCGv_i32 tmp = tcg_temp_new_i32();
 +
 +    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
 +    gen_helper_vfp_negh(tmp, tmp);
 +    gen_helper_vfp_addh(vd, vd, tmp, fpst);
 +    tcg_temp_free_i32(tmp);
 +}
 +
 +static bool trans_VMLS_hp(DisasContext *s, arg_VMLS_sp *a)
 +{
 +    return do_vfp_3op_hp(s, gen_VMLS_hp, a->vd, a->vn, a->vm, true);
 +}
 +
  static void gen_VMLS_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
  {
-     /*
+     BCM2835CprmanState *s = CPRMAN(obj);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMLS_dp(DisasContext *s, arg_VMLS_dp *a)
++    size_t i;
-     return do_vfp_3op_dp(s, gen_VMLS_dp, a->vd, a->vn, a->vm, true);
++
 +    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
 +        object_initialize_child(obj, PLL_INIT_INFO[i].name,
 +                                &s->plls[i], TYPE_CPRMAN_PLL);
 +        set_pll_init_info(s, &s->plls[i], i);
 +    }
      s->xosc = clock_new(obj, "xosc");
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
      sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
  }
-+static void gen_VNMLS_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
++static void cprman_realize(DeviceState *dev, Error **errp)
 +{
-+    /*
++    BCM2835CprmanState *s = CPRMAN(dev);
-+     * VNMLS: -fd + (fn * fm)
++    size_t i;
-+     * Note that it isn't valid to replace (-A + B) with (B - A) or similar
++
-+     * plausible looking simplifications because this will give wrong results
++    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
-+     * for NaNs.
++        CprmanPllState *pll = &s->plls[i];
-+     */
++
-+    TCGv_i32 tmp = tcg_temp_new_i32();
++        clock_set_source(pll->xosc_in, s->xosc);
 +
-+    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
++        if (!qdev_realize(DEVICE(pll), NULL, errp)) {
-+    gen_helper_vfp_negh(vd, vd);
++            return;
-+    gen_helper_vfp_addh(vd, vd, tmp, fpst);
++        }
-+    tcg_temp_free_i32(tmp);
++    }
 +}
 +
-+static bool trans_VNMLS_hp(DisasContext *s, arg_VNMLS_sp *a)
+ static const VMStateDescription cprman_vmstate = {
-+{
+     .name = TYPE_BCM2835_CPRMAN,
-+    return do_vfp_3op_hp(s, gen_VNMLS_hp, a->vd, a->vn, a->vm, true);
+     .version_id = 1,
-+}
+@@ -XXX,XX +XXX,XX @@ static void cprman_class_init(ObjectClass *klass, void *data)
 +
  static void gen_VNMLS_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
  {
-     /*
+     DeviceClass *dc = DEVICE_CLASS(klass);
-@@ -XXX,XX +XXX,XX @@ static bool trans_VNMLS_dp(DisasContext *s, arg_VNMLS_dp *a)
-     return do_vfp_3op_dp(s, gen_VNMLS_dp, a->vd, a->vn, a->vm, true);
++    dc->realize = cprman_realize;
      dc->reset = cprman_reset;
      dc->vmsd = &cprman_vmstate;
      device_class_set_props(dc, cprman_properties);
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_info = {
  static void cprman_register_types(void)
  {
      type_register_static(&cprman_info);
 +    type_register_static(&cprman_pll_info);
  }
-+static void gen_VNMLA_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+ type_init(cprman_register_types);
 +{
 +    /* VNMLA: -fd + -(fn * fm) */
 +    TCGv_i32 tmp = tcg_temp_new_i32();
 +
 +    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
 +    gen_helper_vfp_negh(tmp, tmp);
 +    gen_helper_vfp_negh(vd, vd);
 +    gen_helper_vfp_addh(vd, vd, tmp, fpst);
 +    tcg_temp_free_i32(tmp);
 +}
 +
 +static bool trans_VNMLA_hp(DisasContext *s, arg_VNMLA_sp *a)
 +{
 +    return do_vfp_3op_hp(s, gen_VNMLA_hp, a->vd, a->vn, a->vm, true);
 +}
 +
  static void gen_VNMLA_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
  {
      /* VNMLA: -fd + -(fn * fm) */
@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_dp(DisasContext *s, arg_VMUL_dp *a)
      return do_vfp_3op_dp(s, gen_helper_vfp_muld, a->vd, a->vn, a->vm, false);
  }
 +static void gen_VNMUL_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
 +{
 +    /* VNMUL: -(fn * fm) */
 +    gen_helper_vfp_mulh(vd, vn, vm, fpst);
 +    gen_helper_vfp_negh(vd, vd);
 +}
 +
 +static bool trans_VNMUL_hp(DisasContext *s, arg_VNMUL_sp *a)
 +{
 +    return do_vfp_3op_hp(s, gen_VNMUL_hp, a->vd, a->vn, a->vm, false);
 +}
 +
  static void gen_VNMUL_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
  {
      /* VNMUL: -(fn * fm) */
 --
 .20.1

-[PULL 10/47] target/arm: Implement VFP fp16 VCMP
+[PULL 36/48] hw/misc/bcm2835_cprman: implement PLLs behaviour
-Implement fp16 version of VCMP.
+From: Luc Michel <luc@lmichel.fr>
+The CPRMAN PLLs generate a clock based on a prescaler, a multiplier and
+a divider. The prescaler doubles the parent (xosc) frequency, then the
+multiplier/divider are applied. The multiplier has an integer and a
+fractional part.
+This commit also implements the CPRMAN CM_LOCK register. This register
+reports which PLL is currently locked. We consider a PLL has being
+locked as soon as it is enabled (on real hardware, there is a delay
+after turning a PLL on, for it to stabilize).
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-11-peter.maydell@linaro.org
 ---
- target/arm/helper.h            |  2 ++
+ include/hw/misc/bcm2835_cprman_internals.h |  8 +++
- target/arm/vfp.decode          |  2 ++
+ hw/misc/bcm2835_cprman.c                   | 64 +++++++++++++++++++++-
- target/arm/vfp_helper.c        | 15 +++++++------
+files changed, 71 insertions(+), 1 deletion(-)
  target/arm/translate-vfp.c.inc | 39 ++++++++++++++++++++++++++++++++++
 files changed, 51 insertions(+), 7 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/bcm2835_cprman_internals.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/bcm2835_cprman_internals.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(vfp_absd, f64, f64)
+@@ -XXX,XX +XXX,XX @@ REG32(A2W_PLLD_FRAC, 0x1240)
- DEF_HELPER_2(vfp_sqrth, f16, f16, env)
+ REG32(A2W_PLLH_FRAC, 0x1260)
- DEF_HELPER_2(vfp_sqrts, f32, f32, env)
+ REG32(A2W_PLLB_FRAC, 0x12e0)
- DEF_HELPER_2(vfp_sqrtd, f64, f64, env)
-+DEF_HELPER_3(vfp_cmph, void, f16, f16, env)
++/* misc registers */
- DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
++REG32(CM_LOCK, 0x114)
- DEF_HELPER_3(vfp_cmpd, void, f64, f64, env)
++    FIELD(CM_LOCK, FLOCKH, 12, 1)
-+DEF_HELPER_3(vfp_cmpeh, void, f16, f16, env)
++    FIELD(CM_LOCK, FLOCKD, 11, 1)
- DEF_HELPER_3(vfp_cmpes, void, f32, f32, env)
++    FIELD(CM_LOCK, FLOCKC, 10, 1)
- DEF_HELPER_3(vfp_cmped, void, f64, f64, env)
++    FIELD(CM_LOCK, FLOCKB, 9, 1)
++    FIELD(CM_LOCK, FLOCKA, 8, 1)
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
++
  /*
   * This field is common to all registers. Each register write value must match
   * the CPRMAN_PASSWORD magic value in its 8 MSB.
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/hw/misc/bcm2835_cprman.c
-+++ b/target/arm/vfp.decode
++++ b/hw/misc/bcm2835_cprman.c
-@@ -XXX,XX +XXX,XX @@ VSQRT_hp     ---- 1110 1.11 0001 .... 1001 11.0 ....        @vfp_dm_ss
+@@ -XXX,XX +XXX,XX @@
- VSQRT_sp     ---- 1110 1.11 0001 .... 1010 11.0 ....        @vfp_dm_ss
- VSQRT_dp     ---- 1110 1.11 0001 .... 1011 11.0 ....        @vfp_dm_dd
+ /* PLL */
-+VCMP_hp      ---- 1110 1.11 010 z:1 .... 1001 e:1 1.0 .... \
++static bool pll_is_locked(const CprmanPllState *pll)
 +             vd=%vd_sp vm=%vm_sp
  VCMP_sp      ---- 1110 1.11 010 z:1 .... 1010 e:1 1.0 .... \
               vd=%vd_sp vm=%vm_sp
  VCMP_dp      ---- 1110 1.11 010 z:1 .... 1011 e:1 1.0 .... \
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ static void softfloat_to_vfp_compare(CPUARMState *env, FloatRelation cmp)
  }
  /* XXX: check quiet/signaling case */
 -#define DO_VFP_cmp(p, type) \
 -void VFP_HELPER(cmp, p)(type a, type b, CPUARMState *env)  \
 +#define DO_VFP_cmp(P, FLOATTYPE, ARGTYPE, FPST) \
 +void VFP_HELPER(cmp, P)(ARGTYPE a, ARGTYPE b, CPUARMState *env)  \
  { \
      softfloat_to_vfp_compare(env, \
 -        type ## _compare_quiet(a, b, &env->vfp.fp_status)); \
 +        FLOATTYPE ## _compare_quiet(a, b, &env->vfp.FPST)); \
  } \
 -void VFP_HELPER(cmpe, p)(type a, type b, CPUARMState *env) \
 +void VFP_HELPER(cmpe, P)(ARGTYPE a, ARGTYPE b, CPUARMState *env) \
  { \
      softfloat_to_vfp_compare(env, \
 -        type ## _compare(a, b, &env->vfp.fp_status)); \
 +        FLOATTYPE ## _compare(a, b, &env->vfp.FPST)); \
  }
 -DO_VFP_cmp(s, float32)
 -DO_VFP_cmp(d, float64)
 +DO_VFP_cmp(h, float16, dh_ctype_f16, fp_status_f16)
 +DO_VFP_cmp(s, float32, float32, fp_status)
 +DO_VFP_cmp(d, float64, float64, fp_status)
  #undef DO_VFP_cmp
  /* Integer to float and float to integer conversions */
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ DO_VFP_2OP(VSQRT, hp, gen_VSQRT_hp)
  DO_VFP_2OP(VSQRT, sp, gen_VSQRT_sp)
  DO_VFP_2OP(VSQRT, dp, gen_VSQRT_dp)
 +static bool trans_VCMP_hp(DisasContext *s, arg_VCMP_sp *a)
 +{
-+    TCGv_i32 vd, vm;
++    return !FIELD_EX32(*pll->reg_a2w_ctrl, A2W_PLLx_CTRL, PWRDN)
 +        && !FIELD_EX32(*pll->reg_cm, CM_PLLx, ANARST);
 +}
 +
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+ static void pll_update(CprmanPllState *pll)
-+        return false;
+ {
 -    clock_update(pll->out, 0);
 +    uint64_t freq, ndiv, fdiv, pdiv;
 +
 +    if (!pll_is_locked(pll)) {
 +        clock_update(pll->out, 0);
 +        return;
 +    }
 +
-+    /* Vm/M bits must be zero for the Z variant */
++    pdiv = FIELD_EX32(*pll->reg_a2w_ctrl, A2W_PLLx_CTRL, PDIV);
-+    if (a->z && a->vm != 0) {
++
-+        return false;
++    if (!pdiv) {
 +        clock_update(pll->out, 0);
 +        return;
 +    }
 +
-+    if (!vfp_access_check(s)) {
++    ndiv = FIELD_EX32(*pll->reg_a2w_ctrl, A2W_PLLx_CTRL, NDIV);
-+        return true;
++    fdiv = FIELD_EX32(*pll->reg_a2w_frac, A2W_PLLx_FRAC, FRAC);
 +
 +    if (pll->reg_a2w_ana[1] & pll->prediv_mask) {
 +        /* The prescaler doubles the parent frequency */
 +        ndiv *= 2;
 +        fdiv *= 2;
 +    }
 +
-+    vd = tcg_temp_new_i32();
++    /*
-+    vm = tcg_temp_new_i32();
++     * We have a multiplier with an integer part (ndiv) and a fractional part
 +     * (fdiv), and a divider (pdiv).
 +     */
 +    freq = clock_get_hz(pll->xosc_in) *
 +        ((ndiv << R_A2W_PLLx_FRAC_FRAC_LENGTH) + fdiv);
 +    freq /= pdiv;
 +    freq >>= R_A2W_PLLx_FRAC_FRAC_LENGTH;
 +
-+    neon_load_reg32(vd, a->vd);
++    clock_update_hz(pll->out, freq);
-+    if (a->z) {
+ }
-+        tcg_gen_movi_i32(vm, 0);
-+    } else {
+ static void pll_xosc_update(void *opaque)
-+        neon_load_reg32(vm, a->vm);
+@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_info = {
  /* CPRMAN "top level" model */
 +static uint32_t get_cm_lock(const BCM2835CprmanState *s)
 +{
 +    static const int CM_LOCK_MAPPING[CPRMAN_NUM_PLL] = {
 +        [CPRMAN_PLLA] = R_CM_LOCK_FLOCKA_SHIFT,
 +        [CPRMAN_PLLC] = R_CM_LOCK_FLOCKC_SHIFT,
 +        [CPRMAN_PLLD] = R_CM_LOCK_FLOCKD_SHIFT,
 +        [CPRMAN_PLLH] = R_CM_LOCK_FLOCKH_SHIFT,
 +        [CPRMAN_PLLB] = R_CM_LOCK_FLOCKB_SHIFT,
 +    };
 +
 +    uint32_t r = 0;
 +    size_t i;
 +
 +    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
 +        r |= pll_is_locked(&s->plls[i]) << CM_LOCK_MAPPING[i];
 +    }
 +
-+    if (a->e) {
++    return r;
 +        gen_helper_vfp_cmpeh(vd, vm, cpu_env);
 +    } else {
 +        gen_helper_vfp_cmph(vd, vm, cpu_env);
 +    }
 +
 +    tcg_temp_free_i32(vd);
 +    tcg_temp_free_i32(vm);
 +
 +    return true;
 +}
 +
- static bool trans_VCMP_sp(DisasContext *s, arg_VCMP_sp *a)
+ static uint64_t cprman_read(void *opaque, hwaddr offset,
                              unsigned size)
  {
-     TCGv_i32 vd, vm;
+@@ -XXX,XX +XXX,XX @@ static uint64_t cprman_read(void *opaque, hwaddr offset,
      size_t idx = offset / sizeof(uint32_t);
      switch (idx) {
 +    case R_CM_LOCK:
 +        r = get_cm_lock(s);
 +        break;
 +
      default:
          r = s->regs[idx];
      }
 --
 .20.1

-[PULL 32/47] target/arm: Implement fp16 for Neon VRECPS
+[PULL 37/48] hw/misc/bcm2835_cprman: add a PLL channel skeleton implementation
-Convert the Neon VRECPS insn to using a gvec helper, and
+From: Luc Michel <luc@lmichel.fr>
-use this to implement the fp16 case.
+PLLs are composed of multiple channels. Each channel outputs one clock
-The phrasing of the new float32_recps_nf() is slightly different from
+signal. They are modeled as one device taking the PLL generated clock as
-the old recps_f32() so that it parallels the f16 version; for f16 we
+input, and outputting a new clock.
-can't assume that flush-to-zero is always enabled.
+A channel shares the CM register with its parent PLL, and has its own
 A2W_CTRL register. A write to the CM register will trigger an update of
 the PLL and all its channels, while a write to an A2W_CTRL channel
 register will update the required channel only.
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Luc Michel <luc@lmichel.fr>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-34-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  4 +++-
+ include/hw/misc/bcm2835_cprman.h           |  44 ++++++
- target/arm/vec_helper.c         | 31 +++++++++++++++++++++++++++++++
+ include/hw/misc/bcm2835_cprman_internals.h | 146 +++++++++++++++++++
- target/arm/vfp_helper.c         | 13 -------------
+ hw/misc/bcm2835_cprman.c                   | 155 +++++++++++++++++++--
- target/arm/translate-neon.c.inc | 21 +--------------------
+files changed, 337 insertions(+), 8 deletions(-)
-files changed, 35 insertions(+), 34 deletions(-)
+diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/bcm2835_cprman.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/bcm2835_cprman.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@ typedef enum CprmanPll {
- DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+     CPRMAN_NUM_PLL
- DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
+ } CprmanPll;
--DEF_HELPER_3(recps_f32, f32, env, f32, f32)
++typedef enum CprmanPllChannel {
- DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
++    CPRMAN_PLLA_CHANNEL_DSI0 = 0,
- DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
++    CPRMAN_PLLA_CHANNEL_CORE,
- DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
++    CPRMAN_PLLA_CHANNEL_PER,
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i3
++    CPRMAN_PLLA_CHANNEL_CCP2,
- DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++
- DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_PLLC_CHANNEL_CORE2,
++    CPRMAN_PLLC_CHANNEL_CORE1,
-+DEF_HELPER_FLAGS_5(gvec_recps_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_PLLC_CHANNEL_PER,
-+DEF_HELPER_FLAGS_5(gvec_recps_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_PLLC_CHANNEL_CORE0,
 +
- DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_PLLD_CHANNEL_DSI0,
- DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_PLLD_CHANNEL_CORE,
++    CPRMAN_PLLD_CHANNEL_PER,
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++    CPRMAN_PLLD_CHANNEL_DSI1,
 +
 +    CPRMAN_PLLH_CHANNEL_AUX,
 +    CPRMAN_PLLH_CHANNEL_RCAL,
 +    CPRMAN_PLLH_CHANNEL_PIX,
 +
 +    CPRMAN_PLLB_CHANNEL_ARM,
 +
 +    CPRMAN_NUM_PLL_CHANNEL,
 +} CprmanPllChannel;
 +
  typedef struct CprmanPllState {
      /*< private >*/
      DeviceState parent_obj;
@@ -XXX,XX +XXX,XX @@ typedef struct CprmanPllState {
      Clock *out;
  } CprmanPllState;
 +typedef struct CprmanPllChannelState {
 +    /*< private >*/
 +    DeviceState parent_obj;
 +
 +    /*< public >*/
 +    CprmanPllChannel id;
 +    CprmanPll parent;
 +
 +    uint32_t *reg_cm;
 +    uint32_t hold_mask;
 +    uint32_t load_mask;
 +    uint32_t *reg_a2w_ctrl;
 +    int fixed_divider;
 +
 +    Clock *pll_in;
 +    Clock *out;
 +} CprmanPllChannelState;
 +
  struct BCM2835CprmanState {
      /*< private >*/
      SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
      MemoryRegion iomem;
      CprmanPllState plls[CPRMAN_NUM_PLL];
 +    CprmanPllChannelState channels[CPRMAN_NUM_PLL_CHANNEL];
      uint32_t regs[CPRMAN_NUM_REGS];
      uint32_t xosc_freq;
 diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/include/hw/misc/bcm2835_cprman_internals.h
-+++ b/target/arm/vec_helper.c
++++ b/include/hw/misc/bcm2835_cprman_internals.h
-@@ -XXX,XX +XXX,XX @@ static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
+@@ -XXX,XX +XXX,XX @@
-     return float32_abs(float32_sub(op1, op2, stat));
+ #include "hw/misc/bcm2835_cprman.h"
- }
+ #define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
-+/*
++#define TYPE_CPRMAN_PLL_CHANNEL "bcm2835-cprman-pll-channel"
-+ * Reciprocal step. These are the AArch32 version which uses a
-+ * non-fused multiply-and-subtract.
+ DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
-+ */
+                          TYPE_CPRMAN_PLL)
-+static float16 float16_recps_nf(float16 op1, float16 op2, float_status *stat)
++DECLARE_INSTANCE_CHECKER(CprmanPllChannelState, CPRMAN_PLL_CHANNEL,
-+{
++                         TYPE_CPRMAN_PLL_CHANNEL)
-+    op1 = float16_squash_input_denormal(op1, stat);
-+    op2 = float16_squash_input_denormal(op2, stat);
+ /* Register map */
-+
-+    if ((float16_is_infinity(op1) && float16_is_zero(op2)) ||
+@@ -XXX,XX +XXX,XX @@ REG32(A2W_PLLD_FRAC, 0x1240)
-+        (float16_is_infinity(op2) && float16_is_zero(op1))) {
+ REG32(A2W_PLLH_FRAC, 0x1260)
-+        return float16_two;
+ REG32(A2W_PLLB_FRAC, 0x12e0)
-+    }
-+    return float16_sub(float16_two, float16_mul(op1, op2, stat), stat);
++/* PLL channels */
-+}
++REG32(A2W_PLLA_DSI0, 0x1300)
-+
++    FIELD(A2W_PLLx_CHANNELy, DIV, 0, 8)
-+static float32 float32_recps_nf(float32 op1, float32 op2, float_status *stat)
++    FIELD(A2W_PLLx_CHANNELy, DISABLE, 8, 1)
-+{
++REG32(A2W_PLLA_CORE, 0x1400)
-+    op1 = float32_squash_input_denormal(op1, stat);
++REG32(A2W_PLLA_PER, 0x1500)
-+    op2 = float32_squash_input_denormal(op2, stat);
++REG32(A2W_PLLA_CCP2, 0x1600)
 +
-+    if ((float32_is_infinity(op1) && float32_is_zero(op2)) ||
++REG32(A2W_PLLC_CORE2, 0x1320)
-+        (float32_is_infinity(op2) && float32_is_zero(op1))) {
++REG32(A2W_PLLC_CORE1, 0x1420)
-+        return float32_two;
++REG32(A2W_PLLC_PER, 0x1520)
-+    }
++REG32(A2W_PLLC_CORE0, 0x1620)
-+    return float32_sub(float32_two, float32_mul(op1, op2, stat), stat);
++
-+}
++REG32(A2W_PLLD_DSI0, 0x1340)
-+
++REG32(A2W_PLLD_CORE, 0x1440)
- #define DO_3OP(NAME, FUNC, TYPE) \
++REG32(A2W_PLLD_PER, 0x1540)
- void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
++REG32(A2W_PLLD_DSI1, 0x1640)
- {                                                                          \
++
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_fmaxnum_s, float32_maxnum, float32)
++REG32(A2W_PLLH_AUX, 0x1360)
- DO_3OP(gvec_fminnum_h, float16_minnum, float16)
++REG32(A2W_PLLH_RCAL, 0x1460)
- DO_3OP(gvec_fminnum_s, float32_minnum, float32)
++REG32(A2W_PLLH_PIX, 0x1560)
++REG32(A2W_PLLH_STS, 0x1660)
-+DO_3OP(gvec_recps_nf_h, float16_recps_nf, float16)
++
-+DO_3OP(gvec_recps_nf_s, float32_recps_nf, float32)
++REG32(A2W_PLLB_ARM, 0x13e0)
 +
- #ifdef TARGET_AARCH64
+ /* misc registers */
+ REG32(CM_LOCK, 0x114)
- DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
+     FIELD(CM_LOCK, FLOCKH, 12, 1)
-diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
+@@ -XXX,XX +XXX,XX @@ static inline void set_pll_init_info(BCM2835CprmanState *s,
      pll->reg_a2w_frac = &s->regs[PLL_INIT_INFO[id].a2w_frac_offset];
  }
 +
 +/* PLL channel init info */
 +typedef struct PLLChannelInitInfo {
 +    const char *name;
 +    CprmanPll parent;
 +    size_t cm_offset;
 +    uint32_t cm_hold_mask;
 +    uint32_t cm_load_mask;
 +    size_t a2w_ctrl_offset;
 +    unsigned int fixed_divider;
 +} PLLChannelInitInfo;
 +
 +#define FILL_PLL_CHANNEL_INIT_INFO_common(pll_, channel_)            \
 +    .parent = CPRMAN_ ## pll_,                                       \
 +    .cm_offset = R_CM_ ## pll_,                                      \
 +    .cm_load_mask = R_CM_ ## pll_ ## _ ## LOAD ## channel_ ## _MASK, \
 +    .a2w_ctrl_offset = R_A2W_ ## pll_ ## _ ## channel_
 +
 +#define FILL_PLL_CHANNEL_INIT_INFO(pll_, channel_)                   \
 +    FILL_PLL_CHANNEL_INIT_INFO_common(pll_, channel_),               \
 +    .cm_hold_mask = R_CM_ ## pll_ ## _ ## HOLD ## channel_ ## _MASK, \
 +    .fixed_divider = 1
 +
 +#define FILL_PLL_CHANNEL_INIT_INFO_nohold(pll_, channel_) \
 +    FILL_PLL_CHANNEL_INIT_INFO_common(pll_, channel_),    \
 +    .cm_hold_mask = 0
 +
 +static PLLChannelInitInfo PLL_CHANNEL_INIT_INFO[] = {
 +    [CPRMAN_PLLA_CHANNEL_DSI0] = {
 +        .name = "plla-dsi0",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLA, DSI0),
 +    },
 +    [CPRMAN_PLLA_CHANNEL_CORE] = {
 +        .name = "plla-core",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLA, CORE),
 +    },
 +    [CPRMAN_PLLA_CHANNEL_PER] = {
 +        .name = "plla-per",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLA, PER),
 +    },
 +    [CPRMAN_PLLA_CHANNEL_CCP2] = {
 +        .name = "plla-ccp2",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLA, CCP2),
 +    },
 +
 +    [CPRMAN_PLLC_CHANNEL_CORE2] = {
 +        .name = "pllc-core2",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLC, CORE2),
 +    },
 +    [CPRMAN_PLLC_CHANNEL_CORE1] = {
 +        .name = "pllc-core1",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLC, CORE1),
 +    },
 +    [CPRMAN_PLLC_CHANNEL_PER] = {
 +        .name = "pllc-per",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLC, PER),
 +    },
 +    [CPRMAN_PLLC_CHANNEL_CORE0] = {
 +        .name = "pllc-core0",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLC, CORE0),
 +    },
 +
 +    [CPRMAN_PLLD_CHANNEL_DSI0] = {
 +        .name = "plld-dsi0",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLD, DSI0),
 +    },
 +    [CPRMAN_PLLD_CHANNEL_CORE] = {
 +        .name = "plld-core",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLD, CORE),
 +    },
 +    [CPRMAN_PLLD_CHANNEL_PER] = {
 +        .name = "plld-per",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLD, PER),
 +    },
 +    [CPRMAN_PLLD_CHANNEL_DSI1] = {
 +        .name = "plld-dsi1",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLD, DSI1),
 +    },
 +
 +    [CPRMAN_PLLH_CHANNEL_AUX] = {
 +        .name = "pllh-aux",
 +        .fixed_divider = 1,
 +        FILL_PLL_CHANNEL_INIT_INFO_nohold(PLLH, AUX),
 +    },
 +    [CPRMAN_PLLH_CHANNEL_RCAL] = {
 +        .name = "pllh-rcal",
 +        .fixed_divider = 10,
 +        FILL_PLL_CHANNEL_INIT_INFO_nohold(PLLH, RCAL),
 +    },
 +    [CPRMAN_PLLH_CHANNEL_PIX] = {
 +        .name = "pllh-pix",
 +        .fixed_divider = 10,
 +        FILL_PLL_CHANNEL_INIT_INFO_nohold(PLLH, PIX),
 +    },
 +
 +    [CPRMAN_PLLB_CHANNEL_ARM] = {
 +        .name = "pllb-arm",
 +        FILL_PLL_CHANNEL_INIT_INFO(PLLB, ARM),
 +    },
 +};
 +
 +#undef FILL_PLL_CHANNEL_INIT_INFO_nohold
 +#undef FILL_PLL_CHANNEL_INIT_INFO
 +#undef FILL_PLL_CHANNEL_INIT_INFO_common
 +
 +static inline void set_pll_channel_init_info(BCM2835CprmanState *s,
 +                                             CprmanPllChannelState *channel,
 +                                             CprmanPllChannel id)
 +{
 +    channel->id = id;
 +    channel->parent = PLL_CHANNEL_INIT_INFO[id].parent;
 +    channel->reg_cm = &s->regs[PLL_CHANNEL_INIT_INFO[id].cm_offset];
 +    channel->hold_mask = PLL_CHANNEL_INIT_INFO[id].cm_hold_mask;
 +    channel->load_mask = PLL_CHANNEL_INIT_INFO[id].cm_load_mask;
 +    channel->reg_a2w_ctrl = &s->regs[PLL_CHANNEL_INIT_INFO[id].a2w_ctrl_offset];
 +    channel->fixed_divider = PLL_CHANNEL_INIT_INFO[id].fixed_divider;
 +}
 +
  #endif
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp_helper.c
+--- a/hw/misc/bcm2835_cprman.c
-+++ b/target/arm/vfp_helper.c
++++ b/hw/misc/bcm2835_cprman.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
+@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_info = {
  };
 +/* PLL channel */
 +
 +static void pll_channel_update(CprmanPllChannelState *channel)
 +{
 +    clock_update(channel->out, 0);
 +}
 +
 +/* Update a PLL and all its channels */
 +static void pll_update_all_channels(BCM2835CprmanState *s,
 +                                    CprmanPllState *pll)
 +{
 +    size_t i;
 +
 +    pll_update(pll);
 +
 +    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
 +        CprmanPllChannelState *channel = &s->channels[i];
 +        if (channel->parent == pll->id) {
 +            pll_channel_update(channel);
 +        }
 +    }
 +}
 +
 +static void pll_channel_pll_in_update(void *opaque)
 +{
 +    pll_channel_update(CPRMAN_PLL_CHANNEL(opaque));
 +}
 +
 +static void pll_channel_init(Object *obj)
 +{
 +    CprmanPllChannelState *s = CPRMAN_PLL_CHANNEL(obj);
 +
 +    s->pll_in = qdev_init_clock_in(DEVICE(s), "pll-in",
 +                                   pll_channel_pll_in_update, s);
 +    s->out = qdev_init_clock_out(DEVICE(s), "out");
 +}
 +
 +static const VMStateDescription pll_channel_vmstate = {
 +    .name = TYPE_CPRMAN_PLL_CHANNEL,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_CLOCK(pll_in, CprmanPllChannelState),
 +        VMSTATE_END_OF_LIST()
 +    }
 +};
 +
 +static void pll_channel_class_init(ObjectClass *klass, void *data)
 +{
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    dc->vmsd = &pll_channel_vmstate;
 +}
 +
 +static const TypeInfo cprman_pll_channel_info = {
 +    .name = TYPE_CPRMAN_PLL_CHANNEL,
 +    .parent = TYPE_DEVICE,
 +    .instance_size = sizeof(CprmanPllChannelState),
 +    .class_init = pll_channel_class_init,
 +    .instance_init = pll_channel_init,
 +};
 +
 +
  /* CPRMAN "top level" model */
  static uint32_t get_cm_lock(const BCM2835CprmanState *s)
@@ -XXX,XX +XXX,XX @@ static uint64_t cprman_read(void *opaque, hwaddr offset,
      return r;
  }
--float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
+-#define CASE_PLL_REGS(pll_)       \
--{
+-    case R_CM_ ## pll_:           \
--    float_status *s = &env->vfp.standard_fp_status;
++static inline void update_pll_and_channels_from_cm(BCM2835CprmanState *s,
--    if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
++                                                   size_t idx)
--        (float32_is_infinity(b) && float32_is_zero_or_denormal(a))) {
++{
--        if (!(float32_is_zero(a) || float32_is_zero(b))) {
++    size_t i;
--            float_raise(float_flag_input_denormal, s);
++
--        }
++    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
--        return float32_two;
++        if (PLL_INIT_INFO[i].cm_offset == idx) {
--    }
++            pll_update_all_channels(s, &s->plls[i]);
--    return float32_sub(float32_two, float32_mul(a, b, s), s);
++            return;
--}
++        }
--
++    }
- float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
++}
 +
 +static inline void update_channel_from_a2w(BCM2835CprmanState *s, size_t idx)
 +{
 +    size_t i;
 +
 +    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
 +        if (PLL_CHANNEL_INIT_INFO[i].a2w_ctrl_offset == idx) {
 +            pll_channel_update(&s->channels[i]);
 +            return;
 +        }
 +    }
 +}
 +
 +#define CASE_PLL_A2W_REGS(pll_) \
      case R_A2W_ ## pll_ ## _CTRL: \
      case R_A2W_ ## pll_ ## _ANA0: \
      case R_A2W_ ## pll_ ## _ANA1: \
@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
      s->regs[idx] = value;
      switch (idx) {
 -    CASE_PLL_REGS(PLLA) :
 +    case R_CM_PLLA ... R_CM_PLLH:
 +    case R_CM_PLLB:
 +        /*
 +         * A given CM_PLLx register is shared by both the PLL and the channels
 +         * of this PLL.
 +         */
 +        update_pll_and_channels_from_cm(s, idx);
 +        break;
 +
 +    CASE_PLL_A2W_REGS(PLLA) :
          pll_update(&s->plls[CPRMAN_PLLA]);
          break;
 -    CASE_PLL_REGS(PLLC) :
 +    CASE_PLL_A2W_REGS(PLLC) :
          pll_update(&s->plls[CPRMAN_PLLC]);
          break;
 -    CASE_PLL_REGS(PLLD) :
 +    CASE_PLL_A2W_REGS(PLLD) :
          pll_update(&s->plls[CPRMAN_PLLD]);
          break;
 -    CASE_PLL_REGS(PLLH) :
 +    CASE_PLL_A2W_REGS(PLLH) :
          pll_update(&s->plls[CPRMAN_PLLH]);
          break;
 -    CASE_PLL_REGS(PLLB) :
 +    CASE_PLL_A2W_REGS(PLLB) :
          pll_update(&s->plls[CPRMAN_PLLB]);
          break;
 +
 +    case R_A2W_PLLA_DSI0:
 +    case R_A2W_PLLA_CORE:
 +    case R_A2W_PLLA_PER:
 +    case R_A2W_PLLA_CCP2:
 +    case R_A2W_PLLC_CORE2:
 +    case R_A2W_PLLC_CORE1:
 +    case R_A2W_PLLC_PER:
 +    case R_A2W_PLLC_CORE0:
 +    case R_A2W_PLLD_DSI0:
 +    case R_A2W_PLLD_CORE:
 +    case R_A2W_PLLD_PER:
 +    case R_A2W_PLLD_DSI1:
 +    case R_A2W_PLLH_AUX:
 +    case R_A2W_PLLH_RCAL:
 +    case R_A2W_PLLH_PIX:
 +    case R_A2W_PLLB_ARM:
 +        update_channel_from_a2w(s, idx);
 +        break;
      }
  }
 -#undef CASE_PLL_REGS
 +#undef CASE_PLL_A2W_REGS
  static const MemoryRegionOps cprman_ops = {
      .read = cprman_read,
@@ -XXX,XX +XXX,XX @@ static void cprman_reset(DeviceState *dev)
          device_cold_reset(DEVICE(&s->plls[i]));
      }
 +    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
 +        device_cold_reset(DEVICE(&s->channels[i]));
 +    }
 +
      clock_update_hz(s->xosc, s->xosc_freq);
  }
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
          set_pll_init_info(s, &s->plls[i], i);
      }
 +    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
 +        object_initialize_child(obj, PLL_CHANNEL_INIT_INFO[i].name,
 +                                &s->channels[i],
 +                                TYPE_CPRMAN_PLL_CHANNEL);
 +        set_pll_channel_init_info(s, &s->channels[i], i);
 +    }
 +
      s->xosc = clock_new(obj, "xosc");
      memory_region_init_io(&s->iomem, obj, &cprman_ops,
@@ -XXX,XX +XXX,XX @@ static void cprman_realize(DeviceState *dev, Error **errp)
              return;
          }
      }
 +
 +    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
 +        CprmanPllChannelState *channel = &s->channels[i];
 +        CprmanPll parent = PLL_CHANNEL_INIT_INFO[i].parent;
 +        Clock *parent_clk = s->plls[parent].out;
 +
 +        clock_set_source(channel->pll_in, parent_clk);
 +
 +        if (!qdev_realize(DEVICE(channel), NULL, errp)) {
 +            return;
 +        }
 +    }
  }
  static const VMStateDescription cprman_vmstate = {
@@ -XXX,XX +XXX,XX @@ static void cprman_register_types(void)
  {
-     float_status *s = &env->vfp.standard_fp_status;
+     type_register_static(&cprman_info);
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
+     type_register_static(&cprman_pll_info);
-index XXXXXXX..XXXXXXX 100644
++    type_register_static(&cprman_pll_channel_info);
---- a/target/arm/translate-neon.c.inc
+ }
-+++ b/target/arm/translate-neon.c.inc
-@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMLA, gen_helper_gvec_fmla_s, gen_helper_gvec_fmla_h)
+ type_init(cprman_register_types);
  DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
  DO_3S_FP_GVEC(VFMA, gen_helper_gvec_vfma_s, gen_helper_gvec_vfma_h)
  DO_3S_FP_GVEC(VFMS, gen_helper_gvec_vfms_s, gen_helper_gvec_vfms_h)
 +DO_3S_FP_GVEC(VRECPS, gen_helper_gvec_recps_nf_s, gen_helper_gvec_recps_nf_h)
  WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
  WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
      return do_3same(s, a, gen_VMINNM_fp32_3s);
  }
 -WRAP_ENV_FN(gen_VRECPS_tramp, gen_helper_recps_f32)
 -
 -static void gen_VRECPS_fp_3s(unsigned vece, uint32_t rd_ofs,
 -                             uint32_t rn_ofs, uint32_t rm_ofs,
 -                             uint32_t oprsz, uint32_t maxsz)
 -{
 -    static const GVecGen3 ops = { .fni4 = gen_VRECPS_tramp };
 -    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
 -}
 -
 -static bool trans_VRECPS_fp_3s(DisasContext *s, arg_3same *a)
 -{
 -    if (a->size != 0) {
 -        /* TODO fp16 support */
 -        return false;
 -    }
 -
 -    return do_3same(s, a, gen_VRECPS_fp_3s);
 -}
 -
  WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
  static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
 --
 .20.1

-[PULL 18/47] target/arm: Implement VFP fp16 VRINT*
+[PULL 38/48] hw/misc/bcm2835_cprman: implement PLL channels behaviour
-Implement the fp16 version of the VFP VRINT* insns.
+From: Luc Michel <luc@lmichel.fr>
+A PLL channel is able to further divide the generated PLL frequency.
+The divider is given in the CTRL_A2W register. Some channels have an
+additional fixed divider which is always applied to the signal.
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-19-peter.maydell@linaro.org
 ---
- target/arm/helper.h            |  2 +
+ hw/misc/bcm2835_cprman.c | 33 ++++++++++++++++++++++++++++++++-
- target/arm/vfp-uncond.decode   |  6 ++-
+file changed, 32 insertions(+), 1 deletion(-)
  target/arm/vfp.decode          |  3 ++
  target/arm/vfp_helper.c        | 21 ++++++++
  target/arm/translate-vfp.c.inc | 98 +++++++++++++++++++++++++++++++---
 files changed, 122 insertions(+), 8 deletions(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/hw/misc/bcm2835_cprman.c
-+++ b/target/arm/helper.h
++++ b/hw/misc/bcm2835_cprman.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(shr_cc, i32, env, i32, i32)
+@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_info = {
- DEF_HELPER_3(sar_cc, i32, env, i32, i32)
- DEF_HELPER_3(ror_cc, i32, env, i32, i32)
+ /* PLL channel */
-+DEF_HELPER_FLAGS_2(rinth_exact, TCG_CALL_NO_RWG, f16, f16, ptr)
++static bool pll_channel_is_enabled(CprmanPllChannelState *channel)
  DEF_HELPER_FLAGS_2(rints_exact, TCG_CALL_NO_RWG, f32, f32, ptr)
  DEF_HELPER_FLAGS_2(rintd_exact, TCG_CALL_NO_RWG, f64, f64, ptr)
 +DEF_HELPER_FLAGS_2(rinth, TCG_CALL_NO_RWG, f16, f16, ptr)
  DEF_HELPER_FLAGS_2(rints, TCG_CALL_NO_RWG, f32, f32, ptr)
  DEF_HELPER_FLAGS_2(rintd, TCG_CALL_NO_RWG, f64, f64, ptr)
 diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp-uncond.decode
 +++ b/target/arm/vfp-uncond.decode
@@ -XXX,XX +XXX,XX @@ VMINNM_sp   1111 1110 1.00 .... .... 1010 .1.0 ....         @vfp_dnm_s
  VMAXNM_dp   1111 1110 1.00 .... .... 1011 .0.0 ....         @vfp_dnm_d
  VMINNM_dp   1111 1110 1.00 .... .... 1011 .1.0 ....         @vfp_dnm_d
 +VRINT       1111 1110 1.11 10 rm:2 .... 1001 01.0 .... \
 +            vm=%vm_sp vd=%vd_sp sz=1
  VRINT       1111 1110 1.11 10 rm:2 .... 1010 01.0 .... \
 -            vm=%vm_sp vd=%vd_sp dp=0
 +            vm=%vm_sp vd=%vd_sp sz=2
  VRINT       1111 1110 1.11 10 rm:2 .... 1011 01.0 .... \
 -            vm=%vm_dp vd=%vd_dp dp=1
 +            vm=%vm_dp vd=%vd_dp sz=3
  # VCVT float to int with specified rounding mode; Vd is always single-precision
  VCVT        1111 1110 1.11 11 rm:2 .... 1001 op:1 1.0 .... \
 diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp.decode
 +++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VCVT_f16_f32 ---- 1110 1.11 0011 .... 1010 t:1 1.0 .... \
  VCVT_f16_f64 ---- 1110 1.11 0011 .... 1011 t:1 1.0 .... \
               vd=%vd_sp vm=%vm_dp
 +VRINTR_hp    ---- 1110 1.11 0110 .... 1001 01.0 ....        @vfp_dm_ss
  VRINTR_sp    ---- 1110 1.11 0110 .... 1010 01.0 ....        @vfp_dm_ss
  VRINTR_dp    ---- 1110 1.11 0110 .... 1011 01.0 ....        @vfp_dm_dd
 +VRINTZ_hp    ---- 1110 1.11 0110 .... 1001 11.0 ....        @vfp_dm_ss
  VRINTZ_sp    ---- 1110 1.11 0110 .... 1010 11.0 ....        @vfp_dm_ss
  VRINTZ_dp    ---- 1110 1.11 0110 .... 1011 11.0 ....        @vfp_dm_dd
 +VRINTX_hp    ---- 1110 1.11 0111 .... 1001 01.0 ....        @vfp_dm_ss
  VRINTX_sp    ---- 1110 1.11 0111 .... 1010 01.0 ....        @vfp_dm_ss
  VRINTX_dp    ---- 1110 1.11 0111 .... 1011 01.0 ....        @vfp_dm_dd
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 VFP_HELPER(muladd, d)(float64 a, float64 b, float64 c, void *fpstp)
  }
  /* ARMv8 round to integral */
 +dh_ctype_f16 HELPER(rinth_exact)(dh_ctype_f16 x, void *fp_status)
 +{
-+    return float16_round_to_int(x, fp_status);
++    /*
 +     * XXX I'm not sure of the purpose of the LOAD field. The Linux driver does
 +     * not set it when enabling the channel, but does clear it when disabling
 +     * it.
 +     */
 +    return !FIELD_EX32(*channel->reg_a2w_ctrl, A2W_PLLx_CHANNELy, DISABLE)
 +        && !(*channel->reg_cm & channel->hold_mask);
 +}
 +
- float32 HELPER(rints_exact)(float32 x, void *fp_status)
+ static void pll_channel_update(CprmanPllChannelState *channel)
  {
-     return float32_round_to_int(x, fp_status);
+-    clock_update(channel->out, 0);
-@@ -XXX,XX +XXX,XX @@ float64 HELPER(rintd_exact)(float64 x, void *fp_status)
++    uint64_t freq, div;
      return float64_round_to_int(x, fp_status);
  }
 +dh_ctype_f16 HELPER(rinth)(dh_ctype_f16 x, void *fp_status)
 +{
 +    int old_flags = get_float_exception_flags(fp_status), new_flags;
 +    float16 ret;
 +
-+    ret = float16_round_to_int(x, fp_status);
++    if (!pll_channel_is_enabled(channel)) {
-+
++        clock_update(channel->out, 0);
-+    /* Suppress any inexact exceptions the conversion produced */
++        return;
 +    if (!(old_flags & float_flag_inexact)) {
 +        new_flags = get_float_exception_flags(fp_status);
 +        set_float_exception_flags(new_flags & ~float_flag_inexact, fp_status);
 +    }
 +
-+    return ret;
++    div = FIELD_EX32(*channel->reg_a2w_ctrl, A2W_PLLx_CHANNELy, DIV);
 +}
 +
- float32 HELPER(rints)(float32 x, void *fp_status)
++    if (!div) {
- {
++        /*
-     int old_flags = get_float_exception_flags(fp_status), new_flags;
++         * It seems that when the divider value is 0, it is considered as
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
++         * being maximum by the hardware (see the Linux driver).
-index XXXXXXX..XXXXXXX 100644
++         */
---- a/target/arm/translate-vfp.c.inc
++        div = R_A2W_PLLx_CHANNELy_DIV_MASK;
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static const uint8_t fp_decode_rm[] = {
  static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
  {
      uint32_t rd, rm;
 -    bool dp = a->dp;
 +    int sz = a->sz;
      TCGv_ptr fpst;
      TCGv_i32 tcg_rmode;
      int rounding = fp_decode_rm[a->rm];
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
          return false;
      }
 -    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
 +    if (sz == 3 && !dc_isar_feature(aa32_fpdp_v2, s)) {
 +        return false;
 +    }
 +
-+    if (sz == 1 && !dc_isar_feature(aa32_fp16_arith, s)) {
++    /* Some channels have an additional fixed divider */
-         return false;
++    freq = clock_get_hz(channel->pll_in) / (div * channel->fixed_divider);
-     }
++
++    clock_update_hz(channel->out, freq);
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
 +    if (sz == 3 && !dc_isar_feature(aa32_simd_r32, s) &&
          ((a->vm | a->vd) & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
          return true;
      }
 -    fpst = fpstatus_ptr(FPST_FPCR);
 +    if (sz == 1) {
 +        fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    } else {
 +        fpst = fpstatus_ptr(FPST_FPCR);
 +    }
      tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rounding));
      gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
 -    if (dp) {
 +    if (sz == 3) {
          TCGv_i64 tcg_op;
          TCGv_i64 tcg_res;
          tcg_op = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
          tcg_op = tcg_temp_new_i32();
          tcg_res = tcg_temp_new_i32();
          neon_load_reg32(tcg_op, rm);
 -        gen_helper_rints(tcg_res, tcg_op, fpst);
 +        if (sz == 1) {
 +            gen_helper_rinth(tcg_res, tcg_op, fpst);
 +        } else {
 +            gen_helper_rints(tcg_res, tcg_op, fpst);
 +        }
          neon_store_reg32(tcg_res, rd);
          tcg_temp_free_i32(tcg_op);
          tcg_temp_free_i32(tcg_res);
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
      return true;
  }
-+static bool trans_VRINTR_hp(DisasContext *s, arg_VRINTR_sp *a)
+ /* Update a PLL and all its channels */
 +{
 +    TCGv_ptr fpst;
 +    TCGv_i32 tmp;
 +
 +    if (!dc_isar_feature(aa32_fp16_arith, s)) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    tmp = tcg_temp_new_i32();
 +    neon_load_reg32(tmp, a->vm);
 +    fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    gen_helper_rinth(tmp, tmp, fpst);
 +    neon_store_reg32(tmp, a->vd);
 +    tcg_temp_free_ptr(fpst);
 +    tcg_temp_free_i32(tmp);
 +    return true;
 +}
 +
  static bool trans_VRINTR_sp(DisasContext *s, arg_VRINTR_sp *a)
  {
      TCGv_ptr fpst;
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
      return true;
  }
 +static bool trans_VRINTZ_hp(DisasContext *s, arg_VRINTZ_sp *a)
 +{
 +    TCGv_ptr fpst;
 +    TCGv_i32 tmp;
 +    TCGv_i32 tcg_rmode;
 +
 +    if (!dc_isar_feature(aa32_fp16_arith, s)) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    tmp = tcg_temp_new_i32();
 +    neon_load_reg32(tmp, a->vm);
 +    fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    tcg_rmode = tcg_const_i32(float_round_to_zero);
 +    gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
 +    gen_helper_rinth(tmp, tmp, fpst);
 +    gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
 +    neon_store_reg32(tmp, a->vd);
 +    tcg_temp_free_ptr(fpst);
 +    tcg_temp_free_i32(tcg_rmode);
 +    tcg_temp_free_i32(tmp);
 +    return true;
 +}
 +
  static bool trans_VRINTZ_sp(DisasContext *s, arg_VRINTZ_sp *a)
  {
      TCGv_ptr fpst;
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
      return true;
  }
 +static bool trans_VRINTX_hp(DisasContext *s, arg_VRINTX_sp *a)
 +{
 +    TCGv_ptr fpst;
 +    TCGv_i32 tmp;
 +
 +    if (!dc_isar_feature(aa32_fp16_arith, s)) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    tmp = tcg_temp_new_i32();
 +    neon_load_reg32(tmp, a->vm);
 +    fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    gen_helper_rinth_exact(tmp, tmp, fpst);
 +    neon_store_reg32(tmp, a->vd);
 +    tcg_temp_free_ptr(fpst);
 +    tcg_temp_free_i32(tmp);
 +    return true;
 +}
 +
  static bool trans_VRINTX_sp(DisasContext *s, arg_VRINTX_sp *a)
  {
      TCGv_ptr fpst;
 --
 .20.1

-[PULL 25/47] target/arm: Implement fp16 for VCEQ, VCGE, VCGT comparisons
+[PULL 39/48] hw/misc/bcm2835_cprman: add a clock mux skeleton implementation
-Convert the Neon floating-point vector comparison ops VCEQ,
+From: Luc Michel <luc@lmichel.fr>
-VCGE and VCGT over to using a gvec helper and use this to
-implement the fp16 case.
+The clock multiplexers are the last clock stage in the CPRMAN. Each mux
+outputs one clock signal that goes out of the CPRMAN to the SoC
-(We put the float16_ceq() etc functions above the DO_2OP()
+peripherals.
-macro definition because later when we convert the
-compare-against-zero instructions we'll want their
+Each mux has at most 10 sources. The sources 0 to 3 are common to all
-definitions to be visible at that point in the source file.)
+muxes. They are:
+. ground (no clock signal)
 . the main oscillator (xosc)
 . "test debug 0" clock
 . "test debug 1" clock
 Test debug 0 and 1 are actual clock muxes that can be used as sources to
 other muxes (for debug purpose).
 Sources 4 to 9 are mux specific and can be unpopulated (grounded). Those
 sources are fed by the PLL channels outputs.
 One corner case exists for DSI0E and DSI0P muxes. They have their source
 number 4 connected to an intermediate multiplexer that can select
 between PLLA-DSI0 and PLLD-DSI0 channel. This multiplexer is called
 DSI0HSCK and is not a clock mux as such. It is really a simple mux from
 the hardware point of view (see https://elinux.org/The_Undocumented_Pi).
 This mux is not implemented in this commit.
 Note that there is some muxes for which sources are unknown (because of
 a lack of documentation). For those cases all the sources are connected
 to ground in this implementation.
 Each clock mux output is exported by the CPRMAN at the qdev level,
 adding the suffix '-out' to the mux name to form the output clock name.
 (E.g. the 'uart' mux sees its output exported as 'uart-out' at the
 CPRMAN level.)
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Luc Michel <luc@lmichel.fr>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-27-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  9 +++++++
+ include/hw/misc/bcm2835_cprman.h           |  85 +++++
- target/arm/vec_helper.c         | 44 +++++++++++++++++++++++++++++++++
+ include/hw/misc/bcm2835_cprman_internals.h | 422 +++++++++++++++++++++
- target/arm/translate-neon.c.inc |  6 ++---
+ hw/misc/bcm2835_cprman.c                   | 151 ++++++++
-files changed, 56 insertions(+), 3 deletions(-)
+files changed, 658 insertions(+)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/bcm2835_cprman.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/bcm2835_cprman.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ typedef enum CprmanPllChannel {
- DEF_HELPER_FLAGS_5(gvec_fabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     CPRMAN_PLLB_CHANNEL_ARM,
- DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     CPRMAN_NUM_PLL_CHANNEL,
-+DEF_HELPER_FLAGS_5(gvec_fceq_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++
-+DEF_HELPER_FLAGS_5(gvec_fceq_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    /* Special values used when connecting clock sources to clocks */
-+
++    CPRMAN_CLOCK_SRC_NORMAL = -1,
-+DEF_HELPER_FLAGS_5(gvec_fcge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_CLOCK_SRC_FORCE_GROUND = -2,
-+DEF_HELPER_FLAGS_5(gvec_fcge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_CLOCK_SRC_DSI0HSCK = -3,
-+
+ } CprmanPllChannel;
-+DEF_HELPER_FLAGS_5(gvec_fcgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
-+DEF_HELPER_FLAGS_5(gvec_fcgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++typedef enum CprmanClockMux {
-+
++    CPRMAN_CLOCK_GNRIC,
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
++    CPRMAN_CLOCK_VPU,
-                    void, ptr, ptr, ptr, ptr, i32)
++    CPRMAN_CLOCK_SYS,
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
++    CPRMAN_CLOCK_PERIA,
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++    CPRMAN_CLOCK_PERII,
 +    CPRMAN_CLOCK_H264,
 +    CPRMAN_CLOCK_ISP,
 +    CPRMAN_CLOCK_V3D,
 +    CPRMAN_CLOCK_CAM0,
 +    CPRMAN_CLOCK_CAM1,
 +    CPRMAN_CLOCK_CCP2,
 +    CPRMAN_CLOCK_DSI0E,
 +    CPRMAN_CLOCK_DSI0P,
 +    CPRMAN_CLOCK_DPI,
 +    CPRMAN_CLOCK_GP0,
 +    CPRMAN_CLOCK_GP1,
 +    CPRMAN_CLOCK_GP2,
 +    CPRMAN_CLOCK_HSM,
 +    CPRMAN_CLOCK_OTP,
 +    CPRMAN_CLOCK_PCM,
 +    CPRMAN_CLOCK_PWM,
 +    CPRMAN_CLOCK_SLIM,
 +    CPRMAN_CLOCK_SMI,
 +    CPRMAN_CLOCK_TEC,
 +    CPRMAN_CLOCK_TD0,
 +    CPRMAN_CLOCK_TD1,
 +    CPRMAN_CLOCK_TSENS,
 +    CPRMAN_CLOCK_TIMER,
 +    CPRMAN_CLOCK_UART,
 +    CPRMAN_CLOCK_VEC,
 +    CPRMAN_CLOCK_PULSE,
 +    CPRMAN_CLOCK_SDC,
 +    CPRMAN_CLOCK_ARM,
 +    CPRMAN_CLOCK_AVEO,
 +    CPRMAN_CLOCK_EMMC,
 +    CPRMAN_CLOCK_EMMC2,
 +
 +    CPRMAN_NUM_CLOCK_MUX
 +} CprmanClockMux;
 +
 +typedef enum CprmanClockMuxSource {
 +    CPRMAN_CLOCK_SRC_GND = 0,
 +    CPRMAN_CLOCK_SRC_XOSC,
 +    CPRMAN_CLOCK_SRC_TD0,
 +    CPRMAN_CLOCK_SRC_TD1,
 +    CPRMAN_CLOCK_SRC_PLLA,
 +    CPRMAN_CLOCK_SRC_PLLC,
 +    CPRMAN_CLOCK_SRC_PLLD,
 +    CPRMAN_CLOCK_SRC_PLLH,
 +    CPRMAN_CLOCK_SRC_PLLC_CORE1,
 +    CPRMAN_CLOCK_SRC_PLLC_CORE2,
 +
 +    CPRMAN_NUM_CLOCK_MUX_SRC
 +} CprmanClockMuxSource;
 +
  typedef struct CprmanPllState {
      /*< private >*/
      DeviceState parent_obj;
@@ -XXX,XX +XXX,XX @@ typedef struct CprmanPllChannelState {
      Clock *out;
  } CprmanPllChannelState;
 +typedef struct CprmanClockMuxState {
 +    /*< private >*/
 +    DeviceState parent_obj;
 +
 +    /*< public >*/
 +    CprmanClockMux id;
 +
 +    uint32_t *reg_ctl;
 +    uint32_t *reg_div;
 +    int int_bits;
 +    int frac_bits;
 +
 +    Clock *srcs[CPRMAN_NUM_CLOCK_MUX_SRC];
 +    Clock *out;
 +
 +    /*
 +     * Used by clock srcs update callback to retrieve both the clock and the
 +     * source number.
 +     */
 +    struct CprmanClockMuxState *backref[CPRMAN_NUM_CLOCK_MUX_SRC];
 +} CprmanClockMuxState;
 +
  struct BCM2835CprmanState {
      /*< private >*/
      SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
      CprmanPllState plls[CPRMAN_NUM_PLL];
      CprmanPllChannelState channels[CPRMAN_NUM_PLL_CHANNEL];
 +    CprmanClockMuxState clock_muxes[CPRMAN_NUM_CLOCK_MUX];
      uint32_t regs[CPRMAN_NUM_REGS];
      uint32_t xosc_freq;
      Clock *xosc;
 +    Clock *gnd;
  };
  #endif
 diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/include/hw/misc/bcm2835_cprman_internals.h
-+++ b/target/arm/vec_helper.c
++++ b/include/hw/misc/bcm2835_cprman_internals.h
-@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlad)(void *vd, void *vn, void *vm,
+@@ -XXX,XX +XXX,XX @@
-     clear_tail(d, opr_sz, simd_maxsz(desc));
  #define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
  #define TYPE_CPRMAN_PLL_CHANNEL "bcm2835-cprman-pll-channel"
 +#define TYPE_CPRMAN_CLOCK_MUX "bcm2835-cprman-clock-mux"
  DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
                           TYPE_CPRMAN_PLL)
  DECLARE_INSTANCE_CHECKER(CprmanPllChannelState, CPRMAN_PLL_CHANNEL,
                           TYPE_CPRMAN_PLL_CHANNEL)
 +DECLARE_INSTANCE_CHECKER(CprmanClockMuxState, CPRMAN_CLOCK_MUX,
 +                         TYPE_CPRMAN_CLOCK_MUX)
  /* Register map */
@@ -XXX,XX +XXX,XX @@ REG32(A2W_PLLH_STS, 0x1660)
  REG32(A2W_PLLB_ARM, 0x13e0)
 +/* Clock muxes */
 +REG32(CM_GNRICCTL, 0x000)
 +    FIELD(CM_CLOCKx_CTL, SRC, 0, 4)
 +    FIELD(CM_CLOCKx_CTL, ENABLE, 4, 1)
 +    FIELD(CM_CLOCKx_CTL, KILL, 5, 1)
 +    FIELD(CM_CLOCKx_CTL, GATE, 6, 1)
 +    FIELD(CM_CLOCKx_CTL, BUSY, 7, 1)
 +    FIELD(CM_CLOCKx_CTL, BUSYD, 8, 1)
 +    FIELD(CM_CLOCKx_CTL, MASH, 9, 2)
 +    FIELD(CM_CLOCKx_CTL, FLIP, 11, 1)
 +REG32(CM_GNRICDIV, 0x004)
 +    FIELD(CM_CLOCKx_DIV, FRAC, 0, 12)
 +REG32(CM_VPUCTL, 0x008)
 +REG32(CM_VPUDIV, 0x00c)
 +REG32(CM_SYSCTL, 0x010)
 +REG32(CM_SYSDIV, 0x014)
 +REG32(CM_PERIACTL, 0x018)
 +REG32(CM_PERIADIV, 0x01c)
 +REG32(CM_PERIICTL, 0x020)
 +REG32(CM_PERIIDIV, 0x024)
 +REG32(CM_H264CTL, 0x028)
 +REG32(CM_H264DIV, 0x02c)
 +REG32(CM_ISPCTL, 0x030)
 +REG32(CM_ISPDIV, 0x034)
 +REG32(CM_V3DCTL, 0x038)
 +REG32(CM_V3DDIV, 0x03c)
 +REG32(CM_CAM0CTL, 0x040)
 +REG32(CM_CAM0DIV, 0x044)
 +REG32(CM_CAM1CTL, 0x048)
 +REG32(CM_CAM1DIV, 0x04c)
 +REG32(CM_CCP2CTL, 0x050)
 +REG32(CM_CCP2DIV, 0x054)
 +REG32(CM_DSI0ECTL, 0x058)
 +REG32(CM_DSI0EDIV, 0x05c)
 +REG32(CM_DSI0PCTL, 0x060)
 +REG32(CM_DSI0PDIV, 0x064)
 +REG32(CM_DPICTL, 0x068)
 +REG32(CM_DPIDIV, 0x06c)
 +REG32(CM_GP0CTL, 0x070)
 +REG32(CM_GP0DIV, 0x074)
 +REG32(CM_GP1CTL, 0x078)
 +REG32(CM_GP1DIV, 0x07c)
 +REG32(CM_GP2CTL, 0x080)
 +REG32(CM_GP2DIV, 0x084)
 +REG32(CM_HSMCTL, 0x088)
 +REG32(CM_HSMDIV, 0x08c)
 +REG32(CM_OTPCTL, 0x090)
 +REG32(CM_OTPDIV, 0x094)
 +REG32(CM_PCMCTL, 0x098)
 +REG32(CM_PCMDIV, 0x09c)
 +REG32(CM_PWMCTL, 0x0a0)
 +REG32(CM_PWMDIV, 0x0a4)
 +REG32(CM_SLIMCTL, 0x0a8)
 +REG32(CM_SLIMDIV, 0x0ac)
 +REG32(CM_SMICTL, 0x0b0)
 +REG32(CM_SMIDIV, 0x0b4)
 +REG32(CM_TCNTCTL, 0x0c0)
 +REG32(CM_TCNTCNT, 0x0c4)
 +REG32(CM_TECCTL, 0x0c8)
 +REG32(CM_TECDIV, 0x0cc)
 +REG32(CM_TD0CTL, 0x0d0)
 +REG32(CM_TD0DIV, 0x0d4)
 +REG32(CM_TD1CTL, 0x0d8)
 +REG32(CM_TD1DIV, 0x0dc)
 +REG32(CM_TSENSCTL, 0x0e0)
 +REG32(CM_TSENSDIV, 0x0e4)
 +REG32(CM_TIMERCTL, 0x0e8)
 +REG32(CM_TIMERDIV, 0x0ec)
 +REG32(CM_UARTCTL, 0x0f0)
 +REG32(CM_UARTDIV, 0x0f4)
 +REG32(CM_VECCTL, 0x0f8)
 +REG32(CM_VECDIV, 0x0fc)
 +REG32(CM_PULSECTL, 0x190)
 +REG32(CM_PULSEDIV, 0x194)
 +REG32(CM_SDCCTL, 0x1a8)
 +REG32(CM_SDCDIV, 0x1ac)
 +REG32(CM_ARMCTL, 0x1b0)
 +REG32(CM_AVEOCTL, 0x1b8)
 +REG32(CM_AVEODIV, 0x1bc)
 +REG32(CM_EMMCCTL, 0x1c0)
 +REG32(CM_EMMCDIV, 0x1c4)
 +REG32(CM_EMMC2CTL, 0x1d0)
 +REG32(CM_EMMC2DIV, 0x1d4)
 +
  /* misc registers */
  REG32(CM_LOCK, 0x114)
      FIELD(CM_LOCK, FLOCKH, 12, 1)
@@ -XXX,XX +XXX,XX @@ static inline void set_pll_channel_init_info(BCM2835CprmanState *s,
      channel->fixed_divider = PLL_CHANNEL_INIT_INFO[id].fixed_divider;
  }
++/* Clock mux init info */
++typedef struct ClockMuxInitInfo {
++    const char *name;
++    size_t cm_offset; /* cm_offset[0]->CM_CTL, cm_offset[1]->CM_DIV */
++    int int_bits;
++    int frac_bits;
++
++    CprmanPllChannel src_mapping[CPRMAN_NUM_CLOCK_MUX_SRC];
++} ClockMuxInitInfo;
++
 +/*
-+ * Floating point comparisons producing an integer result (all 1s or all 0s).
++ * Each clock mux can have up to 10 sources. Sources 0 to 3 are always the
-+ * Note that EQ doesn't signal InvalidOp for QNaNs but GE and GT do.
++ * same (ground, xosc, td0, td1). Sources 4 to 9 are mux specific, and are not
-+ * Softfloat routines return 0/1, which we convert to the 0/-1 Neon requires.
++ * always populated. The following macros catch all those cases.
 + */
-+static uint16_t float16_ceq(float16 op1, float16 op2, float_status *stat)
++
 +/* Unknown mapping. Connect everything to ground */
 +#define SRC_MAPPING_INFO_unknown                          \
 +    .src_mapping = {                                      \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* gnd */          \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* xosc */         \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* test debug 0 */ \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* test debug 1 */ \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll a */        \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll c */        \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll d */        \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll h */        \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll c, core1 */ \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll c, core2 */ \
 +    }
 +
 +/* Only the oscillator and the two test debug clocks */
 +#define SRC_MAPPING_INFO_xosc          \
 +    .src_mapping = {                   \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +    }
 +
 +/* All the PLL "core" channels */
 +#define SRC_MAPPING_INFO_core      \
 +    .src_mapping = {               \
 +        CPRMAN_CLOCK_SRC_NORMAL,   \
 +        CPRMAN_CLOCK_SRC_NORMAL,   \
 +        CPRMAN_CLOCK_SRC_NORMAL,   \
 +        CPRMAN_CLOCK_SRC_NORMAL,   \
 +        CPRMAN_PLLA_CHANNEL_CORE,  \
 +        CPRMAN_PLLC_CHANNEL_CORE0, \
 +        CPRMAN_PLLD_CHANNEL_CORE,  \
 +        CPRMAN_PLLH_CHANNEL_AUX,   \
 +        CPRMAN_PLLC_CHANNEL_CORE1, \
 +        CPRMAN_PLLC_CHANNEL_CORE2, \
 +    }
 +
 +/* All the PLL "per" channels */
 +#define SRC_MAPPING_INFO_periph        \
 +    .src_mapping = {                   \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_PLLA_CHANNEL_PER,       \
 +        CPRMAN_PLLC_CHANNEL_PER,       \
 +        CPRMAN_PLLD_CHANNEL_PER,       \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +    }
 +
 +/*
 + * The DSI0 channels. This one got an intermediate mux between the PLL channels
 + * and the clock input.
 + */
 +#define SRC_MAPPING_INFO_dsi0          \
 +    .src_mapping = {                   \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_DSI0HSCK,     \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +    }
 +
 +/* The DSI1 channel */
 +#define SRC_MAPPING_INFO_dsi1          \
 +    .src_mapping = {                   \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_CLOCK_SRC_NORMAL,       \
 +        CPRMAN_PLLD_CHANNEL_DSI1,      \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
 +    }
 +
 +#define FILL_CLOCK_MUX_SRC_MAPPING_INIT_INFO(kind_) \
 +    SRC_MAPPING_INFO_ ## kind_
 +
 +#define FILL_CLOCK_MUX_INIT_INFO(clock_, kind_) \
 +    .cm_offset = R_CM_ ## clock_ ## CTL,        \
 +    FILL_CLOCK_MUX_SRC_MAPPING_INIT_INFO(kind_)
 +
 +static ClockMuxInitInfo CLOCK_MUX_INIT_INFO[] = {
 +    [CPRMAN_CLOCK_GNRIC] = {
 +        .name = "gnric",
 +        FILL_CLOCK_MUX_INIT_INFO(GNRIC, unknown),
 +    },
 +    [CPRMAN_CLOCK_VPU] = {
 +        .name = "vpu",
 +        .int_bits = 12,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(VPU, core),
 +    },
 +    [CPRMAN_CLOCK_SYS] = {
 +        .name = "sys",
 +        FILL_CLOCK_MUX_INIT_INFO(SYS, unknown),
 +    },
 +    [CPRMAN_CLOCK_PERIA] = {
 +        .name = "peria",
 +        FILL_CLOCK_MUX_INIT_INFO(PERIA, unknown),
 +    },
 +    [CPRMAN_CLOCK_PERII] = {
 +        .name = "perii",
 +        FILL_CLOCK_MUX_INIT_INFO(PERII, unknown),
 +    },
 +    [CPRMAN_CLOCK_H264] = {
 +        .name = "h264",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(H264, core),
 +    },
 +    [CPRMAN_CLOCK_ISP] = {
 +        .name = "isp",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(ISP, core),
 +    },
 +    [CPRMAN_CLOCK_V3D] = {
 +        .name = "v3d",
 +        FILL_CLOCK_MUX_INIT_INFO(V3D, core),
 +    },
 +    [CPRMAN_CLOCK_CAM0] = {
 +        .name = "cam0",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(CAM0, periph),
 +    },
 +    [CPRMAN_CLOCK_CAM1] = {
 +        .name = "cam1",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(CAM1, periph),
 +    },
 +    [CPRMAN_CLOCK_CCP2] = {
 +        .name = "ccp2",
 +        FILL_CLOCK_MUX_INIT_INFO(CCP2, unknown),
 +    },
 +    [CPRMAN_CLOCK_DSI0E] = {
 +        .name = "dsi0e",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(DSI0E, dsi0),
 +    },
 +    [CPRMAN_CLOCK_DSI0P] = {
 +        .name = "dsi0p",
 +        .int_bits = 0,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(DSI0P, dsi0),
 +    },
 +    [CPRMAN_CLOCK_DPI] = {
 +        .name = "dpi",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(DPI, periph),
 +    },
 +    [CPRMAN_CLOCK_GP0] = {
 +        .name = "gp0",
 +        .int_bits = 12,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(GP0, periph),
 +    },
 +    [CPRMAN_CLOCK_GP1] = {
 +        .name = "gp1",
 +        .int_bits = 12,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(GP1, periph),
 +    },
 +    [CPRMAN_CLOCK_GP2] = {
 +        .name = "gp2",
 +        .int_bits = 12,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(GP2, periph),
 +    },
 +    [CPRMAN_CLOCK_HSM] = {
 +        .name = "hsm",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(HSM, periph),
 +    },
 +    [CPRMAN_CLOCK_OTP] = {
 +        .name = "otp",
 +        .int_bits = 4,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(OTP, xosc),
 +    },
 +    [CPRMAN_CLOCK_PCM] = {
 +        .name = "pcm",
 +        .int_bits = 12,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(PCM, periph),
 +    },
 +    [CPRMAN_CLOCK_PWM] = {
 +        .name = "pwm",
 +        .int_bits = 12,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(PWM, periph),
 +    },
 +    [CPRMAN_CLOCK_SLIM] = {
 +        .name = "slim",
 +        .int_bits = 12,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(SLIM, periph),
 +    },
 +    [CPRMAN_CLOCK_SMI] = {
 +        .name = "smi",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(SMI, periph),
 +    },
 +    [CPRMAN_CLOCK_TEC] = {
 +        .name = "tec",
 +        .int_bits = 6,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(TEC, xosc),
 +    },
 +    [CPRMAN_CLOCK_TD0] = {
 +        .name = "td0",
 +        FILL_CLOCK_MUX_INIT_INFO(TD0, unknown),
 +    },
 +    [CPRMAN_CLOCK_TD1] = {
 +        .name = "td1",
 +        FILL_CLOCK_MUX_INIT_INFO(TD1, unknown),
 +    },
 +    [CPRMAN_CLOCK_TSENS] = {
 +        .name = "tsens",
 +        .int_bits = 5,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(TSENS, xosc),
 +    },
 +    [CPRMAN_CLOCK_TIMER] = {
 +        .name = "timer",
 +        .int_bits = 6,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(TIMER, xosc),
 +    },
 +    [CPRMAN_CLOCK_UART] = {
 +        .name = "uart",
 +        .int_bits = 10,
 +        .frac_bits = 12,
 +        FILL_CLOCK_MUX_INIT_INFO(UART, periph),
 +    },
 +    [CPRMAN_CLOCK_VEC] = {
 +        .name = "vec",
 +        .int_bits = 4,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(VEC, periph),
 +    },
 +    [CPRMAN_CLOCK_PULSE] = {
 +        .name = "pulse",
 +        FILL_CLOCK_MUX_INIT_INFO(PULSE, xosc),
 +    },
 +    [CPRMAN_CLOCK_SDC] = {
 +        .name = "sdram",
 +        .int_bits = 6,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(SDC, core),
 +    },
 +    [CPRMAN_CLOCK_ARM] = {
 +        .name = "arm",
 +        FILL_CLOCK_MUX_INIT_INFO(ARM, unknown),
 +    },
 +    [CPRMAN_CLOCK_AVEO] = {
 +        .name = "aveo",
 +        .int_bits = 4,
 +        .frac_bits = 0,
 +        FILL_CLOCK_MUX_INIT_INFO(AVEO, periph),
 +    },
 +    [CPRMAN_CLOCK_EMMC] = {
 +        .name = "emmc",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(EMMC, periph),
 +    },
 +    [CPRMAN_CLOCK_EMMC2] = {
 +        .name = "emmc2",
 +        .int_bits = 4,
 +        .frac_bits = 8,
 +        FILL_CLOCK_MUX_INIT_INFO(EMMC2, unknown),
 +    },
 +};
 +
 +#undef FILL_CLOCK_MUX_INIT_INFO
 +#undef FILL_CLOCK_MUX_SRC_MAPPING_INIT_INFO
 +#undef SRC_MAPPING_INFO_dsi1
 +#undef SRC_MAPPING_INFO_dsi0
 +#undef SRC_MAPPING_INFO_periph
 +#undef SRC_MAPPING_INFO_core
 +#undef SRC_MAPPING_INFO_xosc
 +#undef SRC_MAPPING_INFO_unknown
 +
 +static inline void set_clock_mux_init_info(BCM2835CprmanState *s,
 +                                           CprmanClockMuxState *mux,
 +                                           CprmanClockMux id)
 +{
-+    return -float16_eq_quiet(op1, op2, stat);
++    mux->id = id;
 +    mux->reg_ctl = &s->regs[CLOCK_MUX_INIT_INFO[id].cm_offset];
 +    mux->reg_div = &s->regs[CLOCK_MUX_INIT_INFO[id].cm_offset + 1];
 +    mux->int_bits = CLOCK_MUX_INIT_INFO[id].int_bits;
 +    mux->frac_bits = CLOCK_MUX_INIT_INFO[id].frac_bits;
 +}
 +
-+static uint32_t float32_ceq(float32 op1, float32 op2, float_status *stat)
+ #endif
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/bcm2835_cprman.c
 +++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@
   *
   * The page at https://elinux.org/The_Undocumented_Pi gives the actual clock
   * tree configuration.
 + *
 + * The CPRMAN exposes clock outputs with the name of the clock mux suffixed
 + * with "-out" (e.g. "uart-out", "h264-out", ...).
   */
  #include "qemu/osdep.h"
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_channel_info = {
  };
 +/* clock mux */
 +
 +static void clock_mux_update(CprmanClockMuxState *mux)
 +{
-+    return -float32_eq_quiet(op1, op2, stat);
++    clock_update(mux->out, 0);
 +}
 +
-+static uint16_t float16_cge(float16 op1, float16 op2, float_status *stat)
++static void clock_mux_src_update(void *opaque)
 +{
-+    return -float16_le(op2, op1, stat);
++    CprmanClockMuxState **backref = opaque;
 +    CprmanClockMuxState *s = *backref;
 +
 +    clock_mux_update(s);
 +}
 +
-+static uint32_t float32_cge(float32 op1, float32 op2, float_status *stat)
++static void clock_mux_init(Object *obj)
 +{
-+    return -float32_le(op2, op1, stat);
++    CprmanClockMuxState *s = CPRMAN_CLOCK_MUX(obj);
 +    size_t i;
 +
 +    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX_SRC; i++) {
 +        char *name = g_strdup_printf("srcs[%zu]", i);
 +        s->backref[i] = s;
 +        s->srcs[i] = qdev_init_clock_in(DEVICE(s), name,
 +                                        clock_mux_src_update,
 +                                        &s->backref[i]);
 +        g_free(name);
 +    }
 +
 +    s->out = qdev_init_clock_out(DEVICE(s), "out");
 +}
 +
-+static uint16_t float16_cgt(float16 op1, float16 op2, float_status *stat)
++static const VMStateDescription clock_mux_vmstate = {
 +    .name = TYPE_CPRMAN_CLOCK_MUX,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_ARRAY_CLOCK(srcs, CprmanClockMuxState,
 +                            CPRMAN_NUM_CLOCK_MUX_SRC),
 +        VMSTATE_END_OF_LIST()
 +    }
 +};
 +
 +static void clock_mux_class_init(ObjectClass *klass, void *data)
 +{
-+    return -float16_lt(op2, op1, stat);
++    DeviceClass *dc = DEVICE_CLASS(klass);
 +
 +    dc->vmsd = &clock_mux_vmstate;
 +}
 +
-+static uint32_t float32_cgt(float32 op1, float32 op2, float_status *stat)
++static const TypeInfo cprman_clock_mux_info = {
 +    .name = TYPE_CPRMAN_CLOCK_MUX,
 +    .parent = TYPE_DEVICE,
 +    .instance_size = sizeof(CprmanClockMuxState),
 +    .class_init = clock_mux_class_init,
 +    .instance_init = clock_mux_init,
 +};
 +
 +
  /* CPRMAN "top level" model */
  static uint32_t get_cm_lock(const BCM2835CprmanState *s)
@@ -XXX,XX +XXX,XX @@ static inline void update_channel_from_a2w(BCM2835CprmanState *s, size_t idx)
      }
  }
 +static inline void update_mux_from_cm(BCM2835CprmanState *s, size_t idx)
 +{
-+    return -float32_lt(op2, op1, stat);
++    size_t i;
 +
 +    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
 +        if ((CLOCK_MUX_INIT_INFO[i].cm_offset == idx) ||
 +            (CLOCK_MUX_INIT_INFO[i].cm_offset + 4 == idx)) {
 +            /* matches CM_CTL or CM_DIV mux register */
 +            clock_mux_update(&s->clock_muxes[i]);
 +            return;
 +        }
 +    }
 +}
 +
- #define DO_2OP(NAME, FUNC, TYPE) \
+ #define CASE_PLL_A2W_REGS(pll_) \
- void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
+     case R_A2W_ ## pll_ ## _CTRL: \
- {                                                                 \
+     case R_A2W_ ## pll_ ## _ANA0: \
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
+@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
- DO_3OP(gvec_fabd_h, float16_abd, float16)
+     case R_A2W_PLLB_ARM:
- DO_3OP(gvec_fabd_s, float32_abd, float32)
+         update_channel_from_a2w(s, idx);
+         break;
-+DO_3OP(gvec_fceq_h, float16_ceq, float16)
++
-+DO_3OP(gvec_fceq_s, float32_ceq, float32)
++    case R_CM_GNRICCTL ... R_CM_SMIDIV:
-+
++    case R_CM_TCNTCNT ... R_CM_VECDIV:
-+DO_3OP(gvec_fcge_h, float16_cge, float16)
++    case R_CM_PULSECTL ... R_CM_PULSEDIV:
-+DO_3OP(gvec_fcge_s, float32_cge, float32)
++    case R_CM_SDCCTL ... R_CM_ARMCTL:
-+
++    case R_CM_AVEOCTL ... R_CM_EMMCDIV:
-+DO_3OP(gvec_fcgt_h, float16_cgt, float16)
++    case R_CM_EMMC2CTL ... R_CM_EMMC2DIV:
-+DO_3OP(gvec_fcgt_s, float32_cgt, float32)
++        update_mux_from_cm(s, idx);
-+
++        break;
  #ifdef TARGET_AARCH64
  DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s, gen_helper_gvec_fadd_h)
  DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s, gen_helper_gvec_fsub_h)
  DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s, gen_helper_gvec_fabd_h)
  DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
 +DO_3S_FP_GVEC(VCEQ, gen_helper_gvec_fceq_s, gen_helper_gvec_fceq_h)
 +DO_3S_FP_GVEC(VCGE, gen_helper_gvec_fcge_s, gen_helper_gvec_fcge_h)
 +DO_3S_FP_GVEC(VCGT, gen_helper_gvec_fcgt_s, gen_helper_gvec_fcgt_h)
  /*
   * For all the functions using this macro, size == 1 means fp16,
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
          return do_3same_fp(s, a, FUNC, READS_VD);                   \
      }
+ }
--DO_3S_FP(VCEQ, gen_helper_neon_ceq_f32, false)
--DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
+@@ -XXX,XX +XXX,XX @@ static void cprman_reset(DeviceState *dev)
--DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
+         device_cold_reset(DEVICE(&s->channels[i]));
- DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
+     }
- DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
- DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
++    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
 +        device_cold_reset(DEVICE(&s->clock_muxes[i]));
 +    }
 +
      clock_update_hz(s->xosc, s->xosc_freq);
  }
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
          set_pll_channel_init_info(s, &s->channels[i], i);
      }
 +    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
 +        char *alias;
 +
 +        object_initialize_child(obj, CLOCK_MUX_INIT_INFO[i].name,
 +                                &s->clock_muxes[i],
 +                                TYPE_CPRMAN_CLOCK_MUX);
 +        set_clock_mux_init_info(s, &s->clock_muxes[i], i);
 +
 +        /* Expose muxes output as CPRMAN outputs */
 +        alias = g_strdup_printf("%s-out", CLOCK_MUX_INIT_INFO[i].name);
 +        qdev_alias_clock(DEVICE(&s->clock_muxes[i]), "out", DEVICE(obj), alias);
 +        g_free(alias);
 +    }
 +
      s->xosc = clock_new(obj, "xosc");
 +    s->gnd = clock_new(obj, "gnd");
 +
 +    clock_set(s->gnd, 0);
      memory_region_init_io(&s->iomem, obj, &cprman_ops,
                            s, "bcm2835-cprman", 0x2000);
      sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
  }
 +static void connect_mux_sources(BCM2835CprmanState *s,
 +                                CprmanClockMuxState *mux,
 +                                const CprmanPllChannel *clk_mapping)
 +{
 +    size_t i;
 +    Clock *td0 = s->clock_muxes[CPRMAN_CLOCK_TD0].out;
 +    Clock *td1 = s->clock_muxes[CPRMAN_CLOCK_TD1].out;
 +
 +    /* For sources from 0 to 3. Source 4 to 9 are mux specific */
 +    Clock * const CLK_SRC_MAPPING[] = {
 +        [CPRMAN_CLOCK_SRC_GND] = s->gnd,
 +        [CPRMAN_CLOCK_SRC_XOSC] = s->xosc,
 +        [CPRMAN_CLOCK_SRC_TD0] = td0,
 +        [CPRMAN_CLOCK_SRC_TD1] = td1,
 +    };
 +
 +    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX_SRC; i++) {
 +        CprmanPllChannel mapping = clk_mapping[i];
 +        Clock *src;
 +
 +        if (mapping == CPRMAN_CLOCK_SRC_FORCE_GROUND) {
 +            src = s->gnd;
 +        } else if (mapping == CPRMAN_CLOCK_SRC_DSI0HSCK) {
 +            src = s->gnd; /* TODO */
 +        } else if (i < CPRMAN_CLOCK_SRC_PLLA) {
 +            src = CLK_SRC_MAPPING[i];
 +        } else {
 +            src = s->channels[mapping].out;
 +        }
 +
 +        clock_set_source(mux->srcs[i], src);
 +    }
 +}
 +
  static void cprman_realize(DeviceState *dev, Error **errp)
  {
      BCM2835CprmanState *s = CPRMAN(dev);
@@ -XXX,XX +XXX,XX @@ static void cprman_realize(DeviceState *dev, Error **errp)
              return;
          }
      }
 +
 +    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
 +        CprmanClockMuxState *clock_mux = &s->clock_muxes[i];
 +
 +        connect_mux_sources(s, clock_mux, CLOCK_MUX_INIT_INFO[i].src_mapping);
 +
 +        if (!qdev_realize(DEVICE(clock_mux), NULL, errp)) {
 +            return;
 +        }
 +    }
  }
  static const VMStateDescription cprman_vmstate = {
@@ -XXX,XX +XXX,XX @@ static void cprman_register_types(void)
      type_register_static(&cprman_info);
      type_register_static(&cprman_pll_info);
      type_register_static(&cprman_pll_channel_info);
 +    type_register_static(&cprman_clock_mux_info);
  }
  type_init(cprman_register_types);
 --
 .20.1

-[PULL 09/47] target/arm: Implement VFP fp16 for VMOV immediate
+[PULL 40/48] hw/misc/bcm2835_cprman: implement clock mux behaviour
-Implement VFP fp16 support for the VMOV immediate insn.
+From: Luc Michel <luc@lmichel.fr>
+A clock mux can be configured to select one of its 10 sources through
+the CM_CTL register. It also embeds yet another clock divider, composed
+of an integer part and a fractional part. The number of bits of each
+part is mux dependent.
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-10-peter.maydell@linaro.org
 ---
- target/arm/vfp.decode          |  2 ++
+ hw/misc/bcm2835_cprman.c | 53 +++++++++++++++++++++++++++++++++++++++-
- target/arm/translate-vfp.c.inc | 22 ++++++++++++++++++++++
+file changed, 52 insertions(+), 1 deletion(-)
 files changed, 24 insertions(+)
-diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
+diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/hw/misc/bcm2835_cprman.c
-+++ b/target/arm/vfp.decode
++++ b/hw/misc/bcm2835_cprman.c
-@@ -XXX,XX +XXX,XX @@ VFMS_dp      ---- 1110 1.10 .... .... 1011 .1.0 ....        @vfp_dnm_d
+@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_channel_info = {
- VFNMA_dp     ---- 1110 1.01 .... .... 1011 .0.0 ....        @vfp_dnm_d
- VFNMS_dp     ---- 1110 1.01 .... .... 1011 .1.0 ....        @vfp_dnm_d
+ /* clock mux */
-+VMOV_imm_hp  ---- 1110 1.11 .... .... 1001 0000 .... \
++static bool clock_mux_is_enabled(CprmanClockMuxState *mux)
 +             vd=%vd_sp imm=%vmov_imm
  VMOV_imm_sp  ---- 1110 1.11 .... .... 1010 0000 .... \
               vd=%vd_sp imm=%vmov_imm
  VMOV_imm_dp  ---- 1110 1.11 .... .... 1011 0000 .... \
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ MAKE_VFM_TRANS_FNS(hp)
  MAKE_VFM_TRANS_FNS(sp)
  MAKE_VFM_TRANS_FNS(dp)
 +static bool trans_VMOV_imm_hp(DisasContext *s, arg_VMOV_imm_sp *a)
 +{
-+    TCGv_i32 fd;
++    return FIELD_EX32(*mux->reg_ctl, CM_CLOCKx_CTL, ENABLE);
 +}
 +
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+ static void clock_mux_update(CprmanClockMuxState *mux)
-+        return false;
+ {
 -    clock_update(mux->out, 0);
 +    uint64_t freq;
 +    uint32_t div, src = FIELD_EX32(*mux->reg_ctl, CM_CLOCKx_CTL, SRC);
 +    bool enabled = clock_mux_is_enabled(mux);
 +
 +    *mux->reg_ctl = FIELD_DP32(*mux->reg_ctl, CM_CLOCKx_CTL, BUSY, enabled);
 +
 +    if (!enabled) {
 +        clock_update(mux->out, 0);
 +        return;
 +    }
 +
-+    if (s->vec_len != 0 || s->vec_stride != 0) {
++    freq = clock_get_hz(mux->srcs[src]);
-+        return false;
++
 +    if (mux->int_bits == 0 && mux->frac_bits == 0) {
 +        clock_update_hz(mux->out, freq);
 +        return;
 +    }
 +
-+    if (!vfp_access_check(s)) {
++    /*
-+        return true;
++     * The divider has an integer and a fractional part. The size of each part
 +     * varies with the muxes (int_bits and frac_bits). Both parts are
 +     * concatenated, with the integer part always starting at bit 12.
 +     *
 +     *         31          12 11          0
 +     *        ------------------------------
 +     * CM_DIV |      |  int  |  frac  |    |
 +     *        ------------------------------
 +     *                <-----> <------>
 +     *                int_bits frac_bits
 +     */
 +    div = extract32(*mux->reg_div,
 +                    R_CM_CLOCKx_DIV_FRAC_LENGTH - mux->frac_bits,
 +                    mux->int_bits + mux->frac_bits);
 +
 +    if (!div) {
 +        clock_update(mux->out, 0);
 +        return;
 +    }
 +
-+    fd = tcg_const_i32(vfp_expand_imm(MO_16, a->imm));
++    freq = muldiv64(freq, 1 << mux->frac_bits, div);
 +    neon_store_reg32(fd, a->vd);
 +    tcg_temp_free_i32(fd);
 +    return true;
 +}
 +
- static bool trans_VMOV_imm_sp(DisasContext *s, arg_VMOV_imm_sp *a)
++    clock_update_hz(mux->out, freq);
  }
  static void clock_mux_src_update(void *opaque)
  {
-     uint32_t delta_d = 0;
+     CprmanClockMuxState **backref = opaque;
      CprmanClockMuxState *s = *backref;
 +    CprmanClockMuxSource src = backref - s->backref;
 +
 +    if (FIELD_EX32(*s->reg_ctl, CM_CLOCKx_CTL, SRC) != src) {
 +        return;
 +    }
      clock_mux_update(s);
  }
 --
 .20.1

-[PULL 36/47] target/arm: Convert Neon VCVT fixed-point to gvec
+[PULL 41/48] hw/misc/bcm2835_cprman: add the DSI0HSCK multiplexer
-Convert the Neon VCVT float<->fixed-point insns to a
+From: Luc Michel <luc@lmichel.fr>
-gvec style, in preparation for adding fp16 support.
+This simple mux sits between the PLL channels and the DSI0E and DSI0P
 clock muxes. This mux selects between PLLA-DSI0 and PLLD-DSI0 channel
 and outputs the selected signal to source number 4 of DSI0E/P clock
 muxes. It is controlled by the cm_dsi0hsck register.
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Luc Michel <luc@lmichel.fr>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-38-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  5 +++++
+ include/hw/misc/bcm2835_cprman.h           | 15 +++++
- target/arm/vec_helper.c         | 20 +++++++++++++++++++
+ include/hw/misc/bcm2835_cprman_internals.h |  6 ++
- target/arm/translate-neon.c.inc | 35 +++++++++++++++++----------------
+ hw/misc/bcm2835_cprman.c                   | 74 +++++++++++++++++++++-
-files changed, 43 insertions(+), 17 deletions(-)
+files changed, 94 insertions(+), 1 deletion(-)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/bcm2835_cprman.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/bcm2835_cprman.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_tosizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ typedef struct CprmanClockMuxState {
- DEF_HELPER_FLAGS_4(gvec_touszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+     struct CprmanClockMuxState *backref[CPRMAN_NUM_CLOCK_MUX_SRC];
- DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+ } CprmanClockMuxState;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_sf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++typedef struct CprmanDsi0HsckMuxState {
-+DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    /*< private >*/
-+DEF_HELPER_FLAGS_4(gvec_vcvt_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    DeviceState parent_obj;
-+DEF_HELPER_FLAGS_4(gvec_vcvt_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++
-+
++    /*< public >*/
- DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    CprmanClockMux id;
- DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++
- DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
++    uint32_t *reg_cm;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++
 +    Clock *plla_in;
 +    Clock *plld_in;
 +    Clock *out;
 +} CprmanDsi0HsckMuxState;
 +
  struct BCM2835CprmanState {
      /*< private >*/
      SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
      CprmanPllState plls[CPRMAN_NUM_PLL];
      CprmanPllChannelState channels[CPRMAN_NUM_PLL_CHANNEL];
      CprmanClockMuxState clock_muxes[CPRMAN_NUM_CLOCK_MUX];
 +    CprmanDsi0HsckMuxState dsi0hsck_mux;
      uint32_t regs[CPRMAN_NUM_REGS];
      uint32_t xosc_freq;
 diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/include/hw/misc/bcm2835_cprman_internals.h
-+++ b/target/arm/vec_helper.c
++++ b/include/hw/misc/bcm2835_cprman_internals.h
-@@ -XXX,XX +XXX,XX @@ DO_NEON_PAIRWISE(neon_pmax, max)
+@@ -XXX,XX +XXX,XX @@
- DO_NEON_PAIRWISE(neon_pmin, min)
+ #define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
+ #define TYPE_CPRMAN_PLL_CHANNEL "bcm2835-cprman-pll-channel"
- #undef DO_NEON_PAIRWISE
+ #define TYPE_CPRMAN_CLOCK_MUX "bcm2835-cprman-clock-mux"
-+
++#define TYPE_CPRMAN_DSI0HSCK_MUX "bcm2835-cprman-dsi0hsck-mux"
-+#define DO_VCVT_FIXED(NAME, FUNC, TYPE)                                 \
-+    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
+ DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
-+    {                                                                   \
+                          TYPE_CPRMAN_PLL)
-+        intptr_t i, oprsz = simd_oprsz(desc);                           \
+@@ -XXX,XX +XXX,XX @@ DECLARE_INSTANCE_CHECKER(CprmanPllChannelState, CPRMAN_PLL_CHANNEL,
-+        int shift = simd_data(desc);                                    \
+                          TYPE_CPRMAN_PLL_CHANNEL)
-+        TYPE *d = vd, *n = vn;                                          \
+ DECLARE_INSTANCE_CHECKER(CprmanClockMuxState, CPRMAN_CLOCK_MUX,
-+        float_status *fpst = stat;                                      \
+                          TYPE_CPRMAN_CLOCK_MUX)
-+        for (i = 0; i < oprsz / sizeof(TYPE); i++) {                    \
++DECLARE_INSTANCE_CHECKER(CprmanDsi0HsckMuxState, CPRMAN_DSI0HSCK_MUX,
-+            d[i] = FUNC(n[i], shift, fpst);                             \
++                         TYPE_CPRMAN_DSI0HSCK_MUX)
-+        }                                                               \
-+        clear_tail(d, oprsz, simd_maxsz(desc));                         \
+ /* Register map */
@@ -XXX,XX +XXX,XX @@ REG32(CM_LOCK, 0x114)
      FIELD(CM_LOCK, FLOCKB, 9, 1)
      FIELD(CM_LOCK, FLOCKA, 8, 1)
 +REG32(CM_DSI0HSCK, 0x120)
 +    FIELD(CM_DSI0HSCK, SELPLLD, 0, 1)
 +
  /*
   * This field is common to all registers. Each register write value must match
   * the CPRMAN_PASSWORD magic value in its 8 MSB.
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/bcm2835_cprman.c
 +++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_clock_mux_info = {
  };
 +/* DSI0HSCK mux */
 +
 +static void dsi0hsck_mux_update(CprmanDsi0HsckMuxState *s)
 +{
 +    bool src_is_plld = FIELD_EX32(*s->reg_cm, CM_DSI0HSCK, SELPLLD);
 +    Clock *src = src_is_plld ? s->plld_in : s->plla_in;
 +
 +    clock_update(s->out, clock_get(src));
 +}
 +
 +static void dsi0hsck_mux_in_update(void *opaque)
 +{
 +    dsi0hsck_mux_update(CPRMAN_DSI0HSCK_MUX(opaque));
 +}
 +
 +static void dsi0hsck_mux_init(Object *obj)
 +{
 +    CprmanDsi0HsckMuxState *s = CPRMAN_DSI0HSCK_MUX(obj);
 +    DeviceState *dev = DEVICE(obj);
 +
 +    s->plla_in = qdev_init_clock_in(dev, "plla-in", dsi0hsck_mux_in_update, s);
 +    s->plld_in = qdev_init_clock_in(dev, "plld-in", dsi0hsck_mux_in_update, s);
 +    s->out = qdev_init_clock_out(DEVICE(s), "out");
 +}
 +
 +static const VMStateDescription dsi0hsck_mux_vmstate = {
 +    .name = TYPE_CPRMAN_DSI0HSCK_MUX,
 +    .version_id = 1,
 +    .minimum_version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_CLOCK(plla_in, CprmanDsi0HsckMuxState),
 +        VMSTATE_CLOCK(plld_in, CprmanDsi0HsckMuxState),
 +        VMSTATE_END_OF_LIST()
 +    }
-+
++};
-+DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
++
-+DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
++static void dsi0hsck_mux_class_init(ObjectClass *klass, void *data)
-+DO_VCVT_FIXED(gvec_vcvt_fs, helper_vfp_tosls_round_to_zero, uint32_t)
++{
-+DO_VCVT_FIXED(gvec_vcvt_fu, helper_vfp_touls_round_to_zero, uint32_t)
++    DeviceClass *dc = DEVICE_CLASS(klass);
 +
-+#undef DO_VCVT_FIXED
++    dc->vmsd = &dsi0hsck_mux_vmstate;
-diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
++}
-index XXXXXXX..XXXXXXX 100644
++
---- a/target/arm/translate-neon.c.inc
++static const TypeInfo cprman_dsi0hsck_mux_info = {
-+++ b/target/arm/translate-neon.c.inc
++    .name = TYPE_CPRMAN_DSI0HSCK_MUX,
-@@ -XXX,XX +XXX,XX @@ static bool trans_VSHLL_U_2sh(DisasContext *s, arg_2reg_shift *a)
++    .parent = TYPE_DEVICE,
 +    .instance_size = sizeof(CprmanDsi0HsckMuxState),
 +    .class_init = dsi0hsck_mux_class_init,
 +    .instance_init = dsi0hsck_mux_init,
 +};
 +
 +
  /* CPRMAN "top level" model */
  static uint32_t get_cm_lock(const BCM2835CprmanState *s)
@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
      case R_CM_EMMC2CTL ... R_CM_EMMC2DIV:
          update_mux_from_cm(s, idx);
          break;
 +
 +    case R_CM_DSI0HSCK:
 +        dsi0hsck_mux_update(&s->dsi0hsck_mux);
 +        break;
      }
  }
- static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
+@@ -XXX,XX +XXX,XX @@ static void cprman_reset(DeviceState *dev)
--                      NeonGenTwoSingleOpFn *fn)
+         device_cold_reset(DEVICE(&s->channels[i]));
-+                      gen_helper_gvec_2_ptr *fn)
+     }
- {
-     /* FP operations in 2-reg-and-shift group */
++    device_cold_reset(DEVICE(&s->dsi0hsck_mux));
--    TCGv_i32 tmp, shiftv;
++
--    TCGv_ptr fpstatus;
+     for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
--    int pass;
+         device_cold_reset(DEVICE(&s->clock_muxes[i]));
-+    int vec_size = a->q ? 16 : 8;
+     }
-+    int rd_ofs = neon_reg_offset(a->vd, 0);
+@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
-+    int rm_ofs = neon_reg_offset(a->vm, 0);
+         set_pll_channel_init_info(s, &s->channels[i], i);
-+    TCGv_ptr fpst;
+     }
-     if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
++    object_initialize_child(obj, "dsi0hsck-mux",
-         return false;
++                            &s->dsi0hsck_mux, TYPE_CPRMAN_DSI0HSCK_MUX);
-     }
++    s->dsi0hsck_mux.reg_cm = &s->regs[R_CM_DSI0HSCK];
++
-+    if (a->size != 0) {
+     for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
-+        if (!dc_isar_feature(aa32_fp16_arith, s)) {
+         char *alias;
-+            return false;
-+        }
+@@ -XXX,XX +XXX,XX @@ static void connect_mux_sources(BCM2835CprmanState *s,
          if (mapping == CPRMAN_CLOCK_SRC_FORCE_GROUND) {
              src = s->gnd;
          } else if (mapping == CPRMAN_CLOCK_SRC_DSI0HSCK) {
 -            src = s->gnd; /* TODO */
 +            src = s->dsi0hsck_mux.out;
          } else if (i < CPRMAN_CLOCK_SRC_PLLA) {
              src = CLK_SRC_MAPPING[i];
          } else {
@@ -XXX,XX +XXX,XX @@ static void cprman_realize(DeviceState *dev, Error **errp)
          }
      }
 +    clock_set_source(s->dsi0hsck_mux.plla_in,
 +                     s->channels[CPRMAN_PLLA_CHANNEL_DSI0].out);
 +    clock_set_source(s->dsi0hsck_mux.plld_in,
 +                     s->channels[CPRMAN_PLLD_CHANNEL_DSI0].out);
 +
 +    if (!qdev_realize(DEVICE(&s->dsi0hsck_mux), NULL, errp)) {
 +        return;
 +    }
 +
-     /* UNDEF accesses to D16-D31 if they don't exist. */
+     for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
-     if (!dc_isar_feature(aa32_simd_r32, s) &&
+         CprmanClockMuxState *clock_mux = &s->clock_muxes[i];
-         ((a->vd | a->vm) & 0x10)) {
-@@ -XXX,XX +XXX,XX @@ static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
+@@ -XXX,XX +XXX,XX @@ static void cprman_register_types(void)
-         return true;
+     type_register_static(&cprman_pll_info);
-     }
+     type_register_static(&cprman_pll_channel_info);
+     type_register_static(&cprman_clock_mux_info);
--    fpstatus = fpstatus_ptr(FPST_STD);
++    type_register_static(&cprman_dsi0hsck_mux_info);
 -    shiftv = tcg_const_i32(a->shift);
 -    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
 -        tmp = neon_load_reg(a->vm, pass);
 -        fn(tmp, tmp, shiftv, fpstatus);
 -        neon_store_reg(a->vd, pass, tmp);
 -    }
 -    tcg_temp_free_ptr(fpstatus);
 -    tcg_temp_free_i32(shiftv);
 +    fpst = fpstatus_ptr(a->size ? FPST_STD_F16 : FPST_STD);
 +    tcg_gen_gvec_2_ptr(rd_ofs, rm_ofs, fpst, vec_size, vec_size, a->shift, fn);
 +    tcg_temp_free_ptr(fpst);
      return true;
  }
-@@ -XXX,XX +XXX,XX @@ static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
+ type_init(cprman_register_types);
          return do_fp_2sh(s, a, FUNC);                                   \
      }
 -DO_FP_2SH(VCVT_SF, gen_helper_vfp_sltos)
 -DO_FP_2SH(VCVT_UF, gen_helper_vfp_ultos)
 -DO_FP_2SH(VCVT_FS, gen_helper_vfp_tosls_round_to_zero)
 -DO_FP_2SH(VCVT_FU, gen_helper_vfp_touls_round_to_zero)
 +DO_FP_2SH(VCVT_SF, gen_helper_gvec_vcvt_sf)
 +DO_FP_2SH(VCVT_UF, gen_helper_gvec_vcvt_uf)
 +DO_FP_2SH(VCVT_FS, gen_helper_gvec_vcvt_fs)
 +DO_FP_2SH(VCVT_FU, gen_helper_gvec_vcvt_fu)
  static uint64_t asimd_imm_const(uint32_t imm, int cmode, int op)
  {
 --
 .20.1

-[PULL 26/47] target/arm: Implement fp16 for VACGE, VACGT
+[PULL 42/48] hw/misc/bcm2835_cprman: add sane reset values to the registers
-Convert the neon floating-point vector absolute comparison ops
+From: Luc Michel <luc@lmichel.fr>
-VACGE and VACGT over to using a gvec hepler and use this to
-implement the fp16 case.
+Those reset values have been extracted from a Raspberry Pi 3 model B
+v1.2, using the 2020-08-20 version of raspios. The dump was done using
 the debugfs interface of the CPRMAN driver in Linux (under
 '/sys/kernel/debug/clk'). Each exposed clock tree stage (PLLs, channels
 and muxes) can be observed by reading the 'regdump' file (e.g.
 'plla/regdump').
 Those values are set by the Raspberry Pi firmware at boot time (Linux
 expects them to be set when it boots up).
 Some stages are not exposed by the Linux driver (e.g. the PLL B). For
 those, the reset values are unknown and left to 0 which implies a
 disabled output.
 Once booted in QEMU, the final clock tree is very similar to the one
 visible on real hardware. The differences come from some unimplemented
 devices for which the driver simply disable the corresponding clock.
 Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Luc Michel <luc@lmichel.fr>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Tested-by: Guenter Roeck <linux@roeck-us.net>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-28-peter.maydell@linaro.org
 ---
- target/arm/helper.h             |  6 ++++++
+ include/hw/misc/bcm2835_cprman_internals.h | 269 +++++++++++++++++++++
- target/arm/vec_helper.c         | 26 ++++++++++++++++++++++++++
+ hw/misc/bcm2835_cprman.c                   |  31 +++
- target/arm/translate-neon.c.inc |  4 ++--
+files changed, 300 insertions(+)
-files changed, 34 insertions(+), 2 deletions(-)
+diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
 diff --git a/target/arm/helper.h b/target/arm/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/misc/bcm2835_cprman_internals.h
-+++ b/target/arm/helper.h
++++ b/include/hw/misc/bcm2835_cprman_internals.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fcge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+@@ -XXX,XX +XXX,XX @@ static inline void set_clock_mux_init_info(BCM2835CprmanState *s,
- DEF_HELPER_FLAGS_5(gvec_fcgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+     mux->frac_bits = CLOCK_MUX_INIT_INFO[id].frac_bits;
- DEF_HELPER_FLAGS_5(gvec_fcgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+ }
-+DEF_HELPER_FLAGS_5(gvec_facge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++
-+DEF_HELPER_FLAGS_5(gvec_facge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++/*
-+
++ * Object reset info
-+DEF_HELPER_FLAGS_5(gvec_facgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++ * Those values have been dumped from a Raspberry Pi 3 Model B v1.2 using the
-+DEF_HELPER_FLAGS_5(gvec_facgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
++ * clk debugfs interface in Linux.
-+
++ */
- DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
++typedef struct PLLResetInfo {
-                    void, ptr, ptr, ptr, ptr, i32)
++    uint32_t cm;
- DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
++    uint32_t a2w_ctrl;
-diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
++    uint32_t a2w_ana[4];
 +    uint32_t a2w_frac;
 +} PLLResetInfo;
 +
 +static const PLLResetInfo PLL_RESET_INFO[] = {
 +    [CPRMAN_PLLA] = {
 +        .cm = 0x0000008a,
 +        .a2w_ctrl = 0x0002103a,
 +        .a2w_frac = 0x00098000,
 +        .a2w_ana = { 0x00000000, 0x00144000, 0x00000000, 0x00000100 }
 +    },
 +
 +    [CPRMAN_PLLC] = {
 +        .cm = 0x00000228,
 +        .a2w_ctrl = 0x0002103e,
 +        .a2w_frac = 0x00080000,
 +        .a2w_ana = { 0x00000000, 0x00144000, 0x00000000, 0x00000100 }
 +    },
 +
 +    [CPRMAN_PLLD] = {
 +        .cm = 0x0000020a,
 +        .a2w_ctrl = 0x00021034,
 +        .a2w_frac = 0x00015556,
 +        .a2w_ana = { 0x00000000, 0x00144000, 0x00000000, 0x00000100 }
 +    },
 +
 +    [CPRMAN_PLLH] = {
 +        .cm = 0x00000000,
 +        .a2w_ctrl = 0x0002102d,
 +        .a2w_frac = 0x00000000,
 +        .a2w_ana = { 0x00900000, 0x0000000c, 0x00000000, 0x00000000 }
 +    },
 +
 +    [CPRMAN_PLLB] = {
 +        /* unknown */
 +        .cm = 0x00000000,
 +        .a2w_ctrl = 0x00000000,
 +        .a2w_frac = 0x00000000,
 +        .a2w_ana = { 0x00000000, 0x00000000, 0x00000000, 0x00000000 }
 +    }
 +};
 +
 +typedef struct PLLChannelResetInfo {
 +    /*
 +     * Even though a PLL channel has a CM register, it shares it with its
 +     * parent PLL. The parent already takes care of the reset value.
 +     */
 +    uint32_t a2w_ctrl;
 +} PLLChannelResetInfo;
 +
 +static const PLLChannelResetInfo PLL_CHANNEL_RESET_INFO[] = {
 +    [CPRMAN_PLLA_CHANNEL_DSI0] = { .a2w_ctrl = 0x00000100 },
 +    [CPRMAN_PLLA_CHANNEL_CORE] = { .a2w_ctrl = 0x00000003 },
 +    [CPRMAN_PLLA_CHANNEL_PER] = { .a2w_ctrl = 0x00000000 }, /* unknown */
 +    [CPRMAN_PLLA_CHANNEL_CCP2] = { .a2w_ctrl = 0x00000100 },
 +
 +    [CPRMAN_PLLC_CHANNEL_CORE2] = { .a2w_ctrl = 0x00000100 },
 +    [CPRMAN_PLLC_CHANNEL_CORE1] = { .a2w_ctrl = 0x00000100 },
 +    [CPRMAN_PLLC_CHANNEL_PER] = { .a2w_ctrl = 0x00000002 },
 +    [CPRMAN_PLLC_CHANNEL_CORE0] = { .a2w_ctrl = 0x00000002 },
 +
 +    [CPRMAN_PLLD_CHANNEL_DSI0] = { .a2w_ctrl = 0x00000100 },
 +    [CPRMAN_PLLD_CHANNEL_CORE] = { .a2w_ctrl = 0x00000004 },
 +    [CPRMAN_PLLD_CHANNEL_PER] = { .a2w_ctrl = 0x00000004 },
 +    [CPRMAN_PLLD_CHANNEL_DSI1] = { .a2w_ctrl = 0x00000100 },
 +
 +    [CPRMAN_PLLH_CHANNEL_AUX] = { .a2w_ctrl = 0x00000004 },
 +    [CPRMAN_PLLH_CHANNEL_RCAL] = { .a2w_ctrl = 0x00000000 },
 +    [CPRMAN_PLLH_CHANNEL_PIX] = { .a2w_ctrl = 0x00000000 },
 +
 +    [CPRMAN_PLLB_CHANNEL_ARM] = { .a2w_ctrl = 0x00000000 }, /* unknown */
 +};
 +
 +typedef struct ClockMuxResetInfo {
 +    uint32_t cm_ctl;
 +    uint32_t cm_div;
 +} ClockMuxResetInfo;
 +
 +static const ClockMuxResetInfo CLOCK_MUX_RESET_INFO[] = {
 +    [CPRMAN_CLOCK_GNRIC] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_VPU] = {
 +        .cm_ctl = 0x00000245,
 +        .cm_div = 0x00003000,
 +    },
 +
 +    [CPRMAN_CLOCK_SYS] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_PERIA] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_PERII] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_H264] = {
 +        .cm_ctl = 0x00000244,
 +        .cm_div = 0x00003000,
 +    },
 +
 +    [CPRMAN_CLOCK_ISP] = {
 +        .cm_ctl = 0x00000244,
 +        .cm_div = 0x00003000,
 +    },
 +
 +    [CPRMAN_CLOCK_V3D] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_CAM0] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_CAM1] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_CCP2] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_DSI0E] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_DSI0P] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_DPI] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_GP0] = {
 +        .cm_ctl = 0x00000200,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_GP1] = {
 +        .cm_ctl = 0x00000096,
 +        .cm_div = 0x00014000,
 +    },
 +
 +    [CPRMAN_CLOCK_GP2] = {
 +        .cm_ctl = 0x00000291,
 +        .cm_div = 0x00249f00,
 +    },
 +
 +    [CPRMAN_CLOCK_HSM] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_OTP] = {
 +        .cm_ctl = 0x00000091,
 +        .cm_div = 0x00004000,
 +    },
 +
 +    [CPRMAN_CLOCK_PCM] = {
 +        .cm_ctl = 0x00000200,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_PWM] = {
 +        .cm_ctl = 0x00000200,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_SLIM] = {
 +        .cm_ctl = 0x00000200,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_SMI] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_TEC] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_TD0] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_TD1] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_TSENS] = {
 +        .cm_ctl = 0x00000091,
 +        .cm_div = 0x0000a000,
 +    },
 +
 +    [CPRMAN_CLOCK_TIMER] = {
 +        .cm_ctl = 0x00000291,
 +        .cm_div = 0x00013333,
 +    },
 +
 +    [CPRMAN_CLOCK_UART] = {
 +        .cm_ctl = 0x00000296,
 +        .cm_div = 0x0000a6ab,
 +    },
 +
 +    [CPRMAN_CLOCK_VEC] = {
 +        .cm_ctl = 0x00000097,
 +        .cm_div = 0x00002000,
 +    },
 +
 +    [CPRMAN_CLOCK_PULSE] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_SDC] = {
 +        .cm_ctl = 0x00004006,
 +        .cm_div = 0x00003000,
 +    },
 +
 +    [CPRMAN_CLOCK_ARM] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +
 +    [CPRMAN_CLOCK_AVEO] = {
 +        .cm_ctl = 0x00000000,
 +        .cm_div = 0x00000000,
 +    },
 +
 +    [CPRMAN_CLOCK_EMMC] = {
 +        .cm_ctl = 0x00000295,
 +        .cm_div = 0x00006000,
 +    },
 +
 +    [CPRMAN_CLOCK_EMMC2] = {
 +        .cm_ctl = 0, /* unknown */
 +        .cm_div = 0
 +    },
 +};
 +
  #endif
 diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vec_helper.c
+--- a/hw/misc/bcm2835_cprman.c
-+++ b/target/arm/vec_helper.c
++++ b/hw/misc/bcm2835_cprman.c
-@@ -XXX,XX +XXX,XX @@ static uint32_t float32_cgt(float32 op1, float32 op2, float_status *stat)
+@@ -XXX,XX +XXX,XX @@
-     return -float32_lt(op2, op1, stat);
- }
+ /* PLL */
-+static uint16_t float16_acge(float16 op1, float16 op2, float_status *stat)
++static void pll_reset(DeviceState *dev)
 +{
-+    return -float16_le(float16_abs(op2), float16_abs(op1), stat);
++    CprmanPllState *s = CPRMAN_PLL(dev);
 +    const PLLResetInfo *info = &PLL_RESET_INFO[s->id];
 +
 +    *s->reg_cm = info->cm;
 +    *s->reg_a2w_ctrl = info->a2w_ctrl;
 +    memcpy(s->reg_a2w_ana, info->a2w_ana, sizeof(info->a2w_ana));
 +    *s->reg_a2w_frac = info->a2w_frac;
 +}
 +
-+static uint32_t float32_acge(float32 op1, float32 op2, float_status *stat)
+ static bool pll_is_locked(const CprmanPllState *pll)
  {
      return !FIELD_EX32(*pll->reg_a2w_ctrl, A2W_PLLx_CTRL, PWRDN)
@@ -XXX,XX +XXX,XX @@ static void pll_class_init(ObjectClass *klass, void *data)
  {
      DeviceClass *dc = DEVICE_CLASS(klass);
 +    dc->reset = pll_reset;
      dc->vmsd = &pll_vmstate;
  }
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_info = {
  /* PLL channel */
 +static void pll_channel_reset(DeviceState *dev)
 +{
-+    return -float32_le(float32_abs(op2), float32_abs(op1), stat);
++    CprmanPllChannelState *s = CPRMAN_PLL_CHANNEL(dev);
 +    const PLLChannelResetInfo *info = &PLL_CHANNEL_RESET_INFO[s->id];
 +
 +    *s->reg_a2w_ctrl = info->a2w_ctrl;
 +}
 +
-+static uint16_t float16_acgt(float16 op1, float16 op2, float_status *stat)
+ static bool pll_channel_is_enabled(CprmanPllChannelState *channel)
  {
      /*
@@ -XXX,XX +XXX,XX @@ static void pll_channel_class_init(ObjectClass *klass, void *data)
  {
      DeviceClass *dc = DEVICE_CLASS(klass);
 +    dc->reset = pll_channel_reset;
      dc->vmsd = &pll_channel_vmstate;
  }
@@ -XXX,XX +XXX,XX @@ static void clock_mux_src_update(void *opaque)
      clock_mux_update(s);
  }
 +static void clock_mux_reset(DeviceState *dev)
 +{
-+    return -float16_lt(float16_abs(op2), float16_abs(op1), stat);
++    CprmanClockMuxState *clock = CPRMAN_CLOCK_MUX(dev);
 +    const ClockMuxResetInfo *info = &CLOCK_MUX_RESET_INFO[clock->id];
 +
 +    *clock->reg_ctl = info->cm_ctl;
 +    *clock->reg_div = info->cm_div;
 +}
 +
-+static uint32_t float32_acgt(float32 op1, float32 op2, float_status *stat)
+ static void clock_mux_init(Object *obj)
-+{
+ {
-+    return -float32_lt(float32_abs(op2), float32_abs(op1), stat);
+     CprmanClockMuxState *s = CPRMAN_CLOCK_MUX(obj);
-+}
+@@ -XXX,XX +XXX,XX @@ static void clock_mux_class_init(ObjectClass *klass, void *data)
-+
+ {
- #define DO_2OP(NAME, FUNC, TYPE) \
+     DeviceClass *dc = DEVICE_CLASS(klass);
- void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
- {                                                                 \
++    dc->reset = clock_mux_reset;
-@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_fcge_s, float32_cge, float32)
+     dc->vmsd = &clock_mux_vmstate;
- DO_3OP(gvec_fcgt_h, float16_cgt, float16)
+ }
  DO_3OP(gvec_fcgt_s, float32_cgt, float32)
 +DO_3OP(gvec_facge_h, float16_acge, float16)
 +DO_3OP(gvec_facge_s, float32_acge, float32)
 +
 +DO_3OP(gvec_facgt_h, float16_acgt, float16)
 +DO_3OP(gvec_facgt_s, float32_acgt, float32)
 +
  #ifdef TARGET_AARCH64
  DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
 diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-neon.c.inc
 +++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
  DO_3S_FP_GVEC(VCEQ, gen_helper_gvec_fceq_s, gen_helper_gvec_fceq_h)
  DO_3S_FP_GVEC(VCGE, gen_helper_gvec_fcge_s, gen_helper_gvec_fcge_h)
  DO_3S_FP_GVEC(VCGT, gen_helper_gvec_fcgt_s, gen_helper_gvec_fcgt_h)
 +DO_3S_FP_GVEC(VACGE, gen_helper_gvec_facge_s, gen_helper_gvec_facge_h)
 +DO_3S_FP_GVEC(VACGT, gen_helper_gvec_facgt_s, gen_helper_gvec_facgt_h)
  /*
   * For all the functions using this macro, size == 1 means fp16,
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VCGT, gen_helper_gvec_fcgt_s, gen_helper_gvec_fcgt_h)
          return do_3same_fp(s, a, FUNC, READS_VD);                   \
      }
 -DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
 -DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
  DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
  DO_3S_FP(VMIN, gen_helper_vfp_mins, false)
 --
 .20.1

-[PULL 08/47] target/arm: Implement VFP fp16 for VABS, VNEG, VSQRT
+[PULL 43/48] hw/char/pl011: add a clock input
-Implement VFP fp16 for VABS, VNEG and VSQRT. This is all
+From: Luc Michel <luc@lmichel.fr>
 the fp16 insns that use the DO_VFP_2OP macro, because there
 is no fp16 version of VMOV_reg.
-Notes:
+Add a clock input to the PL011 UART so we can compute the current baud
- * the gen_helper_vfp_negh already exists as we needed to create
+rate and trace it. This is intended for developers who wish to use QEMU
-   it for the fp16 multiply-add insns
+to e.g. debug their firmware or to figure out the baud rate configured
- * as usual we need to use the f16 version of the fp_status;
+by an unknown/closed source binary.
    this is only relevant for VSQRT
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-9-peter.maydell@linaro.org
 ---
- target/arm/helper.h            |  2 ++
+ include/hw/char/pl011.h |  1 +
- target/arm/vfp.decode          |  3 +++
+ hw/char/pl011.c         | 45 +++++++++++++++++++++++++++++++++++++++++
- target/arm/vfp_helper.c        | 10 +++++++++
+ hw/char/trace-events    |  1 +
- target/arm/translate-vfp.c.inc | 40 ++++++++++++++++++++++++++++++++++
+files changed, 47 insertions(+)
 files changed, 55 insertions(+)
-diff --git a/target/arm/helper.h b/target/arm/helper.h
+diff --git a/include/hw/char/pl011.h b/include/hw/char/pl011.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper.h
+--- a/include/hw/char/pl011.h
-+++ b/target/arm/helper.h
++++ b/include/hw/char/pl011.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
+@@ -XXX,XX +XXX,XX @@ struct PL011State {
- DEF_HELPER_1(vfp_negh, f16, f16)
+     int read_trigger;
- DEF_HELPER_1(vfp_negs, f32, f32)
+     CharBackend chr;
- DEF_HELPER_1(vfp_negd, f64, f64)
+     qemu_irq irq[6];
-+DEF_HELPER_1(vfp_absh, f16, f16)
++    Clock *clk;
- DEF_HELPER_1(vfp_abss, f32, f32)
+     const unsigned char *id;
- DEF_HELPER_1(vfp_absd, f64, f64)
+ };
-+DEF_HELPER_2(vfp_sqrth, f16, f16, env)
- DEF_HELPER_2(vfp_sqrts, f32, f32, env)
+diff --git a/hw/char/pl011.c b/hw/char/pl011.c
  DEF_HELPER_2(vfp_sqrtd, f64, f64, env)
  DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
 diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp.decode
+--- a/hw/char/pl011.c
-+++ b/target/arm/vfp.decode
++++ b/hw/char/pl011.c
-@@ -XXX,XX +XXX,XX @@ VMOV_imm_dp  ---- 1110 1.11 .... .... 1011 0000 .... \
+@@ -XXX,XX +XXX,XX @@
- VMOV_reg_sp  ---- 1110 1.11 0000 .... 1010 01.0 ....        @vfp_dm_ss
+ #include "hw/char/pl011.h"
- VMOV_reg_dp  ---- 1110 1.11 0000 .... 1011 01.0 ....        @vfp_dm_dd
+ #include "hw/irq.h"
+ #include "hw/sysbus.h"
-+VABS_hp      ---- 1110 1.11 0000 .... 1001 11.0 ....        @vfp_dm_ss
++#include "hw/qdev-clock.h"
- VABS_sp      ---- 1110 1.11 0000 .... 1010 11.0 ....        @vfp_dm_ss
+ #include "migration/vmstate.h"
- VABS_dp      ---- 1110 1.11 0000 .... 1011 11.0 ....        @vfp_dm_dd
+ #include "chardev/char-fe.h"
+ #include "qemu/log.h"
-+VNEG_hp      ---- 1110 1.11 0001 .... 1001 01.0 ....        @vfp_dm_ss
+@@ -XXX,XX +XXX,XX @@ static void pl011_set_read_trigger(PL011State *s)
- VNEG_sp      ---- 1110 1.11 0001 .... 1010 01.0 ....        @vfp_dm_ss
+         s->read_trigger = 1;
  VNEG_dp      ---- 1110 1.11 0001 .... 1011 01.0 ....        @vfp_dm_dd
 +VSQRT_hp     ---- 1110 1.11 0001 .... 1001 11.0 ....        @vfp_dm_ss
  VSQRT_sp     ---- 1110 1.11 0001 .... 1010 11.0 ....        @vfp_dm_ss
  VSQRT_dp     ---- 1110 1.11 0001 .... 1011 11.0 ....        @vfp_dm_dd
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 VFP_HELPER(neg, d)(float64 a)
      return float64_chs(a);
  }
-+dh_ctype_f16 VFP_HELPER(abs, h)(dh_ctype_f16 a)
++static unsigned int pl011_get_baudrate(const PL011State *s)
 +{
-+    return float16_abs(a);
++    uint64_t clk;
 +
 +    if (s->fbrd == 0) {
 +        return 0;
 +    }
 +
 +    clk = clock_get_hz(s->clk);
 +    return (clk / ((s->ibrd << 6) + s->fbrd)) << 2;
 +}
 +
- float32 VFP_HELPER(abs, s)(float32 a)
++static void pl011_trace_baudrate_change(const PL011State *s)
  {
      return float32_abs(a);
@@ -XXX,XX +XXX,XX @@ float64 VFP_HELPER(abs, d)(float64 a)
      return float64_abs(a);
  }
 +dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, CPUARMState *env)
 +{
-+    return float16_sqrt(a, &env->vfp.fp_status_f16);
++    trace_pl011_baudrate_change(pl011_get_baudrate(s),
 +                                clock_get_hz(s->clk),
 +                                s->ibrd, s->fbrd);
 +}
 +
- float32 VFP_HELPER(sqrt, s)(float32 a, CPUARMState *env)
+ static void pl011_write(void *opaque, hwaddr offset,
                          uint64_t value, unsigned size)
  {
-     return float32_sqrt(a, &env->vfp.fp_status);
+@@ -XXX,XX +XXX,XX @@ static void pl011_write(void *opaque, hwaddr offset,
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
+         break;
-index XXXXXXX..XXXXXXX 100644
+     case 9: /* UARTIBRD */
---- a/target/arm/translate-vfp.c.inc
+         s->ibrd = value;
-+++ b/target/arm/translate-vfp.c.inc
++        pl011_trace_baudrate_change(s);
-@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_sp(DisasContext *s, VFPGen2OpSPFn *fn, int vd, int vm)
+         break;
-     return true;
+     case 10: /* UARTFBRD */
          s->fbrd = value;
 +        pl011_trace_baudrate_change(s);
          break;
      case 11: /* UARTLCR_H */
          /* Reset the FIFO state on FIFO enable or disable */
@@ -XXX,XX +XXX,XX @@ static void pl011_event(void *opaque, QEMUChrEvent event)
          pl011_put_fifo(opaque, 0x400);
  }
-+static bool do_vfp_2op_hp(DisasContext *s, VFPGen2OpSPFn *fn, int vd, int vm)
++static void pl011_clock_update(void *opaque)
 +{
-+    /*
++    PL011State *s = PL011(opaque);
 +     * Do a half-precision operation. Functionally this is
 +     * the same as do_vfp_2op_sp(), except:
 +     *  - it doesn't need the VFP vector handling (fp16 is a
 +     *    v8 feature, and in v8 VFP vectors don't exist)
 +     *  - it does the aa32_fp16_arith feature test
 +     */
 +    TCGv_i32 f0;
 +
-+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
++    pl011_trace_baudrate_change(s);
 +        return false;
 +    }
 +
 +    if (s->vec_len != 0 || s->vec_stride != 0) {
 +        return false;
 +    }
 +
 +    if (!vfp_access_check(s)) {
 +        return true;
 +    }
 +
 +    f0 = tcg_temp_new_i32();
 +    neon_load_reg32(f0, vm);
 +    fn(f0, f0);
 +    neon_store_reg32(f0, vd);
 +    tcg_temp_free_i32(f0);
 +
 +    return true;
 +}
 +
- static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
+ static const MemoryRegionOps pl011_ops = {
- {
+     .read = pl011_read,
-     uint32_t delta_m = 0;
+     .write = pl011_write,
-@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
+     .endianness = DEVICE_NATIVE_ENDIAN,
- DO_VFP_2OP(VMOV_reg, sp, tcg_gen_mov_i32)
+ };
- DO_VFP_2OP(VMOV_reg, dp, tcg_gen_mov_i64)
++static const VMStateDescription vmstate_pl011_clock = {
-+DO_VFP_2OP(VABS, hp, gen_helper_vfp_absh)
++    .name = "pl011/clock",
- DO_VFP_2OP(VABS, sp, gen_helper_vfp_abss)
++    .version_id = 1,
- DO_VFP_2OP(VABS, dp, gen_helper_vfp_absd)
++    .minimum_version_id = 1,
++    .fields = (VMStateField[]) {
-+DO_VFP_2OP(VNEG, hp, gen_helper_vfp_negh)
++        VMSTATE_CLOCK(clk, PL011State),
- DO_VFP_2OP(VNEG, sp, gen_helper_vfp_negs)
++        VMSTATE_END_OF_LIST()
- DO_VFP_2OP(VNEG, dp, gen_helper_vfp_negd)
++    }
++};
 +static void gen_VSQRT_hp(TCGv_i32 vd, TCGv_i32 vm)
 +{
 +    gen_helper_vfp_sqrth(vd, vm, cpu_env);
 +}
 +
- static void gen_VSQRT_sp(TCGv_i32 vd, TCGv_i32 vm)
+ static const VMStateDescription vmstate_pl011 = {
- {
+     .name = "pl011",
-     gen_helper_vfp_sqrts(vd, vm, cpu_env);
+     .version_id = 2,
-@@ -XXX,XX +XXX,XX @@ static void gen_VSQRT_dp(TCGv_i64 vd, TCGv_i64 vm)
+@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_pl011 = {
-     gen_helper_vfp_sqrtd(vd, vm, cpu_env);
+         VMSTATE_INT32(read_count, PL011State),
- }
+         VMSTATE_INT32(read_trigger, PL011State),
+         VMSTATE_END_OF_LIST()
-+DO_VFP_2OP(VSQRT, hp, gen_VSQRT_hp)
++    },
- DO_VFP_2OP(VSQRT, sp, gen_VSQRT_sp)
++    .subsections = (const VMStateDescription * []) {
- DO_VFP_2OP(VSQRT, dp, gen_VSQRT_dp)
++        &vmstate_pl011_clock,
++        NULL
      }
  };
@@ -XXX,XX +XXX,XX @@ static void pl011_init(Object *obj)
          sysbus_init_irq(sbd, &s->irq[i]);
      }
 +    s->clk = qdev_init_clock_in(DEVICE(obj), "clk", pl011_clock_update, s);
 +
      s->read_trigger = 1;
      s->ifl = 0x12;
      s->cr = 0x300;
 diff --git a/hw/char/trace-events b/hw/char/trace-events
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/char/trace-events
 +++ b/hw/char/trace-events
@@ -XXX,XX +XXX,XX @@ pl011_write(uint32_t addr, uint32_t value) "addr 0x%08x value 0x%08x"
  pl011_can_receive(uint32_t lcr, int read_count, int r) "LCR 0x%08x read_count %d returning %d"
  pl011_put_fifo(uint32_t c, int read_count) "new char 0x%x read_count now %d"
  pl011_put_fifo_full(void) "FIFO now full, RXFF set"
 +pl011_baudrate_change(unsigned int baudrate, uint64_t clock, uint32_t ibrd, uint32_t fbrd) "new baudrate %u (clk: %" PRIu64 "hz, ibrd: %" PRIu32 ", fbrd: %" PRIu32 ")"
  # cmsdk-apb-uart.c
  cmsdk_apb_uart_read(uint64_t offset, uint64_t data, unsigned size) "CMSDK APB UART read: offset 0x%" PRIx64 " data 0x%" PRIx64 " size %u"
 --
 .20.1

-[PULL 01/47] target/arm: Remove local definitions of float constants
+[PULL 44/48] hw/arm/bcm2835_peripherals: connect the UART clock
-In several places the target/arm code defines local float constants
+From: Luc Michel <luc@lmichel.fr>
 for 2, 3 and 1.5, which are also provided by include/fpu/softfloat.h.
 Remove the unnecessary local duplicate versions.
+Connect the 'uart-out' clock from the CPRMAN to the PL011 instance.
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Signed-off-by: Luc Michel <luc@lmichel.fr>
+Tested-by: Guenter Roeck <linux@roeck-us.net>
+Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200828183354.27913-2-peter.maydell@linaro.org
 ---
- target/arm/helper-a64.c    | 11 -----------
+ hw/arm/bcm2835_peripherals.c | 2 ++
- target/arm/translate-sve.c |  4 ----
+file changed, 2 insertions(+)
  target/arm/vfp_helper.c    |  4 ----
 files changed, 19 deletions(-)
-diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
+diff --git a/hw/arm/bcm2835_peripherals.c b/hw/arm/bcm2835_peripherals.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.c
+--- a/hw/arm/bcm2835_peripherals.c
-+++ b/target/arm/helper-a64.c
++++ b/hw/arm/bcm2835_peripherals.c
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, void *fpstp)
+@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
-  * versions, these do a fully fused multiply-add or
+     }
-  * multiply-add-and-halve.
+     memory_region_add_subregion(&s->peri_mr, CPRMAN_OFFSET,
-  */
+                 sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->cprman), 0));
--#define float16_two make_float16(0x4000)
++    qdev_connect_clock_in(DEVICE(&s->uart0), "clk",
--#define float16_three make_float16(0x4200)
++                          qdev_get_clock_out(DEVICE(&s->cprman), "uart-out"));
--#define float16_one_point_five make_float16(0x3e00)
--
+     memory_region_add_subregion(&s->peri_mr, ARMCTRL_IC_OFFSET,
--#define float32_two make_float32(0x40000000)
+                 sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->ic), 0));
 -#define float32_three make_float32(0x40400000)
 -#define float32_one_point_five make_float32(0x3fc00000)
 -
 -#define float64_two make_float64(0x4000000000000000ULL)
 -#define float64_three make_float64(0x4008000000000000ULL)
 -#define float64_one_point_five make_float64(0x3FF8000000000000ULL)
  uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, void *fpstp)
  {
 diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME##_zpzi(DisasContext *s, arg_rpri_esz *a)         \
      return true;                                                          \
  }
 -#define float16_two  make_float16(0x4000)
 -#define float32_two  make_float32(0x40000000)
 -#define float64_two  make_float64(0x4000000000000000ULL)
 -
  DO_FP_IMM(FADD, fadds, half, one)
  DO_FP_IMM(FSUB, fsubs, half, one)
  DO_FP_IMM(FMUL, fmuls, half, two)
 diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/vfp_helper.c
 +++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
      return r;
  }
 -#define float32_two make_float32(0x40000000)
 -#define float32_three make_float32(0x40400000)
 -#define float32_one_point_five make_float32(0x3fc00000)
 -
  float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
  {
      float_status *s = &env->vfp.standard_fp_status;
 --
 .20.1

-[PULL 46/47] hw/misc/sbsa_ec : Add an embedded controller for sbsa-ref
+[PULL 45/48] hw/watchdog: Implement SBSA watchdog device
-From: Graeme Gregory <graeme@nuviainc.com>
+From: Shashi Mallela <shashi.mallela@linaro.org>
-A difference between sbsa platform and the virt platform is PSCI is
+Generic watchdog device model implementation as per ARM SBSA v6.0
 handled by ARM-TF in the sbsa platform. This means that the PSCI code
 there needs to communicate some of the platform power changes down
 to the qemu code for things like shutdown/reset control.
-Space has been left to extend the EC if we find other use cases in
+Signed-off-by: Shashi Mallela <shashi.mallela@linaro.org>
-future where ARM-TF and qemu need to communicate.
+Message-id: 20201027015927.29495-2-shashi.mallela@linaro.org
 Signed-off-by: Graeme Gregory <graeme@nuviainc.com>
 Reviewed-by: Leif Lindholm <leif@nuviainc.com>
 Tested-by: Leif Lindholm <leif@nuviainc.com>
 Message-id: 20200826141952.136164-2-graeme@nuviainc.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/misc/sbsa_ec.c   | 98 +++++++++++++++++++++++++++++++++++++++++++++
+ include/hw/watchdog/sbsa_gwdt.h |  79 +++++++++
- hw/misc/meson.build |  2 +
+ hw/watchdog/sbsa_gwdt.c         | 293 ++++++++++++++++++++++++++++++++
-files changed, 100 insertions(+)
+ hw/arm/Kconfig                  |   1 +
- create mode 100644 hw/misc/sbsa_ec.c
+ hw/watchdog/Kconfig             |   3 +
  hw/watchdog/meson.build         |   1 +
 files changed, 377 insertions(+)
  create mode 100644 include/hw/watchdog/sbsa_gwdt.h
  create mode 100644 hw/watchdog/sbsa_gwdt.c
-diff --git a/hw/misc/sbsa_ec.c b/hw/misc/sbsa_ec.c
+diff --git a/include/hw/watchdog/sbsa_gwdt.h b/include/hw/watchdog/sbsa_gwdt.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/hw/misc/sbsa_ec.c
++++ b/include/hw/watchdog/sbsa_gwdt.h
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * ARM SBSA Reference Platform Embedded Controller
++ * Copyright (c) 2020 Linaro Limited
 + *
-+ * A device to allow PSCI running in the secure side of sbsa-ref machine
++ * Authors:
-+ * to communicate platform power states to qemu.
++ *  Shashi Mallela <shashi.mallela@linaro.org>
 + *
-+ * Copyright (c) 2020 Nuvia Inc
++ * This work is licensed under the terms of the GNU GPL, version 2 or (at your
-+ * Written by Graeme Gregory <graeme@nuviainc.com>
++ * option) any later version.  See the COPYING file in the top-level directory.
 + *
 + * SPDX-License-Identifer: GPL-2.0-or-later
 + */
 +
++#ifndef WDT_SBSA_GWDT_H
++#define WDT_SBSA_GWDT_H
++
++#include "qemu/bitops.h"
++#include "hw/sysbus.h"
++#include "hw/irq.h"
++
++#define TYPE_WDT_SBSA "sbsa_gwdt"
++#define SBSA_GWDT(obj) \
++    OBJECT_CHECK(SBSA_GWDTState, (obj), TYPE_WDT_SBSA)
++#define SBSA_GWDT_CLASS(klass) \
++    OBJECT_CLASS_CHECK(SBSA_GWDTClass, (klass), TYPE_WDT_SBSA)
++#define SBSA_GWDT_GET_CLASS(obj) \
++    OBJECT_GET_CLASS(SBSA_GWDTClass, (obj), TYPE_WDT_SBSA)
++
++/* SBSA Generic Watchdog register definitions */
++/* refresh frame */
++#define SBSA_GWDT_WRR       0x000
++
++/* control frame */
++#define SBSA_GWDT_WCS       0x000
++#define SBSA_GWDT_WOR       0x008
++#define SBSA_GWDT_WORU      0x00C
++#define SBSA_GWDT_WCV       0x010
++#define SBSA_GWDT_WCVU      0x014
++
++/* Watchdog Interface Identification Register */
++#define SBSA_GWDT_W_IIDR    0xFCC
++
++/* Watchdog Control and Status Register Bits */
++#define SBSA_GWDT_WCS_EN    BIT(0)
++#define SBSA_GWDT_WCS_WS0   BIT(1)
++#define SBSA_GWDT_WCS_WS1   BIT(2)
++
++#define SBSA_GWDT_WOR_MASK  0x0000FFFF
++
++/*
++ * Watchdog Interface Identification Register definition
++ * considering JEP106 code for ARM in Bits [11:0]
++ */
++#define SBSA_GWDT_ID        0x1043B
++
++/* 2 Separate memory regions for each of refresh & control register frames */
++#define SBSA_GWDT_RMMIO_SIZE 0x1000
++#define SBSA_GWDT_CMMIO_SIZE 0x1000
++
++#define SBSA_TIMER_FREQ      62500000 /* Hz */
++
++typedef struct SBSA_GWDTState {
++    /* <private> */
++    SysBusDevice parent_obj;
++
++    /*< public >*/
++    MemoryRegion rmmio;
++    MemoryRegion cmmio;
++    qemu_irq irq;
++
++    QEMUTimer *timer;
++
++    uint32_t id;
++    uint32_t wcs;
++    uint32_t worl;
++    uint32_t woru;
++    uint32_t wcvl;
++    uint32_t wcvu;
++} SBSA_GWDTState;
++
++#endif /* WDT_SBSA_GWDT_H */
+diff --git a/hw/watchdog/sbsa_gwdt.c b/hw/watchdog/sbsa_gwdt.c
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/hw/watchdog/sbsa_gwdt.c
+@@ -XXX,XX +XXX,XX @@
++/*
++ * Generic watchdog device model for SBSA
++ *
++ * The watchdog device has been implemented as revision 1 variant of
++ * the ARM SBSA specification v6.0
++ * (https://developer.arm.com/documentation/den0029/d?lang=en)
++ *
++ * Copyright Linaro.org 2020
++ *
++ * Authors:
++ *  Shashi Mallela <shashi.mallela@linaro.org>
++ *
++ * This work is licensed under the terms of the GNU GPL, version 2 or (at your
++ * option) any later version.  See the COPYING file in the top-level directory.
++ *
++ */
++
 +#include "qemu/osdep.h"
-+#include "qemu-common.h"
++#include "sysemu/reset.h"
 +#include "sysemu/watchdog.h"
 +#include "hw/watchdog/sbsa_gwdt.h"
 +#include "qemu/timer.h"
 +#include "migration/vmstate.h"
 +#include "qemu/log.h"
-+#include "hw/sysbus.h"
++#include "qemu/module.h"
-+#include "sysemu/runstate.h"
++
-+
++static WatchdogTimerModel model = {
-+typedef struct {
++    .wdt_name = TYPE_WDT_SBSA,
-+    SysBusDevice parent_obj;
++    .wdt_description = "SBSA-compliant generic watchdog device",
 +    MemoryRegion iomem;
 +} SECUREECState;
 +
 +#define TYPE_SBSA_EC      "sbsa-ec"
 +#define SECURE_EC(obj) OBJECT_CHECK(SECUREECState, (obj), TYPE_SBSA_EC)
 +
 +enum sbsa_ec_powerstates {
 +    SBSA_EC_CMD_POWEROFF = 0x01,
 +    SBSA_EC_CMD_REBOOT = 0x02,
 +};
 +
-+static uint64_t sbsa_ec_read(void *opaque, hwaddr offset, unsigned size)
++static const VMStateDescription vmstate_sbsa_gwdt = {
-+{
++    .name = "sbsa-gwdt",
-+    /* No use for this currently */
++    .version_id = 1,
-+    qemu_log_mask(LOG_GUEST_ERROR, "sbsa-ec: no readable registers");
++    .minimum_version_id = 1,
-+    return 0;
++    .fields = (VMStateField[]) {
-+}
++        VMSTATE_TIMER_PTR(timer, SBSA_GWDTState),
-+
++        VMSTATE_UINT32(wcs, SBSA_GWDTState),
-+static void sbsa_ec_write(void *opaque, hwaddr offset,
++        VMSTATE_UINT32(worl, SBSA_GWDTState),
-+                     uint64_t value, unsigned size)
++        VMSTATE_UINT32(woru, SBSA_GWDTState),
-+{
++        VMSTATE_UINT32(wcvl, SBSA_GWDTState),
-+    if (offset == 0) { /* PSCI machine power command register */
++        VMSTATE_UINT32(wcvu, SBSA_GWDTState),
-+        switch (value) {
++        VMSTATE_END_OF_LIST()
-+        case SBSA_EC_CMD_POWEROFF:
++    }
-+            qemu_system_shutdown_request(SHUTDOWN_CAUSE_GUEST_SHUTDOWN);
++};
-+            break;
++
-+        case SBSA_EC_CMD_REBOOT:
++typedef enum WdtRefreshType {
-+            qemu_system_reset_request(SHUTDOWN_CAUSE_GUEST_RESET);
++    EXPLICIT_REFRESH = 0,
 +    TIMEOUT_REFRESH = 1,
 +} WdtRefreshType;
 +
 +static uint64_t sbsa_gwdt_rread(void *opaque, hwaddr addr, unsigned int size)
 +{
 +    SBSA_GWDTState *s = SBSA_GWDT(opaque);
 +    uint32_t ret = 0;
 +
 +    switch (addr) {
 +    case SBSA_GWDT_WRR:
 +        /* watch refresh read has no effect and returns 0 */
 +        ret = 0;
 +        break;
 +    case SBSA_GWDT_W_IIDR:
 +        ret = s->id;
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR, "bad address in refresh frame read :"
 +                        " 0x%x\n", (int)addr);
 +    }
 +    return ret;
 +}
 +
 +static uint64_t sbsa_gwdt_read(void *opaque, hwaddr addr, unsigned int size)
 +{
 +    SBSA_GWDTState *s = SBSA_GWDT(opaque);
 +    uint32_t ret = 0;
 +
 +    switch (addr) {
 +    case SBSA_GWDT_WCS:
 +        ret = s->wcs;
 +        break;
 +    case SBSA_GWDT_WOR:
 +        ret = s->worl;
 +        break;
 +    case SBSA_GWDT_WORU:
 +         ret = s->woru;
 +         break;
 +    case SBSA_GWDT_WCV:
 +        ret = s->wcvl;
 +        break;
 +    case SBSA_GWDT_WCVU:
 +        ret = s->wcvu;
 +        break;
 +    case SBSA_GWDT_W_IIDR:
 +        ret = s->id;
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR, "bad address in control frame read :"
 +                        " 0x%x\n", (int)addr);
 +    }
 +    return ret;
 +}
 +
 +static void sbsa_gwdt_update_timer(SBSA_GWDTState *s, WdtRefreshType rtype)
 +{
 +    uint64_t timeout = 0;
 +
 +    timer_del(s->timer);
 +
 +    if (s->wcs & SBSA_GWDT_WCS_EN) {
 +        /*
 +         * Extract the upper 16 bits from woru & 32 bits from worl
 +         * registers to construct the 48 bit offset value
 +         */
 +        timeout = s->woru;
 +        timeout <<= 32;
 +        timeout |= s->worl;
 +        timeout = muldiv64(timeout, NANOSECONDS_PER_SECOND, SBSA_TIMER_FREQ);
 +        timeout += qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 +
 +        if ((rtype == EXPLICIT_REFRESH) || ((rtype == TIMEOUT_REFRESH) &&
 +                (!(s->wcs & SBSA_GWDT_WCS_WS0)))) {
 +            /* store the current timeout value into compare registers */
 +            s->wcvu = timeout >> 32;
 +            s->wcvl = timeout;
 +        }
 +        timer_mod(s->timer, timeout);
 +    }
 +}
 +
 +static void sbsa_gwdt_rwrite(void *opaque, hwaddr offset, uint64_t data,
 +                             unsigned size) {
 +    SBSA_GWDTState *s = SBSA_GWDT(opaque);
 +
 +    if (offset == SBSA_GWDT_WRR) {
 +        s->wcs &= ~(SBSA_GWDT_WCS_WS0 | SBSA_GWDT_WCS_WS1);
 +
 +        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
 +    } else {
 +        qemu_log_mask(LOG_GUEST_ERROR, "bad address in refresh frame write :"
 +                        " 0x%x\n", (int)offset);
 +    }
 +}
 +
 +static void sbsa_gwdt_write(void *opaque, hwaddr offset, uint64_t data,
 +                             unsigned size) {
 +    SBSA_GWDTState *s = SBSA_GWDT(opaque);
 +
 +    switch (offset) {
 +    case SBSA_GWDT_WCS:
 +        s->wcs = data & SBSA_GWDT_WCS_EN;
 +        qemu_set_irq(s->irq, 0);
 +        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
 +        break;
 +
 +    case SBSA_GWDT_WOR:
 +        s->worl = data;
 +        s->wcs &= ~(SBSA_GWDT_WCS_WS0 | SBSA_GWDT_WCS_WS1);
 +        qemu_set_irq(s->irq, 0);
 +        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
 +        break;
 +
 +    case SBSA_GWDT_WORU:
 +        s->woru = data & SBSA_GWDT_WOR_MASK;
 +        s->wcs &= ~(SBSA_GWDT_WCS_WS0 | SBSA_GWDT_WCS_WS1);
 +        qemu_set_irq(s->irq, 0);
 +        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
 +        break;
 +
 +    case SBSA_GWDT_WCV:
 +        s->wcvl = data;
 +        break;
 +
 +    case SBSA_GWDT_WCVU:
 +        s->wcvu = data;
 +        break;
 +
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR, "bad address in control frame write :"
 +                " 0x%x\n", (int)offset);
 +    }
 +    return;
 +}
 +
 +static void wdt_sbsa_gwdt_reset(DeviceState *dev)
 +{
 +    SBSA_GWDTState *s = SBSA_GWDT(dev);
 +
 +    timer_del(s->timer);
 +
 +    s->wcs  = 0;
 +    s->wcvl = 0;
 +    s->wcvu = 0;
 +    s->worl = 0;
 +    s->woru = 0;
 +    s->id = SBSA_GWDT_ID;
 +}
 +
 +static void sbsa_gwdt_timer_sysinterrupt(void *opaque)
 +{
 +    SBSA_GWDTState *s = SBSA_GWDT(opaque);
 +
 +    if (!(s->wcs & SBSA_GWDT_WCS_WS0)) {
 +        s->wcs |= SBSA_GWDT_WCS_WS0;
 +        sbsa_gwdt_update_timer(s, TIMEOUT_REFRESH);
 +        qemu_set_irq(s->irq, 1);
 +    } else {
 +        s->wcs |= SBSA_GWDT_WCS_WS1;
 +        qemu_log_mask(CPU_LOG_RESET, "Watchdog timer expired.\n");
 +        /*
 +         * Reset the watchdog only if the guest gets notified about
 +         * expiry. watchdog_perform_action() may temporarily relinquish
 +         * the BQL; reset before triggering the action to avoid races with
 +         * sbsa_gwdt instructions.
 +         */
 +        switch (get_watchdog_action()) {
 +        case WATCHDOG_ACTION_DEBUG:
 +        case WATCHDOG_ACTION_NONE:
 +        case WATCHDOG_ACTION_PAUSE:
 +            break;
 +        default:
-+            qemu_log_mask(LOG_GUEST_ERROR,
++            wdt_sbsa_gwdt_reset(DEVICE(s));
 +                          "sbsa-ec: unknown power command");
 +        }
-+    } else {
++        watchdog_perform_action();
-+        qemu_log_mask(LOG_GUEST_ERROR, "sbsa-ec: unknown EC register");
++    }
-+    }
++}
-+}
++
-+
++static const MemoryRegionOps sbsa_gwdt_rops = {
-+static const MemoryRegionOps sbsa_ec_ops = {
++    .read = sbsa_gwdt_rread,
-+    .read = sbsa_ec_read,
++    .write = sbsa_gwdt_rwrite,
-+    .write = sbsa_ec_write,
++    .endianness = DEVICE_LITTLE_ENDIAN,
 +    .endianness = DEVICE_NATIVE_ENDIAN,
 +    .valid.min_access_size = 4,
 +    .valid.max_access_size = 4,
++    .valid.unaligned = false,
 +};
 +
-+static void sbsa_ec_init(Object *obj)
++static const MemoryRegionOps sbsa_gwdt_ops = {
-+{
++    .read = sbsa_gwdt_read,
-+    SECUREECState *s = SECURE_EC(obj);
++    .write = sbsa_gwdt_write,
-+    SysBusDevice *dev = SYS_BUS_DEVICE(obj);
++    .endianness = DEVICE_LITTLE_ENDIAN,
-+
++    .valid.min_access_size = 4,
-+    memory_region_init_io(&s->iomem, obj, &sbsa_ec_ops, s, "sbsa-ec",
++    .valid.max_access_size = 4,
-+                          0x1000);
++    .valid.unaligned = false,
-+    sysbus_init_mmio(dev, &s->iomem);
++};
-+}
++
-+
++static void wdt_sbsa_gwdt_realize(DeviceState *dev, Error **errp)
-+static void sbsa_ec_class_init(ObjectClass *klass, void *data)
++{
 +    SBSA_GWDTState *s = SBSA_GWDT(dev);
 +    SysBusDevice *sbd = SYS_BUS_DEVICE(dev);
 +
 +    memory_region_init_io(&s->rmmio, OBJECT(dev),
 +                          &sbsa_gwdt_rops, s,
 +                          "sbsa_gwdt.refresh",
 +                          SBSA_GWDT_RMMIO_SIZE);
 +
 +    memory_region_init_io(&s->cmmio, OBJECT(dev),
 +                          &sbsa_gwdt_ops, s,
 +                          "sbsa_gwdt.control",
 +                          SBSA_GWDT_CMMIO_SIZE);
 +
 +    sysbus_init_mmio(sbd, &s->rmmio);
 +    sysbus_init_mmio(sbd, &s->cmmio);
 +
 +    sysbus_init_irq(sbd, &s->irq);
 +
 +    s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, sbsa_gwdt_timer_sysinterrupt,
 +                dev);
 +}
 +
 +static void wdt_sbsa_gwdt_class_init(ObjectClass *klass, void *data)
 +{
 +    DeviceClass *dc = DEVICE_CLASS(klass);
 +
-+    /* No vmstate or reset required: device has no internal state */
++    dc->realize = wdt_sbsa_gwdt_realize;
-+    dc->user_creatable = false;
++    dc->reset = wdt_sbsa_gwdt_reset;
-+}
++    dc->hotpluggable = false;
-+
++    set_bit(DEVICE_CATEGORY_MISC, dc->categories);
-+static const TypeInfo sbsa_ec_info = {
++    dc->vmsd = &vmstate_sbsa_gwdt;
-+    .name          = TYPE_SBSA_EC,
++}
-+    .parent        = TYPE_SYS_BUS_DEVICE,
++
-+    .instance_size = sizeof(SECUREECState),
++static const TypeInfo wdt_sbsa_gwdt_info = {
-+    .instance_init = sbsa_ec_init,
++    .class_init = wdt_sbsa_gwdt_class_init,
-+    .class_init    = sbsa_ec_class_init,
++    .parent = TYPE_SYS_BUS_DEVICE,
 +    .name  = TYPE_WDT_SBSA,
 +    .instance_size  = sizeof(SBSA_GWDTState),
 +};
 +
-+static void sbsa_ec_register_type(void)
++static void wdt_sbsa_gwdt_register_types(void)
 +{
-+    type_register_static(&sbsa_ec_info);
++    watchdog_add_model(&model);
-+}
++    type_register_static(&wdt_sbsa_gwdt_info);
-+
++}
-+type_init(sbsa_ec_register_type);
++
-diff --git a/hw/misc/meson.build b/hw/misc/meson.build
++type_init(wdt_sbsa_gwdt_register_types)
 diff --git a/hw/arm/Kconfig b/hw/arm/Kconfig
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/meson.build
+--- a/hw/arm/Kconfig
-+++ b/hw/misc/meson.build
++++ b/hw/arm/Kconfig
-@@ -XXX,XX +XXX,XX @@ specific_ss.add(when: 'CONFIG_MAC_VIA', if_true: files('mac_via.c'))
+@@ -XXX,XX +XXX,XX @@ config SBSA_REF
+     select PL031 # RTC
- specific_ss.add(when: 'CONFIG_MIPS_CPS', if_true: files('mips_cmgcr.c', 'mips_cpc.c'))
+     select PL061 # GPIO
- specific_ss.add(when: 'CONFIG_MIPS_ITU', if_true: files('mips_itu.c'))
+     select USB_EHCI_SYSBUS
-+
++    select WDT_SBSA
-+specific_ss.add(when: 'CONFIG_SBSA_REF', if_true: files('sbsa_ec.c'))
  config SABRELITE
      bool
 diff --git a/hw/watchdog/Kconfig b/hw/watchdog/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/watchdog/Kconfig
 +++ b/hw/watchdog/Kconfig
@@ -XXX,XX +XXX,XX @@ config WDT_DIAG288
  config WDT_IMX2
      bool
 +
 +config WDT_SBSA
 +    bool
 diff --git a/hw/watchdog/meson.build b/hw/watchdog/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/watchdog/meson.build
 +++ b/hw/watchdog/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_WDT_IB700', if_true: files('wdt_ib700.c'))
  softmmu_ss.add(when: 'CONFIG_WDT_DIAG288', if_true: files('wdt_diag288.c'))
  softmmu_ss.add(when: 'CONFIG_ASPEED_SOC', if_true: files('wdt_aspeed.c'))
  softmmu_ss.add(when: 'CONFIG_WDT_IMX2', if_true: files('wdt_imx2.c'))
 +softmmu_ss.add(when: 'CONFIG_WDT_SBSA', if_true: files('sbsa_gwdt.c'))
 --
 .20.1

-[PULL 47/47] hw/arm/sbsa-ref : Add embedded controller in secure memory
+[PULL 46/48] hw/arm/sbsa-ref: add SBSA watchdog device
-From: Graeme Gregory <graeme@nuviainc.com>
+From: Shashi Mallela <shashi.mallela@linaro.org>
-Add the previously created sbsa-ec device to the sbsa-ref machine in
+Included the newly implemented SBSA generic watchdog device model into
-secure memory so the PSCI implementation in ARM-TF can access it, but
+SBSA platform
 not expose it to non secure firmware or OS except by via ARM-TF.
-Signed-off-by: Graeme Gregory <graeme@nuviainc.com>
+Signed-off-by: Shashi Mallela <shashi.mallela@linaro.org>
 Reviewed-by: Leif Lindholm <leif@nuviainc.com>
 Tested-by: Leif Lindholm <leif@nuviainc.com>
 Message-id: 20200826141952.136164-3-graeme@nuviainc.com
 Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-id: 20201027015927.29495-3-shashi.mallela@linaro.org
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
 ---
- hw/arm/sbsa-ref.c | 14 ++++++++++++++
+ hw/arm/sbsa-ref.c | 23 +++++++++++++++++++++++
-file changed, 14 insertions(+)
+file changed, 23 insertions(+)
 diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/arm/sbsa-ref.c
 +++ b/hw/arm/sbsa-ref.c
+@@ -XXX,XX +XXX,XX @@
+ #include "hw/qdev-properties.h"
+ #include "hw/usb.h"
+ #include "hw/char/pl011.h"
++#include "hw/watchdog/sbsa_gwdt.h"
+ #include "net/net.h"
+ #include "qom/object.h"
 @@ -XXX,XX +XXX,XX @@ enum {
-     SBSA_CPUPERIPHS,
      SBSA_GIC_DIST,
      SBSA_GIC_REDIST,
-+    SBSA_SECURE_EC,
+     SBSA_SECURE_EC,
 +    SBSA_GWDT,
 +    SBSA_GWDT_REFRESH,
 +    SBSA_GWDT_CONTROL,
      SBSA_SMMU,
      SBSA_UART,
      SBSA_RTC,
 @@ -XXX,XX +XXX,XX @@ static const MemMapEntry sbsa_ref_memmap[] = {
-     [SBSA_CPUPERIPHS] =         { 0x40000000, 0x00040000 },
      [SBSA_GIC_DIST] =           { 0x40060000, 0x00010000 },
      [SBSA_GIC_REDIST] =         { 0x40080000, 0x04000000 },
-+    [SBSA_SECURE_EC] =          { 0x50000000, 0x00001000 },
+     [SBSA_SECURE_EC] =          { 0x50000000, 0x00001000 },
 +    [SBSA_GWDT_REFRESH] =       { 0x50010000, 0x00001000 },
 +    [SBSA_GWDT_CONTROL] =       { 0x50011000, 0x00001000 },
      [SBSA_UART] =               { 0x60000000, 0x00001000 },
      [SBSA_RTC] =                { 0x60010000, 0x00001000 },
      [SBSA_GPIO] =               { 0x60020000, 0x00001000 },
-@@ -XXX,XX +XXX,XX @@ static void *sbsa_ref_dtb(const struct arm_boot_info *binfo, int *fdt_size)
+@@ -XXX,XX +XXX,XX @@ static const int sbsa_ref_irqmap[] = {
-     return board->fdt;
+     [SBSA_AHCI] = 10,
      [SBSA_EHCI] = 11,
      [SBSA_SMMU] = 12, /* ... to 15 */
 +    [SBSA_GWDT] = 16,
  };
  static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
@@ -XXX,XX +XXX,XX @@ static void create_rtc(const SBSAMachineState *sms)
      sysbus_create_simple("pl031", base, qdev_get_gpio_in(sms->gic, irq));
  }
-+static void create_secure_ec(MemoryRegion *mem)
++static void create_wdt(const SBSAMachineState *sms)
 +{
-+    hwaddr base = sbsa_ref_memmap[SBSA_SECURE_EC].base;
++    hwaddr rbase = sbsa_ref_memmap[SBSA_GWDT_REFRESH].base;
-+    DeviceState *dev = qdev_new("sbsa-ec");
++    hwaddr cbase = sbsa_ref_memmap[SBSA_GWDT_CONTROL].base;
 +    DeviceState *dev = qdev_new(TYPE_WDT_SBSA);
 +    SysBusDevice *s = SYS_BUS_DEVICE(dev);
++    int irq = sbsa_ref_irqmap[SBSA_GWDT];
 +
-+    memory_region_add_subregion(mem, base,
++    sysbus_realize_and_unref(s, &error_fatal);
-+                                sysbus_mmio_get_region(s, 0));
++    sysbus_mmio_map(s, 0, rbase);
 +    sysbus_mmio_map(s, 1, cbase);
 +    sysbus_connect_irq(s, 0, qdev_get_gpio_in(sms->gic, irq));
 +}
 +
- static void sbsa_ref_init(MachineState *machine)
+ static DeviceState *gpio_key_dev;
  static void sbsa_ref_powerdown_req(Notifier *n, void *opaque)
  {
-     unsigned int smp_cpus = machine->smp.cpus;
 @@ -XXX,XX +XXX,XX @@ static void sbsa_ref_init(MachineState *machine)
-     create_pcie(sms);
+     create_rtc(sms);
-+    create_secure_ec(secure_sysmem);
++    create_wdt(sms);
 +
-     sms->bootinfo.ram_size = machine->ram_size;
+     create_gpio(sms);
-     sms->bootinfo.nb_cpus = smp_cpus;
-     sms->bootinfo.board_id = -1;
+     create_ahci(sms);
 --
 .20.1

-[PULL 16/47] target/arm: Implement VFP vp16 VCVT-with-specified-rounding-mode
+[PULL 47/48] hw/core/ptimer: Support ptimer being disabled by timer callback
-Implement the fp16 versions of the VFP VCVT instruction forms
+In ptimer_reload(), we call the callback function provided by the
-which convert between floating point and integer with a specified
+timer device that is using the ptimer.  This callback might disable
-rounding mode.
+the ptimer.  The code mostly handles this correctly, except that
 we'll still print the warning about "Timer with delta zero,
 disabling" if the now-disabled timer happened to be set such that it
 would fire again immediately if it were enabled (eg because the
 limit/reload value is zero).
 Suppress the spurious warning message and the unnecessary
 repeat-deletion of the underlying timer in this case.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
-Message-id: 20200828183354.27913-17-peter.maydell@linaro.org
+Message-id: 20201015151829.14656-2-peter.maydell@linaro.org
 ---
- target/arm/vfp-uncond.decode   |  6 ++++--
+ hw/core/ptimer.c | 4 ++++
- target/arm/translate-vfp.c.inc | 32 ++++++++++++++++++++++++--------
+file changed, 4 insertions(+)
 files changed, 28 insertions(+), 10 deletions(-)
-diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
+diff --git a/hw/core/ptimer.c b/hw/core/ptimer.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/vfp-uncond.decode
+--- a/hw/core/ptimer.c
-+++ b/target/arm/vfp-uncond.decode
++++ b/hw/core/ptimer.c
-@@ -XXX,XX +XXX,XX @@ VRINT       1111 1110 1.11 10 rm:2 .... 1011 01.0 .... \
+@@ -XXX,XX +XXX,XX @@ static void ptimer_reload(ptimer_state *s, int delta_adjust)
              vm=%vm_dp vd=%vd_dp dp=1
  # VCVT float to int with specified rounding mode; Vd is always single-precision
 +VCVT        1111 1110 1.11 11 rm:2 .... 1001 op:1 1.0 .... \
 +            vm=%vm_sp vd=%vd_sp sz=1
  VCVT        1111 1110 1.11 11 rm:2 .... 1010 op:1 1.0 .... \
 -            vm=%vm_sp vd=%vd_sp dp=0
 +            vm=%vm_sp vd=%vd_sp sz=2
  VCVT        1111 1110 1.11 11 rm:2 .... 1011 op:1 1.0 .... \
 -            vm=%vm_dp vd=%vd_sp dp=1
 +            vm=%vm_dp vd=%vd_sp sz=3
 diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c.inc
 +++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
  static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
  {
      uint32_t rd, rm;
 -    bool dp = a->dp;
 +    int sz = a->sz;
      TCGv_ptr fpst;
      TCGv_i32 tcg_rmode, tcg_shift;
      int rounding = fp_decode_rm[a->rm];
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
          return false;
      }
--    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+     if (delta == 0) {
-+    if (sz == 3 && !dc_isar_feature(aa32_fpdp_v2, s)) {
++        if (s->enabled == 0) {
-+        return false;
++            /* trigger callback disabled the timer already */
-+    }
++            return;
-+
++        }
-+    if (sz == 1 && !dc_isar_feature(aa32_fp16_arith, s)) {
+         if (!qtest_enabled()) {
-         return false;
+             fprintf(stderr, "Timer with delta zero, disabling\n");
      }
      /* UNDEF accesses to D16-D31 if they don't exist */
 -    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
 +    if (sz == 3 && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
          return false;
      }
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
          return true;
      }
 -    fpst = fpstatus_ptr(FPST_FPCR);
 +    if (sz == 1) {
 +        fpst = fpstatus_ptr(FPST_FPCR_F16);
 +    } else {
 +        fpst = fpstatus_ptr(FPST_FPCR);
 +    }
      tcg_shift = tcg_const_i32(0);
      tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rounding));
      gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
 -    if (dp) {
 +    if (sz == 3) {
          TCGv_i64 tcg_double, tcg_res;
          TCGv_i32 tcg_tmp;
          tcg_double = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
          tcg_single = tcg_temp_new_i32();
          tcg_res = tcg_temp_new_i32();
          neon_load_reg32(tcg_single, rm);
 -        if (is_signed) {
 -            gen_helper_vfp_tosls(tcg_res, tcg_single, tcg_shift, fpst);
 +        if (sz == 1) {
 +            if (is_signed) {
 +                gen_helper_vfp_toslh(tcg_res, tcg_single, tcg_shift, fpst);
 +            } else {
 +                gen_helper_vfp_toulh(tcg_res, tcg_single, tcg_shift, fpst);
 +            }
          } else {
 -            gen_helper_vfp_touls(tcg_res, tcg_single, tcg_shift, fpst);
 +            if (is_signed) {
 +                gen_helper_vfp_tosls(tcg_res, tcg_single, tcg_shift, fpst);
 +            } else {
 +                gen_helper_vfp_touls(tcg_res, tcg_single, tcg_shift, fpst);
 +            }
          }
-         neon_store_reg32(tcg_res, rd);
-         tcg_temp_free_i32(tcg_res);
 --
 .20.1

-[PULL 05/47] target/arm: Macroify trans functions for VFMA, VFMS, VFNMA, VFNMS
+[PULL 48/48] hw/timer/armv7m_systick: Rewrite to use ptimers
-Macroify creation of the trans functions for single and double
+The armv7m systick timer is a 24-bit decrementing, wrap-on-zero,
-precision VFMA, VFMS, VFNMA, VFNMS. The repetition was OK for
+clear-on-write counter. Our current implementation has various
-two sizes, but we're about to add halfprec and it will get a bit
+bugs and dubious workarounds in it (for instance see
-more than seems reasonable.
+https://bugs.launchpad.net/qemu/+bug/1872237).
 We have an implementation of a simple decrementing counter
 and we put a lot of effort into making sure it handles the
 interesting corner cases (like "spend a cycle at 0 before
 reloading") -- ptimer.
 Rewrite the systick timer to use a ptimer rather than
 a raw QEMU timer.
 Unfortunately this is a migration compatibility break,
 which will affect all M-profile boards.
 Among other bugs, this fixes
 https://bugs.launchpad.net/qemu/+bug/1872237 :
 now writes to SYST_CVR when the timer is enabled correctly
 do nothing; when the timer is enabled via SYST_CSR.ENABLE,
 the ptimer code will (because of POLICY_NO_IMMEDIATE_RELOAD)
 arrange that after one timer tick the counter is reloaded
 from SYST_RVR and then counts down from there, as the
 architecture requires.
 Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Message-id: 20200828183354.27913-6-peter.maydell@linaro.org
+Message-id: 20201015151829.14656-3-peter.maydell@linaro.org
 ---
- target/arm/translate-vfp.c.inc | 50 +++++++++-------------------------
+ include/hw/timer/armv7m_systick.h |   3 +-
-file changed, 13 insertions(+), 37 deletions(-)
+ hw/timer/armv7m_systick.c         | 124 +++++++++++++-----------------
+files changed, 54 insertions(+), 73 deletions(-)
-diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
 diff --git a/include/hw/timer/armv7m_systick.h b/include/hw/timer/armv7m_systick.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/translate-vfp.c.inc
+--- a/include/hw/timer/armv7m_systick.h
-+++ b/target/arm/translate-vfp.c.inc
++++ b/include/hw/timer/armv7m_systick.h
-@@ -XXX,XX +XXX,XX @@ static bool do_vfm_sp(DisasContext *s, arg_VFMA_sp *a, bool neg_n, bool neg_d)
+@@ -XXX,XX +XXX,XX @@
-     return true;
- }
+ #include "hw/sysbus.h"
+ #include "qom/object.h"
--static bool trans_VFMA_sp(DisasContext *s, arg_VFMA_sp *a)
++#include "hw/ptimer.h"
  #define TYPE_SYSTICK "armv7m_systick"
@@ -XXX,XX +XXX,XX @@ struct SysTickState {
      uint32_t control;
      uint32_t reload;
      int64_t tick;
 -    QEMUTimer *timer;
 +    ptimer_state *ptimer;
      MemoryRegion iomem;
      qemu_irq irq;
  };
 diff --git a/hw/timer/armv7m_systick.c b/hw/timer/armv7m_systick.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/timer/armv7m_systick.c
 +++ b/hw/timer/armv7m_systick.c
@@ -XXX,XX +XXX,XX @@ static inline int64_t systick_scale(SysTickState *s)
      }
  }
 -static void systick_reload(SysTickState *s, int reset)
 -{
--    return do_vfm_sp(s, a, false, false);
+-    /* The Cortex-M3 Devices Generic User Guide says that "When the
 -     * ENABLE bit is set to 1, the counter loads the RELOAD value from the
 -     * SYST RVR register and then counts down". So, we need to check the
 -     * ENABLE bit before reloading the value.
 -     */
 -    trace_systick_reload();
 -
 -    if ((s->control & SYSTICK_ENABLE) == 0) {
 -        return;
 -    }
 -
 -    if (reset) {
 -        s->tick = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 -    }
 -    s->tick += (s->reload + 1) * systick_scale(s);
 -    timer_mod(s->timer, s->tick);
 -}
 -
--static bool trans_VFMS_sp(DisasContext *s, arg_VFMS_sp *a)
+ static void systick_timer_tick(void *opaque)
 -{
 -    return do_vfm_sp(s, a, true, false);
 -}
 -
 -static bool trans_VFNMA_sp(DisasContext *s, arg_VFNMA_sp *a)
 -{
 -    return do_vfm_sp(s, a, false, true);
 -}
 -
 -static bool trans_VFNMS_sp(DisasContext *s, arg_VFNMS_sp *a)
 -{
 -    return do_vfm_sp(s, a, true, true);
 -}
 -
  static bool do_vfm_dp(DisasContext *s, arg_VFMA_dp *a, bool neg_n, bool neg_d)
  {
-     /*
+     SysTickState *s = (SysTickState *)opaque;
-@@ -XXX,XX +XXX,XX @@ static bool do_vfm_dp(DisasContext *s, arg_VFMA_dp *a, bool neg_n, bool neg_d)
+@@ -XXX,XX +XXX,XX @@ static void systick_timer_tick(void *opaque)
-     return true;
+         /* Tell the NVIC to pend the SysTick exception */
- }
+         qemu_irq_pulse(s->irq);
+     }
--static bool trans_VFMA_dp(DisasContext *s, arg_VFMA_dp *a)
+-    if (s->reload == 0) {
--{
+-        s->control &= ~SYSTICK_ENABLE;
--    return do_vfm_dp(s, a, false, false);
+-    } else {
--}
+-        systick_reload(s, 0);
-+#define MAKE_ONE_VFM_TRANS_FN(INSN, PREC, NEGN, NEGD)                   \
++    if (ptimer_get_limit(s->ptimer) == 0) {
-+    static bool trans_##INSN##_##PREC(DisasContext *s,                  \
++        /*
-+                                      arg_##INSN##_##PREC *a)           \
++         * Timer expiry with SYST_RVR zero disables the timer
-+    {                                                                   \
++         * (but doesn't clear SYST_CSR.ENABLE)
-+        return do_vfm_##PREC(s, a, NEGN, NEGD);                         \
++         */
-+    }
++        ptimer_stop(s->ptimer);
+     }
--static bool trans_VFMS_dp(DisasContext *s, arg_VFMS_dp *a)
+ }
--{
--    return do_vfm_dp(s, a, true, false);
+@@ -XXX,XX +XXX,XX @@ static MemTxResult systick_read(void *opaque, hwaddr addr, uint64_t *data,
--}
+         s->control &= ~SYSTICK_COUNTFLAG;
-+#define MAKE_VFM_TRANS_FNS(PREC) \
+         break;
-+    MAKE_ONE_VFM_TRANS_FN(VFMA, PREC, false, false) \
+     case 0x4: /* SysTick Reload Value.  */
-+    MAKE_ONE_VFM_TRANS_FN(VFMS, PREC, true, false) \
+-        val = s->reload;
-+    MAKE_ONE_VFM_TRANS_FN(VFNMA, PREC, false, true) \
++        val = ptimer_get_limit(s->ptimer);
-+    MAKE_ONE_VFM_TRANS_FN(VFNMS, PREC, true, true)
+         break;
+     case 0x8: /* SysTick Current Value.  */
--static bool trans_VFNMA_dp(DisasContext *s, arg_VFNMA_dp *a)
+-    {
--{
+-        int64_t t;
--    return do_vfm_dp(s, a, false, true);
+-
--}
+-        if ((s->control & SYSTICK_ENABLE) == 0) {
--
+-            val = 0;
--static bool trans_VFNMS_dp(DisasContext *s, arg_VFNMS_dp *a)
+-            break;
--{
+-        }
--    return do_vfm_dp(s, a, true, true);
+-        t = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
--}
+-        if (t >= s->tick) {
-+MAKE_VFM_TRANS_FNS(sp)
+-            val = 0;
-+MAKE_VFM_TRANS_FNS(dp)
+-            break;
+-        }
- static bool trans_VMOV_imm_sp(DisasContext *s, arg_VMOV_imm_sp *a)
+-        val = ((s->tick - (t + 1)) / systick_scale(s)) + 1;
 -        /* The interrupt in triggered when the timer reaches zero.
 -           However the counter is not reloaded until the next clock
 -           tick.  This is a hack to return zero during the first tick.  */
 -        if (val > s->reload) {
 -            val = 0;
 -        }
 +        val = ptimer_get_count(s->ptimer);
          break;
 -    }
      case 0xc: /* SysTick Calibration Value.  */
          val = 10000;
          break;
@@ -XXX,XX +XXX,XX @@ static MemTxResult systick_write(void *opaque, hwaddr addr,
      switch (addr) {
      case 0x0: /* SysTick Control and Status.  */
      {
 -        uint32_t oldval = s->control;
 +        uint32_t oldval;
 +        ptimer_transaction_begin(s->ptimer);
 +        oldval = s->control;
          s->control &= 0xfffffff8;
          s->control |= value & 7;
 +
          if ((oldval ^ value) & SYSTICK_ENABLE) {
 -            int64_t now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
              if (value & SYSTICK_ENABLE) {
 -                if (s->tick) {
 -                    s->tick += now;
 -                    timer_mod(s->timer, s->tick);
 -                } else {
 -                    systick_reload(s, 1);
 -                }
 +                /*
 +                 * Always reload the period in case board code has
 +                 * changed system_clock_scale. If we ever replace that
 +                 * global with a more sensible API then we might be able
 +                 * to set the period only when it actually changes.
 +                 */
 +                ptimer_set_period(s->ptimer, systick_scale(s));
 +                ptimer_run(s->ptimer, 0);
              } else {
 -                timer_del(s->timer);
 -                s->tick -= now;
 -                if (s->tick < 0) {
 -                    s->tick = 0;
 -                }
 +                ptimer_stop(s->ptimer);
              }
          } else if ((oldval ^ value) & SYSTICK_CLKSOURCE) {
 -            /* This is a hack. Force the timer to be reloaded
 -               when the reference clock is changed.  */
 -            systick_reload(s, 1);
 +            ptimer_set_period(s->ptimer, systick_scale(s));
          }
 +        ptimer_transaction_commit(s->ptimer);
          break;
      }
      case 0x4: /* SysTick Reload Value.  */
 -        s->reload = value;
 +        ptimer_transaction_begin(s->ptimer);
 +        ptimer_set_limit(s->ptimer, value & 0xffffff, 0);
 +        ptimer_transaction_commit(s->ptimer);
          break;
 -    case 0x8: /* SysTick Current Value.  Writes reload the timer.  */
 -        systick_reload(s, 1);
 +    case 0x8: /* SysTick Current Value. */
 +        /*
 +         * Writing any value clears SYST_CVR to zero and clears
 +         * SYST_CSR.COUNTFLAG. The counter will then reload from SYST_RVR
 +         * on the next clock edge unless SYST_RVR is zero.
 +         */
 +        ptimer_transaction_begin(s->ptimer);
 +        if (ptimer_get_limit(s->ptimer) == 0) {
 +            ptimer_stop(s->ptimer);
 +        }
 +        ptimer_set_count(s->ptimer, 0);
          s->control &= ~SYSTICK_COUNTFLAG;
 +        ptimer_transaction_commit(s->ptimer);
          break;
      default:
          qemu_log_mask(LOG_GUEST_ERROR,
@@ -XXX,XX +XXX,XX @@ static void systick_reset(DeviceState *dev)
       */
      assert(system_clock_scale != 0);
 +    ptimer_transaction_begin(s->ptimer);
      s->control = 0;
 -    s->reload = 0;
 -    s->tick = 0;
 -    timer_del(s->timer);
 +    ptimer_stop(s->ptimer);
 +    ptimer_set_count(s->ptimer, 0);
 +    ptimer_set_limit(s->ptimer, 0, 0);
 +    ptimer_set_period(s->ptimer, systick_scale(s));
 +    ptimer_transaction_commit(s->ptimer);
  }
  static void systick_instance_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void systick_instance_init(Object *obj)
  static void systick_realize(DeviceState *dev, Error **errp)
  {
+     SysTickState *s = SYSTICK(dev);
+-    s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, systick_timer_tick, s);
++    s->ptimer = ptimer_init(systick_timer_tick, s,
++                            PTIMER_POLICY_WRAP_AFTER_ONE_PERIOD |
++                            PTIMER_POLICY_NO_COUNTER_ROUND_DOWN |
++                            PTIMER_POLICY_NO_IMMEDIATE_RELOAD |
++                            PTIMER_POLICY_TRIGGER_ONLY_ON_DECREMENT);
+ }
+ static const VMStateDescription vmstate_systick = {
+     .name = "armv7m_systick",
+-    .version_id = 1,
+-    .minimum_version_id = 1,
++    .version_id = 2,
++    .minimum_version_id = 2,
+     .fields = (VMStateField[]) {
+         VMSTATE_UINT32(control, SysTickState),
+-        VMSTATE_UINT32(reload, SysTickState),
+         VMSTATE_INT64(tick, SysTickState),
+-        VMSTATE_TIMER_PTR(timer, SysTickState),
++        VMSTATE_PTIMER(ptimer, SysTickState),
+         VMSTATE_END_OF_LIST()
+     }
+ };
 --
 .20.1

Just my fp16 work, plus some small stuff for the sbsa-ref board;
but my rule of thumb is to send a pullreq once I get over about
30 patches...

-- PMM

The following changes since commit 2f4c51c0f384d7888a04b4815861e6d5fd244d75:

Merge remote-tracking branch 'remotes/kraxel/tags/usb-20200831-pull-request' into staging (2020-08-31 19:39:13 +0100)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20200901

for you to fetch changes up to 3f462bf0f6ea6382dd1502d4eb1fcd33c8e774f5:

hw/arm/sbsa-ref : Add embedded controller in secure memory (2020-09-01 14:01:34 +0100)

----------------------------------------------------------------
target-arm queue:
 * Implement fp16 support for AArch32 VFP and Neon
 * hw/arm/sbsa-ref: add "reg" property to DT cpu nodes
 * hw/arm/sbsa-ref : Add embedded controller in secure memory

----------------------------------------------------------------
Graeme Gregory (2):
      hw/misc/sbsa_ec : Add an embedded controller for sbsa-ref
      hw/arm/sbsa-ref : Add embedded controller in secure memory

Leif Lindholm (1):
      hw/arm/sbsa-ref: add "reg" property to DT cpu nodes

Peter Maydell (44):
      target/arm: Remove local definitions of float constants
      target/arm: Use correct ID register check for aa32_fp16_arith
      target/arm: Implement VFP fp16 for VFP_BINOP operations
      target/arm: Implement VFP fp16 VMLA, VMLS, VNMLS, VNMLA, VNMUL
      target/arm: Macroify trans functions for VFMA, VFMS, VFNMA, VFNMS
      target/arm: Implement VFP fp16 for fused-multiply-add
      target/arm: Macroify uses of do_vfp_2op_sp() and do_vfp_2op_dp()
      target/arm: Implement VFP fp16 for VABS, VNEG, VSQRT
      target/arm: Implement VFP fp16 for VMOV immediate
      target/arm: Implement VFP fp16 VCMP
      target/arm: Implement VFP fp16 VLDR and VSTR
      target/arm: Implement VFP fp16 VCVT between float and integer
      target/arm: Make VFP_CONV_FIX macros take separate float type and float size
      target/arm: Use macros instead of open-coding fp16 conversion helpers
      target/arm: Implement VFP fp16 VCVT between float and fixed-point
      target/arm: Implement VFP vp16 VCVT-with-specified-rounding-mode
      target/arm: Implement VFP fp16 VSEL
      target/arm: Implement VFP fp16 VRINT*
      target/arm: Implement new VFP fp16 insn VINS
      target/arm: Implement new VFP fp16 insn VMOVX
      target/arm: Implement VFP fp16 VMOV between gp and halfprec registers
      target/arm: Implement FP16 for Neon VADD, VSUB, VABD, VMUL
      target/arm: Implement fp16 for Neon VRECPE, VRSQRTE using gvec
      target/arm: Implement fp16 for Neon VABS, VNEG of floats
      target/arm: Implement fp16 for VCEQ, VCGE, VCGT comparisons
      target/arm: Implement fp16 for VACGE, VACGT
      target/arm: Implement fp16 for Neon VMAX, VMIN
      target/arm: Implement fp16 for Neon VMAXNM, VMINNM
      target/arm: Implement fp16 for Neon VMLA, VMLS operations
      target/arm: Implement fp16 for Neon VFMA, VMFS
      target/arm: Implement fp16 for Neon fp compare-vs-0
      target/arm: Implement fp16 for Neon VRECPS
      target/arm: Implement fp16 for Neon VRSQRTS
      target/arm: Implement fp16 for Neon pairwise fp ops
      target/arm: Implement fp16 for Neon float-integer VCVT
      target/arm: Convert Neon VCVT fixed-point to gvec
      target/arm: Implement fp16 for Neon VCVT fixed-point
      target/arm: Implement fp16 for Neon VCVT with rounding modes
      target/arm: Implement fp16 for Neon VRINT-with-specified-rounding-mode
      target/arm: Implement fp16 for Neon VRINTX
      target/arm/vec_helper: Handle oprsz less than 16 bytes in indexed operations
      target/arm/vec_helper: Add gvec fp indexed multiply-and-add operations
      target/arm: Implement fp16 for Neon VMUL, VMLA, VMLS
      target/arm: Enable FP16 in '-cpu max'

In several places the target/arm code defines local float constants
for 2, 3 and 1.5, which are also provided by include/fpu/softfloat.h.
Remove the unnecessary local duplicate versions.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-2-peter.maydell@linaro.org
---
 target/arm/helper-a64.c    | 11 -----------
 target/arm/translate-sve.c |  4 ----
 target/arm/vfp_helper.c    |  4 ----
 3 files changed, 19 deletions(-)

diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.c
+++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(neon_cgt_f64)(float64 a, float64 b, void *fpstp)
  * versions, these do a fully fused multiply-add or
  * multiply-add-and-halve.
  */
-#define float16_two make_float16(0x4000)
-#define float16_three make_float16(0x4200)
-#define float16_one_point_five make_float16(0x3e00)
-
-#define float32_two make_float32(0x40000000)
-#define float32_three make_float32(0x40400000)
-#define float32_one_point_five make_float32(0x3fc00000)
-
-#define float64_two make_float64(0x4000000000000000ULL)
-#define float64_three make_float64(0x4008000000000000ULL)
-#define float64_one_point_five make_float64(0x3FF8000000000000ULL)
 
 uint32_t HELPER(recpsf_f16)(uint32_t a, uint32_t b, void *fpstp)
 {
diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-sve.c
+++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME##_zpzi(DisasContext *s, arg_rpri_esz *a)         \
     return true;                                                          \
 }
 
-#define float16_two  make_float16(0x4000)
-#define float32_two  make_float32(0x40000000)
-#define float64_two  make_float64(0x4000000000000000ULL)
-
 DO_FP_IMM(FADD, fadds, half, one)
 DO_FP_IMM(FSUB, fsubs, half, one)
 DO_FP_IMM(FMUL, fmuls, half, two)
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
     return r;
 }
 
-#define float32_two make_float32(0x40000000)
-#define float32_three make_float32(0x40400000)
-#define float32_one_point_five make_float32(0x3fc00000)
-
 float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
 {
     float_status *s = &env->vfp.standard_fp_status;
-- 
2.20.1

The aa32_fp16_arith feature check function currently looks at the
AArch64 ID_AA64PFR0 register. This is (as the comment notes) not
correct. The bogus check was put in mostly to allow testing of the
fp16 variants of the VCMLA instructions and it was something of
a mistake that we allowed them to exist in master.

Switch the feature check function to testing VMFR1.FPHP, which is
what it ought to be.

This will remove emulation of the VCMLA and VCADD insns from
AArch32 code running on an AArch64 '-cpu max' using system emulation.
(They were never enabled for aarch32 linux-user and system-emulation.)
Since we weren't advertising their existence via the AArch32 ID
register, well-behaved guests wouldn't have been using them anyway.

Once we have implemented all the AArch32 support for the FP16 extension
we will advertise it in the MVFR1 ID register field, which will reenable
these insns along with all the others.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-3-peter.maydell@linaro.org
---
 target/arm/cpu.h | 7 +------
 1 file changed, 1 insertion(+), 6 deletions(-)

diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline bool isar_feature_aa32_predinv(const ARMISARegisters *id)
 
 static inline bool isar_feature_aa32_fp16_arith(const ARMISARegisters *id)
 {
-    /*
-     * This is a placeholder for use by VCMA until the rest of
-     * the ARMv8.2-FP16 extension is implemented for aa32 mode.
-     * At which point we can properly set and check MVFR1.FPHP.
-     */
-    return FIELD_EX64(id->id_aa64pfr0, ID_AA64PFR0, FP) == 1;
+    return FIELD_EX32(id->mvfr1, MVFR1, FPHP) >= 3;
 }
 
 static inline bool isar_feature_aa32_vfp_simd(const ARMISARegisters *id)
-- 
2.20.1

Implmeent VFP fp16 support for simple binary-operator VFP insns VADD,
VSUB, VMUL, VDIV, VMINNM and VMAXNM:

* make the VFP_BINOP() macro generate float16 helpers as well as
   float32 and float64
 * implement a do_vfp_3op_hp() function similar to the existing
   do_vfp_3op_sp()
 * add decode for the half-precision insn patterns

Note that the VFP_BINOP macro use creates a couple of unused helper
functions vfp_maxh and vfp_minh, but they're small so it's not worth
splitting the BINOP operations into "needs halfprec" and "no
halfprec" groups.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-4-peter.maydell@linaro.org
---
 target/arm/helper.h            |  8 ++++
 target/arm/vfp-uncond.decode   |  3 ++
 target/arm/vfp.decode          |  4 ++
 target/arm/vfp_helper.c        |  5 ++
 target/arm/translate-vfp.c.inc | 86 ++++++++++++++++++++++++++++++++++
 5 files changed, 106 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(probe_access, TCG_CALL_NO_WG, void, env, tl, i32, i32, i32)
 DEF_HELPER_1(vfp_get_fpscr, i32, env)
 DEF_HELPER_2(vfp_set_fpscr, void, env, i32)
 
+DEF_HELPER_3(vfp_addh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_adds, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_addd, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_subh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_subs, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_subd, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_mulh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_muls, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_muld, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_divh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_divs, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_divd, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_maxh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_maxs, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_maxd, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_minh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_mins, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_mind, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_maxnumh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_maxnums, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
+DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
 DEF_HELPER_1(vfp_negs, f32, f32)
diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp-uncond.decode
+++ b/target/arm/vfp-uncond.decode
@@ -XXX,XX +XXX,XX @@ VSEL        1111 1110 0. cc:2 .... .... 1010 .0.0 .... \
 VSEL        1111 1110 0. cc:2 .... .... 1011 .0.0 .... \
             vm=%vm_dp vn=%vn_dp vd=%vd_dp dp=1
 
+VMAXNM_hp   1111 1110 1.00 .... .... 1001 .0.0 ....         @vfp_dnm_s
+VMINNM_hp   1111 1110 1.00 .... .... 1001 .1.0 ....         @vfp_dnm_s
+
 VMAXNM_sp   1111 1110 1.00 .... .... 1010 .0.0 ....         @vfp_dnm_s
 VMINNM_sp   1111 1110 1.00 .... .... 1010 .1.0 ....         @vfp_dnm_s
 
diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VNMLS_dp     ---- 1110 0.01 .... .... 1011 .0.0 ....        @vfp_dnm_d
 VNMLA_sp     ---- 1110 0.01 .... .... 1010 .1.0 ....        @vfp_dnm_s
 VNMLA_dp     ---- 1110 0.01 .... .... 1011 .1.0 ....        @vfp_dnm_d
 
+VMUL_hp      ---- 1110 0.10 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VMUL_sp      ---- 1110 0.10 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VMUL_dp      ---- 1110 0.10 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
 VNMUL_sp     ---- 1110 0.10 .... .... 1010 .1.0 ....        @vfp_dnm_s
 VNMUL_dp     ---- 1110 0.10 .... .... 1011 .1.0 ....        @vfp_dnm_d
 
+VADD_hp      ---- 1110 0.11 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VADD_sp      ---- 1110 0.11 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VADD_dp      ---- 1110 0.11 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
+VSUB_hp      ---- 1110 0.11 .... .... 1001 .1.0 ....        @vfp_dnm_s
 VSUB_sp      ---- 1110 0.11 .... .... 1010 .1.0 ....        @vfp_dnm_s
 VSUB_dp      ---- 1110 0.11 .... .... 1011 .1.0 ....        @vfp_dnm_d
 
+VDIV_hp      ---- 1110 1.00 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VDIV_sp      ---- 1110 1.00 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VDIV_dp      ---- 1110 1.00 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ void vfp_set_fpscr(CPUARMState *env, uint32_t val)
 #define VFP_HELPER(name, p) HELPER(glue(glue(vfp_,name),p))
 
 #define VFP_BINOP(name) \
+dh_ctype_f16 VFP_HELPER(name, h)(dh_ctype_f16 a, dh_ctype_f16 b, void *fpstp) \
+{ \
+    float_status *fpst = fpstp; \
+    return float16_ ## name(a, b, fpst); \
+} \
 float32 VFP_HELPER(name, s)(float32 a, float32 b, void *fpstp) \
 { \
     float_status *fpst = fpstp; \
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_3op_sp(DisasContext *s, VFPGen3OpSPFn *fn,
     return true;
 }
 
+static bool do_vfp_3op_hp(DisasContext *s, VFPGen3OpSPFn *fn,
+                          int vd, int vn, int vm, bool reads_vd)
+{
+    /*
+     * Do a half-precision operation. Functionally this is
+     * the same as do_vfp_3op_sp(), except:
+     *  - it uses the FPST_FPCR_F16
+     *  - it doesn't need the VFP vector handling (fp16 is a
+     *    v8 feature, and in v8 VFP vectors don't exist)
+     *  - it does the aa32_fp16_arith feature test
+     */
+    TCGv_i32 f0, f1, fd;
+    TCGv_ptr fpst;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (s->vec_len != 0 || s->vec_stride != 0) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    f0 = tcg_temp_new_i32();
+    f1 = tcg_temp_new_i32();
+    fd = tcg_temp_new_i32();
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+
+    neon_load_reg32(f0, vn);
+    neon_load_reg32(f1, vm);
+
+    if (reads_vd) {
+        neon_load_reg32(fd, vd);
+    }
+    fn(fd, f0, f1, fpst);
+    neon_store_reg32(fd, vd);
+
+    tcg_temp_free_i32(f0);
+    tcg_temp_free_i32(f1);
+    tcg_temp_free_i32(fd);
+    tcg_temp_free_ptr(fpst);
+
+    return true;
+}
+
 static bool do_vfp_3op_dp(DisasContext *s, VFPGen3OpDPFn *fn,
                           int vd, int vn, int vm, bool reads_vd)
 {
@@ -XXX,XX +XXX,XX @@ static bool trans_VNMLA_dp(DisasContext *s, arg_VNMLA_dp *a)
     return do_vfp_3op_dp(s, gen_VNMLA_dp, a->vd, a->vn, a->vm, true);
 }
 
+static bool trans_VMUL_hp(DisasContext *s, arg_VMUL_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_helper_vfp_mulh, a->vd, a->vn, a->vm, false);
+}
+
 static bool trans_VMUL_sp(DisasContext *s, arg_VMUL_sp *a)
 {
     return do_vfp_3op_sp(s, gen_helper_vfp_muls, a->vd, a->vn, a->vm, false);
@@ -XXX,XX +XXX,XX @@ static bool trans_VNMUL_dp(DisasContext *s, arg_VNMUL_dp *a)
     return do_vfp_3op_dp(s, gen_VNMUL_dp, a->vd, a->vn, a->vm, false);
 }
 
+static bool trans_VADD_hp(DisasContext *s, arg_VADD_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_helper_vfp_addh, a->vd, a->vn, a->vm, false);
+}
+
 static bool trans_VADD_sp(DisasContext *s, arg_VADD_sp *a)
 {
     return do_vfp_3op_sp(s, gen_helper_vfp_adds, a->vd, a->vn, a->vm, false);
@@ -XXX,XX +XXX,XX @@ static bool trans_VADD_dp(DisasContext *s, arg_VADD_dp *a)
     return do_vfp_3op_dp(s, gen_helper_vfp_addd, a->vd, a->vn, a->vm, false);
 }
 
+static bool trans_VSUB_hp(DisasContext *s, arg_VSUB_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_helper_vfp_subh, a->vd, a->vn, a->vm, false);
+}
+
 static bool trans_VSUB_sp(DisasContext *s, arg_VSUB_sp *a)
 {
     return do_vfp_3op_sp(s, gen_helper_vfp_subs, a->vd, a->vn, a->vm, false);
@@ -XXX,XX +XXX,XX @@ static bool trans_VSUB_dp(DisasContext *s, arg_VSUB_dp *a)
     return do_vfp_3op_dp(s, gen_helper_vfp_subd, a->vd, a->vn, a->vm, false);
 }
 
+static bool trans_VDIV_hp(DisasContext *s, arg_VDIV_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_helper_vfp_divh, a->vd, a->vn, a->vm, false);
+}
+
 static bool trans_VDIV_sp(DisasContext *s, arg_VDIV_sp *a)
 {
     return do_vfp_3op_sp(s, gen_helper_vfp_divs, a->vd, a->vn, a->vm, false);
@@ -XXX,XX +XXX,XX @@ static bool trans_VDIV_dp(DisasContext *s, arg_VDIV_dp *a)
     return do_vfp_3op_dp(s, gen_helper_vfp_divd, a->vd, a->vn, a->vm, false);
 }
 
+static bool trans_VMINNM_hp(DisasContext *s, arg_VMINNM_sp *a)
+{
+    if (!dc_isar_feature(aa32_vminmaxnm, s)) {
+        return false;
+    }
+    return do_vfp_3op_hp(s, gen_helper_vfp_minnumh,
+                         a->vd, a->vn, a->vm, false);
+}
+
+static bool trans_VMAXNM_hp(DisasContext *s, arg_VMAXNM_sp *a)
+{
+    if (!dc_isar_feature(aa32_vminmaxnm, s)) {
+        return false;
+    }
+    return do_vfp_3op_hp(s, gen_helper_vfp_maxnumh,
+                         a->vd, a->vn, a->vm, false);
+}
+
 static bool trans_VMINNM_sp(DisasContext *s, arg_VMINNM_sp *a)
 {
     if (!dc_isar_feature(aa32_vminmaxnm, s)) {
-- 
2.20.1

Implement fp16 versions of the VFP VMLA, VMLS, VNMLS, VNMLA, VNMUL
instructions. (These are all the remaining ones which we implement
via do_vfp_3op_[hsd]p().)

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-5-peter.maydell@linaro.org
---
 target/arm/helper.h            |  1 +
 target/arm/vfp.decode          |  5 ++
 target/arm/vfp_helper.c        |  5 ++
 target/arm/translate-vfp.c.inc | 84 ++++++++++++++++++++++++++++++++++
 4 files changed, 95 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_maxnumd, f64, f64, f64, ptr)
 DEF_HELPER_3(vfp_minnumh, f16, f16, f16, ptr)
 DEF_HELPER_3(vfp_minnums, f32, f32, f32, ptr)
 DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
+DEF_HELPER_1(vfp_negh, f16, f16)
 DEF_HELPER_1(vfp_negs, f32, f32)
 DEF_HELPER_1(vfp_negd, f64, f64)
 DEF_HELPER_1(vfp_abss, f32, f32)
diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VLDM_VSTM_dp ---- 1101 0.1 l:1 rn:4 .... 1011 imm:8 \
              vd=%vd_dp p=1 u=0 w=1
 
 # 3-register VFP data-processing; bits [23,21:20,6] identify the operation.
+VMLA_hp      ---- 1110 0.00 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VMLA_sp      ---- 1110 0.00 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VMLA_dp      ---- 1110 0.00 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
+VMLS_hp      ---- 1110 0.00 .... .... 1001 .1.0 ....        @vfp_dnm_s
 VMLS_sp      ---- 1110 0.00 .... .... 1010 .1.0 ....        @vfp_dnm_s
 VMLS_dp      ---- 1110 0.00 .... .... 1011 .1.0 ....        @vfp_dnm_d
 
+VNMLS_hp     ---- 1110 0.01 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VNMLS_sp     ---- 1110 0.01 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VNMLS_dp     ---- 1110 0.01 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
+VNMLA_hp     ---- 1110 0.01 .... .... 1001 .1.0 ....        @vfp_dnm_s
 VNMLA_sp     ---- 1110 0.01 .... .... 1010 .1.0 ....        @vfp_dnm_s
 VNMLA_dp     ---- 1110 0.01 .... .... 1011 .1.0 ....        @vfp_dnm_d
 
@@ -XXX,XX +XXX,XX @@ VMUL_hp      ---- 1110 0.10 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VMUL_sp      ---- 1110 0.10 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VMUL_dp      ---- 1110 0.10 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
+VNMUL_hp     ---- 1110 0.10 .... .... 1001 .1.0 ....        @vfp_dnm_s
 VNMUL_sp     ---- 1110 0.10 .... .... 1010 .1.0 ....        @vfp_dnm_s
 VNMUL_dp     ---- 1110 0.10 .... .... 1011 .1.0 ....        @vfp_dnm_d
 
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ VFP_BINOP(minnum)
 VFP_BINOP(maxnum)
 #undef VFP_BINOP
 
+dh_ctype_f16 VFP_HELPER(neg, h)(dh_ctype_f16 a)
+{
+    return float16_chs(a);
+}
+
 float32 VFP_HELPER(neg, s)(float32 a)
 {
     return float32_chs(a);
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
     return true;
 }
 
+static void gen_VMLA_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+{
+    /* Note that order of inputs to the add matters for NaNs */
+    TCGv_i32 tmp = tcg_temp_new_i32();
+
+    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
+    gen_helper_vfp_addh(vd, vd, tmp, fpst);
+    tcg_temp_free_i32(tmp);
+}
+
+static bool trans_VMLA_hp(DisasContext *s, arg_VMLA_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_VMLA_hp, a->vd, a->vn, a->vm, true);
+}
+
 static void gen_VMLA_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
 {
     /* Note that order of inputs to the add matters for NaNs */
@@ -XXX,XX +XXX,XX @@ static bool trans_VMLA_dp(DisasContext *s, arg_VMLA_dp *a)
     return do_vfp_3op_dp(s, gen_VMLA_dp, a->vd, a->vn, a->vm, true);
 }
 
+static void gen_VMLS_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+{
+    /*
+     * VMLS: vd = vd + -(vn * vm)
+     * Note that order of inputs to the add matters for NaNs.
+     */
+    TCGv_i32 tmp = tcg_temp_new_i32();
+
+    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
+    gen_helper_vfp_negh(tmp, tmp);
+    gen_helper_vfp_addh(vd, vd, tmp, fpst);
+    tcg_temp_free_i32(tmp);
+}
+
+static bool trans_VMLS_hp(DisasContext *s, arg_VMLS_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_VMLS_hp, a->vd, a->vn, a->vm, true);
+}
+
 static void gen_VMLS_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
 {
     /*
@@ -XXX,XX +XXX,XX @@ static bool trans_VMLS_dp(DisasContext *s, arg_VMLS_dp *a)
     return do_vfp_3op_dp(s, gen_VMLS_dp, a->vd, a->vn, a->vm, true);
 }
 
+static void gen_VNMLS_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+{
+    /*
+     * VNMLS: -fd + (fn * fm)
+     * Note that it isn't valid to replace (-A + B) with (B - A) or similar
+     * plausible looking simplifications because this will give wrong results
+     * for NaNs.
+     */
+    TCGv_i32 tmp = tcg_temp_new_i32();
+
+    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
+    gen_helper_vfp_negh(vd, vd);
+    gen_helper_vfp_addh(vd, vd, tmp, fpst);
+    tcg_temp_free_i32(tmp);
+}
+
+static bool trans_VNMLS_hp(DisasContext *s, arg_VNMLS_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_VNMLS_hp, a->vd, a->vn, a->vm, true);
+}
+
 static void gen_VNMLS_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
 {
     /*
@@ -XXX,XX +XXX,XX @@ static bool trans_VNMLS_dp(DisasContext *s, arg_VNMLS_dp *a)
     return do_vfp_3op_dp(s, gen_VNMLS_dp, a->vd, a->vn, a->vm, true);
 }
 
+static void gen_VNMLA_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+{
+    /* VNMLA: -fd + -(fn * fm) */
+    TCGv_i32 tmp = tcg_temp_new_i32();
+
+    gen_helper_vfp_mulh(tmp, vn, vm, fpst);
+    gen_helper_vfp_negh(tmp, tmp);
+    gen_helper_vfp_negh(vd, vd);
+    gen_helper_vfp_addh(vd, vd, tmp, fpst);
+    tcg_temp_free_i32(tmp);
+}
+
+static bool trans_VNMLA_hp(DisasContext *s, arg_VNMLA_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_VNMLA_hp, a->vd, a->vn, a->vm, true);
+}
+
 static void gen_VNMLA_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
 {
     /* VNMLA: -fd + -(fn * fm) */
@@ -XXX,XX +XXX,XX @@ static bool trans_VMUL_dp(DisasContext *s, arg_VMUL_dp *a)
     return do_vfp_3op_dp(s, gen_helper_vfp_muld, a->vd, a->vn, a->vm, false);
 }
 
+static void gen_VNMUL_hp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
+{
+    /* VNMUL: -(fn * fm) */
+    gen_helper_vfp_mulh(vd, vn, vm, fpst);
+    gen_helper_vfp_negh(vd, vd);
+}
+
+static bool trans_VNMUL_hp(DisasContext *s, arg_VNMUL_sp *a)
+{
+    return do_vfp_3op_hp(s, gen_VNMUL_hp, a->vd, a->vn, a->vm, false);
+}
+
 static void gen_VNMUL_sp(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm, TCGv_ptr fpst)
 {
     /* VNMUL: -(fn * fm) */
-- 
2.20.1

Macroify creation of the trans functions for single and double
precision VFMA, VFMS, VFNMA, VFNMS. The repetition was OK for
two sizes, but we're about to add halfprec and it will get a bit
more than seems reasonable.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-6-peter.maydell@linaro.org
---
 target/arm/translate-vfp.c.inc | 50 +++++++++-------------------------
 1 file changed, 13 insertions(+), 37 deletions(-)

diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_vfm_sp(DisasContext *s, arg_VFMA_sp *a, bool neg_n, bool neg_d)
     return true;
 }
 
-static bool trans_VFMA_sp(DisasContext *s, arg_VFMA_sp *a)
-{
-    return do_vfm_sp(s, a, false, false);
-}
-
-static bool trans_VFMS_sp(DisasContext *s, arg_VFMS_sp *a)
-{
-    return do_vfm_sp(s, a, true, false);
-}
-
-static bool trans_VFNMA_sp(DisasContext *s, arg_VFNMA_sp *a)
-{
-    return do_vfm_sp(s, a, false, true);
-}
-
-static bool trans_VFNMS_sp(DisasContext *s, arg_VFNMS_sp *a)
-{
-    return do_vfm_sp(s, a, true, true);
-}
-
 static bool do_vfm_dp(DisasContext *s, arg_VFMA_dp *a, bool neg_n, bool neg_d)
 {
     /*
@@ -XXX,XX +XXX,XX @@ static bool do_vfm_dp(DisasContext *s, arg_VFMA_dp *a, bool neg_n, bool neg_d)
     return true;
 }
 
-static bool trans_VFMA_dp(DisasContext *s, arg_VFMA_dp *a)
-{
-    return do_vfm_dp(s, a, false, false);
-}
+#define MAKE_ONE_VFM_TRANS_FN(INSN, PREC, NEGN, NEGD)                   \
+    static bool trans_##INSN##_##PREC(DisasContext *s,                  \
+                                      arg_##INSN##_##PREC *a)           \
+    {                                                                   \
+        return do_vfm_##PREC(s, a, NEGN, NEGD);                         \
+    }
 
-static bool trans_VFMS_dp(DisasContext *s, arg_VFMS_dp *a)
-{
-    return do_vfm_dp(s, a, true, false);
-}
+#define MAKE_VFM_TRANS_FNS(PREC) \
+    MAKE_ONE_VFM_TRANS_FN(VFMA, PREC, false, false) \
+    MAKE_ONE_VFM_TRANS_FN(VFMS, PREC, true, false) \
+    MAKE_ONE_VFM_TRANS_FN(VFNMA, PREC, false, true) \
+    MAKE_ONE_VFM_TRANS_FN(VFNMS, PREC, true, true)
 
-static bool trans_VFNMA_dp(DisasContext *s, arg_VFNMA_dp *a)
-{
-    return do_vfm_dp(s, a, false, true);
-}
-
-static bool trans_VFNMS_dp(DisasContext *s, arg_VFNMS_dp *a)
-{
-    return do_vfm_dp(s, a, true, true);
-}
+MAKE_VFM_TRANS_FNS(sp)
+MAKE_VFM_TRANS_FNS(dp)
 
 static bool trans_VMOV_imm_sp(DisasContext *s, arg_VMOV_imm_sp *a)
 {
-- 
2.20.1

Implement VFP fp16 support for fused multiply-add insns
VFNMA, VFNMS, VFMA, VFMS.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-7-peter.maydell@linaro.org
---
 target/arm/helper.h            |  1 +
 target/arm/vfp.decode          |  5 +++
 target/arm/vfp_helper.c        |  7 ++++
 target/arm/translate-vfp.c.inc | 64 ++++++++++++++++++++++++++++++++++
 4 files changed, 77 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(vfp_fcvt_f64_to_f16, TCG_CALL_NO_RWG, f16, f64, ptr, i32)
 
 DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
 DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
+DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
 
 DEF_HELPER_3(recps_f32, f32, env, f32, f32)
 DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VDIV_hp      ---- 1110 1.00 .... .... 1001 .0.0 ....        @vfp_dnm_s
 VDIV_sp      ---- 1110 1.00 .... .... 1010 .0.0 ....        @vfp_dnm_s
 VDIV_dp      ---- 1110 1.00 .... .... 1011 .0.0 ....        @vfp_dnm_d
 
+VFMA_hp      ---- 1110 1.10 .... .... 1001 .0. 0 ....       @vfp_dnm_s
+VFMS_hp      ---- 1110 1.10 .... .... 1001 .1. 0 ....       @vfp_dnm_s
+VFNMA_hp     ---- 1110 1.01 .... .... 1001 .0. 0 ....       @vfp_dnm_s
+VFNMS_hp     ---- 1110 1.01 .... .... 1001 .1. 0 ....       @vfp_dnm_s
+
 VFMA_sp      ---- 1110 1.10 .... .... 1010 .0. 0 ....       @vfp_dnm_s
 VFMS_sp      ---- 1110 1.10 .... .... 1010 .1. 0 ....       @vfp_dnm_s
 VFNMA_sp     ---- 1110 1.01 .... .... 1010 .0. 0 ....       @vfp_dnm_s
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(rsqrte_u32)(uint32_t a)
 }
 
 /* VFPv4 fused multiply-accumulate */
+dh_ctype_f16 VFP_HELPER(muladd, h)(dh_ctype_f16 a, dh_ctype_f16 b,
+                                   dh_ctype_f16 c, void *fpstp)
+{
+    float_status *fpst = fpstp;
+    return float16_muladd(a, b, c, 0, fpst);
+}
+
 float32 VFP_HELPER(muladd, s)(float32 a, float32 b, float32 c, void *fpstp)
 {
     float_status *fpst = fpstp;
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMAXNM_dp(DisasContext *s, arg_VMAXNM_dp *a)
                          a->vd, a->vn, a->vm, false);
 }
 
+static bool do_vfm_hp(DisasContext *s, arg_VFMA_sp *a, bool neg_n, bool neg_d)
+{
+    /*
+     * VFNMA : fd = muladd(-fd,  fn, fm)
+     * VFNMS : fd = muladd(-fd, -fn, fm)
+     * VFMA  : fd = muladd( fd,  fn, fm)
+     * VFMS  : fd = muladd( fd, -fn, fm)
+     *
+     * These are fused multiply-add, and must be done as one floating
+     * point operation with no rounding between the multiplication and
+     * addition steps.  NB that doing the negations here as separate
+     * steps is correct : an input NaN should come out with its sign
+     * bit flipped if it is a negated-input.
+     */
+    TCGv_ptr fpst;
+    TCGv_i32 vn, vm, vd;
+
+    /*
+     * Present in VFPv4 only, and only with the FP16 extension.
+     * Note that we can't rely on the SIMDFMAC check alone, because
+     * in a Neon-no-VFP core that ID register field will be non-zero.
+     */
+    if (!dc_isar_feature(aa32_fp16_arith, s) ||
+        !dc_isar_feature(aa32_simdfmac, s) ||
+        !dc_isar_feature(aa32_fpsp_v2, s)) {
+        return false;
+    }
+
+    if (s->vec_len != 0 || s->vec_stride != 0) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    vn = tcg_temp_new_i32();
+    vm = tcg_temp_new_i32();
+    vd = tcg_temp_new_i32();
+
+    neon_load_reg32(vn, a->vn);
+    neon_load_reg32(vm, a->vm);
+    if (neg_n) {
+        /* VFNMS, VFMS */
+        gen_helper_vfp_negh(vn, vn);
+    }
+    neon_load_reg32(vd, a->vd);
+    if (neg_d) {
+        /* VFNMA, VFNMS */
+        gen_helper_vfp_negh(vd, vd);
+    }
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    gen_helper_vfp_muladdh(vd, vn, vm, vd, fpst);
+    neon_store_reg32(vd, a->vd);
+
+    tcg_temp_free_ptr(fpst);
+    tcg_temp_free_i32(vn);
+    tcg_temp_free_i32(vm);
+    tcg_temp_free_i32(vd);
+
+    return true;
+}
+
 static bool do_vfm_sp(DisasContext *s, arg_VFMA_sp *a, bool neg_n, bool neg_d)
 {
     /*
@@ -XXX,XX +XXX,XX @@ static bool do_vfm_dp(DisasContext *s, arg_VFMA_dp *a, bool neg_n, bool neg_d)
     MAKE_ONE_VFM_TRANS_FN(VFNMA, PREC, false, true) \
     MAKE_ONE_VFM_TRANS_FN(VFNMS, PREC, true, true)
 
+MAKE_VFM_TRANS_FNS(hp)
 MAKE_VFM_TRANS_FNS(sp)
 MAKE_VFM_TRANS_FNS(dp)
 
-- 
2.20.1

Macroify the uses of do_vfp_2op_sp() and do_vfp_2op_dp(); this will
make it easier to add the halfprec support.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-8-peter.maydell@linaro.org
---
 target/arm/translate-vfp.c.inc | 49 ++++++++++------------------------
 1 file changed, 14 insertions(+), 35 deletions(-)

diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
     return true;
 }
 
-static bool trans_VMOV_reg_sp(DisasContext *s, arg_VMOV_reg_sp *a)
-{
-    return do_vfp_2op_sp(s, tcg_gen_mov_i32, a->vd, a->vm);
-}
+#define DO_VFP_2OP(INSN, PREC, FN)                              \
+    static bool trans_##INSN##_##PREC(DisasContext *s,          \
+                                      arg_##INSN##_##PREC *a)   \
+    {                                                           \
+        return do_vfp_2op_##PREC(s, FN, a->vd, a->vm);          \
+    }
 
-static bool trans_VMOV_reg_dp(DisasContext *s, arg_VMOV_reg_dp *a)
-{
-    return do_vfp_2op_dp(s, tcg_gen_mov_i64, a->vd, a->vm);
-}
+DO_VFP_2OP(VMOV_reg, sp, tcg_gen_mov_i32)
+DO_VFP_2OP(VMOV_reg, dp, tcg_gen_mov_i64)
 
-static bool trans_VABS_sp(DisasContext *s, arg_VABS_sp *a)
-{
-    return do_vfp_2op_sp(s, gen_helper_vfp_abss, a->vd, a->vm);
-}
+DO_VFP_2OP(VABS, sp, gen_helper_vfp_abss)
+DO_VFP_2OP(VABS, dp, gen_helper_vfp_absd)
 
-static bool trans_VABS_dp(DisasContext *s, arg_VABS_dp *a)
-{
-    return do_vfp_2op_dp(s, gen_helper_vfp_absd, a->vd, a->vm);
-}
-
-static bool trans_VNEG_sp(DisasContext *s, arg_VNEG_sp *a)
-{
-    return do_vfp_2op_sp(s, gen_helper_vfp_negs, a->vd, a->vm);
-}
-
-static bool trans_VNEG_dp(DisasContext *s, arg_VNEG_dp *a)
-{
-    return do_vfp_2op_dp(s, gen_helper_vfp_negd, a->vd, a->vm);
-}
+DO_VFP_2OP(VNEG, sp, gen_helper_vfp_negs)
+DO_VFP_2OP(VNEG, dp, gen_helper_vfp_negd)
 
 static void gen_VSQRT_sp(TCGv_i32 vd, TCGv_i32 vm)
 {
     gen_helper_vfp_sqrts(vd, vm, cpu_env);
 }
 
-static bool trans_VSQRT_sp(DisasContext *s, arg_VSQRT_sp *a)
-{
-    return do_vfp_2op_sp(s, gen_VSQRT_sp, a->vd, a->vm);
-}
-
 static void gen_VSQRT_dp(TCGv_i64 vd, TCGv_i64 vm)
 {
     gen_helper_vfp_sqrtd(vd, vm, cpu_env);
 }
 
-static bool trans_VSQRT_dp(DisasContext *s, arg_VSQRT_dp *a)
-{
-    return do_vfp_2op_dp(s, gen_VSQRT_dp, a->vd, a->vm);
-}
+DO_VFP_2OP(VSQRT, sp, gen_VSQRT_sp)
+DO_VFP_2OP(VSQRT, dp, gen_VSQRT_dp)
 
 static bool trans_VCMP_sp(DisasContext *s, arg_VCMP_sp *a)
 {
-- 
2.20.1

Implement VFP fp16 for VABS, VNEG and VSQRT. This is all
the fp16 insns that use the DO_VFP_2OP macro, because there
is no fp16 version of VMOV_reg.

Notes:
 * the gen_helper_vfp_negh already exists as we needed to create
   it for the fp16 multiply-add insns
 * as usual we need to use the f16 version of the fp_status;
   this is only relevant for VSQRT

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-9-peter.maydell@linaro.org
---
 target/arm/helper.h            |  2 ++
 target/arm/vfp.decode          |  3 +++
 target/arm/vfp_helper.c        | 10 +++++++++
 target/arm/translate-vfp.c.inc | 40 ++++++++++++++++++++++++++++++++++
 4 files changed, 55 insertions(+)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_minnumd, f64, f64, f64, ptr)
 DEF_HELPER_1(vfp_negh, f16, f16)
 DEF_HELPER_1(vfp_negs, f32, f32)
 DEF_HELPER_1(vfp_negd, f64, f64)
+DEF_HELPER_1(vfp_absh, f16, f16)
 DEF_HELPER_1(vfp_abss, f32, f32)
 DEF_HELPER_1(vfp_absd, f64, f64)
+DEF_HELPER_2(vfp_sqrth, f16, f16, env)
 DEF_HELPER_2(vfp_sqrts, f32, f32, env)
 DEF_HELPER_2(vfp_sqrtd, f64, f64, env)
 DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VMOV_imm_dp  ---- 1110 1.11 .... .... 1011 0000 .... \
 VMOV_reg_sp  ---- 1110 1.11 0000 .... 1010 01.0 ....        @vfp_dm_ss
 VMOV_reg_dp  ---- 1110 1.11 0000 .... 1011 01.0 ....        @vfp_dm_dd
 
+VABS_hp      ---- 1110 1.11 0000 .... 1001 11.0 ....        @vfp_dm_ss
 VABS_sp      ---- 1110 1.11 0000 .... 1010 11.0 ....        @vfp_dm_ss
 VABS_dp      ---- 1110 1.11 0000 .... 1011 11.0 ....        @vfp_dm_dd
 
+VNEG_hp      ---- 1110 1.11 0001 .... 1001 01.0 ....        @vfp_dm_ss
 VNEG_sp      ---- 1110 1.11 0001 .... 1010 01.0 ....        @vfp_dm_ss
 VNEG_dp      ---- 1110 1.11 0001 .... 1011 01.0 ....        @vfp_dm_dd
 
+VSQRT_hp     ---- 1110 1.11 0001 .... 1001 11.0 ....        @vfp_dm_ss
 VSQRT_sp     ---- 1110 1.11 0001 .... 1010 11.0 ....        @vfp_dm_ss
 VSQRT_dp     ---- 1110 1.11 0001 .... 1011 11.0 ....        @vfp_dm_dd
 
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 VFP_HELPER(neg, d)(float64 a)
     return float64_chs(a);
 }
 
+dh_ctype_f16 VFP_HELPER(abs, h)(dh_ctype_f16 a)
+{
+    return float16_abs(a);
+}
+
 float32 VFP_HELPER(abs, s)(float32 a)
 {
     return float32_abs(a);
@@ -XXX,XX +XXX,XX @@ float64 VFP_HELPER(abs, d)(float64 a)
     return float64_abs(a);
 }
 
+dh_ctype_f16 VFP_HELPER(sqrt, h)(dh_ctype_f16 a, CPUARMState *env)
+{
+    return float16_sqrt(a, &env->vfp.fp_status_f16);
+}
+
 float32 VFP_HELPER(sqrt, s)(float32 a, CPUARMState *env)
 {
     return float32_sqrt(a, &env->vfp.fp_status);
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_vfp_2op_sp(DisasContext *s, VFPGen2OpSPFn *fn, int vd, int vm)
     return true;
 }
 
+static bool do_vfp_2op_hp(DisasContext *s, VFPGen2OpSPFn *fn, int vd, int vm)
+{
+    /*
+     * Do a half-precision operation. Functionally this is
+     * the same as do_vfp_2op_sp(), except:
+     *  - it doesn't need the VFP vector handling (fp16 is a
+     *    v8 feature, and in v8 VFP vectors don't exist)
+     *  - it does the aa32_fp16_arith feature test
+     */
+    TCGv_i32 f0;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (s->vec_len != 0 || s->vec_stride != 0) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    f0 = tcg_temp_new_i32();
+    neon_load_reg32(f0, vm);
+    fn(f0, f0);
+    neon_store_reg32(f0, vd);
+    tcg_temp_free_i32(f0);
+
+    return true;
+}
+
 static bool do_vfp_2op_dp(DisasContext *s, VFPGen2OpDPFn *fn, int vd, int vm)
 {
     uint32_t delta_m = 0;
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_imm_dp(DisasContext *s, arg_VMOV_imm_dp *a)
 DO_VFP_2OP(VMOV_reg, sp, tcg_gen_mov_i32)
 DO_VFP_2OP(VMOV_reg, dp, tcg_gen_mov_i64)
 
+DO_VFP_2OP(VABS, hp, gen_helper_vfp_absh)
 DO_VFP_2OP(VABS, sp, gen_helper_vfp_abss)
 DO_VFP_2OP(VABS, dp, gen_helper_vfp_absd)
 
+DO_VFP_2OP(VNEG, hp, gen_helper_vfp_negh)
 DO_VFP_2OP(VNEG, sp, gen_helper_vfp_negs)
 DO_VFP_2OP(VNEG, dp, gen_helper_vfp_negd)
 
+static void gen_VSQRT_hp(TCGv_i32 vd, TCGv_i32 vm)
+{
+    gen_helper_vfp_sqrth(vd, vm, cpu_env);
+}
+
 static void gen_VSQRT_sp(TCGv_i32 vd, TCGv_i32 vm)
 {
     gen_helper_vfp_sqrts(vd, vm, cpu_env);
@@ -XXX,XX +XXX,XX @@ static void gen_VSQRT_dp(TCGv_i64 vd, TCGv_i64 vm)
     gen_helper_vfp_sqrtd(vd, vm, cpu_env);
 }
 
+DO_VFP_2OP(VSQRT, hp, gen_VSQRT_hp)
 DO_VFP_2OP(VSQRT, sp, gen_VSQRT_sp)
 DO_VFP_2OP(VSQRT, dp, gen_VSQRT_dp)
 
-- 
2.20.1

Implement VFP fp16 support for the VMOV immediate insn.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-10-peter.maydell@linaro.org
---
 target/arm/vfp.decode          |  2 ++
 target/arm/translate-vfp.c.inc | 22 ++++++++++++++++++++++
 2 files changed, 24 insertions(+)

Implement fp16 version of VCMP.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-11-peter.maydell@linaro.org
---
 target/arm/helper.h            |  2 ++
 target/arm/vfp.decode          |  2 ++
 target/arm/vfp_helper.c        | 15 +++++++------
 target/arm/translate-vfp.c.inc | 39 ++++++++++++++++++++++++++++++++++
 4 files changed, 51 insertions(+), 7 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(vfp_absd, f64, f64)
 DEF_HELPER_2(vfp_sqrth, f16, f16, env)
 DEF_HELPER_2(vfp_sqrts, f32, f32, env)
 DEF_HELPER_2(vfp_sqrtd, f64, f64, env)
+DEF_HELPER_3(vfp_cmph, void, f16, f16, env)
 DEF_HELPER_3(vfp_cmps, void, f32, f32, env)
 DEF_HELPER_3(vfp_cmpd, void, f64, f64, env)
+DEF_HELPER_3(vfp_cmpeh, void, f16, f16, env)
 DEF_HELPER_3(vfp_cmpes, void, f32, f32, env)
 DEF_HELPER_3(vfp_cmped, void, f64, f64, env)
 
diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VSQRT_hp     ---- 1110 1.11 0001 .... 1001 11.0 ....        @vfp_dm_ss
 VSQRT_sp     ---- 1110 1.11 0001 .... 1010 11.0 ....        @vfp_dm_ss
 VSQRT_dp     ---- 1110 1.11 0001 .... 1011 11.0 ....        @vfp_dm_dd
 
+VCMP_hp      ---- 1110 1.11 010 z:1 .... 1001 e:1 1.0 .... \
+             vd=%vd_sp vm=%vm_sp
 VCMP_sp      ---- 1110 1.11 010 z:1 .... 1010 e:1 1.0 .... \
              vd=%vd_sp vm=%vm_sp
 VCMP_dp      ---- 1110 1.11 010 z:1 .... 1011 e:1 1.0 .... \
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ static void softfloat_to_vfp_compare(CPUARMState *env, FloatRelation cmp)
 }
 
 /* XXX: check quiet/signaling case */
-#define DO_VFP_cmp(p, type) \
-void VFP_HELPER(cmp, p)(type a, type b, CPUARMState *env)  \
+#define DO_VFP_cmp(P, FLOATTYPE, ARGTYPE, FPST) \
+void VFP_HELPER(cmp, P)(ARGTYPE a, ARGTYPE b, CPUARMState *env)  \
 { \
     softfloat_to_vfp_compare(env, \
-        type ## _compare_quiet(a, b, &env->vfp.fp_status)); \
+        FLOATTYPE ## _compare_quiet(a, b, &env->vfp.FPST)); \
 } \
-void VFP_HELPER(cmpe, p)(type a, type b, CPUARMState *env) \
+void VFP_HELPER(cmpe, P)(ARGTYPE a, ARGTYPE b, CPUARMState *env) \
 { \
     softfloat_to_vfp_compare(env, \
-        type ## _compare(a, b, &env->vfp.fp_status)); \
+        FLOATTYPE ## _compare(a, b, &env->vfp.FPST)); \
 }
-DO_VFP_cmp(s, float32)
-DO_VFP_cmp(d, float64)
+DO_VFP_cmp(h, float16, dh_ctype_f16, fp_status_f16)
+DO_VFP_cmp(s, float32, float32, fp_status)
+DO_VFP_cmp(d, float64, float64, fp_status)
 #undef DO_VFP_cmp
 
 /* Integer to float and float to integer conversions */
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ DO_VFP_2OP(VSQRT, hp, gen_VSQRT_hp)
 DO_VFP_2OP(VSQRT, sp, gen_VSQRT_sp)
 DO_VFP_2OP(VSQRT, dp, gen_VSQRT_dp)
 
+static bool trans_VCMP_hp(DisasContext *s, arg_VCMP_sp *a)
+{
+    TCGv_i32 vd, vm;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    /* Vm/M bits must be zero for the Z variant */
+    if (a->z && a->vm != 0) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    vd = tcg_temp_new_i32();
+    vm = tcg_temp_new_i32();
+
+    neon_load_reg32(vd, a->vd);
+    if (a->z) {
+        tcg_gen_movi_i32(vm, 0);
+    } else {
+        neon_load_reg32(vm, a->vm);
+    }
+
+    if (a->e) {
+        gen_helper_vfp_cmpeh(vd, vm, cpu_env);
+    } else {
+        gen_helper_vfp_cmph(vd, vm, cpu_env);
+    }
+
+    tcg_temp_free_i32(vd);
+    tcg_temp_free_i32(vm);
+
+    return true;
+}
+
 static bool trans_VCMP_sp(DisasContext *s, arg_VCMP_sp *a)
 {
     TCGv_i32 vd, vm;
-- 
2.20.1

Implement the fp16 versions of the VFP VLDR/VSTR (immediate).

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-12-peter.maydell@linaro.org
---
 target/arm/vfp.decode          |  3 +--
 target/arm/translate-vfp.c.inc | 35 ++++++++++++++++++++++++++++++++++
 2 files changed, 36 insertions(+), 2 deletions(-)

diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VMOV_single  ---- 1110 000 l:1 .... rt:4 1010 . 001 0000    vn=%vn_sp
 VMOV_64_sp   ---- 1100 010 op:1 rt2:4 rt:4 1010 00.1 ....   vm=%vm_sp
 VMOV_64_dp   ---- 1100 010 op:1 rt2:4 rt:4 1011 00.1 ....   vm=%vm_dp
 
-# Note that the half-precision variants of VLDR and VSTR are
-# not part of this decodetree at all because they have bits [9:8] == 0b01
+VLDR_VSTR_hp ---- 1101 u:1 .0 l:1 rn:4 .... 1001 imm:8      vd=%vd_sp
 VLDR_VSTR_sp ---- 1101 u:1 .0 l:1 rn:4 .... 1010 imm:8      vd=%vd_sp
 VLDR_VSTR_dp ---- 1101 u:1 .0 l:1 rn:4 .... 1011 imm:8      vd=%vd_dp
 
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMOV_64_dp(DisasContext *s, arg_VMOV_64_dp *a)
     return true;
 }
 
+static bool trans_VLDR_VSTR_hp(DisasContext *s, arg_VLDR_VSTR_sp *a)
+{
+    uint32_t offset;
+    TCGv_i32 addr, tmp;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    /* imm8 field is offset/2 for fp16, unlike fp32 and fp64 */
+    offset = a->imm << 1;
+    if (!a->u) {
+        offset = -offset;
+    }
+
+    /* For thumb, use of PC is UNPREDICTABLE.  */
+    addr = add_reg_for_lit(s, a->rn, offset);
+    tmp = tcg_temp_new_i32();
+    if (a->l) {
+        gen_aa32_ld16u(s, tmp, addr, get_mem_index(s));
+        neon_store_reg32(tmp, a->vd);
+    } else {
+        neon_load_reg32(tmp, a->vd);
+        gen_aa32_st16(s, tmp, addr, get_mem_index(s));
+    }
+    tcg_temp_free_i32(tmp);
+    tcg_temp_free_i32(addr);
+
+    return true;
+}
+
 static bool trans_VLDR_VSTR_sp(DisasContext *s, arg_VLDR_VSTR_sp *a)
 {
     uint32_t offset;
-- 
2.20.1

Implement the fp16 versions of the VFP VCVT instruction forms which
convert between floating point and integer.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-13-peter.maydell@linaro.org
---
 target/arm/vfp.decode          |  4 +++
 target/arm/translate-vfp.c.inc | 65 ++++++++++++++++++++++++++++++++++
 2 files changed, 69 insertions(+)

diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VCVT_sp      ---- 1110 1.11 0111 .... 1010 11.0 ....        @vfp_dm_ds
 VCVT_dp      ---- 1110 1.11 0111 .... 1011 11.0 ....        @vfp_dm_sd
 
 # VCVT from integer to floating point: Vm always single; Vd depends on size
+VCVT_int_hp  ---- 1110 1.11 1000 .... 1001 s:1 1.0 .... \
+             vd=%vd_sp vm=%vm_sp
 VCVT_int_sp  ---- 1110 1.11 1000 .... 1010 s:1 1.0 .... \
              vd=%vd_sp vm=%vm_sp
 VCVT_int_dp  ---- 1110 1.11 1000 .... 1011 s:1 1.0 .... \
@@ -XXX,XX +XXX,XX @@ VCVT_fix_dp  ---- 1110 1.11 1.1. .... 1011 .1.0 .... \
              vd=%vd_dp imm=%vm_sp opc=%vcvt_fix_op
 
 # VCVT float to integer (VCVT and VCVTR): Vd always single; Vd depends on size
+VCVT_hp_int  ---- 1110 1.11 110 s:1 .... 1001 rz:1 1.0 .... \
+             vd=%vd_sp vm=%vm_sp
 VCVT_sp_int  ---- 1110 1.11 110 s:1 .... 1010 rz:1 1.0 .... \
              vd=%vd_sp vm=%vm_sp
 VCVT_dp_int  ---- 1110 1.11 110 s:1 .... 1011 rz:1 1.0 .... \
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_dp(DisasContext *s, arg_VCVT_dp *a)
     return true;
 }
 
+static bool trans_VCVT_int_hp(DisasContext *s, arg_VCVT_int_sp *a)
+{
+    TCGv_i32 vm;
+    TCGv_ptr fpst;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    vm = tcg_temp_new_i32();
+    neon_load_reg32(vm, a->vm);
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    if (a->s) {
+        /* i32 -> f16 */
+        gen_helper_vfp_sitoh(vm, vm, fpst);
+    } else {
+        /* u32 -> f16 */
+        gen_helper_vfp_uitoh(vm, vm, fpst);
+    }
+    neon_store_reg32(vm, a->vd);
+    tcg_temp_free_i32(vm);
+    tcg_temp_free_ptr(fpst);
+    return true;
+}
+
 static bool trans_VCVT_int_sp(DisasContext *s, arg_VCVT_int_sp *a)
 {
     TCGv_i32 vm;
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_fix_dp(DisasContext *s, arg_VCVT_fix_dp *a)
     return true;
 }
 
+static bool trans_VCVT_hp_int(DisasContext *s, arg_VCVT_sp_int *a)
+{
+    TCGv_i32 vm;
+    TCGv_ptr fpst;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    vm = tcg_temp_new_i32();
+    neon_load_reg32(vm, a->vm);
+
+    if (a->s) {
+        if (a->rz) {
+            gen_helper_vfp_tosizh(vm, vm, fpst);
+        } else {
+            gen_helper_vfp_tosih(vm, vm, fpst);
+        }
+    } else {
+        if (a->rz) {
+            gen_helper_vfp_touizh(vm, vm, fpst);
+        } else {
+            gen_helper_vfp_touih(vm, vm, fpst);
+        }
+    }
+    neon_store_reg32(vm, a->vd);
+    tcg_temp_free_i32(vm);
+    tcg_temp_free_ptr(fpst);
+    return true;
+}
+
 static bool trans_VCVT_sp_int(DisasContext *s, arg_VCVT_sp_int *a)
 {
     TCGv_i32 vm;
-- 
2.20.1

Currently the VFP_CONV_FIX macros take a single fsz argument for the
size of the float type, which is used both to select the name of
the functions to call (eg float32_is_any_nan()) and also for the
type to use for the float inputs and outputs (eg float32).

Separate these into fsz and ftype arguments, so that we can use them
for fp16, which uses 'float16' in the function names but is still
passing inputs and outputs in a 32-bit sized type.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-14-peter.maydell@linaro.org
---
 target/arm/vfp_helper.c | 46 ++++++++++++++++++++---------------------
 1 file changed, 23 insertions(+), 23 deletions(-)

diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float32 VFP_HELPER(fcvts, d)(float64 x, CPUARMState *env)
 }
 
 /* VFP3 fixed point conversion.  */
-#define VFP_CONV_FIX_FLOAT(name, p, fsz, isz, itype) \
-float##fsz HELPER(vfp_##name##to##p)(uint##isz##_t  x, uint32_t shift, \
+#define VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)            \
+ftype HELPER(vfp_##name##to##p)(uint##isz##_t  x, uint32_t shift,      \
                                      void *fpstp) \
 { return itype##_to_##float##fsz##_scalbn(x, -shift, fpstp); }
 
-#define VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype, ROUND, suff)   \
-uint##isz##_t HELPER(vfp_to##name##p##suff)(float##fsz x, uint32_t shift, \
+#define VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype, ROUND, suff) \
+uint##isz##_t HELPER(vfp_to##name##p##suff)(ftype x, uint32_t shift,      \
                                             void *fpst)                   \
 {                                                                         \
     if (unlikely(float##fsz##_is_any_nan(x))) {                           \
@@ -XXX,XX +XXX,XX @@ uint##isz##_t HELPER(vfp_to##name##p##suff)(float##fsz x, uint32_t shift, \
     return float##fsz##_to_##itype##_scalbn(x, ROUND, shift, fpst);       \
 }
 
-#define VFP_CONV_FIX(name, p, fsz, isz, itype)                   \
-VFP_CONV_FIX_FLOAT(name, p, fsz, isz, itype)                     \
-VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype,               \
+#define VFP_CONV_FIX(name, p, fsz, ftype, isz, itype)            \
+VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)              \
+VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype,        \
                          float_round_to_zero, _round_to_zero)    \
-VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype,               \
+VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype,        \
                          get_float_rounding_mode(fpst), )
 
-#define VFP_CONV_FIX_A64(name, p, fsz, isz, itype)               \
-VFP_CONV_FIX_FLOAT(name, p, fsz, isz, itype)                     \
-VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, isz, itype,               \
+#define VFP_CONV_FIX_A64(name, p, fsz, ftype, isz, itype)        \
+VFP_CONV_FIX_FLOAT(name, p, fsz, ftype, isz, itype)              \
+VFP_CONV_FLOAT_FIX_ROUND(name, p, fsz, ftype, isz, itype,        \
                          get_float_rounding_mode(fpst), )
 
-VFP_CONV_FIX(sh, d, 64, 64, int16)
-VFP_CONV_FIX(sl, d, 64, 64, int32)
-VFP_CONV_FIX_A64(sq, d, 64, 64, int64)
-VFP_CONV_FIX(uh, d, 64, 64, uint16)
-VFP_CONV_FIX(ul, d, 64, 64, uint32)
-VFP_CONV_FIX_A64(uq, d, 64, 64, uint64)
-VFP_CONV_FIX(sh, s, 32, 32, int16)
-VFP_CONV_FIX(sl, s, 32, 32, int32)
-VFP_CONV_FIX_A64(sq, s, 32, 64, int64)
-VFP_CONV_FIX(uh, s, 32, 32, uint16)
-VFP_CONV_FIX(ul, s, 32, 32, uint32)
-VFP_CONV_FIX_A64(uq, s, 32, 64, uint64)
+VFP_CONV_FIX(sh, d, 64, float64, 64, int16)
+VFP_CONV_FIX(sl, d, 64, float64, 64, int32)
+VFP_CONV_FIX_A64(sq, d, 64, float64, 64, int64)
+VFP_CONV_FIX(uh, d, 64, float64, 64, uint16)
+VFP_CONV_FIX(ul, d, 64, float64, 64, uint32)
+VFP_CONV_FIX_A64(uq, d, 64, float64, 64, uint64)
+VFP_CONV_FIX(sh, s, 32, float32, 32, int16)
+VFP_CONV_FIX(sl, s, 32, float32, 32, int32)
+VFP_CONV_FIX_A64(sq, s, 32, float32, 64, int64)
+VFP_CONV_FIX(uh, s, 32, float32, 32, uint16)
+VFP_CONV_FIX(ul, s, 32, float32, 32, uint32)
+VFP_CONV_FIX_A64(uq, s, 32, float32, 64, uint64)
 
 #undef VFP_CONV_FIX
 #undef VFP_CONV_FIX_FLOAT
-- 
2.20.1

Now the VFP_CONV_FIX macros can handle fp16's distinction between the
width of the operation and the width of the type used to pass operands,
use the macros rather than the open-coded functions.

This creates an extra six helper functions, all of which we are going
to need for the AArch32 VFP fp16 instructions.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-15-peter.maydell@linaro.org
---
 target/arm/helper.h     |  6 +++
 target/arm/vfp_helper.c | 86 +++--------------------------------------
 2 files changed, 12 insertions(+), 80 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_2(vfp_tosizh, s32, f16, ptr)
 DEF_HELPER_2(vfp_tosizs, s32, f32, ptr)
 DEF_HELPER_2(vfp_tosizd, s32, f64, ptr)
 
+DEF_HELPER_3(vfp_toshh_round_to_zero, i32, f16, i32, ptr)
+DEF_HELPER_3(vfp_toslh_round_to_zero, i32, f16, i32, ptr)
+DEF_HELPER_3(vfp_touhh_round_to_zero, i32, f16, i32, ptr)
+DEF_HELPER_3(vfp_toulh_round_to_zero, i32, f16, i32, ptr)
 DEF_HELPER_3(vfp_toshs_round_to_zero, i32, f32, i32, ptr)
 DEF_HELPER_3(vfp_tosls_round_to_zero, i32, f32, i32, ptr)
 DEF_HELPER_3(vfp_touhs_round_to_zero, i32, f32, i32, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_sqtod, f64, i64, i32, ptr)
 DEF_HELPER_3(vfp_uhtod, f64, i64, i32, ptr)
 DEF_HELPER_3(vfp_ultod, f64, i64, i32, ptr)
 DEF_HELPER_3(vfp_uqtod, f64, i64, i32, ptr)
+DEF_HELPER_3(vfp_shtoh, f16, i32, i32, ptr)
+DEF_HELPER_3(vfp_uhtoh, f16, i32, i32, ptr)
 DEF_HELPER_3(vfp_sltoh, f16, i32, i32, ptr)
 DEF_HELPER_3(vfp_ultoh, f16, i32, i32, ptr)
 DEF_HELPER_3(vfp_sqtoh, f16, i64, i32, ptr)
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ VFP_CONV_FIX_A64(sq, s, 32, float32, 64, int64)
 VFP_CONV_FIX(uh, s, 32, float32, 32, uint16)
 VFP_CONV_FIX(ul, s, 32, float32, 32, uint32)
 VFP_CONV_FIX_A64(uq, s, 32, float32, 64, uint64)
+VFP_CONV_FIX(sh, h, 16, dh_ctype_f16, 32, int16)
+VFP_CONV_FIX(sl, h, 16, dh_ctype_f16, 32, int32)
+VFP_CONV_FIX_A64(sq, h, 16, dh_ctype_f16, 64, int64)
+VFP_CONV_FIX(uh, h, 16, dh_ctype_f16, 32, uint16)
+VFP_CONV_FIX(ul, h, 16, dh_ctype_f16, 32, uint32)
+VFP_CONV_FIX_A64(uq, h, 16, dh_ctype_f16, 64, uint64)
 
 #undef VFP_CONV_FIX
 #undef VFP_CONV_FIX_FLOAT
 #undef VFP_CONV_FLOAT_FIX_ROUND
 #undef VFP_CONV_FIX_A64
 
-uint32_t HELPER(vfp_sltoh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    return int32_to_float16_scalbn(x, -shift, fpst);
-}
-
-uint32_t HELPER(vfp_ultoh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    return uint32_to_float16_scalbn(x, -shift, fpst);
-}
-
-uint32_t HELPER(vfp_sqtoh)(uint64_t x, uint32_t shift, void *fpst)
-{
-    return int64_to_float16_scalbn(x, -shift, fpst);
-}
-
-uint32_t HELPER(vfp_uqtoh)(uint64_t x, uint32_t shift, void *fpst)
-{
-    return uint64_to_float16_scalbn(x, -shift, fpst);
-}
-
-uint32_t HELPER(vfp_toshh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    if (unlikely(float16_is_any_nan(x))) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_int16_scalbn(x, get_float_rounding_mode(fpst),
-                                   shift, fpst);
-}
-
-uint32_t HELPER(vfp_touhh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    if (unlikely(float16_is_any_nan(x))) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_uint16_scalbn(x, get_float_rounding_mode(fpst),
-                                    shift, fpst);
-}
-
-uint32_t HELPER(vfp_toslh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    if (unlikely(float16_is_any_nan(x))) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_int32_scalbn(x, get_float_rounding_mode(fpst),
-                                   shift, fpst);
-}
-
-uint32_t HELPER(vfp_toulh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    if (unlikely(float16_is_any_nan(x))) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_uint32_scalbn(x, get_float_rounding_mode(fpst),
-                                    shift, fpst);
-}
-
-uint64_t HELPER(vfp_tosqh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    if (unlikely(float16_is_any_nan(x))) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_int64_scalbn(x, get_float_rounding_mode(fpst),
-                                   shift, fpst);
-}
-
-uint64_t HELPER(vfp_touqh)(uint32_t x, uint32_t shift, void *fpst)
-{
-    if (unlikely(float16_is_any_nan(x))) {
-        float_raise(float_flag_invalid, fpst);
-        return 0;
-    }
-    return float16_to_uint64_scalbn(x, get_float_rounding_mode(fpst),
-                                    shift, fpst);
-}
-
 /* Set the current fp rounding mode and return the old one.
  * The argument is a softfloat float_round_ value.
  */
-- 
2.20.1

Implement the fp16 versions of the VFP VCVT instruction forms which
convert between floating point and fixed-point.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-16-peter.maydell@linaro.org
---
 target/arm/vfp.decode          |  2 ++
 target/arm/translate-vfp.c.inc | 59 ++++++++++++++++++++++++++++++++++
 2 files changed, 61 insertions(+)

diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VJCVT        ---- 1110 1.11 1001 .... 1011 11.0 ....        @vfp_dm_sd
 # We assemble bits 18 (op), 16 (u) and 7 (sx) into a single opc field
 # for the convenience of the trans_VCVT_fix functions.
 %vcvt_fix_op 18:1 16:1 7:1
+VCVT_fix_hp  ---- 1110 1.11 1.1. .... 1001 .1.0 .... \
+             vd=%vd_sp imm=%vm_sp opc=%vcvt_fix_op
 VCVT_fix_sp  ---- 1110 1.11 1.1. .... 1010 .1.0 .... \
              vd=%vd_sp imm=%vm_sp opc=%vcvt_fix_op
 VCVT_fix_dp  ---- 1110 1.11 1.1. .... 1011 .1.0 .... \
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VJCVT(DisasContext *s, arg_VJCVT *a)
     return true;
 }
 
+static bool trans_VCVT_fix_hp(DisasContext *s, arg_VCVT_fix_sp *a)
+{
+    TCGv_i32 vd, shift;
+    TCGv_ptr fpst;
+    int frac_bits;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    frac_bits = (a->opc & 1) ? (32 - a->imm) : (16 - a->imm);
+
+    vd = tcg_temp_new_i32();
+    neon_load_reg32(vd, a->vd);
+
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    shift = tcg_const_i32(frac_bits);
+
+    /* Switch on op:U:sx bits */
+    switch (a->opc) {
+    case 0:
+        gen_helper_vfp_shtoh(vd, vd, shift, fpst);
+        break;
+    case 1:
+        gen_helper_vfp_sltoh(vd, vd, shift, fpst);
+        break;
+    case 2:
+        gen_helper_vfp_uhtoh(vd, vd, shift, fpst);
+        break;
+    case 3:
+        gen_helper_vfp_ultoh(vd, vd, shift, fpst);
+        break;
+    case 4:
+        gen_helper_vfp_toshh_round_to_zero(vd, vd, shift, fpst);
+        break;
+    case 5:
+        gen_helper_vfp_toslh_round_to_zero(vd, vd, shift, fpst);
+        break;
+    case 6:
+        gen_helper_vfp_touhh_round_to_zero(vd, vd, shift, fpst);
+        break;
+    case 7:
+        gen_helper_vfp_toulh_round_to_zero(vd, vd, shift, fpst);
+        break;
+    default:
+        g_assert_not_reached();
+    }
+
+    neon_store_reg32(vd, a->vd);
+    tcg_temp_free_i32(vd);
+    tcg_temp_free_i32(shift);
+    tcg_temp_free_ptr(fpst);
+    return true;
+}
+
 static bool trans_VCVT_fix_sp(DisasContext *s, arg_VCVT_fix_sp *a)
 {
     TCGv_i32 vd, shift;
-- 
2.20.1

Implement the fp16 versions of the VFP VCVT instruction forms
which convert between floating point and integer with a specified
rounding mode.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-17-peter.maydell@linaro.org
---
 target/arm/vfp-uncond.decode   |  6 ++++--
 target/arm/translate-vfp.c.inc | 32 ++++++++++++++++++++++++--------
 2 files changed, 28 insertions(+), 10 deletions(-)

diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp-uncond.decode
+++ b/target/arm/vfp-uncond.decode
@@ -XXX,XX +XXX,XX @@ VRINT       1111 1110 1.11 10 rm:2 .... 1011 01.0 .... \
             vm=%vm_dp vd=%vd_dp dp=1
 
 # VCVT float to int with specified rounding mode; Vd is always single-precision
+VCVT        1111 1110 1.11 11 rm:2 .... 1001 op:1 1.0 .... \
+            vm=%vm_sp vd=%vd_sp sz=1
 VCVT        1111 1110 1.11 11 rm:2 .... 1010 op:1 1.0 .... \
-            vm=%vm_sp vd=%vd_sp dp=0
+            vm=%vm_sp vd=%vd_sp sz=2
 VCVT        1111 1110 1.11 11 rm:2 .... 1011 op:1 1.0 .... \
-            vm=%vm_dp vd=%vd_sp dp=1
+            vm=%vm_dp vd=%vd_sp sz=3
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
 static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
 {
     uint32_t rd, rm;
-    bool dp = a->dp;
+    int sz = a->sz;
     TCGv_ptr fpst;
     TCGv_i32 tcg_rmode, tcg_shift;
     int rounding = fp_decode_rm[a->rm];
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    if (sz == 3 && !dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
+    if (sz == 1 && !dc_isar_feature(aa32_fp16_arith, s)) {
         return false;
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
+    if (sz == 3 && !dc_isar_feature(aa32_simd_r32, s) && (a->vm & 0x10)) {
         return false;
     }
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
         return true;
     }
 
-    fpst = fpstatus_ptr(FPST_FPCR);
+    if (sz == 1) {
+        fpst = fpstatus_ptr(FPST_FPCR_F16);
+    } else {
+        fpst = fpstatus_ptr(FPST_FPCR);
+    }
 
     tcg_shift = tcg_const_i32(0);
 
     tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rounding));
     gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
 
-    if (dp) {
+    if (sz == 3) {
         TCGv_i64 tcg_double, tcg_res;
         TCGv_i32 tcg_tmp;
         tcg_double = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT(DisasContext *s, arg_VCVT *a)
         tcg_single = tcg_temp_new_i32();
         tcg_res = tcg_temp_new_i32();
         neon_load_reg32(tcg_single, rm);
-        if (is_signed) {
-            gen_helper_vfp_tosls(tcg_res, tcg_single, tcg_shift, fpst);
+        if (sz == 1) {
+            if (is_signed) {
+                gen_helper_vfp_toslh(tcg_res, tcg_single, tcg_shift, fpst);
+            } else {
+                gen_helper_vfp_toulh(tcg_res, tcg_single, tcg_shift, fpst);
+            }
         } else {
-            gen_helper_vfp_touls(tcg_res, tcg_single, tcg_shift, fpst);
+            if (is_signed) {
+                gen_helper_vfp_tosls(tcg_res, tcg_single, tcg_shift, fpst);
+            } else {
+                gen_helper_vfp_touls(tcg_res, tcg_single, tcg_shift, fpst);
+            }
         }
         neon_store_reg32(tcg_res, rd);
         tcg_temp_free_i32(tcg_res);
-- 
2.20.1

Implement the fp16 versions of the VFP VSEL instruction.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-18-peter.maydell@linaro.org
---
 target/arm/vfp-uncond.decode   |  6 ++++--
 target/arm/translate-vfp.c.inc | 16 ++++++++++++----
 2 files changed, 16 insertions(+), 6 deletions(-)

diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp-uncond.decode
+++ b/target/arm/vfp-uncond.decode
@@ -XXX,XX +XXX,XX @@
 @vfp_dnm_s   ................................ vm=%vm_sp vn=%vn_sp vd=%vd_sp
 @vfp_dnm_d   ................................ vm=%vm_dp vn=%vn_dp vd=%vd_dp
 
+VSEL        1111 1110 0. cc:2 .... .... 1001 .0.0 .... \
+            vm=%vm_sp vn=%vn_sp vd=%vd_sp sz=1
 VSEL        1111 1110 0. cc:2 .... .... 1010 .0.0 .... \
-            vm=%vm_sp vn=%vn_sp vd=%vd_sp dp=0
+            vm=%vm_sp vn=%vn_sp vd=%vd_sp sz=2
 VSEL        1111 1110 0. cc:2 .... .... 1011 .0.0 .... \
-            vm=%vm_dp vn=%vn_dp vd=%vd_dp dp=1
+            vm=%vm_dp vn=%vn_dp vd=%vd_dp sz=3
 
 VMAXNM_hp   1111 1110 1.00 .... .... 1001 .0.0 ....         @vfp_dnm_s
 VMINNM_hp   1111 1110 1.00 .... .... 1001 .1.0 ....         @vfp_dnm_s
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vfp_access_check(DisasContext *s)
 static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
 {
     uint32_t rd, rn, rm;
-    bool dp = a->dp;
+    int sz = a->sz;
 
     if (!dc_isar_feature(aa32_vsel, s)) {
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    if (sz == 3 && !dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
+    if (sz == 1 && !dc_isar_feature(aa32_fp16_arith, s)) {
         return false;
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+    if (sz == 3 && !dc_isar_feature(aa32_simd_r32, s) &&
         ((a->vm | a->vn | a->vd) & 0x10)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
         return true;
     }
 
-    if (dp) {
+    if (sz == 3) {
         TCGv_i64 frn, frm, dest;
         TCGv_i64 tmp, zero, zf, nf, vf;
 
@@ -XXX,XX +XXX,XX @@ static bool trans_VSEL(DisasContext *s, arg_VSEL *a)
             tcg_temp_free_i32(tmp);
             break;
         }
+        /* For fp16 the top half is always zeroes */
+        if (sz == 1) {
+            tcg_gen_andi_i32(dest, dest, 0xffff);
+        }
         neon_store_reg32(dest, rd);
         tcg_temp_free_i32(frn);
         tcg_temp_free_i32(frm);
-- 
2.20.1

Implement the fp16 version of the VFP VRINT* insns.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-19-peter.maydell@linaro.org
---
 target/arm/helper.h            |  2 +
 target/arm/vfp-uncond.decode   |  6 ++-
 target/arm/vfp.decode          |  3 ++
 target/arm/vfp_helper.c        | 21 ++++++++
 target/arm/translate-vfp.c.inc | 98 +++++++++++++++++++++++++++++++---
 5 files changed, 122 insertions(+), 8 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(shr_cc, i32, env, i32, i32)
 DEF_HELPER_3(sar_cc, i32, env, i32, i32)
 DEF_HELPER_3(ror_cc, i32, env, i32, i32)
 
+DEF_HELPER_FLAGS_2(rinth_exact, TCG_CALL_NO_RWG, f16, f16, ptr)
 DEF_HELPER_FLAGS_2(rints_exact, TCG_CALL_NO_RWG, f32, f32, ptr)
 DEF_HELPER_FLAGS_2(rintd_exact, TCG_CALL_NO_RWG, f64, f64, ptr)
+DEF_HELPER_FLAGS_2(rinth, TCG_CALL_NO_RWG, f16, f16, ptr)
 DEF_HELPER_FLAGS_2(rints, TCG_CALL_NO_RWG, f32, f32, ptr)
 DEF_HELPER_FLAGS_2(rintd, TCG_CALL_NO_RWG, f64, f64, ptr)
 
diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp-uncond.decode
+++ b/target/arm/vfp-uncond.decode
@@ -XXX,XX +XXX,XX @@ VMINNM_sp   1111 1110 1.00 .... .... 1010 .1.0 ....         @vfp_dnm_s
 VMAXNM_dp   1111 1110 1.00 .... .... 1011 .0.0 ....         @vfp_dnm_d
 VMINNM_dp   1111 1110 1.00 .... .... 1011 .1.0 ....         @vfp_dnm_d
 
+VRINT       1111 1110 1.11 10 rm:2 .... 1001 01.0 .... \
+            vm=%vm_sp vd=%vd_sp sz=1
 VRINT       1111 1110 1.11 10 rm:2 .... 1010 01.0 .... \
-            vm=%vm_sp vd=%vd_sp dp=0
+            vm=%vm_sp vd=%vd_sp sz=2
 VRINT       1111 1110 1.11 10 rm:2 .... 1011 01.0 .... \
-            vm=%vm_dp vd=%vd_dp dp=1
+            vm=%vm_dp vd=%vd_dp sz=3
 
 # VCVT float to int with specified rounding mode; Vd is always single-precision
 VCVT        1111 1110 1.11 11 rm:2 .... 1001 op:1 1.0 .... \
diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VCVT_f16_f32 ---- 1110 1.11 0011 .... 1010 t:1 1.0 .... \
 VCVT_f16_f64 ---- 1110 1.11 0011 .... 1011 t:1 1.0 .... \
              vd=%vd_sp vm=%vm_dp
 
+VRINTR_hp    ---- 1110 1.11 0110 .... 1001 01.0 ....        @vfp_dm_ss
 VRINTR_sp    ---- 1110 1.11 0110 .... 1010 01.0 ....        @vfp_dm_ss
 VRINTR_dp    ---- 1110 1.11 0110 .... 1011 01.0 ....        @vfp_dm_dd
 
+VRINTZ_hp    ---- 1110 1.11 0110 .... 1001 11.0 ....        @vfp_dm_ss
 VRINTZ_sp    ---- 1110 1.11 0110 .... 1010 11.0 ....        @vfp_dm_ss
 VRINTZ_dp    ---- 1110 1.11 0110 .... 1011 11.0 ....        @vfp_dm_dd
 
+VRINTX_hp    ---- 1110 1.11 0111 .... 1001 01.0 ....        @vfp_dm_ss
 VRINTX_sp    ---- 1110 1.11 0111 .... 1010 01.0 ....        @vfp_dm_ss
 VRINTX_dp    ---- 1110 1.11 0111 .... 1011 01.0 ....        @vfp_dm_dd
 
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ float64 VFP_HELPER(muladd, d)(float64 a, float64 b, float64 c, void *fpstp)
 }
 
 /* ARMv8 round to integral */
+dh_ctype_f16 HELPER(rinth_exact)(dh_ctype_f16 x, void *fp_status)
+{
+    return float16_round_to_int(x, fp_status);
+}
+
 float32 HELPER(rints_exact)(float32 x, void *fp_status)
 {
     return float32_round_to_int(x, fp_status);
@@ -XXX,XX +XXX,XX @@ float64 HELPER(rintd_exact)(float64 x, void *fp_status)
     return float64_round_to_int(x, fp_status);
 }
 
+dh_ctype_f16 HELPER(rinth)(dh_ctype_f16 x, void *fp_status)
+{
+    int old_flags = get_float_exception_flags(fp_status), new_flags;
+    float16 ret;
+
+    ret = float16_round_to_int(x, fp_status);
+
+    /* Suppress any inexact exceptions the conversion produced */
+    if (!(old_flags & float_flag_inexact)) {
+        new_flags = get_float_exception_flags(fp_status);
+        set_float_exception_flags(new_flags & ~float_flag_inexact, fp_status);
+    }
+
+    return ret;
+}
+
 float32 HELPER(rints)(float32 x, void *fp_status)
 {
     int old_flags = get_float_exception_flags(fp_status), new_flags;
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static const uint8_t fp_decode_rm[] = {
 static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
 {
     uint32_t rd, rm;
-    bool dp = a->dp;
+    int sz = a->sz;
     TCGv_ptr fpst;
     TCGv_i32 tcg_rmode;
     int rounding = fp_decode_rm[a->rm];
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
         return false;
     }
 
-    if (dp && !dc_isar_feature(aa32_fpdp_v2, s)) {
+    if (sz == 3 && !dc_isar_feature(aa32_fpdp_v2, s)) {
+        return false;
+    }
+
+    if (sz == 1 && !dc_isar_feature(aa32_fp16_arith, s)) {
         return false;
     }
 
     /* UNDEF accesses to D16-D31 if they don't exist */
-    if (dp && !dc_isar_feature(aa32_simd_r32, s) &&
+    if (sz == 3 && !dc_isar_feature(aa32_simd_r32, s) &&
         ((a->vm | a->vd) & 0x10)) {
         return false;
     }
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
         return true;
     }
 
-    fpst = fpstatus_ptr(FPST_FPCR);
+    if (sz == 1) {
+        fpst = fpstatus_ptr(FPST_FPCR_F16);
+    } else {
+        fpst = fpstatus_ptr(FPST_FPCR);
+    }
 
     tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rounding));
     gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
 
-    if (dp) {
+    if (sz == 3) {
         TCGv_i64 tcg_op;
         TCGv_i64 tcg_res;
         tcg_op = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINT(DisasContext *s, arg_VRINT *a)
         tcg_op = tcg_temp_new_i32();
         tcg_res = tcg_temp_new_i32();
         neon_load_reg32(tcg_op, rm);
-        gen_helper_rints(tcg_res, tcg_op, fpst);
+        if (sz == 1) {
+            gen_helper_rinth(tcg_res, tcg_op, fpst);
+        } else {
+            gen_helper_rints(tcg_res, tcg_op, fpst);
+        }
         neon_store_reg32(tcg_res, rd);
         tcg_temp_free_i32(tcg_op);
         tcg_temp_free_i32(tcg_res);
@@ -XXX,XX +XXX,XX @@ static bool trans_VCVT_f16_f64(DisasContext *s, arg_VCVT_f16_f64 *a)
     return true;
 }
 
+static bool trans_VRINTR_hp(DisasContext *s, arg_VRINTR_sp *a)
+{
+    TCGv_ptr fpst;
+    TCGv_i32 tmp;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    tmp = tcg_temp_new_i32();
+    neon_load_reg32(tmp, a->vm);
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    gen_helper_rinth(tmp, tmp, fpst);
+    neon_store_reg32(tmp, a->vd);
+    tcg_temp_free_ptr(fpst);
+    tcg_temp_free_i32(tmp);
+    return true;
+}
+
 static bool trans_VRINTR_sp(DisasContext *s, arg_VRINTR_sp *a)
 {
     TCGv_ptr fpst;
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTR_dp(DisasContext *s, arg_VRINTR_dp *a)
     return true;
 }
 
+static bool trans_VRINTZ_hp(DisasContext *s, arg_VRINTZ_sp *a)
+{
+    TCGv_ptr fpst;
+    TCGv_i32 tmp;
+    TCGv_i32 tcg_rmode;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    tmp = tcg_temp_new_i32();
+    neon_load_reg32(tmp, a->vm);
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    tcg_rmode = tcg_const_i32(float_round_to_zero);
+    gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
+    gen_helper_rinth(tmp, tmp, fpst);
+    gen_helper_set_rmode(tcg_rmode, tcg_rmode, fpst);
+    neon_store_reg32(tmp, a->vd);
+    tcg_temp_free_ptr(fpst);
+    tcg_temp_free_i32(tcg_rmode);
+    tcg_temp_free_i32(tmp);
+    return true;
+}
+
 static bool trans_VRINTZ_sp(DisasContext *s, arg_VRINTZ_sp *a)
 {
     TCGv_ptr fpst;
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTZ_dp(DisasContext *s, arg_VRINTZ_dp *a)
     return true;
 }
 
+static bool trans_VRINTX_hp(DisasContext *s, arg_VRINTX_sp *a)
+{
+    TCGv_ptr fpst;
+    TCGv_i32 tmp;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    tmp = tcg_temp_new_i32();
+    neon_load_reg32(tmp, a->vm);
+    fpst = fpstatus_ptr(FPST_FPCR_F16);
+    gen_helper_rinth_exact(tmp, tmp, fpst);
+    neon_store_reg32(tmp, a->vd);
+    tcg_temp_free_ptr(fpst);
+    tcg_temp_free_i32(tmp);
+    return true;
+}
+
 static bool trans_VRINTX_sp(DisasContext *s, arg_VRINTX_sp *a)
 {
     TCGv_ptr fpst;
-- 
2.20.1

The fp16 extension includes a new instruction VINS, which copies the
lower 16 bits of a 32-bit source VFP register into the upper 16 bits
of the destination.  Implement it.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-20-peter.maydell@linaro.org
---
 target/arm/vfp-uncond.decode   |  3 +++
 target/arm/translate-vfp.c.inc | 28 ++++++++++++++++++++++++++++
 2 files changed, 31 insertions(+)

The fp16 extension includes a new instruction VMOVX, which copies the
upper 16 bits of a 32-bit source VFP register into the lower 16
bits of the destination and zeroes the high half of the destination.
Implement it.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-21-peter.maydell@linaro.org
---
 target/arm/vfp-uncond.decode   |  3 +++
 target/arm/translate-vfp.c.inc | 25 +++++++++++++++++++++++++
 2 files changed, 28 insertions(+)

diff --git a/target/arm/vfp-uncond.decode b/target/arm/vfp-uncond.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp-uncond.decode
+++ b/target/arm/vfp-uncond.decode
@@ -XXX,XX +XXX,XX @@ VCVT        1111 1110 1.11 11 rm:2 .... 1010 op:1 1.0 .... \
 VCVT        1111 1110 1.11 11 rm:2 .... 1011 op:1 1.0 .... \
             vm=%vm_dp vd=%vd_sp sz=3
 
+VMOVX       1111 1110 1.11 0000 .... 1010 01 . 0 .... \
+            vd=%vd_sp vm=%vm_sp
+
 VINS        1111 1110 1.11 0000 .... 1010 11 . 0 .... \
             vd=%vd_sp vm=%vm_sp
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VINS(DisasContext *s, arg_VINS *a)
     tcg_temp_free_i32(rd);
     return true;
 }
+
+static bool trans_VMOVX(DisasContext *s, arg_VINS *a)
+{
+    TCGv_i32 rm;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (s->vec_len != 0 || s->vec_stride != 0) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    /* Set Vd to high half of Vm */
+    rm = tcg_temp_new_i32();
+    neon_load_reg32(rm, a->vm);
+    tcg_gen_shri_i32(rm, rm, 16);
+    neon_store_reg32(rm, a->vd);
+    tcg_temp_free_i32(rm);
+    return true;
+}
-- 
2.20.1

Implement the VFP fp16 variant of VMOV that transfers a 16-bit
value between a general purpose register and a VFP register.

Note that Rt == 15 is UNPREDICTABLE; since this insn is v8 and later
only we have no need to replicate the old "updates CPSR.NZCV"
behaviour that the singleprec version of this insn does.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-22-peter.maydell@linaro.org
---
 target/arm/vfp.decode          |  1 +
 target/arm/translate-vfp.c.inc | 34 ++++++++++++++++++++++++++++++++++
 2 files changed, 35 insertions(+)

diff --git a/target/arm/vfp.decode b/target/arm/vfp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp.decode
+++ b/target/arm/vfp.decode
@@ -XXX,XX +XXX,XX @@ VDUP         ---- 1110 1 b:1 q:1 0 .... rt:4 1011 . 0 e:1 1 0000 \
              vn=%vn_dp
 
 VMSR_VMRS    ---- 1110 111 l:1 reg:4 rt:4 1010 0001 0000
+VMOV_half    ---- 1110 000 l:1 .... rt:4 1001 . 001 0000    vn=%vn_sp
 VMOV_single  ---- 1110 000 l:1 .... rt:4 1010 . 001 0000    vn=%vn_sp
 
 VMOV_64_sp   ---- 1100 010 op:1 rt2:4 rt:4 1010 00.1 ....   vm=%vm_sp
diff --git a/target/arm/translate-vfp.c.inc b/target/arm/translate-vfp.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-vfp.c.inc
+++ b/target/arm/translate-vfp.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMSR_VMRS(DisasContext *s, arg_VMSR_VMRS *a)
     return true;
 }
 
+static bool trans_VMOV_half(DisasContext *s, arg_VMOV_single *a)
+{
+    TCGv_i32 tmp;
+
+    if (!dc_isar_feature(aa32_fp16_arith, s)) {
+        return false;
+    }
+
+    if (a->rt == 15) {
+        /* UNPREDICTABLE; we choose to UNDEF */
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    if (a->l) {
+        /* VFP to general purpose register */
+        tmp = tcg_temp_new_i32();
+        neon_load_reg32(tmp, a->vn);
+        tcg_gen_andi_i32(tmp, tmp, 0xffff);
+        store_reg(s, a->rt, tmp);
+    } else {
+        /* general purpose register to VFP */
+        tmp = load_reg(s, a->rt);
+        tcg_gen_andi_i32(tmp, tmp, 0xffff);
+        neon_store_reg32(tmp, a->vn);
+        tcg_temp_free_i32(tmp);
+    }
+
+    return true;
+}
+
 static bool trans_VMOV_single(DisasContext *s, arg_VMOV_single *a)
 {
     TCGv_i32 tmp;
-- 
2.20.1

Implement FP16 support for the Neon insns which use the DO_3S_FP_GVEC
macro: VADD, VSUB, VABD, VMUL.

For VABD this requires us to implement a new gvec_fabd_h helper
using the machinery we have already for the other helpers.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-24-peter.maydell@linaro.org
---
 target/arm/helper.h             |  1 +
 target/arm/vec_helper.c         |  6 ++++++
 target/arm/translate-neon.c.inc | 36 +++++++++++++++++----------------
 3 files changed, 26 insertions(+), 17 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fmul_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_fabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
 DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static float64 float64_ftsmul(float64 op1, uint64_t op2, float_status *stat)
     return result;
 }
 
+static float16 float16_abd(float16 op1, float16 op2, float_status *stat)
+{
+    return float16_abs(float16_sub(op1, op2, stat));
+}
+
 static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
 {
     return float32_abs(float32_sub(op1, op2, stat));
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_h, float16_ftsmul, float16)
 DO_3OP(gvec_ftsmul_s, float32_ftsmul, float32)
 DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
 
+DO_3OP(gvec_fabd_h, float16_abd, float16)
 DO_3OP(gvec_fabd_s, float32_abd, float32)
 
 #ifdef TARGET_AARCH64
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
     return true;
 }
 
-/*
- * For all the functions using this macro, size == 1 means fp16,
- * which is an architecture extension we don't implement yet.
- */
-#define DO_3S_FP_GVEC(INSN,FUNC)                                        \
-    static void gen_##INSN##_3s(unsigned vece, uint32_t rd_ofs,         \
-                                uint32_t rn_ofs, uint32_t rm_ofs,       \
-                                uint32_t oprsz, uint32_t maxsz)         \
+#define WRAP_FP_GVEC(WRAPNAME, FPST, FUNC)                              \
+    static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
+                         uint32_t rn_ofs, uint32_t rm_ofs,              \
+                         uint32_t oprsz, uint32_t maxsz)                \
     {                                                                   \
-        TCGv_ptr fpst = fpstatus_ptr(FPST_STD);                         \
+        TCGv_ptr fpst = fpstatus_ptr(FPST);                             \
         tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpst,                \
                            oprsz, maxsz, 0, FUNC);                      \
         tcg_temp_free_ptr(fpst);                                        \
-    }                                                                   \
+    }
+
+#define DO_3S_FP_GVEC(INSN,SFUNC,HFUNC)                                 \
+    WRAP_FP_GVEC(gen_##INSN##_fp32_3s, FPST_STD, SFUNC)                 \
+    WRAP_FP_GVEC(gen_##INSN##_fp16_3s, FPST_STD_F16, HFUNC)             \
     static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a)     \
     {                                                                   \
         if (a->size != 0) {                                             \
-            /* TODO fp16 support */                                     \
-            return false;                                               \
+            if (!dc_isar_feature(aa32_fp16_arith, s)) {                 \
+                return false;                                           \
+            }                                                           \
+            return do_3same(s, a, gen_##INSN##_fp16_3s);                \
         }                                                               \
-        return do_3same(s, a, gen_##INSN##_3s);                         \
+        return do_3same(s, a, gen_##INSN##_fp32_3s);                    \
     }
 
 
-DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s)
-DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s)
-DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s)
-DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s)
+DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s, gen_helper_gvec_fadd_h)
+DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s, gen_helper_gvec_fsub_h)
+DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s, gen_helper_gvec_fabd_h)
+DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
 
 /*
  * For all the functions using this macro, size == 1 means fp16,
-- 
2.20.1

We already have gvec helpers for floating point VRECPE and
VRQSRTE, so convert the Neon decoder to use them and
add the fp16 support.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-25-peter.maydell@linaro.org
---
 target/arm/translate-neon.c.inc | 31 +++++++++++++++++++++++++++++--
 1 file changed, 29 insertions(+), 2 deletions(-)

Rewrite Neon VABS/VNEG of floats to use gvec logical AND and XOR, so
that we can implement the fp16 version of the insns.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-26-peter.maydell@linaro.org
---
 target/arm/translate-neon.c.inc | 34 +++++++++++++++++++++++++++------
 1 file changed, 28 insertions(+), 6 deletions(-)

Convert the Neon floating-point vector comparison ops VCEQ,
VCGE and VCGT over to using a gvec helper and use this to
implement the fp16 case.

(We put the float16_ceq() etc functions above the DO_2OP()
macro definition because later when we convert the
compare-against-zero instructions we'll want their
definitions to be visible at that point in the source file.)

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-27-peter.maydell@linaro.org
---
 target/arm/helper.h             |  9 +++++++
 target/arm/vec_helper.c         | 44 +++++++++++++++++++++++++++++++++
 target/arm/translate-neon.c.inc |  6 ++---
 3 files changed, 56 insertions(+), 3 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fabd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fabd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_fceq_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fceq_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(gvec_fcge_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fcge_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(gvec_fcgt_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fcgt_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(gvec_fcmlad)(void *vd, void *vn, void *vm,
     clear_tail(d, opr_sz, simd_maxsz(desc));
 }
 
+/*
+ * Floating point comparisons producing an integer result (all 1s or all 0s).
+ * Note that EQ doesn't signal InvalidOp for QNaNs but GE and GT do.
+ * Softfloat routines return 0/1, which we convert to the 0/-1 Neon requires.
+ */
+static uint16_t float16_ceq(float16 op1, float16 op2, float_status *stat)
+{
+    return -float16_eq_quiet(op1, op2, stat);
+}
+
+static uint32_t float32_ceq(float32 op1, float32 op2, float_status *stat)
+{
+    return -float32_eq_quiet(op1, op2, stat);
+}
+
+static uint16_t float16_cge(float16 op1, float16 op2, float_status *stat)
+{
+    return -float16_le(op2, op1, stat);
+}
+
+static uint32_t float32_cge(float32 op1, float32 op2, float_status *stat)
+{
+    return -float32_le(op2, op1, stat);
+}
+
+static uint16_t float16_cgt(float16 op1, float16 op2, float_status *stat)
+{
+    return -float16_lt(op2, op1, stat);
+}
+
+static uint32_t float32_cgt(float32 op1, float32 op2, float_status *stat)
+{
+    return -float32_lt(op2, op1, stat);
+}
+
 #define DO_2OP(NAME, FUNC, TYPE) \
 void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
 {                                                                 \
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_ftsmul_d, float64_ftsmul, float64)
 DO_3OP(gvec_fabd_h, float16_abd, float16)
 DO_3OP(gvec_fabd_s, float32_abd, float32)
 
+DO_3OP(gvec_fceq_h, float16_ceq, float16)
+DO_3OP(gvec_fceq_s, float32_ceq, float32)
+
+DO_3OP(gvec_fcge_h, float16_cge, float16)
+DO_3OP(gvec_fcge_s, float32_cge, float32)
+
+DO_3OP(gvec_fcgt_h, float16_cgt, float16)
+DO_3OP(gvec_fcgt_s, float32_cgt, float32)
+
 #ifdef TARGET_AARCH64
 
 DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VADD, gen_helper_gvec_fadd_s, gen_helper_gvec_fadd_h)
 DO_3S_FP_GVEC(VSUB, gen_helper_gvec_fsub_s, gen_helper_gvec_fsub_h)
 DO_3S_FP_GVEC(VABD, gen_helper_gvec_fabd_s, gen_helper_gvec_fabd_h)
 DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
+DO_3S_FP_GVEC(VCEQ, gen_helper_gvec_fceq_s, gen_helper_gvec_fceq_h)
+DO_3S_FP_GVEC(VCGE, gen_helper_gvec_fcge_s, gen_helper_gvec_fcge_h)
+DO_3S_FP_GVEC(VCGT, gen_helper_gvec_fcgt_s, gen_helper_gvec_fcgt_h)
 
 /*
  * For all the functions using this macro, size == 1 means fp16,
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMUL, gen_helper_gvec_fmul_s, gen_helper_gvec_fmul_h)
         return do_3same_fp(s, a, FUNC, READS_VD);                   \
     }
 
-DO_3S_FP(VCEQ, gen_helper_neon_ceq_f32, false)
-DO_3S_FP(VCGE, gen_helper_neon_cge_f32, false)
-DO_3S_FP(VCGT, gen_helper_neon_cgt_f32, false)
 DO_3S_FP(VACGE, gen_helper_neon_acge_f32, false)
 DO_3S_FP(VACGT, gen_helper_neon_acgt_f32, false)
 DO_3S_FP(VMAX, gen_helper_vfp_maxs, false)
-- 
2.20.1

Convert the neon floating-point vector absolute comparison ops
VACGE and VACGT over to using a gvec hepler and use this to
implement the fp16 case.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-28-peter.maydell@linaro.org
---
 target/arm/helper.h             |  6 ++++++
 target/arm/vec_helper.c         | 26 ++++++++++++++++++++++++++
 target/arm/translate-neon.c.inc |  4 ++--
 3 files changed, 34 insertions(+), 2 deletions(-)

Convert the Neon float-point VMAX and VMIN insns over to using
a gvec helper, and use this to implement the fp16 case.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-29-peter.maydell@linaro.org
---
 target/arm/helper.h             | 6 ++++++
 target/arm/vec_helper.c         | 6 ++++++
 target/arm/translate-neon.c.inc | 5 ++---
 3 files changed, 14 insertions(+), 3 deletions(-)

Convert the Neon floating point VMAXNM and VMINNM insns to
using a gvec helper and use this to implement the fp16 case.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-30-peter.maydell@linaro.org
---
 target/arm/helper.h             |  6 ++++++
 target/arm/vec_helper.c         |  6 ++++++
 target/arm/translate-neon.c.inc | 23 +++++++++++++++--------
 3 files changed, 27 insertions(+), 8 deletions(-)

Convert the Neon floating-point VMLA and VMLS insns over to using a
gvec helper, and use this to implement the fp16 case.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-31-peter.maydell@linaro.org
---
 target/arm/helper.h             |  6 +++++
 target/arm/vec_helper.c         | 42 +++++++++++++++++++++++++++++++++
 target/arm/translate-neon.c.inc | 33 ++------------------------
 3 files changed, 50 insertions(+), 31 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i3
 DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(gvec_fmls_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fmls_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_rsqrts_d, helper_rsqrtsf_f64, float64)
 #endif
 #undef DO_3OP
 
+/* Non-fused multiply-add (unlike float16_muladd etc, which are fused) */
+static float16 float16_muladd_nf(float16 dest, float16 op1, float16 op2,
+                                 float_status *stat)
+{
+    return float16_add(dest, float16_mul(op1, op2, stat), stat);
+}
+
+static float32 float32_muladd_nf(float32 dest, float32 op1, float32 op2,
+                                 float_status *stat)
+{
+    return float32_add(dest, float32_mul(op1, op2, stat), stat);
+}
+
+static float16 float16_mulsub_nf(float16 dest, float16 op1, float16 op2,
+                                 float_status *stat)
+{
+    return float16_sub(dest, float16_mul(op1, op2, stat), stat);
+}
+
+static float32 float32_mulsub_nf(float32 dest, float32 op1, float32 op2,
+                                 float_status *stat)
+{
+    return float32_sub(dest, float32_mul(op1, op2, stat), stat);
+}
+
+#define DO_MULADD(NAME, FUNC, TYPE) \
+void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
+{                                                                          \
+    intptr_t i, oprsz = simd_oprsz(desc);                                  \
+    TYPE *d = vd, *n = vn, *m = vm;                                        \
+    for (i = 0; i < oprsz / sizeof(TYPE); i++) {                           \
+        d[i] = FUNC(d[i], n[i], m[i], stat);                               \
+    }                                                                      \
+    clear_tail(d, oprsz, simd_maxsz(desc));                                \
+}
+
+DO_MULADD(gvec_fmla_h, float16_muladd_nf, float16)
+DO_MULADD(gvec_fmla_s, float32_muladd_nf, float32)
+
+DO_MULADD(gvec_fmls_h, float16_mulsub_nf, float16)
+DO_MULADD(gvec_fmls_s, float32_mulsub_nf, float32)
+
 /* For the indexed ops, SVE applies the index per 128-bit vector segment.
  * For AdvSIMD, there is of course only one such vector segment.
  */
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VACGE, gen_helper_gvec_facge_s, gen_helper_gvec_facge_h)
 DO_3S_FP_GVEC(VACGT, gen_helper_gvec_facgt_s, gen_helper_gvec_facgt_h)
 DO_3S_FP_GVEC(VMAX, gen_helper_gvec_fmax_s, gen_helper_gvec_fmax_h)
 DO_3S_FP_GVEC(VMIN, gen_helper_gvec_fmin_s, gen_helper_gvec_fmin_h)
-
-/*
- * For all the functions using this macro, size == 1 means fp16,
- * which is an architecture extension we don't implement yet.
- */
-#define DO_3S_FP(INSN,FUNC,READS_VD)                                \
-    static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
-    {                                                               \
-        if (a->size != 0) {                                         \
-            /* TODO fp16 support */                                 \
-            return false;                                           \
-        }                                                           \
-        return do_3same_fp(s, a, FUNC, READS_VD);                   \
-    }
-
-static void gen_VMLA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-                            TCGv_ptr fpstatus)
-{
-    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
-    gen_helper_vfp_adds(vd, vd, vn, fpstatus);
-}
-
-static void gen_VMLS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-                            TCGv_ptr fpstatus)
-{
-    gen_helper_vfp_muls(vn, vn, vm, fpstatus);
-    gen_helper_vfp_subs(vd, vd, vn, fpstatus);
-}
-
-DO_3S_FP(VMLA, gen_VMLA_fp_3s, true)
-DO_3S_FP(VMLS, gen_VMLS_fp_3s, true)
+DO_3S_FP_GVEC(VMLA, gen_helper_gvec_fmla_s, gen_helper_gvec_fmla_h)
+DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
 
 WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
 WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
-- 
2.20.1

Convert the neon floating-point vector operations VFMA and VFMS
to use a gvec helper, and use this to implement the fp16 case.

This is the last use of do_3same_fp() so we can now delete
that function.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-32-peter.maydell@linaro.org
---
 target/arm/helper.h             |  6 +++
 target/arm/vec_helper.c         | 33 +++++++++++-
 target/arm/translate-neon.c.inc | 92 +--------------------------------
 3 files changed, 40 insertions(+), 91 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fmls_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fmls_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_vfma_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_vfma_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(gvec_vfms_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_vfms_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_ftsmul_h, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_ftsmul_s, TCG_CALL_NO_RWG,
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static float32 float32_mulsub_nf(float32 dest, float32 op1, float32 op2,
     return float32_sub(dest, float32_mul(op1, op2, stat), stat);
 }
 
-#define DO_MULADD(NAME, FUNC, TYPE) \
+/* Fused versions; these have the semantics Neon VFMA/VFMS want */
+static float16 float16_muladd_f(float16 dest, float16 op1, float16 op2,
+                                float_status *stat)
+{
+    return float16_muladd(op1, op2, dest, 0, stat);
+}
+
+static float32 float32_muladd_f(float32 dest, float32 op1, float32 op2,
+                                 float_status *stat)
+{
+    return float32_muladd(op1, op2, dest, 0, stat);
+}
+
+static float16 float16_mulsub_f(float16 dest, float16 op1, float16 op2,
+                                 float_status *stat)
+{
+    return float16_muladd(float16_chs(op1), op2, dest, 0, stat);
+}
+
+static float32 float32_mulsub_f(float32 dest, float32 op1, float32 op2,
+                                 float_status *stat)
+{
+    return float32_muladd(float32_chs(op1), op2, dest, 0, stat);
+}
+
+#define DO_MULADD(NAME, FUNC, TYPE)                                     \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
     intptr_t i, oprsz = simd_oprsz(desc);                                  \
@@ -XXX,XX +XXX,XX @@ DO_MULADD(gvec_fmla_s, float32_muladd_nf, float32)
 DO_MULADD(gvec_fmls_h, float16_mulsub_nf, float16)
 DO_MULADD(gvec_fmls_s, float32_mulsub_nf, float32)
 
+DO_MULADD(gvec_vfma_h, float16_muladd_f, float16)
+DO_MULADD(gvec_vfma_s, float32_muladd_f, float32)
+
+DO_MULADD(gvec_vfms_h, float16_mulsub_f, float16)
+DO_MULADD(gvec_vfms_s, float32_mulsub_f, float32)
+
 /* For the indexed ops, SVE applies the index per 128-bit vector segment.
  * For AdvSIMD, there is of course only one such vector segment.
  */
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3SAME_PAIR(VPADD, padd_u)
 DO_3SAME_VQDMULH(VQDMULH, qdmulh)
 DO_3SAME_VQDMULH(VQRDMULH, qrdmulh)
 
-static bool do_3same_fp(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn,
-                        bool reads_vd)
-{
-    /*
-     * FP operations handled elementwise 32 bits at a time.
-     * If reads_vd is true then the old value of Vd will be
-     * loaded before calling the callback function. This is
-     * used for multiply-accumulate type operations.
-     */
-    TCGv_i32 tmp, tmp2;
-    int pass;
-
-    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-        return false;
-    }
-
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vn | a->vm) & 0x10)) {
-        return false;
-    }
-
-    if ((a->vn | a->vm | a->vd) & a->q) {
-        return false;
-    }
-
-    if (!vfp_access_check(s)) {
-        return true;
-    }
-
-    TCGv_ptr fpstatus = fpstatus_ptr(FPST_STD);
-    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
-        tmp = neon_load_reg(a->vn, pass);
-        tmp2 = neon_load_reg(a->vm, pass);
-        if (reads_vd) {
-            TCGv_i32 tmp_rd = neon_load_reg(a->vd, pass);
-            fn(tmp_rd, tmp, tmp2, fpstatus);
-            neon_store_reg(a->vd, pass, tmp_rd);
-            tcg_temp_free_i32(tmp);
-        } else {
-            fn(tmp, tmp, tmp2, fpstatus);
-            neon_store_reg(a->vd, pass, tmp);
-        }
-        tcg_temp_free_i32(tmp2);
-    }
-    tcg_temp_free_ptr(fpstatus);
-    return true;
-}
-
 #define WRAP_FP_GVEC(WRAPNAME, FPST, FUNC)                              \
     static void WRAPNAME(unsigned vece, uint32_t rd_ofs,                \
                          uint32_t rn_ofs, uint32_t rm_ofs,              \
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMAX, gen_helper_gvec_fmax_s, gen_helper_gvec_fmax_h)
 DO_3S_FP_GVEC(VMIN, gen_helper_gvec_fmin_s, gen_helper_gvec_fmin_h)
 DO_3S_FP_GVEC(VMLA, gen_helper_gvec_fmla_s, gen_helper_gvec_fmla_h)
 DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
+DO_3S_FP_GVEC(VFMA, gen_helper_gvec_vfma_s, gen_helper_gvec_vfma_h)
+DO_3S_FP_GVEC(VFMS, gen_helper_gvec_vfms_s, gen_helper_gvec_vfms_h)
 
 WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
 WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
@@ -XXX,XX +XXX,XX @@ static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
     return do_3same(s, a, gen_VRSQRTS_fp_3s);
 }
 
-static void gen_VFMA_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-                            TCGv_ptr fpstatus)
-{
-    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
-}
-
-static bool trans_VFMA_fp_3s(DisasContext *s, arg_3same *a)
-{
-    if (!dc_isar_feature(aa32_simdfmac, s)) {
-        return false;
-    }
-
-    if (a->size != 0) {
-        /* TODO fp16 support */
-        return false;
-    }
-
-    return do_3same_fp(s, a, gen_VFMA_fp_3s, true);
-}
-
-static void gen_VFMS_fp_3s(TCGv_i32 vd, TCGv_i32 vn, TCGv_i32 vm,
-                            TCGv_ptr fpstatus)
-{
-    gen_helper_vfp_negs(vn, vn);
-    gen_helper_vfp_muladds(vd, vn, vm, vd, fpstatus);
-}
-
-static bool trans_VFMS_fp_3s(DisasContext *s, arg_3same *a)
-{
-    if (!dc_isar_feature(aa32_simdfmac, s)) {
-        return false;
-    }
-
-    if (a->size != 0) {
-        /* TODO fp16 support */
-        return false;
-    }
-
-    return do_3same_fp(s, a, gen_VFMS_fp_3s, true);
-}
-
 static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
 {
     /* FP operations handled pairwise 32 bits at a time */
-- 
2.20.1

Convert the neon floating-point vector compare-vs-0 insns VCEQ0,
VCGT0, VCLE0, VCGE0 and VCLT0 to use a gvec helper, and use this to
implement the fp16 case.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-33-peter.maydell@linaro.org
---
 target/arm/helper.h             | 15 +++++++++++++++
 target/arm/vec_helper.c         | 25 +++++++++++++++++++++++++
 target/arm/translate-neon.c.inc | 33 +++++----------------------------
 3 files changed, 45 insertions(+), 28 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
 DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
 DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
 
+#define WRAP_CMP0_FWD(FN, CMPOP, TYPE)                          \
+    static TYPE TYPE##_##FN##0(TYPE op, float_status *stat)     \
+    {                                                           \
+        return TYPE##_##CMPOP(op, TYPE##_zero, stat);           \
+    }
+
+#define WRAP_CMP0_REV(FN, CMPOP, TYPE)                          \
+    static TYPE TYPE##_##FN##0(TYPE op, float_status *stat)    \
+    {                                                           \
+        return TYPE##_##CMPOP(TYPE##_zero, op, stat);           \
+    }
+
+#define DO_2OP_CMP0(FN, CMPOP, DIRN)                    \
+    WRAP_CMP0_##DIRN(FN, CMPOP, float16)                \
+    WRAP_CMP0_##DIRN(FN, CMPOP, float32)                \
+    DO_2OP(gvec_f##FN##0_h, float16_##FN##0, float16)   \
+    DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)
+
+DO_2OP_CMP0(cgt, cgt, FWD)
+DO_2OP_CMP0(cge, cge, FWD)
+DO_2OP_CMP0(ceq, ceq, FWD)
+DO_2OP_CMP0(clt, cgt, REV)
+DO_2OP_CMP0(cle, cge, REV)
+
 #undef DO_2OP
+#undef DO_2OP_CMP0
 
 /* Floating-point trigonometric starting value.
  * See the ARM ARM pseudocode function FPTrigSMul.
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_2MISC_FP(VCVT_UF, gen_helper_vfp_touizs)
 
 DO_2MISC_FP_VEC(VRECPE_F, gen_helper_gvec_frecpe_h, gen_helper_gvec_frecpe_s)
 DO_2MISC_FP_VEC(VRSQRTE_F, gen_helper_gvec_frsqrte_h, gen_helper_gvec_frsqrte_s)
+DO_2MISC_FP_VEC(VCGT0_F, gen_helper_gvec_fcgt0_h, gen_helper_gvec_fcgt0_s)
+DO_2MISC_FP_VEC(VCGE0_F, gen_helper_gvec_fcge0_h, gen_helper_gvec_fcge0_s)
+DO_2MISC_FP_VEC(VCEQ0_F, gen_helper_gvec_fceq0_h, gen_helper_gvec_fceq0_s)
+DO_2MISC_FP_VEC(VCLT0_F, gen_helper_gvec_fclt0_h, gen_helper_gvec_fclt0_s)
+DO_2MISC_FP_VEC(VCLE0_F, gen_helper_gvec_fcle0_h, gen_helper_gvec_fcle0_s)
 
 static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
 {
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
     return do_2misc_fp(s, a, gen_helper_rints_exact);
 }
 
-#define WRAP_FP_CMP0_FWD(WRAPNAME, FUNC)                        \
-    static void WRAPNAME(TCGv_i32 d, TCGv_i32 m, TCGv_ptr fpst) \
-    {                                                           \
-        TCGv_i32 zero = tcg_const_i32(0);                       \
-        FUNC(d, m, zero, fpst);                                 \
-        tcg_temp_free_i32(zero);                                \
-    }
-#define WRAP_FP_CMP0_REV(WRAPNAME, FUNC)                        \
-    static void WRAPNAME(TCGv_i32 d, TCGv_i32 m, TCGv_ptr fpst) \
-    {                                                           \
-        TCGv_i32 zero = tcg_const_i32(0);                       \
-        FUNC(d, zero, m, fpst);                                 \
-        tcg_temp_free_i32(zero);                                \
-    }
-
-#define DO_FP_CMP0(INSN, FUNC, REV)                             \
-    WRAP_FP_CMP0_##REV(gen_##INSN, FUNC)                        \
-    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
-    {                                                           \
-        return do_2misc_fp(s, a, gen_##INSN);                   \
-    }
-
-DO_FP_CMP0(VCGT0_F, gen_helper_neon_cgt_f32, FWD)
-DO_FP_CMP0(VCGE0_F, gen_helper_neon_cge_f32, FWD)
-DO_FP_CMP0(VCEQ0_F, gen_helper_neon_ceq_f32, FWD)
-DO_FP_CMP0(VCLE0_F, gen_helper_neon_cge_f32, REV)
-DO_FP_CMP0(VCLT0_F, gen_helper_neon_cgt_f32, REV)
-
 static bool do_vrint(DisasContext *s, arg_2misc *a, int rmode)
 {
     /*
-- 
2.20.1

Convert the Neon VRECPS insn to using a gvec helper, and
use this to implement the fp16 case.

The phrasing of the new float32_recps_nf() is slightly different from
the old recps_f32() so that it parallels the f16 version; for f16 we
can't assume that flush-to-zero is always enabled.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-34-peter.maydell@linaro.org
---
 target/arm/helper.h             |  4 +++-
 target/arm/vec_helper.c         | 31 +++++++++++++++++++++++++++++++
 target/arm/vfp_helper.c         | 13 -------------
 target/arm/translate-neon.c.inc | 21 +--------------------
 4 files changed, 35 insertions(+), 34 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
 DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
 DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
 
-DEF_HELPER_3(recps_f32, f32, env, f32, f32)
 DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
 DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
 DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmaxnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i3
 DEF_HELPER_FLAGS_5(gvec_fminnum_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_recps_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_recps_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static float32 float32_abd(float32 op1, float32 op2, float_status *stat)
     return float32_abs(float32_sub(op1, op2, stat));
 }
 
+/*
+ * Reciprocal step. These are the AArch32 version which uses a
+ * non-fused multiply-and-subtract.
+ */
+static float16 float16_recps_nf(float16 op1, float16 op2, float_status *stat)
+{
+    op1 = float16_squash_input_denormal(op1, stat);
+    op2 = float16_squash_input_denormal(op2, stat);
+
+    if ((float16_is_infinity(op1) && float16_is_zero(op2)) ||
+        (float16_is_infinity(op2) && float16_is_zero(op1))) {
+        return float16_two;
+    }
+    return float16_sub(float16_two, float16_mul(op1, op2, stat), stat);
+}
+
+static float32 float32_recps_nf(float32 op1, float32 op2, float_status *stat)
+{
+    op1 = float32_squash_input_denormal(op1, stat);
+    op2 = float32_squash_input_denormal(op2, stat);
+
+    if ((float32_is_infinity(op1) && float32_is_zero(op2)) ||
+        (float32_is_infinity(op2) && float32_is_zero(op1))) {
+        return float32_two;
+    }
+    return float32_sub(float32_two, float32_mul(op1, op2, stat), stat);
+}
+
 #define DO_3OP(NAME, FUNC, TYPE) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_fmaxnum_s, float32_maxnum, float32)
 DO_3OP(gvec_fminnum_h, float16_minnum, float16)
 DO_3OP(gvec_fminnum_s, float32_minnum, float32)
 
+DO_3OP(gvec_recps_nf_h, float16_recps_nf, float16)
+DO_3OP(gvec_recps_nf_s, float32_recps_nf, float32)
+
 #ifdef TARGET_AARCH64
 
 DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
     return r;
 }
 
-float32 HELPER(recps_f32)(CPUARMState *env, float32 a, float32 b)
-{
-    float_status *s = &env->vfp.standard_fp_status;
-    if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
-        (float32_is_infinity(b) && float32_is_zero_or_denormal(a))) {
-        if (!(float32_is_zero(a) || float32_is_zero(b))) {
-            float_raise(float_flag_input_denormal, s);
-        }
-        return float32_two;
-    }
-    return float32_sub(float32_two, float32_mul(a, b, s), s);
-}
-
 float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
 {
     float_status *s = &env->vfp.standard_fp_status;
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMLA, gen_helper_gvec_fmla_s, gen_helper_gvec_fmla_h)
 DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
 DO_3S_FP_GVEC(VFMA, gen_helper_gvec_vfma_s, gen_helper_gvec_vfma_h)
 DO_3S_FP_GVEC(VFMS, gen_helper_gvec_vfms_s, gen_helper_gvec_vfms_h)
+DO_3S_FP_GVEC(VRECPS, gen_helper_gvec_recps_nf_s, gen_helper_gvec_recps_nf_h)
 
 WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
 WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
     return do_3same(s, a, gen_VMINNM_fp32_3s);
 }
 
-WRAP_ENV_FN(gen_VRECPS_tramp, gen_helper_recps_f32)
-
-static void gen_VRECPS_fp_3s(unsigned vece, uint32_t rd_ofs,
-                             uint32_t rn_ofs, uint32_t rm_ofs,
-                             uint32_t oprsz, uint32_t maxsz)
-{
-    static const GVecGen3 ops = { .fni4 = gen_VRECPS_tramp };
-    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
-}
-
-static bool trans_VRECPS_fp_3s(DisasContext *s, arg_3same *a)
-{
-    if (a->size != 0) {
-        /* TODO fp16 support */
-        return false;
-    }
-
-    return do_3same(s, a, gen_VRECPS_fp_3s);
-}
-
 WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
 
 static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
-- 
2.20.1

Convert the Neon VRSQRTS insn to using a gvec helper,
and use this to implement the fp16 case.

As with VRECPS, we adjust the phrasing of the new implementation
slightly so that the fp32 version parallels the fp16 one.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-35-peter.maydell@linaro.org
---
 target/arm/helper.h             |  4 +++-
 target/arm/vec_helper.c         | 30 ++++++++++++++++++++++++++++++
 target/arm/vfp_helper.c         | 15 ---------------
 target/arm/translate-neon.c.inc | 21 +--------------------
 4 files changed, 34 insertions(+), 36 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vfp_muladdd, f64, f64, f64, f64, ptr)
 DEF_HELPER_4(vfp_muladds, f32, f32, f32, f32, ptr)
 DEF_HELPER_4(vfp_muladdh, f16, f16, f16, f16, ptr)
 
-DEF_HELPER_3(rsqrts_f32, f32, env, f32, f32)
 DEF_HELPER_FLAGS_2(recpe_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
 DEF_HELPER_FLAGS_2(recpe_f32, TCG_CALL_NO_RWG, f32, f32, ptr)
 DEF_HELPER_FLAGS_2(recpe_f64, TCG_CALL_NO_RWG, f64, f64, ptr)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fminnum_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i3
 DEF_HELPER_FLAGS_5(gvec_recps_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_recps_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_rsqrts_nf_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_5(gvec_fmla_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(gvec_fmla_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static float32 float32_recps_nf(float32 op1, float32 op2, float_status *stat)
     return float32_sub(float32_two, float32_mul(op1, op2, stat), stat);
 }
 
+/* Reciprocal square-root step. AArch32 non-fused semantics. */
+static float16 float16_rsqrts_nf(float16 op1, float16 op2, float_status *stat)
+{
+    op1 = float16_squash_input_denormal(op1, stat);
+    op2 = float16_squash_input_denormal(op2, stat);
+
+    if ((float16_is_infinity(op1) && float16_is_zero(op2)) ||
+        (float16_is_infinity(op2) && float16_is_zero(op1))) {
+        return float16_one_point_five;
+    }
+    op1 = float16_sub(float16_three, float16_mul(op1, op2, stat), stat);
+    return float16_div(op1, float16_two, stat);
+}
+
+static float32 float32_rsqrts_nf(float32 op1, float32 op2, float_status *stat)
+{
+    op1 = float32_squash_input_denormal(op1, stat);
+    op2 = float32_squash_input_denormal(op2, stat);
+
+    if ((float32_is_infinity(op1) && float32_is_zero(op2)) ||
+        (float32_is_infinity(op2) && float32_is_zero(op1))) {
+        return float32_one_point_five;
+    }
+    op1 = float32_sub(float32_three, float32_mul(op1, op2, stat), stat);
+    return float32_div(op1, float32_two, stat);
+}
+
 #define DO_3OP(NAME, FUNC, TYPE) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
@@ -XXX,XX +XXX,XX @@ DO_3OP(gvec_fminnum_s, float32_minnum, float32)
 DO_3OP(gvec_recps_nf_h, float16_recps_nf, float16)
 DO_3OP(gvec_recps_nf_s, float32_recps_nf, float32)
 
+DO_3OP(gvec_rsqrts_nf_h, float16_rsqrts_nf, float16)
+DO_3OP(gvec_rsqrts_nf_s, float32_rsqrts_nf, float32)
+
 #ifdef TARGET_AARCH64
 
 DO_3OP(gvec_recps_h, helper_recpsf_f16, float16)
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(vfp_fcvt_f64_to_f16)(float64 a, void *fpstp, uint32_t ahp_mode)
     return r;
 }
 
-float32 HELPER(rsqrts_f32)(CPUARMState *env, float32 a, float32 b)
-{
-    float_status *s = &env->vfp.standard_fp_status;
-    float32 product;
-    if ((float32_is_infinity(a) && float32_is_zero_or_denormal(b)) ||
-        (float32_is_infinity(b) && float32_is_zero_or_denormal(a))) {
-        if (!(float32_is_zero(a) || float32_is_zero(b))) {
-            float_raise(float_flag_input_denormal, s);
-        }
-        return float32_one_point_five;
-    }
-    product = float32_mul(a, b, s);
-    return float32_div(float32_sub(float32_three, product, s), float32_two, s);
-}
-
 /* NEON helpers.  */
 
 /* Constants 256 and 512 are used in some helpers; we avoid relying on
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_3S_FP_GVEC(VMLS, gen_helper_gvec_fmls_s, gen_helper_gvec_fmls_h)
 DO_3S_FP_GVEC(VFMA, gen_helper_gvec_vfma_s, gen_helper_gvec_vfma_h)
 DO_3S_FP_GVEC(VFMS, gen_helper_gvec_vfms_s, gen_helper_gvec_vfms_h)
 DO_3S_FP_GVEC(VRECPS, gen_helper_gvec_recps_nf_s, gen_helper_gvec_recps_nf_h)
+DO_3S_FP_GVEC(VRSQRTS, gen_helper_gvec_rsqrts_nf_s, gen_helper_gvec_rsqrts_nf_h)
 
 WRAP_FP_GVEC(gen_VMAXNM_fp32_3s, FPST_STD, gen_helper_gvec_fmaxnum_s)
 WRAP_FP_GVEC(gen_VMAXNM_fp16_3s, FPST_STD_F16, gen_helper_gvec_fmaxnum_h)
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
     return do_3same(s, a, gen_VMINNM_fp32_3s);
 }
 
-WRAP_ENV_FN(gen_VRSQRTS_tramp, gen_helper_rsqrts_f32)
-
-static void gen_VRSQRTS_fp_3s(unsigned vece, uint32_t rd_ofs,
-                              uint32_t rn_ofs, uint32_t rm_ofs,
-                              uint32_t oprsz, uint32_t maxsz)
-{
-    static const GVecGen3 ops = { .fni4 = gen_VRSQRTS_tramp };
-    tcg_gen_gvec_3(rd_ofs, rn_ofs, rm_ofs, oprsz, maxsz, &ops);
-}
-
-static bool trans_VRSQRTS_fp_3s(DisasContext *s, arg_3same *a)
-{
-    if (a->size != 0) {
-        /* TODO fp16 support */
-        return false;
-    }
-
-    return do_3same(s, a, gen_VRSQRTS_fp_3s);
-}
-
 static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
 {
     /* FP operations handled pairwise 32 bits at a time */
-- 
2.20.1

Convert the Neon pairwise fp ops to use a single gvic-style
helper to do the full operation instead of one helper call
for each 32-bit part. This allows us to use the same
framework to implement the fp16.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-36-peter.maydell@linaro.org
---
 target/arm/helper.h             |  7 +++++
 target/arm/vec_helper.c         | 45 +++++++++++++++++++++++++++++++++
 target/arm/translate-neon.c.inc | 42 ++++++++++++------------------
 3 files changed, 68 insertions(+), 26 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fcmlas_idx, TCG_CALL_NO_RWG,
 DEF_HELPER_FLAGS_5(gvec_fcmlad, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(neon_paddh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_pmaxh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_pminh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_padds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_pmaxs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(neon_pmins, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_ABA(gvec_uaba_s, uint32_t)
 DO_ABA(gvec_uaba_d, uint64_t)
 
 #undef DO_ABA
+
+#define DO_NEON_PAIRWISE(NAME, OP)                                      \
+    void HELPER(NAME##s)(void *vd, void *vn, void *vm,                  \
+                         void *stat, uint32_t oprsz)                    \
+    {                                                                   \
+        float_status *fpst = stat;                                      \
+        float32 *d = vd;                                                \
+        float32 *n = vn;                                                \
+        float32 *m = vm;                                                \
+        float32 r0, r1;                                                 \
+                                                                        \
+        /* Read all inputs before writing outputs in case vm == vd */   \
+        r0 = float32_##OP(n[H4(0)], n[H4(1)], fpst);                    \
+        r1 = float32_##OP(m[H4(0)], m[H4(1)], fpst);                    \
+                                                                        \
+        d[H4(0)] = r0;                                                  \
+        d[H4(1)] = r1;                                                  \
+    }                                                                   \
+                                                                        \
+    void HELPER(NAME##h)(void *vd, void *vn, void *vm,                  \
+                         void *stat, uint32_t oprsz)                    \
+    {                                                                   \
+        float_status *fpst = stat;                                      \
+        float16 *d = vd;                                                \
+        float16 *n = vn;                                                \
+        float16 *m = vm;                                                \
+        float16 r0, r1, r2, r3;                                         \
+                                                                        \
+        /* Read all inputs before writing outputs in case vm == vd */   \
+        r0 = float16_##OP(n[H2(0)], n[H2(1)], fpst);                    \
+        r1 = float16_##OP(n[H2(2)], n[H2(3)], fpst);                    \
+        r2 = float16_##OP(m[H2(0)], m[H2(1)], fpst);                    \
+        r3 = float16_##OP(m[H2(2)], m[H2(3)], fpst);                    \
+                                                                        \
+        d[H4(0)] = r0;                                                  \
+        d[H4(1)] = r1;                                                  \
+        d[H4(2)] = r2;                                                  \
+        d[H4(3)] = r3;                                                  \
+    }
+
+DO_NEON_PAIRWISE(neon_padd, add)
+DO_NEON_PAIRWISE(neon_pmax, max)
+DO_NEON_PAIRWISE(neon_pmin, min)
+
+#undef DO_NEON_PAIRWISE
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMINNM_fp_3s(DisasContext *s, arg_3same *a)
     return do_3same(s, a, gen_VMINNM_fp32_3s);
 }
 
-static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
+static bool do_3same_fp_pair(DisasContext *s, arg_3same *a,
+                             gen_helper_gvec_3_ptr *fn)
 {
-    /* FP operations handled pairwise 32 bits at a time */
-    TCGv_i32 tmp, tmp2, tmp3;
+    /* FP pairwise operations */
     TCGv_ptr fpstatus;
 
     if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
@@ -XXX,XX +XXX,XX @@ static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
 
     assert(a->q == 0); /* enforced by decode patterns */
 
-    /*
-     * Note that we have to be careful not to clobber the source operands
-     * in the "vm == vd" case by storing the result of the first pass too
-     * early. Since Q is 0 there are always just two passes, so instead
-     * of a complicated loop over each pass we just unroll.
-     */
-    fpstatus = fpstatus_ptr(FPST_STD);
-    tmp = neon_load_reg(a->vn, 0);
-    tmp2 = neon_load_reg(a->vn, 1);
-    fn(tmp, tmp, tmp2, fpstatus);
-    tcg_temp_free_i32(tmp2);
 
-    tmp3 = neon_load_reg(a->vm, 0);
-    tmp2 = neon_load_reg(a->vm, 1);
-    fn(tmp3, tmp3, tmp2, fpstatus);
-    tcg_temp_free_i32(tmp2);
+    fpstatus = fpstatus_ptr(a->size != 0 ? FPST_STD_F16 : FPST_STD);
+    tcg_gen_gvec_3_ptr(vfp_reg_offset(1, a->vd),
+                       vfp_reg_offset(1, a->vn),
+                       vfp_reg_offset(1, a->vm),
+                       fpstatus, 8, 8, 0, fn);
     tcg_temp_free_ptr(fpstatus);
 
-    neon_store_reg(a->vd, 0, tmp);
-    neon_store_reg(a->vd, 1, tmp3);
     return true;
 }
 
@@ -XXX,XX +XXX,XX @@ static bool do_3same_fp_pair(DisasContext *s, arg_3same *a, VFPGen3OpSPFn *fn)
     static bool trans_##INSN##_fp_3s(DisasContext *s, arg_3same *a) \
     {                                                               \
         if (a->size != 0) {                                         \
-            /* TODO fp16 support */                                 \
-            return false;                                           \
+            if (!dc_isar_feature(aa32_fp16_arith, s)) {             \
+                return false;                                       \
+            }                                                       \
+            return do_3same_fp_pair(s, a, FUNC##h);                 \
         }                                                           \
-        return do_3same_fp_pair(s, a, FUNC);                        \
+        return do_3same_fp_pair(s, a, FUNC##s);                     \
     }
 
-DO_3S_FP_PAIR(VPADD, gen_helper_vfp_adds)
-DO_3S_FP_PAIR(VPMAX, gen_helper_vfp_maxs)
-DO_3S_FP_PAIR(VPMIN, gen_helper_vfp_mins)
+DO_3S_FP_PAIR(VPADD, gen_helper_neon_padd)
+DO_3S_FP_PAIR(VPMAX, gen_helper_neon_pmax)
+DO_3S_FP_PAIR(VPMIN, gen_helper_neon_pmin)
 
 static bool do_vector_2sh(DisasContext *s, arg_2reg_shift *a, GVecGen2iFn *fn)
 {
-- 
2.20.1

Convert the Neon float-integer VCVT insns to gvec, and use this
to implement fp16 support for them.

Note that unlike the VFP int<->fp16 VCVT insns we converted
earlier and which convert to/from a 32-bit integer, these
Neon insns convert to/from 16-bit integers. So we can use
the existing vfp conversion helpers for the f32<->u32/i32
case but need to provide our own for f16<->u16/i16.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-37-peter.maydell@linaro.org
---
 target/arm/helper.h             |  9 +++++++++
 target/arm/vec_helper.c         | 29 +++++++++++++++++++++++++++++
 target/arm/translate-neon.c.inc | 15 ++++-----------
 3 files changed, 42 insertions(+), 11 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(neon_padds, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(neon_pmaxs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_5(neon_pmins, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_sstoh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_sitos, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_ustoh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_uitos, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_tosszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_tosizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_touszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t float32_acgt(float32 op1, float32 op2, float_status *stat)
     return -float32_lt(float32_abs(op2), float32_abs(op1), stat);
 }
 
+static int16_t vfp_tosszh(float16 x, void *fpstp)
+{
+    float_status *fpst = fpstp;
+    if (float16_is_any_nan(x)) {
+        float_raise(float_flag_invalid, fpst);
+        return 0;
+    }
+    return float16_to_int16_round_to_zero(x, fpst);
+}
+
+static uint16_t vfp_touszh(float16 x, void *fpstp)
+{
+    float_status *fpst = fpstp;
+    if (float16_is_any_nan(x)) {
+        float_raise(float_flag_invalid, fpst);
+        return 0;
+    }
+    return float16_to_uint16_round_to_zero(x, fpst);
+}
+
 #define DO_2OP(NAME, FUNC, TYPE) \
 void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)  \
 {                                                                 \
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
 DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
 DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
 
+DO_2OP(gvec_sitos, helper_vfp_sitos, int32_t)
+DO_2OP(gvec_uitos, helper_vfp_uitos, uint32_t)
+DO_2OP(gvec_tosizs, helper_vfp_tosizs, float32)
+DO_2OP(gvec_touizs, helper_vfp_touizs, float32)
+DO_2OP(gvec_sstoh, int16_to_float16, int16_t)
+DO_2OP(gvec_ustoh, uint16_to_float16, uint16_t)
+DO_2OP(gvec_tosszh, vfp_tosszh, float16)
+DO_2OP(gvec_touszh, vfp_touszh, float16)
+
 #define WRAP_CMP0_FWD(FN, CMPOP, TYPE)                          \
     static TYPE TYPE##_##FN##0(TYPE op, float_status *stat)     \
     {                                                           \
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_2misc_fp(DisasContext *s, arg_2misc *a,
     return true;
 }
 
-#define DO_2MISC_FP(INSN, FUNC)                                 \
-    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
-    {                                                           \
-        return do_2misc_fp(s, a, FUNC);                         \
-    }
-
-DO_2MISC_FP(VCVT_FS, gen_helper_vfp_sitos)
-DO_2MISC_FP(VCVT_FU, gen_helper_vfp_uitos)
-DO_2MISC_FP(VCVT_SF, gen_helper_vfp_tosizs)
-DO_2MISC_FP(VCVT_UF, gen_helper_vfp_touizs)
-
 #define DO_2MISC_FP_VEC(INSN, HFUNC, SFUNC)                             \
     static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
                            uint32_t rm_ofs,                             \
@@ -XXX,XX +XXX,XX @@ DO_2MISC_FP_VEC(VCGE0_F, gen_helper_gvec_fcge0_h, gen_helper_gvec_fcge0_s)
 DO_2MISC_FP_VEC(VCEQ0_F, gen_helper_gvec_fceq0_h, gen_helper_gvec_fceq0_s)
 DO_2MISC_FP_VEC(VCLT0_F, gen_helper_gvec_fclt0_h, gen_helper_gvec_fclt0_s)
 DO_2MISC_FP_VEC(VCLE0_F, gen_helper_gvec_fcle0_h, gen_helper_gvec_fcle0_s)
+DO_2MISC_FP_VEC(VCVT_FS, gen_helper_gvec_sstoh, gen_helper_gvec_sitos)
+DO_2MISC_FP_VEC(VCVT_FU, gen_helper_gvec_ustoh, gen_helper_gvec_uitos)
+DO_2MISC_FP_VEC(VCVT_SF, gen_helper_gvec_tosszh, gen_helper_gvec_tosizs)
+DO_2MISC_FP_VEC(VCVT_UF, gen_helper_gvec_touszh, gen_helper_gvec_touizs)
 
 static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
 {
-- 
2.20.1

Convert the Neon VCVT float<->fixed-point insns to a
gvec style, in preparation for adding fp16 support.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-38-peter.maydell@linaro.org
---
 target/arm/helper.h             |  5 +++++
 target/arm/vec_helper.c         | 20 +++++++++++++++++++
 target/arm/translate-neon.c.inc | 35 +++++++++++++++++----------------
 3 files changed, 43 insertions(+), 17 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_tosizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_touszh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_touizs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vcvt_sf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_NEON_PAIRWISE(neon_pmax, max)
 DO_NEON_PAIRWISE(neon_pmin, min)
 
 #undef DO_NEON_PAIRWISE
+
+#define DO_VCVT_FIXED(NAME, FUNC, TYPE)                                 \
+    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
+    {                                                                   \
+        intptr_t i, oprsz = simd_oprsz(desc);                           \
+        int shift = simd_data(desc);                                    \
+        TYPE *d = vd, *n = vn;                                          \
+        float_status *fpst = stat;                                      \
+        for (i = 0; i < oprsz / sizeof(TYPE); i++) {                    \
+            d[i] = FUNC(n[i], shift, fpst);                             \
+        }                                                               \
+        clear_tail(d, oprsz, simd_maxsz(desc));                         \
+    }
+
+DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
+DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
+DO_VCVT_FIXED(gvec_vcvt_fs, helper_vfp_tosls_round_to_zero, uint32_t)
+DO_VCVT_FIXED(gvec_vcvt_fu, helper_vfp_touls_round_to_zero, uint32_t)
+
+#undef DO_VCVT_FIXED
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VSHLL_U_2sh(DisasContext *s, arg_2reg_shift *a)
 }
 
 static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
-                      NeonGenTwoSingleOpFn *fn)
+                      gen_helper_gvec_2_ptr *fn)
 {
     /* FP operations in 2-reg-and-shift group */
-    TCGv_i32 tmp, shiftv;
-    TCGv_ptr fpstatus;
-    int pass;
+    int vec_size = a->q ? 16 : 8;
+    int rd_ofs = neon_reg_offset(a->vd, 0);
+    int rm_ofs = neon_reg_offset(a->vm, 0);
+    TCGv_ptr fpst;
 
     if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
         return false;
     }
 
+    if (a->size != 0) {
+        if (!dc_isar_feature(aa32_fp16_arith, s)) {
+            return false;
+        }
+    }
+
     /* UNDEF accesses to D16-D31 if they don't exist. */
     if (!dc_isar_feature(aa32_simd_r32, s) &&
         ((a->vd | a->vm) & 0x10)) {
@@ -XXX,XX +XXX,XX @@ static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
         return true;
     }
 
-    fpstatus = fpstatus_ptr(FPST_STD);
-    shiftv = tcg_const_i32(a->shift);
-    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
-        tmp = neon_load_reg(a->vm, pass);
-        fn(tmp, tmp, shiftv, fpstatus);
-        neon_store_reg(a->vd, pass, tmp);
-    }
-    tcg_temp_free_ptr(fpstatus);
-    tcg_temp_free_i32(shiftv);
+    fpst = fpstatus_ptr(a->size ? FPST_STD_F16 : FPST_STD);
+    tcg_gen_gvec_2_ptr(rd_ofs, rm_ofs, fpst, vec_size, vec_size, a->shift, fn);
+    tcg_temp_free_ptr(fpst);
     return true;
 }
 
@@ -XXX,XX +XXX,XX @@ static bool do_fp_2sh(DisasContext *s, arg_2reg_shift *a,
         return do_fp_2sh(s, a, FUNC);                                   \
     }
 
-DO_FP_2SH(VCVT_SF, gen_helper_vfp_sltos)
-DO_FP_2SH(VCVT_UF, gen_helper_vfp_ultos)
-DO_FP_2SH(VCVT_FS, gen_helper_vfp_tosls_round_to_zero)
-DO_FP_2SH(VCVT_FU, gen_helper_vfp_touls_round_to_zero)
+DO_FP_2SH(VCVT_SF, gen_helper_gvec_vcvt_sf)
+DO_FP_2SH(VCVT_UF, gen_helper_gvec_vcvt_uf)
+DO_FP_2SH(VCVT_FS, gen_helper_gvec_vcvt_fs)
+DO_FP_2SH(VCVT_FU, gen_helper_gvec_vcvt_fu)
 
 static uint64_t asimd_imm_const(uint32_t imm, int cmode, int op)
 {
-- 
2.20.1

Implement fp16 for the Neon VCVT insns which convert between
float and fixed-point.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-39-peter.maydell@linaro.org
---
 target/arm/helper.h             | 5 +++++
 target/arm/neon-dp.decode       | 8 +++++++-
 target/arm/vec_helper.c         | 4 ++++
 target/arm/translate-neon.c.inc | 5 +++++
 4 files changed, 21 insertions(+), 1 deletion(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_uf, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_fs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_fu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vcvt_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/neon-dp.decode b/target/arm/neon-dp.decode
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/neon-dp.decode
+++ b/target/arm/neon-dp.decode
@@ -XXX,XX +XXX,XX @@ VMINNM_fp_3s     1111 001 1 0 . 1 . .... .... 1111 ... 1 .... @3same_fp
 # We use size=0 for fp32 and size=1 for fp16 to match the 3-same encodings.
 @2reg_vcvt       .... ... . . . 1 ..... .... .... . q:1 . . .... \
                  &2reg_shift vm=%vm_dp vd=%vd_dp size=0 shift=%neon_rshift_i5
+@2reg_vcvt_f16   .... ... . . . 11 .... .... .... . q:1 . . .... \
+                 &2reg_shift vm=%vm_dp vd=%vd_dp size=1 shift=%neon_rshift_i4
 
 VSHR_S_2sh       1111 001 0 1 . ...... .... 0000 . . . 1 .... @2reg_shr_d
 VSHR_S_2sh       1111 001 0 1 . ...... .... 0000 . . . 1 .... @2reg_shr_s
@@ -XXX,XX +XXX,XX @@ VSHLL_U_2sh      1111 001 1 1 . ...... .... 1010 . 0 . 1 .... @2reg_shll_h
 VSHLL_U_2sh      1111 001 1 1 . ...... .... 1010 . 0 . 1 .... @2reg_shll_b
 
 # VCVT fixed<->float conversions
-# TODO: FP16 fixed<->float conversions are opc==0b1100 and 0b1101
+VCVT_SH_2sh      1111 001 0 1 . ...... .... 1100 0 . . 1 .... @2reg_vcvt_f16
+VCVT_UH_2sh      1111 001 1 1 . ...... .... 1100 0 . . 1 .... @2reg_vcvt_f16
+VCVT_HS_2sh      1111 001 0 1 . ...... .... 1101 0 . . 1 .... @2reg_vcvt_f16
+VCVT_HU_2sh      1111 001 1 1 . ...... .... 1101 0 . . 1 .... @2reg_vcvt_f16
+
 VCVT_SF_2sh      1111 001 0 1 . ...... .... 1110 0 . . 1 .... @2reg_vcvt
 VCVT_UF_2sh      1111 001 1 1 . ...... .... 1110 0 . . 1 .... @2reg_vcvt
 VCVT_FS_2sh      1111 001 0 1 . ...... .... 1111 0 . . 1 .... @2reg_vcvt
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_sf, helper_vfp_sltos, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_uf, helper_vfp_ultos, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_fs, helper_vfp_tosls_round_to_zero, uint32_t)
 DO_VCVT_FIXED(gvec_vcvt_fu, helper_vfp_touls_round_to_zero, uint32_t)
+DO_VCVT_FIXED(gvec_vcvt_sh, helper_vfp_shtoh, uint16_t)
+DO_VCVT_FIXED(gvec_vcvt_uh, helper_vfp_uhtoh, uint16_t)
+DO_VCVT_FIXED(gvec_vcvt_hs, helper_vfp_toshh_round_to_zero, uint16_t)
+DO_VCVT_FIXED(gvec_vcvt_hu, helper_vfp_touhh_round_to_zero, uint16_t)
 
 #undef DO_VCVT_FIXED
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_FP_2SH(VCVT_UF, gen_helper_gvec_vcvt_uf)
 DO_FP_2SH(VCVT_FS, gen_helper_gvec_vcvt_fs)
 DO_FP_2SH(VCVT_FU, gen_helper_gvec_vcvt_fu)
 
+DO_FP_2SH(VCVT_SH, gen_helper_gvec_vcvt_sh)
+DO_FP_2SH(VCVT_UH, gen_helper_gvec_vcvt_uh)
+DO_FP_2SH(VCVT_HS, gen_helper_gvec_vcvt_hs)
+DO_FP_2SH(VCVT_HU, gen_helper_gvec_vcvt_hu)
+
 static uint64_t asimd_imm_const(uint32_t imm, int cmode, int op)
 {
     /*
-- 
2.20.1

Convert the Neon VCVT with-specified-rounding-mode instructions
to gvec, and use this to implement fp16 support for them.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-40-peter.maydell@linaro.org
---
 target/arm/helper.h             |   5 ++
 target/arm/vec_helper.c         |  23 +++++++
 target/arm/translate-neon.c.inc | 105 ++++++++++++--------------------
 3 files changed, 66 insertions(+), 67 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_hs, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_hu, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_ss, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_FIXED(gvec_vcvt_hs, helper_vfp_toshh_round_to_zero, uint16_t)
 DO_VCVT_FIXED(gvec_vcvt_hu, helper_vfp_touhh_round_to_zero, uint16_t)
 
 #undef DO_VCVT_FIXED
+
+#define DO_VCVT_RMODE(NAME, FUNC, TYPE)                                 \
+    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
+    {                                                                   \
+        float_status *fpst = stat;                                      \
+        intptr_t i, oprsz = simd_oprsz(desc);                           \
+        uint32_t rmode = simd_data(desc);                               \
+        uint32_t prev_rmode = get_float_rounding_mode(fpst);            \
+        TYPE *d = vd, *n = vn;                                          \
+        set_float_rounding_mode(rmode, fpst);                           \
+        for (i = 0; i < oprsz / sizeof(TYPE); i++) {                    \
+            d[i] = FUNC(n[i], 0, fpst);                                 \
+        }                                                               \
+        set_float_rounding_mode(prev_rmode, fpst);                      \
+        clear_tail(d, oprsz, simd_maxsz(desc));                         \
+    }
+
+DO_VCVT_RMODE(gvec_vcvt_rm_ss, helper_vfp_tosls, uint32_t)
+DO_VCVT_RMODE(gvec_vcvt_rm_us, helper_vfp_touls, uint32_t)
+DO_VCVT_RMODE(gvec_vcvt_rm_sh, helper_vfp_toshh, uint16_t)
+DO_VCVT_RMODE(gvec_vcvt_rm_uh, helper_vfp_touhh, uint16_t)
+
+#undef DO_VCVT_RMODE
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ DO_VRINT(VRINTZ, FPROUNDING_ZERO)
 DO_VRINT(VRINTM, FPROUNDING_NEGINF)
 DO_VRINT(VRINTP, FPROUNDING_POSINF)
 
-static bool do_vcvt(DisasContext *s, arg_2misc *a, int rmode, bool is_signed)
-{
-    /*
-     * Handle a VCVT* operation by iterating 32 bits at a time,
-     * with a specified rounding mode in operation.
-     */
-    int pass;
-    TCGv_ptr fpst;
-    TCGv_i32 tcg_rmode, tcg_shift;
-
-    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
-        !arm_dc_feature(s, ARM_FEATURE_V8)) {
-        return false;
+#define DO_VEC_RMODE(INSN, RMODE, OP)                                   \
+    static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
+                           uint32_t rm_ofs,                             \
+                           uint32_t oprsz, uint32_t maxsz)              \
+    {                                                                   \
+        static gen_helper_gvec_2_ptr * const fns[4] = {                 \
+            NULL,                                                       \
+            gen_helper_gvec_##OP##h,                                    \
+            gen_helper_gvec_##OP##s,                                    \
+            NULL,                                                       \
+        };                                                              \
+        TCGv_ptr fpst;                                                  \
+        fpst = fpstatus_ptr(vece == 1 ? FPST_STD_F16 : FPST_STD);       \
+        tcg_gen_gvec_2_ptr(rd_ofs, rm_ofs, fpst, oprsz, maxsz,          \
+                           arm_rmode_to_sf(RMODE), fns[vece]);          \
+        tcg_temp_free_ptr(fpst);                                        \
+    }                                                                   \
+    static bool trans_##INSN(DisasContext *s, arg_2misc *a)             \
+    {                                                                   \
+        if (!arm_dc_feature(s, ARM_FEATURE_V8)) {                       \
+            return false;                                               \
+        }                                                               \
+        if (a->size == MO_16) {                                         \
+            if (!dc_isar_feature(aa32_fp16_arith, s)) {                 \
+                return false;                                           \
+            }                                                           \
+        } else if (a->size != MO_32) {                                  \
+            return false;                                               \
+        }                                                               \
+        return do_2misc_vec(s, a, gen_##INSN);                          \
     }
 
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vm) & 0x10)) {
-        return false;
-    }
-
-    if (a->size != 2) {
-        /* TODO: FP16 will be the size == 1 case */
-        return false;
-    }
-
-    if ((a->vd | a->vm) & a->q) {
-        return false;
-    }
-
-    if (!vfp_access_check(s)) {
-        return true;
-    }
-
-    fpst = fpstatus_ptr(FPST_STD);
-    tcg_shift = tcg_const_i32(0);
-    tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rmode));
-    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
-    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
-        TCGv_i32 tmp = neon_load_reg(a->vm, pass);
-        if (is_signed) {
-            gen_helper_vfp_tosls(tmp, tmp, tcg_shift, fpst);
-        } else {
-            gen_helper_vfp_touls(tmp, tmp, tcg_shift, fpst);
-        }
-        neon_store_reg(a->vd, pass, tmp);
-    }
-    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
-    tcg_temp_free_i32(tcg_rmode);
-    tcg_temp_free_i32(tcg_shift);
-    tcg_temp_free_ptr(fpst);
-
-    return true;
-}
-
-#define DO_VCVT(INSN, RMODE, SIGNED)                            \
-    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
-    {                                                           \
-        return do_vcvt(s, a, RMODE, SIGNED);                    \
-    }
-
-DO_VCVT(VCVTAU, FPROUNDING_TIEAWAY, false)
-DO_VCVT(VCVTAS, FPROUNDING_TIEAWAY, true)
-DO_VCVT(VCVTNU, FPROUNDING_TIEEVEN, false)
-DO_VCVT(VCVTNS, FPROUNDING_TIEEVEN, true)
-DO_VCVT(VCVTPU, FPROUNDING_POSINF, false)
-DO_VCVT(VCVTPS, FPROUNDING_POSINF, true)
-DO_VCVT(VCVTMU, FPROUNDING_NEGINF, false)
-DO_VCVT(VCVTMS, FPROUNDING_NEGINF, true)
+DO_VEC_RMODE(VCVTAU, FPROUNDING_TIEAWAY, vcvt_rm_u)
+DO_VEC_RMODE(VCVTAS, FPROUNDING_TIEAWAY, vcvt_rm_s)
+DO_VEC_RMODE(VCVTNU, FPROUNDING_TIEEVEN, vcvt_rm_u)
+DO_VEC_RMODE(VCVTNS, FPROUNDING_TIEEVEN, vcvt_rm_s)
+DO_VEC_RMODE(VCVTPU, FPROUNDING_POSINF, vcvt_rm_u)
+DO_VEC_RMODE(VCVTPS, FPROUNDING_POSINF, vcvt_rm_s)
+DO_VEC_RMODE(VCVTMU, FPROUNDING_NEGINF, vcvt_rm_u)
+DO_VEC_RMODE(VCVTMS, FPROUNDING_NEGINF, vcvt_rm_s)
 
 static bool trans_VSWP(DisasContext *s, arg_2misc *a)
 {
-- 
2.20.1

Convert the Neon VRINT-with-specified-rounding-mode insns to gvec,
and use this to implement the fp16 versions.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-41-peter.maydell@linaro.org
---
 target/arm/helper.h             |  4 +-
 target/arm/vec_helper.c         | 21 +++++++++++
 target/arm/vfp_helper.c         | 17 ---------
 target/arm/translate-neon.c.inc | 67 +++------------------------------
 4 files changed, 30 insertions(+), 79 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(vfp_sqtoh, f16, i64, i32, ptr)
 DEF_HELPER_3(vfp_uqtoh, f16, i64, i32, ptr)
 
 DEF_HELPER_FLAGS_2(set_rmode, TCG_CALL_NO_RWG, i32, i32, ptr)
-DEF_HELPER_FLAGS_2(set_neon_rmode, TCG_CALL_NO_RWG, i32, i32, env)
 
 DEF_HELPER_FLAGS_3(vfp_fcvt_f16_to_f32, TCG_CALL_NO_RWG, f32, f16, ptr, i32)
 DEF_HELPER_FLAGS_3(vfp_fcvt_f32_to_f16, TCG_CALL_NO_RWG, f16, f32, ptr, i32)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_us, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_sh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vrint_rm_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vrint_rm_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_VCVT_RMODE(gvec_vcvt_rm_sh, helper_vfp_toshh, uint16_t)
 DO_VCVT_RMODE(gvec_vcvt_rm_uh, helper_vfp_touhh, uint16_t)
 
 #undef DO_VCVT_RMODE
+
+#define DO_VRINT_RMODE(NAME, FUNC, TYPE)                                \
+    void HELPER(NAME)(void *vd, void *vn, void *stat, uint32_t desc)    \
+    {                                                                   \
+        float_status *fpst = stat;                                      \
+        intptr_t i, oprsz = simd_oprsz(desc);                           \
+        uint32_t rmode = simd_data(desc);                               \
+        uint32_t prev_rmode = get_float_rounding_mode(fpst);            \
+        TYPE *d = vd, *n = vn;                                          \
+        set_float_rounding_mode(rmode, fpst);                           \
+        for (i = 0; i < oprsz / sizeof(TYPE); i++) {                    \
+            d[i] = FUNC(n[i], fpst);                                    \
+        }                                                               \
+        set_float_rounding_mode(prev_rmode, fpst);                      \
+        clear_tail(d, oprsz, simd_maxsz(desc));                         \
+    }
+
+DO_VRINT_RMODE(gvec_vrint_rm_h, helper_rinth, uint16_t)
+DO_VRINT_RMODE(gvec_vrint_rm_s, helper_rints, uint32_t)
+
+#undef DO_VRINT_RMODE
diff --git a/target/arm/vfp_helper.c b/target/arm/vfp_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vfp_helper.c
+++ b/target/arm/vfp_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(set_rmode)(uint32_t rmode, void *fpstp)
     return prev_rmode;
 }
 
-/* Set the current fp rounding mode in the standard fp status and return
- * the old one. This is for NEON instructions that need to change the
- * rounding mode but wish to use the standard FPSCR values for everything
- * else. Always set the rounding mode back to the correct value after
- * modifying it.
- * The argument is a softfloat float_round_ value.
- */
-uint32_t HELPER(set_neon_rmode)(uint32_t rmode, CPUARMState *env)
-{
-    float_status *fp_status = &env->vfp.standard_fp_status;
-
-    uint32_t prev_rmode = get_float_rounding_mode(fp_status);
-    set_float_rounding_mode(rmode, fp_status);
-
-    return prev_rmode;
-}
-
 /* Half precision conversions.  */
 float32 HELPER(vfp_fcvt_f16_to_f32)(uint32_t a, void *fpstp, uint32_t ahp_mode)
 {
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
     return do_2misc_fp(s, a, gen_helper_rints_exact);
 }
 
-static bool do_vrint(DisasContext *s, arg_2misc *a, int rmode)
-{
-    /*
-     * Handle a VRINT* operation by iterating 32 bits at a time,
-     * with a specified rounding mode in operation.
-     */
-    int pass;
-    TCGv_ptr fpst;
-    TCGv_i32 tcg_rmode;
-
-    if (!arm_dc_feature(s, ARM_FEATURE_NEON) ||
-        !arm_dc_feature(s, ARM_FEATURE_V8)) {
-        return false;
-    }
-
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vm) & 0x10)) {
-        return false;
-    }
-
-    if (a->size != 2) {
-        /* TODO: FP16 will be the size == 1 case */
-        return false;
-    }
-
-    if ((a->vd | a->vm) & a->q) {
-        return false;
-    }
-
-    if (!vfp_access_check(s)) {
-        return true;
-    }
-
-    fpst = fpstatus_ptr(FPST_STD);
-    tcg_rmode = tcg_const_i32(arm_rmode_to_sf(rmode));
-    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
-    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
-        TCGv_i32 tmp = neon_load_reg(a->vm, pass);
-        gen_helper_rints(tmp, tmp, fpst);
-        neon_store_reg(a->vd, pass, tmp);
-    }
-    gen_helper_set_neon_rmode(tcg_rmode, tcg_rmode, cpu_env);
-    tcg_temp_free_i32(tcg_rmode);
-    tcg_temp_free_ptr(fpst);
-
-    return true;
-}
-
-#define DO_VRINT(INSN, RMODE)                                   \
-    static bool trans_##INSN(DisasContext *s, arg_2misc *a)     \
-    {                                                           \
-        return do_vrint(s, a, RMODE);                           \
-    }
-
-DO_VRINT(VRINTN, FPROUNDING_TIEEVEN)
-DO_VRINT(VRINTA, FPROUNDING_TIEAWAY)
-DO_VRINT(VRINTZ, FPROUNDING_ZERO)
-DO_VRINT(VRINTM, FPROUNDING_NEGINF)
-DO_VRINT(VRINTP, FPROUNDING_POSINF)
-
 #define DO_VEC_RMODE(INSN, RMODE, OP)                                   \
     static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
                            uint32_t rm_ofs,                             \
@@ -XXX,XX +XXX,XX @@ DO_VEC_RMODE(VCVTPS, FPROUNDING_POSINF, vcvt_rm_s)
 DO_VEC_RMODE(VCVTMU, FPROUNDING_NEGINF, vcvt_rm_u)
 DO_VEC_RMODE(VCVTMS, FPROUNDING_NEGINF, vcvt_rm_s)
 
+DO_VEC_RMODE(VRINTN, FPROUNDING_TIEEVEN, vrint_rm_)
+DO_VEC_RMODE(VRINTA, FPROUNDING_TIEAWAY, vrint_rm_)
+DO_VEC_RMODE(VRINTZ, FPROUNDING_ZERO, vrint_rm_)
+DO_VEC_RMODE(VRINTM, FPROUNDING_NEGINF, vrint_rm_)
+DO_VEC_RMODE(VRINTP, FPROUNDING_POSINF, vrint_rm_)
+
 static bool trans_VSWP(DisasContext *s, arg_2misc *a)
 {
     TCGv_i64 rm, rd;
-- 
2.20.1

Convert the Neon VRINTX insn to use gvec, and use this to implement
fp16 support for it.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-42-peter.maydell@linaro.org
---
 target/arm/helper.h             |  3 +++
 target/arm/vec_helper.c         |  3 +++
 target/arm/translate-neon.c.inc | 45 +++------------------------------
 3 files changed, 9 insertions(+), 42 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(gvec_vcvt_rm_uh, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vrint_rm_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_vrint_rm_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_4(gvec_vrintx_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_4(gvec_vrintx_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_4(gvec_frecpe_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_4(gvec_frecpe_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
 DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
 DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
 
+DO_2OP(gvec_vrintx_h, float16_round_to_int, float16)
+DO_2OP(gvec_vrintx_s, float32_round_to_int, float32)
+
 DO_2OP(gvec_sitos, helper_vfp_sitos, int32_t)
 DO_2OP(gvec_uitos, helper_vfp_uitos, uint32_t)
 DO_2OP(gvec_tosizs, helper_vfp_tosizs, float32)
diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VQNEG(DisasContext *s, arg_2misc *a)
     return do_2misc(s, a, fn[a->size]);
 }
 
-static bool do_2misc_fp(DisasContext *s, arg_2misc *a,
-                        NeonGenOneSingleOpFn *fn)
-{
-    int pass;
-    TCGv_ptr fpst;
-
-    /* Handle a 2-reg-misc operation by iterating 32 bits at a time */
-    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
-        return false;
-    }
-
-    /* UNDEF accesses to D16-D31 if they don't exist. */
-    if (!dc_isar_feature(aa32_simd_r32, s) &&
-        ((a->vd | a->vm) & 0x10)) {
-        return false;
-    }
-
-    if (a->size != 2) {
-        /* TODO: FP16 will be the size == 1 case */
-        return false;
-    }
-
-    if ((a->vd | a->vm) & a->q) {
-        return false;
-    }
-
-    if (!vfp_access_check(s)) {
-        return true;
-    }
-
-    fpst = fpstatus_ptr(FPST_STD);
-    for (pass = 0; pass < (a->q ? 4 : 2); pass++) {
-        TCGv_i32 tmp = neon_load_reg(a->vm, pass);
-        fn(tmp, tmp, fpst);
-        neon_store_reg(a->vd, pass, tmp);
-    }
-    tcg_temp_free_ptr(fpst);
-
-    return true;
-}
-
 #define DO_2MISC_FP_VEC(INSN, HFUNC, SFUNC)                             \
     static void gen_##INSN(unsigned vece, uint32_t rd_ofs,              \
                            uint32_t rm_ofs,                             \
@@ -XXX,XX +XXX,XX @@ DO_2MISC_FP_VEC(VCVT_FU, gen_helper_gvec_ustoh, gen_helper_gvec_uitos)
 DO_2MISC_FP_VEC(VCVT_SF, gen_helper_gvec_tosszh, gen_helper_gvec_tosizs)
 DO_2MISC_FP_VEC(VCVT_UF, gen_helper_gvec_touszh, gen_helper_gvec_touizs)
 
+DO_2MISC_FP_VEC(VRINTX_impl, gen_helper_gvec_vrintx_h, gen_helper_gvec_vrintx_s)
+
 static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
 {
     if (!arm_dc_feature(s, ARM_FEATURE_V8)) {
         return false;
     }
-    return do_2misc_fp(s, a, gen_helper_rints_exact);
+    return trans_VRINTX_impl(s, a);
 }
 
 #define DO_VEC_RMODE(INSN, RMODE, OP)                                   \
-- 
2.20.1

In the gvec helper functions for indexed operations, for AArch32
Neon the oprsz (total size of the vector) can be less than 16 bytes
if the operation is on a D reg. Since the inner loop in these
helpers always goes from 0 to segment, we must clamp it based
on oprsz to avoid processing a full 16 byte segment when asked to
handle an 8 byte wide vector.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-43-peter.maydell@linaro.org
---
 target/arm/vec_helper.c | 12 ++++++++----
 1 file changed, 8 insertions(+), 4 deletions(-)

diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_MULADD(gvec_vfms_s, float32_mulsub_f, float32)
 #define DO_MUL_IDX(NAME, TYPE, H) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, uint32_t desc) \
 {                                                                          \
-    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
     intptr_t idx = simd_data(desc);                                        \
     TYPE *d = vd, *n = vn, *m = vm;                                        \
     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
@@ -XXX,XX +XXX,XX @@ DO_MUL_IDX(gvec_mul_idx_d, uint64_t, )
 #define DO_MLA_IDX(NAME, TYPE, OP, H) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *va, uint32_t desc)   \
 {                                                                          \
-    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
     intptr_t idx = simd_data(desc);                                        \
     TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
@@ -XXX,XX +XXX,XX @@ DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -,   )
 #define DO_FMUL_IDX(NAME, TYPE, H) \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
-    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
     intptr_t idx = simd_data(desc);                                        \
     TYPE *d = vd, *n = vn, *m = vm;                                        \
     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
@@ -XXX,XX +XXX,XX @@ DO_FMUL_IDX(gvec_fmul_idx_d, float64, )
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *va,                  \
                   void *stat, uint32_t desc)                               \
 {                                                                          \
-    intptr_t i, j, oprsz = simd_oprsz(desc), segment = 16 / sizeof(TYPE);  \
+    intptr_t i, j, oprsz = simd_oprsz(desc);                               \
+    intptr_t segment = MIN(16, oprsz) / sizeof(TYPE);                      \
     TYPE op1_neg = extract32(desc, SIMD_DATA_SHIFT, 1);                    \
     intptr_t idx = desc >> (SIMD_DATA_SHIFT + 1);                          \
     TYPE *d = vd, *n = vn, *m = vm, *a = va;                               \
-- 
2.20.1

Add gvec helpers for doing Neon-style indexed non-fused fp
multiply-and-accumulate operations.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20200828183354.27913-44-peter.maydell@linaro.org
---
 target/arm/helper.h     | 10 ++++++++++
 target/arm/vec_helper.c | 27 ++++++++++++++++++++++-----
 2 files changed, 32 insertions(+), 5 deletions(-)

diff --git a/target/arm/helper.h b/target/arm/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper.h
+++ b/target/arm/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(gvec_fmul_idx_s, TCG_CALL_NO_RWG,
 DEF_HELPER_FLAGS_5(gvec_fmul_idx_d, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, i32)
 
+DEF_HELPER_FLAGS_5(gvec_fmla_nf_idx_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fmla_nf_idx_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
+DEF_HELPER_FLAGS_5(gvec_fmls_nf_idx_h, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+DEF_HELPER_FLAGS_5(gvec_fmls_nf_idx_s, TCG_CALL_NO_RWG,
+                   void, ptr, ptr, ptr, ptr, i32)
+
 DEF_HELPER_FLAGS_6(gvec_fmla_idx_h, TCG_CALL_NO_RWG,
                    void, ptr, ptr, ptr, ptr, ptr, i32)
 DEF_HELPER_FLAGS_6(gvec_fmla_idx_s, TCG_CALL_NO_RWG,
diff --git a/target/arm/vec_helper.c b/target/arm/vec_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/vec_helper.c
+++ b/target/arm/vec_helper.c
@@ -XXX,XX +XXX,XX @@ DO_MLA_IDX(gvec_mls_idx_d, uint64_t, -,   )
 
 #undef DO_MLA_IDX
 
-#define DO_FMUL_IDX(NAME, TYPE, H) \
+#define DO_FMUL_IDX(NAME, ADD, TYPE, H)                                    \
 void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
 {                                                                          \
     intptr_t i, j, oprsz = simd_oprsz(desc);                               \
@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *vn, void *vm, void *stat, uint32_t desc) \
     for (i = 0; i < oprsz / sizeof(TYPE); i += segment) {                  \
         TYPE mm = m[H(i + idx)];                                           \
         for (j = 0; j < segment; j++) {                                    \
-            d[i + j] = TYPE##_mul(n[i + j], mm, stat);                     \
+            d[i + j] = TYPE##_##ADD(d[i + j],                              \
+                                    TYPE##_mul(n[i + j], mm, stat), stat); \
         }                                                                  \
     }                                                                      \
     clear_tail(d, oprsz, simd_maxsz(desc));                                \
 }
 
-DO_FMUL_IDX(gvec_fmul_idx_h, float16, H2)
-DO_FMUL_IDX(gvec_fmul_idx_s, float32, H4)
-DO_FMUL_IDX(gvec_fmul_idx_d, float64, )
+#define float16_nop(N, M, S) (M)
+#define float32_nop(N, M, S) (M)
+#define float64_nop(N, M, S) (M)
 
+DO_FMUL_IDX(gvec_fmul_idx_h, nop, float16, H2)
+DO_FMUL_IDX(gvec_fmul_idx_s, nop, float32, H4)
+DO_FMUL_IDX(gvec_fmul_idx_d, nop, float64, )
+
+/*
+ * Non-fused multiply-accumulate operations, for Neon. NB that unlike
+ * the fused ops below they assume accumulate both from and into Vd.
+ */
+DO_FMUL_IDX(gvec_fmla_nf_idx_h, add, float16, H2)
+DO_FMUL_IDX(gvec_fmla_nf_idx_s, add, float32, H4)
+DO_FMUL_IDX(gvec_fmls_nf_idx_h, sub, float16, H2)
+DO_FMUL_IDX(gvec_fmls_nf_idx_s, sub, float32, H4)
+
+#undef float16_nop
+#undef float32_nop
+#undef float64_nop
 #undef DO_FMUL_IDX
 
 #define DO_FMLA_IDX(NAME, TYPE, H)                                         \
-- 
2.20.1

Convert the Neon floating-point VMUL, VMLA and VMLS to use gvec,
and use this to implement fp16 support.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-45-peter.maydell@linaro.org
---
 target/arm/translate-neon.c.inc | 114 ++++++++++++++++----------------
 1 file changed, 57 insertions(+), 57 deletions(-)

diff --git a/target/arm/translate-neon.c.inc b/target/arm/translate-neon.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-neon.c.inc
+++ b/target/arm/translate-neon.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_VMLS_2sc(DisasContext *s, arg_2scalar *a)
     return do_2scalar(s, a, opfn[a->size], accfn[a->size]);
 }
 
-/*
- * Rather than have a float-specific version of do_2scalar just for
- * three insns, we wrap a NeonGenTwoSingleOpFn to turn it into
- * a NeonGenTwoOpFn.
- */
-#define WRAP_FP_FN(WRAPNAME, FUNC)                              \
-    static void WRAPNAME(TCGv_i32 rd, TCGv_i32 rn, TCGv_i32 rm) \
-    {                                                           \
-        TCGv_ptr fpstatus = fpstatus_ptr(FPST_STD);             \
-        FUNC(rd, rn, rm, fpstatus);                             \
-        tcg_temp_free_ptr(fpstatus);                            \
+static bool do_2scalar_fp_vec(DisasContext *s, arg_2scalar *a,
+                              gen_helper_gvec_3_ptr *fn)
+{
+    /* Two registers and a scalar, using gvec */
+    int vec_size = a->q ? 16 : 8;
+    int rd_ofs = neon_reg_offset(a->vd, 0);
+    int rn_ofs = neon_reg_offset(a->vn, 0);
+    int rm_ofs;
+    int idx;
+    TCGv_ptr fpstatus;
+
+    if (!arm_dc_feature(s, ARM_FEATURE_NEON)) {
+        return false;
     }
 
-WRAP_FP_FN(gen_VMUL_F_mul, gen_helper_vfp_muls)
-WRAP_FP_FN(gen_VMUL_F_add, gen_helper_vfp_adds)
-WRAP_FP_FN(gen_VMUL_F_sub, gen_helper_vfp_subs)
+    /* UNDEF accesses to D16-D31 if they don't exist. */
+    if (!dc_isar_feature(aa32_simd_r32, s) &&
+        ((a->vd | a->vn | a->vm) & 0x10)) {
+        return false;
+    }
 
-static bool trans_VMUL_F_2sc(DisasContext *s, arg_2scalar *a)
-{
-    static NeonGenTwoOpFn * const opfn[] = {
-        NULL,
-        NULL, /* TODO: fp16 support */
-        gen_VMUL_F_mul,
-        NULL,
-    };
+    if (!fn) {
+        /* Bad size (including size == 3, which is a different insn group) */
+        return false;
+    }
 
-    return do_2scalar(s, a, opfn[a->size], NULL);
+    if (a->q && ((a->vd | a->vn) & 1)) {
+        return false;
+    }
+
+    if (!vfp_access_check(s)) {
+        return true;
+    }
+
+    /* a->vm is M:Vm, which encodes both register and index */
+    idx = extract32(a->vm, a->size + 2, 2);
+    a->vm = extract32(a->vm, 0, a->size + 2);
+    rm_ofs = neon_reg_offset(a->vm, 0);
+
+    fpstatus = fpstatus_ptr(a->size == 1 ? FPST_STD_F16 : FPST_STD);
+    tcg_gen_gvec_3_ptr(rd_ofs, rn_ofs, rm_ofs, fpstatus,
+                       vec_size, vec_size, idx, fn);
+    tcg_temp_free_ptr(fpstatus);
+    return true;
 }
 
-static bool trans_VMLA_F_2sc(DisasContext *s, arg_2scalar *a)
-{
-    static NeonGenTwoOpFn * const opfn[] = {
-        NULL,
-        NULL, /* TODO: fp16 support */
-        gen_VMUL_F_mul,
-        NULL,
-    };
-    static NeonGenTwoOpFn * const accfn[] = {
-        NULL,
-        NULL, /* TODO: fp16 support */
-        gen_VMUL_F_add,
-        NULL,
-    };
+#define DO_VMUL_F_2sc(NAME, FUNC)                                       \
+    static bool trans_##NAME##_F_2sc(DisasContext *s, arg_2scalar *a)   \
+    {                                                                   \
+        static gen_helper_gvec_3_ptr * const opfn[] = {                 \
+            NULL,                                                       \
+            gen_helper_##FUNC##_h,                                      \
+            gen_helper_##FUNC##_s,                                      \
+            NULL,                                                       \
+        };                                                              \
+        if (a->size == MO_16 && !dc_isar_feature(aa32_fp16_arith, s)) { \
+            return false;                                               \
+        }                                                               \
+        return do_2scalar_fp_vec(s, a, opfn[a->size]);                  \
+    }
 
-    return do_2scalar(s, a, opfn[a->size], accfn[a->size]);
-}
-
-static bool trans_VMLS_F_2sc(DisasContext *s, arg_2scalar *a)
-{
-    static NeonGenTwoOpFn * const opfn[] = {
-        NULL,
-        NULL, /* TODO: fp16 support */
-        gen_VMUL_F_mul,
-        NULL,
-    };
-    static NeonGenTwoOpFn * const accfn[] = {
-        NULL,
-        NULL, /* TODO: fp16 support */
-        gen_VMUL_F_sub,
-        NULL,
-    };
-
-    return do_2scalar(s, a, opfn[a->size], accfn[a->size]);
-}
+DO_VMUL_F_2sc(VMUL, gvec_fmul_idx)
+DO_VMUL_F_2sc(VMLA, gvec_fmla_nf_idx)
+DO_VMUL_F_2sc(VMLS, gvec_fmls_nf_idx)
 
 WRAP_ENV_FN(gen_VQDMULH_16, gen_helper_neon_qdmulh_s16)
 WRAP_ENV_FN(gen_VQDMULH_32, gen_helper_neon_qdmulh_s32)
-- 
2.20.1

Set the MVFR1 ID register FPHP and SIMDHP fields to indicate
that our "-cpu max" has v8.2-FP16.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20200828183354.27913-46-peter.maydell@linaro.org
---
 target/arm/cpu.c   |  3 ++-
 target/arm/cpu64.c | 10 ++++------
 2 files changed, 6 insertions(+), 7 deletions(-)

diff --git a/target/arm/cpu.c b/target/arm/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.c
+++ b/target/arm/cpu.c
@@ -XXX,XX +XXX,XX @@ static void arm_max_initfn(Object *obj)
             cpu->isar.id_isar6 = t;
 
             t = cpu->isar.mvfr1;
-            t = FIELD_DP32(t, MVFR1, FPHP, 2);     /* v8.0 FP support */
+            t = FIELD_DP32(t, MVFR1, FPHP, 3);     /* v8.2-FP16 */
+            t = FIELD_DP32(t, MVFR1, SIMDHP, 2);   /* v8.2-FP16 */
             cpu->isar.mvfr1 = t;
 
             t = cpu->isar.mvfr2;
diff --git a/target/arm/cpu64.c b/target/arm/cpu64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu64.c
+++ b/target/arm/cpu64.c
@@ -XXX,XX +XXX,XX @@ static void aarch64_max_initfn(Object *obj)
         u = FIELD_DP32(u, ID_DFR0, PERFMON, 5); /* v8.4-PMU */
         cpu->isar.id_dfr0 = u;
 
-        /*
-         * FIXME: We do not yet support ARMv8.2-fp16 for AArch32 yet,
-         * so do not set MVFR1.FPHP.  Strictly speaking this is not legal,
-         * but it is also not legal to enable SVE without support for FP16,
-         * and enabling SVE in system mode is more useful in the short term.
-         */
+        u = cpu->isar.mvfr1;
+        u = FIELD_DP32(u, MVFR1, FPHP, 3);      /* v8.2-FP16 */
+        u = FIELD_DP32(u, MVFR1, SIMDHP, 2);    /* v8.2-FP16 */
+        cpu->isar.mvfr1 = u;
 
 #ifdef CONFIG_USER_ONLY
         /* For usermode -cpu max we can use a larger and more efficient DCZ
-- 
2.20.1

From: Leif Lindholm <leif@nuviainc.com>

The sbsa-ref platform uses a minimal device tree to pass amount of memory
as well as number of cpus to the firmware. However, when dumping that
minimal dtb (with -M sbsa-virt,dumpdtb=<file>), the resulting blob
generates a warning when decompiled by dtc due to lack of reg property.

Add a simple reg property per cpu, representing a 64-bit MPIDR_EL1.

This also ends up being cleaner than having the firmware calculating its
own IDs for generating APCI.

Signed-off-by: Leif Lindholm <leif@nuviainc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20200827124335.30586-1-leif@nuviainc.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/sbsa-ref.c | 29 +++++++++++++++++++++++------
 1 file changed, 23 insertions(+), 6 deletions(-)

diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sbsa-ref.c
+++ b/hw/arm/sbsa-ref.c
@@ -XXX,XX +XXX,XX @@ static const int sbsa_ref_irqmap[] = {
     [SBSA_EHCI] = 11,
 };
 
+static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
+{
+    uint8_t clustersz = ARM_DEFAULT_CPUS_PER_CLUSTER;
+    return arm_cpu_mp_affinity(idx, clustersz);
+}
+
 /*
  * Firmware on this machine only uses ACPI table to load OS, these limited
  * device tree nodes are just to let firmware know the info which varies from
@@ -XXX,XX +XXX,XX @@ static void create_fdt(SBSAMachineState *sms)
         g_free(matrix);
     }
 
+    /*
+     * From Documentation/devicetree/bindings/arm/cpus.yaml
+     *  On ARM v8 64-bit systems this property is required
+     *    and matches the MPIDR_EL1 register affinity bits.
+     *
+     *    * If cpus node's #address-cells property is set to 2
+     *
+     *      The first reg cell bits [7:0] must be set to
+     *      bits [39:32] of MPIDR_EL1.
+     *
+     *      The second reg cell bits [23:0] must be set to
+     *      bits [23:0] of MPIDR_EL1.
+     */
     qemu_fdt_add_subnode(sms->fdt, "/cpus");
+    qemu_fdt_setprop_cell(sms->fdt, "/cpus", "#address-cells", 2);
+    qemu_fdt_setprop_cell(sms->fdt, "/cpus", "#size-cells", 0x0);
 
     for (cpu = sms->smp_cpus - 1; cpu >= 0; cpu--) {
         char *nodename = g_strdup_printf("/cpus/cpu@%d", cpu);
         ARMCPU *armcpu = ARM_CPU(qemu_get_cpu(cpu));
         CPUState *cs = CPU(armcpu);
+        uint64_t mpidr = sbsa_ref_cpu_mp_affinity(sms, cpu);
 
         qemu_fdt_add_subnode(sms->fdt, nodename);
+        qemu_fdt_setprop_u64(sms->fdt, nodename, "reg", mpidr);
 
         if (ms->possible_cpus->cpus[cs->cpu_index].props.has_node_id) {
             qemu_fdt_setprop_cell(sms->fdt, nodename, "numa-node-id",
@@ -XXX,XX +XXX,XX @@ static void sbsa_ref_init(MachineState *machine)
     arm_load_kernel(ARM_CPU(first_cpu), machine, &sms->bootinfo);
 }
 
-static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
-{
-    uint8_t clustersz = ARM_DEFAULT_CPUS_PER_CLUSTER;
-    return arm_cpu_mp_affinity(idx, clustersz);
-}
-
 static const CPUArchIdList *sbsa_ref_possible_cpu_arch_ids(MachineState *ms)
 {
     unsigned int max_cpus = ms->smp.max_cpus;
-- 
2.20.1

From: Graeme Gregory <graeme@nuviainc.com>

A difference between sbsa platform and the virt platform is PSCI is
handled by ARM-TF in the sbsa platform. This means that the PSCI code
there needs to communicate some of the platform power changes down
to the qemu code for things like shutdown/reset control.

Space has been left to extend the EC if we find other use cases in
future where ARM-TF and qemu need to communicate.

Signed-off-by: Graeme Gregory <graeme@nuviainc.com>
Reviewed-by: Leif Lindholm <leif@nuviainc.com>
Tested-by: Leif Lindholm <leif@nuviainc.com>
Message-id: 20200826141952.136164-2-graeme@nuviainc.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/sbsa_ec.c   | 98 +++++++++++++++++++++++++++++++++++++++++++++
 hw/misc/meson.build |  2 +
 2 files changed, 100 insertions(+)
 create mode 100644 hw/misc/sbsa_ec.c

diff --git a/hw/misc/sbsa_ec.c b/hw/misc/sbsa_ec.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/misc/sbsa_ec.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * ARM SBSA Reference Platform Embedded Controller
+ *
+ * A device to allow PSCI running in the secure side of sbsa-ref machine
+ * to communicate platform power states to qemu.
+ *
+ * Copyright (c) 2020 Nuvia Inc
+ * Written by Graeme Gregory <graeme@nuviainc.com>
+ *
+ * SPDX-License-Identifer: GPL-2.0-or-later
+ */
+
+#include "qemu/osdep.h"
+#include "qemu-common.h"
+#include "qemu/log.h"
+#include "hw/sysbus.h"
+#include "sysemu/runstate.h"
+
+typedef struct {
+    SysBusDevice parent_obj;
+    MemoryRegion iomem;
+} SECUREECState;
+
+#define TYPE_SBSA_EC      "sbsa-ec"
+#define SECURE_EC(obj) OBJECT_CHECK(SECUREECState, (obj), TYPE_SBSA_EC)
+
+enum sbsa_ec_powerstates {
+    SBSA_EC_CMD_POWEROFF = 0x01,
+    SBSA_EC_CMD_REBOOT = 0x02,
+};
+
+static uint64_t sbsa_ec_read(void *opaque, hwaddr offset, unsigned size)
+{
+    /* No use for this currently */
+    qemu_log_mask(LOG_GUEST_ERROR, "sbsa-ec: no readable registers");
+    return 0;
+}
+
+static void sbsa_ec_write(void *opaque, hwaddr offset,
+                     uint64_t value, unsigned size)
+{
+    if (offset == 0) { /* PSCI machine power command register */
+        switch (value) {
+        case SBSA_EC_CMD_POWEROFF:
+            qemu_system_shutdown_request(SHUTDOWN_CAUSE_GUEST_SHUTDOWN);
+            break;
+        case SBSA_EC_CMD_REBOOT:
+            qemu_system_reset_request(SHUTDOWN_CAUSE_GUEST_RESET);
+            break;
+        default:
+            qemu_log_mask(LOG_GUEST_ERROR,
+                          "sbsa-ec: unknown power command");
+        }
+    } else {
+        qemu_log_mask(LOG_GUEST_ERROR, "sbsa-ec: unknown EC register");
+    }
+}
+
+static const MemoryRegionOps sbsa_ec_ops = {
+    .read = sbsa_ec_read,
+    .write = sbsa_ec_write,
+    .endianness = DEVICE_NATIVE_ENDIAN,
+    .valid.min_access_size = 4,
+    .valid.max_access_size = 4,
+};
+
+static void sbsa_ec_init(Object *obj)
+{
+    SECUREECState *s = SECURE_EC(obj);
+    SysBusDevice *dev = SYS_BUS_DEVICE(obj);
+
+    memory_region_init_io(&s->iomem, obj, &sbsa_ec_ops, s, "sbsa-ec",
+                          0x1000);
+    sysbus_init_mmio(dev, &s->iomem);
+}
+
+static void sbsa_ec_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    /* No vmstate or reset required: device has no internal state */
+    dc->user_creatable = false;
+}
+
+static const TypeInfo sbsa_ec_info = {
+    .name          = TYPE_SBSA_EC,
+    .parent        = TYPE_SYS_BUS_DEVICE,
+    .instance_size = sizeof(SECUREECState),
+    .instance_init = sbsa_ec_init,
+    .class_init    = sbsa_ec_class_init,
+};
+
+static void sbsa_ec_register_type(void)
+{
+    type_register_static(&sbsa_ec_info);
+}
+
+type_init(sbsa_ec_register_type);
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ specific_ss.add(when: 'CONFIG_MAC_VIA', if_true: files('mac_via.c'))
 
 specific_ss.add(when: 'CONFIG_MIPS_CPS', if_true: files('mips_cmgcr.c', 'mips_cpc.c'))
 specific_ss.add(when: 'CONFIG_MIPS_ITU', if_true: files('mips_itu.c'))
+
+specific_ss.add(when: 'CONFIG_SBSA_REF', if_true: files('sbsa_ec.c'))
-- 
2.20.1

From: Graeme Gregory <graeme@nuviainc.com>

Add the previously created sbsa-ec device to the sbsa-ref machine in
secure memory so the PSCI implementation in ARM-TF can access it, but
not expose it to non secure firmware or OS except by via ARM-TF.

Signed-off-by: Graeme Gregory <graeme@nuviainc.com>
Reviewed-by: Leif Lindholm <leif@nuviainc.com>
Tested-by: Leif Lindholm <leif@nuviainc.com>
Message-id: 20200826141952.136164-3-graeme@nuviainc.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/sbsa-ref.c | 14 ++++++++++++++
 1 file changed, 14 insertions(+)

diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sbsa-ref.c
+++ b/hw/arm/sbsa-ref.c
@@ -XXX,XX +XXX,XX @@ enum {
     SBSA_CPUPERIPHS,
     SBSA_GIC_DIST,
     SBSA_GIC_REDIST,
+    SBSA_SECURE_EC,
     SBSA_SMMU,
     SBSA_UART,
     SBSA_RTC,
@@ -XXX,XX +XXX,XX @@ static const MemMapEntry sbsa_ref_memmap[] = {
     [SBSA_CPUPERIPHS] =         { 0x40000000, 0x00040000 },
     [SBSA_GIC_DIST] =           { 0x40060000, 0x00010000 },
     [SBSA_GIC_REDIST] =         { 0x40080000, 0x04000000 },
+    [SBSA_SECURE_EC] =          { 0x50000000, 0x00001000 },
     [SBSA_UART] =               { 0x60000000, 0x00001000 },
     [SBSA_RTC] =                { 0x60010000, 0x00001000 },
     [SBSA_GPIO] =               { 0x60020000, 0x00001000 },
@@ -XXX,XX +XXX,XX @@ static void *sbsa_ref_dtb(const struct arm_boot_info *binfo, int *fdt_size)
     return board->fdt;
 }
 
+static void create_secure_ec(MemoryRegion *mem)
+{
+    hwaddr base = sbsa_ref_memmap[SBSA_SECURE_EC].base;
+    DeviceState *dev = qdev_new("sbsa-ec");
+    SysBusDevice *s = SYS_BUS_DEVICE(dev);
+
+    memory_region_add_subregion(mem, base,
+                                sysbus_mmio_get_region(s, 0));
+}
+
 static void sbsa_ref_init(MachineState *machine)
 {
     unsigned int smp_cpus = machine->smp.cpus;
@@ -XXX,XX +XXX,XX @@ static void sbsa_ref_init(MachineState *machine)
 
     create_pcie(sms);
 
+    create_secure_ec(secure_sysmem);
+
     sms->bootinfo.ram_size = machine->ram_size;
     sms->bootinfo.nb_cpus = smp_cpus;
     sms->bootinfo.board_id = -1;
-- 
2.20.1

Last minute pullreq for arm related patches; quite large because
there were several series that only just made it through code review
in time.

thanks
-- PMM

The following changes since commit 091e3e3dbc499d84c004e1c50bc9870af37f6e99:

Merge remote-tracking branch 'remotes/ericb/tags/pull-bitmaps-2020-10-26' into staging (2020-10-26 22:36:35 +0000)

are available in the Git repository at:

https://git.linaro.org/people/pmaydell/qemu-arm.git tags/pull-target-arm-20201027-1

for you to fetch changes up to 32bd322a0134ed89db00f2b9b3894982db3dedcb:

hw/timer/armv7m_systick: Rewrite to use ptimers (2020-10-27 11:15:31 +0000)

----------------------------------------------------------------
target-arm queue:
 * raspi: add model of cprman clock manager
 * sbsa-ref: add an SBSA generic watchdog device
 * arm/trace: Fix hex printing
 * raspi: Add models of Pi 3 model A+, Pi Zero and Pi A+
 * hw/arm/smmuv3: Set the restoration priority of the vSMMUv3 explicitly
 * Nuvoton NPCM7xx: Add USB, RNG, GPIO and watchdog support
 * hw/arm: fix min_cpus for xlnx-versal-virt platform
 * hw/arm/highbank: Silence warnings about missing fallthrough statements
 * linux-user: Support Aarch64 BTI
 * Armv7M systick: fix corner case bugs by rewriting to use ptimer

----------------------------------------------------------------
Dr. David Alan Gilbert (1):
      arm/trace: Fix hex printing

Hao Wu (1):
      hw/timer: Adding watchdog for NPCM7XX Timer.

Havard Skinnemoen (4):
      Move npcm7xx_timer_reached_zero call out of npcm7xx_timer_pause
      hw/misc: Add npcm7xx random number generator
      hw/arm/npcm7xx: Add EHCI and OHCI controllers
      hw/gpio: Add GPIO model for Nuvoton NPCM7xx

Luc Michel (14):
      hw/core/clock: provide the VMSTATE_ARRAY_CLOCK macro
      hw/core/clock: trace clock values in Hz instead of ns
      hw/arm/raspi: fix CPRMAN base address
      hw/arm/raspi: add a skeleton implementation of the CPRMAN
      hw/misc/bcm2835_cprman: add a PLL skeleton implementation
      hw/misc/bcm2835_cprman: implement PLLs behaviour
      hw/misc/bcm2835_cprman: add a PLL channel skeleton implementation
      hw/misc/bcm2835_cprman: implement PLL channels behaviour
      hw/misc/bcm2835_cprman: add a clock mux skeleton implementation
      hw/misc/bcm2835_cprman: implement clock mux behaviour
      hw/misc/bcm2835_cprman: add the DSI0HSCK multiplexer
      hw/misc/bcm2835_cprman: add sane reset values to the registers
      hw/char/pl011: add a clock input
      hw/arm/bcm2835_peripherals: connect the UART clock

Pavel Dovgalyuk (1):
      hw/arm: fix min_cpus for xlnx-versal-virt platform

Peter Maydell (2):
      hw/core/ptimer: Support ptimer being disabled by timer callback
      hw/timer/armv7m_systick: Rewrite to use ptimers

Philippe Mathieu-Daudé (10):
      linux-user/elfload: Avoid leaking interp_name using GLib memory API
      hw/arm/bcm2836: Restrict BCM283XInfo declaration to C source
      hw/arm/bcm2836: QOM'ify more by adding class_init() to each SoC type
      hw/arm/bcm2836: Introduce BCM283XClass::core_count
      hw/arm/bcm2836: Only provide "enabled-cpus" property to multicore SoCs
      hw/arm/bcm2836: Split out common realize() code
      hw/arm/bcm2836: Introduce the BCM2835 SoC
      hw/arm/raspi: Add the Raspberry Pi A+ machine
      hw/arm/raspi: Add the Raspberry Pi Zero machine
      hw/arm/raspi: Add the Raspberry Pi 3 model A+

Richard Henderson (11):
      linux-user/aarch64: Reset btype for signals
      linux-user: Set PAGE_TARGET_1 for TARGET_PROT_BTI
      include/elf: Add defines related to GNU property notes for AArch64
      linux-user/elfload: Fix coding style in load_elf_image
      linux-user/elfload: Adjust iteration over phdr
      linux-user/elfload: Move PT_INTERP detection to first loop
      linux-user/elfload: Use Error for load_elf_image
      linux-user/elfload: Use Error for load_elf_interp
      linux-user/elfload: Parse NT_GNU_PROPERTY_TYPE_0 notes
      linux-user/elfload: Parse GNU_PROPERTY_AARCH64_FEATURE_1_AND
      tests/tcg/aarch64: Add bti smoke tests

Shashi Mallela (2):
      hw/watchdog: Implement SBSA watchdog device
      hw/arm/sbsa-ref: add SBSA watchdog device

Thomas Huth (1):
      hw/arm/highbank: Silence warnings about missing fallthrough statements

Zenghui Yu (1):
      hw/arm/smmuv3: Set the restoration priority of the vSMMUv3 explicitly

docs/system/arm/nuvoton.rst                |    6 +-
 hw/usb/hcd-ehci.h                          |    1 +
 include/elf.h                              |   22 +
 include/exec/cpu-all.h                     |    2 +
 include/hw/arm/bcm2835_peripherals.h       |    5 +-
 include/hw/arm/bcm2836.h                   |    9 +-
 include/hw/arm/npcm7xx.h                   |    8 +
 include/hw/arm/raspi_platform.h            |    5 +-
 include/hw/char/pl011.h                    |    1 +
 include/hw/clock.h                         |    5 +
 include/hw/gpio/npcm7xx_gpio.h             |   55 ++
 include/hw/misc/bcm2835_cprman.h           |  210 ++++++
 include/hw/misc/bcm2835_cprman_internals.h | 1019 ++++++++++++++++++++++++++++
 include/hw/misc/npcm7xx_clk.h              |    2 +
 include/hw/misc/npcm7xx_rng.h              |   34 +
 include/hw/timer/armv7m_systick.h          |    3 +-
 include/hw/timer/npcm7xx_timer.h           |   48 +-
 include/hw/watchdog/sbsa_gwdt.h            |   79 +++
 linux-user/qemu.h                          |    4 +
 linux-user/syscall_defs.h                  |    4 +
 target/arm/cpu.h                           |    5 +
 hw/arm/bcm2835_peripherals.c               |   15 +-
 hw/arm/bcm2836.c                           |  182 +++--
 hw/arm/highbank.c                          |    2 +
 hw/arm/npcm7xx.c                           |  126 +++-
 hw/arm/raspi.c                             |   41 ++
 hw/arm/sbsa-ref.c                          |   23 +
 hw/arm/smmuv3.c                            |    1 +
 hw/arm/xlnx-versal-virt.c                  |    1 +
 hw/char/pl011.c                            |   45 ++
 hw/core/clock.c                            |    6 +-
 hw/core/ptimer.c                           |    4 +
 hw/gpio/npcm7xx_gpio.c                     |  424 ++++++++++++
 hw/misc/bcm2835_cprman.c                   |  808 ++++++++++++++++++++++
 hw/misc/npcm7xx_clk.c                      |   28 +
 hw/misc/npcm7xx_rng.c                      |  180 +++++
 hw/timer/armv7m_systick.c                  |  124 ++--
 hw/timer/npcm7xx_timer.c                   |  270 ++++++--
 hw/usb/hcd-ehci-sysbus.c                   |   19 +
 hw/watchdog/sbsa_gwdt.c                    |  293 ++++++++
 linux-user/aarch64/signal.c                |   10 +-
 linux-user/elfload.c                       |  326 +++++++--
 linux-user/mmap.c                          |   16 +
 target/arm/translate-a64.c                 |    6 +-
 tests/qtest/npcm7xx_gpio-test.c            |  385 +++++++++++
 tests/qtest/npcm7xx_rng-test.c             |  278 ++++++++
 tests/qtest/npcm7xx_watchdog_timer-test.c  |  319 +++++++++
 tests/tcg/aarch64/bti-1.c                  |   62 ++
 tests/tcg/aarch64/bti-2.c                  |  116 ++++
 tests/tcg/aarch64/bti-crt.inc.c            |   51 ++
 MAINTAINERS                                |    1 +
 hw/arm/Kconfig                             |    1 +
 hw/arm/trace-events                        |    2 +-
 hw/char/trace-events                       |    1 +
 hw/core/trace-events                       |    4 +-
 hw/gpio/meson.build                        |    1 +
 hw/gpio/trace-events                       |    7 +
 hw/misc/meson.build                        |    2 +
 hw/misc/trace-events                       |    9 +
 hw/watchdog/Kconfig                        |    3 +
 hw/watchdog/meson.build                    |    1 +
 tests/qtest/meson.build                    |    6 +-
 tests/tcg/aarch64/Makefile.target          |   10 +
 tests/tcg/configure.sh                     |    4 +
 64 files changed, 5461 insertions(+), 279 deletions(-)
 create mode 100644 include/hw/gpio/npcm7xx_gpio.h
 create mode 100644 include/hw/misc/bcm2835_cprman.h
 create mode 100644 include/hw/misc/bcm2835_cprman_internals.h
 create mode 100644 include/hw/misc/npcm7xx_rng.h
 create mode 100644 include/hw/watchdog/sbsa_gwdt.h
 create mode 100644 hw/gpio/npcm7xx_gpio.c
 create mode 100644 hw/misc/bcm2835_cprman.c
 create mode 100644 hw/misc/npcm7xx_rng.c
 create mode 100644 hw/watchdog/sbsa_gwdt.c
 create mode 100644 tests/qtest/npcm7xx_gpio-test.c
 create mode 100644 tests/qtest/npcm7xx_rng-test.c
 create mode 100644 tests/qtest/npcm7xx_watchdog_timer-test.c
 create mode 100644 tests/tcg/aarch64/bti-1.c
 create mode 100644 tests/tcg/aarch64/bti-2.c
 create mode 100644 tests/tcg/aarch64/bti-crt.inc.c

From: Richard Henderson <richard.henderson@linaro.org>

The kernel sets btype for the signal handler as if for a call.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-2-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/aarch64/signal.c | 10 ++++++++--
 1 file changed, 8 insertions(+), 2 deletions(-)

diff --git a/linux-user/aarch64/signal.c b/linux-user/aarch64/signal.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/aarch64/signal.c
+++ b/linux-user/aarch64/signal.c
@@ -XXX,XX +XXX,XX @@ static void target_setup_frame(int usig, struct target_sigaction *ka,
             + offsetof(struct target_rt_frame_record, tramp);
     }
     env->xregs[0] = usig;
-    env->xregs[31] = frame_addr;
     env->xregs[29] = frame_addr + fr_ofs;
-    env->pc = ka->_sa_handler;
     env->xregs[30] = return_addr;
+    env->xregs[31] = frame_addr;
+    env->pc = ka->_sa_handler;
+
+    /* Invoke the signal handler as if by indirect call.  */
+    if (cpu_isar_feature(aa64_bti, env_archcpu(env))) {
+        env->btype = 2;
+    }
+
     if (info) {
         tswap_siginfo(&frame->info, info);
         env->xregs[1] = frame_addr + offsetof(struct target_rt_sigframe, info);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Transform the prot bit to a qemu internal page bit, and save
it in the page tables.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-3-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/exec/cpu-all.h     |  2 ++
 linux-user/syscall_defs.h  |  4 ++++
 target/arm/cpu.h           |  5 +++++
 linux-user/mmap.c          | 16 ++++++++++++++++
 target/arm/translate-a64.c |  6 +++---
 5 files changed, 30 insertions(+), 3 deletions(-)

diff --git a/include/exec/cpu-all.h b/include/exec/cpu-all.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/cpu-all.h
+++ b/include/exec/cpu-all.h
@@ -XXX,XX +XXX,XX @@ extern intptr_t qemu_host_page_mask;
 /* FIXME: Code that sets/uses this is broken and needs to go away.  */
 #define PAGE_RESERVED  0x0020
 #endif
+/* Target-specific bits that will be used via page_get_flags().  */
+#define PAGE_TARGET_1  0x0080
 
 #if defined(CONFIG_USER_ONLY)
 void page_dump(FILE *f);
diff --git a/linux-user/syscall_defs.h b/linux-user/syscall_defs.h
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/syscall_defs.h
+++ b/linux-user/syscall_defs.h
@@ -XXX,XX +XXX,XX @@ struct target_winsize {
 #define TARGET_PROT_SEM         0x08
 #endif
 
+#ifdef TARGET_AARCH64
+#define TARGET_PROT_BTI         0x10
+#endif
+
 /* Common */
 #define TARGET_MAP_SHARED	0x01		/* Share changes */
 #define TARGET_MAP_PRIVATE	0x02		/* Changes are private */
diff --git a/target/arm/cpu.h b/target/arm/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/cpu.h
+++ b/target/arm/cpu.h
@@ -XXX,XX +XXX,XX @@ static inline MemTxAttrs *typecheck_memtxattrs(MemTxAttrs *x)
 #define arm_tlb_bti_gp(x) (typecheck_memtxattrs(x)->target_tlb_bit0)
 #define arm_tlb_mte_tagged(x) (typecheck_memtxattrs(x)->target_tlb_bit1)
 
+/*
+ * AArch64 usage of the PAGE_TARGET_* bits for linux-user.
+ */
+#define PAGE_BTI  PAGE_TARGET_1
+
 /*
  * Naming convention for isar_feature functions:
  * Functions which test 32-bit ID registers should have _aa32_ in
diff --git a/linux-user/mmap.c b/linux-user/mmap.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/mmap.c
+++ b/linux-user/mmap.c
@@ -XXX,XX +XXX,XX @@ static int validate_prot_to_pageflags(int *host_prot, int prot)
     *host_prot = (prot & (PROT_READ | PROT_WRITE))
                | (prot & PROT_EXEC ? PROT_READ : 0);
 
+#ifdef TARGET_AARCH64
+    /*
+     * The PROT_BTI bit is only accepted if the cpu supports the feature.
+     * Since this is the unusual case, don't bother checking unless
+     * the bit has been requested.  If set and valid, record the bit
+     * within QEMU's page_flags.
+     */
+    if (prot & TARGET_PROT_BTI) {
+        ARMCPU *cpu = ARM_CPU(thread_cpu);
+        if (cpu_isar_feature(aa64_bti, cpu)) {
+            valid |= TARGET_PROT_BTI;
+            page_flags |= PAGE_BTI;
+        }
+    }
+#endif
+
     return prot & ~valid ? 0 : page_flags;
 }
 
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void disas_data_proc_simd_fp(DisasContext *s, uint32_t insn)
  */
 static bool is_guarded_page(CPUARMState *env, DisasContext *s)
 {
-#ifdef CONFIG_USER_ONLY
-    return false;  /* FIXME */
-#else
     uint64_t addr = s->base.pc_first;
+#ifdef CONFIG_USER_ONLY
+    return page_get_flags(addr) & PAGE_BTI;
+#else
     int mmu_idx = arm_to_core_mmu_idx(s->mmu_idx);
     unsigned int index = tlb_index(env, mmu_idx, addr);
     CPUTLBEntry *entry = tlb_entry(env, mmu_idx, addr);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

These are all of the defines required to parse
GNU_PROPERTY_AARCH64_FEATURE_1_AND, copied from binutils.
Other missing defines related to other GNU program headers
and notes are elided for now.

Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-4-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/elf.h | 22 ++++++++++++++++++++++
 1 file changed, 22 insertions(+)

diff --git a/include/elf.h b/include/elf.h
index XXXXXXX..XXXXXXX 100644
--- a/include/elf.h
+++ b/include/elf.h
@@ -XXX,XX +XXX,XX @@ typedef int64_t  Elf64_Sxword;
 #define PT_NOTE    4
 #define PT_SHLIB   5
 #define PT_PHDR    6
+#define PT_LOOS    0x60000000
+#define PT_HIOS    0x6fffffff
 #define PT_LOPROC  0x70000000
 #define PT_HIPROC  0x7fffffff
 
+#define PT_GNU_PROPERTY   (PT_LOOS + 0x474e553)
+
 #define PT_MIPS_REGINFO   0x70000000
 #define PT_MIPS_RTPROC    0x70000001
 #define PT_MIPS_OPTIONS   0x70000002
@@ -XXX,XX +XXX,XX @@ typedef struct elf64_shdr {
 #define NT_ARM_SYSTEM_CALL      0x404   /* ARM system call number */
 #define NT_ARM_SVE      0x405           /* ARM Scalable Vector Extension regs */
 
+/* Defined note types for GNU systems.  */
+
+#define NT_GNU_PROPERTY_TYPE_0  5       /* Program property */
+
+/* Values used in GNU .note.gnu.property notes (NT_GNU_PROPERTY_TYPE_0).  */
+
+#define GNU_PROPERTY_STACK_SIZE                 1
+#define GNU_PROPERTY_NO_COPY_ON_PROTECTED       2
+
+#define GNU_PROPERTY_LOPROC                     0xc0000000
+#define GNU_PROPERTY_HIPROC                     0xdfffffff
+#define GNU_PROPERTY_LOUSER                     0xe0000000
+#define GNU_PROPERTY_HIUSER                     0xffffffff
+
+#define GNU_PROPERTY_AARCH64_FEATURE_1_AND      0xc0000000
+#define GNU_PROPERTY_AARCH64_FEATURE_1_BTI      (1u << 0)
+#define GNU_PROPERTY_AARCH64_FEATURE_1_PAC      (1u << 1)
+
 /*
  * Physical entry point into the kernel.
  *
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Fix an unlikely memory leak in load_elf_image().

Fixes: bf858897b7 ("linux-user: Re-use load_elf_image for the main binary.")
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-5-richard.henderson@linaro.org
Message-Id: <20201003174944.1972444-1-f4bug@amsat.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                 info->brk = vaddr_em;
             }
         } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
-            char *interp_name;
+            g_autofree char *interp_name = NULL;
 
             if (*pinterp_name) {
                 errmsg = "Multiple PT_INTERP entries";
                 goto exit_errmsg;
             }
-            interp_name = malloc(eppnt->p_filesz);
+            interp_name = g_malloc(eppnt->p_filesz);
             if (!interp_name) {
                 goto exit_perror;
             }
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                 errmsg = "Invalid PT_INTERP entry";
                 goto exit_errmsg;
             }
-            *pinterp_name = interp_name;
+            *pinterp_name = g_steal_pointer(&interp_name);
 #ifdef TARGET_MIPS
         } else if (eppnt->p_type == PT_MIPS_ABIFLAGS) {
             Mips_elf_abiflags_v0 abiflags;
@@ -XXX,XX +XXX,XX @@ int load_elf_binary(struct linux_binprm *bprm, struct image_info *info)
     if (elf_interpreter) {
         info->load_bias = interp_info.load_bias;
         info->entry = interp_info.entry;
-        free(elf_interpreter);
+        g_free(elf_interpreter);
     }
 
 #ifdef USE_ELF_CORE_DUMP
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Fixing this now will clarify following patches.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-6-richard.henderson@linaro.org
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 12 +++++++++---
 1 file changed, 9 insertions(+), 3 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
             abi_ulong vaddr, vaddr_po, vaddr_ps, vaddr_ef, vaddr_em, vaddr_len;
             int elf_prot = 0;
 
-            if (eppnt->p_flags & PF_R) elf_prot =  PROT_READ;
-            if (eppnt->p_flags & PF_W) elf_prot |= PROT_WRITE;
-            if (eppnt->p_flags & PF_X) elf_prot |= PROT_EXEC;
+            if (eppnt->p_flags & PF_R) {
+                elf_prot |= PROT_READ;
+            }
+            if (eppnt->p_flags & PF_W) {
+                elf_prot |= PROT_WRITE;
+            }
+            if (eppnt->p_flags & PF_X) {
+                elf_prot |= PROT_EXEC;
+            }
 
             vaddr = load_bias + eppnt->p_vaddr;
             vaddr_po = TARGET_ELF_PAGEOFFSET(vaddr);
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The second loop uses a loop induction variable, and the first
does not.  Transform the first to match the second, to simplify
a following patch moving code between them.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-7-richard.henderson@linaro.org
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
     loaddr = -1, hiaddr = 0;
     info->alignment = 0;
     for (i = 0; i < ehdr->e_phnum; ++i) {
-        if (phdr[i].p_type == PT_LOAD) {
-            abi_ulong a = phdr[i].p_vaddr - phdr[i].p_offset;
+        struct elf_phdr *eppnt = phdr + i;
+        if (eppnt->p_type == PT_LOAD) {
+            abi_ulong a = eppnt->p_vaddr - eppnt->p_offset;
             if (a < loaddr) {
                 loaddr = a;
             }
-            a = phdr[i].p_vaddr + phdr[i].p_memsz;
+            a = eppnt->p_vaddr + eppnt->p_memsz;
             if (a > hiaddr) {
                 hiaddr = a;
             }
             ++info->nsegs;
-            info->alignment |= phdr[i].p_align;
+            info->alignment |= eppnt->p_align;
         }
     }
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

For BTI, we need to know if the executable is static or dynamic,
which means looking for PT_INTERP earlier.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-8-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 60 +++++++++++++++++++++++---------------------
 1 file changed, 31 insertions(+), 29 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
 
     mmap_lock();
 
-    /* Find the maximum size of the image and allocate an appropriate
-       amount of memory to handle that.  */
+    /*
+     * Find the maximum size of the image and allocate an appropriate
+     * amount of memory to handle that.  Locate the interpreter, if any.
+     */
     loaddr = -1, hiaddr = 0;
     info->alignment = 0;
     for (i = 0; i < ehdr->e_phnum; ++i) {
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
             }
             ++info->nsegs;
             info->alignment |= eppnt->p_align;
+        } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
+            g_autofree char *interp_name = NULL;
+
+            if (*pinterp_name) {
+                errmsg = "Multiple PT_INTERP entries";
+                goto exit_errmsg;
+            }
+            interp_name = g_malloc(eppnt->p_filesz);
+            if (!interp_name) {
+                goto exit_perror;
+            }
+
+            if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
+                memcpy(interp_name, bprm_buf + eppnt->p_offset,
+                       eppnt->p_filesz);
+            } else {
+                retval = pread(image_fd, interp_name, eppnt->p_filesz,
+                               eppnt->p_offset);
+                if (retval != eppnt->p_filesz) {
+                    goto exit_perror;
+                }
+            }
+            if (interp_name[eppnt->p_filesz - 1] != 0) {
+                errmsg = "Invalid PT_INTERP entry";
+                goto exit_errmsg;
+            }
+            *pinterp_name = g_steal_pointer(&interp_name);
         }
     }
 
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
             if (vaddr_em > info->brk) {
                 info->brk = vaddr_em;
             }
-        } else if (eppnt->p_type == PT_INTERP && pinterp_name) {
-            g_autofree char *interp_name = NULL;
-
-            if (*pinterp_name) {
-                errmsg = "Multiple PT_INTERP entries";
-                goto exit_errmsg;
-            }
-            interp_name = g_malloc(eppnt->p_filesz);
-            if (!interp_name) {
-                goto exit_perror;
-            }
-
-            if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
-                memcpy(interp_name, bprm_buf + eppnt->p_offset,
-                       eppnt->p_filesz);
-            } else {
-                retval = pread(image_fd, interp_name, eppnt->p_filesz,
-                               eppnt->p_offset);
-                if (retval != eppnt->p_filesz) {
-                    goto exit_perror;
-                }
-            }
-            if (interp_name[eppnt->p_filesz - 1] != 0) {
-                errmsg = "Invalid PT_INTERP entry";
-                goto exit_errmsg;
-            }
-            *pinterp_name = g_steal_pointer(&interp_name);
 #ifdef TARGET_MIPS
         } else if (eppnt->p_type == PT_MIPS_ABIFLAGS) {
             Mips_elf_abiflags_v0 abiflags;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is a bit clearer than open-coding some of this
with a bare c string.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-9-richard.henderson@linaro.org
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 37 ++++++++++++++++++++-----------------
 1 file changed, 20 insertions(+), 17 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/guest-random.h"
 #include "qemu/units.h"
 #include "qemu/selfmap.h"
+#include "qapi/error.h"
 
 #ifdef _ARCH_PPC64
 #undef ARCH_DLINFO
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
     struct elf_phdr *phdr;
     abi_ulong load_addr, load_bias, loaddr, hiaddr, error;
     int i, retval;
-    const char *errmsg;
+    Error *err = NULL;
 
     /* First of all, some simple consistency checks */
-    errmsg = "Invalid ELF image for this architecture";
     if (!elf_check_ident(ehdr)) {
+        error_setg(&err, "Invalid ELF image for this architecture");
         goto exit_errmsg;
     }
     bswap_ehdr(ehdr);
     if (!elf_check_ehdr(ehdr)) {
+        error_setg(&err, "Invalid ELF image for this architecture");
         goto exit_errmsg;
     }
 
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
             g_autofree char *interp_name = NULL;
 
             if (*pinterp_name) {
-                errmsg = "Multiple PT_INTERP entries";
+                error_setg(&err, "Multiple PT_INTERP entries");
                 goto exit_errmsg;
             }
+
             interp_name = g_malloc(eppnt->p_filesz);
-            if (!interp_name) {
-                goto exit_perror;
-            }
 
             if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
                 memcpy(interp_name, bprm_buf + eppnt->p_offset,
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                 retval = pread(image_fd, interp_name, eppnt->p_filesz,
                                eppnt->p_offset);
                 if (retval != eppnt->p_filesz) {
-                    goto exit_perror;
+                    goto exit_read;
                 }
             }
             if (interp_name[eppnt->p_filesz - 1] != 0) {
-                errmsg = "Invalid PT_INTERP entry";
+                error_setg(&err, "Invalid PT_INTERP entry");
                 goto exit_errmsg;
             }
             *pinterp_name = g_steal_pointer(&interp_name);
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                             (ehdr->e_type == ET_EXEC ? MAP_FIXED : 0),
                             -1, 0);
     if (load_addr == -1) {
-        goto exit_perror;
+        goto exit_mmap;
     }
     load_bias = load_addr - loaddr;
 
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                                     image_fd, eppnt->p_offset - vaddr_po);
 
                 if (error == -1) {
-                    goto exit_perror;
+                    goto exit_mmap;
                 }
             }
 
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
         } else if (eppnt->p_type == PT_MIPS_ABIFLAGS) {
             Mips_elf_abiflags_v0 abiflags;
             if (eppnt->p_filesz < sizeof(Mips_elf_abiflags_v0)) {
-                errmsg = "Invalid PT_MIPS_ABIFLAGS entry";
+                error_setg(&err, "Invalid PT_MIPS_ABIFLAGS entry");
                 goto exit_errmsg;
             }
             if (eppnt->p_offset + eppnt->p_filesz <= BPRM_BUF_SIZE) {
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                 retval = pread(image_fd, &abiflags, sizeof(Mips_elf_abiflags_v0),
                                eppnt->p_offset);
                 if (retval != sizeof(Mips_elf_abiflags_v0)) {
-                    goto exit_perror;
+                    goto exit_read;
                 }
             }
             bswap_mips_abiflags(&abiflags);
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
 
  exit_read:
     if (retval >= 0) {
-        errmsg = "Incomplete read of file header";
-        goto exit_errmsg;
+        error_setg(&err, "Incomplete read of file header");
+    } else {
+        error_setg_errno(&err, errno, "Error reading file header");
     }
- exit_perror:
-    errmsg = strerror(errno);
+    goto exit_errmsg;
+ exit_mmap:
+    error_setg_errno(&err, errno, "Error mapping file");
+    goto exit_errmsg;
  exit_errmsg:
-    fprintf(stderr, "%s: %s\n", image_name, errmsg);
+    error_reportf_err(err, "%s: ", image_name);
     exit(-1);
 }
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is slightly clearer than just using strerror, though
the different forms produced by error_setg_file_open and
error_setg_errno isn't entirely convenient.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-10-richard.henderson@linaro.org
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 15 ++++++++-------
 1 file changed, 8 insertions(+), 7 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void load_elf_interp(const char *filename, struct image_info *info,
                             char bprm_buf[BPRM_BUF_SIZE])
 {
     int fd, retval;
+    Error *err = NULL;
 
     fd = open(path(filename), O_RDONLY);
     if (fd < 0) {
-        goto exit_perror;
+        error_setg_file_open(&err, errno, filename);
+        error_report_err(err);
+        exit(-1);
     }
 
     retval = read(fd, bprm_buf, BPRM_BUF_SIZE);
     if (retval < 0) {
-        goto exit_perror;
+        error_setg_errno(&err, errno, "Error reading file header");
+        error_reportf_err(err, "%s: ", filename);
+        exit(-1);
     }
+
     if (retval < BPRM_BUF_SIZE) {
         memset(bprm_buf + retval, 0, BPRM_BUF_SIZE - retval);
     }
 
     load_elf_image(filename, fd, info, NULL, bprm_buf);
-    return;
-
- exit_perror:
-    fprintf(stderr, "%s: %s\n", filename, strerror(errno));
-    exit(-1);
 }
 
 static int symfind(const void *s0, const void *s1)
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

This is generic support, with the code disabled for all targets.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-11-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/qemu.h    |   4 ++
 linux-user/elfload.c | 157 +++++++++++++++++++++++++++++++++++++++++++
 2 files changed, 161 insertions(+)

diff --git a/linux-user/qemu.h b/linux-user/qemu.h
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/qemu.h
+++ b/linux-user/qemu.h
@@ -XXX,XX +XXX,XX @@ struct image_info {
         abi_ulong       interpreter_loadmap_addr;
         abi_ulong       interpreter_pt_dynamic_addr;
         struct image_info *other_info;
+
+        /* For target-specific processing of NT_GNU_PROPERTY_TYPE_0. */
+        uint32_t        note_flags;
+
 #ifdef TARGET_MIPS
         int             fp_abi;
         int             interp_fp_abi;
diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void elf_core_copy_regs(target_elf_gregset_t *regs,
 
 #include "elf.h"
 
+static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
+                                    const uint32_t *data,
+                                    struct image_info *info,
+                                    Error **errp)
+{
+    g_assert_not_reached();
+}
+#define ARCH_USE_GNU_PROPERTY 0
+
 struct exec
 {
     unsigned int a_info;   /* Use macros N_MAGIC, etc for access */
@@ -XXX,XX +XXX,XX @@ void probe_guest_base(const char *image_name, abi_ulong guest_loaddr,
                   "@ 0x%" PRIx64 "\n", (uint64_t)guest_base);
 }
 
+enum {
+    /* The string "GNU\0" as a magic number. */
+    GNU0_MAGIC = const_le32('G' | 'N' << 8 | 'U' << 16),
+    NOTE_DATA_SZ = 1 * KiB,
+    NOTE_NAME_SZ = 4,
+    ELF_GNU_PROPERTY_ALIGN = ELF_CLASS == ELFCLASS32 ? 4 : 8,
+};
+
+/*
+ * Process a single gnu_property entry.
+ * Return false for error.
+ */
+static bool parse_elf_property(const uint32_t *data, int *off, int datasz,
+                               struct image_info *info, bool have_prev_type,
+                               uint32_t *prev_type, Error **errp)
+{
+    uint32_t pr_type, pr_datasz, step;
+
+    if (*off > datasz || !QEMU_IS_ALIGNED(*off, ELF_GNU_PROPERTY_ALIGN)) {
+        goto error_data;
+    }
+    datasz -= *off;
+    data += *off / sizeof(uint32_t);
+
+    if (datasz < 2 * sizeof(uint32_t)) {
+        goto error_data;
+    }
+    pr_type = data[0];
+    pr_datasz = data[1];
+    data += 2;
+    datasz -= 2 * sizeof(uint32_t);
+    step = ROUND_UP(pr_datasz, ELF_GNU_PROPERTY_ALIGN);
+    if (step > datasz) {
+        goto error_data;
+    }
+
+    /* Properties are supposed to be unique and sorted on pr_type. */
+    if (have_prev_type && pr_type <= *prev_type) {
+        if (pr_type == *prev_type) {
+            error_setg(errp, "Duplicate property in PT_GNU_PROPERTY");
+        } else {
+            error_setg(errp, "Unsorted property in PT_GNU_PROPERTY");
+        }
+        return false;
+    }
+    *prev_type = pr_type;
+
+    if (!arch_parse_elf_property(pr_type, pr_datasz, data, info, errp)) {
+        return false;
+    }
+
+    *off += 2 * sizeof(uint32_t) + step;
+    return true;
+
+ error_data:
+    error_setg(errp, "Ill-formed property in PT_GNU_PROPERTY");
+    return false;
+}
+
+/* Process NT_GNU_PROPERTY_TYPE_0. */
+static bool parse_elf_properties(int image_fd,
+                                 struct image_info *info,
+                                 const struct elf_phdr *phdr,
+                                 char bprm_buf[BPRM_BUF_SIZE],
+                                 Error **errp)
+{
+    union {
+        struct elf_note nhdr;
+        uint32_t data[NOTE_DATA_SZ / sizeof(uint32_t)];
+    } note;
+
+    int n, off, datasz;
+    bool have_prev_type;
+    uint32_t prev_type;
+
+    /* Unless the arch requires properties, ignore them. */
+    if (!ARCH_USE_GNU_PROPERTY) {
+        return true;
+    }
+
+    /* If the properties are crazy large, that's too bad. */
+    n = phdr->p_filesz;
+    if (n > sizeof(note)) {
+        error_setg(errp, "PT_GNU_PROPERTY too large");
+        return false;
+    }
+    if (n < sizeof(note.nhdr)) {
+        error_setg(errp, "PT_GNU_PROPERTY too small");
+        return false;
+    }
+
+    if (phdr->p_offset + n <= BPRM_BUF_SIZE) {
+        memcpy(&note, bprm_buf + phdr->p_offset, n);
+    } else {
+        ssize_t len = pread(image_fd, &note, n, phdr->p_offset);
+        if (len != n) {
+            error_setg_errno(errp, errno, "Error reading file header");
+            return false;
+        }
+    }
+
+    /*
+     * The contents of a valid PT_GNU_PROPERTY is a sequence
+     * of uint32_t -- swap them all now.
+     */
+#ifdef BSWAP_NEEDED
+    for (int i = 0; i < n / 4; i++) {
+        bswap32s(note.data + i);
+    }
+#endif
+
+    /*
+     * Note that nhdr is 3 words, and that the "name" described by namesz
+     * immediately follows nhdr and is thus at the 4th word.  Further, all
+     * of the inputs to the kernel's round_up are multiples of 4.
+     */
+    if (note.nhdr.n_type != NT_GNU_PROPERTY_TYPE_0 ||
+        note.nhdr.n_namesz != NOTE_NAME_SZ ||
+        note.data[3] != GNU0_MAGIC) {
+        error_setg(errp, "Invalid note in PT_GNU_PROPERTY");
+        return false;
+    }
+    off = sizeof(note.nhdr) + NOTE_NAME_SZ;
+
+    datasz = note.nhdr.n_descsz + off;
+    if (datasz > n) {
+        error_setg(errp, "Invalid note size in PT_GNU_PROPERTY");
+        return false;
+    }
+
+    have_prev_type = false;
+    prev_type = 0;
+    while (1) {
+        if (off == datasz) {
+            return true;  /* end, exit ok */
+        }
+        if (!parse_elf_property(note.data, &off, datasz, info,
+                                have_prev_type, &prev_type, errp)) {
+            return false;
+        }
+        have_prev_type = true;
+    }
+}
+
 /* Load an ELF image into the address space.
 
    IMAGE_NAME is the filename of the image, to use in error messages.
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                 goto exit_errmsg;
             }
             *pinterp_name = g_steal_pointer(&interp_name);
+        } else if (eppnt->p_type == PT_GNU_PROPERTY) {
+            if (!parse_elf_properties(image_fd, info, eppnt, bprm_buf, &err)) {
+                goto exit_errmsg;
+            }
         }
     }
 
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

Use the new generic support for NT_GNU_PROPERTY_TYPE_0.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-12-richard.henderson@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 linux-user/elfload.c | 48 ++++++++++++++++++++++++++++++++++++++++++--
 1 file changed, 46 insertions(+), 2 deletions(-)

diff --git a/linux-user/elfload.c b/linux-user/elfload.c
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/elfload.c
+++ b/linux-user/elfload.c
@@ -XXX,XX +XXX,XX @@ static void elf_core_copy_regs(target_elf_gregset_t *regs,
 
 #include "elf.h"
 
+/* We must delay the following stanzas until after "elf.h". */
+#if defined(TARGET_AARCH64)
+
+static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
+                                    const uint32_t *data,
+                                    struct image_info *info,
+                                    Error **errp)
+{
+    if (pr_type == GNU_PROPERTY_AARCH64_FEATURE_1_AND) {
+        if (pr_datasz != sizeof(uint32_t)) {
+            error_setg(errp, "Ill-formed GNU_PROPERTY_AARCH64_FEATURE_1_AND");
+            return false;
+        }
+        /* We will extract GNU_PROPERTY_AARCH64_FEATURE_1_BTI later. */
+        info->note_flags = *data;
+    }
+    return true;
+}
+#define ARCH_USE_GNU_PROPERTY 1
+
+#else
+
 static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
                                     const uint32_t *data,
                                     struct image_info *info,
@@ -XXX,XX +XXX,XX @@ static bool arch_parse_elf_property(uint32_t pr_type, uint32_t pr_datasz,
 }
 #define ARCH_USE_GNU_PROPERTY 0
 
+#endif
+
 struct exec
 {
     unsigned int a_info;   /* Use macros N_MAGIC, etc for access */
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
     struct elfhdr *ehdr = (struct elfhdr *)bprm_buf;
     struct elf_phdr *phdr;
     abi_ulong load_addr, load_bias, loaddr, hiaddr, error;
-    int i, retval;
+    int i, retval, prot_exec;
     Error *err = NULL;
 
     /* First of all, some simple consistency checks */
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
     info->brk = 0;
     info->elf_flags = ehdr->e_flags;
 
+    prot_exec = PROT_EXEC;
+#ifdef TARGET_AARCH64
+    /*
+     * If the BTI feature is present, this indicates that the executable
+     * pages of the startup binary should be mapped with PROT_BTI, so that
+     * branch targets are enforced.
+     *
+     * The startup binary is either the interpreter or the static executable.
+     * The interpreter is responsible for all pages of a dynamic executable.
+     *
+     * Elf notes are backward compatible to older cpus.
+     * Do not enable BTI unless it is supported.
+     */
+    if ((info->note_flags & GNU_PROPERTY_AARCH64_FEATURE_1_BTI)
+        && (pinterp_name == NULL || *pinterp_name == 0)
+        && cpu_isar_feature(aa64_bti, ARM_CPU(thread_cpu))) {
+        prot_exec |= TARGET_PROT_BTI;
+    }
+#endif
+
     for (i = 0; i < ehdr->e_phnum; i++) {
         struct elf_phdr *eppnt = phdr + i;
         if (eppnt->p_type == PT_LOAD) {
@@ -XXX,XX +XXX,XX @@ static void load_elf_image(const char *image_name, int image_fd,
                 elf_prot |= PROT_WRITE;
             }
             if (eppnt->p_flags & PF_X) {
-                elf_prot |= PROT_EXEC;
+                elf_prot |= prot_exec;
             }
 
             vaddr = load_bias + eppnt->p_vaddr;
-- 
2.20.1

From: Richard Henderson <richard.henderson@linaro.org>

The note test requires gcc 10 for -mbranch-protection=standard.
The mmap test uses PROT_BTI and does not require special compiler support.

Acked-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-id: 20201021173749.111103-13-richard.henderson@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 tests/tcg/aarch64/bti-1.c         |  62 ++++++++++++++++
 tests/tcg/aarch64/bti-2.c         | 116 ++++++++++++++++++++++++++++++
 tests/tcg/aarch64/bti-crt.inc.c   |  51 +++++++++++++
 tests/tcg/aarch64/Makefile.target |  10 +++
 tests/tcg/configure.sh            |   4 ++
 5 files changed, 243 insertions(+)
 create mode 100644 tests/tcg/aarch64/bti-1.c
 create mode 100644 tests/tcg/aarch64/bti-2.c
 create mode 100644 tests/tcg/aarch64/bti-crt.inc.c

diff --git a/tests/tcg/aarch64/bti-1.c b/tests/tcg/aarch64/bti-1.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/aarch64/bti-1.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Branch target identification, basic notskip cases.
+ */
+
+#include "bti-crt.inc.c"
+
+static void skip2_sigill(int sig, siginfo_t *info, ucontext_t *uc)
+{
+    uc->uc_mcontext.pc += 8;
+    uc->uc_mcontext.pstate = 1;
+}
+
+#define NOP       "nop"
+#define BTI_N     "hint #32"
+#define BTI_C     "hint #34"
+#define BTI_J     "hint #36"
+#define BTI_JC    "hint #38"
+
+#define BTYPE_1(DEST) \
+    asm("mov %0,#1; adr x16, 1f; br x16; 1: " DEST "; mov %0,#0" \
+        : "=r"(skipped) : : "x16")
+
+#define BTYPE_2(DEST) \
+    asm("mov %0,#1; adr x16, 1f; blr x16; 1: " DEST "; mov %0,#0" \
+        : "=r"(skipped) : : "x16", "x30")
+
+#define BTYPE_3(DEST) \
+    asm("mov %0,#1; adr x15, 1f; br x15; 1: " DEST "; mov %0,#0" \
+        : "=r"(skipped) : : "x15")
+
+#define TEST(WHICH, DEST, EXPECT) \
+    do { WHICH(DEST); fail += skipped ^ EXPECT; } while (0)
+
+
+int main()
+{
+    int fail = 0;
+    int skipped;
+
+    /* Signal-like with SA_SIGINFO.  */
+    signal_info(SIGILL, skip2_sigill);
+
+    TEST(BTYPE_1, NOP, 1);
+    TEST(BTYPE_1, BTI_N, 1);
+    TEST(BTYPE_1, BTI_C, 0);
+    TEST(BTYPE_1, BTI_J, 0);
+    TEST(BTYPE_1, BTI_JC, 0);
+
+    TEST(BTYPE_2, NOP, 1);
+    TEST(BTYPE_2, BTI_N, 1);
+    TEST(BTYPE_2, BTI_C, 0);
+    TEST(BTYPE_2, BTI_J, 1);
+    TEST(BTYPE_2, BTI_JC, 0);
+
+    TEST(BTYPE_3, NOP, 1);
+    TEST(BTYPE_3, BTI_N, 1);
+    TEST(BTYPE_3, BTI_C, 1);
+    TEST(BTYPE_3, BTI_J, 0);
+    TEST(BTYPE_3, BTI_JC, 0);
+
+    return fail;
+}
diff --git a/tests/tcg/aarch64/bti-2.c b/tests/tcg/aarch64/bti-2.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/aarch64/bti-2.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Branch target identification, basic notskip cases.
+ */
+
+#include <stdio.h>
+#include <signal.h>
+#include <string.h>
+#include <unistd.h>
+#include <sys/mman.h>
+
+#ifndef PROT_BTI
+#define PROT_BTI  0x10
+#endif
+
+static void skip2_sigill(int sig, siginfo_t *info, void *vuc)
+{
+    ucontext_t *uc = vuc;
+    uc->uc_mcontext.pc += 8;
+    uc->uc_mcontext.pstate = 1;
+}
+
+#define NOP       "nop"
+#define BTI_N     "hint #32"
+#define BTI_C     "hint #34"
+#define BTI_J     "hint #36"
+#define BTI_JC    "hint #38"
+
+#define BTYPE_1(DEST)    \
+    "mov x1, #1\n\t"     \
+    "adr x16, 1f\n\t"    \
+    "br x16\n"           \
+"1: " DEST "\n\t"        \
+    "mov x1, #0"
+
+#define BTYPE_2(DEST)    \
+    "mov x1, #1\n\t"     \
+    "adr x16, 1f\n\t"    \
+    "blr x16\n"          \
+"1: " DEST "\n\t"        \
+    "mov x1, #0"
+
+#define BTYPE_3(DEST)    \
+    "mov x1, #1\n\t"     \
+    "adr x15, 1f\n\t"    \
+    "br x15\n"           \
+"1: " DEST "\n\t"        \
+    "mov x1, #0"
+
+#define TEST(WHICH, DEST, EXPECT) \
+    WHICH(DEST) "\n"              \
+    ".if " #EXPECT "\n\t"         \
+    "eor x1, x1," #EXPECT "\n"    \
+    ".endif\n\t"                  \
+    "add x0, x0, x1\n\t"
+
+asm("\n"
+"test_begin:\n\t"
+    BTI_C "\n\t"
+    "mov x2, x30\n\t"
+    "mov x0, #0\n\t"
+
+    TEST(BTYPE_1, NOP, 1)
+    TEST(BTYPE_1, BTI_N, 1)
+    TEST(BTYPE_1, BTI_C, 0)
+    TEST(BTYPE_1, BTI_J, 0)
+    TEST(BTYPE_1, BTI_JC, 0)
+
+    TEST(BTYPE_2, NOP, 1)
+    TEST(BTYPE_2, BTI_N, 1)
+    TEST(BTYPE_2, BTI_C, 0)
+    TEST(BTYPE_2, BTI_J, 1)
+    TEST(BTYPE_2, BTI_JC, 0)
+
+    TEST(BTYPE_3, NOP, 1)
+    TEST(BTYPE_3, BTI_N, 1)
+    TEST(BTYPE_3, BTI_C, 1)
+    TEST(BTYPE_3, BTI_J, 0)
+    TEST(BTYPE_3, BTI_JC, 0)
+
+    "ret x2\n"
+"test_end:"
+);
+
+int main()
+{
+    struct sigaction sa;
+    void *tb, *te;
+
+    void *p = mmap(0, getpagesize(),
+                   PROT_EXEC | PROT_READ | PROT_WRITE | PROT_BTI,
+                   MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);
+    if (p == MAP_FAILED) {
+        perror("mmap");
+        return 1;
+    }
+
+    memset(&sa, 0, sizeof(sa));
+    sa.sa_sigaction = skip2_sigill;
+    sa.sa_flags = SA_SIGINFO;
+    if (sigaction(SIGILL, &sa, NULL) < 0) {
+        perror("sigaction");
+        return 1;
+    }
+
+    /*
+     * ??? With "extern char test_begin[]", some compiler versions
+     * will use :got references, and some linker versions will
+     * resolve this reference to a static symbol incorrectly.
+     * Bypass this error by using a pc-relative reference directly.
+     */
+    asm("adr %0, test_begin; adr %1, test_end" : "=r"(tb), "=r"(te));
+
+    memcpy(p, tb, te - tb);
+
+    return ((int (*)(void))p)();
+}
diff --git a/tests/tcg/aarch64/bti-crt.inc.c b/tests/tcg/aarch64/bti-crt.inc.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/aarch64/bti-crt.inc.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Minimal user-environment for testing BTI.
+ *
+ * Normal libc is not (yet) built with BTI support enabled,
+ * and so could generate a BTI TRAP before ever reaching main.
+ */
+
+#include <stdlib.h>
+#include <signal.h>
+#include <ucontext.h>
+#include <asm/unistd.h>
+
+int main(void);
+
+void _start(void)
+{
+    exit(main());
+}
+
+void exit(int ret)
+{
+    register int x0 __asm__("x0") = ret;
+    register int x8 __asm__("x8") = __NR_exit;
+
+    asm volatile("svc #0" : : "r"(x0), "r"(x8));
+    __builtin_unreachable();
+}
+
+/*
+ * Irritatingly, the user API struct sigaction does not match the
+ * kernel API struct sigaction.  So for simplicity, isolate the
+ * kernel ABI here, and make this act like signal.
+ */
+void signal_info(int sig, void (*fn)(int, siginfo_t *, ucontext_t *))
+{
+    struct kernel_sigaction {
+        void (*handler)(int, siginfo_t *, ucontext_t *);
+        unsigned long flags;
+        unsigned long restorer;
+        unsigned long mask;
+    } sa = { fn, SA_SIGINFO, 0, 0 };
+
+    register int x0 __asm__("x0") = sig;
+    register void *x1 __asm__("x1") = &sa;
+    register void *x2 __asm__("x2") = 0;
+    register int x3 __asm__("x3") = sizeof(unsigned long);
+    register int x8 __asm__("x8") = __NR_rt_sigaction;
+
+    asm volatile("svc #0"
+                 : : "r"(x0), "r"(x1), "r"(x2), "r"(x3), "r"(x8) : "memory");
+}
diff --git a/tests/tcg/aarch64/Makefile.target b/tests/tcg/aarch64/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/aarch64/Makefile.target
+++ b/tests/tcg/aarch64/Makefile.target
@@ -XXX,XX +XXX,XX @@ run-pauth-%: QEMU_OPTS += -cpu max
 run-plugin-pauth-%: QEMU_OPTS += -cpu max
 endif
 
+# BTI Tests
+# bti-1 tests the elf notes, so we require special compiler support.
+ifneq ($(DOCKER_IMAGE)$(CROSS_CC_HAS_ARMV8_BTI),)
+AARCH64_TESTS += bti-1
+bti-1: CFLAGS += -mbranch-protection=standard
+bti-1: LDFLAGS += -nostdlib
+endif
+# bti-2 tests PROT_BTI, so no special compiler support required.
+AARCH64_TESTS += bti-2
+
 # Semihosting smoke test for linux-user
 AARCH64_TESTS += semihosting
 run-semihosting: semihosting
diff --git a/tests/tcg/configure.sh b/tests/tcg/configure.sh
index XXXXXXX..XXXXXXX 100755
--- a/tests/tcg/configure.sh
+++ b/tests/tcg/configure.sh
@@ -XXX,XX +XXX,XX @@ for target in $target_list; do
                -march=armv8.3-a -o $TMPE $TMPC; then
                 echo "CROSS_CC_HAS_ARMV8_3=y" >> $config_target_mak
             fi
+            if do_compiler "$target_compiler" $target_compiler_cflags \
+               -mbranch-protection=standard -o $TMPE $TMPC; then
+                echo "CROSS_CC_HAS_ARMV8_BTI=y" >> $config_target_mak
+            fi
         ;;
     esac
 
-- 
2.20.1

From: Thomas Huth <thuth@redhat.com>

When compiling with -Werror=implicit-fallthrough, gcc complains about
missing fallthrough annotations in this file. Looking at the code,
the fallthrough is very likely intended here, so add some comments
to silence the compiler warnings.

Signed-off-by: Thomas Huth <thuth@redhat.com>
Message-id: 20201020105938.23209-1-thuth@redhat.com
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/highbank.c | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/hw/arm/highbank.c b/hw/arm/highbank.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/highbank.c
+++ b/hw/arm/highbank.c
@@ -XXX,XX +XXX,XX @@ static void hb_reset_secondary(ARMCPU *cpu, const struct arm_boot_info *info)
         address_space_stl_notdirty(&address_space_memory,
                                    SMP_BOOT_REG + 0x30, 0,
                                    MEMTXATTRS_UNSPECIFIED, NULL);
+        /* fallthrough */
     case 3:
         address_space_stl_notdirty(&address_space_memory,
                                    SMP_BOOT_REG + 0x20, 0,
                                    MEMTXATTRS_UNSPECIFIED, NULL);
+        /* fallthrough */
     case 2:
         address_space_stl_notdirty(&address_space_memory,
                                    SMP_BOOT_REG + 0x10, 0,
-- 
2.20.1

From: Pavel Dovgalyuk <pavel.dovgalyuk@ispras.ru>

This patch sets min_cpus field for xlnx-versal-virt platform,
because it always creates XLNX_VERSAL_NR_ACPUS cpus even with
-smp 1 command line option.

Signed-off-by: Pavel Dovgalyuk <pavel.dovgalyuk@ispras.ru>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
Message-id: 160343854912.8460.17915238517799132371.stgit@pasha-ThinkPad-X280
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/xlnx-versal-virt.c | 1 +
 1 file changed, 1 insertion(+)

diff --git a/hw/arm/xlnx-versal-virt.c b/hw/arm/xlnx-versal-virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/xlnx-versal-virt.c
+++ b/hw/arm/xlnx-versal-virt.c
@@ -XXX,XX +XXX,XX @@ static void versal_virt_machine_class_init(ObjectClass *oc, void *data)
 
     mc->desc = "Xilinx Versal Virtual development board";
     mc->init = versal_virt_init;
+    mc->min_cpus = XLNX_VERSAL_NR_ACPUS;
     mc->max_cpus = XLNX_VERSAL_NR_ACPUS;
     mc->default_cpus = XLNX_VERSAL_NR_ACPUS;
     mc->no_cdrom = true;
-- 
2.20.1

From: Havard Skinnemoen <hskinnemoen@google.com>

This allows us to reuse npcm7xx_timer_pause for the watchdog timer.

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/timer/npcm7xx_timer.c | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/hw/timer/npcm7xx_timer.c b/hw/timer/npcm7xx_timer.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/timer/npcm7xx_timer.c
+++ b/hw/timer/npcm7xx_timer.c
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_pause(NPCM7xxTimer *t)
     timer_del(&t->qtimer);
     now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
     t->remaining_ns = t->expires_ns - now;
-    if (t->remaining_ns <= 0) {
-        npcm7xx_timer_reached_zero(t);
-    }
 }
 
 /*
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
         } else {
             t->tcsr &= ~NPCM7XX_TCSR_CACT;
             npcm7xx_timer_pause(t);
+            if (t->remaining_ns <= 0) {
+                npcm7xx_timer_reached_zero(t);
+            }
         }
     }
 }
-- 
2.20.1

From: Hao Wu <wuhaotsh@google.com>

The watchdog is part of NPCM7XX's timer module. Its behavior is
controlled by the WTCR register in the timer.

When enabled, the watchdog issues an interrupt signal after a pre-set
amount of cycles, and issues a reset signal shortly after that.

Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
Signed-off-by: Hao Wu <wuhaotsh@google.com>
Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
[PMM: deleted blank line at end of npcm_watchdog_timer-test.c]
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/misc/npcm7xx_clk.h             |   2 +
 include/hw/timer/npcm7xx_timer.h          |  48 +++-
 hw/arm/npcm7xx.c                          |  12 +
 hw/misc/npcm7xx_clk.c                     |  28 ++
 hw/timer/npcm7xx_timer.c                  | 266 ++++++++++++++----
 tests/qtest/npcm7xx_watchdog_timer-test.c | 319 ++++++++++++++++++++++
 MAINTAINERS                               |   1 +
 tests/qtest/meson.build                   |   2 +-
 8 files changed, 624 insertions(+), 54 deletions(-)
 create mode 100644 tests/qtest/npcm7xx_watchdog_timer-test.c

diff --git a/include/hw/misc/npcm7xx_clk.h b/include/hw/misc/npcm7xx_clk.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/npcm7xx_clk.h
+++ b/include/hw/misc/npcm7xx_clk.h
@@ -XXX,XX +XXX,XX @@
  */
 #define NPCM7XX_CLK_NR_REGS             (0x70 / sizeof(uint32_t))
 
+#define NPCM7XX_WATCHDOG_RESET_GPIO_IN "npcm7xx-clk-watchdog-reset-gpio-in"
+
 typedef struct NPCM7xxCLKState {
     SysBusDevice parent;
 
diff --git a/include/hw/timer/npcm7xx_timer.h b/include/hw/timer/npcm7xx_timer.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/timer/npcm7xx_timer.h
+++ b/include/hw/timer/npcm7xx_timer.h
@@ -XXX,XX +XXX,XX @@
  */
 #define NPCM7XX_TIMER_NR_REGS (0x54 / sizeof(uint32_t))
 
+/* The basic watchdog timer period is 2^14 clock cycles. */
+#define NPCM7XX_WATCHDOG_BASETIME_SHIFT 14
+
+#define NPCM7XX_WATCHDOG_RESET_GPIO_OUT "npcm7xx-clk-watchdog-reset-gpio-out"
+
 typedef struct NPCM7xxTimerCtrlState NPCM7xxTimerCtrlState;
 
 /**
- * struct NPCM7xxTimer - Individual timer state.
- * @irq: GIC interrupt line to fire on expiration (if enabled).
+ * struct NPCM7xxBaseTimer - Basic functionality that both regular timer and
+ * watchdog timer use.
  * @qtimer: QEMU timer that notifies us on expiration.
  * @expires_ns: Absolute virtual expiration time.
  * @remaining_ns: Remaining time until expiration if timer is paused.
+ */
+typedef struct NPCM7xxBaseTimer {
+    QEMUTimer   qtimer;
+    int64_t     expires_ns;
+    int64_t     remaining_ns;
+} NPCM7xxBaseTimer;
+
+/**
+ * struct NPCM7xxTimer - Individual timer state.
+ * @ctrl: The timer module that owns this timer.
+ * @irq: GIC interrupt line to fire on expiration (if enabled).
+ * @base_timer: The basic timer functionality for this timer.
  * @tcsr: The Timer Control and Status Register.
  * @ticr: The Timer Initial Count Register.
  */
@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxTimer {
     NPCM7xxTimerCtrlState *ctrl;
 
     qemu_irq    irq;
-    QEMUTimer   qtimer;
-    int64_t     expires_ns;
-    int64_t     remaining_ns;
+    NPCM7xxBaseTimer base_timer;
 
     uint32_t    tcsr;
     uint32_t    ticr;
 } NPCM7xxTimer;
 
+/**
+ * struct NPCM7xxWatchdogTimer - The watchdog timer state.
+ * @ctrl: The timer module that owns this timer.
+ * @irq: GIC interrupt line to fire on expiration (if enabled).
+ * @reset_signal: The GPIO used to send a reset signal.
+ * @base_timer: The basic timer functionality for this timer.
+ * @wtcr: The Watchdog Timer Control Register.
+ */
+typedef struct NPCM7xxWatchdogTimer {
+    NPCM7xxTimerCtrlState *ctrl;
+
+    qemu_irq            irq;
+    qemu_irq            reset_signal;
+    NPCM7xxBaseTimer base_timer;
+
+    uint32_t            wtcr;
+} NPCM7xxWatchdogTimer;
+
 /**
  * struct NPCM7xxTimerCtrlState - Timer Module device state.
  * @parent: System bus device.
  * @iomem: Memory region through which registers are accessed.
+ * @index: The index of this timer module.
  * @tisr: The Timer Interrupt Status Register.
- * @wtcr: The Watchdog Timer Control Register.
  * @timer: The five individual timers managed by this module.
+ * @watchdog_timer: The watchdog timer managed by this module.
  */
 struct NPCM7xxTimerCtrlState {
     SysBusDevice parent;
@@ -XXX,XX +XXX,XX @@ struct NPCM7xxTimerCtrlState {
     MemoryRegion iomem;
 
     uint32_t    tisr;
-    uint32_t    wtcr;
 
     NPCM7xxTimer timer[NPCM7XX_TIMERS_PER_CTRL];
+    NPCM7xxWatchdogTimer watchdog_timer;
 };
 
 #define TYPE_NPCM7XX_TIMER "npcm7xx-timer"
diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/npcm7xx.c
+++ b/hw/arm/npcm7xx.c
@@ -XXX,XX +XXX,XX @@ enum NPCM7xxInterrupt {
     NPCM7XX_TIMER12_IRQ,
     NPCM7XX_TIMER13_IRQ,
     NPCM7XX_TIMER14_IRQ,
+    NPCM7XX_WDG0_IRQ            = 47,   /* Timer Module 0 Watchdog */
+    NPCM7XX_WDG1_IRQ,                   /* Timer Module 1 Watchdog */
+    NPCM7XX_WDG2_IRQ,                   /* Timer Module 2 Watchdog */
 };
 
 /* Total number of GIC interrupts, including internal Cortex-A9 interrupts. */
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
             qemu_irq irq = npcm7xx_irq(s, first_irq + j);
             sysbus_connect_irq(sbd, j, irq);
         }
+
+        /* IRQ for watchdogs */
+        sysbus_connect_irq(sbd, NPCM7XX_TIMERS_PER_CTRL,
+                npcm7xx_irq(s, NPCM7XX_WDG0_IRQ + i));
+        /* GPIO that connects clk module with watchdog */
+        qdev_connect_gpio_out_named(DEVICE(&s->tim[i]),
+                NPCM7XX_WATCHDOG_RESET_GPIO_OUT, 0,
+                qdev_get_gpio_in_named(DEVICE(&s->clk),
+                        NPCM7XX_WATCHDOG_RESET_GPIO_IN, i));
     }
 
     /* UART0..3 (16550 compatible) */
diff --git a/hw/misc/npcm7xx_clk.c b/hw/misc/npcm7xx_clk.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/npcm7xx_clk.c
+++ b/hw/misc/npcm7xx_clk.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/osdep.h"
 
 #include "hw/misc/npcm7xx_clk.h"
+#include "hw/timer/npcm7xx_timer.h"
 #include "migration/vmstate.h"
 #include "qemu/error-report.h"
 #include "qemu/log.h"
@@ -XXX,XX +XXX,XX @@
 #include "qemu/timer.h"
 #include "qemu/units.h"
 #include "trace.h"
+#include "sysemu/watchdog.h"
 
 #define PLLCON_LOKI     BIT(31)
 #define PLLCON_LOKS     BIT(30)
@@ -XXX,XX +XXX,XX @@ static const uint32_t cold_reset_values[NPCM7XX_CLK_NR_REGS] = {
     [NPCM7XX_CLK_AHBCKFI]       = 0x000000c8,
 };
 
+/* Register Field Definitions */
+#define NPCM7XX_CLK_WDRCR_CA9C  BIT(0) /* Cortex A9 Cores */
+
+/* The number of watchdogs that can trigger a reset. */
+#define NPCM7XX_NR_WATCHDOGS    (3)
+
 static uint64_t npcm7xx_clk_read(void *opaque, hwaddr offset, unsigned size)
 {
     uint32_t reg = offset / sizeof(uint32_t);
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_clk_write(void *opaque, hwaddr offset,
     s->regs[reg] = value;
 }
 
+/* Perform reset action triggered by a watchdog */
+static void npcm7xx_clk_perform_watchdog_reset(void *opaque, int n,
+        int level)
+{
+    NPCM7xxCLKState *clk = NPCM7XX_CLK(opaque);
+    uint32_t rcr;
+
+    g_assert(n >= 0 && n <= NPCM7XX_NR_WATCHDOGS);
+    rcr = clk->regs[NPCM7XX_CLK_WD0RCR + n];
+    if (rcr & NPCM7XX_CLK_WDRCR_CA9C) {
+        watchdog_perform_action();
+    } else {
+        qemu_log_mask(LOG_UNIMP,
+                "%s: only CPU reset is implemented. (requested 0x%" PRIx32")\n",
+                __func__, rcr);
+    }
+}
+
 static const struct MemoryRegionOps npcm7xx_clk_ops = {
     .read       = npcm7xx_clk_read,
     .write      = npcm7xx_clk_write,
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_clk_init(Object *obj)
     memory_region_init_io(&s->iomem, obj, &npcm7xx_clk_ops, s,
                           TYPE_NPCM7XX_CLK, 4 * KiB);
     sysbus_init_mmio(&s->parent, &s->iomem);
+    qdev_init_gpio_in_named(DEVICE(s), npcm7xx_clk_perform_watchdog_reset,
+            NPCM7XX_WATCHDOG_RESET_GPIO_IN, NPCM7XX_NR_WATCHDOGS);
 }
 
 static const VMStateDescription vmstate_npcm7xx_clk = {
diff --git a/hw/timer/npcm7xx_timer.c b/hw/timer/npcm7xx_timer.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/timer/npcm7xx_timer.c
+++ b/hw/timer/npcm7xx_timer.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/osdep.h"
 
 #include "hw/irq.h"
+#include "hw/qdev-properties.h"
 #include "hw/misc/npcm7xx_clk.h"
 #include "hw/timer/npcm7xx_timer.h"
 #include "migration/vmstate.h"
@@ -XXX,XX +XXX,XX @@ enum NPCM7xxTimerRegisters {
 #define NPCM7XX_TCSR_PRESCALE_START     0
 #define NPCM7XX_TCSR_PRESCALE_LEN       8
 
+#define NPCM7XX_WTCR_WTCLK(rv)          extract32(rv, 10, 2)
+#define NPCM7XX_WTCR_FREEZE_EN          BIT(9)
+#define NPCM7XX_WTCR_WTE                BIT(7)
+#define NPCM7XX_WTCR_WTIE               BIT(6)
+#define NPCM7XX_WTCR_WTIS(rv)           extract32(rv, 4, 2)
+#define NPCM7XX_WTCR_WTIF               BIT(3)
+#define NPCM7XX_WTCR_WTRF               BIT(2)
+#define NPCM7XX_WTCR_WTRE               BIT(1)
+#define NPCM7XX_WTCR_WTR                BIT(0)
+
+/*
+ * The number of clock cycles between interrupt and reset in watchdog, used
+ * by the software to handle the interrupt before system is reset.
+ */
+#define NPCM7XX_WATCHDOG_INTERRUPT_TO_RESET_CYCLES 1024
+
+/* Start or resume the timer. */
+static void npcm7xx_timer_start(NPCM7xxBaseTimer *t)
+{
+    int64_t now;
+
+    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
+    t->expires_ns = now + t->remaining_ns;
+    timer_mod(&t->qtimer, t->expires_ns);
+}
+
+/* Stop counting. Record the time remaining so we can continue later. */
+static void npcm7xx_timer_pause(NPCM7xxBaseTimer *t)
+{
+    int64_t now;
+
+    timer_del(&t->qtimer);
+    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
+    t->remaining_ns = t->expires_ns - now;
+}
+
+/* Delete the timer and reset it to default state. */
+static void npcm7xx_timer_clear(NPCM7xxBaseTimer *t)
+{
+    timer_del(&t->qtimer);
+    t->expires_ns = 0;
+    t->remaining_ns = 0;
+}
+
 /*
  * Returns the index of timer in the tc->timer array. This can be used to
  * locate the registers that belong to this timer.
@@ -XXX,XX +XXX,XX @@ static uint32_t npcm7xx_timer_ns_to_count(NPCM7xxTimer *t, int64_t ns)
     return count;
 }
 
+static uint32_t npcm7xx_watchdog_timer_prescaler(const NPCM7xxWatchdogTimer *t)
+{
+    switch (NPCM7XX_WTCR_WTCLK(t->wtcr)) {
+    case 0:
+        return 1;
+    case 1:
+        return 256;
+    case 2:
+        return 2048;
+    case 3:
+        return 65536;
+    default:
+        g_assert_not_reached();
+    }
+}
+
+static void npcm7xx_watchdog_timer_reset_cycles(NPCM7xxWatchdogTimer *t,
+        int64_t cycles)
+{
+    uint32_t prescaler = npcm7xx_watchdog_timer_prescaler(t);
+    int64_t ns = (NANOSECONDS_PER_SECOND / NPCM7XX_TIMER_REF_HZ) * cycles;
+
+    /*
+     * The reset function always clears the current timer. The caller of the
+     * this needs to decide whether to start the watchdog timer based on
+     * specific flag in WTCR.
+     */
+    npcm7xx_timer_clear(&t->base_timer);
+
+    ns *= prescaler;
+    t->base_timer.remaining_ns = ns;
+}
+
+static void npcm7xx_watchdog_timer_reset(NPCM7xxWatchdogTimer *t)
+{
+    int64_t cycles = 1;
+    uint32_t s = NPCM7XX_WTCR_WTIS(t->wtcr);
+
+    g_assert(s <= 3);
+
+    cycles <<= NPCM7XX_WATCHDOG_BASETIME_SHIFT;
+    cycles <<= 2 * s;
+
+    npcm7xx_watchdog_timer_reset_cycles(t, cycles);
+}
+
 /*
  * Raise the interrupt line if there's a pending interrupt and interrupts are
  * enabled for this timer. If not, lower it.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_check_interrupt(NPCM7xxTimer *t)
     trace_npcm7xx_timer_irq(DEVICE(tc)->canonical_path, index, pending);
 }
 
-/* Start or resume the timer. */
-static void npcm7xx_timer_start(NPCM7xxTimer *t)
-{
-    int64_t now;
-
-    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
-    t->expires_ns = now + t->remaining_ns;
-    timer_mod(&t->qtimer, t->expires_ns);
-}
-
 /*
  * Called when the counter reaches zero. Sets the interrupt flag, and either
  * restarts or disables the timer.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_reached_zero(NPCM7xxTimer *t)
     tc->tisr |= BIT(index);
 
     if (t->tcsr & NPCM7XX_TCSR_PERIODIC) {
-        t->remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
+        t->base_timer.remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
         if (t->tcsr & NPCM7XX_TCSR_CEN) {
-            npcm7xx_timer_start(t);
+            npcm7xx_timer_start(&t->base_timer);
         }
     } else {
         t->tcsr &= ~(NPCM7XX_TCSR_CEN | NPCM7XX_TCSR_CACT);
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_reached_zero(NPCM7xxTimer *t)
     npcm7xx_timer_check_interrupt(t);
 }
 
-/* Stop counting. Record the time remaining so we can continue later. */
-static void npcm7xx_timer_pause(NPCM7xxTimer *t)
-{
-    int64_t now;
-
-    timer_del(&t->qtimer);
-    now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
-    t->remaining_ns = t->expires_ns - now;
-}
 
 /*
  * Restart the timer from its initial value. If the timer was enabled and stays
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_pause(NPCM7xxTimer *t)
  */
 static void npcm7xx_timer_restart(NPCM7xxTimer *t, uint32_t old_tcsr)
 {
-    t->remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
+    t->base_timer.remaining_ns = npcm7xx_timer_count_to_ns(t, t->ticr);
 
     if (old_tcsr & t->tcsr & NPCM7XX_TCSR_CEN) {
-        npcm7xx_timer_start(t);
+        npcm7xx_timer_start(&t->base_timer);
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static uint32_t npcm7xx_timer_read_tdr(NPCM7xxTimer *t)
     if (t->tcsr & NPCM7XX_TCSR_CEN) {
         int64_t now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
 
-        return npcm7xx_timer_ns_to_count(t, t->expires_ns - now);
+        return npcm7xx_timer_ns_to_count(t, t->base_timer.expires_ns - now);
     }
 
-    return npcm7xx_timer_ns_to_count(t, t->remaining_ns);
+    return npcm7xx_timer_ns_to_count(t, t->base_timer.remaining_ns);
 }
 
 static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
 
     if (npcm7xx_tcsr_prescaler(old_tcsr) != npcm7xx_tcsr_prescaler(new_tcsr)) {
         /* Recalculate time remaining based on the current TDR value. */
-        t->remaining_ns = npcm7xx_timer_count_to_ns(t, tdr);
+        t->base_timer.remaining_ns = npcm7xx_timer_count_to_ns(t, tdr);
         if (old_tcsr & t->tcsr & NPCM7XX_TCSR_CEN) {
-            npcm7xx_timer_start(t);
+            npcm7xx_timer_start(&t->base_timer);
         }
     }
 
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tcsr(NPCM7xxTimer *t, uint32_t new_tcsr)
     if ((old_tcsr ^ new_tcsr) & NPCM7XX_TCSR_CEN) {
         if (new_tcsr & NPCM7XX_TCSR_CEN) {
             t->tcsr |= NPCM7XX_TCSR_CACT;
-            npcm7xx_timer_start(t);
+            npcm7xx_timer_start(&t->base_timer);
         } else {
             t->tcsr &= ~NPCM7XX_TCSR_CACT;
-            npcm7xx_timer_pause(t);
-            if (t->remaining_ns <= 0) {
+            npcm7xx_timer_pause(&t->base_timer);
+            if (t->base_timer.remaining_ns <= 0) {
                 npcm7xx_timer_reached_zero(t);
             }
         }
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write_tisr(NPCM7xxTimerCtrlState *s, uint32_t value)
         if (value & (1U << i)) {
             npcm7xx_timer_check_interrupt(&s->timer[i]);
         }
+
     }
 }
 
+static void npcm7xx_timer_write_wtcr(NPCM7xxWatchdogTimer *t, uint32_t new_wtcr)
+{
+    uint32_t old_wtcr = t->wtcr;
+
+    /*
+     * WTIF and WTRF are cleared by writing 1. Writing 0 makes these bits
+     * unchanged.
+     */
+    if (new_wtcr & NPCM7XX_WTCR_WTIF) {
+        new_wtcr &= ~NPCM7XX_WTCR_WTIF;
+    } else if (old_wtcr & NPCM7XX_WTCR_WTIF) {
+        new_wtcr |= NPCM7XX_WTCR_WTIF;
+    }
+    if (new_wtcr & NPCM7XX_WTCR_WTRF) {
+        new_wtcr &= ~NPCM7XX_WTCR_WTRF;
+    } else if (old_wtcr & NPCM7XX_WTCR_WTRF) {
+        new_wtcr |= NPCM7XX_WTCR_WTRF;
+    }
+
+    t->wtcr = new_wtcr;
+
+    if (new_wtcr & NPCM7XX_WTCR_WTR) {
+        t->wtcr &= ~NPCM7XX_WTCR_WTR;
+        npcm7xx_watchdog_timer_reset(t);
+        if (new_wtcr & NPCM7XX_WTCR_WTE) {
+            npcm7xx_timer_start(&t->base_timer);
+        }
+    } else if ((old_wtcr ^ new_wtcr) & NPCM7XX_WTCR_WTE) {
+        if (new_wtcr & NPCM7XX_WTCR_WTE) {
+            npcm7xx_timer_start(&t->base_timer);
+        } else {
+            npcm7xx_timer_pause(&t->base_timer);
+        }
+    }
+
+}
+
 static hwaddr npcm7xx_tcsr_index(hwaddr reg)
 {
     switch (reg) {
@@ -XXX,XX +XXX,XX @@ static uint64_t npcm7xx_timer_read(void *opaque, hwaddr offset, unsigned size)
         break;
 
     case NPCM7XX_TIMER_WTCR:
-        value = s->wtcr;
+        value = s->watchdog_timer.wtcr;
         break;
 
     default:
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_write(void *opaque, hwaddr offset,
         return;
 
     case NPCM7XX_TIMER_WTCR:
-        qemu_log_mask(LOG_UNIMP, "%s: WTCR write not implemented: 0x%08x\n",
-                      __func__, value);
+        npcm7xx_timer_write_wtcr(&s->watchdog_timer, value);
         return;
     }
 
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_enter_reset(Object *obj, ResetType type)
     for (i = 0; i < NPCM7XX_TIMERS_PER_CTRL; i++) {
         NPCM7xxTimer *t = &s->timer[i];
 
-        timer_del(&t->qtimer);
-        t->expires_ns = 0;
-        t->remaining_ns = 0;
+        npcm7xx_timer_clear(&t->base_timer);
         t->tcsr = 0x00000005;
         t->ticr = 0x00000000;
     }
 
     s->tisr = 0x00000000;
-    s->wtcr = 0x00000400;
+    /*
+     * Set WTCLK to 1(default) and reset all flags except WTRF.
+     * WTRF is not reset during a core domain reset.
+     */
+    s->watchdog_timer.wtcr = 0x00000400 | (s->watchdog_timer.wtcr &
+            NPCM7XX_WTCR_WTRF);
+}
+
+static void npcm7xx_watchdog_timer_expired(void *opaque)
+{
+    NPCM7xxWatchdogTimer *t = opaque;
+
+    if (t->wtcr & NPCM7XX_WTCR_WTE) {
+        if (t->wtcr & NPCM7XX_WTCR_WTIF) {
+            if (t->wtcr & NPCM7XX_WTCR_WTRE) {
+                t->wtcr |= NPCM7XX_WTCR_WTRF;
+                /* send reset signal to CLK module*/
+                qemu_irq_raise(t->reset_signal);
+            }
+        } else {
+            t->wtcr |= NPCM7XX_WTCR_WTIF;
+            if (t->wtcr & NPCM7XX_WTCR_WTIE) {
+                /* send interrupt */
+                qemu_irq_raise(t->irq);
+            }
+            npcm7xx_watchdog_timer_reset_cycles(t,
+                    NPCM7XX_WATCHDOG_INTERRUPT_TO_RESET_CYCLES);
+            npcm7xx_timer_start(&t->base_timer);
+        }
+    }
 }
 
 static void npcm7xx_timer_hold_reset(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_hold_reset(Object *obj)
     for (i = 0; i < NPCM7XX_TIMERS_PER_CTRL; i++) {
         qemu_irq_lower(s->timer[i].irq);
     }
+    qemu_irq_lower(s->watchdog_timer.irq);
 }
 
 static void npcm7xx_timer_realize(DeviceState *dev, Error **errp)
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_timer_realize(DeviceState *dev, Error **errp)
     NPCM7xxTimerCtrlState *s = NPCM7XX_TIMER(dev);
     SysBusDevice *sbd = &s->parent;
     int i;
+    NPCM7xxWatchdogTimer *w;
 
     for (i = 0; i < NPCM7XX_TIMERS_PER_CTRL; i++) {
         NPCM7xxTimer *t = &s->timer[i];
         t->ctrl = s;
-        timer_init_ns(&t->qtimer, QEMU_CLOCK_VIRTUAL, npcm7xx_timer_expired, t);
+        timer_init_ns(&t->base_timer.qtimer, QEMU_CLOCK_VIRTUAL,
+                npcm7xx_timer_expired, t);
         sysbus_init_irq(sbd, &t->irq);
     }
 
+    w = &s->watchdog_timer;
+    w->ctrl = s;
+    timer_init_ns(&w->base_timer.qtimer, QEMU_CLOCK_VIRTUAL,
+            npcm7xx_watchdog_timer_expired, w);
+    sysbus_init_irq(sbd, &w->irq);
+
     memory_region_init_io(&s->iomem, OBJECT(s), &npcm7xx_timer_ops, s,
                           TYPE_NPCM7XX_TIMER, 4 * KiB);
     sysbus_init_mmio(sbd, &s->iomem);
+    qdev_init_gpio_out_named(dev, &w->reset_signal,
+            NPCM7XX_WATCHDOG_RESET_GPIO_OUT, 1);
 }
 
-static const VMStateDescription vmstate_npcm7xx_timer = {
-    .name = "npcm7xx-timer",
+static const VMStateDescription vmstate_npcm7xx_base_timer = {
+    .name = "npcm7xx-base-timer",
     .version_id = 0,
     .minimum_version_id = 0,
     .fields = (VMStateField[]) {
-        VMSTATE_TIMER(qtimer, NPCM7xxTimer),
-        VMSTATE_INT64(expires_ns, NPCM7xxTimer),
-        VMSTATE_INT64(remaining_ns, NPCM7xxTimer),
+        VMSTATE_TIMER(qtimer, NPCM7xxBaseTimer),
+        VMSTATE_INT64(expires_ns, NPCM7xxBaseTimer),
+        VMSTATE_INT64(remaining_ns, NPCM7xxBaseTimer),
+        VMSTATE_END_OF_LIST(),
+    },
+};
+
+static const VMStateDescription vmstate_npcm7xx_timer = {
+    .name = "npcm7xx-timer",
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_STRUCT(base_timer, NPCM7xxTimer,
+                             0, vmstate_npcm7xx_base_timer,
+                             NPCM7xxBaseTimer),
         VMSTATE_UINT32(tcsr, NPCM7xxTimer),
         VMSTATE_UINT32(ticr, NPCM7xxTimer),
         VMSTATE_END_OF_LIST(),
     },
 };
 
-static const VMStateDescription vmstate_npcm7xx_timer_ctrl = {
-    .name = "npcm7xx-timer-ctrl",
+static const VMStateDescription vmstate_npcm7xx_watchdog_timer = {
+    .name = "npcm7xx-watchdog-timer",
     .version_id = 0,
     .minimum_version_id = 0,
+    .fields = (VMStateField[]) {
+        VMSTATE_STRUCT(base_timer, NPCM7xxWatchdogTimer,
+                             0, vmstate_npcm7xx_base_timer,
+                             NPCM7xxBaseTimer),
+        VMSTATE_UINT32(wtcr, NPCM7xxWatchdogTimer),
+        VMSTATE_END_OF_LIST(),
+    },
+};
+
+static const VMStateDescription vmstate_npcm7xx_timer_ctrl = {
+    .name = "npcm7xx-timer-ctrl",
+    .version_id = 1,
+    .minimum_version_id = 1,
     .fields = (VMStateField[]) {
         VMSTATE_UINT32(tisr, NPCM7xxTimerCtrlState),
-        VMSTATE_UINT32(wtcr, NPCM7xxTimerCtrlState),
         VMSTATE_STRUCT_ARRAY(timer, NPCM7xxTimerCtrlState,
                              NPCM7XX_TIMERS_PER_CTRL, 0, vmstate_npcm7xx_timer,
                              NPCM7xxTimer),
+        VMSTATE_STRUCT(watchdog_timer, NPCM7xxTimerCtrlState,
+                             0, vmstate_npcm7xx_watchdog_timer,
+                             NPCM7xxWatchdogTimer),
         VMSTATE_END_OF_LIST(),
     },
 };
diff --git a/tests/qtest/npcm7xx_watchdog_timer-test.c b/tests/qtest/npcm7xx_watchdog_timer-test.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/qtest/npcm7xx_watchdog_timer-test.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * QTests for Nuvoton NPCM7xx Timer Watchdog Modules.
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms of the GNU General Public License as published by the
+ * Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
+ * for more details.
+ */
+
+#include "qemu/osdep.h"
+#include "qemu/timer.h"
+
+#include "libqos/libqtest.h"
+#include "qapi/qmp/qdict.h"
+
+#define WTCR_OFFSET     0x1c
+#define REF_HZ          (25000000)
+
+/* WTCR bit fields */
+#define WTCLK(rv)       ((rv) << 10)
+#define WTE             BIT(7)
+#define WTIE            BIT(6)
+#define WTIS(rv)        ((rv) << 4)
+#define WTIF            BIT(3)
+#define WTRF            BIT(2)
+#define WTRE            BIT(1)
+#define WTR             BIT(0)
+
+typedef struct Watchdog {
+    int irq;
+    uint64_t base_addr;
+} Watchdog;
+
+static const Watchdog watchdog_list[] = {
+    {
+        .irq        = 47,
+        .base_addr  = 0xf0008000
+    },
+    {
+        .irq        = 48,
+        .base_addr  = 0xf0009000
+    },
+    {
+        .irq        = 49,
+        .base_addr  = 0xf000a000
+    }
+};
+
+static int watchdog_index(const Watchdog *wd)
+{
+    ptrdiff_t diff = wd - watchdog_list;
+
+    g_assert(diff >= 0 && diff < ARRAY_SIZE(watchdog_list));
+
+    return diff;
+}
+
+static uint32_t watchdog_read_wtcr(QTestState *qts, const Watchdog *wd)
+{
+    return qtest_readl(qts, wd->base_addr + WTCR_OFFSET);
+}
+
+static void watchdog_write_wtcr(QTestState *qts, const Watchdog *wd,
+        uint32_t value)
+{
+    qtest_writel(qts, wd->base_addr + WTCR_OFFSET, value);
+}
+
+static uint32_t watchdog_prescaler(QTestState *qts, const Watchdog *wd)
+{
+    switch (extract32(watchdog_read_wtcr(qts, wd), 10, 2)) {
+    case 0:
+        return 1;
+    case 1:
+        return 256;
+    case 2:
+        return 2048;
+    case 3:
+        return 65536;
+    default:
+        g_assert_not_reached();
+    }
+}
+
+static QDict *get_watchdog_action(QTestState *qts)
+{
+    QDict *ev = qtest_qmp_eventwait_ref(qts, "WATCHDOG");
+    QDict *data;
+
+    data = qdict_get_qdict(ev, "data");
+    qobject_ref(data);
+    qobject_unref(ev);
+    return data;
+}
+
+#define RESET_CYCLES 1024
+static uint32_t watchdog_interrupt_cycles(QTestState *qts, const Watchdog *wd)
+{
+    uint32_t wtis = extract32(watchdog_read_wtcr(qts, wd), 4, 2);
+    return 1 << (14 + 2 * wtis);
+}
+
+static int64_t watchdog_calculate_steps(uint32_t count, uint32_t prescale)
+{
+    return (NANOSECONDS_PER_SECOND / REF_HZ) * count * prescale;
+}
+
+static int64_t watchdog_interrupt_steps(QTestState *qts, const Watchdog *wd)
+{
+    return watchdog_calculate_steps(watchdog_interrupt_cycles(qts, wd),
+            watchdog_prescaler(qts, wd));
+}
+
+/* Check wtcr can be reset to default value */
+static void test_init(gconstpointer watchdog)
+{
+    const Watchdog *wd = watchdog;
+    QTestState *qts = qtest_init("-machine quanta-gsj");
+
+    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+
+    watchdog_write_wtcr(qts, wd, WTCLK(1) | WTRF | WTIF | WTR);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(1));
+
+    qtest_quit(qts);
+}
+
+/* Check a watchdog can generate interrupt and reset actions */
+static void test_reset_action(gconstpointer watchdog)
+{
+    const Watchdog *wd = watchdog;
+    QTestState *qts = qtest_init("-machine quanta-gsj");
+    QDict *ad;
+
+    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+
+    watchdog_write_wtcr(qts, wd,
+            WTCLK(0) | WTE | WTRF | WTRE | WTIF | WTIE | WTR);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==,
+            WTCLK(0) | WTE | WTRE | WTIE);
+
+    /* Check a watchdog can generate an interrupt */
+    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==,
+            WTCLK(0) | WTE | WTIF | WTIE | WTRE);
+    g_assert_true(qtest_get_irq(qts, wd->irq));
+
+    /* Check a watchdog can generate a reset signal */
+    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
+                watchdog_prescaler(qts, wd)));
+    ad = get_watchdog_action(qts);
+    /* The signal is a reset signal */
+    g_assert_false(strcmp(qdict_get_str(ad, "action"), "reset"));
+    qobject_unref(ad);
+    qtest_qmp_eventwait(qts, "RESET");
+    /*
+     * Make sure WTCR is reset to default except for WTRF bit which shouldn't
+     * be reset.
+     */
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(1) | WTRF);
+    qtest_quit(qts);
+}
+
+/* Check a watchdog works with all possible WTCLK prescalers and WTIS cycles */
+static void test_prescaler(gconstpointer watchdog)
+{
+    const Watchdog *wd = watchdog;
+
+    for (int wtclk = 0; wtclk < 4; ++wtclk) {
+        for (int wtis = 0; wtis < 4; ++wtis) {
+            QTestState *qts = qtest_init("-machine quanta-gsj");
+
+            qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+            watchdog_write_wtcr(qts, wd,
+                    WTCLK(wtclk) | WTE | WTIF | WTIS(wtis) | WTIE | WTR);
+            /*
+             * The interrupt doesn't fire until watchdog_interrupt_steps()
+             * cycles passed
+             */
+            qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd) - 1);
+            g_assert_false(watchdog_read_wtcr(qts, wd) & WTIF);
+            g_assert_false(qtest_get_irq(qts, wd->irq));
+            qtest_clock_step(qts, 1);
+            g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
+            g_assert_true(qtest_get_irq(qts, wd->irq));
+
+            qtest_quit(qts);
+        }
+    }
+}
+
+/*
+ * Check a watchdog doesn't fire if corresponding flags (WTIE and WTRE) are not
+ * set.
+ */
+static void test_enabling_flags(gconstpointer watchdog)
+{
+    const Watchdog *wd = watchdog;
+    QTestState *qts;
+
+    /* Neither WTIE or WTRE is set, no interrupt or reset should happen */
+    qts = qtest_init("-machine quanta-gsj");
+    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTRF | WTR);
+    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
+    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
+    g_assert_false(qtest_get_irq(qts, wd->irq));
+    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
+                watchdog_prescaler(qts, wd)));
+    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
+    g_assert_false(watchdog_read_wtcr(qts, wd) & WTRF);
+    qtest_quit(qts);
+
+    /* Only WTIE is set, interrupt is triggered but reset should not happen */
+    qts = qtest_init("-machine quanta-gsj");
+    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTIE | WTRF | WTR);
+    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
+    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
+    g_assert_true(qtest_get_irq(qts, wd->irq));
+    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
+                watchdog_prescaler(qts, wd)));
+    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
+    g_assert_false(watchdog_read_wtcr(qts, wd) & WTRF);
+    qtest_quit(qts);
+
+    /* Only WTRE is set, interrupt is triggered but reset should not happen */
+    qts = qtest_init("-machine quanta-gsj");
+    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTRE | WTRF | WTR);
+    qtest_clock_step(qts, watchdog_interrupt_steps(qts, wd));
+    g_assert_true(watchdog_read_wtcr(qts, wd) & WTIF);
+    g_assert_false(qtest_get_irq(qts, wd->irq));
+    qtest_clock_step(qts, watchdog_calculate_steps(RESET_CYCLES,
+                watchdog_prescaler(qts, wd)));
+    g_assert_false(strcmp(qdict_get_str(get_watchdog_action(qts), "action"),
+                "reset"));
+    qtest_qmp_eventwait(qts, "RESET");
+    qtest_quit(qts);
+
+    /*
+     * The case when both flags are set is already tested in
+     * test_reset_action().
+     */
+}
+
+/* Check a watchdog can pause and resume by setting WTE bits */
+static void test_pause(gconstpointer watchdog)
+{
+    const Watchdog *wd = watchdog;
+    QTestState *qts;
+    int64_t remaining_steps, steps;
+
+    qts = qtest_init("-machine quanta-gsj");
+    qtest_irq_intercept_in(qts, "/machine/soc/a9mpcore/gic");
+    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIF | WTIE | WTRF | WTR);
+    remaining_steps = watchdog_interrupt_steps(qts, wd);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTE | WTIE);
+
+    /* Run for half of the execution period. */
+    steps = remaining_steps / 2;
+    remaining_steps -= steps;
+    qtest_clock_step(qts, steps);
+
+    /* Pause the watchdog */
+    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTIE);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTIE);
+
+    /* Run for a long period of time, the watchdog shouldn't fire */
+    qtest_clock_step(qts, steps << 4);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTIE);
+    g_assert_false(qtest_get_irq(qts, wd->irq));
+
+    /* Resume the watchdog */
+    watchdog_write_wtcr(qts, wd, WTCLK(0) | WTE | WTIE);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==, WTCLK(0) | WTE | WTIE);
+
+    /* Run for the reset of the execution period, the watchdog should fire */
+    qtest_clock_step(qts, remaining_steps);
+    g_assert_cmphex(watchdog_read_wtcr(qts, wd), ==,
+            WTCLK(0) | WTE | WTIF | WTIE);
+    g_assert_true(qtest_get_irq(qts, wd->irq));
+
+    qtest_quit(qts);
+}
+
+static void watchdog_add_test(const char *name, const Watchdog* wd,
+        GTestDataFunc fn)
+{
+    g_autofree char *full_name = g_strdup_printf(
+            "npcm7xx_watchdog_timer[%d]/%s", watchdog_index(wd), name);
+    qtest_add_data_func(full_name, wd, fn);
+}
+#define add_test(name, td) watchdog_add_test(#name, td, test_##name)
+
+int main(int argc, char **argv)
+{
+    g_test_init(&argc, &argv, NULL);
+    g_test_set_nonfatal_assertions();
+
+    for (int i = 0; i < ARRAY_SIZE(watchdog_list); ++i) {
+        const Watchdog *wd = &watchdog_list[i];
+
+        add_test(init, wd);
+        add_test(reset_action, wd);
+        add_test(prescaler, wd);
+        add_test(enabling_flags, wd);
+        add_test(pause, wd);
+    }
+
+    return g_test_run();
+}
diff --git a/MAINTAINERS b/MAINTAINERS
index XXXXXXX..XXXXXXX 100644
--- a/MAINTAINERS
+++ b/MAINTAINERS
@@ -XXX,XX +XXX,XX @@ L: qemu-arm@nongnu.org
 S: Supported
 F: hw/*/npcm7xx*
 F: include/hw/*/npcm7xx*
+F: tests/qtest/npcm7xx*
 F: pc-bios/npcm7xx_bootrom.bin
 F: roms/vbootrom
 
diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/tests/qtest/meson.build
+++ b/tests/qtest/meson.build
@@ -XXX,XX +XXX,XX @@ qtests_sparc64 = \
   (config_all_devices.has_key('CONFIG_ISA_TESTDEV') ? ['endianness-test'] : []) +            \
   ['prom-env-test', 'boot-serial-test']
 
-qtests_npcm7xx = ['npcm7xx_timer-test']
+qtests_npcm7xx = ['npcm7xx_timer-test', 'npcm7xx_watchdog_timer-test']
 qtests_arm = \
   (config_all_devices.has_key('CONFIG_PFLASH_CFI02') ? ['pflash-cfi02-test'] : []) +         \
   (config_all_devices.has_key('CONFIG_NPCM7XX') ? qtests_npcm7xx : []) + \
-- 
2.20.1

From: Havard Skinnemoen <hskinnemoen@google.com>

The RNG module returns a byte of randomness when the Data Valid bit is
set.

This implementation ignores the prescaler setting, and loads a new value
into RNGD every time RNGCS is read while the RNG is enabled and random
data is available.

A qtest featuring some simple randomness tests is included.

Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/nuvoton.rst    |   2 +-
 include/hw/arm/npcm7xx.h       |   2 +
 include/hw/misc/npcm7xx_rng.h  |  34 ++++
 hw/arm/npcm7xx.c               |   7 +-
 hw/misc/npcm7xx_rng.c          | 180 +++++++++++++++++++++
 tests/qtest/npcm7xx_rng-test.c | 278 +++++++++++++++++++++++++++++++++
 hw/misc/meson.build            |   1 +
 hw/misc/trace-events           |   4 +
 tests/qtest/meson.build        |   5 +-
 9 files changed, 510 insertions(+), 3 deletions(-)
 create mode 100644 include/hw/misc/npcm7xx_rng.h
 create mode 100644 hw/misc/npcm7xx_rng.c
 create mode 100644 tests/qtest/npcm7xx_rng-test.c

diff --git a/docs/system/arm/nuvoton.rst b/docs/system/arm/nuvoton.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/nuvoton.rst
+++ b/docs/system/arm/nuvoton.rst
@@ -XXX,XX +XXX,XX @@ Supported devices
  * DDR4 memory controller (dummy interface indicating memory training is done)
  * OTP controllers (no protection features)
  * Flash Interface Unit (FIU; no protection features)
+ * Random Number Generator (RNG)
 
 Missing devices
 ---------------
@@ -XXX,XX +XXX,XX @@ Missing devices
  * Peripheral SPI controller (PSPI)
  * Analog to Digital Converter (ADC)
  * SD/MMC host
- * Random Number Generator (RNG)
  * PECI interface
  * Pulse Width Modulation (PWM)
  * Tachometer
diff --git a/include/hw/arm/npcm7xx.h b/include/hw/arm/npcm7xx.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/npcm7xx.h
+++ b/include/hw/arm/npcm7xx.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/mem/npcm7xx_mc.h"
 #include "hw/misc/npcm7xx_clk.h"
 #include "hw/misc/npcm7xx_gcr.h"
+#include "hw/misc/npcm7xx_rng.h"
 #include "hw/nvram/npcm7xx_otp.h"
 #include "hw/timer/npcm7xx_timer.h"
 #include "hw/ssi/npcm7xx_fiu.h"
@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxState {
     NPCM7xxOTPState     key_storage;
     NPCM7xxOTPState     fuse_array;
     NPCM7xxMCState      mc;
+    NPCM7xxRNGState     rng;
     NPCM7xxFIUState     fiu[2];
 } NPCM7xxState;
 
diff --git a/include/hw/misc/npcm7xx_rng.h b/include/hw/misc/npcm7xx_rng.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/misc/npcm7xx_rng.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * Nuvoton NPCM7xx Random Number Generator.
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms of the GNU General Public License as published by the
+ * Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
+ * for more details.
+ */
+#ifndef NPCM7XX_RNG_H
+#define NPCM7XX_RNG_H
+
+#include "hw/sysbus.h"
+
+typedef struct NPCM7xxRNGState {
+    SysBusDevice parent;
+
+    MemoryRegion iomem;
+
+    uint8_t rngcs;
+    uint8_t rngd;
+    uint8_t rngmode;
+} NPCM7xxRNGState;
+
+#define TYPE_NPCM7XX_RNG "npcm7xx-rng"
+#define NPCM7XX_RNG(obj) OBJECT_CHECK(NPCM7xxRNGState, (obj), TYPE_NPCM7XX_RNG)
+
+#endif /* NPCM7XX_RNG_H */
diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/npcm7xx.c
+++ b/hw/arm/npcm7xx.c
@@ -XXX,XX +XXX,XX @@
 #define NPCM7XX_GCR_BA          (0xf0800000)
 #define NPCM7XX_CLK_BA          (0xf0801000)
 #define NPCM7XX_MC_BA           (0xf0824000)
+#define NPCM7XX_RNG_BA          (0xf000b000)
 
 /* Internal AHB SRAM */
 #define NPCM7XX_RAM3_BA         (0xc0008000)
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_init(Object *obj)
     object_initialize_child(obj, "otp2", &s->fuse_array,
                             TYPE_NPCM7XX_FUSE_ARRAY);
     object_initialize_child(obj, "mc", &s->mc, TYPE_NPCM7XX_MC);
+    object_initialize_child(obj, "rng", &s->rng, TYPE_NPCM7XX_RNG);
 
     for (i = 0; i < ARRAY_SIZE(s->tim); i++) {
         object_initialize_child(obj, "tim[*]", &s->tim[i], TYPE_NPCM7XX_TIMER);
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
                        serial_hd(i), DEVICE_LITTLE_ENDIAN);
     }
 
+    /* Random Number Generator. Cannot fail. */
+    sysbus_realize(SYS_BUS_DEVICE(&s->rng), &error_abort);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->rng), 0, NPCM7XX_RNG_BA);
+
     /*
      * Flash Interface Unit (FIU). Can fail if incorrect number of chip selects
      * specified, but this is a programming error.
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
     create_unimplemented_device("npcm7xx.vdmx",         0xe0800000,   4 * KiB);
     create_unimplemented_device("npcm7xx.pcierc",       0xe1000000,  64 * KiB);
     create_unimplemented_device("npcm7xx.kcs",          0xf0007000,   4 * KiB);
-    create_unimplemented_device("npcm7xx.rng",          0xf000b000,   4 * KiB);
     create_unimplemented_device("npcm7xx.adc",          0xf000c000,   4 * KiB);
     create_unimplemented_device("npcm7xx.gfxi",         0xf000e000,   4 * KiB);
     create_unimplemented_device("npcm7xx.gpio[0]",      0xf0010000,   4 * KiB);
diff --git a/hw/misc/npcm7xx_rng.c b/hw/misc/npcm7xx_rng.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/misc/npcm7xx_rng.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Nuvoton NPCM7xx Random Number Generator.
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms of the GNU General Public License as published by the
+ * Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
+ * for more details.
+ */
+
+#include "qemu/osdep.h"
+
+#include "hw/misc/npcm7xx_rng.h"
+#include "migration/vmstate.h"
+#include "qemu/bitops.h"
+#include "qemu/guest-random.h"
+#include "qemu/log.h"
+#include "qemu/module.h"
+#include "qemu/units.h"
+
+#include "trace.h"
+
+#define NPCM7XX_RNG_REGS_SIZE   (4 * KiB)
+
+#define NPCM7XX_RNGCS           (0x00)
+#define NPCM7XX_RNGCS_CLKP(rv)      extract32(rv, 2, 4)
+#define NPCM7XX_RNGCS_DVALID        BIT(1)
+#define NPCM7XX_RNGCS_RNGE          BIT(0)
+
+#define NPCM7XX_RNGD            (0x04)
+#define NPCM7XX_RNGMODE         (0x08)
+#define NPCM7XX_RNGMODE_NORMAL      (0x02)
+
+static bool npcm7xx_rng_is_enabled(NPCM7xxRNGState *s)
+{
+    return (s->rngcs & NPCM7XX_RNGCS_RNGE) &&
+        (s->rngmode == NPCM7XX_RNGMODE_NORMAL);
+}
+
+static uint64_t npcm7xx_rng_read(void *opaque, hwaddr offset, unsigned size)
+{
+    NPCM7xxRNGState *s = opaque;
+    uint64_t value = 0;
+
+    switch (offset) {
+    case NPCM7XX_RNGCS:
+        /*
+         * If the RNG is enabled, but we don't have any valid random data, try
+         * obtaining some and update the DVALID bit accordingly.
+         */
+        if (!npcm7xx_rng_is_enabled(s)) {
+            s->rngcs &= ~NPCM7XX_RNGCS_DVALID;
+        } else if (!(s->rngcs & NPCM7XX_RNGCS_DVALID)) {
+            uint8_t byte = 0;
+
+            if (qemu_guest_getrandom(&byte, sizeof(byte), NULL) == 0) {
+                s->rngd = byte;
+                s->rngcs |= NPCM7XX_RNGCS_DVALID;
+            }
+        }
+        value = s->rngcs;
+        break;
+    case NPCM7XX_RNGD:
+        if (npcm7xx_rng_is_enabled(s) && s->rngcs & NPCM7XX_RNGCS_DVALID) {
+            s->rngcs &= ~NPCM7XX_RNGCS_DVALID;
+            value = s->rngd;
+            s->rngd = 0;
+        }
+        break;
+    case NPCM7XX_RNGMODE:
+        value = s->rngmode;
+        break;
+
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: read from invalid offset 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, offset);
+        break;
+    }
+
+    trace_npcm7xx_rng_read(offset, value, size);
+
+    return value;
+}
+
+static void npcm7xx_rng_write(void *opaque, hwaddr offset, uint64_t value,
+                              unsigned size)
+{
+    NPCM7xxRNGState *s = opaque;
+
+    trace_npcm7xx_rng_write(offset, value, size);
+
+    switch (offset) {
+    case NPCM7XX_RNGCS:
+        s->rngcs &= NPCM7XX_RNGCS_DVALID;
+        s->rngcs |= value & ~NPCM7XX_RNGCS_DVALID;
+        break;
+    case NPCM7XX_RNGD:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: write to read-only register @ 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, offset);
+        break;
+    case NPCM7XX_RNGMODE:
+        s->rngmode = value;
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: write to invalid offset 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, offset);
+        break;
+    }
+}
+
+static const MemoryRegionOps npcm7xx_rng_ops = {
+    .read = npcm7xx_rng_read,
+    .write = npcm7xx_rng_write,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    .valid = {
+        .min_access_size = 1,
+        .max_access_size = 4,
+        .unaligned = false,
+    },
+};
+
+static void npcm7xx_rng_enter_reset(Object *obj, ResetType type)
+{
+    NPCM7xxRNGState *s = NPCM7XX_RNG(obj);
+
+    s->rngcs = 0;
+    s->rngd = 0;
+    s->rngmode = 0;
+}
+
+static void npcm7xx_rng_init(Object *obj)
+{
+    NPCM7xxRNGState *s = NPCM7XX_RNG(obj);
+
+    memory_region_init_io(&s->iomem, obj, &npcm7xx_rng_ops, s, "regs",
+                          NPCM7XX_RNG_REGS_SIZE);
+    sysbus_init_mmio(&s->parent, &s->iomem);
+}
+
+static const VMStateDescription vmstate_npcm7xx_rng = {
+    .name = "npcm7xx-rng",
+    .version_id = 0,
+    .minimum_version_id = 0,
+    .fields = (VMStateField[]) {
+        VMSTATE_UINT8(rngcs, NPCM7xxRNGState),
+        VMSTATE_UINT8(rngd, NPCM7xxRNGState),
+        VMSTATE_UINT8(rngmode, NPCM7xxRNGState),
+        VMSTATE_END_OF_LIST(),
+    },
+};
+
+static void npcm7xx_rng_class_init(ObjectClass *klass, void *data)
+{
+    ResettableClass *rc = RESETTABLE_CLASS(klass);
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->desc = "NPCM7xx Random Number Generator";
+    dc->vmsd = &vmstate_npcm7xx_rng;
+    rc->phases.enter = npcm7xx_rng_enter_reset;
+}
+
+static const TypeInfo npcm7xx_rng_types[] = {
+    {
+        .name = TYPE_NPCM7XX_RNG,
+        .parent = TYPE_SYS_BUS_DEVICE,
+        .instance_size = sizeof(NPCM7xxRNGState),
+        .class_init = npcm7xx_rng_class_init,
+        .instance_init = npcm7xx_rng_init,
+    },
+};
+DEFINE_TYPES(npcm7xx_rng_types);
diff --git a/tests/qtest/npcm7xx_rng-test.c b/tests/qtest/npcm7xx_rng-test.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/qtest/npcm7xx_rng-test.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * QTest testcase for the Nuvoton NPCM7xx Random Number Generator
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms of the GNU General Public License as published by the
+ * Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
+ * for more details.
+ */
+
+#include "qemu/osdep.h"
+
+#include <math.h>
+
+#include "libqtest-single.h"
+#include "qemu/bitops.h"
+
+#define RNG_BASE_ADDR   0xf000b000
+
+/* Control and Status Register */
+#define RNGCS   0x00
+# define DVALID     BIT(1)  /* Data Valid */
+# define RNGE       BIT(0)  /* RNG Enable */
+/* Data Register */
+#define RNGD    0x04
+/* Mode Register */
+#define RNGMODE 0x08
+# define ROSEL_NORMAL   (2) /* RNG only works in this mode */
+
+/* Number of bits to collect for randomness tests. */
+#define TEST_INPUT_BITS  (128)
+
+static void rng_writeb(unsigned int offset, uint8_t value)
+{
+    writeb(RNG_BASE_ADDR + offset, value);
+}
+
+static uint8_t rng_readb(unsigned int offset)
+{
+    return readb(RNG_BASE_ADDR + offset);
+}
+
+/* Disable RNG and set normal ring oscillator mode. */
+static void rng_reset(void)
+{
+    rng_writeb(RNGCS, 0);
+    rng_writeb(RNGMODE, ROSEL_NORMAL);
+}
+
+/* Reset RNG and then enable it. */
+static void rng_reset_enable(void)
+{
+    rng_reset();
+    rng_writeb(RNGCS, RNGE);
+}
+
+/* Wait until Data Valid bit is set. */
+static bool rng_wait_ready(void)
+{
+    /* qemu_guest_getrandom may fail. Assume it won't fail 10 times in a row. */
+    int retries = 10;
+
+    while (retries-- > 0) {
+        if (rng_readb(RNGCS) & DVALID) {
+            return true;
+        }
+    }
+
+    return false;
+}
+
+/*
+ * Perform a frequency (monobit) test, as defined by NIST SP 800-22, on the
+ * sequence in buf and return the P-value. This represents the probability of a
+ * truly random sequence having the same proportion of zeros and ones as the
+ * sequence in buf.
+ *
+ * An RNG which always returns 0x00 or 0xff, or has some bits stuck at 0 or 1,
+ * will fail this test. However, an RNG which always returns 0x55, 0xf0 or some
+ * other value with an equal number of zeroes and ones will pass.
+ */
+static double calc_monobit_p(const uint8_t *buf, unsigned int len)
+{
+    unsigned int i;
+    double s_obs;
+    int sn = 0;
+
+    for (i = 0; i < len; i++) {
+        /*
+         * Each 1 counts as 1, each 0 counts as -1.
+         * s = cp - (8 - cp) = 2 * cp - 8
+         */
+        sn += 2 * ctpop8(buf[i]) - 8;
+    }
+
+    s_obs = abs(sn) / sqrt(len * BITS_PER_BYTE);
+
+    return erfc(s_obs / sqrt(2));
+}
+
+/*
+ * Perform a runs test, as defined by NIST SP 800-22, and return the P-value.
+ * This represents the probability of a truly random sequence having the same
+ * number of runs (i.e. uninterrupted sequences of identical bits) as the
+ * sequence in buf.
+ */
+static double calc_runs_p(const unsigned long *buf, unsigned int nr_bits)
+{
+    unsigned int j;
+    unsigned int k;
+    int nr_ones = 0;
+    int vn_obs = 0;
+    double pi;
+
+    g_assert(nr_bits % BITS_PER_LONG == 0);
+
+    for (j = 0; j < nr_bits / BITS_PER_LONG; j++) {
+        nr_ones += __builtin_popcountl(buf[j]);
+    }
+    pi = (double)nr_ones / nr_bits;
+
+    for (k = 0; k < nr_bits - 1; k++) {
+        vn_obs += !(test_bit(k, buf) ^ test_bit(k + 1, buf));
+    }
+    vn_obs += 1;
+
+    return erfc(fabs(vn_obs - 2 * nr_bits * pi * (1.0 - pi))
+                / (2 * sqrt(2 * nr_bits) * pi * (1.0 - pi)));
+}
+
+/*
+ * Verifies that DVALID is clear, and RNGD reads zero, when RNGE is cleared,
+ * and DVALID eventually becomes set when RNGE is set.
+ */
+static void test_enable_disable(void)
+{
+    /* Disable: DVALID should not be set, and RNGD should read zero */
+    rng_reset();
+    g_assert_cmphex(rng_readb(RNGCS), ==, 0);
+    g_assert_cmphex(rng_readb(RNGD), ==, 0);
+
+    /* Enable: DVALID should be set, but we can't make assumptions about RNGD */
+    rng_writeb(RNGCS, RNGE);
+    g_assert_true(rng_wait_ready());
+    g_assert_cmphex(rng_readb(RNGCS), ==, DVALID | RNGE);
+
+    /* Disable: DVALID should not be set, and RNGD should read zero */
+    rng_writeb(RNGCS, 0);
+    g_assert_cmphex(rng_readb(RNGCS), ==, 0);
+    g_assert_cmphex(rng_readb(RNGD), ==, 0);
+}
+
+/*
+ * Verifies that the RNG only produces data when RNGMODE is set to 'normal'
+ * ring oscillator mode.
+ */
+static void test_rosel(void)
+{
+    rng_reset_enable();
+    g_assert_true(rng_wait_ready());
+    rng_writeb(RNGMODE, 0);
+    g_assert_false(rng_wait_ready());
+    rng_writeb(RNGMODE, ROSEL_NORMAL);
+    g_assert_true(rng_wait_ready());
+    rng_writeb(RNGMODE, 0);
+    g_assert_false(rng_wait_ready());
+}
+
+/*
+ * Verifies that a continuous sequence of bits collected after enabling the RNG
+ * satisfies a monobit test.
+ */
+static void test_continuous_monobit(void)
+{
+    uint8_t buf[TEST_INPUT_BITS / BITS_PER_BYTE];
+    unsigned int i;
+
+    rng_reset_enable();
+    for (i = 0; i < sizeof(buf); i++) {
+        g_assert_true(rng_wait_ready());
+        buf[i] = rng_readb(RNGD);
+    }
+
+    g_assert_cmpfloat(calc_monobit_p(buf, sizeof(buf)), >, 0.01);
+}
+
+/*
+ * Verifies that a continuous sequence of bits collected after enabling the RNG
+ * satisfies a runs test.
+ */
+static void test_continuous_runs(void)
+{
+    union {
+        unsigned long l[TEST_INPUT_BITS / BITS_PER_LONG];
+        uint8_t c[TEST_INPUT_BITS / BITS_PER_BYTE];
+    } buf;
+    unsigned int i;
+
+    rng_reset_enable();
+    for (i = 0; i < sizeof(buf); i++) {
+        g_assert_true(rng_wait_ready());
+        buf.c[i] = rng_readb(RNGD);
+    }
+
+    g_assert_cmpfloat(calc_runs_p(buf.l, sizeof(buf) * BITS_PER_BYTE), >, 0.01);
+}
+
+/*
+ * Verifies that the first data byte collected after enabling the RNG satisfies
+ * a monobit test.
+ */
+static void test_first_byte_monobit(void)
+{
+    /* Enable, collect one byte, disable. Repeat until we have 100 bits. */
+    uint8_t buf[TEST_INPUT_BITS / BITS_PER_BYTE];
+    unsigned int i;
+
+    rng_reset();
+    for (i = 0; i < sizeof(buf); i++) {
+        rng_writeb(RNGCS, RNGE);
+        g_assert_true(rng_wait_ready());
+        buf[i] = rng_readb(RNGD);
+        rng_writeb(RNGCS, 0);
+    }
+
+    g_assert_cmpfloat(calc_monobit_p(buf, sizeof(buf)), >, 0.01);
+}
+
+/*
+ * Verifies that the first data byte collected after enabling the RNG satisfies
+ * a runs test.
+ */
+static void test_first_byte_runs(void)
+{
+    /* Enable, collect one byte, disable. Repeat until we have 100 bits. */
+    union {
+        unsigned long l[TEST_INPUT_BITS / BITS_PER_LONG];
+        uint8_t c[TEST_INPUT_BITS / BITS_PER_BYTE];
+    } buf;
+    unsigned int i;
+
+    rng_reset();
+    for (i = 0; i < sizeof(buf); i++) {
+        rng_writeb(RNGCS, RNGE);
+        g_assert_true(rng_wait_ready());
+        buf.c[i] = rng_readb(RNGD);
+        rng_writeb(RNGCS, 0);
+    }
+
+    g_assert_cmpfloat(calc_runs_p(buf.l, sizeof(buf) * BITS_PER_BYTE), >, 0.01);
+}
+
+int main(int argc, char **argv)
+{
+    int ret;
+
+    g_test_init(&argc, &argv, NULL);
+    g_test_set_nonfatal_assertions();
+
+    qtest_add_func("npcm7xx_rng/enable_disable", test_enable_disable);
+    qtest_add_func("npcm7xx_rng/rosel", test_rosel);
+    qtest_add_func("npcm7xx_rng/continuous/monobit", test_continuous_monobit);
+    qtest_add_func("npcm7xx_rng/continuous/runs", test_continuous_runs);
+    qtest_add_func("npcm7xx_rng/first_byte/monobit", test_first_byte_monobit);
+    qtest_add_func("npcm7xx_rng/first_byte/runs", test_first_byte_runs);
+
+    qtest_start("-machine npcm750-evb");
+    ret = g_test_run();
+    qtest_end();
+
+    return ret;
+}
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_MAINSTONE', if_true: files('mst_fpga.c'))
 softmmu_ss.add(when: 'CONFIG_NPCM7XX', if_true: files(
   'npcm7xx_clk.c',
   'npcm7xx_gcr.c',
+  'npcm7xx_rng.c',
 ))
 softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files(
   'omap_clk.c',
diff --git a/hw/misc/trace-events b/hw/misc/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/trace-events
+++ b/hw/misc/trace-events
@@ -XXX,XX +XXX,XX @@ npcm7xx_clk_write(uint64_t offset, uint32_t value) "offset: 0x%04" PRIx64 " valu
 npcm7xx_gcr_read(uint64_t offset, uint32_t value) " offset: 0x%04" PRIx64 " value: 0x%08" PRIx32
 npcm7xx_gcr_write(uint64_t offset, uint32_t value) "offset: 0x%04" PRIx64 " value: 0x%08" PRIx32
 
+# npcm7xx_rng.c
+npcm7xx_rng_read(uint64_t offset, uint64_t value, unsigned size) "offset: 0x%04" PRIx64 " value: 0x%02" PRIx64 " size: %u"
+npcm7xx_rng_write(uint64_t offset, uint64_t value, unsigned size) "offset: 0x%04" PRIx64 " value: 0x%02" PRIx64 " size: %u"
+
 # stm32f4xx_syscfg.c
 stm32f4xx_syscfg_set_irq(int gpio, int line, int level) "Interupt: GPIO: %d, Line: %d; Level: %d"
 stm32f4xx_pulse_exti(int irq) "Pulse EXTI: %d"
diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/tests/qtest/meson.build
+++ b/tests/qtest/meson.build
@@ -XXX,XX +XXX,XX @@ qtests_sparc64 = \
   (config_all_devices.has_key('CONFIG_ISA_TESTDEV') ? ['endianness-test'] : []) +            \
   ['prom-env-test', 'boot-serial-test']
 
-qtests_npcm7xx = ['npcm7xx_timer-test', 'npcm7xx_watchdog_timer-test']
+qtests_npcm7xx = \
+  ['npcm7xx_rng-test',
+   'npcm7xx_timer-test',
+   'npcm7xx_watchdog_timer-test']
 qtests_arm = \
   (config_all_devices.has_key('CONFIG_PFLASH_CFI02') ? ['pflash-cfi02-test'] : []) +         \
   (config_all_devices.has_key('CONFIG_NPCM7XX') ? qtests_npcm7xx : []) + \
-- 
2.20.1

From: Havard Skinnemoen <hskinnemoen@google.com>

The NPCM730 and NPCM750 chips have a single USB host port shared between
a USB 2.0 EHCI host controller and a USB 1.1 OHCI host controller. This
adds support for both of them.

Testing notes:
  * With -device usb-kbd, qemu will automatically insert a full-speed
    hub, and the keyboard becomes controlled by the OHCI controller.
  * With -device usb-kbd,bus=usb-bus.0,port=1, the keyboard is directly
    attached to the port without any hubs, and the device becomes
    controlled by the EHCI controller since it's high speed capable.
  * With -device usb-kbd,bus=usb-bus.0,port=1,usb_version=1, the
    keyboard is directly attached to the port, but it only advertises
    itself as full-speed capable, so it becomes controlled by the OHCI
    controller.

In all cases, the keyboard device enumerates correctly.

Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
Reviewed-by: Gerd Hoffmann <kraxel@redhat.com>
Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/nuvoton.rst |  2 +-
 hw/usb/hcd-ehci.h           |  1 +
 include/hw/arm/npcm7xx.h    |  4 ++++
 hw/arm/npcm7xx.c            | 27 +++++++++++++++++++++++++--
 hw/usb/hcd-ehci-sysbus.c    | 19 +++++++++++++++++++
 5 files changed, 50 insertions(+), 3 deletions(-)

From: Havard Skinnemoen <hskinnemoen@google.com>

The NPCM7xx chips have multiple GPIO controllers that are mostly
identical except for some minor differences like the reset values of
some registers. Each controller controls up to 32 pins.

Each individual pin is modeled as a pair of unnamed GPIOs -- one for
emitting the actual pin state, and one for driving the pin externally.
Like the nRF51 GPIO controller, a gpio level may be negative, which
means the pin is not driven, or floating.

Reviewed-by: Tyrone Ting <kfting@nuvoton.com>
Signed-off-by: Havard Skinnemoen <hskinnemoen@google.com>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 docs/system/arm/nuvoton.rst     |   2 +-
 include/hw/arm/npcm7xx.h        |   2 +
 include/hw/gpio/npcm7xx_gpio.h  |  55 +++++
 hw/arm/npcm7xx.c                |  80 ++++++
 hw/gpio/npcm7xx_gpio.c          | 424 ++++++++++++++++++++++++++++++++
 tests/qtest/npcm7xx_gpio-test.c | 385 +++++++++++++++++++++++++++++
 hw/gpio/meson.build             |   1 +
 hw/gpio/trace-events            |   7 +
 tests/qtest/meson.build         |   3 +-
 9 files changed, 957 insertions(+), 2 deletions(-)
 create mode 100644 include/hw/gpio/npcm7xx_gpio.h
 create mode 100644 hw/gpio/npcm7xx_gpio.c
 create mode 100644 tests/qtest/npcm7xx_gpio-test.c

diff --git a/docs/system/arm/nuvoton.rst b/docs/system/arm/nuvoton.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/system/arm/nuvoton.rst
+++ b/docs/system/arm/nuvoton.rst
@@ -XXX,XX +XXX,XX @@ Supported devices
  * Flash Interface Unit (FIU; no protection features)
  * Random Number Generator (RNG)
  * USB host (USBH)
+ * GPIO controller
 
 Missing devices
 ---------------
 
- * GPIO controller
  * LPC/eSPI host-to-BMC interface, including
 
    * Keyboard and mouse controller interface (KBCI)
diff --git a/include/hw/arm/npcm7xx.h b/include/hw/arm/npcm7xx.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/npcm7xx.h
+++ b/include/hw/arm/npcm7xx.h
@@ -XXX,XX +XXX,XX @@
 
 #include "hw/boards.h"
 #include "hw/cpu/a9mpcore.h"
+#include "hw/gpio/npcm7xx_gpio.h"
 #include "hw/mem/npcm7xx_mc.h"
 #include "hw/misc/npcm7xx_clk.h"
 #include "hw/misc/npcm7xx_gcr.h"
@@ -XXX,XX +XXX,XX @@ typedef struct NPCM7xxState {
     NPCM7xxOTPState     fuse_array;
     NPCM7xxMCState      mc;
     NPCM7xxRNGState     rng;
+    NPCM7xxGPIOState    gpio[8];
     EHCISysBusState     ehci;
     OHCISysBusState     ohci;
     NPCM7xxFIUState     fiu[2];
diff --git a/include/hw/gpio/npcm7xx_gpio.h b/include/hw/gpio/npcm7xx_gpio.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/gpio/npcm7xx_gpio.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * Nuvoton NPCM7xx General Purpose Input / Output (GPIO)
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License
+ * version 2 as published by the Free Software Foundation.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
+ * GNU General Public License for more details.
+ */
+#ifndef NPCM7XX_GPIO_H
+#define NPCM7XX_GPIO_H
+
+#include "exec/memory.h"
+#include "hw/sysbus.h"
+
+/* Number of pins managed by each controller. */
+#define NPCM7XX_GPIO_NR_PINS (32)
+
+/*
+ * Number of registers in our device state structure. Don't change this without
+ * incrementing the version_id in the vmstate.
+ */
+#define NPCM7XX_GPIO_NR_REGS (0x80 / sizeof(uint32_t))
+
+typedef struct NPCM7xxGPIOState {
+    SysBusDevice parent;
+
+    /* Properties to be defined by the SoC */
+    uint32_t reset_pu;
+    uint32_t reset_pd;
+    uint32_t reset_osrc;
+    uint32_t reset_odsc;
+
+    MemoryRegion mmio;
+
+    qemu_irq irq;
+    qemu_irq output[NPCM7XX_GPIO_NR_PINS];
+
+    uint32_t pin_level;
+    uint32_t ext_level;
+    uint32_t ext_driven;
+
+    uint32_t regs[NPCM7XX_GPIO_NR_REGS];
+} NPCM7xxGPIOState;
+
+#define TYPE_NPCM7XX_GPIO "npcm7xx-gpio"
+#define NPCM7XX_GPIO(obj) \
+    OBJECT_CHECK(NPCM7xxGPIOState, (obj), TYPE_NPCM7XX_GPIO)
+
+#endif /* NPCM7XX_GPIO_H */
diff --git a/hw/arm/npcm7xx.c b/hw/arm/npcm7xx.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/npcm7xx.c
+++ b/hw/arm/npcm7xx.c
@@ -XXX,XX +XXX,XX @@ enum NPCM7xxInterrupt {
     NPCM7XX_WDG2_IRQ,                   /* Timer Module 2 Watchdog */
     NPCM7XX_EHCI_IRQ            = 61,
     NPCM7XX_OHCI_IRQ            = 62,
+    NPCM7XX_GPIO0_IRQ           = 116,
+    NPCM7XX_GPIO1_IRQ,
+    NPCM7XX_GPIO2_IRQ,
+    NPCM7XX_GPIO3_IRQ,
+    NPCM7XX_GPIO4_IRQ,
+    NPCM7XX_GPIO5_IRQ,
+    NPCM7XX_GPIO6_IRQ,
+    NPCM7XX_GPIO7_IRQ,
 };
 
 /* Total number of GIC interrupts, including internal Cortex-A9 interrupts. */
@@ -XXX,XX +XXX,XX @@ static const hwaddr npcm7xx_fiu3_flash_addr[] = {
     0xb8000000, /* CS3 */
 };
 
+static const struct {
+    hwaddr regs_addr;
+    uint32_t unconnected_pins;
+    uint32_t reset_pu;
+    uint32_t reset_pd;
+    uint32_t reset_osrc;
+    uint32_t reset_odsc;
+} npcm7xx_gpio[] = {
+    {
+        .regs_addr = 0xf0010000,
+        .reset_pu = 0xff03ffff,
+        .reset_pd = 0x00fc0000,
+    }, {
+        .regs_addr = 0xf0011000,
+        .unconnected_pins = 0x0000001e,
+        .reset_pu = 0xfefffe07,
+        .reset_pd = 0x010001e0,
+    }, {
+        .regs_addr = 0xf0012000,
+        .reset_pu = 0x780fffff,
+        .reset_pd = 0x07f00000,
+        .reset_odsc = 0x00700000,
+    }, {
+        .regs_addr = 0xf0013000,
+        .reset_pu = 0x00fc0000,
+        .reset_pd = 0xff000000,
+    }, {
+        .regs_addr = 0xf0014000,
+        .reset_pu = 0xffffffff,
+    }, {
+        .regs_addr = 0xf0015000,
+        .reset_pu = 0xbf83f801,
+        .reset_pd = 0x007c0000,
+        .reset_osrc = 0x000000f1,
+        .reset_odsc = 0x3f9f80f1,
+    }, {
+        .regs_addr = 0xf0016000,
+        .reset_pu = 0xfc00f801,
+        .reset_pd = 0x000007fe,
+        .reset_odsc = 0x00000800,
+    }, {
+        .regs_addr = 0xf0017000,
+        .unconnected_pins = 0xffffff00,
+        .reset_pu = 0x0000007f,
+        .reset_osrc = 0x0000007f,
+        .reset_odsc = 0x0000007f,
+    },
+};
+
 static const struct {
     const char *name;
     hwaddr regs_addr;
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_init(Object *obj)
         object_initialize_child(obj, "tim[*]", &s->tim[i], TYPE_NPCM7XX_TIMER);
     }
 
+    for (i = 0; i < ARRAY_SIZE(s->gpio); i++) {
+        object_initialize_child(obj, "gpio[*]", &s->gpio[i], TYPE_NPCM7XX_GPIO);
+    }
+
     object_initialize_child(obj, "ehci", &s->ehci, TYPE_NPCM7XX_EHCI);
     object_initialize_child(obj, "ohci", &s->ohci, TYPE_SYSBUS_OHCI);
 
@@ -XXX,XX +XXX,XX @@ static void npcm7xx_realize(DeviceState *dev, Error **errp)
     sysbus_realize(SYS_BUS_DEVICE(&s->rng), &error_abort);
     sysbus_mmio_map(SYS_BUS_DEVICE(&s->rng), 0, NPCM7XX_RNG_BA);
 
+    /* GPIO modules. Cannot fail. */
+    QEMU_BUILD_BUG_ON(ARRAY_SIZE(npcm7xx_gpio) != ARRAY_SIZE(s->gpio));
+    for (i = 0; i < ARRAY_SIZE(s->gpio); i++) {
+        Object *obj = OBJECT(&s->gpio[i]);
+
+        object_property_set_uint(obj, "reset-pullup",
+                                 npcm7xx_gpio[i].reset_pu, &error_abort);
+        object_property_set_uint(obj, "reset-pulldown",
+                                 npcm7xx_gpio[i].reset_pd, &error_abort);
+        object_property_set_uint(obj, "reset-osrc",
+                                 npcm7xx_gpio[i].reset_osrc, &error_abort);
+        object_property_set_uint(obj, "reset-odsc",
+                                 npcm7xx_gpio[i].reset_odsc, &error_abort);
+        sysbus_realize(SYS_BUS_DEVICE(obj), &error_abort);
+        sysbus_mmio_map(SYS_BUS_DEVICE(obj), 0, npcm7xx_gpio[i].regs_addr);
+        sysbus_connect_irq(SYS_BUS_DEVICE(obj), 0,
+                           npcm7xx_irq(s, NPCM7XX_GPIO0_IRQ + i));
+    }
+
     /* USB Host */
     object_property_set_bool(OBJECT(&s->ehci), "companion-enable", true,
                              &error_abort);
diff --git a/hw/gpio/npcm7xx_gpio.c b/hw/gpio/npcm7xx_gpio.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/gpio/npcm7xx_gpio.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Nuvoton NPCM7xx General Purpose Input / Output (GPIO)
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License
+ * version 2 as published by the Free Software Foundation.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
+ * GNU General Public License for more details.
+ */
+
+#include "qemu/osdep.h"
+
+#include "hw/gpio/npcm7xx_gpio.h"
+#include "hw/irq.h"
+#include "hw/qdev-properties.h"
+#include "migration/vmstate.h"
+#include "qapi/error.h"
+#include "qemu/log.h"
+#include "qemu/module.h"
+#include "qemu/units.h"
+#include "trace.h"
+
+/* 32-bit register indices. */
+enum NPCM7xxGPIORegister {
+    NPCM7XX_GPIO_TLOCK1,
+    NPCM7XX_GPIO_DIN,
+    NPCM7XX_GPIO_POL,
+    NPCM7XX_GPIO_DOUT,
+    NPCM7XX_GPIO_OE,
+    NPCM7XX_GPIO_OTYP,
+    NPCM7XX_GPIO_MP,
+    NPCM7XX_GPIO_PU,
+    NPCM7XX_GPIO_PD,
+    NPCM7XX_GPIO_DBNC,
+    NPCM7XX_GPIO_EVTYP,
+    NPCM7XX_GPIO_EVBE,
+    NPCM7XX_GPIO_OBL0,
+    NPCM7XX_GPIO_OBL1,
+    NPCM7XX_GPIO_OBL2,
+    NPCM7XX_GPIO_OBL3,
+    NPCM7XX_GPIO_EVEN,
+    NPCM7XX_GPIO_EVENS,
+    NPCM7XX_GPIO_EVENC,
+    NPCM7XX_GPIO_EVST,
+    NPCM7XX_GPIO_SPLCK,
+    NPCM7XX_GPIO_MPLCK,
+    NPCM7XX_GPIO_IEM,
+    NPCM7XX_GPIO_OSRC,
+    NPCM7XX_GPIO_ODSC,
+    NPCM7XX_GPIO_DOS = 0x68 / sizeof(uint32_t),
+    NPCM7XX_GPIO_DOC,
+    NPCM7XX_GPIO_OES,
+    NPCM7XX_GPIO_OEC,
+    NPCM7XX_GPIO_TLOCK2 = 0x7c / sizeof(uint32_t),
+    NPCM7XX_GPIO_REGS_END,
+};
+
+#define NPCM7XX_GPIO_REGS_SIZE (4 * KiB)
+
+#define NPCM7XX_GPIO_LOCK_MAGIC1 (0xc0defa73)
+#define NPCM7XX_GPIO_LOCK_MAGIC2 (0xc0de1248)
+
+static void npcm7xx_gpio_update_events(NPCM7xxGPIOState *s, uint32_t din_diff)
+{
+    uint32_t din_new = s->regs[NPCM7XX_GPIO_DIN];
+
+    /* Trigger on high level */
+    s->regs[NPCM7XX_GPIO_EVST] |= din_new & ~s->regs[NPCM7XX_GPIO_EVTYP];
+    /* Trigger on both edges */
+    s->regs[NPCM7XX_GPIO_EVST] |= (din_diff & s->regs[NPCM7XX_GPIO_EVTYP]
+                                   & s->regs[NPCM7XX_GPIO_EVBE]);
+    /* Trigger on rising edge */
+    s->regs[NPCM7XX_GPIO_EVST] |= (din_diff & din_new
+                                   & s->regs[NPCM7XX_GPIO_EVTYP]);
+
+    trace_npcm7xx_gpio_update_events(DEVICE(s)->canonical_path,
+                                     s->regs[NPCM7XX_GPIO_EVST],
+                                     s->regs[NPCM7XX_GPIO_EVEN]);
+    qemu_set_irq(s->irq, !!(s->regs[NPCM7XX_GPIO_EVST]
+                            & s->regs[NPCM7XX_GPIO_EVEN]));
+}
+
+static void npcm7xx_gpio_update_pins(NPCM7xxGPIOState *s, uint32_t diff)
+{
+    uint32_t drive_en;
+    uint32_t drive_lvl;
+    uint32_t not_driven;
+    uint32_t undefined;
+    uint32_t pin_diff;
+    uint32_t din_old;
+
+    /* Calculate level of each pin driven by GPIO controller. */
+    drive_lvl = s->regs[NPCM7XX_GPIO_DOUT] ^ s->regs[NPCM7XX_GPIO_POL];
+    /* If OTYP=1, only drive low (open drain) */
+    drive_en = s->regs[NPCM7XX_GPIO_OE] & ~(s->regs[NPCM7XX_GPIO_OTYP]
+                                            & drive_lvl);
+    /*
+     * If a pin is driven to opposite levels by the GPIO controller and the
+     * external driver, the result is undefined.
+     */
+    undefined = drive_en & s->ext_driven & (drive_lvl ^ s->ext_level);
+    if (undefined) {
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: pins have multiple drivers: 0x%" PRIx32 "\n",
+                      DEVICE(s)->canonical_path, undefined);
+    }
+
+    not_driven = ~(drive_en | s->ext_driven);
+    pin_diff = s->pin_level;
+
+    /* Set pins to externally driven level. */
+    s->pin_level = s->ext_level & s->ext_driven;
+    /* Set internally driven pins, ignoring any conflicts. */
+    s->pin_level |= drive_lvl & drive_en;
+    /* Pull up undriven pins with internal pull-up enabled. */
+    s->pin_level |= not_driven & s->regs[NPCM7XX_GPIO_PU];
+    /* Pins not driven, pulled up or pulled down are undefined */
+    undefined |= not_driven & ~(s->regs[NPCM7XX_GPIO_PU]
+                                | s->regs[NPCM7XX_GPIO_PD]);
+
+    /* If any pins changed state, update the outgoing GPIOs. */
+    pin_diff ^= s->pin_level;
+    pin_diff |= undefined & diff;
+    if (pin_diff) {
+        int i;
+
+        for (i = 0; i < NPCM7XX_GPIO_NR_PINS; i++) {
+            uint32_t mask = BIT(i);
+            if (pin_diff & mask) {
+                int level = (undefined & mask) ? -1 : !!(s->pin_level & mask);
+                trace_npcm7xx_gpio_set_output(DEVICE(s)->canonical_path,
+                                              i, level);
+                qemu_set_irq(s->output[i], level);
+            }
+        }
+    }
+
+    /* Calculate new value of DIN after masking and polarity setting. */
+    din_old = s->regs[NPCM7XX_GPIO_DIN];
+    s->regs[NPCM7XX_GPIO_DIN] = ((s->pin_level & s->regs[NPCM7XX_GPIO_IEM])
+                                 ^ s->regs[NPCM7XX_GPIO_POL]);
+
+    /* See if any new events triggered because of all this. */
+    npcm7xx_gpio_update_events(s, din_old ^ s->regs[NPCM7XX_GPIO_DIN]);
+}
+
+static bool npcm7xx_gpio_is_locked(NPCM7xxGPIOState *s)
+{
+    return s->regs[NPCM7XX_GPIO_TLOCK1] == 1;
+}
+
+static uint64_t npcm7xx_gpio_regs_read(void *opaque, hwaddr addr,
+                                       unsigned int size)
+{
+    hwaddr reg = addr / sizeof(uint32_t);
+    NPCM7xxGPIOState *s = opaque;
+    uint64_t value = 0;
+
+    switch (reg) {
+    case NPCM7XX_GPIO_TLOCK1 ... NPCM7XX_GPIO_EVEN:
+    case NPCM7XX_GPIO_EVST ... NPCM7XX_GPIO_ODSC:
+        value = s->regs[reg];
+        break;
+
+    case NPCM7XX_GPIO_EVENS ... NPCM7XX_GPIO_EVENC:
+    case NPCM7XX_GPIO_DOS ... NPCM7XX_GPIO_TLOCK2:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: read from write-only register 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, addr);
+        break;
+
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: read from invalid offset 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, addr);
+        break;
+    }
+
+    trace_npcm7xx_gpio_read(DEVICE(s)->canonical_path, addr, value);
+
+    return value;
+}
+
+static void npcm7xx_gpio_regs_write(void *opaque, hwaddr addr, uint64_t v,
+                                    unsigned int size)
+{
+    hwaddr reg = addr / sizeof(uint32_t);
+    NPCM7xxGPIOState *s = opaque;
+    uint32_t value = v;
+    uint32_t diff;
+
+    trace_npcm7xx_gpio_write(DEVICE(s)->canonical_path, addr, v);
+
+    if (npcm7xx_gpio_is_locked(s)) {
+        switch (reg) {
+        case NPCM7XX_GPIO_TLOCK1:
+            if (s->regs[NPCM7XX_GPIO_TLOCK2] == NPCM7XX_GPIO_LOCK_MAGIC2 &&
+                value == NPCM7XX_GPIO_LOCK_MAGIC1) {
+                s->regs[NPCM7XX_GPIO_TLOCK1] = 0;
+                s->regs[NPCM7XX_GPIO_TLOCK2] = 0;
+            }
+            break;
+
+        case NPCM7XX_GPIO_TLOCK2:
+            s->regs[reg] = value;
+            break;
+
+        default:
+            qemu_log_mask(LOG_GUEST_ERROR,
+                          "%s: write to locked register @ 0x%" HWADDR_PRIx "\n",
+                          DEVICE(s)->canonical_path, addr);
+            break;
+        }
+
+        return;
+    }
+
+    diff = s->regs[reg] ^ value;
+
+    switch (reg) {
+    case NPCM7XX_GPIO_TLOCK1:
+    case NPCM7XX_GPIO_TLOCK2:
+        s->regs[NPCM7XX_GPIO_TLOCK1] = 1;
+        s->regs[NPCM7XX_GPIO_TLOCK2] = 0;
+        break;
+
+    case NPCM7XX_GPIO_DIN:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: write to read-only register @ 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, addr);
+        break;
+
+    case NPCM7XX_GPIO_POL:
+    case NPCM7XX_GPIO_DOUT:
+    case NPCM7XX_GPIO_OE:
+    case NPCM7XX_GPIO_OTYP:
+    case NPCM7XX_GPIO_PU:
+    case NPCM7XX_GPIO_PD:
+    case NPCM7XX_GPIO_IEM:
+        s->regs[reg] = value;
+        npcm7xx_gpio_update_pins(s, diff);
+        break;
+
+    case NPCM7XX_GPIO_DOS:
+        s->regs[NPCM7XX_GPIO_DOUT] |= value;
+        npcm7xx_gpio_update_pins(s, value);
+        break;
+    case NPCM7XX_GPIO_DOC:
+        s->regs[NPCM7XX_GPIO_DOUT] &= ~value;
+        npcm7xx_gpio_update_pins(s, value);
+        break;
+    case NPCM7XX_GPIO_OES:
+        s->regs[NPCM7XX_GPIO_OE] |= value;
+        npcm7xx_gpio_update_pins(s, value);
+        break;
+    case NPCM7XX_GPIO_OEC:
+        s->regs[NPCM7XX_GPIO_OE] &= ~value;
+        npcm7xx_gpio_update_pins(s, value);
+        break;
+
+    case NPCM7XX_GPIO_EVTYP:
+    case NPCM7XX_GPIO_EVBE:
+    case NPCM7XX_GPIO_EVEN:
+        s->regs[reg] = value;
+        npcm7xx_gpio_update_events(s, 0);
+        break;
+
+    case NPCM7XX_GPIO_EVENS:
+        s->regs[NPCM7XX_GPIO_EVEN] |= value;
+        npcm7xx_gpio_update_events(s, 0);
+        break;
+    case NPCM7XX_GPIO_EVENC:
+        s->regs[NPCM7XX_GPIO_EVEN] &= ~value;
+        npcm7xx_gpio_update_events(s, 0);
+        break;
+
+    case NPCM7XX_GPIO_EVST:
+        s->regs[reg] &= ~value;
+        npcm7xx_gpio_update_events(s, 0);
+        break;
+
+    case NPCM7XX_GPIO_MP:
+    case NPCM7XX_GPIO_DBNC:
+    case NPCM7XX_GPIO_OSRC:
+    case NPCM7XX_GPIO_ODSC:
+        /* Nothing to do; just store the value. */
+        s->regs[reg] = value;
+        break;
+
+    case NPCM7XX_GPIO_OBL0:
+    case NPCM7XX_GPIO_OBL1:
+    case NPCM7XX_GPIO_OBL2:
+    case NPCM7XX_GPIO_OBL3:
+        s->regs[reg] = value;
+        qemu_log_mask(LOG_UNIMP, "%s: Blinking is not implemented\n",
+                      __func__);
+        break;
+
+    case NPCM7XX_GPIO_SPLCK:
+    case NPCM7XX_GPIO_MPLCK:
+        qemu_log_mask(LOG_UNIMP, "%s: Per-pin lock is not implemented\n",
+                      __func__);
+        break;
+
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: write to invalid offset 0x%" HWADDR_PRIx "\n",
+                      DEVICE(s)->canonical_path, addr);
+        break;
+    }
+}
+
+static const MemoryRegionOps npcm7xx_gpio_regs_ops = {
+    .read = npcm7xx_gpio_regs_read,
+    .write = npcm7xx_gpio_regs_write,
+    .endianness = DEVICE_NATIVE_ENDIAN,
+    .valid = {
+        .min_access_size = 4,
+        .max_access_size = 4,
+        .unaligned = false,
+    },
+};
+
+static void npcm7xx_gpio_set_input(void *opaque, int line, int level)
+{
+    NPCM7xxGPIOState *s = opaque;
+
+    trace_npcm7xx_gpio_set_input(DEVICE(s)->canonical_path, line, level);
+
+    g_assert(line >= 0 && line < NPCM7XX_GPIO_NR_PINS);
+
+    s->ext_driven = deposit32(s->ext_driven, line, 1, level >= 0);
+    s->ext_level = deposit32(s->ext_level, line, 1, level > 0);
+
+    npcm7xx_gpio_update_pins(s, BIT(line));
+}
+
+static void npcm7xx_gpio_enter_reset(Object *obj, ResetType type)
+{
+    NPCM7xxGPIOState *s = NPCM7XX_GPIO(obj);
+
+    memset(s->regs, 0, sizeof(s->regs));
+
+    s->regs[NPCM7XX_GPIO_PU] = s->reset_pu;
+    s->regs[NPCM7XX_GPIO_PD] = s->reset_pd;
+    s->regs[NPCM7XX_GPIO_OSRC] = s->reset_osrc;
+    s->regs[NPCM7XX_GPIO_ODSC] = s->reset_odsc;
+}
+
+static void npcm7xx_gpio_hold_reset(Object *obj)
+{
+    NPCM7xxGPIOState *s = NPCM7XX_GPIO(obj);
+
+    npcm7xx_gpio_update_pins(s, -1);
+}
+
+static void npcm7xx_gpio_init(Object *obj)
+{
+    NPCM7xxGPIOState *s = NPCM7XX_GPIO(obj);
+    DeviceState *dev = DEVICE(obj);
+
+    memory_region_init_io(&s->mmio, obj, &npcm7xx_gpio_regs_ops, s,
+                          "regs", NPCM7XX_GPIO_REGS_SIZE);
+    sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->mmio);
+    sysbus_init_irq(SYS_BUS_DEVICE(obj), &s->irq);
+
+    qdev_init_gpio_in(dev, npcm7xx_gpio_set_input, NPCM7XX_GPIO_NR_PINS);
+    qdev_init_gpio_out(dev, s->output, NPCM7XX_GPIO_NR_PINS);
+}
+
+static const VMStateDescription vmstate_npcm7xx_gpio = {
+    .name = "npcm7xx-gpio",
+    .version_id = 0,
+    .minimum_version_id = 0,
+    .fields = (VMStateField[]) {
+        VMSTATE_UINT32(pin_level, NPCM7xxGPIOState),
+        VMSTATE_UINT32(ext_level, NPCM7xxGPIOState),
+        VMSTATE_UINT32(ext_driven, NPCM7xxGPIOState),
+        VMSTATE_UINT32_ARRAY(regs, NPCM7xxGPIOState, NPCM7XX_GPIO_NR_REGS),
+        VMSTATE_END_OF_LIST(),
+    },
+};
+
+static Property npcm7xx_gpio_properties[] = {
+    /* Bit n set => pin n has pullup enabled by default. */
+    DEFINE_PROP_UINT32("reset-pullup", NPCM7xxGPIOState, reset_pu, 0),
+    /* Bit n set => pin n has pulldown enabled by default. */
+    DEFINE_PROP_UINT32("reset-pulldown", NPCM7xxGPIOState, reset_pd, 0),
+    /* Bit n set => pin n has high slew rate by default. */
+    DEFINE_PROP_UINT32("reset-osrc", NPCM7xxGPIOState, reset_osrc, 0),
+    /* Bit n set => pin n has high drive strength by default. */
+    DEFINE_PROP_UINT32("reset-odsc", NPCM7xxGPIOState, reset_odsc, 0),
+    DEFINE_PROP_END_OF_LIST(),
+};
+
+static void npcm7xx_gpio_class_init(ObjectClass *klass, void *data)
+{
+    ResettableClass *reset = RESETTABLE_CLASS(klass);
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    QEMU_BUILD_BUG_ON(NPCM7XX_GPIO_REGS_END > NPCM7XX_GPIO_NR_REGS);
+
+    dc->desc = "NPCM7xx GPIO Controller";
+    dc->vmsd = &vmstate_npcm7xx_gpio;
+    reset->phases.enter = npcm7xx_gpio_enter_reset;
+    reset->phases.hold = npcm7xx_gpio_hold_reset;
+    device_class_set_props(dc, npcm7xx_gpio_properties);
+}
+
+static const TypeInfo npcm7xx_gpio_types[] = {
+    {
+        .name = TYPE_NPCM7XX_GPIO,
+        .parent = TYPE_SYS_BUS_DEVICE,
+        .instance_size = sizeof(NPCM7xxGPIOState),
+        .class_init = npcm7xx_gpio_class_init,
+        .instance_init = npcm7xx_gpio_init,
+    },
+};
+DEFINE_TYPES(npcm7xx_gpio_types);
diff --git a/tests/qtest/npcm7xx_gpio-test.c b/tests/qtest/npcm7xx_gpio-test.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/qtest/npcm7xx_gpio-test.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * QTest testcase for the Nuvoton NPCM7xx GPIO modules.
+ *
+ * Copyright 2020 Google LLC
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms of the GNU General Public License as published by the
+ * Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
+ * for more details.
+ */
+
+#include "qemu/osdep.h"
+#include "libqtest-single.h"
+
+#define NR_GPIO_DEVICES (8)
+#define GPIO(x)         (0xf0010000 + (x) * 0x1000)
+#define GPIO_IRQ(x)     (116 + (x))
+
+/* GPIO registers */
+#define GP_N_TLOCK1     0x00
+#define GP_N_DIN        0x04 /* Data IN */
+#define GP_N_POL        0x08 /* Polarity */
+#define GP_N_DOUT       0x0c /* Data OUT */
+#define GP_N_OE         0x10 /* Output Enable */
+#define GP_N_OTYP       0x14
+#define GP_N_MP         0x18
+#define GP_N_PU         0x1c /* Pull-up */
+#define GP_N_PD         0x20 /* Pull-down */
+#define GP_N_DBNC       0x24 /* Debounce */
+#define GP_N_EVTYP      0x28 /* Event Type */
+#define GP_N_EVBE       0x2c /* Event Both Edge */
+#define GP_N_OBL0       0x30
+#define GP_N_OBL1       0x34
+#define GP_N_OBL2       0x38
+#define GP_N_OBL3       0x3c
+#define GP_N_EVEN       0x40 /* Event Enable */
+#define GP_N_EVENS      0x44 /* Event Set (enable) */
+#define GP_N_EVENC      0x48 /* Event Clear (disable) */
+#define GP_N_EVST       0x4c /* Event Status */
+#define GP_N_SPLCK      0x50
+#define GP_N_MPLCK      0x54
+#define GP_N_IEM        0x58 /* Input Enable */
+#define GP_N_OSRC       0x5c
+#define GP_N_ODSC       0x60
+#define GP_N_DOS        0x68 /* Data OUT Set */
+#define GP_N_DOC        0x6c /* Data OUT Clear */
+#define GP_N_OES        0x70 /* Output Enable Set */
+#define GP_N_OEC        0x74 /* Output Enable Clear */
+#define GP_N_TLOCK2     0x7c
+
+static void gpio_unlock(int n)
+{
+    if (readl(GPIO(n) + GP_N_TLOCK1) != 0) {
+        writel(GPIO(n) + GP_N_TLOCK2, 0xc0de1248);
+        writel(GPIO(n) + GP_N_TLOCK1, 0xc0defa73);
+    }
+}
+
+/* Restore the GPIO controller to a sensible default state. */
+static void gpio_reset(int n)
+{
+    gpio_unlock(0);
+
+    writel(GPIO(n) + GP_N_EVEN, 0x00000000);
+    writel(GPIO(n) + GP_N_EVST, 0xffffffff);
+    writel(GPIO(n) + GP_N_POL, 0x00000000);
+    writel(GPIO(n) + GP_N_DOUT, 0x00000000);
+    writel(GPIO(n) + GP_N_OE, 0x00000000);
+    writel(GPIO(n) + GP_N_OTYP, 0x00000000);
+    writel(GPIO(n) + GP_N_PU, 0xffffffff);
+    writel(GPIO(n) + GP_N_PD, 0x00000000);
+    writel(GPIO(n) + GP_N_IEM, 0xffffffff);
+}
+
+static void test_dout_to_din(void)
+{
+    gpio_reset(0);
+
+    /* When output is enabled, DOUT should be reflected on DIN. */
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    /* PU and PD shouldn't have any impact on DIN. */
+    writel(GPIO(0) + GP_N_PU, 0xffff0000);
+    writel(GPIO(0) + GP_N_PD, 0x0000ffff);
+    writel(GPIO(0) + GP_N_DOUT, 0x12345678);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0x12345678);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x12345678);
+}
+
+static void test_pullup_pulldown(void)
+{
+    gpio_reset(0);
+
+    /*
+     * When output is disabled, and PD is the inverse of PU, PU should be
+     * reflected on DIN. If PD is not the inverse of PU, the state of DIN is
+     * undefined, so we don't test that.
+     */
+    writel(GPIO(0) + GP_N_OE, 0x00000000);
+    /* DOUT shouldn't have any impact on DIN. */
+    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
+    writel(GPIO(0) + GP_N_PU, 0x23456789);
+    writel(GPIO(0) + GP_N_PD, ~0x23456789U);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_PU), ==, 0x23456789);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_PD), ==, ~0x23456789U);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x23456789);
+}
+
+static void test_output_enable(void)
+{
+    gpio_reset(0);
+
+    /*
+     * With all pins weakly pulled down, and DOUT all-ones, OE should be
+     * reflected on DIN.
+     */
+    writel(GPIO(0) + GP_N_DOUT, 0xffffffff);
+    writel(GPIO(0) + GP_N_PU, 0x00000000);
+    writel(GPIO(0) + GP_N_PD, 0xffffffff);
+    writel(GPIO(0) + GP_N_OE, 0x3456789a);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_OE), ==, 0x3456789a);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x3456789a);
+
+    writel(GPIO(0) + GP_N_OEC, 0x00030002);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_OE), ==, 0x34547898);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x34547898);
+
+    writel(GPIO(0) + GP_N_OES, 0x0000f001);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_OE), ==, 0x3454f899);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x3454f899);
+}
+
+static void test_open_drain(void)
+{
+    gpio_reset(0);
+
+    /*
+     * Upper half of DOUT drives a 1 only if the corresponding bit in OTYP is
+     * not set. If OTYP is set, DIN is determined by PU/PD. Lower half of
+     * DOUT always drives a 0 regardless of OTYP; PU/PD have no effect.  When
+     * OE is 0, output is determined by PU/PD; OTYP has no effect.
+     */
+    writel(GPIO(0) + GP_N_OTYP, 0x456789ab);
+    writel(GPIO(0) + GP_N_OE, 0xf0f0f0f0);
+    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
+    writel(GPIO(0) + GP_N_PU, 0xff00ff00);
+    writel(GPIO(0) + GP_N_PD, 0x00ff00ff);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_OTYP), ==, 0x456789ab);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0xff900f00);
+}
+
+static void test_polarity(void)
+{
+    gpio_reset(0);
+
+    /*
+     * In push-pull mode, DIN should reflect DOUT because the signal is
+     * inverted in both directions.
+     */
+    writel(GPIO(0) + GP_N_OTYP, 0x00000000);
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    writel(GPIO(0) + GP_N_DOUT, 0x56789abc);
+    writel(GPIO(0) + GP_N_POL, 0x6789abcd);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_POL), ==, 0x6789abcd);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0x56789abc);
+
+    /*
+     * When turning off the drivers, DIN should reflect the inverse of the
+     * pulled-up lines.
+     */
+    writel(GPIO(0) + GP_N_OE, 0x00000000);
+    writel(GPIO(0) + GP_N_POL, 0xffffffff);
+    writel(GPIO(0) + GP_N_PU, 0x789abcde);
+    writel(GPIO(0) + GP_N_PD, ~0x789abcdeU);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, ~0x789abcdeU);
+
+    /*
+     * In open-drain mode, DOUT=1 will appear to drive the pin high (since DIN
+     * is inverted), while DOUT=0 will leave the pin floating.
+     */
+    writel(GPIO(0) + GP_N_OTYP, 0xffffffff);
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    writel(GPIO(0) + GP_N_PU, 0xffff0000);
+    writel(GPIO(0) + GP_N_PD, 0x0000ffff);
+    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0xff00ffff);
+}
+
+static void test_input_mask(void)
+{
+    gpio_reset(0);
+
+    /* IEM=0 forces the input to zero before polarity inversion. */
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
+    writel(GPIO(0) + GP_N_POL, 0xffff0000);
+    writel(GPIO(0) + GP_N_IEM, 0x87654321);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DIN), ==, 0xff9a4300);
+}
+
+static void test_temp_lock(void)
+{
+    gpio_reset(0);
+
+    writel(GPIO(0) + GP_N_DOUT, 0x98765432);
+
+    /* Make sure we're unlocked initially. */
+    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 0);
+    /* Writing any value to TLOCK1 will lock. */
+    writel(GPIO(0) + GP_N_TLOCK1, 0);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 1);
+    writel(GPIO(0) + GP_N_DOUT, 0xa9876543);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0x98765432);
+    /* Now, try to unlock. */
+    gpio_unlock(0);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 0);
+    writel(GPIO(0) + GP_N_DOUT, 0xa9876543);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0xa9876543);
+
+    /* Try it again, but write TLOCK2 to lock. */
+    writel(GPIO(0) + GP_N_TLOCK2, 0);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 1);
+    writel(GPIO(0) + GP_N_DOUT, 0x98765432);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0xa9876543);
+    /* Now, try to unlock. */
+    gpio_unlock(0);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_TLOCK1), ==, 0);
+    writel(GPIO(0) + GP_N_DOUT, 0x98765432);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_DOUT), ==, 0x98765432);
+}
+
+static void test_events_level(void)
+{
+    gpio_reset(0);
+
+    writel(GPIO(0) + GP_N_EVTYP, 0x00000000);
+    writel(GPIO(0) + GP_N_DOUT, 0xba987654);
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    writel(GPIO(0) + GP_N_EVST, 0xffffffff);
+
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0xba987654);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_DOUT, 0x00000000);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0xba987654);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_EVST, 0x00007654);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0xba980000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_EVST, 0xba980000);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+}
+
+static void test_events_rising_edge(void)
+{
+    gpio_reset(0);
+
+    writel(GPIO(0) + GP_N_EVTYP, 0xffffffff);
+    writel(GPIO(0) + GP_N_EVBE, 0x00000000);
+    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    writel(GPIO(0) + GP_N_EVST, 0xffffffff);
+
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x0000ff00);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_DOUT, 0x00ff0000);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00ffff00);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_EVST, 0x0000f000);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00ff0f00);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_EVST, 0x00ff0f00);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+}
+
+static void test_events_both_edges(void)
+{
+    gpio_reset(0);
+
+    writel(GPIO(0) + GP_N_EVTYP, 0xffffffff);
+    writel(GPIO(0) + GP_N_EVBE, 0xffffffff);
+    writel(GPIO(0) + GP_N_DOUT, 0xffff0000);
+    writel(GPIO(0) + GP_N_OE, 0xffffffff);
+    writel(GPIO(0) + GP_N_EVST, 0xffffffff);
+
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_DOUT, 0xff00ff00);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00ffff00);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_DOUT, 0xef00ff08);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x10ffff08);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_EVST, 0x0000f000);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x10ff0f08);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+    writel(GPIO(0) + GP_N_EVST, 0x10ff0f08);
+    g_assert_cmphex(readl(GPIO(0) + GP_N_EVST), ==, 0x00000000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(0)));
+}
+
+static void test_gpion_irq(gconstpointer test_data)
+{
+    intptr_t n = (intptr_t)test_data;
+
+    gpio_reset(n);
+
+    writel(GPIO(n) + GP_N_EVTYP, 0x00000000);
+    writel(GPIO(n) + GP_N_DOUT, 0x00000000);
+    writel(GPIO(n) + GP_N_OE, 0xffffffff);
+    writel(GPIO(n) + GP_N_EVST, 0xffffffff);
+    writel(GPIO(n) + GP_N_EVEN, 0x00000000);
+
+    /* Trigger an event; interrupts are masked. */
+    g_assert_cmphex(readl(GPIO(n) + GP_N_EVST), ==, 0x00000000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+    writel(GPIO(n) + GP_N_DOS, 0x00008000);
+    g_assert_cmphex(readl(GPIO(n) + GP_N_EVST), ==, 0x00008000);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+
+    /* Unmask all event interrupts; verify that the interrupt fired. */
+    writel(GPIO(n) + GP_N_EVEN, 0xffffffff);
+    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+
+    /* Clear the current bit, set a new bit, irq stays asserted. */
+    writel(GPIO(n) + GP_N_DOC, 0x00008000);
+    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+    writel(GPIO(n) + GP_N_DOS, 0x00000200);
+    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+    writel(GPIO(n) + GP_N_EVST, 0x00008000);
+    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+
+    /* Mask/unmask the event that's currently active. */
+    writel(GPIO(n) + GP_N_EVENC, 0x00000200);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+    writel(GPIO(n) + GP_N_EVENS, 0x00000200);
+    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+
+    /* Clear the input and the status bit, irq is deasserted. */
+    writel(GPIO(n) + GP_N_DOC, 0x00000200);
+    g_assert_true(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+    writel(GPIO(n) + GP_N_EVST, 0x00000200);
+    g_assert_false(qtest_get_irq(global_qtest, GPIO_IRQ(n)));
+}
+
+int main(int argc, char **argv)
+{
+    int ret;
+    int i;
+
+    g_test_init(&argc, &argv, NULL);
+    g_test_set_nonfatal_assertions();
+
+    qtest_add_func("/npcm7xx_gpio/dout_to_din", test_dout_to_din);
+    qtest_add_func("/npcm7xx_gpio/pullup_pulldown", test_pullup_pulldown);
+    qtest_add_func("/npcm7xx_gpio/output_enable", test_output_enable);
+    qtest_add_func("/npcm7xx_gpio/open_drain", test_open_drain);
+    qtest_add_func("/npcm7xx_gpio/polarity", test_polarity);
+    qtest_add_func("/npcm7xx_gpio/input_mask", test_input_mask);
+    qtest_add_func("/npcm7xx_gpio/temp_lock", test_temp_lock);
+    qtest_add_func("/npcm7xx_gpio/events/level", test_events_level);
+    qtest_add_func("/npcm7xx_gpio/events/rising_edge", test_events_rising_edge);
+    qtest_add_func("/npcm7xx_gpio/events/both_edges", test_events_both_edges);
+
+    for (i = 0; i < NR_GPIO_DEVICES; i++) {
+        g_autofree char *test_name =
+            g_strdup_printf("/npcm7xx_gpio/gpio[%d]/irq", i);
+        qtest_add_data_func(test_name, (void *)(intptr_t)i, test_gpion_irq);
+    }
+
+    qtest_start("-machine npcm750-evb");
+    qtest_irq_intercept_in(global_qtest, "/machine/soc/a9mpcore/gic");
+    ret = g_test_run();
+    qtest_end();
+
+    return ret;
+}
diff --git a/hw/gpio/meson.build b/hw/gpio/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/gpio/meson.build
+++ b/hw/gpio/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_PUV3', if_true: files('puv3_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_ZAURUS', if_true: files('zaurus.c'))
 
 softmmu_ss.add(when: 'CONFIG_IMX', if_true: files('imx_gpio.c'))
+softmmu_ss.add(when: 'CONFIG_NPCM7XX', if_true: files('npcm7xx_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_NRF51_SOC', if_true: files('nrf51_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_gpio.c'))
diff --git a/hw/gpio/trace-events b/hw/gpio/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/gpio/trace-events
+++ b/hw/gpio/trace-events
@@ -XXX,XX +XXX,XX @@
 # See docs/devel/tracing.txt for syntax documentation.
 
+# npcm7xx_gpio.c
+npcm7xx_gpio_read(const char *id, uint64_t offset, uint64_t value) " %s offset: 0x%04" PRIx64 " value 0x%08" PRIx64
+npcm7xx_gpio_write(const char *id, uint64_t offset, uint64_t value) "%s offset: 0x%04" PRIx64 " value 0x%08" PRIx64
+npcm7xx_gpio_set_input(const char *id, int32_t line, int32_t level) "%s line: %" PRIi32 " level: %" PRIi32
+npcm7xx_gpio_set_output(const char *id, int32_t line, int32_t level) "%s line: %" PRIi32 " level: %" PRIi32
+npcm7xx_gpio_update_events(const char *id, uint32_t evst, uint32_t even) "%s evst: 0x%08" PRIx32 " even: 0x%08" PRIx32
+
 # nrf51_gpio.c
 nrf51_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PRIx64
 nrf51_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
diff --git a/tests/qtest/meson.build b/tests/qtest/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/tests/qtest/meson.build
+++ b/tests/qtest/meson.build
@@ -XXX,XX +XXX,XX @@ qtests_sparc64 = \
   ['prom-env-test', 'boot-serial-test']
 
 qtests_npcm7xx = \
-  ['npcm7xx_rng-test',
+  ['npcm7xx_gpio-test',
+   'npcm7xx_rng-test',
    'npcm7xx_timer-test',
    'npcm7xx_watchdog_timer-test']
 qtests_arm = \
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

No code out of bcm2836.c uses (or requires) the BCM283XInfo
declarations. Move it locally to the C source file.

Reviewed-by: Luc Michel <luc.michel@greensocs.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-2-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/bcm2836.h |  8 --------
 hw/arm/bcm2836.c         | 14 ++++++++++++++
 2 files changed, 14 insertions(+), 8 deletions(-)

diff --git a/include/hw/arm/bcm2836.h b/include/hw/arm/bcm2836.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/bcm2836.h
+++ b/include/hw/arm/bcm2836.h
@@ -XXX,XX +XXX,XX @@ struct BCM283XState {
     BCM2835PeripheralState peripherals;
 };
 
-typedef struct BCM283XInfo BCM283XInfo;
-
-struct BCM283XClass {
-    DeviceClass parent_class;
-    const BCM283XInfo *info;
-};
-
-
 #endif /* BCM2836_H */
diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2836.c
+++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/arm/raspi_platform.h"
 #include "hw/sysbus.h"
 
+typedef struct BCM283XInfo BCM283XInfo;
+
+typedef struct BCM283XClass {
+    /*< private >*/
+    DeviceClass parent_class;
+    /*< public >*/
+    const BCM283XInfo *info;
+} BCM283XClass;
+
 struct BCM283XInfo {
     const char *name;
     const char *cpu_type;
@@ -XXX,XX +XXX,XX @@ struct BCM283XInfo {
     int clusterid;
 };
 
+#define BCM283X_CLASS(klass) \
+    OBJECT_CLASS_CHECK(BCM283XClass, (klass), TYPE_BCM283X)
+#define BCM283X_GET_CLASS(obj) \
+    OBJECT_GET_CLASS(BCM283XClass, (obj), TYPE_BCM283X)
+
 static const BCM283XInfo bcm283x_socs[] = {
     {
         .name = TYPE_BCM2836,
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Remove usage of TypeInfo::class_data. Instead fill the fields in
the corresponding class_init().

So far all children use the same values for almost all fields,
but we are going to add the BCM2711/BCM2838 SoC for the raspi4
machine which use different fields.

Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-3-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/bcm2836.c | 108 ++++++++++++++++++++++-------------------------
 1 file changed, 51 insertions(+), 57 deletions(-)

diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2836.c
+++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/arm/raspi_platform.h"
 #include "hw/sysbus.h"
 
-typedef struct BCM283XInfo BCM283XInfo;
-
 typedef struct BCM283XClass {
     /*< private >*/
     DeviceClass parent_class;
     /*< public >*/
-    const BCM283XInfo *info;
-} BCM283XClass;
-
-struct BCM283XInfo {
     const char *name;
     const char *cpu_type;
     hwaddr peri_base; /* Peripheral base address seen by the CPU */
     hwaddr ctrl_base; /* Interrupt controller and mailboxes etc. */
     int clusterid;
-};
+} BCM283XClass;
 
 #define BCM283X_CLASS(klass) \
     OBJECT_CLASS_CHECK(BCM283XClass, (klass), TYPE_BCM283X)
 #define BCM283X_GET_CLASS(obj) \
     OBJECT_GET_CLASS(BCM283XClass, (obj), TYPE_BCM283X)
 
-static const BCM283XInfo bcm283x_socs[] = {
-    {
-        .name = TYPE_BCM2836,
-        .cpu_type = ARM_CPU_TYPE_NAME("cortex-a7"),
-        .peri_base = 0x3f000000,
-        .ctrl_base = 0x40000000,
-        .clusterid = 0xf,
-    },
-#ifdef TARGET_AARCH64
-    {
-        .name = TYPE_BCM2837,
-        .cpu_type = ARM_CPU_TYPE_NAME("cortex-a53"),
-        .peri_base = 0x3f000000,
-        .ctrl_base = 0x40000000,
-        .clusterid = 0x0,
-    },
-#endif
-};
-
 static void bcm2836_init(Object *obj)
 {
     BCM283XState *s = BCM283X(obj);
     BCM283XClass *bc = BCM283X_GET_CLASS(obj);
-    const BCM283XInfo *info = bc->info;
     int n;
 
     for (n = 0; n < BCM283X_NCPUS; n++) {
         object_initialize_child(obj, "cpu[*]", &s->cpu[n].core,
-                                info->cpu_type);
+                                bc->cpu_type);
     }
 
     object_initialize_child(obj, "control", &s->control, TYPE_BCM2836_CONTROL);
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
 {
     BCM283XState *s = BCM283X(dev);
     BCM283XClass *bc = BCM283X_GET_CLASS(dev);
-    const BCM283XInfo *info = bc->info;
     Object *obj;
     int n;
 
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
                               "sd-bus");
 
     sysbus_mmio_map_overlap(SYS_BUS_DEVICE(&s->peripherals), 0,
-                            info->peri_base, 1);
+                            bc->peri_base, 1);
 
     /* bcm2836 interrupt controller (and mailboxes, etc.) */
     if (!sysbus_realize(SYS_BUS_DEVICE(&s->control), errp)) {
         return;
     }
 
-    sysbus_mmio_map(SYS_BUS_DEVICE(&s->control), 0, info->ctrl_base);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->control), 0, bc->ctrl_base);
 
     sysbus_connect_irq(SYS_BUS_DEVICE(&s->peripherals), 0,
         qdev_get_gpio_in_named(DEVICE(&s->control), "gpu-irq", 0));
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
 
     for (n = 0; n < BCM283X_NCPUS; n++) {
         /* TODO: this should be converted to a property of ARM_CPU */
-        s->cpu[n].core.mp_affinity = (info->clusterid << 8) | n;
+        s->cpu[n].core.mp_affinity = (bc->clusterid << 8) | n;
 
         /* set periphbase/CBAR value for CPU-local registers */
         if (!object_property_set_int(OBJECT(&s->cpu[n].core), "reset-cbar",
-                                     info->peri_base, errp)) {
+                                     bc->peri_base, errp)) {
             return;
         }
 
@@ -XXX,XX +XXX,XX @@ static Property bcm2836_props[] = {
 static void bcm283x_class_init(ObjectClass *oc, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(oc);
-    BCM283XClass *bc = BCM283X_CLASS(oc);
 
-    bc->info = data;
-    dc->realize = bcm2836_realize;
-    device_class_set_props(dc, bcm2836_props);
     /* Reason: Must be wired up in code (see raspi_init() function) */
     dc->user_creatable = false;
 }
 
-static const TypeInfo bcm283x_type_info = {
-    .name = TYPE_BCM283X,
-    .parent = TYPE_DEVICE,
-    .instance_size = sizeof(BCM283XState),
-    .instance_init = bcm2836_init,
-    .class_size = sizeof(BCM283XClass),
-    .abstract = true,
+static void bcm2836_class_init(ObjectClass *oc, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(oc);
+    BCM283XClass *bc = BCM283X_CLASS(oc);
+
+    bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a7");
+    bc->peri_base = 0x3f000000;
+    bc->ctrl_base = 0x40000000;
+    bc->clusterid = 0xf;
+    dc->realize = bcm2836_realize;
+    device_class_set_props(dc, bcm2836_props);
 };
 
-static void bcm2836_register_types(void)
+#ifdef TARGET_AARCH64
+static void bcm2837_class_init(ObjectClass *oc, void *data)
 {
-    int i;
+    DeviceClass *dc = DEVICE_CLASS(oc);
+    BCM283XClass *bc = BCM283X_CLASS(oc);
 
-    type_register_static(&bcm283x_type_info);
-    for (i = 0; i < ARRAY_SIZE(bcm283x_socs); i++) {
-        TypeInfo ti = {
-            .name = bcm283x_socs[i].name,
-            .parent = TYPE_BCM283X,
-            .class_init = bcm283x_class_init,
-            .class_data = (void *) &bcm283x_socs[i],
-        };
-        type_register(&ti);
+    bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a53");
+    bc->peri_base = 0x3f000000;
+    bc->ctrl_base = 0x40000000;
+    bc->clusterid = 0x0;
+    dc->realize = bcm2836_realize;
+    device_class_set_props(dc, bcm2836_props);
+};
+#endif
+
+static const TypeInfo bcm283x_types[] = {
+    {
+        .name           = TYPE_BCM2836,
+        .parent         = TYPE_BCM283X,
+        .class_init     = bcm2836_class_init,
+#ifdef TARGET_AARCH64
+    }, {
+        .name           = TYPE_BCM2837,
+        .parent         = TYPE_BCM283X,
+        .class_init     = bcm2837_class_init,
+#endif
+    }, {
+        .name           = TYPE_BCM283X,
+        .parent         = TYPE_DEVICE,
+        .instance_size  = sizeof(BCM283XState),
+        .instance_init  = bcm2836_init,
+        .class_size     = sizeof(BCM283XClass),
+        .class_init     = bcm283x_class_init,
+        .abstract       = true,
     }
-}
+};
 
-type_init(bcm2836_register_types)
+DEFINE_TYPES(bcm283x_types)
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

The BCM2835 has only one core. Introduce the core_count field to
be able to use values different than BCM283X_NCPUS (4).

Reviewed-by: Luc Michel <luc.michel@greensocs.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-4-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/bcm2836.c | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2836.c
+++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@ typedef struct BCM283XClass {
     /*< public >*/
     const char *name;
     const char *cpu_type;
+    unsigned core_count;
     hwaddr peri_base; /* Peripheral base address seen by the CPU */
     hwaddr ctrl_base; /* Interrupt controller and mailboxes etc. */
     int clusterid;
@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
     BCM283XClass *bc = BCM283X_GET_CLASS(obj);
     int n;
 
-    for (n = 0; n < BCM283X_NCPUS; n++) {
+    for (n = 0; n < bc->core_count; n++) {
         object_initialize_child(obj, "cpu[*]", &s->cpu[n].core,
                                 bc->cpu_type);
     }
@@ -XXX,XX +XXX,XX @@ static void bcm2836_class_init(ObjectClass *oc, void *data)
     BCM283XClass *bc = BCM283X_CLASS(oc);
 
     bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a7");
+    bc->core_count = BCM283X_NCPUS;
     bc->peri_base = 0x3f000000;
     bc->ctrl_base = 0x40000000;
     bc->clusterid = 0xf;
@@ -XXX,XX +XXX,XX @@ static void bcm2837_class_init(ObjectClass *oc, void *data)
     BCM283XClass *bc = BCM283X_CLASS(oc);
 
     bc->cpu_type = ARM_CPU_TYPE_NAME("cortex-a53");
+    bc->core_count = BCM283X_NCPUS;
     bc->peri_base = 0x3f000000;
     bc->ctrl_base = 0x40000000;
     bc->clusterid = 0x0;
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

It makes no sense to set enabled-cpus=0 on single core SoCs.

Reviewed-by: Luc Michel <luc.michel@greensocs.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-5-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/bcm2836.c | 15 +++++++--------
 1 file changed, 7 insertions(+), 8 deletions(-)

diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2836.c
+++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@ typedef struct BCM283XClass {
 #define BCM283X_GET_CLASS(obj) \
     OBJECT_GET_CLASS(BCM283XClass, (obj), TYPE_BCM283X)
 
+static Property bcm2836_enabled_cores_property =
+    DEFINE_PROP_UINT32("enabled-cpus", BCM283XState, enabled_cpus, 0);
+
 static void bcm2836_init(Object *obj)
 {
     BCM283XState *s = BCM283X(obj);
@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
         object_initialize_child(obj, "cpu[*]", &s->cpu[n].core,
                                 bc->cpu_type);
     }
+    if (bc->core_count > 1) {
+        qdev_property_add_static(DEVICE(obj), &bcm2836_enabled_cores_property);
+        qdev_prop_set_uint32(DEVICE(obj), "enabled-cpus", bc->core_count);
+    }
 
     object_initialize_child(obj, "control", &s->control, TYPE_BCM2836_CONTROL);
 
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
     }
 }
 
-static Property bcm2836_props[] = {
-    DEFINE_PROP_UINT32("enabled-cpus", BCM283XState, enabled_cpus,
-                       BCM283X_NCPUS),
-    DEFINE_PROP_END_OF_LIST()
-};
-
 static void bcm283x_class_init(ObjectClass *oc, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void bcm2836_class_init(ObjectClass *oc, void *data)
     bc->ctrl_base = 0x40000000;
     bc->clusterid = 0xf;
     dc->realize = bcm2836_realize;
-    device_class_set_props(dc, bcm2836_props);
 };
 
 #ifdef TARGET_AARCH64
@@ -XXX,XX +XXX,XX @@ static void bcm2837_class_init(ObjectClass *oc, void *data)
     bc->ctrl_base = 0x40000000;
     bc->clusterid = 0x0;
     dc->realize = bcm2836_realize;
-    device_class_set_props(dc, bcm2836_props);
 };
 #endif
 
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

The realize() function is clearly composed of two parts,
each described by a comment:

void realize()
  {
     /* common peripherals from bcm2835 */
     ...
     /* bcm2836 interrupt controller (and mailboxes, etc.) */
     ...
   }

Split the two part, so we can reuse the common part with other
SoCs from this family.

Reviewed-by: Luc Michel <luc.michel@greensocs.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-6-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/bcm2836.c | 22 ++++++++++++++++++----
 1 file changed, 18 insertions(+), 4 deletions(-)

diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2836.c
+++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
         qdev_prop_set_uint32(DEVICE(obj), "enabled-cpus", bc->core_count);
     }
 
-    object_initialize_child(obj, "control", &s->control, TYPE_BCM2836_CONTROL);
+    if (bc->ctrl_base) {
+        object_initialize_child(obj, "control", &s->control,
+                                TYPE_BCM2836_CONTROL);
+    }
 
     object_initialize_child(obj, "peripherals", &s->peripherals,
                             TYPE_BCM2835_PERIPHERALS);
@@ -XXX,XX +XXX,XX @@ static void bcm2836_init(Object *obj)
                               "vcram-size");
 }
 
-static void bcm2836_realize(DeviceState *dev, Error **errp)
+static bool bcm283x_common_realize(DeviceState *dev, Error **errp)
 {
     BCM283XState *s = BCM283X(dev);
     BCM283XClass *bc = BCM283X_GET_CLASS(dev);
     Object *obj;
-    int n;
 
     /* common peripherals from bcm2835 */
 
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
     object_property_add_const_link(OBJECT(&s->peripherals), "ram", obj);
 
     if (!sysbus_realize(SYS_BUS_DEVICE(&s->peripherals), errp)) {
-        return;
+        return false;
     }
 
     object_property_add_alias(OBJECT(s), "sd-bus", OBJECT(&s->peripherals),
@@ -XXX,XX +XXX,XX @@ static void bcm2836_realize(DeviceState *dev, Error **errp)
 
     sysbus_mmio_map_overlap(SYS_BUS_DEVICE(&s->peripherals), 0,
                             bc->peri_base, 1);
+    return true;
+}
+
+static void bcm2836_realize(DeviceState *dev, Error **errp)
+{
+    BCM283XState *s = BCM283X(dev);
+    BCM283XClass *bc = BCM283X_GET_CLASS(dev);
+    int n;
+
+    if (!bcm283x_common_realize(dev, errp)) {
+        return;
+    }
 
     /* bcm2836 interrupt controller (and mailboxes, etc.) */
     if (!sysbus_realize(SYS_BUS_DEVICE(&s->control), errp)) {
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Reviewed-by: Luc Michel <luc.michel@greensocs.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-7-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/bcm2836.h |  1 +
 hw/arm/bcm2836.c         | 34 ++++++++++++++++++++++++++++++++++
 hw/arm/raspi.c           |  2 ++
 3 files changed, 37 insertions(+)

diff --git a/include/hw/arm/bcm2836.h b/include/hw/arm/bcm2836.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/bcm2836.h
+++ b/include/hw/arm/bcm2836.h
@@ -XXX,XX +XXX,XX @@ OBJECT_DECLARE_TYPE(BCM283XState, BCM283XClass, BCM283X)
  * them, code using these devices should always handle them via the
  * BCM283x base class, so they have no BCM2836(obj) etc macros.
  */
+#define TYPE_BCM2835 "bcm2835"
 #define TYPE_BCM2836 "bcm2836"
 #define TYPE_BCM2837 "bcm2837"
 
diff --git a/hw/arm/bcm2836.c b/hw/arm/bcm2836.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2836.c
+++ b/hw/arm/bcm2836.c
@@ -XXX,XX +XXX,XX @@ static bool bcm283x_common_realize(DeviceState *dev, Error **errp)
     return true;
 }
 
+static void bcm2835_realize(DeviceState *dev, Error **errp)
+{
+    BCM283XState *s = BCM283X(dev);
+
+    if (!bcm283x_common_realize(dev, errp)) {
+        return;
+    }
+
+    if (!qdev_realize(DEVICE(&s->cpu[0].core), NULL, errp)) {
+        return;
+    }
+
+    /* Connect irq/fiq outputs from the interrupt controller. */
+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->peripherals), 0,
+            qdev_get_gpio_in(DEVICE(&s->cpu[0].core), ARM_CPU_IRQ));
+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->peripherals), 1,
+            qdev_get_gpio_in(DEVICE(&s->cpu[0].core), ARM_CPU_FIQ));
+}
+
 static void bcm2836_realize(DeviceState *dev, Error **errp)
 {
     BCM283XState *s = BCM283X(dev);
@@ -XXX,XX +XXX,XX @@ static void bcm283x_class_init(ObjectClass *oc, void *data)
     dc->user_creatable = false;
 }
 
+static void bcm2835_class_init(ObjectClass *oc, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(oc);
+    BCM283XClass *bc = BCM283X_CLASS(oc);
+
+    bc->cpu_type = ARM_CPU_TYPE_NAME("arm1176");
+    bc->core_count = 1;
+    bc->peri_base = 0x20000000;
+    dc->realize = bcm2835_realize;
+};
+
 static void bcm2836_class_init(ObjectClass *oc, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void bcm2837_class_init(ObjectClass *oc, void *data)
 
 static const TypeInfo bcm283x_types[] = {
     {
+        .name           = TYPE_BCM2835,
+        .parent         = TYPE_BCM283X,
+        .class_init     = bcm2835_class_init,
+    }, {
         .name           = TYPE_BCM2836,
         .parent         = TYPE_BCM283X,
         .class_init     = bcm2836_class_init,
diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/raspi.c
+++ b/hw/arm/raspi.c
@@ -XXX,XX +XXX,XX @@ FIELD(REV_CODE, MEMORY_SIZE,       20, 3);
 FIELD(REV_CODE, STYLE,             23, 1);
 
 typedef enum RaspiProcessorId {
+    PROCESSOR_ID_BCM2835 = 0,
     PROCESSOR_ID_BCM2836 = 1,
     PROCESSOR_ID_BCM2837 = 2,
 } RaspiProcessorId;
@@ -XXX,XX +XXX,XX @@ static const struct {
     const char *type;
     int cores_count;
 } soc_property[] = {
+    [PROCESSOR_ID_BCM2835] = {TYPE_BCM2835, 1},
     [PROCESSOR_ID_BCM2836] = {TYPE_BCM2836, BCM283X_NCPUS},
     [PROCESSOR_ID_BCM2837] = {TYPE_BCM2837, BCM283X_NCPUS},
 };
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

The Pi A is almost the first machine released.
It uses a BCM2835 SoC which includes a ARMv6Z core.

Example booting the machine using content from [*]
(we use the device tree from the B model):

$ qemu-system-arm -M raspi1ap -serial stdio \
      -kernel raspberrypi/firmware/boot/kernel.img \
      -dtb raspberrypi/firmware/boot/bcm2708-rpi-b-plus.dtb \
      -append 'earlycon=pl011,0x20201000 console=ttyAMA0'
  [    0.000000] Booting Linux on physical CPU 0x0
  [    0.000000] Linux version 4.19.118+ (dom@buildbot) (gcc version 4.9.3 (crosstool-NG crosstool-ng-1.22.0-88-g8460611)) #1311 Mon Apr 27 14:16:15 BST 2020
  [    0.000000] CPU: ARMv6-compatible processor [410fb767] revision 7 (ARMv7), cr=00c5387d
  [    0.000000] CPU: VIPT aliasing data cache, unknown instruction cache
  [    0.000000] OF: fdt: Machine model: Raspberry Pi Model B+
  ...

[*] http://archive.raspberrypi.org/debian/pool/main/r/raspberrypi-firmware/raspberrypi-kernel_1.20200512-2_armhf.deb

Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-8-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/raspi.c | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/raspi.c
+++ b/hw/arm/raspi.c
@@ -XXX,XX +XXX,XX @@ static void raspi_machine_class_common_init(MachineClass *mc,
     mc->default_ram_id = "ram";
 };
 
+static void raspi1ap_machine_class_init(ObjectClass *oc, void *data)
+{
+    MachineClass *mc = MACHINE_CLASS(oc);
+    RaspiMachineClass *rmc = RASPI_MACHINE_CLASS(oc);
+
+    rmc->board_rev = 0x900021; /* Revision 1.1 */
+    raspi_machine_class_common_init(mc, rmc->board_rev);
+};
+
 static void raspi2b_machine_class_init(ObjectClass *oc, void *data)
 {
     MachineClass *mc = MACHINE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void raspi3b_machine_class_init(ObjectClass *oc, void *data)
 
 static const TypeInfo raspi_machine_types[] = {
     {
+        .name           = MACHINE_TYPE_NAME("raspi1ap"),
+        .parent         = TYPE_RASPI_MACHINE,
+        .class_init     = raspi1ap_machine_class_init,
+    }, {
         .name           = MACHINE_TYPE_NAME("raspi2b"),
         .parent         = TYPE_RASPI_MACHINE,
         .class_init     = raspi2b_machine_class_init,
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

Similarly to the Pi A, the Pi Zero uses a BCM2835 SoC (ARMv6Z core).

The only difference between the revision 1.2 and 1.3 is the latter
exposes a CSI camera connector. As we do not implement the Unicam
peripheral, there is no point in exposing a camera connector :)
Therefore we choose to model the 1.2 revision.

Example booting the machine using content from [*]:

$ qemu-system-arm -M raspi0 -serial stdio \
      -kernel raspberrypi/firmware/boot/kernel.img \
      -dtb raspberrypi/firmware/boot/bcm2708-rpi-zero.dtb \
      -append 'printk.time=0 earlycon=pl011,0x20201000 console=ttyAMA0'
  [    0.000000] Booting Linux on physical CPU 0x0
  [    0.000000] Linux version 4.19.118+ (dom@buildbot) (gcc version 4.9.3 (crosstool-NG crosstool-ng-1.22.0-88-g8460611)) #1311 Mon Apr 27 14:16:15 BST 2020
  [    0.000000] CPU: ARMv6-compatible processor [410fb767] revision 7 (ARMv7), cr=00c5387d
  [    0.000000] CPU: VIPT aliasing data cache, unknown instruction cache
  [    0.000000] OF: fdt: Machine model: Raspberry Pi Zero
  ...

[*] http://archive.raspberrypi.org/debian/pool/main/r/raspberrypi-firmware/raspberrypi-kernel_1.20200512-2_armhf.deb

Reviewed-by: Luc Michel <luc.michel@greensocs.com>
Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-9-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/raspi.c | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/raspi.c
+++ b/hw/arm/raspi.c
@@ -XXX,XX +XXX,XX @@ static void raspi_machine_class_common_init(MachineClass *mc,
     mc->default_ram_id = "ram";
 };
 
+static void raspi0_machine_class_init(ObjectClass *oc, void *data)
+{
+    MachineClass *mc = MACHINE_CLASS(oc);
+    RaspiMachineClass *rmc = RASPI_MACHINE_CLASS(oc);
+
+    rmc->board_rev = 0x920092; /* Revision 1.2 */
+    raspi_machine_class_common_init(mc, rmc->board_rev);
+};
+
 static void raspi1ap_machine_class_init(ObjectClass *oc, void *data)
 {
     MachineClass *mc = MACHINE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static void raspi3b_machine_class_init(ObjectClass *oc, void *data)
 
 static const TypeInfo raspi_machine_types[] = {
     {
+        .name           = MACHINE_TYPE_NAME("raspi0"),
+        .parent         = TYPE_RASPI_MACHINE,
+        .class_init     = raspi0_machine_class_init,
+    }, {
         .name           = MACHINE_TYPE_NAME("raspi1ap"),
         .parent         = TYPE_RASPI_MACHINE,
         .class_init     = raspi1ap_machine_class_init,
-- 
2.20.1

From: Philippe Mathieu-Daudé <f4bug@amsat.org>

The Pi 3A+ is a stripped down version of the 3B:
- 512 MiB of RAM instead of 1 GiB
- no on-board ethernet chipset

Add it as it is a closer match to what we model.

Reviewed-by: Igor Mammedov <imammedo@redhat.com>
Signed-off-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201024170127.3592182-10-f4bug@amsat.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/raspi.c | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/hw/arm/raspi.c b/hw/arm/raspi.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/raspi.c
+++ b/hw/arm/raspi.c
@@ -XXX,XX +XXX,XX @@ static void raspi2b_machine_class_init(ObjectClass *oc, void *data)
 };
 
 #ifdef TARGET_AARCH64
+static void raspi3ap_machine_class_init(ObjectClass *oc, void *data)
+{
+    MachineClass *mc = MACHINE_CLASS(oc);
+    RaspiMachineClass *rmc = RASPI_MACHINE_CLASS(oc);
+
+    rmc->board_rev = 0x9020e0; /* Revision 1.0 */
+    raspi_machine_class_common_init(mc, rmc->board_rev);
+};
+
 static void raspi3b_machine_class_init(ObjectClass *oc, void *data)
 {
     MachineClass *mc = MACHINE_CLASS(oc);
@@ -XXX,XX +XXX,XX @@ static const TypeInfo raspi_machine_types[] = {
         .parent         = TYPE_RASPI_MACHINE,
         .class_init     = raspi2b_machine_class_init,
 #ifdef TARGET_AARCH64
+    }, {
+        .name           = MACHINE_TYPE_NAME("raspi3ap"),
+        .parent         = TYPE_RASPI_MACHINE,
+        .class_init     = raspi3ap_machine_class_init,
     }, {
         .name           = MACHINE_TYPE_NAME("raspi3b"),
         .parent         = TYPE_RASPI_MACHINE,
-- 
2.20.1

From: "Dr. David Alan Gilbert" <dgilbert@redhat.com>

Use of 0x%d - make up our mind as 0x%x

Signed-off-by: Dr. David Alan Gilbert <dgilbert@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Acked-by: Eric Auger <eric.auger@redhat.com>
Message-id: 20201014193355.53074-1-dgilbert@redhat.com
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/trace-events | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/hw/arm/trace-events b/hw/arm/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/trace-events
+++ b/hw/arm/trace-events
@@ -XXX,XX +XXX,XX @@ smmuv3_get_cd(uint64_t addr) "CD addr: 0x%"PRIx64
 smmuv3_decode_cd(uint32_t oas) "oas=%d"
 smmuv3_decode_cd_tt(int i, uint32_t tsz, uint64_t ttb, uint32_t granule_sz, bool had) "TT[%d]:tsz:%d ttb:0x%"PRIx64" granule_sz:%d had:%d"
 smmuv3_cmdq_cfgi_ste(int streamid) "streamid =%d"
-smmuv3_cmdq_cfgi_ste_range(int start, int end) "start=0x%d - end=0x%d"
+smmuv3_cmdq_cfgi_ste_range(int start, int end) "start=0x%x - end=0x%x"
 smmuv3_cmdq_cfgi_cd(uint32_t sid) "streamid = %d"
 smmuv3_config_cache_hit(uint32_t sid, uint32_t hits, uint32_t misses, uint32_t perc) "Config cache HIT for sid %d (hits=%d, misses=%d, hit rate=%d)"
 smmuv3_config_cache_miss(uint32_t sid, uint32_t hits, uint32_t misses, uint32_t perc) "Config cache MISS for sid %d (hits=%d, misses=%d, hit rate=%d)"
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/clock.h | 5 +++++
 1 file changed, 5 insertions(+)

diff --git a/include/hw/clock.h b/include/hw/clock.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/clock.h
+++ b/include/hw/clock.h
@@ -XXX,XX +XXX,XX @@ extern const VMStateDescription vmstate_clock;
     VMSTATE_CLOCK_V(field, state, 0)
 #define VMSTATE_CLOCK_V(field, state, version) \
     VMSTATE_STRUCT_POINTER_V(field, state, version, vmstate_clock, Clock)
+#define VMSTATE_ARRAY_CLOCK(field, state, num) \
+    VMSTATE_ARRAY_CLOCK_V(field, state, num, 0)
+#define VMSTATE_ARRAY_CLOCK_V(field, state, num, version)          \
+    VMSTATE_ARRAY_OF_POINTER_TO_STRUCT(field, state, num, version, \
+                                       vmstate_clock, Clock)
 
 /**
  * clock_setup_canonical_path:
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

The nanosecond unit greatly limits the dynamic range we can display in
clock value traces, for values in the order of 1GHz and more. The
internal representation can go way beyond this value and it is quite
common for today's clocks to be within those ranges.

For example, a frequency between 500MHz+ and 1GHz will be displayed as
1ns. Beyond 1GHz, it will show up as 0ns.

Replace nanosecond periods traces with frequencies in the Hz unit
to have more dynamic range in the trace output.

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Damien Hedde <damien.hedde@greensocs.com>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/core/clock.c      | 6 +++---
 hw/core/trace-events | 4 ++--
 2 files changed, 5 insertions(+), 5 deletions(-)

diff --git a/hw/core/clock.c b/hw/core/clock.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/clock.c
+++ b/hw/core/clock.c
@@ -XXX,XX +XXX,XX @@ bool clock_set(Clock *clk, uint64_t period)
     if (clk->period == period) {
         return false;
     }
-    trace_clock_set(CLOCK_PATH(clk), CLOCK_PERIOD_TO_NS(clk->period),
-                    CLOCK_PERIOD_TO_NS(period));
+    trace_clock_set(CLOCK_PATH(clk), CLOCK_PERIOD_TO_HZ(clk->period),
+                    CLOCK_PERIOD_TO_HZ(period));
     clk->period = period;
 
     return true;
@@ -XXX,XX +XXX,XX @@ static void clock_propagate_period(Clock *clk, bool call_callbacks)
         if (child->period != clk->period) {
             child->period = clk->period;
             trace_clock_update(CLOCK_PATH(child), CLOCK_PATH(clk),
-                               CLOCK_PERIOD_TO_NS(clk->period),
+                               CLOCK_PERIOD_TO_HZ(clk->period),
                                call_callbacks);
             if (call_callbacks && child->callback) {
                 child->callback(child->callback_opaque);
diff --git a/hw/core/trace-events b/hw/core/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/trace-events
+++ b/hw/core/trace-events
@@ -XXX,XX +XXX,XX @@ resettable_transitional_function(void *obj, const char *objtype) "obj=%p(%s)"
 # clock.c
 clock_set_source(const char *clk, const char *src) "'%s', src='%s'"
 clock_disconnect(const char *clk) "'%s'"
-clock_set(const char *clk, uint64_t old, uint64_t new) "'%s', ns=%"PRIu64"->%"PRIu64
+clock_set(const char *clk, uint64_t old, uint64_t new) "'%s', %"PRIu64"Hz->%"PRIu64"Hz"
 clock_propagate(const char *clk) "'%s'"
-clock_update(const char *clk, const char *src, uint64_t val, int cb) "'%s', src='%s', ns=%"PRIu64", cb=%d"
+clock_update(const char *clk, const char *src, uint64_t hz, int cb) "'%s', src='%s', val=%"PRIu64"Hz cb=%d"
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

The CPRMAN (clock controller) was mapped at the watchdog/power manager
address. It was also split into two unimplemented peripherals (CM and
A2W) but this is really the same one, as shown by this extract of the
Raspberry Pi 3 Linux device tree:

watchdog@7e100000 {
            compatible = "brcm,bcm2835-pm\0brcm,bcm2835-pm-wdt";
            [...]
            reg = <0x7e100000 0x114 0x7e00a000 0x24>;
            [...]
    };

[...]
    cprman@7e101000 {
            compatible = "brcm,bcm2835-cprman";
            [...]
            reg = <0x7e101000 0x2000>;
            [...]
    };

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/bcm2835_peripherals.h | 2 +-
 include/hw/arm/raspi_platform.h      | 5 ++---
 hw/arm/bcm2835_peripherals.c         | 4 ++--
 3 files changed, 5 insertions(+), 6 deletions(-)

diff --git a/include/hw/arm/bcm2835_peripherals.h b/include/hw/arm/bcm2835_peripherals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/bcm2835_peripherals.h
+++ b/include/hw/arm/bcm2835_peripherals.h
@@ -XXX,XX +XXX,XX @@ struct BCM2835PeripheralState {
     BCM2835MphiState mphi;
     UnimplementedDeviceState txp;
     UnimplementedDeviceState armtmr;
+    UnimplementedDeviceState powermgt;
     UnimplementedDeviceState cprman;
-    UnimplementedDeviceState a2w;
     PL011State uart0;
     BCM2835AuxState aux;
     BCM2835FBState fb;
diff --git a/include/hw/arm/raspi_platform.h b/include/hw/arm/raspi_platform.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/raspi_platform.h
+++ b/include/hw/arm/raspi_platform.h
@@ -XXX,XX +XXX,XX @@
 #define ARMCTRL_TIMER0_1_OFFSET (ARM_OFFSET + 0x400) /* Timer 0 and 1 (SP804) */
 #define ARMCTRL_0_SBM_OFFSET    (ARM_OFFSET + 0x800) /* User 0 (ARM) Semaphores
                                                       * Doorbells & Mailboxes */
-#define CPRMAN_OFFSET           0x100000 /* Power Management, Watchdog */
-#define CM_OFFSET               0x101000 /* Clock Management */
-#define A2W_OFFSET              0x102000 /* Reset controller */
+#define PM_OFFSET               0x100000 /* Power Management */
+#define CPRMAN_OFFSET           0x101000 /* Clock Management */
 #define AVS_OFFSET              0x103000 /* Audio Video Standard */
 #define RNG_OFFSET              0x104000
 #define GPIO_OFFSET             0x200000
diff --git a/hw/arm/bcm2835_peripherals.c b/hw/arm/bcm2835_peripherals.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2835_peripherals.c
+++ b/hw/arm/bcm2835_peripherals.c
@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
 
     create_unimp(s, &s->txp, "bcm2835-txp", TXP_OFFSET, 0x1000);
     create_unimp(s, &s->armtmr, "bcm2835-sp804", ARMCTRL_TIMER0_1_OFFSET, 0x40);
-    create_unimp(s, &s->cprman, "bcm2835-cprman", CPRMAN_OFFSET, 0x1000);
-    create_unimp(s, &s->a2w, "bcm2835-a2w", A2W_OFFSET, 0x1000);
+    create_unimp(s, &s->powermgt, "bcm2835-powermgt", PM_OFFSET, 0x114);
+    create_unimp(s, &s->cprman, "bcm2835-cprman", CPRMAN_OFFSET, 0x2000);
     create_unimp(s, &s->i2s, "bcm2835-i2s", I2S_OFFSET, 0x100);
     create_unimp(s, &s->smi, "bcm2835-smi", SMI_OFFSET, 0x100);
     create_unimp(s, &s->spi[0], "bcm2835-spi0", SPI0_OFFSET, 0x20);
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

The BCM2835 CPRMAN is the clock manager of the SoC. It is composed of a
main oscillator, and several sub-components (PLLs, multiplexers, ...) to
generate the BCM2835 clock tree.

This commit adds a skeleton of the CPRMAN, with a dummy register
read/write implementation. It embeds the main oscillator (xosc) from
which all the clocks will be derived.

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/arm/bcm2835_peripherals.h       |   3 +-
 include/hw/misc/bcm2835_cprman.h           |  37 +++++
 include/hw/misc/bcm2835_cprman_internals.h |  24 +++
 hw/arm/bcm2835_peripherals.c               |  11 +-
 hw/misc/bcm2835_cprman.c                   | 163 +++++++++++++++++++++
 hw/misc/meson.build                        |   1 +
 hw/misc/trace-events                       |   5 +
 7 files changed, 242 insertions(+), 2 deletions(-)
 create mode 100644 include/hw/misc/bcm2835_cprman.h
 create mode 100644 include/hw/misc/bcm2835_cprman_internals.h
 create mode 100644 hw/misc/bcm2835_cprman.c

diff --git a/include/hw/arm/bcm2835_peripherals.h b/include/hw/arm/bcm2835_peripherals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/arm/bcm2835_peripherals.h
+++ b/include/hw/arm/bcm2835_peripherals.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/bcm2835_mbox.h"
 #include "hw/misc/bcm2835_mphi.h"
 #include "hw/misc/bcm2835_thermal.h"
+#include "hw/misc/bcm2835_cprman.h"
 #include "hw/sd/sdhci.h"
 #include "hw/sd/bcm2835_sdhost.h"
 #include "hw/gpio/bcm2835_gpio.h"
@@ -XXX,XX +XXX,XX @@ struct BCM2835PeripheralState {
     UnimplementedDeviceState txp;
     UnimplementedDeviceState armtmr;
     UnimplementedDeviceState powermgt;
-    UnimplementedDeviceState cprman;
+    BCM2835CprmanState cprman;
     PL011State uart0;
     BCM2835AuxState aux;
     BCM2835FBState fb;
diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/misc/bcm2835_cprman.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * BCM2835 CPRMAN clock manager
+ *
+ * Copyright (c) 2020 Luc Michel <luc@lmichel.fr>
+ *
+ * SPDX-License-Identifier: GPL-2.0-or-later
+ */
+
+#ifndef HW_MISC_CPRMAN_H
+#define HW_MISC_CPRMAN_H
+
+#include "hw/sysbus.h"
+#include "hw/qdev-clock.h"
+
+#define TYPE_BCM2835_CPRMAN "bcm2835-cprman"
+
+typedef struct BCM2835CprmanState BCM2835CprmanState;
+
+DECLARE_INSTANCE_CHECKER(BCM2835CprmanState, CPRMAN,
+                         TYPE_BCM2835_CPRMAN)
+
+#define CPRMAN_NUM_REGS (0x2000 / sizeof(uint32_t))
+
+struct BCM2835CprmanState {
+    /*< private >*/
+    SysBusDevice parent_obj;
+
+    /*< public >*/
+    MemoryRegion iomem;
+
+    uint32_t regs[CPRMAN_NUM_REGS];
+    uint32_t xosc_freq;
+
+    Clock *xosc;
+};
+
+#endif
diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * BCM2835 CPRMAN clock manager
+ *
+ * Copyright (c) 2020 Luc Michel <luc@lmichel.fr>
+ *
+ * SPDX-License-Identifier: GPL-2.0-or-later
+ */
+
+#ifndef HW_MISC_CPRMAN_INTERNALS_H
+#define HW_MISC_CPRMAN_INTERNALS_H
+
+#include "hw/registerfields.h"
+#include "hw/misc/bcm2835_cprman.h"
+
+/* Register map */
+
+/*
+ * This field is common to all registers. Each register write value must match
+ * the CPRMAN_PASSWORD magic value in its 8 MSB.
+ */
+FIELD(CPRMAN, PASSWORD, 24, 8)
+#define CPRMAN_PASSWORD 0x5a
+
+#endif
diff --git a/hw/arm/bcm2835_peripherals.c b/hw/arm/bcm2835_peripherals.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2835_peripherals.c
+++ b/hw/arm/bcm2835_peripherals.c
@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_init(Object *obj)
     /* DWC2 */
     object_initialize_child(obj, "dwc2", &s->dwc2, TYPE_DWC2_USB);
 
+    /* CPRMAN clock manager */
+    object_initialize_child(obj, "cprman", &s->cprman, TYPE_BCM2835_CPRMAN);
+
     object_property_add_const_link(OBJECT(&s->dwc2), "dma-mr",
                                    OBJECT(&s->gpu_bus_mr));
 }
@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
         return;
     }
 
+    /* CPRMAN clock manager */
+    if (!sysbus_realize(SYS_BUS_DEVICE(&s->cprman), errp)) {
+        return;
+    }
+    memory_region_add_subregion(&s->peri_mr, CPRMAN_OFFSET,
+                sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->cprman), 0));
+
     memory_region_add_subregion(&s->peri_mr, ARMCTRL_IC_OFFSET,
                 sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->ic), 0));
     sysbus_pass_irq(SYS_BUS_DEVICE(s), SYS_BUS_DEVICE(&s->ic));
@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
     create_unimp(s, &s->txp, "bcm2835-txp", TXP_OFFSET, 0x1000);
     create_unimp(s, &s->armtmr, "bcm2835-sp804", ARMCTRL_TIMER0_1_OFFSET, 0x40);
     create_unimp(s, &s->powermgt, "bcm2835-powermgt", PM_OFFSET, 0x114);
-    create_unimp(s, &s->cprman, "bcm2835-cprman", CPRMAN_OFFSET, 0x2000);
     create_unimp(s, &s->i2s, "bcm2835-i2s", I2S_OFFSET, 0x100);
     create_unimp(s, &s->smi, "bcm2835-smi", SMI_OFFSET, 0x100);
     create_unimp(s, &s->spi[0], "bcm2835-spi0", SPI0_OFFSET, 0x20);
diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * BCM2835 CPRMAN clock manager
+ *
+ * Copyright (c) 2020 Luc Michel <luc@lmichel.fr>
+ *
+ * SPDX-License-Identifier: GPL-2.0-or-later
+ */
+
+/*
+ * This peripheral is roughly divided into 3 main parts:
+ *   - the PLLs
+ *   - the PLL channels
+ *   - the clock muxes
+ *
+ * A main oscillator (xosc) feeds all the PLLs. Each PLLs has one or more
+ * channels. Those channel are then connected to the clock muxes. Each mux has
+ * multiples sources (usually the xosc, some of the PLL channels and some "test
+ * debug" clocks). A mux is configured to select a given source through its
+ * control register. Each mux has one output clock that also goes out of the
+ * CPRMAN. This output clock usually connects to another peripheral in the SoC
+ * (so a given mux is dedicated to a peripheral).
+ *
+ * At each level (PLL, channel and mux), the clock can be altered through
+ * dividers (and multipliers in case of the PLLs), and can be disabled (in this
+ * case, the next levels see no clock).
+ *
+ * This can be sum-up as follows (this is an example and not the actual BCM2835
+ * clock tree):
+ *
+ *          /-->[PLL]-|->[PLL channel]--...            [mux]--> to peripherals
+ *          |         |->[PLL channel]  muxes takes    [mux]
+ *          |         \->[PLL channel]  inputs from    [mux]
+ *          |                           some channels  [mux]
+ * [xosc]---|-->[PLL]-|->[PLL channel]  and other srcs [mux]
+ *          |         \->[PLL channel]           ...-->[mux]
+ *          |                                          [mux]
+ *          \-->[PLL]--->[PLL channel]                 [mux]
+ *
+ * The page at https://elinux.org/The_Undocumented_Pi gives the actual clock
+ * tree configuration.
+ */
+
+#include "qemu/osdep.h"
+#include "qemu/log.h"
+#include "migration/vmstate.h"
+#include "hw/qdev-properties.h"
+#include "hw/misc/bcm2835_cprman.h"
+#include "hw/misc/bcm2835_cprman_internals.h"
+#include "trace.h"
+
+/* CPRMAN "top level" model */
+
+static uint64_t cprman_read(void *opaque, hwaddr offset,
+                            unsigned size)
+{
+    BCM2835CprmanState *s = CPRMAN(opaque);
+    uint64_t r = 0;
+    size_t idx = offset / sizeof(uint32_t);
+
+    switch (idx) {
+    default:
+        r = s->regs[idx];
+    }
+
+    trace_bcm2835_cprman_read(offset, r);
+    return r;
+}
+
+static void cprman_write(void *opaque, hwaddr offset,
+                         uint64_t value, unsigned size)
+{
+    BCM2835CprmanState *s = CPRMAN(opaque);
+    size_t idx = offset / sizeof(uint32_t);
+
+    if (FIELD_EX32(value, CPRMAN, PASSWORD) != CPRMAN_PASSWORD) {
+        trace_bcm2835_cprman_write_invalid_magic(offset, value);
+        return;
+    }
+
+    value &= ~R_CPRMAN_PASSWORD_MASK;
+
+    trace_bcm2835_cprman_write(offset, value);
+    s->regs[idx] = value;
+
+}
+
+static const MemoryRegionOps cprman_ops = {
+    .read = cprman_read,
+    .write = cprman_write,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    .valid = {
+        /*
+         * Although this hasn't been checked against real hardware, nor the
+         * information can be found in a datasheet, it seems reasonable because
+         * of the "PASSWORD" magic value found in every registers.
+         */
+        .min_access_size        = 4,
+        .max_access_size        = 4,
+        .unaligned              = false,
+    },
+    .impl = {
+        .max_access_size = 4,
+    },
+};
+
+static void cprman_reset(DeviceState *dev)
+{
+    BCM2835CprmanState *s = CPRMAN(dev);
+
+    memset(s->regs, 0, sizeof(s->regs));
+
+    clock_update_hz(s->xosc, s->xosc_freq);
+}
+
+static void cprman_init(Object *obj)
+{
+    BCM2835CprmanState *s = CPRMAN(obj);
+
+    s->xosc = clock_new(obj, "xosc");
+
+    memory_region_init_io(&s->iomem, obj, &cprman_ops,
+                          s, "bcm2835-cprman", 0x2000);
+    sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
+}
+
+static const VMStateDescription cprman_vmstate = {
+    .name = TYPE_BCM2835_CPRMAN,
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_UINT32_ARRAY(regs, BCM2835CprmanState, CPRMAN_NUM_REGS),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
+static Property cprman_properties[] = {
+    DEFINE_PROP_UINT32("xosc-freq-hz", BCM2835CprmanState, xosc_freq, 19200000),
+    DEFINE_PROP_END_OF_LIST()
+};
+
+static void cprman_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->reset = cprman_reset;
+    dc->vmsd = &cprman_vmstate;
+    device_class_set_props(dc, cprman_properties);
+}
+
+static const TypeInfo cprman_info = {
+    .name = TYPE_BCM2835_CPRMAN,
+    .parent = TYPE_SYS_BUS_DEVICE,
+    .instance_size = sizeof(BCM2835CprmanState),
+    .class_init = cprman_class_init,
+    .instance_init = cprman_init,
+};
+
+static void cprman_register_types(void)
+{
+    type_register_static(&cprman_info);
+}
+
+type_init(cprman_register_types);
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files(
   'bcm2835_property.c',
   'bcm2835_rng.c',
   'bcm2835_thermal.c',
+  'bcm2835_cprman.c',
 ))
 softmmu_ss.add(when: 'CONFIG_SLAVIO', if_true: files('slavio_misc.c'))
 softmmu_ss.add(when: 'CONFIG_ZYNQ', if_true: files('zynq_slcr.c', 'zynq-xadc.c'))
diff --git a/hw/misc/trace-events b/hw/misc/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/trace-events
+++ b/hw/misc/trace-events
@@ -XXX,XX +XXX,XX @@ grlib_apb_pnp_read(uint64_t addr, uint32_t value) "APB PnP read addr:0x%03"PRIx6
 # pca9552.c
 pca955x_gpio_status(const char *description, const char *buf) "%s GPIOs 0-15 [%s]"
 pca955x_gpio_change(const char *description, unsigned id, unsigned prev_state, unsigned current_state) "%s GPIO id:%u status: %u -> %u"
+
+# bcm2835_cprman.c
+bcm2835_cprman_read(uint64_t offset, uint64_t value) "offset:0x%" PRIx64 " value:0x%" PRIx64
+bcm2835_cprman_write(uint64_t offset, uint64_t value) "offset:0x%" PRIx64 " value:0x%" PRIx64
+bcm2835_cprman_write_invalid_magic(uint64_t offset, uint64_t value) "offset:0x%" PRIx64 " value:0x%" PRIx64
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

There are 5 PLLs in the CPRMAN, namely PLL A, C, D, H and B. All of them
take the xosc clock as input and produce a new clock.

This commit adds a skeleton implementation for the PLLs as sub-devices
of the CPRMAN. The PLLs are instantiated and connected internally to the
main oscillator.

Each PLL has 6 registers : CM, A2W_CTRL, A2W_ANA[0,1,2,3], A2W_FRAC. A
write to any of them triggers a call to the (not yet implemented)
pll_update function.

If the main oscillator changes frequency, an update is also triggered.

diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman.h
+++ b/include/hw/misc/bcm2835_cprman.h
@@ -XXX,XX +XXX,XX @@ DECLARE_INSTANCE_CHECKER(BCM2835CprmanState, CPRMAN,
 
 #define CPRMAN_NUM_REGS (0x2000 / sizeof(uint32_t))
 
+typedef enum CprmanPll {
+    CPRMAN_PLLA = 0,
+    CPRMAN_PLLC,
+    CPRMAN_PLLD,
+    CPRMAN_PLLH,
+    CPRMAN_PLLB,
+
+    CPRMAN_NUM_PLL
+} CprmanPll;
+
+typedef struct CprmanPllState {
+    /*< private >*/
+    DeviceState parent_obj;
+
+    /*< public >*/
+    CprmanPll id;
+
+    uint32_t *reg_cm;
+    uint32_t *reg_a2w_ctrl;
+    uint32_t *reg_a2w_ana; /* ANA[0] .. ANA[3] */
+    uint32_t prediv_mask; /* prediv bit in ana[1] */
+    uint32_t *reg_a2w_frac;
+
+    Clock *xosc_in;
+    Clock *out;
+} CprmanPllState;
+
 struct BCM2835CprmanState {
     /*< private >*/
     SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
     /*< public >*/
     MemoryRegion iomem;
 
+    CprmanPllState plls[CPRMAN_NUM_PLL];
+
     uint32_t regs[CPRMAN_NUM_REGS];
     uint32_t xosc_freq;
 
diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman_internals.h
+++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/registerfields.h"
 #include "hw/misc/bcm2835_cprman.h"
 
+#define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
+
+DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
+                         TYPE_CPRMAN_PLL)
+
 /* Register map */
 
+/* PLLs */
+REG32(CM_PLLA, 0x104)
+    FIELD(CM_PLLA, LOADDSI0, 0, 1)
+    FIELD(CM_PLLA, HOLDDSI0, 1, 1)
+    FIELD(CM_PLLA, LOADCCP2, 2, 1)
+    FIELD(CM_PLLA, HOLDCCP2, 3, 1)
+    FIELD(CM_PLLA, LOADCORE, 4, 1)
+    FIELD(CM_PLLA, HOLDCORE, 5, 1)
+    FIELD(CM_PLLA, LOADPER, 6, 1)
+    FIELD(CM_PLLA, HOLDPER, 7, 1)
+    FIELD(CM_PLLx, ANARST, 8, 1)
+REG32(CM_PLLC, 0x108)
+    FIELD(CM_PLLC, LOADCORE0, 0, 1)
+    FIELD(CM_PLLC, HOLDCORE0, 1, 1)
+    FIELD(CM_PLLC, LOADCORE1, 2, 1)
+    FIELD(CM_PLLC, HOLDCORE1, 3, 1)
+    FIELD(CM_PLLC, LOADCORE2, 4, 1)
+    FIELD(CM_PLLC, HOLDCORE2, 5, 1)
+    FIELD(CM_PLLC, LOADPER, 6, 1)
+    FIELD(CM_PLLC, HOLDPER, 7, 1)
+REG32(CM_PLLD, 0x10c)
+    FIELD(CM_PLLD, LOADDSI0, 0, 1)
+    FIELD(CM_PLLD, HOLDDSI0, 1, 1)
+    FIELD(CM_PLLD, LOADDSI1, 2, 1)
+    FIELD(CM_PLLD, HOLDDSI1, 3, 1)
+    FIELD(CM_PLLD, LOADCORE, 4, 1)
+    FIELD(CM_PLLD, HOLDCORE, 5, 1)
+    FIELD(CM_PLLD, LOADPER, 6, 1)
+    FIELD(CM_PLLD, HOLDPER, 7, 1)
+REG32(CM_PLLH, 0x110)
+    FIELD(CM_PLLH, LOADPIX, 0, 1)
+    FIELD(CM_PLLH, LOADAUX, 1, 1)
+    FIELD(CM_PLLH, LOADRCAL, 2, 1)
+REG32(CM_PLLB, 0x170)
+    FIELD(CM_PLLB, LOADARM, 0, 1)
+    FIELD(CM_PLLB, HOLDARM, 1, 1)
+
+REG32(A2W_PLLA_CTRL, 0x1100)
+    FIELD(A2W_PLLx_CTRL, NDIV, 0, 10)
+    FIELD(A2W_PLLx_CTRL, PDIV, 12, 3)
+    FIELD(A2W_PLLx_CTRL, PWRDN, 16, 1)
+    FIELD(A2W_PLLx_CTRL, PRST_DISABLE, 17, 1)
+REG32(A2W_PLLC_CTRL, 0x1120)
+REG32(A2W_PLLD_CTRL, 0x1140)
+REG32(A2W_PLLH_CTRL, 0x1160)
+REG32(A2W_PLLB_CTRL, 0x11e0)
+
+REG32(A2W_PLLA_ANA0, 0x1010)
+REG32(A2W_PLLA_ANA1, 0x1014)
+    FIELD(A2W_PLLx_ANA1, FB_PREDIV, 14, 1)
+REG32(A2W_PLLA_ANA2, 0x1018)
+REG32(A2W_PLLA_ANA3, 0x101c)
+
+REG32(A2W_PLLC_ANA0, 0x1030)
+REG32(A2W_PLLC_ANA1, 0x1034)
+REG32(A2W_PLLC_ANA2, 0x1038)
+REG32(A2W_PLLC_ANA3, 0x103c)
+
+REG32(A2W_PLLD_ANA0, 0x1050)
+REG32(A2W_PLLD_ANA1, 0x1054)
+REG32(A2W_PLLD_ANA2, 0x1058)
+REG32(A2W_PLLD_ANA3, 0x105c)
+
+REG32(A2W_PLLH_ANA0, 0x1070)
+REG32(A2W_PLLH_ANA1, 0x1074)
+    FIELD(A2W_PLLH_ANA1, FB_PREDIV, 11, 1)
+REG32(A2W_PLLH_ANA2, 0x1078)
+REG32(A2W_PLLH_ANA3, 0x107c)
+
+REG32(A2W_PLLB_ANA0, 0x10f0)
+REG32(A2W_PLLB_ANA1, 0x10f4)
+REG32(A2W_PLLB_ANA2, 0x10f8)
+REG32(A2W_PLLB_ANA3, 0x10fc)
+
+REG32(A2W_PLLA_FRAC, 0x1200)
+    FIELD(A2W_PLLx_FRAC, FRAC, 0, 20)
+REG32(A2W_PLLC_FRAC, 0x1220)
+REG32(A2W_PLLD_FRAC, 0x1240)
+REG32(A2W_PLLH_FRAC, 0x1260)
+REG32(A2W_PLLB_FRAC, 0x12e0)
+
 /*
  * This field is common to all registers. Each register write value must match
  * the CPRMAN_PASSWORD magic value in its 8 MSB.
@@ -XXX,XX +XXX,XX @@
 FIELD(CPRMAN, PASSWORD, 24, 8)
 #define CPRMAN_PASSWORD 0x5a
 
+/* PLL init info */
+typedef struct PLLInitInfo {
+    const char *name;
+    size_t cm_offset;
+    size_t a2w_ctrl_offset;
+    size_t a2w_ana_offset;
+    uint32_t prediv_mask; /* Prediv bit in ana[1] */
+    size_t a2w_frac_offset;
+} PLLInitInfo;
+
+#define FILL_PLL_INIT_INFO(pll_)                \
+    .cm_offset = R_CM_ ## pll_,                 \
+    .a2w_ctrl_offset = R_A2W_ ## pll_ ## _CTRL, \
+    .a2w_ana_offset = R_A2W_ ## pll_ ## _ANA0,  \
+    .a2w_frac_offset = R_A2W_ ## pll_ ## _FRAC
+
+static const PLLInitInfo PLL_INIT_INFO[] = {
+    [CPRMAN_PLLA] = {
+        .name = "plla",
+        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
+        FILL_PLL_INIT_INFO(PLLA),
+    },
+    [CPRMAN_PLLC] = {
+        .name = "pllc",
+        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
+        FILL_PLL_INIT_INFO(PLLC),
+    },
+    [CPRMAN_PLLD] = {
+        .name = "plld",
+        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
+        FILL_PLL_INIT_INFO(PLLD),
+    },
+    [CPRMAN_PLLH] = {
+        .name = "pllh",
+        .prediv_mask = R_A2W_PLLH_ANA1_FB_PREDIV_MASK,
+        FILL_PLL_INIT_INFO(PLLH),
+    },
+    [CPRMAN_PLLB] = {
+        .name = "pllb",
+        .prediv_mask = R_A2W_PLLx_ANA1_FB_PREDIV_MASK,
+        FILL_PLL_INIT_INFO(PLLB),
+    },
+};
+
+#undef FILL_PLL_CHANNEL_INIT_INFO
+
+static inline void set_pll_init_info(BCM2835CprmanState *s,
+                                     CprmanPllState *pll,
+                                     CprmanPll id)
+{
+    pll->id = id;
+    pll->reg_cm = &s->regs[PLL_INIT_INFO[id].cm_offset];
+    pll->reg_a2w_ctrl = &s->regs[PLL_INIT_INFO[id].a2w_ctrl_offset];
+    pll->reg_a2w_ana = &s->regs[PLL_INIT_INFO[id].a2w_ana_offset];
+    pll->prediv_mask = PLL_INIT_INFO[id].prediv_mask;
+    pll->reg_a2w_frac = &s->regs[PLL_INIT_INFO[id].a2w_frac_offset];
+}
+
 #endif
diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/bcm2835_cprman.c
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/bcm2835_cprman_internals.h"
 #include "trace.h"
 
+/* PLL */
+
+static void pll_update(CprmanPllState *pll)
+{
+    clock_update(pll->out, 0);
+}
+
+static void pll_xosc_update(void *opaque)
+{
+    pll_update(CPRMAN_PLL(opaque));
+}
+
+static void pll_init(Object *obj)
+{
+    CprmanPllState *s = CPRMAN_PLL(obj);
+
+    s->xosc_in = qdev_init_clock_in(DEVICE(s), "xosc-in", pll_xosc_update, s);
+    s->out = qdev_init_clock_out(DEVICE(s), "out");
+}
+
+static const VMStateDescription pll_vmstate = {
+    .name = TYPE_CPRMAN_PLL,
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_CLOCK(xosc_in, CprmanPllState),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
+static void pll_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->vmsd = &pll_vmstate;
+}
+
+static const TypeInfo cprman_pll_info = {
+    .name = TYPE_CPRMAN_PLL,
+    .parent = TYPE_DEVICE,
+    .instance_size = sizeof(CprmanPllState),
+    .class_init = pll_class_init,
+    .instance_init = pll_init,
+};
+
+
 /* CPRMAN "top level" model */
 
 static uint64_t cprman_read(void *opaque, hwaddr offset,
@@ -XXX,XX +XXX,XX @@ static uint64_t cprman_read(void *opaque, hwaddr offset,
     return r;
 }
 
+#define CASE_PLL_REGS(pll_)       \
+    case R_CM_ ## pll_:           \
+    case R_A2W_ ## pll_ ## _CTRL: \
+    case R_A2W_ ## pll_ ## _ANA0: \
+    case R_A2W_ ## pll_ ## _ANA1: \
+    case R_A2W_ ## pll_ ## _ANA2: \
+    case R_A2W_ ## pll_ ## _ANA3: \
+    case R_A2W_ ## pll_ ## _FRAC
+
 static void cprman_write(void *opaque, hwaddr offset,
                          uint64_t value, unsigned size)
 {
@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
     trace_bcm2835_cprman_write(offset, value);
     s->regs[idx] = value;
 
+    switch (idx) {
+    CASE_PLL_REGS(PLLA) :
+        pll_update(&s->plls[CPRMAN_PLLA]);
+        break;
+
+    CASE_PLL_REGS(PLLC) :
+        pll_update(&s->plls[CPRMAN_PLLC]);
+        break;
+
+    CASE_PLL_REGS(PLLD) :
+        pll_update(&s->plls[CPRMAN_PLLD]);
+        break;
+
+    CASE_PLL_REGS(PLLH) :
+        pll_update(&s->plls[CPRMAN_PLLH]);
+        break;
+
+    CASE_PLL_REGS(PLLB) :
+        pll_update(&s->plls[CPRMAN_PLLB]);
+        break;
+    }
 }
 
+#undef CASE_PLL_REGS
+
 static const MemoryRegionOps cprman_ops = {
     .read = cprman_read,
     .write = cprman_write,
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps cprman_ops = {
 static void cprman_reset(DeviceState *dev)
 {
     BCM2835CprmanState *s = CPRMAN(dev);
+    size_t i;
 
     memset(s->regs, 0, sizeof(s->regs));
 
+    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
+        device_cold_reset(DEVICE(&s->plls[i]));
+    }
+
     clock_update_hz(s->xosc, s->xosc_freq);
 }
 
 static void cprman_init(Object *obj)
 {
     BCM2835CprmanState *s = CPRMAN(obj);
+    size_t i;
+
+    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
+        object_initialize_child(obj, PLL_INIT_INFO[i].name,
+                                &s->plls[i], TYPE_CPRMAN_PLL);
+        set_pll_init_info(s, &s->plls[i], i);
+    }
 
     s->xosc = clock_new(obj, "xosc");
 
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
     sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
 }
 
+static void cprman_realize(DeviceState *dev, Error **errp)
+{
+    BCM2835CprmanState *s = CPRMAN(dev);
+    size_t i;
+
+    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
+        CprmanPllState *pll = &s->plls[i];
+
+        clock_set_source(pll->xosc_in, s->xosc);
+
+        if (!qdev_realize(DEVICE(pll), NULL, errp)) {
+            return;
+        }
+    }
+}
+
 static const VMStateDescription cprman_vmstate = {
     .name = TYPE_BCM2835_CPRMAN,
     .version_id = 1,
@@ -XXX,XX +XXX,XX @@ static void cprman_class_init(ObjectClass *klass, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(klass);
 
+    dc->realize = cprman_realize;
     dc->reset = cprman_reset;
     dc->vmsd = &cprman_vmstate;
     device_class_set_props(dc, cprman_properties);
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_info = {
 static void cprman_register_types(void)
 {
     type_register_static(&cprman_info);
+    type_register_static(&cprman_pll_info);
 }
 
 type_init(cprman_register_types);
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

The CPRMAN PLLs generate a clock based on a prescaler, a multiplier and
a divider. The prescaler doubles the parent (xosc) frequency, then the
multiplier/divider are applied. The multiplier has an integer and a
fractional part.

This commit also implements the CPRMAN CM_LOCK register. This register
reports which PLL is currently locked. We consider a PLL has being
locked as soon as it is enabled (on real hardware, there is a delay
after turning a PLL on, for it to stabilize).

From: Luc Michel <luc@lmichel.fr>

PLLs are composed of multiple channels. Each channel outputs one clock
signal. They are modeled as one device taking the PLL generated clock as
input, and outputting a new clock.

A channel shares the CM register with its parent PLL, and has its own
A2W_CTRL register. A write to the CM register will trigger an update of
the PLL and all its channels, while a write to an A2W_CTRL channel
register will update the required channel only.

diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman.h
+++ b/include/hw/misc/bcm2835_cprman.h
@@ -XXX,XX +XXX,XX @@ typedef enum CprmanPll {
     CPRMAN_NUM_PLL
 } CprmanPll;
 
+typedef enum CprmanPllChannel {
+    CPRMAN_PLLA_CHANNEL_DSI0 = 0,
+    CPRMAN_PLLA_CHANNEL_CORE,
+    CPRMAN_PLLA_CHANNEL_PER,
+    CPRMAN_PLLA_CHANNEL_CCP2,
+
+    CPRMAN_PLLC_CHANNEL_CORE2,
+    CPRMAN_PLLC_CHANNEL_CORE1,
+    CPRMAN_PLLC_CHANNEL_PER,
+    CPRMAN_PLLC_CHANNEL_CORE0,
+
+    CPRMAN_PLLD_CHANNEL_DSI0,
+    CPRMAN_PLLD_CHANNEL_CORE,
+    CPRMAN_PLLD_CHANNEL_PER,
+    CPRMAN_PLLD_CHANNEL_DSI1,
+
+    CPRMAN_PLLH_CHANNEL_AUX,
+    CPRMAN_PLLH_CHANNEL_RCAL,
+    CPRMAN_PLLH_CHANNEL_PIX,
+
+    CPRMAN_PLLB_CHANNEL_ARM,
+
+    CPRMAN_NUM_PLL_CHANNEL,
+} CprmanPllChannel;
+
 typedef struct CprmanPllState {
     /*< private >*/
     DeviceState parent_obj;
@@ -XXX,XX +XXX,XX @@ typedef struct CprmanPllState {
     Clock *out;
 } CprmanPllState;
 
+typedef struct CprmanPllChannelState {
+    /*< private >*/
+    DeviceState parent_obj;
+
+    /*< public >*/
+    CprmanPllChannel id;
+    CprmanPll parent;
+
+    uint32_t *reg_cm;
+    uint32_t hold_mask;
+    uint32_t load_mask;
+    uint32_t *reg_a2w_ctrl;
+    int fixed_divider;
+
+    Clock *pll_in;
+    Clock *out;
+} CprmanPllChannelState;
+
 struct BCM2835CprmanState {
     /*< private >*/
     SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
     MemoryRegion iomem;
 
     CprmanPllState plls[CPRMAN_NUM_PLL];
+    CprmanPllChannelState channels[CPRMAN_NUM_PLL_CHANNEL];
 
     uint32_t regs[CPRMAN_NUM_REGS];
     uint32_t xosc_freq;
diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman_internals.h
+++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/bcm2835_cprman.h"
 
 #define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
+#define TYPE_CPRMAN_PLL_CHANNEL "bcm2835-cprman-pll-channel"
 
 DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
                          TYPE_CPRMAN_PLL)
+DECLARE_INSTANCE_CHECKER(CprmanPllChannelState, CPRMAN_PLL_CHANNEL,
+                         TYPE_CPRMAN_PLL_CHANNEL)
 
 /* Register map */
 
@@ -XXX,XX +XXX,XX @@ REG32(A2W_PLLD_FRAC, 0x1240)
 REG32(A2W_PLLH_FRAC, 0x1260)
 REG32(A2W_PLLB_FRAC, 0x12e0)
 
+/* PLL channels */
+REG32(A2W_PLLA_DSI0, 0x1300)
+    FIELD(A2W_PLLx_CHANNELy, DIV, 0, 8)
+    FIELD(A2W_PLLx_CHANNELy, DISABLE, 8, 1)
+REG32(A2W_PLLA_CORE, 0x1400)
+REG32(A2W_PLLA_PER, 0x1500)
+REG32(A2W_PLLA_CCP2, 0x1600)
+
+REG32(A2W_PLLC_CORE2, 0x1320)
+REG32(A2W_PLLC_CORE1, 0x1420)
+REG32(A2W_PLLC_PER, 0x1520)
+REG32(A2W_PLLC_CORE0, 0x1620)
+
+REG32(A2W_PLLD_DSI0, 0x1340)
+REG32(A2W_PLLD_CORE, 0x1440)
+REG32(A2W_PLLD_PER, 0x1540)
+REG32(A2W_PLLD_DSI1, 0x1640)
+
+REG32(A2W_PLLH_AUX, 0x1360)
+REG32(A2W_PLLH_RCAL, 0x1460)
+REG32(A2W_PLLH_PIX, 0x1560)
+REG32(A2W_PLLH_STS, 0x1660)
+
+REG32(A2W_PLLB_ARM, 0x13e0)
+
 /* misc registers */
 REG32(CM_LOCK, 0x114)
     FIELD(CM_LOCK, FLOCKH, 12, 1)
@@ -XXX,XX +XXX,XX @@ static inline void set_pll_init_info(BCM2835CprmanState *s,
     pll->reg_a2w_frac = &s->regs[PLL_INIT_INFO[id].a2w_frac_offset];
 }
 
+
+/* PLL channel init info */
+typedef struct PLLChannelInitInfo {
+    const char *name;
+    CprmanPll parent;
+    size_t cm_offset;
+    uint32_t cm_hold_mask;
+    uint32_t cm_load_mask;
+    size_t a2w_ctrl_offset;
+    unsigned int fixed_divider;
+} PLLChannelInitInfo;
+
+#define FILL_PLL_CHANNEL_INIT_INFO_common(pll_, channel_)            \
+    .parent = CPRMAN_ ## pll_,                                       \
+    .cm_offset = R_CM_ ## pll_,                                      \
+    .cm_load_mask = R_CM_ ## pll_ ## _ ## LOAD ## channel_ ## _MASK, \
+    .a2w_ctrl_offset = R_A2W_ ## pll_ ## _ ## channel_
+
+#define FILL_PLL_CHANNEL_INIT_INFO(pll_, channel_)                   \
+    FILL_PLL_CHANNEL_INIT_INFO_common(pll_, channel_),               \
+    .cm_hold_mask = R_CM_ ## pll_ ## _ ## HOLD ## channel_ ## _MASK, \
+    .fixed_divider = 1
+
+#define FILL_PLL_CHANNEL_INIT_INFO_nohold(pll_, channel_) \
+    FILL_PLL_CHANNEL_INIT_INFO_common(pll_, channel_),    \
+    .cm_hold_mask = 0
+
+static PLLChannelInitInfo PLL_CHANNEL_INIT_INFO[] = {
+    [CPRMAN_PLLA_CHANNEL_DSI0] = {
+        .name = "plla-dsi0",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLA, DSI0),
+    },
+    [CPRMAN_PLLA_CHANNEL_CORE] = {
+        .name = "plla-core",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLA, CORE),
+    },
+    [CPRMAN_PLLA_CHANNEL_PER] = {
+        .name = "plla-per",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLA, PER),
+    },
+    [CPRMAN_PLLA_CHANNEL_CCP2] = {
+        .name = "plla-ccp2",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLA, CCP2),
+    },
+
+    [CPRMAN_PLLC_CHANNEL_CORE2] = {
+        .name = "pllc-core2",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLC, CORE2),
+    },
+    [CPRMAN_PLLC_CHANNEL_CORE1] = {
+        .name = "pllc-core1",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLC, CORE1),
+    },
+    [CPRMAN_PLLC_CHANNEL_PER] = {
+        .name = "pllc-per",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLC, PER),
+    },
+    [CPRMAN_PLLC_CHANNEL_CORE0] = {
+        .name = "pllc-core0",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLC, CORE0),
+    },
+
+    [CPRMAN_PLLD_CHANNEL_DSI0] = {
+        .name = "plld-dsi0",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLD, DSI0),
+    },
+    [CPRMAN_PLLD_CHANNEL_CORE] = {
+        .name = "plld-core",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLD, CORE),
+    },
+    [CPRMAN_PLLD_CHANNEL_PER] = {
+        .name = "plld-per",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLD, PER),
+    },
+    [CPRMAN_PLLD_CHANNEL_DSI1] = {
+        .name = "plld-dsi1",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLD, DSI1),
+    },
+
+    [CPRMAN_PLLH_CHANNEL_AUX] = {
+        .name = "pllh-aux",
+        .fixed_divider = 1,
+        FILL_PLL_CHANNEL_INIT_INFO_nohold(PLLH, AUX),
+    },
+    [CPRMAN_PLLH_CHANNEL_RCAL] = {
+        .name = "pllh-rcal",
+        .fixed_divider = 10,
+        FILL_PLL_CHANNEL_INIT_INFO_nohold(PLLH, RCAL),
+    },
+    [CPRMAN_PLLH_CHANNEL_PIX] = {
+        .name = "pllh-pix",
+        .fixed_divider = 10,
+        FILL_PLL_CHANNEL_INIT_INFO_nohold(PLLH, PIX),
+    },
+
+    [CPRMAN_PLLB_CHANNEL_ARM] = {
+        .name = "pllb-arm",
+        FILL_PLL_CHANNEL_INIT_INFO(PLLB, ARM),
+    },
+};
+
+#undef FILL_PLL_CHANNEL_INIT_INFO_nohold
+#undef FILL_PLL_CHANNEL_INIT_INFO
+#undef FILL_PLL_CHANNEL_INIT_INFO_common
+
+static inline void set_pll_channel_init_info(BCM2835CprmanState *s,
+                                             CprmanPllChannelState *channel,
+                                             CprmanPllChannel id)
+{
+    channel->id = id;
+    channel->parent = PLL_CHANNEL_INIT_INFO[id].parent;
+    channel->reg_cm = &s->regs[PLL_CHANNEL_INIT_INFO[id].cm_offset];
+    channel->hold_mask = PLL_CHANNEL_INIT_INFO[id].cm_hold_mask;
+    channel->load_mask = PLL_CHANNEL_INIT_INFO[id].cm_load_mask;
+    channel->reg_a2w_ctrl = &s->regs[PLL_CHANNEL_INIT_INFO[id].a2w_ctrl_offset];
+    channel->fixed_divider = PLL_CHANNEL_INIT_INFO[id].fixed_divider;
+}
+
 #endif
diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/bcm2835_cprman.c
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_info = {
 };
 
 
+/* PLL channel */
+
+static void pll_channel_update(CprmanPllChannelState *channel)
+{
+    clock_update(channel->out, 0);
+}
+
+/* Update a PLL and all its channels */
+static void pll_update_all_channels(BCM2835CprmanState *s,
+                                    CprmanPllState *pll)
+{
+    size_t i;
+
+    pll_update(pll);
+
+    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
+        CprmanPllChannelState *channel = &s->channels[i];
+        if (channel->parent == pll->id) {
+            pll_channel_update(channel);
+        }
+    }
+}
+
+static void pll_channel_pll_in_update(void *opaque)
+{
+    pll_channel_update(CPRMAN_PLL_CHANNEL(opaque));
+}
+
+static void pll_channel_init(Object *obj)
+{
+    CprmanPllChannelState *s = CPRMAN_PLL_CHANNEL(obj);
+
+    s->pll_in = qdev_init_clock_in(DEVICE(s), "pll-in",
+                                   pll_channel_pll_in_update, s);
+    s->out = qdev_init_clock_out(DEVICE(s), "out");
+}
+
+static const VMStateDescription pll_channel_vmstate = {
+    .name = TYPE_CPRMAN_PLL_CHANNEL,
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_CLOCK(pll_in, CprmanPllChannelState),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
+static void pll_channel_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->vmsd = &pll_channel_vmstate;
+}
+
+static const TypeInfo cprman_pll_channel_info = {
+    .name = TYPE_CPRMAN_PLL_CHANNEL,
+    .parent = TYPE_DEVICE,
+    .instance_size = sizeof(CprmanPllChannelState),
+    .class_init = pll_channel_class_init,
+    .instance_init = pll_channel_init,
+};
+
+
 /* CPRMAN "top level" model */
 
 static uint32_t get_cm_lock(const BCM2835CprmanState *s)
@@ -XXX,XX +XXX,XX @@ static uint64_t cprman_read(void *opaque, hwaddr offset,
     return r;
 }
 
-#define CASE_PLL_REGS(pll_)       \
-    case R_CM_ ## pll_:           \
+static inline void update_pll_and_channels_from_cm(BCM2835CprmanState *s,
+                                                   size_t idx)
+{
+    size_t i;
+
+    for (i = 0; i < CPRMAN_NUM_PLL; i++) {
+        if (PLL_INIT_INFO[i].cm_offset == idx) {
+            pll_update_all_channels(s, &s->plls[i]);
+            return;
+        }
+    }
+}
+
+static inline void update_channel_from_a2w(BCM2835CprmanState *s, size_t idx)
+{
+    size_t i;
+
+    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
+        if (PLL_CHANNEL_INIT_INFO[i].a2w_ctrl_offset == idx) {
+            pll_channel_update(&s->channels[i]);
+            return;
+        }
+    }
+}
+
+#define CASE_PLL_A2W_REGS(pll_) \
     case R_A2W_ ## pll_ ## _CTRL: \
     case R_A2W_ ## pll_ ## _ANA0: \
     case R_A2W_ ## pll_ ## _ANA1: \
@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
     s->regs[idx] = value;
 
     switch (idx) {
-    CASE_PLL_REGS(PLLA) :
+    case R_CM_PLLA ... R_CM_PLLH:
+    case R_CM_PLLB:
+        /*
+         * A given CM_PLLx register is shared by both the PLL and the channels
+         * of this PLL.
+         */
+        update_pll_and_channels_from_cm(s, idx);
+        break;
+
+    CASE_PLL_A2W_REGS(PLLA) :
         pll_update(&s->plls[CPRMAN_PLLA]);
         break;
 
-    CASE_PLL_REGS(PLLC) :
+    CASE_PLL_A2W_REGS(PLLC) :
         pll_update(&s->plls[CPRMAN_PLLC]);
         break;
 
-    CASE_PLL_REGS(PLLD) :
+    CASE_PLL_A2W_REGS(PLLD) :
         pll_update(&s->plls[CPRMAN_PLLD]);
         break;
 
-    CASE_PLL_REGS(PLLH) :
+    CASE_PLL_A2W_REGS(PLLH) :
         pll_update(&s->plls[CPRMAN_PLLH]);
         break;
 
-    CASE_PLL_REGS(PLLB) :
+    CASE_PLL_A2W_REGS(PLLB) :
         pll_update(&s->plls[CPRMAN_PLLB]);
         break;
+
+    case R_A2W_PLLA_DSI0:
+    case R_A2W_PLLA_CORE:
+    case R_A2W_PLLA_PER:
+    case R_A2W_PLLA_CCP2:
+    case R_A2W_PLLC_CORE2:
+    case R_A2W_PLLC_CORE1:
+    case R_A2W_PLLC_PER:
+    case R_A2W_PLLC_CORE0:
+    case R_A2W_PLLD_DSI0:
+    case R_A2W_PLLD_CORE:
+    case R_A2W_PLLD_PER:
+    case R_A2W_PLLD_DSI1:
+    case R_A2W_PLLH_AUX:
+    case R_A2W_PLLH_RCAL:
+    case R_A2W_PLLH_PIX:
+    case R_A2W_PLLB_ARM:
+        update_channel_from_a2w(s, idx);
+        break;
     }
 }
 
-#undef CASE_PLL_REGS
+#undef CASE_PLL_A2W_REGS
 
 static const MemoryRegionOps cprman_ops = {
     .read = cprman_read,
@@ -XXX,XX +XXX,XX @@ static void cprman_reset(DeviceState *dev)
         device_cold_reset(DEVICE(&s->plls[i]));
     }
 
+    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
+        device_cold_reset(DEVICE(&s->channels[i]));
+    }
+
     clock_update_hz(s->xosc, s->xosc_freq);
 }
 
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
         set_pll_init_info(s, &s->plls[i], i);
     }
 
+    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
+        object_initialize_child(obj, PLL_CHANNEL_INIT_INFO[i].name,
+                                &s->channels[i],
+                                TYPE_CPRMAN_PLL_CHANNEL);
+        set_pll_channel_init_info(s, &s->channels[i], i);
+    }
+
     s->xosc = clock_new(obj, "xosc");
 
     memory_region_init_io(&s->iomem, obj, &cprman_ops,
@@ -XXX,XX +XXX,XX @@ static void cprman_realize(DeviceState *dev, Error **errp)
             return;
         }
     }
+
+    for (i = 0; i < CPRMAN_NUM_PLL_CHANNEL; i++) {
+        CprmanPllChannelState *channel = &s->channels[i];
+        CprmanPll parent = PLL_CHANNEL_INIT_INFO[i].parent;
+        Clock *parent_clk = s->plls[parent].out;
+
+        clock_set_source(channel->pll_in, parent_clk);
+
+        if (!qdev_realize(DEVICE(channel), NULL, errp)) {
+            return;
+        }
+    }
 }
 
 static const VMStateDescription cprman_vmstate = {
@@ -XXX,XX +XXX,XX @@ static void cprman_register_types(void)
 {
     type_register_static(&cprman_info);
     type_register_static(&cprman_pll_info);
+    type_register_static(&cprman_pll_channel_info);
 }
 
 type_init(cprman_register_types);
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

A PLL channel is able to further divide the generated PLL frequency.
The divider is given in the CTRL_A2W register. Some channels have an
additional fixed divider which is always applied to the signal.

Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/bcm2835_cprman.c | 33 ++++++++++++++++++++++++++++++++-
 1 file changed, 32 insertions(+), 1 deletion(-)

From: Luc Michel <luc@lmichel.fr>

The clock multiplexers are the last clock stage in the CPRMAN. Each mux
outputs one clock signal that goes out of the CPRMAN to the SoC
peripherals.

Each mux has at most 10 sources. The sources 0 to 3 are common to all
muxes. They are:
   0. ground (no clock signal)
   1. the main oscillator (xosc)
   2. "test debug 0" clock
   3. "test debug 1" clock

Test debug 0 and 1 are actual clock muxes that can be used as sources to
other muxes (for debug purpose).

Sources 4 to 9 are mux specific and can be unpopulated (grounded). Those
sources are fed by the PLL channels outputs.

One corner case exists for DSI0E and DSI0P muxes. They have their source
number 4 connected to an intermediate multiplexer that can select
between PLLA-DSI0 and PLLD-DSI0 channel. This multiplexer is called
DSI0HSCK and is not a clock mux as such. It is really a simple mux from
the hardware point of view (see https://elinux.org/The_Undocumented_Pi).
This mux is not implemented in this commit.

Note that there is some muxes for which sources are unknown (because of
a lack of documentation). For those cases all the sources are connected
to ground in this implementation.

Each clock mux output is exported by the CPRMAN at the qdev level,
adding the suffix '-out' to the mux name to form the output clock name.
(E.g. the 'uart' mux sees its output exported as 'uart-out' at the
CPRMAN level.)

Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/misc/bcm2835_cprman.h           |  85 +++++
 include/hw/misc/bcm2835_cprman_internals.h | 422 +++++++++++++++++++++
 hw/misc/bcm2835_cprman.c                   | 151 ++++++++
 3 files changed, 658 insertions(+)

diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman.h
+++ b/include/hw/misc/bcm2835_cprman.h
@@ -XXX,XX +XXX,XX @@ typedef enum CprmanPllChannel {
     CPRMAN_PLLB_CHANNEL_ARM,
 
     CPRMAN_NUM_PLL_CHANNEL,
+
+    /* Special values used when connecting clock sources to clocks */
+    CPRMAN_CLOCK_SRC_NORMAL = -1,
+    CPRMAN_CLOCK_SRC_FORCE_GROUND = -2,
+    CPRMAN_CLOCK_SRC_DSI0HSCK = -3,
 } CprmanPllChannel;
 
+typedef enum CprmanClockMux {
+    CPRMAN_CLOCK_GNRIC,
+    CPRMAN_CLOCK_VPU,
+    CPRMAN_CLOCK_SYS,
+    CPRMAN_CLOCK_PERIA,
+    CPRMAN_CLOCK_PERII,
+    CPRMAN_CLOCK_H264,
+    CPRMAN_CLOCK_ISP,
+    CPRMAN_CLOCK_V3D,
+    CPRMAN_CLOCK_CAM0,
+    CPRMAN_CLOCK_CAM1,
+    CPRMAN_CLOCK_CCP2,
+    CPRMAN_CLOCK_DSI0E,
+    CPRMAN_CLOCK_DSI0P,
+    CPRMAN_CLOCK_DPI,
+    CPRMAN_CLOCK_GP0,
+    CPRMAN_CLOCK_GP1,
+    CPRMAN_CLOCK_GP2,
+    CPRMAN_CLOCK_HSM,
+    CPRMAN_CLOCK_OTP,
+    CPRMAN_CLOCK_PCM,
+    CPRMAN_CLOCK_PWM,
+    CPRMAN_CLOCK_SLIM,
+    CPRMAN_CLOCK_SMI,
+    CPRMAN_CLOCK_TEC,
+    CPRMAN_CLOCK_TD0,
+    CPRMAN_CLOCK_TD1,
+    CPRMAN_CLOCK_TSENS,
+    CPRMAN_CLOCK_TIMER,
+    CPRMAN_CLOCK_UART,
+    CPRMAN_CLOCK_VEC,
+    CPRMAN_CLOCK_PULSE,
+    CPRMAN_CLOCK_SDC,
+    CPRMAN_CLOCK_ARM,
+    CPRMAN_CLOCK_AVEO,
+    CPRMAN_CLOCK_EMMC,
+    CPRMAN_CLOCK_EMMC2,
+
+    CPRMAN_NUM_CLOCK_MUX
+} CprmanClockMux;
+
+typedef enum CprmanClockMuxSource {
+    CPRMAN_CLOCK_SRC_GND = 0,
+    CPRMAN_CLOCK_SRC_XOSC,
+    CPRMAN_CLOCK_SRC_TD0,
+    CPRMAN_CLOCK_SRC_TD1,
+    CPRMAN_CLOCK_SRC_PLLA,
+    CPRMAN_CLOCK_SRC_PLLC,
+    CPRMAN_CLOCK_SRC_PLLD,
+    CPRMAN_CLOCK_SRC_PLLH,
+    CPRMAN_CLOCK_SRC_PLLC_CORE1,
+    CPRMAN_CLOCK_SRC_PLLC_CORE2,
+
+    CPRMAN_NUM_CLOCK_MUX_SRC
+} CprmanClockMuxSource;
+
 typedef struct CprmanPllState {
     /*< private >*/
     DeviceState parent_obj;
@@ -XXX,XX +XXX,XX @@ typedef struct CprmanPllChannelState {
     Clock *out;
 } CprmanPllChannelState;
 
+typedef struct CprmanClockMuxState {
+    /*< private >*/
+    DeviceState parent_obj;
+
+    /*< public >*/
+    CprmanClockMux id;
+
+    uint32_t *reg_ctl;
+    uint32_t *reg_div;
+    int int_bits;
+    int frac_bits;
+
+    Clock *srcs[CPRMAN_NUM_CLOCK_MUX_SRC];
+    Clock *out;
+
+    /*
+     * Used by clock srcs update callback to retrieve both the clock and the
+     * source number.
+     */
+    struct CprmanClockMuxState *backref[CPRMAN_NUM_CLOCK_MUX_SRC];
+} CprmanClockMuxState;
+
 struct BCM2835CprmanState {
     /*< private >*/
     SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
 
     CprmanPllState plls[CPRMAN_NUM_PLL];
     CprmanPllChannelState channels[CPRMAN_NUM_PLL_CHANNEL];
+    CprmanClockMuxState clock_muxes[CPRMAN_NUM_CLOCK_MUX];
 
     uint32_t regs[CPRMAN_NUM_REGS];
     uint32_t xosc_freq;
 
     Clock *xosc;
+    Clock *gnd;
 };
 
 #endif
diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman_internals.h
+++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@
 
 #define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
 #define TYPE_CPRMAN_PLL_CHANNEL "bcm2835-cprman-pll-channel"
+#define TYPE_CPRMAN_CLOCK_MUX "bcm2835-cprman-clock-mux"
 
 DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
                          TYPE_CPRMAN_PLL)
 DECLARE_INSTANCE_CHECKER(CprmanPllChannelState, CPRMAN_PLL_CHANNEL,
                          TYPE_CPRMAN_PLL_CHANNEL)
+DECLARE_INSTANCE_CHECKER(CprmanClockMuxState, CPRMAN_CLOCK_MUX,
+                         TYPE_CPRMAN_CLOCK_MUX)
 
 /* Register map */
 
@@ -XXX,XX +XXX,XX @@ REG32(A2W_PLLH_STS, 0x1660)
 
 REG32(A2W_PLLB_ARM, 0x13e0)
 
+/* Clock muxes */
+REG32(CM_GNRICCTL, 0x000)
+    FIELD(CM_CLOCKx_CTL, SRC, 0, 4)
+    FIELD(CM_CLOCKx_CTL, ENABLE, 4, 1)
+    FIELD(CM_CLOCKx_CTL, KILL, 5, 1)
+    FIELD(CM_CLOCKx_CTL, GATE, 6, 1)
+    FIELD(CM_CLOCKx_CTL, BUSY, 7, 1)
+    FIELD(CM_CLOCKx_CTL, BUSYD, 8, 1)
+    FIELD(CM_CLOCKx_CTL, MASH, 9, 2)
+    FIELD(CM_CLOCKx_CTL, FLIP, 11, 1)
+REG32(CM_GNRICDIV, 0x004)
+    FIELD(CM_CLOCKx_DIV, FRAC, 0, 12)
+REG32(CM_VPUCTL, 0x008)
+REG32(CM_VPUDIV, 0x00c)
+REG32(CM_SYSCTL, 0x010)
+REG32(CM_SYSDIV, 0x014)
+REG32(CM_PERIACTL, 0x018)
+REG32(CM_PERIADIV, 0x01c)
+REG32(CM_PERIICTL, 0x020)
+REG32(CM_PERIIDIV, 0x024)
+REG32(CM_H264CTL, 0x028)
+REG32(CM_H264DIV, 0x02c)
+REG32(CM_ISPCTL, 0x030)
+REG32(CM_ISPDIV, 0x034)
+REG32(CM_V3DCTL, 0x038)
+REG32(CM_V3DDIV, 0x03c)
+REG32(CM_CAM0CTL, 0x040)
+REG32(CM_CAM0DIV, 0x044)
+REG32(CM_CAM1CTL, 0x048)
+REG32(CM_CAM1DIV, 0x04c)
+REG32(CM_CCP2CTL, 0x050)
+REG32(CM_CCP2DIV, 0x054)
+REG32(CM_DSI0ECTL, 0x058)
+REG32(CM_DSI0EDIV, 0x05c)
+REG32(CM_DSI0PCTL, 0x060)
+REG32(CM_DSI0PDIV, 0x064)
+REG32(CM_DPICTL, 0x068)
+REG32(CM_DPIDIV, 0x06c)
+REG32(CM_GP0CTL, 0x070)
+REG32(CM_GP0DIV, 0x074)
+REG32(CM_GP1CTL, 0x078)
+REG32(CM_GP1DIV, 0x07c)
+REG32(CM_GP2CTL, 0x080)
+REG32(CM_GP2DIV, 0x084)
+REG32(CM_HSMCTL, 0x088)
+REG32(CM_HSMDIV, 0x08c)
+REG32(CM_OTPCTL, 0x090)
+REG32(CM_OTPDIV, 0x094)
+REG32(CM_PCMCTL, 0x098)
+REG32(CM_PCMDIV, 0x09c)
+REG32(CM_PWMCTL, 0x0a0)
+REG32(CM_PWMDIV, 0x0a4)
+REG32(CM_SLIMCTL, 0x0a8)
+REG32(CM_SLIMDIV, 0x0ac)
+REG32(CM_SMICTL, 0x0b0)
+REG32(CM_SMIDIV, 0x0b4)
+REG32(CM_TCNTCTL, 0x0c0)
+REG32(CM_TCNTCNT, 0x0c4)
+REG32(CM_TECCTL, 0x0c8)
+REG32(CM_TECDIV, 0x0cc)
+REG32(CM_TD0CTL, 0x0d0)
+REG32(CM_TD0DIV, 0x0d4)
+REG32(CM_TD1CTL, 0x0d8)
+REG32(CM_TD1DIV, 0x0dc)
+REG32(CM_TSENSCTL, 0x0e0)
+REG32(CM_TSENSDIV, 0x0e4)
+REG32(CM_TIMERCTL, 0x0e8)
+REG32(CM_TIMERDIV, 0x0ec)
+REG32(CM_UARTCTL, 0x0f0)
+REG32(CM_UARTDIV, 0x0f4)
+REG32(CM_VECCTL, 0x0f8)
+REG32(CM_VECDIV, 0x0fc)
+REG32(CM_PULSECTL, 0x190)
+REG32(CM_PULSEDIV, 0x194)
+REG32(CM_SDCCTL, 0x1a8)
+REG32(CM_SDCDIV, 0x1ac)
+REG32(CM_ARMCTL, 0x1b0)
+REG32(CM_AVEOCTL, 0x1b8)
+REG32(CM_AVEODIV, 0x1bc)
+REG32(CM_EMMCCTL, 0x1c0)
+REG32(CM_EMMCDIV, 0x1c4)
+REG32(CM_EMMC2CTL, 0x1d0)
+REG32(CM_EMMC2DIV, 0x1d4)
+
 /* misc registers */
 REG32(CM_LOCK, 0x114)
     FIELD(CM_LOCK, FLOCKH, 12, 1)
@@ -XXX,XX +XXX,XX @@ static inline void set_pll_channel_init_info(BCM2835CprmanState *s,
     channel->fixed_divider = PLL_CHANNEL_INIT_INFO[id].fixed_divider;
 }
 
+/* Clock mux init info */
+typedef struct ClockMuxInitInfo {
+    const char *name;
+    size_t cm_offset; /* cm_offset[0]->CM_CTL, cm_offset[1]->CM_DIV */
+    int int_bits;
+    int frac_bits;
+
+    CprmanPllChannel src_mapping[CPRMAN_NUM_CLOCK_MUX_SRC];
+} ClockMuxInitInfo;
+
+/*
+ * Each clock mux can have up to 10 sources. Sources 0 to 3 are always the
+ * same (ground, xosc, td0, td1). Sources 4 to 9 are mux specific, and are not
+ * always populated. The following macros catch all those cases.
+ */
+
+/* Unknown mapping. Connect everything to ground */
+#define SRC_MAPPING_INFO_unknown                          \
+    .src_mapping = {                                      \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* gnd */          \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* xosc */         \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* test debug 0 */ \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* test debug 1 */ \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll a */        \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll c */        \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll d */        \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll h */        \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll c, core1 */ \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, /* pll c, core2 */ \
+    }
+
+/* Only the oscillator and the two test debug clocks */
+#define SRC_MAPPING_INFO_xosc          \
+    .src_mapping = {                   \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+    }
+
+/* All the PLL "core" channels */
+#define SRC_MAPPING_INFO_core      \
+    .src_mapping = {               \
+        CPRMAN_CLOCK_SRC_NORMAL,   \
+        CPRMAN_CLOCK_SRC_NORMAL,   \
+        CPRMAN_CLOCK_SRC_NORMAL,   \
+        CPRMAN_CLOCK_SRC_NORMAL,   \
+        CPRMAN_PLLA_CHANNEL_CORE,  \
+        CPRMAN_PLLC_CHANNEL_CORE0, \
+        CPRMAN_PLLD_CHANNEL_CORE,  \
+        CPRMAN_PLLH_CHANNEL_AUX,   \
+        CPRMAN_PLLC_CHANNEL_CORE1, \
+        CPRMAN_PLLC_CHANNEL_CORE2, \
+    }
+
+/* All the PLL "per" channels */
+#define SRC_MAPPING_INFO_periph        \
+    .src_mapping = {                   \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_PLLA_CHANNEL_PER,       \
+        CPRMAN_PLLC_CHANNEL_PER,       \
+        CPRMAN_PLLD_CHANNEL_PER,       \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+    }
+
+/*
+ * The DSI0 channels. This one got an intermediate mux between the PLL channels
+ * and the clock input.
+ */
+#define SRC_MAPPING_INFO_dsi0          \
+    .src_mapping = {                   \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_DSI0HSCK,     \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+    }
+
+/* The DSI1 channel */
+#define SRC_MAPPING_INFO_dsi1          \
+    .src_mapping = {                   \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_CLOCK_SRC_NORMAL,       \
+        CPRMAN_PLLD_CHANNEL_DSI1,      \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+        CPRMAN_CLOCK_SRC_FORCE_GROUND, \
+    }
+
+#define FILL_CLOCK_MUX_SRC_MAPPING_INIT_INFO(kind_) \
+    SRC_MAPPING_INFO_ ## kind_
+
+#define FILL_CLOCK_MUX_INIT_INFO(clock_, kind_) \
+    .cm_offset = R_CM_ ## clock_ ## CTL,        \
+    FILL_CLOCK_MUX_SRC_MAPPING_INIT_INFO(kind_)
+
+static ClockMuxInitInfo CLOCK_MUX_INIT_INFO[] = {
+    [CPRMAN_CLOCK_GNRIC] = {
+        .name = "gnric",
+        FILL_CLOCK_MUX_INIT_INFO(GNRIC, unknown),
+    },
+    [CPRMAN_CLOCK_VPU] = {
+        .name = "vpu",
+        .int_bits = 12,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(VPU, core),
+    },
+    [CPRMAN_CLOCK_SYS] = {
+        .name = "sys",
+        FILL_CLOCK_MUX_INIT_INFO(SYS, unknown),
+    },
+    [CPRMAN_CLOCK_PERIA] = {
+        .name = "peria",
+        FILL_CLOCK_MUX_INIT_INFO(PERIA, unknown),
+    },
+    [CPRMAN_CLOCK_PERII] = {
+        .name = "perii",
+        FILL_CLOCK_MUX_INIT_INFO(PERII, unknown),
+    },
+    [CPRMAN_CLOCK_H264] = {
+        .name = "h264",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(H264, core),
+    },
+    [CPRMAN_CLOCK_ISP] = {
+        .name = "isp",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(ISP, core),
+    },
+    [CPRMAN_CLOCK_V3D] = {
+        .name = "v3d",
+        FILL_CLOCK_MUX_INIT_INFO(V3D, core),
+    },
+    [CPRMAN_CLOCK_CAM0] = {
+        .name = "cam0",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(CAM0, periph),
+    },
+    [CPRMAN_CLOCK_CAM1] = {
+        .name = "cam1",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(CAM1, periph),
+    },
+    [CPRMAN_CLOCK_CCP2] = {
+        .name = "ccp2",
+        FILL_CLOCK_MUX_INIT_INFO(CCP2, unknown),
+    },
+    [CPRMAN_CLOCK_DSI0E] = {
+        .name = "dsi0e",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(DSI0E, dsi0),
+    },
+    [CPRMAN_CLOCK_DSI0P] = {
+        .name = "dsi0p",
+        .int_bits = 0,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(DSI0P, dsi0),
+    },
+    [CPRMAN_CLOCK_DPI] = {
+        .name = "dpi",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(DPI, periph),
+    },
+    [CPRMAN_CLOCK_GP0] = {
+        .name = "gp0",
+        .int_bits = 12,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(GP0, periph),
+    },
+    [CPRMAN_CLOCK_GP1] = {
+        .name = "gp1",
+        .int_bits = 12,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(GP1, periph),
+    },
+    [CPRMAN_CLOCK_GP2] = {
+        .name = "gp2",
+        .int_bits = 12,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(GP2, periph),
+    },
+    [CPRMAN_CLOCK_HSM] = {
+        .name = "hsm",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(HSM, periph),
+    },
+    [CPRMAN_CLOCK_OTP] = {
+        .name = "otp",
+        .int_bits = 4,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(OTP, xosc),
+    },
+    [CPRMAN_CLOCK_PCM] = {
+        .name = "pcm",
+        .int_bits = 12,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(PCM, periph),
+    },
+    [CPRMAN_CLOCK_PWM] = {
+        .name = "pwm",
+        .int_bits = 12,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(PWM, periph),
+    },
+    [CPRMAN_CLOCK_SLIM] = {
+        .name = "slim",
+        .int_bits = 12,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(SLIM, periph),
+    },
+    [CPRMAN_CLOCK_SMI] = {
+        .name = "smi",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(SMI, periph),
+    },
+    [CPRMAN_CLOCK_TEC] = {
+        .name = "tec",
+        .int_bits = 6,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(TEC, xosc),
+    },
+    [CPRMAN_CLOCK_TD0] = {
+        .name = "td0",
+        FILL_CLOCK_MUX_INIT_INFO(TD0, unknown),
+    },
+    [CPRMAN_CLOCK_TD1] = {
+        .name = "td1",
+        FILL_CLOCK_MUX_INIT_INFO(TD1, unknown),
+    },
+    [CPRMAN_CLOCK_TSENS] = {
+        .name = "tsens",
+        .int_bits = 5,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(TSENS, xosc),
+    },
+    [CPRMAN_CLOCK_TIMER] = {
+        .name = "timer",
+        .int_bits = 6,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(TIMER, xosc),
+    },
+    [CPRMAN_CLOCK_UART] = {
+        .name = "uart",
+        .int_bits = 10,
+        .frac_bits = 12,
+        FILL_CLOCK_MUX_INIT_INFO(UART, periph),
+    },
+    [CPRMAN_CLOCK_VEC] = {
+        .name = "vec",
+        .int_bits = 4,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(VEC, periph),
+    },
+    [CPRMAN_CLOCK_PULSE] = {
+        .name = "pulse",
+        FILL_CLOCK_MUX_INIT_INFO(PULSE, xosc),
+    },
+    [CPRMAN_CLOCK_SDC] = {
+        .name = "sdram",
+        .int_bits = 6,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(SDC, core),
+    },
+    [CPRMAN_CLOCK_ARM] = {
+        .name = "arm",
+        FILL_CLOCK_MUX_INIT_INFO(ARM, unknown),
+    },
+    [CPRMAN_CLOCK_AVEO] = {
+        .name = "aveo",
+        .int_bits = 4,
+        .frac_bits = 0,
+        FILL_CLOCK_MUX_INIT_INFO(AVEO, periph),
+    },
+    [CPRMAN_CLOCK_EMMC] = {
+        .name = "emmc",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(EMMC, periph),
+    },
+    [CPRMAN_CLOCK_EMMC2] = {
+        .name = "emmc2",
+        .int_bits = 4,
+        .frac_bits = 8,
+        FILL_CLOCK_MUX_INIT_INFO(EMMC2, unknown),
+    },
+};
+
+#undef FILL_CLOCK_MUX_INIT_INFO
+#undef FILL_CLOCK_MUX_SRC_MAPPING_INIT_INFO
+#undef SRC_MAPPING_INFO_dsi1
+#undef SRC_MAPPING_INFO_dsi0
+#undef SRC_MAPPING_INFO_periph
+#undef SRC_MAPPING_INFO_core
+#undef SRC_MAPPING_INFO_xosc
+#undef SRC_MAPPING_INFO_unknown
+
+static inline void set_clock_mux_init_info(BCM2835CprmanState *s,
+                                           CprmanClockMuxState *mux,
+                                           CprmanClockMux id)
+{
+    mux->id = id;
+    mux->reg_ctl = &s->regs[CLOCK_MUX_INIT_INFO[id].cm_offset];
+    mux->reg_div = &s->regs[CLOCK_MUX_INIT_INFO[id].cm_offset + 1];
+    mux->int_bits = CLOCK_MUX_INIT_INFO[id].int_bits;
+    mux->frac_bits = CLOCK_MUX_INIT_INFO[id].frac_bits;
+}
+
 #endif
diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/bcm2835_cprman.c
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@
  *
  * The page at https://elinux.org/The_Undocumented_Pi gives the actual clock
  * tree configuration.
+ *
+ * The CPRMAN exposes clock outputs with the name of the clock mux suffixed
+ * with "-out" (e.g. "uart-out", "h264-out", ...).
  */
 
 #include "qemu/osdep.h"
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_channel_info = {
 };
 
 
+/* clock mux */
+
+static void clock_mux_update(CprmanClockMuxState *mux)
+{
+    clock_update(mux->out, 0);
+}
+
+static void clock_mux_src_update(void *opaque)
+{
+    CprmanClockMuxState **backref = opaque;
+    CprmanClockMuxState *s = *backref;
+
+    clock_mux_update(s);
+}
+
+static void clock_mux_init(Object *obj)
+{
+    CprmanClockMuxState *s = CPRMAN_CLOCK_MUX(obj);
+    size_t i;
+
+    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX_SRC; i++) {
+        char *name = g_strdup_printf("srcs[%zu]", i);
+        s->backref[i] = s;
+        s->srcs[i] = qdev_init_clock_in(DEVICE(s), name,
+                                        clock_mux_src_update,
+                                        &s->backref[i]);
+        g_free(name);
+    }
+
+    s->out = qdev_init_clock_out(DEVICE(s), "out");
+}
+
+static const VMStateDescription clock_mux_vmstate = {
+    .name = TYPE_CPRMAN_CLOCK_MUX,
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_ARRAY_CLOCK(srcs, CprmanClockMuxState,
+                            CPRMAN_NUM_CLOCK_MUX_SRC),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
+static void clock_mux_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->vmsd = &clock_mux_vmstate;
+}
+
+static const TypeInfo cprman_clock_mux_info = {
+    .name = TYPE_CPRMAN_CLOCK_MUX,
+    .parent = TYPE_DEVICE,
+    .instance_size = sizeof(CprmanClockMuxState),
+    .class_init = clock_mux_class_init,
+    .instance_init = clock_mux_init,
+};
+
+
 /* CPRMAN "top level" model */
 
 static uint32_t get_cm_lock(const BCM2835CprmanState *s)
@@ -XXX,XX +XXX,XX @@ static inline void update_channel_from_a2w(BCM2835CprmanState *s, size_t idx)
     }
 }
 
+static inline void update_mux_from_cm(BCM2835CprmanState *s, size_t idx)
+{
+    size_t i;
+
+    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
+        if ((CLOCK_MUX_INIT_INFO[i].cm_offset == idx) ||
+            (CLOCK_MUX_INIT_INFO[i].cm_offset + 4 == idx)) {
+            /* matches CM_CTL or CM_DIV mux register */
+            clock_mux_update(&s->clock_muxes[i]);
+            return;
+        }
+    }
+}
+
 #define CASE_PLL_A2W_REGS(pll_) \
     case R_A2W_ ## pll_ ## _CTRL: \
     case R_A2W_ ## pll_ ## _ANA0: \
@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
     case R_A2W_PLLB_ARM:
         update_channel_from_a2w(s, idx);
         break;
+
+    case R_CM_GNRICCTL ... R_CM_SMIDIV:
+    case R_CM_TCNTCNT ... R_CM_VECDIV:
+    case R_CM_PULSECTL ... R_CM_PULSEDIV:
+    case R_CM_SDCCTL ... R_CM_ARMCTL:
+    case R_CM_AVEOCTL ... R_CM_EMMCDIV:
+    case R_CM_EMMC2CTL ... R_CM_EMMC2DIV:
+        update_mux_from_cm(s, idx);
+        break;
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static void cprman_reset(DeviceState *dev)
         device_cold_reset(DEVICE(&s->channels[i]));
     }
 
+    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
+        device_cold_reset(DEVICE(&s->clock_muxes[i]));
+    }
+
     clock_update_hz(s->xosc, s->xosc_freq);
 }
 
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
         set_pll_channel_init_info(s, &s->channels[i], i);
     }
 
+    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
+        char *alias;
+
+        object_initialize_child(obj, CLOCK_MUX_INIT_INFO[i].name,
+                                &s->clock_muxes[i],
+                                TYPE_CPRMAN_CLOCK_MUX);
+        set_clock_mux_init_info(s, &s->clock_muxes[i], i);
+
+        /* Expose muxes output as CPRMAN outputs */
+        alias = g_strdup_printf("%s-out", CLOCK_MUX_INIT_INFO[i].name);
+        qdev_alias_clock(DEVICE(&s->clock_muxes[i]), "out", DEVICE(obj), alias);
+        g_free(alias);
+    }
+
     s->xosc = clock_new(obj, "xosc");
+    s->gnd = clock_new(obj, "gnd");
+
+    clock_set(s->gnd, 0);
 
     memory_region_init_io(&s->iomem, obj, &cprman_ops,
                           s, "bcm2835-cprman", 0x2000);
     sysbus_init_mmio(SYS_BUS_DEVICE(obj), &s->iomem);
 }
 
+static void connect_mux_sources(BCM2835CprmanState *s,
+                                CprmanClockMuxState *mux,
+                                const CprmanPllChannel *clk_mapping)
+{
+    size_t i;
+    Clock *td0 = s->clock_muxes[CPRMAN_CLOCK_TD0].out;
+    Clock *td1 = s->clock_muxes[CPRMAN_CLOCK_TD1].out;
+
+    /* For sources from 0 to 3. Source 4 to 9 are mux specific */
+    Clock * const CLK_SRC_MAPPING[] = {
+        [CPRMAN_CLOCK_SRC_GND] = s->gnd,
+        [CPRMAN_CLOCK_SRC_XOSC] = s->xosc,
+        [CPRMAN_CLOCK_SRC_TD0] = td0,
+        [CPRMAN_CLOCK_SRC_TD1] = td1,
+    };
+
+    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX_SRC; i++) {
+        CprmanPllChannel mapping = clk_mapping[i];
+        Clock *src;
+
+        if (mapping == CPRMAN_CLOCK_SRC_FORCE_GROUND) {
+            src = s->gnd;
+        } else if (mapping == CPRMAN_CLOCK_SRC_DSI0HSCK) {
+            src = s->gnd; /* TODO */
+        } else if (i < CPRMAN_CLOCK_SRC_PLLA) {
+            src = CLK_SRC_MAPPING[i];
+        } else {
+            src = s->channels[mapping].out;
+        }
+
+        clock_set_source(mux->srcs[i], src);
+    }
+}
+
 static void cprman_realize(DeviceState *dev, Error **errp)
 {
     BCM2835CprmanState *s = CPRMAN(dev);
@@ -XXX,XX +XXX,XX @@ static void cprman_realize(DeviceState *dev, Error **errp)
             return;
         }
     }
+
+    for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
+        CprmanClockMuxState *clock_mux = &s->clock_muxes[i];
+
+        connect_mux_sources(s, clock_mux, CLOCK_MUX_INIT_INFO[i].src_mapping);
+
+        if (!qdev_realize(DEVICE(clock_mux), NULL, errp)) {
+            return;
+        }
+    }
 }
 
 static const VMStateDescription cprman_vmstate = {
@@ -XXX,XX +XXX,XX @@ static void cprman_register_types(void)
     type_register_static(&cprman_info);
     type_register_static(&cprman_pll_info);
     type_register_static(&cprman_pll_channel_info);
+    type_register_static(&cprman_clock_mux_info);
 }
 
 type_init(cprman_register_types);
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

A clock mux can be configured to select one of its 10 sources through
the CM_CTL register. It also embeds yet another clock divider, composed
of an integer part and a fractional part. The number of bits of each
part is mux dependent.

Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/misc/bcm2835_cprman.c | 53 +++++++++++++++++++++++++++++++++++++++-
 1 file changed, 52 insertions(+), 1 deletion(-)

diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/bcm2835_cprman.c
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_channel_info = {
 
 /* clock mux */
 
+static bool clock_mux_is_enabled(CprmanClockMuxState *mux)
+{
+    return FIELD_EX32(*mux->reg_ctl, CM_CLOCKx_CTL, ENABLE);
+}
+
 static void clock_mux_update(CprmanClockMuxState *mux)
 {
-    clock_update(mux->out, 0);
+    uint64_t freq;
+    uint32_t div, src = FIELD_EX32(*mux->reg_ctl, CM_CLOCKx_CTL, SRC);
+    bool enabled = clock_mux_is_enabled(mux);
+
+    *mux->reg_ctl = FIELD_DP32(*mux->reg_ctl, CM_CLOCKx_CTL, BUSY, enabled);
+
+    if (!enabled) {
+        clock_update(mux->out, 0);
+        return;
+    }
+
+    freq = clock_get_hz(mux->srcs[src]);
+
+    if (mux->int_bits == 0 && mux->frac_bits == 0) {
+        clock_update_hz(mux->out, freq);
+        return;
+    }
+
+    /*
+     * The divider has an integer and a fractional part. The size of each part
+     * varies with the muxes (int_bits and frac_bits). Both parts are
+     * concatenated, with the integer part always starting at bit 12.
+     *
+     *         31          12 11          0
+     *        ------------------------------
+     * CM_DIV |      |  int  |  frac  |    |
+     *        ------------------------------
+     *                <-----> <------>
+     *                int_bits frac_bits
+     */
+    div = extract32(*mux->reg_div,
+                    R_CM_CLOCKx_DIV_FRAC_LENGTH - mux->frac_bits,
+                    mux->int_bits + mux->frac_bits);
+
+    if (!div) {
+        clock_update(mux->out, 0);
+        return;
+    }
+
+    freq = muldiv64(freq, 1 << mux->frac_bits, div);
+
+    clock_update_hz(mux->out, freq);
 }
 
 static void clock_mux_src_update(void *opaque)
 {
     CprmanClockMuxState **backref = opaque;
     CprmanClockMuxState *s = *backref;
+    CprmanClockMuxSource src = backref - s->backref;
+
+    if (FIELD_EX32(*s->reg_ctl, CM_CLOCKx_CTL, SRC) != src) {
+        return;
+    }
 
     clock_mux_update(s);
 }
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

This simple mux sits between the PLL channels and the DSI0E and DSI0P
clock muxes. This mux selects between PLLA-DSI0 and PLLD-DSI0 channel
and outputs the selected signal to source number 4 of DSI0E/P clock
muxes. It is controlled by the cm_dsi0hsck register.

diff --git a/include/hw/misc/bcm2835_cprman.h b/include/hw/misc/bcm2835_cprman.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman.h
+++ b/include/hw/misc/bcm2835_cprman.h
@@ -XXX,XX +XXX,XX @@ typedef struct CprmanClockMuxState {
     struct CprmanClockMuxState *backref[CPRMAN_NUM_CLOCK_MUX_SRC];
 } CprmanClockMuxState;
 
+typedef struct CprmanDsi0HsckMuxState {
+    /*< private >*/
+    DeviceState parent_obj;
+
+    /*< public >*/
+    CprmanClockMux id;
+
+    uint32_t *reg_cm;
+
+    Clock *plla_in;
+    Clock *plld_in;
+    Clock *out;
+} CprmanDsi0HsckMuxState;
+
 struct BCM2835CprmanState {
     /*< private >*/
     SysBusDevice parent_obj;
@@ -XXX,XX +XXX,XX @@ struct BCM2835CprmanState {
     CprmanPllState plls[CPRMAN_NUM_PLL];
     CprmanPllChannelState channels[CPRMAN_NUM_PLL_CHANNEL];
     CprmanClockMuxState clock_muxes[CPRMAN_NUM_CLOCK_MUX];
+    CprmanDsi0HsckMuxState dsi0hsck_mux;
 
     uint32_t regs[CPRMAN_NUM_REGS];
     uint32_t xosc_freq;
diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman_internals.h
+++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@
 #define TYPE_CPRMAN_PLL "bcm2835-cprman-pll"
 #define TYPE_CPRMAN_PLL_CHANNEL "bcm2835-cprman-pll-channel"
 #define TYPE_CPRMAN_CLOCK_MUX "bcm2835-cprman-clock-mux"
+#define TYPE_CPRMAN_DSI0HSCK_MUX "bcm2835-cprman-dsi0hsck-mux"
 
 DECLARE_INSTANCE_CHECKER(CprmanPllState, CPRMAN_PLL,
                          TYPE_CPRMAN_PLL)
@@ -XXX,XX +XXX,XX @@ DECLARE_INSTANCE_CHECKER(CprmanPllChannelState, CPRMAN_PLL_CHANNEL,
                          TYPE_CPRMAN_PLL_CHANNEL)
 DECLARE_INSTANCE_CHECKER(CprmanClockMuxState, CPRMAN_CLOCK_MUX,
                          TYPE_CPRMAN_CLOCK_MUX)
+DECLARE_INSTANCE_CHECKER(CprmanDsi0HsckMuxState, CPRMAN_DSI0HSCK_MUX,
+                         TYPE_CPRMAN_DSI0HSCK_MUX)
 
 /* Register map */
 
@@ -XXX,XX +XXX,XX @@ REG32(CM_LOCK, 0x114)
     FIELD(CM_LOCK, FLOCKB, 9, 1)
     FIELD(CM_LOCK, FLOCKA, 8, 1)
 
+REG32(CM_DSI0HSCK, 0x120)
+    FIELD(CM_DSI0HSCK, SELPLLD, 0, 1)
+
 /*
  * This field is common to all registers. Each register write value must match
  * the CPRMAN_PASSWORD magic value in its 8 MSB.
diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/bcm2835_cprman.c
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_clock_mux_info = {
 };
 
 
+/* DSI0HSCK mux */
+
+static void dsi0hsck_mux_update(CprmanDsi0HsckMuxState *s)
+{
+    bool src_is_plld = FIELD_EX32(*s->reg_cm, CM_DSI0HSCK, SELPLLD);
+    Clock *src = src_is_plld ? s->plld_in : s->plla_in;
+
+    clock_update(s->out, clock_get(src));
+}
+
+static void dsi0hsck_mux_in_update(void *opaque)
+{
+    dsi0hsck_mux_update(CPRMAN_DSI0HSCK_MUX(opaque));
+}
+
+static void dsi0hsck_mux_init(Object *obj)
+{
+    CprmanDsi0HsckMuxState *s = CPRMAN_DSI0HSCK_MUX(obj);
+    DeviceState *dev = DEVICE(obj);
+
+    s->plla_in = qdev_init_clock_in(dev, "plla-in", dsi0hsck_mux_in_update, s);
+    s->plld_in = qdev_init_clock_in(dev, "plld-in", dsi0hsck_mux_in_update, s);
+    s->out = qdev_init_clock_out(DEVICE(s), "out");
+}
+
+static const VMStateDescription dsi0hsck_mux_vmstate = {
+    .name = TYPE_CPRMAN_DSI0HSCK_MUX,
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_CLOCK(plla_in, CprmanDsi0HsckMuxState),
+        VMSTATE_CLOCK(plld_in, CprmanDsi0HsckMuxState),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
+static void dsi0hsck_mux_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->vmsd = &dsi0hsck_mux_vmstate;
+}
+
+static const TypeInfo cprman_dsi0hsck_mux_info = {
+    .name = TYPE_CPRMAN_DSI0HSCK_MUX,
+    .parent = TYPE_DEVICE,
+    .instance_size = sizeof(CprmanDsi0HsckMuxState),
+    .class_init = dsi0hsck_mux_class_init,
+    .instance_init = dsi0hsck_mux_init,
+};
+
+
 /* CPRMAN "top level" model */
 
 static uint32_t get_cm_lock(const BCM2835CprmanState *s)
@@ -XXX,XX +XXX,XX @@ static void cprman_write(void *opaque, hwaddr offset,
     case R_CM_EMMC2CTL ... R_CM_EMMC2DIV:
         update_mux_from_cm(s, idx);
         break;
+
+    case R_CM_DSI0HSCK:
+        dsi0hsck_mux_update(&s->dsi0hsck_mux);
+        break;
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static void cprman_reset(DeviceState *dev)
         device_cold_reset(DEVICE(&s->channels[i]));
     }
 
+    device_cold_reset(DEVICE(&s->dsi0hsck_mux));
+
     for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
         device_cold_reset(DEVICE(&s->clock_muxes[i]));
     }
@@ -XXX,XX +XXX,XX @@ static void cprman_init(Object *obj)
         set_pll_channel_init_info(s, &s->channels[i], i);
     }
 
+    object_initialize_child(obj, "dsi0hsck-mux",
+                            &s->dsi0hsck_mux, TYPE_CPRMAN_DSI0HSCK_MUX);
+    s->dsi0hsck_mux.reg_cm = &s->regs[R_CM_DSI0HSCK];
+
     for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
         char *alias;
 
@@ -XXX,XX +XXX,XX @@ static void connect_mux_sources(BCM2835CprmanState *s,
         if (mapping == CPRMAN_CLOCK_SRC_FORCE_GROUND) {
             src = s->gnd;
         } else if (mapping == CPRMAN_CLOCK_SRC_DSI0HSCK) {
-            src = s->gnd; /* TODO */
+            src = s->dsi0hsck_mux.out;
         } else if (i < CPRMAN_CLOCK_SRC_PLLA) {
             src = CLK_SRC_MAPPING[i];
         } else {
@@ -XXX,XX +XXX,XX @@ static void cprman_realize(DeviceState *dev, Error **errp)
         }
     }
 
+    clock_set_source(s->dsi0hsck_mux.plla_in,
+                     s->channels[CPRMAN_PLLA_CHANNEL_DSI0].out);
+    clock_set_source(s->dsi0hsck_mux.plld_in,
+                     s->channels[CPRMAN_PLLD_CHANNEL_DSI0].out);
+
+    if (!qdev_realize(DEVICE(&s->dsi0hsck_mux), NULL, errp)) {
+        return;
+    }
+
     for (i = 0; i < CPRMAN_NUM_CLOCK_MUX; i++) {
         CprmanClockMuxState *clock_mux = &s->clock_muxes[i];
 
@@ -XXX,XX +XXX,XX @@ static void cprman_register_types(void)
     type_register_static(&cprman_pll_info);
     type_register_static(&cprman_pll_channel_info);
     type_register_static(&cprman_clock_mux_info);
+    type_register_static(&cprman_dsi0hsck_mux_info);
 }
 
 type_init(cprman_register_types);
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

Those reset values have been extracted from a Raspberry Pi 3 model B
v1.2, using the 2020-08-20 version of raspios. The dump was done using
the debugfs interface of the CPRMAN driver in Linux (under
'/sys/kernel/debug/clk'). Each exposed clock tree stage (PLLs, channels
and muxes) can be observed by reading the 'regdump' file (e.g.
'plla/regdump').

Those values are set by the Raspberry Pi firmware at boot time (Linux
expects them to be set when it boots up).

Some stages are not exposed by the Linux driver (e.g. the PLL B). For
those, the reset values are unknown and left to 0 which implies a
disabled output.

Once booted in QEMU, the final clock tree is very similar to the one
visible on real hardware. The differences come from some unimplemented
devices for which the driver simply disable the corresponding clock.

Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/misc/bcm2835_cprman_internals.h | 269 +++++++++++++++++++++
 hw/misc/bcm2835_cprman.c                   |  31 +++
 2 files changed, 300 insertions(+)

diff --git a/include/hw/misc/bcm2835_cprman_internals.h b/include/hw/misc/bcm2835_cprman_internals.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/misc/bcm2835_cprman_internals.h
+++ b/include/hw/misc/bcm2835_cprman_internals.h
@@ -XXX,XX +XXX,XX @@ static inline void set_clock_mux_init_info(BCM2835CprmanState *s,
     mux->frac_bits = CLOCK_MUX_INIT_INFO[id].frac_bits;
 }
 
+
+/*
+ * Object reset info
+ * Those values have been dumped from a Raspberry Pi 3 Model B v1.2 using the
+ * clk debugfs interface in Linux.
+ */
+typedef struct PLLResetInfo {
+    uint32_t cm;
+    uint32_t a2w_ctrl;
+    uint32_t a2w_ana[4];
+    uint32_t a2w_frac;
+} PLLResetInfo;
+
+static const PLLResetInfo PLL_RESET_INFO[] = {
+    [CPRMAN_PLLA] = {
+        .cm = 0x0000008a,
+        .a2w_ctrl = 0x0002103a,
+        .a2w_frac = 0x00098000,
+        .a2w_ana = { 0x00000000, 0x00144000, 0x00000000, 0x00000100 }
+    },
+
+    [CPRMAN_PLLC] = {
+        .cm = 0x00000228,
+        .a2w_ctrl = 0x0002103e,
+        .a2w_frac = 0x00080000,
+        .a2w_ana = { 0x00000000, 0x00144000, 0x00000000, 0x00000100 }
+    },
+
+    [CPRMAN_PLLD] = {
+        .cm = 0x0000020a,
+        .a2w_ctrl = 0x00021034,
+        .a2w_frac = 0x00015556,
+        .a2w_ana = { 0x00000000, 0x00144000, 0x00000000, 0x00000100 }
+    },
+
+    [CPRMAN_PLLH] = {
+        .cm = 0x00000000,
+        .a2w_ctrl = 0x0002102d,
+        .a2w_frac = 0x00000000,
+        .a2w_ana = { 0x00900000, 0x0000000c, 0x00000000, 0x00000000 }
+    },
+
+    [CPRMAN_PLLB] = {
+        /* unknown */
+        .cm = 0x00000000,
+        .a2w_ctrl = 0x00000000,
+        .a2w_frac = 0x00000000,
+        .a2w_ana = { 0x00000000, 0x00000000, 0x00000000, 0x00000000 }
+    }
+};
+
+typedef struct PLLChannelResetInfo {
+    /*
+     * Even though a PLL channel has a CM register, it shares it with its
+     * parent PLL. The parent already takes care of the reset value.
+     */
+    uint32_t a2w_ctrl;
+} PLLChannelResetInfo;
+
+static const PLLChannelResetInfo PLL_CHANNEL_RESET_INFO[] = {
+    [CPRMAN_PLLA_CHANNEL_DSI0] = { .a2w_ctrl = 0x00000100 },
+    [CPRMAN_PLLA_CHANNEL_CORE] = { .a2w_ctrl = 0x00000003 },
+    [CPRMAN_PLLA_CHANNEL_PER] = { .a2w_ctrl = 0x00000000 }, /* unknown */
+    [CPRMAN_PLLA_CHANNEL_CCP2] = { .a2w_ctrl = 0x00000100 },
+
+    [CPRMAN_PLLC_CHANNEL_CORE2] = { .a2w_ctrl = 0x00000100 },
+    [CPRMAN_PLLC_CHANNEL_CORE1] = { .a2w_ctrl = 0x00000100 },
+    [CPRMAN_PLLC_CHANNEL_PER] = { .a2w_ctrl = 0x00000002 },
+    [CPRMAN_PLLC_CHANNEL_CORE0] = { .a2w_ctrl = 0x00000002 },
+
+    [CPRMAN_PLLD_CHANNEL_DSI0] = { .a2w_ctrl = 0x00000100 },
+    [CPRMAN_PLLD_CHANNEL_CORE] = { .a2w_ctrl = 0x00000004 },
+    [CPRMAN_PLLD_CHANNEL_PER] = { .a2w_ctrl = 0x00000004 },
+    [CPRMAN_PLLD_CHANNEL_DSI1] = { .a2w_ctrl = 0x00000100 },
+
+    [CPRMAN_PLLH_CHANNEL_AUX] = { .a2w_ctrl = 0x00000004 },
+    [CPRMAN_PLLH_CHANNEL_RCAL] = { .a2w_ctrl = 0x00000000 },
+    [CPRMAN_PLLH_CHANNEL_PIX] = { .a2w_ctrl = 0x00000000 },
+
+    [CPRMAN_PLLB_CHANNEL_ARM] = { .a2w_ctrl = 0x00000000 }, /* unknown */
+};
+
+typedef struct ClockMuxResetInfo {
+    uint32_t cm_ctl;
+    uint32_t cm_div;
+} ClockMuxResetInfo;
+
+static const ClockMuxResetInfo CLOCK_MUX_RESET_INFO[] = {
+    [CPRMAN_CLOCK_GNRIC] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_VPU] = {
+        .cm_ctl = 0x00000245,
+        .cm_div = 0x00003000,
+    },
+
+    [CPRMAN_CLOCK_SYS] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_PERIA] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_PERII] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_H264] = {
+        .cm_ctl = 0x00000244,
+        .cm_div = 0x00003000,
+    },
+
+    [CPRMAN_CLOCK_ISP] = {
+        .cm_ctl = 0x00000244,
+        .cm_div = 0x00003000,
+    },
+
+    [CPRMAN_CLOCK_V3D] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_CAM0] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_CAM1] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_CCP2] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_DSI0E] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_DSI0P] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_DPI] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_GP0] = {
+        .cm_ctl = 0x00000200,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_GP1] = {
+        .cm_ctl = 0x00000096,
+        .cm_div = 0x00014000,
+    },
+
+    [CPRMAN_CLOCK_GP2] = {
+        .cm_ctl = 0x00000291,
+        .cm_div = 0x00249f00,
+    },
+
+    [CPRMAN_CLOCK_HSM] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_OTP] = {
+        .cm_ctl = 0x00000091,
+        .cm_div = 0x00004000,
+    },
+
+    [CPRMAN_CLOCK_PCM] = {
+        .cm_ctl = 0x00000200,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_PWM] = {
+        .cm_ctl = 0x00000200,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_SLIM] = {
+        .cm_ctl = 0x00000200,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_SMI] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_TEC] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_TD0] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_TD1] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_TSENS] = {
+        .cm_ctl = 0x00000091,
+        .cm_div = 0x0000a000,
+    },
+
+    [CPRMAN_CLOCK_TIMER] = {
+        .cm_ctl = 0x00000291,
+        .cm_div = 0x00013333,
+    },
+
+    [CPRMAN_CLOCK_UART] = {
+        .cm_ctl = 0x00000296,
+        .cm_div = 0x0000a6ab,
+    },
+
+    [CPRMAN_CLOCK_VEC] = {
+        .cm_ctl = 0x00000097,
+        .cm_div = 0x00002000,
+    },
+
+    [CPRMAN_CLOCK_PULSE] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_SDC] = {
+        .cm_ctl = 0x00004006,
+        .cm_div = 0x00003000,
+    },
+
+    [CPRMAN_CLOCK_ARM] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+
+    [CPRMAN_CLOCK_AVEO] = {
+        .cm_ctl = 0x00000000,
+        .cm_div = 0x00000000,
+    },
+
+    [CPRMAN_CLOCK_EMMC] = {
+        .cm_ctl = 0x00000295,
+        .cm_div = 0x00006000,
+    },
+
+    [CPRMAN_CLOCK_EMMC2] = {
+        .cm_ctl = 0, /* unknown */
+        .cm_div = 0
+    },
+};
+
 #endif
diff --git a/hw/misc/bcm2835_cprman.c b/hw/misc/bcm2835_cprman.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/bcm2835_cprman.c
+++ b/hw/misc/bcm2835_cprman.c
@@ -XXX,XX +XXX,XX @@
 
 /* PLL */
 
+static void pll_reset(DeviceState *dev)
+{
+    CprmanPllState *s = CPRMAN_PLL(dev);
+    const PLLResetInfo *info = &PLL_RESET_INFO[s->id];
+
+    *s->reg_cm = info->cm;
+    *s->reg_a2w_ctrl = info->a2w_ctrl;
+    memcpy(s->reg_a2w_ana, info->a2w_ana, sizeof(info->a2w_ana));
+    *s->reg_a2w_frac = info->a2w_frac;
+}
+
 static bool pll_is_locked(const CprmanPllState *pll)
 {
     return !FIELD_EX32(*pll->reg_a2w_ctrl, A2W_PLLx_CTRL, PWRDN)
@@ -XXX,XX +XXX,XX @@ static void pll_class_init(ObjectClass *klass, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(klass);
 
+    dc->reset = pll_reset;
     dc->vmsd = &pll_vmstate;
 }
 
@@ -XXX,XX +XXX,XX @@ static const TypeInfo cprman_pll_info = {
 
 /* PLL channel */
 
+static void pll_channel_reset(DeviceState *dev)
+{
+    CprmanPllChannelState *s = CPRMAN_PLL_CHANNEL(dev);
+    const PLLChannelResetInfo *info = &PLL_CHANNEL_RESET_INFO[s->id];
+
+    *s->reg_a2w_ctrl = info->a2w_ctrl;
+}
+
 static bool pll_channel_is_enabled(CprmanPllChannelState *channel)
 {
     /*
@@ -XXX,XX +XXX,XX @@ static void pll_channel_class_init(ObjectClass *klass, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(klass);
 
+    dc->reset = pll_channel_reset;
     dc->vmsd = &pll_channel_vmstate;
 }
 
@@ -XXX,XX +XXX,XX @@ static void clock_mux_src_update(void *opaque)
     clock_mux_update(s);
 }
 
+static void clock_mux_reset(DeviceState *dev)
+{
+    CprmanClockMuxState *clock = CPRMAN_CLOCK_MUX(dev);
+    const ClockMuxResetInfo *info = &CLOCK_MUX_RESET_INFO[clock->id];
+
+    *clock->reg_ctl = info->cm_ctl;
+    *clock->reg_div = info->cm_div;
+}
+
 static void clock_mux_init(Object *obj)
 {
     CprmanClockMuxState *s = CPRMAN_CLOCK_MUX(obj);
@@ -XXX,XX +XXX,XX @@ static void clock_mux_class_init(ObjectClass *klass, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(klass);
 
+    dc->reset = clock_mux_reset;
     dc->vmsd = &clock_mux_vmstate;
 }
 
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

Add a clock input to the PL011 UART so we can compute the current baud
rate and trace it. This is intended for developers who wish to use QEMU
to e.g. debug their firmware or to figure out the baud rate configured
by an unknown/closed source binary.

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/char/pl011.h |  1 +
 hw/char/pl011.c         | 45 +++++++++++++++++++++++++++++++++++++++++
 hw/char/trace-events    |  1 +
 3 files changed, 47 insertions(+)

diff --git a/include/hw/char/pl011.h b/include/hw/char/pl011.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/char/pl011.h
+++ b/include/hw/char/pl011.h
@@ -XXX,XX +XXX,XX @@ struct PL011State {
     int read_trigger;
     CharBackend chr;
     qemu_irq irq[6];
+    Clock *clk;
     const unsigned char *id;
 };
 
diff --git a/hw/char/pl011.c b/hw/char/pl011.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/pl011.c
+++ b/hw/char/pl011.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/char/pl011.h"
 #include "hw/irq.h"
 #include "hw/sysbus.h"
+#include "hw/qdev-clock.h"
 #include "migration/vmstate.h"
 #include "chardev/char-fe.h"
 #include "qemu/log.h"
@@ -XXX,XX +XXX,XX @@ static void pl011_set_read_trigger(PL011State *s)
         s->read_trigger = 1;
 }
 
+static unsigned int pl011_get_baudrate(const PL011State *s)
+{
+    uint64_t clk;
+
+    if (s->fbrd == 0) {
+        return 0;
+    }
+
+    clk = clock_get_hz(s->clk);
+    return (clk / ((s->ibrd << 6) + s->fbrd)) << 2;
+}
+
+static void pl011_trace_baudrate_change(const PL011State *s)
+{
+    trace_pl011_baudrate_change(pl011_get_baudrate(s),
+                                clock_get_hz(s->clk),
+                                s->ibrd, s->fbrd);
+}
+
 static void pl011_write(void *opaque, hwaddr offset,
                         uint64_t value, unsigned size)
 {
@@ -XXX,XX +XXX,XX @@ static void pl011_write(void *opaque, hwaddr offset,
         break;
     case 9: /* UARTIBRD */
         s->ibrd = value;
+        pl011_trace_baudrate_change(s);
         break;
     case 10: /* UARTFBRD */
         s->fbrd = value;
+        pl011_trace_baudrate_change(s);
         break;
     case 11: /* UARTLCR_H */
         /* Reset the FIFO state on FIFO enable or disable */
@@ -XXX,XX +XXX,XX @@ static void pl011_event(void *opaque, QEMUChrEvent event)
         pl011_put_fifo(opaque, 0x400);
 }
 
+static void pl011_clock_update(void *opaque)
+{
+    PL011State *s = PL011(opaque);
+
+    pl011_trace_baudrate_change(s);
+}
+
 static const MemoryRegionOps pl011_ops = {
     .read = pl011_read,
     .write = pl011_write,
     .endianness = DEVICE_NATIVE_ENDIAN,
 };
 
+static const VMStateDescription vmstate_pl011_clock = {
+    .name = "pl011/clock",
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_CLOCK(clk, PL011State),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
 static const VMStateDescription vmstate_pl011 = {
     .name = "pl011",
     .version_id = 2,
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_pl011 = {
         VMSTATE_INT32(read_count, PL011State),
         VMSTATE_INT32(read_trigger, PL011State),
         VMSTATE_END_OF_LIST()
+    },
+    .subsections = (const VMStateDescription * []) {
+        &vmstate_pl011_clock,
+        NULL
     }
 };
 
@@ -XXX,XX +XXX,XX @@ static void pl011_init(Object *obj)
         sysbus_init_irq(sbd, &s->irq[i]);
     }
 
+    s->clk = qdev_init_clock_in(DEVICE(obj), "clk", pl011_clock_update, s);
+
     s->read_trigger = 1;
     s->ifl = 0x12;
     s->cr = 0x300;
diff --git a/hw/char/trace-events b/hw/char/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/trace-events
+++ b/hw/char/trace-events
@@ -XXX,XX +XXX,XX @@ pl011_write(uint32_t addr, uint32_t value) "addr 0x%08x value 0x%08x"
 pl011_can_receive(uint32_t lcr, int read_count, int r) "LCR 0x%08x read_count %d returning %d"
 pl011_put_fifo(uint32_t c, int read_count) "new char 0x%x read_count now %d"
 pl011_put_fifo_full(void) "FIFO now full, RXFF set"
+pl011_baudrate_change(unsigned int baudrate, uint64_t clock, uint32_t ibrd, uint32_t fbrd) "new baudrate %u (clk: %" PRIu64 "hz, ibrd: %" PRIu32 ", fbrd: %" PRIu32 ")"
 
 # cmsdk-apb-uart.c
 cmsdk_apb_uart_read(uint64_t offset, uint64_t data, unsigned size) "CMSDK APB UART read: offset 0x%" PRIx64 " data 0x%" PRIx64 " size %u"
-- 
2.20.1

From: Luc Michel <luc@lmichel.fr>

Connect the 'uart-out' clock from the CPRMAN to the PL011 instance.

Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Luc Michel <luc@lmichel.fr>
Tested-by: Guenter Roeck <linux@roeck-us.net>
Tested-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/bcm2835_peripherals.c | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/hw/arm/bcm2835_peripherals.c b/hw/arm/bcm2835_peripherals.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/bcm2835_peripherals.c
+++ b/hw/arm/bcm2835_peripherals.c
@@ -XXX,XX +XXX,XX @@ static void bcm2835_peripherals_realize(DeviceState *dev, Error **errp)
     }
     memory_region_add_subregion(&s->peri_mr, CPRMAN_OFFSET,
                 sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->cprman), 0));
+    qdev_connect_clock_in(DEVICE(&s->uart0), "clk",
+                          qdev_get_clock_out(DEVICE(&s->cprman), "uart-out"));
 
     memory_region_add_subregion(&s->peri_mr, ARMCTRL_IC_OFFSET,
                 sysbus_mmio_get_region(SYS_BUS_DEVICE(&s->ic), 0));
-- 
2.20.1

From: Shashi Mallela <shashi.mallela@linaro.org>

Generic watchdog device model implementation as per ARM SBSA v6.0

Signed-off-by: Shashi Mallela <shashi.mallela@linaro.org>
Message-id: 20201027015927.29495-2-shashi.mallela@linaro.org
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 include/hw/watchdog/sbsa_gwdt.h |  79 +++++++++
 hw/watchdog/sbsa_gwdt.c         | 293 ++++++++++++++++++++++++++++++++
 hw/arm/Kconfig                  |   1 +
 hw/watchdog/Kconfig             |   3 +
 hw/watchdog/meson.build         |   1 +
 5 files changed, 377 insertions(+)
 create mode 100644 include/hw/watchdog/sbsa_gwdt.h
 create mode 100644 hw/watchdog/sbsa_gwdt.c

diff --git a/include/hw/watchdog/sbsa_gwdt.h b/include/hw/watchdog/sbsa_gwdt.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/watchdog/sbsa_gwdt.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * Copyright (c) 2020 Linaro Limited
+ *
+ * Authors:
+ *  Shashi Mallela <shashi.mallela@linaro.org>
+ *
+ * This work is licensed under the terms of the GNU GPL, version 2 or (at your
+ * option) any later version.  See the COPYING file in the top-level directory.
+ *
+ */
+
+#ifndef WDT_SBSA_GWDT_H
+#define WDT_SBSA_GWDT_H
+
+#include "qemu/bitops.h"
+#include "hw/sysbus.h"
+#include "hw/irq.h"
+
+#define TYPE_WDT_SBSA "sbsa_gwdt"
+#define SBSA_GWDT(obj) \
+    OBJECT_CHECK(SBSA_GWDTState, (obj), TYPE_WDT_SBSA)
+#define SBSA_GWDT_CLASS(klass) \
+    OBJECT_CLASS_CHECK(SBSA_GWDTClass, (klass), TYPE_WDT_SBSA)
+#define SBSA_GWDT_GET_CLASS(obj) \
+    OBJECT_GET_CLASS(SBSA_GWDTClass, (obj), TYPE_WDT_SBSA)
+
+/* SBSA Generic Watchdog register definitions */
+/* refresh frame */
+#define SBSA_GWDT_WRR       0x000
+
+/* control frame */
+#define SBSA_GWDT_WCS       0x000
+#define SBSA_GWDT_WOR       0x008
+#define SBSA_GWDT_WORU      0x00C
+#define SBSA_GWDT_WCV       0x010
+#define SBSA_GWDT_WCVU      0x014
+
+/* Watchdog Interface Identification Register */
+#define SBSA_GWDT_W_IIDR    0xFCC
+
+/* Watchdog Control and Status Register Bits */
+#define SBSA_GWDT_WCS_EN    BIT(0)
+#define SBSA_GWDT_WCS_WS0   BIT(1)
+#define SBSA_GWDT_WCS_WS1   BIT(2)
+
+#define SBSA_GWDT_WOR_MASK  0x0000FFFF
+
+/*
+ * Watchdog Interface Identification Register definition
+ * considering JEP106 code for ARM in Bits [11:0]
+ */
+#define SBSA_GWDT_ID        0x1043B
+
+/* 2 Separate memory regions for each of refresh & control register frames */
+#define SBSA_GWDT_RMMIO_SIZE 0x1000
+#define SBSA_GWDT_CMMIO_SIZE 0x1000
+
+#define SBSA_TIMER_FREQ      62500000 /* Hz */
+
+typedef struct SBSA_GWDTState {
+    /* <private> */
+    SysBusDevice parent_obj;
+
+    /*< public >*/
+    MemoryRegion rmmio;
+    MemoryRegion cmmio;
+    qemu_irq irq;
+
+    QEMUTimer *timer;
+
+    uint32_t id;
+    uint32_t wcs;
+    uint32_t worl;
+    uint32_t woru;
+    uint32_t wcvl;
+    uint32_t wcvu;
+} SBSA_GWDTState;
+
+#endif /* WDT_SBSA_GWDT_H */
diff --git a/hw/watchdog/sbsa_gwdt.c b/hw/watchdog/sbsa_gwdt.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/watchdog/sbsa_gwdt.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Generic watchdog device model for SBSA
+ *
+ * The watchdog device has been implemented as revision 1 variant of
+ * the ARM SBSA specification v6.0
+ * (https://developer.arm.com/documentation/den0029/d?lang=en)
+ *
+ * Copyright Linaro.org 2020
+ *
+ * Authors:
+ *  Shashi Mallela <shashi.mallela@linaro.org>
+ *
+ * This work is licensed under the terms of the GNU GPL, version 2 or (at your
+ * option) any later version.  See the COPYING file in the top-level directory.
+ *
+ */
+
+#include "qemu/osdep.h"
+#include "sysemu/reset.h"
+#include "sysemu/watchdog.h"
+#include "hw/watchdog/sbsa_gwdt.h"
+#include "qemu/timer.h"
+#include "migration/vmstate.h"
+#include "qemu/log.h"
+#include "qemu/module.h"
+
+static WatchdogTimerModel model = {
+    .wdt_name = TYPE_WDT_SBSA,
+    .wdt_description = "SBSA-compliant generic watchdog device",
+};
+
+static const VMStateDescription vmstate_sbsa_gwdt = {
+    .name = "sbsa-gwdt",
+    .version_id = 1,
+    .minimum_version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_TIMER_PTR(timer, SBSA_GWDTState),
+        VMSTATE_UINT32(wcs, SBSA_GWDTState),
+        VMSTATE_UINT32(worl, SBSA_GWDTState),
+        VMSTATE_UINT32(woru, SBSA_GWDTState),
+        VMSTATE_UINT32(wcvl, SBSA_GWDTState),
+        VMSTATE_UINT32(wcvu, SBSA_GWDTState),
+        VMSTATE_END_OF_LIST()
+    }
+};
+
+typedef enum WdtRefreshType {
+    EXPLICIT_REFRESH = 0,
+    TIMEOUT_REFRESH = 1,
+} WdtRefreshType;
+
+static uint64_t sbsa_gwdt_rread(void *opaque, hwaddr addr, unsigned int size)
+{
+    SBSA_GWDTState *s = SBSA_GWDT(opaque);
+    uint32_t ret = 0;
+
+    switch (addr) {
+    case SBSA_GWDT_WRR:
+        /* watch refresh read has no effect and returns 0 */
+        ret = 0;
+        break;
+    case SBSA_GWDT_W_IIDR:
+        ret = s->id;
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "bad address in refresh frame read :"
+                        " 0x%x\n", (int)addr);
+    }
+    return ret;
+}
+
+static uint64_t sbsa_gwdt_read(void *opaque, hwaddr addr, unsigned int size)
+{
+    SBSA_GWDTState *s = SBSA_GWDT(opaque);
+    uint32_t ret = 0;
+
+    switch (addr) {
+    case SBSA_GWDT_WCS:
+        ret = s->wcs;
+        break;
+    case SBSA_GWDT_WOR:
+        ret = s->worl;
+        break;
+    case SBSA_GWDT_WORU:
+         ret = s->woru;
+         break;
+    case SBSA_GWDT_WCV:
+        ret = s->wcvl;
+        break;
+    case SBSA_GWDT_WCVU:
+        ret = s->wcvu;
+        break;
+    case SBSA_GWDT_W_IIDR:
+        ret = s->id;
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "bad address in control frame read :"
+                        " 0x%x\n", (int)addr);
+    }
+    return ret;
+}
+
+static void sbsa_gwdt_update_timer(SBSA_GWDTState *s, WdtRefreshType rtype)
+{
+    uint64_t timeout = 0;
+
+    timer_del(s->timer);
+
+    if (s->wcs & SBSA_GWDT_WCS_EN) {
+        /*
+         * Extract the upper 16 bits from woru & 32 bits from worl
+         * registers to construct the 48 bit offset value
+         */
+        timeout = s->woru;
+        timeout <<= 32;
+        timeout |= s->worl;
+        timeout = muldiv64(timeout, NANOSECONDS_PER_SECOND, SBSA_TIMER_FREQ);
+        timeout += qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
+
+        if ((rtype == EXPLICIT_REFRESH) || ((rtype == TIMEOUT_REFRESH) &&
+                (!(s->wcs & SBSA_GWDT_WCS_WS0)))) {
+            /* store the current timeout value into compare registers */
+            s->wcvu = timeout >> 32;
+            s->wcvl = timeout;
+        }
+        timer_mod(s->timer, timeout);
+    }
+}
+
+static void sbsa_gwdt_rwrite(void *opaque, hwaddr offset, uint64_t data,
+                             unsigned size) {
+    SBSA_GWDTState *s = SBSA_GWDT(opaque);
+
+    if (offset == SBSA_GWDT_WRR) {
+        s->wcs &= ~(SBSA_GWDT_WCS_WS0 | SBSA_GWDT_WCS_WS1);
+
+        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
+    } else {
+        qemu_log_mask(LOG_GUEST_ERROR, "bad address in refresh frame write :"
+                        " 0x%x\n", (int)offset);
+    }
+}
+
+static void sbsa_gwdt_write(void *opaque, hwaddr offset, uint64_t data,
+                             unsigned size) {
+    SBSA_GWDTState *s = SBSA_GWDT(opaque);
+
+    switch (offset) {
+    case SBSA_GWDT_WCS:
+        s->wcs = data & SBSA_GWDT_WCS_EN;
+        qemu_set_irq(s->irq, 0);
+        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
+        break;
+
+    case SBSA_GWDT_WOR:
+        s->worl = data;
+        s->wcs &= ~(SBSA_GWDT_WCS_WS0 | SBSA_GWDT_WCS_WS1);
+        qemu_set_irq(s->irq, 0);
+        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
+        break;
+
+    case SBSA_GWDT_WORU:
+        s->woru = data & SBSA_GWDT_WOR_MASK;
+        s->wcs &= ~(SBSA_GWDT_WCS_WS0 | SBSA_GWDT_WCS_WS1);
+        qemu_set_irq(s->irq, 0);
+        sbsa_gwdt_update_timer(s, EXPLICIT_REFRESH);
+        break;
+
+    case SBSA_GWDT_WCV:
+        s->wcvl = data;
+        break;
+
+    case SBSA_GWDT_WCVU:
+        s->wcvu = data;
+        break;
+
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "bad address in control frame write :"
+                " 0x%x\n", (int)offset);
+    }
+    return;
+}
+
+static void wdt_sbsa_gwdt_reset(DeviceState *dev)
+{
+    SBSA_GWDTState *s = SBSA_GWDT(dev);
+
+    timer_del(s->timer);
+
+    s->wcs  = 0;
+    s->wcvl = 0;
+    s->wcvu = 0;
+    s->worl = 0;
+    s->woru = 0;
+    s->id = SBSA_GWDT_ID;
+}
+
+static void sbsa_gwdt_timer_sysinterrupt(void *opaque)
+{
+    SBSA_GWDTState *s = SBSA_GWDT(opaque);
+
+    if (!(s->wcs & SBSA_GWDT_WCS_WS0)) {
+        s->wcs |= SBSA_GWDT_WCS_WS0;
+        sbsa_gwdt_update_timer(s, TIMEOUT_REFRESH);
+        qemu_set_irq(s->irq, 1);
+    } else {
+        s->wcs |= SBSA_GWDT_WCS_WS1;
+        qemu_log_mask(CPU_LOG_RESET, "Watchdog timer expired.\n");
+        /*
+         * Reset the watchdog only if the guest gets notified about
+         * expiry. watchdog_perform_action() may temporarily relinquish
+         * the BQL; reset before triggering the action to avoid races with
+         * sbsa_gwdt instructions.
+         */
+        switch (get_watchdog_action()) {
+        case WATCHDOG_ACTION_DEBUG:
+        case WATCHDOG_ACTION_NONE:
+        case WATCHDOG_ACTION_PAUSE:
+            break;
+        default:
+            wdt_sbsa_gwdt_reset(DEVICE(s));
+        }
+        watchdog_perform_action();
+    }
+}
+
+static const MemoryRegionOps sbsa_gwdt_rops = {
+    .read = sbsa_gwdt_rread,
+    .write = sbsa_gwdt_rwrite,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    .valid.min_access_size = 4,
+    .valid.max_access_size = 4,
+    .valid.unaligned = false,
+};
+
+static const MemoryRegionOps sbsa_gwdt_ops = {
+    .read = sbsa_gwdt_read,
+    .write = sbsa_gwdt_write,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    .valid.min_access_size = 4,
+    .valid.max_access_size = 4,
+    .valid.unaligned = false,
+};
+
+static void wdt_sbsa_gwdt_realize(DeviceState *dev, Error **errp)
+{
+    SBSA_GWDTState *s = SBSA_GWDT(dev);
+    SysBusDevice *sbd = SYS_BUS_DEVICE(dev);
+
+    memory_region_init_io(&s->rmmio, OBJECT(dev),
+                          &sbsa_gwdt_rops, s,
+                          "sbsa_gwdt.refresh",
+                          SBSA_GWDT_RMMIO_SIZE);
+
+    memory_region_init_io(&s->cmmio, OBJECT(dev),
+                          &sbsa_gwdt_ops, s,
+                          "sbsa_gwdt.control",
+                          SBSA_GWDT_CMMIO_SIZE);
+
+    sysbus_init_mmio(sbd, &s->rmmio);
+    sysbus_init_mmio(sbd, &s->cmmio);
+
+    sysbus_init_irq(sbd, &s->irq);
+
+    s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, sbsa_gwdt_timer_sysinterrupt,
+                dev);
+}
+
+static void wdt_sbsa_gwdt_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->realize = wdt_sbsa_gwdt_realize;
+    dc->reset = wdt_sbsa_gwdt_reset;
+    dc->hotpluggable = false;
+    set_bit(DEVICE_CATEGORY_MISC, dc->categories);
+    dc->vmsd = &vmstate_sbsa_gwdt;
+}
+
+static const TypeInfo wdt_sbsa_gwdt_info = {
+    .class_init = wdt_sbsa_gwdt_class_init,
+    .parent = TYPE_SYS_BUS_DEVICE,
+    .name  = TYPE_WDT_SBSA,
+    .instance_size  = sizeof(SBSA_GWDTState),
+};
+
+static void wdt_sbsa_gwdt_register_types(void)
+{
+    watchdog_add_model(&model);
+    type_register_static(&wdt_sbsa_gwdt_info);
+}
+
+type_init(wdt_sbsa_gwdt_register_types)
diff --git a/hw/arm/Kconfig b/hw/arm/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/Kconfig
+++ b/hw/arm/Kconfig
@@ -XXX,XX +XXX,XX @@ config SBSA_REF
     select PL031 # RTC
     select PL061 # GPIO
     select USB_EHCI_SYSBUS
+    select WDT_SBSA
 
 config SABRELITE
     bool
diff --git a/hw/watchdog/Kconfig b/hw/watchdog/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/watchdog/Kconfig
+++ b/hw/watchdog/Kconfig
@@ -XXX,XX +XXX,XX @@ config WDT_DIAG288
 
 config WDT_IMX2
     bool
+
+config WDT_SBSA
+    bool
diff --git a/hw/watchdog/meson.build b/hw/watchdog/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/watchdog/meson.build
+++ b/hw/watchdog/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_WDT_IB700', if_true: files('wdt_ib700.c'))
 softmmu_ss.add(when: 'CONFIG_WDT_DIAG288', if_true: files('wdt_diag288.c'))
 softmmu_ss.add(when: 'CONFIG_ASPEED_SOC', if_true: files('wdt_aspeed.c'))
 softmmu_ss.add(when: 'CONFIG_WDT_IMX2', if_true: files('wdt_imx2.c'))
+softmmu_ss.add(when: 'CONFIG_WDT_SBSA', if_true: files('sbsa_gwdt.c'))
-- 
2.20.1

From: Shashi Mallela <shashi.mallela@linaro.org>

Included the newly implemented SBSA generic watchdog device model into
SBSA platform

Signed-off-by: Shashi Mallela <shashi.mallela@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-id: 20201027015927.29495-3-shashi.mallela@linaro.org
Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
---
 hw/arm/sbsa-ref.c | 23 +++++++++++++++++++++++
 1 file changed, 23 insertions(+)

diff --git a/hw/arm/sbsa-ref.c b/hw/arm/sbsa-ref.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/sbsa-ref.c
+++ b/hw/arm/sbsa-ref.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/qdev-properties.h"
 #include "hw/usb.h"
 #include "hw/char/pl011.h"
+#include "hw/watchdog/sbsa_gwdt.h"
 #include "net/net.h"
 #include "qom/object.h"
 
@@ -XXX,XX +XXX,XX @@ enum {
     SBSA_GIC_DIST,
     SBSA_GIC_REDIST,
     SBSA_SECURE_EC,
+    SBSA_GWDT,
+    SBSA_GWDT_REFRESH,
+    SBSA_GWDT_CONTROL,
     SBSA_SMMU,
     SBSA_UART,
     SBSA_RTC,
@@ -XXX,XX +XXX,XX @@ static const MemMapEntry sbsa_ref_memmap[] = {
     [SBSA_GIC_DIST] =           { 0x40060000, 0x00010000 },
     [SBSA_GIC_REDIST] =         { 0x40080000, 0x04000000 },
     [SBSA_SECURE_EC] =          { 0x50000000, 0x00001000 },
+    [SBSA_GWDT_REFRESH] =       { 0x50010000, 0x00001000 },
+    [SBSA_GWDT_CONTROL] =       { 0x50011000, 0x00001000 },
     [SBSA_UART] =               { 0x60000000, 0x00001000 },
     [SBSA_RTC] =                { 0x60010000, 0x00001000 },
     [SBSA_GPIO] =               { 0x60020000, 0x00001000 },
@@ -XXX,XX +XXX,XX @@ static const int sbsa_ref_irqmap[] = {
     [SBSA_AHCI] = 10,
     [SBSA_EHCI] = 11,
     [SBSA_SMMU] = 12, /* ... to 15 */
+    [SBSA_GWDT] = 16,
 };
 
 static uint64_t sbsa_ref_cpu_mp_affinity(SBSAMachineState *sms, int idx)
@@ -XXX,XX +XXX,XX @@ static void create_rtc(const SBSAMachineState *sms)
     sysbus_create_simple("pl031", base, qdev_get_gpio_in(sms->gic, irq));
 }
 
+static void create_wdt(const SBSAMachineState *sms)
+{
+    hwaddr rbase = sbsa_ref_memmap[SBSA_GWDT_REFRESH].base;
+    hwaddr cbase = sbsa_ref_memmap[SBSA_GWDT_CONTROL].base;
+    DeviceState *dev = qdev_new(TYPE_WDT_SBSA);
+    SysBusDevice *s = SYS_BUS_DEVICE(dev);
+    int irq = sbsa_ref_irqmap[SBSA_GWDT];
+
+    sysbus_realize_and_unref(s, &error_fatal);
+    sysbus_mmio_map(s, 0, rbase);
+    sysbus_mmio_map(s, 1, cbase);
+    sysbus_connect_irq(s, 0, qdev_get_gpio_in(sms->gic, irq));
+}
+
 static DeviceState *gpio_key_dev;
 static void sbsa_ref_powerdown_req(Notifier *n, void *opaque)
 {
@@ -XXX,XX +XXX,XX @@ static void sbsa_ref_init(MachineState *machine)
 
     create_rtc(sms);
 
+    create_wdt(sms);
+
     create_gpio(sms);
 
     create_ahci(sms);
-- 
2.20.1

In ptimer_reload(), we call the callback function provided by the
timer device that is using the ptimer.  This callback might disable
the ptimer.  The code mostly handles this correctly, except that
we'll still print the warning about "Timer with delta zero,
disabling" if the now-disabled timer happened to be set such that it
would fire again immediately if it were enabled (eg because the
limit/reload value is zero).

Suppress the spurious warning message and the unnecessary
repeat-deletion of the underlying timer in this case.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Message-id: 20201015151829.14656-2-peter.maydell@linaro.org
---
 hw/core/ptimer.c | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/hw/core/ptimer.c b/hw/core/ptimer.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/core/ptimer.c
+++ b/hw/core/ptimer.c
@@ -XXX,XX +XXX,XX @@ static void ptimer_reload(ptimer_state *s, int delta_adjust)
     }
 
     if (delta == 0) {
+        if (s->enabled == 0) {
+            /* trigger callback disabled the timer already */
+            return;
+        }
         if (!qtest_enabled()) {
             fprintf(stderr, "Timer with delta zero, disabling\n");
         }
-- 
2.20.1

The armv7m systick timer is a 24-bit decrementing, wrap-on-zero,
clear-on-write counter. Our current implementation has various
bugs and dubious workarounds in it (for instance see
https://bugs.launchpad.net/qemu/+bug/1872237).

We have an implementation of a simple decrementing counter
and we put a lot of effort into making sure it handles the
interesting corner cases (like "spend a cycle at 0 before
reloading") -- ptimer.

Rewrite the systick timer to use a ptimer rather than
a raw QEMU timer.

Unfortunately this is a migration compatibility break,
which will affect all M-profile boards.

Among other bugs, this fixes
https://bugs.launchpad.net/qemu/+bug/1872237 :
now writes to SYST_CVR when the timer is enabled correctly
do nothing; when the timer is enabled via SYST_CSR.ENABLE,
the ptimer code will (because of POLICY_NO_IMMEDIATE_RELOAD)
arrange that after one timer tick the counter is reloaded
from SYST_RVR and then counts down from there, as the
architecture requires.

Signed-off-by: Peter Maydell <peter.maydell@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-id: 20201015151829.14656-3-peter.maydell@linaro.org
---
 include/hw/timer/armv7m_systick.h |   3 +-
 hw/timer/armv7m_systick.c         | 124 +++++++++++++-----------------
 2 files changed, 54 insertions(+), 73 deletions(-)

diff --git a/include/hw/timer/armv7m_systick.h b/include/hw/timer/armv7m_systick.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/timer/armv7m_systick.h
+++ b/include/hw/timer/armv7m_systick.h
@@ -XXX,XX +XXX,XX @@
 
 #include "hw/sysbus.h"
 #include "qom/object.h"
+#include "hw/ptimer.h"
 
 #define TYPE_SYSTICK "armv7m_systick"
 
@@ -XXX,XX +XXX,XX @@ struct SysTickState {
     uint32_t control;
     uint32_t reload;
     int64_t tick;
-    QEMUTimer *timer;
+    ptimer_state *ptimer;
     MemoryRegion iomem;
     qemu_irq irq;
 };
diff --git a/hw/timer/armv7m_systick.c b/hw/timer/armv7m_systick.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/timer/armv7m_systick.c
+++ b/hw/timer/armv7m_systick.c
@@ -XXX,XX +XXX,XX @@ static inline int64_t systick_scale(SysTickState *s)
     }
 }
 
-static void systick_reload(SysTickState *s, int reset)
-{
-    /* The Cortex-M3 Devices Generic User Guide says that "When the
-     * ENABLE bit is set to 1, the counter loads the RELOAD value from the
-     * SYST RVR register and then counts down". So, we need to check the
-     * ENABLE bit before reloading the value.
-     */
-    trace_systick_reload();
-
-    if ((s->control & SYSTICK_ENABLE) == 0) {
-        return;
-    }
-
-    if (reset) {
-        s->tick = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
-    }
-    s->tick += (s->reload + 1) * systick_scale(s);
-    timer_mod(s->timer, s->tick);
-}
-
 static void systick_timer_tick(void *opaque)
 {
     SysTickState *s = (SysTickState *)opaque;
@@ -XXX,XX +XXX,XX @@ static void systick_timer_tick(void *opaque)
         /* Tell the NVIC to pend the SysTick exception */
         qemu_irq_pulse(s->irq);
     }
-    if (s->reload == 0) {
-        s->control &= ~SYSTICK_ENABLE;
-    } else {
-        systick_reload(s, 0);
+    if (ptimer_get_limit(s->ptimer) == 0) {
+        /*
+         * Timer expiry with SYST_RVR zero disables the timer
+         * (but doesn't clear SYST_CSR.ENABLE)
+         */
+        ptimer_stop(s->ptimer);
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static MemTxResult systick_read(void *opaque, hwaddr addr, uint64_t *data,
         s->control &= ~SYSTICK_COUNTFLAG;
         break;
     case 0x4: /* SysTick Reload Value.  */
-        val = s->reload;
+        val = ptimer_get_limit(s->ptimer);
         break;
     case 0x8: /* SysTick Current Value.  */
-    {
-        int64_t t;
-
-        if ((s->control & SYSTICK_ENABLE) == 0) {
-            val = 0;
-            break;
-        }
-        t = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
-        if (t >= s->tick) {
-            val = 0;
-            break;
-        }
-        val = ((s->tick - (t + 1)) / systick_scale(s)) + 1;
-        /* The interrupt in triggered when the timer reaches zero.
-           However the counter is not reloaded until the next clock
-           tick.  This is a hack to return zero during the first tick.  */
-        if (val > s->reload) {
-            val = 0;
-        }
+        val = ptimer_get_count(s->ptimer);
         break;
-    }
     case 0xc: /* SysTick Calibration Value.  */
         val = 10000;
         break;
@@ -XXX,XX +XXX,XX @@ static MemTxResult systick_write(void *opaque, hwaddr addr,
     switch (addr) {
     case 0x0: /* SysTick Control and Status.  */
     {
-        uint32_t oldval = s->control;
+        uint32_t oldval;
 
+        ptimer_transaction_begin(s->ptimer);
+        oldval = s->control;
         s->control &= 0xfffffff8;
         s->control |= value & 7;
+
         if ((oldval ^ value) & SYSTICK_ENABLE) {
-            int64_t now = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL);
             if (value & SYSTICK_ENABLE) {
-                if (s->tick) {
-                    s->tick += now;
-                    timer_mod(s->timer, s->tick);
-                } else {
-                    systick_reload(s, 1);
-                }
+                /*
+                 * Always reload the period in case board code has
+                 * changed system_clock_scale. If we ever replace that
+                 * global with a more sensible API then we might be able
+                 * to set the period only when it actually changes.
+                 */
+                ptimer_set_period(s->ptimer, systick_scale(s));
+                ptimer_run(s->ptimer, 0);
             } else {
-                timer_del(s->timer);
-                s->tick -= now;
-                if (s->tick < 0) {
-                    s->tick = 0;
-                }
+                ptimer_stop(s->ptimer);
             }
         } else if ((oldval ^ value) & SYSTICK_CLKSOURCE) {
-            /* This is a hack. Force the timer to be reloaded
-               when the reference clock is changed.  */
-            systick_reload(s, 1);
+            ptimer_set_period(s->ptimer, systick_scale(s));
         }
+        ptimer_transaction_commit(s->ptimer);
         break;
     }
     case 0x4: /* SysTick Reload Value.  */
-        s->reload = value;
+        ptimer_transaction_begin(s->ptimer);
+        ptimer_set_limit(s->ptimer, value & 0xffffff, 0);
+        ptimer_transaction_commit(s->ptimer);
         break;
-    case 0x8: /* SysTick Current Value.  Writes reload the timer.  */
-        systick_reload(s, 1);
+    case 0x8: /* SysTick Current Value. */
+        /*
+         * Writing any value clears SYST_CVR to zero and clears
+         * SYST_CSR.COUNTFLAG. The counter will then reload from SYST_RVR
+         * on the next clock edge unless SYST_RVR is zero.
+         */
+        ptimer_transaction_begin(s->ptimer);
+        if (ptimer_get_limit(s->ptimer) == 0) {
+            ptimer_stop(s->ptimer);
+        }
+        ptimer_set_count(s->ptimer, 0);
         s->control &= ~SYSTICK_COUNTFLAG;
+        ptimer_transaction_commit(s->ptimer);
         break;
     default:
         qemu_log_mask(LOG_GUEST_ERROR,
@@ -XXX,XX +XXX,XX @@ static void systick_reset(DeviceState *dev)
      */
     assert(system_clock_scale != 0);
 
+    ptimer_transaction_begin(s->ptimer);
     s->control = 0;
-    s->reload = 0;
-    s->tick = 0;
-    timer_del(s->timer);
+    ptimer_stop(s->ptimer);
+    ptimer_set_count(s->ptimer, 0);
+    ptimer_set_limit(s->ptimer, 0, 0);
+    ptimer_set_period(s->ptimer, systick_scale(s));
+    ptimer_transaction_commit(s->ptimer);
 }
 
 static void systick_instance_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void systick_instance_init(Object *obj)
 static void systick_realize(DeviceState *dev, Error **errp)
 {
     SysTickState *s = SYSTICK(dev);
-    s->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL, systick_timer_tick, s);
+    s->ptimer = ptimer_init(systick_timer_tick, s,
+                            PTIMER_POLICY_WRAP_AFTER_ONE_PERIOD |
+                            PTIMER_POLICY_NO_COUNTER_ROUND_DOWN |
+                            PTIMER_POLICY_NO_IMMEDIATE_RELOAD |
+                            PTIMER_POLICY_TRIGGER_ONLY_ON_DECREMENT);
 }
 
 static const VMStateDescription vmstate_systick = {
     .name = "armv7m_systick",
-    .version_id = 1,
-    .minimum_version_id = 1,
+    .version_id = 2,
+    .minimum_version_id = 2,
     .fields = (VMStateField[]) {
         VMSTATE_UINT32(control, SysTickState),
-        VMSTATE_UINT32(reload, SysTickState),
         VMSTATE_INT64(tick, SysTickState),
-        VMSTATE_TIMER_PTR(timer, SysTickState),
+        VMSTATE_PTIMER(ptimer, SysTickState),
         VMSTATE_END_OF_LIST()
     }
 };
-- 
2.20.1