Series comparison

-[PULL 00/30] riscv-to-apply queue
+[PULL v2 00/64] riscv-to-apply queue
-The following changes since commit 9435a8b3dd35f1f926f1b9127e8a906217a5518a:
+The following changes since commit 64f0ad8ad8e13257e7c912df470d46784b55c3fd:
-  Merge remote-tracking branch 'remotes/kraxel/tags/sirius/ipxe-20200908-pull-request' into staging (2020-09-08 21:21:13 +0100)
+  Merge remote-tracking branch 'remotes/armbru/tags/pull-error-2020-07-02' into staging (2020-07-02 15:54:09 +0100)
 are available in the Git repository at:
-  git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200910
+  git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200702-1
-for you to fetch changes up to 7595a65818ea9b49c36650a8c217a1ef9bd6e62a:
+for you to fetch changes up to 6bf91617f47c74efc99ef48236765d9677c0898e:
-  hw/riscv: Sort the Kconfig options in alphabetical order (2020-09-09 15:54:19 -0700)
+  target/riscv: configure and turn on vector extension from command line (2020-07-02 09:19:34 -0700)
 ----------------------------------------------------------------
-This PR includes multiple fixes and features for RISC-V:
+This PR contains two patches to improve PLIC support in QEMU.
- - Fixes a bug in printing trap causes
- - Allows 16-bit writes to the SiFive test device. This fixes the
+It also contains one patch that fixes CLINT accesses for RISC-V. This
-   failure to reboot the RISC-V virt machine
+fixes a regression for most RISC-V boards.
- - Support for the Microchip PolarFire SoC and Icicle Kit
- - A reafactor of RISC-V code out of hw/riscv
+The rest of the PR is adding support for the v0.7.1 RISC-V vector
 extensions. This is experimental support as the vector extensions are
 still in a draft state.
 This is a v2 pull request that has fixed the building on big endian
 machines failure.
 ----------------------------------------------------------------
-Bin Meng (28):
+Alistair Francis (1):
-      target/riscv: cpu: Add a new 'resetvec' property
+      hw/riscv: Allow 64 bit access to SiFive CLINT
       hw/riscv: hart: Add a new 'resetvec' property
       target/riscv: cpu: Set reset vector based on the configured property value
       hw/riscv: Initial support for Microchip PolarFire SoC Icicle Kit board
       hw/char: Add Microchip PolarFire SoC MMUART emulation
       hw/riscv: microchip_pfsoc: Connect 5 MMUARTs
       hw/sd: Add Cadence SDHCI emulation
       hw/riscv: microchip_pfsoc: Connect a Cadence SDHCI controller and an SD card
       hw/dma: Add SiFive platform DMA controller emulation
       hw/riscv: microchip_pfsoc: Connect a DMA controller
       hw/net: cadence_gem: Add a new 'phy-addr' property
       hw/arm: xlnx: Set all boards' GEM 'phy-addr' property value to 23
       hw/riscv: microchip_pfsoc: Connect 2 Cadence GEMs
       hw/riscv: microchip_pfsoc: Hook GPIO controllers
       hw/riscv: clint: Avoid using hard-coded timebase frequency
       hw/riscv: sifive_u: Connect a DMA controller
       hw/riscv: Move sifive_e_prci model to hw/misc
       hw/riscv: Move sifive_u_prci model to hw/misc
       hw/riscv: Move sifive_u_otp model to hw/misc
       hw/riscv: Move sifive_gpio model to hw/gpio
       hw/riscv: Move sifive_clint model to hw/intc
       hw/riscv: Move sifive_plic model to hw/intc
       hw/riscv: Move riscv_htif model to hw/char
       hw/riscv: Move sifive_uart model to hw/char
       hw/riscv: Move sifive_test model to hw/misc
       hw/riscv: Always build riscv_hart.c
       hw/riscv: Drop CONFIG_SIFIVE
       hw/riscv: Sort the Kconfig options in alphabetical order
-Nathan Chancellor (1):
+Jessica Clarke (2):
-      riscv: sifive_test: Allow 16-bit writes to memory region
+      riscv: plic: Honour source priorities
       riscv: plic: Add a couple of mising sifive_plic_update calls
-Yifei Jiang (1):
+LIU Zhiwei (61):
-      target/riscv: Fix bug in getting trap cause name for trace_riscv_trap
+      target/riscv: add vector extension field in CPURISCVState
       target/riscv: implementation-defined constant parameters
       target/riscv: support vector extension csr
       target/riscv: add vector configure instruction
       target/riscv: add an internals.h header
       target/riscv: add vector stride load and store instructions
       target/riscv: add vector index load and store instructions
       target/riscv: add fault-only-first unit stride load
       target/riscv: add vector amo operations
       target/riscv: vector single-width integer add and subtract
       target/riscv: vector widening integer add and subtract
       target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
       target/riscv: vector bitwise logical instructions
       target/riscv: vector single-width bit shift instructions
       target/riscv: vector narrowing integer right shift instructions
       target/riscv: vector integer comparison instructions
       target/riscv: vector integer min/max instructions
       target/riscv: vector single-width integer multiply instructions
       target/riscv: vector integer divide instructions
       target/riscv: vector widening integer multiply instructions
       target/riscv: vector single-width integer multiply-add instructions
       target/riscv: vector widening integer multiply-add instructions
       target/riscv: vector integer merge and move instructions
       target/riscv: vector single-width saturating add and subtract
       target/riscv: vector single-width averaging add and subtract
       target/riscv: vector single-width fractional multiply with rounding and saturation
       target/riscv: vector widening saturating scaled multiply-add
       target/riscv: vector single-width scaling shift instructions
       target/riscv: vector narrowing fixed-point clip instructions
       target/riscv: vector single-width floating-point add/subtract instructions
       target/riscv: vector widening floating-point add/subtract instructions
       target/riscv: vector single-width floating-point multiply/divide instructions
       target/riscv: vector widening floating-point multiply
       target/riscv: vector single-width floating-point fused multiply-add instructions
       target/riscv: vector widening floating-point fused multiply-add instructions
       target/riscv: vector floating-point square-root instruction
       target/riscv: vector floating-point min/max instructions
       target/riscv: vector floating-point sign-injection instructions
       target/riscv: vector floating-point compare instructions
       target/riscv: vector floating-point classify instructions
       target/riscv: vector floating-point merge instructions
       target/riscv: vector floating-point/integer type-convert instructions
       target/riscv: widening floating-point/integer type-convert instructions
       target/riscv: narrowing floating-point/integer type-convert instructions
       target/riscv: vector single-width integer reduction instructions
       target/riscv: vector wideing integer reduction instructions
       target/riscv: vector single-width floating-point reduction instructions
       target/riscv: vector widening floating-point reduction instructions
       target/riscv: vector mask-register logical instructions
       target/riscv: vector mask population count vmpopc
       target/riscv: vmfirst find-first-set mask bit
       target/riscv: set-X-first mask bit
       target/riscv: vector iota instruction
       target/riscv: vector element index instruction
       target/riscv: integer extract instruction
       target/riscv: integer scalar move instruction
       target/riscv: floating-point scalar move instructions
       target/riscv: vector slide instructions
       target/riscv: vector register gather instruction
       target/riscv: vector compress instruction
       target/riscv: configure and turn on vector extension from command line
- default-configs/riscv64-softmmu.mak         |   1 +
+ target/riscv/cpu.h                      |   82 +-
- {include/hw/riscv => hw/intc}/sifive_plic.h |   0
+ target/riscv/cpu_bits.h                 |   15 +
- hw/riscv/trace.h                            |   1 -
+ target/riscv/helper.h                   | 1069 +++++++
- include/hw/char/mchp_pfsoc_mmuart.h         |  61 ++++
+ target/riscv/internals.h                |   41 +
- include/hw/{riscv => char}/riscv_htif.h     |   0
+ target/riscv/insn32-64.decode           |   11 +
- include/hw/{riscv => char}/sifive_uart.h    |   0
+ target/riscv/insn32.decode              |  372 +++
- include/hw/dma/sifive_pdma.h                |  57 ++++
+ hw/riscv/sifive_clint.c                 |    2 +-
- include/hw/{riscv => gpio}/sifive_gpio.h    |   0
+ hw/riscv/sifive_plic.c                  |   20 +-
- include/hw/{riscv => intc}/sifive_clint.h   |   4 +-
+ target/riscv/cpu.c                      |   50 +
- include/hw/{riscv => misc}/sifive_e_prci.h  |   0
+ target/riscv/csr.c                      |   75 +-
- include/hw/{riscv => misc}/sifive_test.h    |   0
+ target/riscv/fpu_helper.c               |   33 +-
- include/hw/{riscv => misc}/sifive_u_otp.h   |   0
+ target/riscv/insn_trans/trans_rvv.inc.c | 2888 ++++++++++++++++++
- include/hw/{riscv => misc}/sifive_u_prci.h  |   0
+ target/riscv/translate.c                |   27 +-
- include/hw/net/cadence_gem.h                |   2 +
+ target/riscv/vector_helper.c            | 4899 +++++++++++++++++++++++++++++++
- include/hw/riscv/microchip_pfsoc.h          | 133 +++++++++
+ target/riscv/Makefile.objs              |    2 +-
- include/hw/riscv/riscv_hart.h               |   1 +
+files changed, 9535 insertions(+), 51 deletions(-)
- include/hw/riscv/sifive_e.h                 |   2 +-
+ create mode 100644 target/riscv/internals.h
- include/hw/riscv/sifive_u.h                 |  17 +-
+ create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
- include/hw/sd/cadence_sdhci.h               |  47 +++
+ create mode 100644 target/riscv/vector_helper.c
  target/riscv/cpu.h                          |   8 +-
  hw/arm/xilinx_zynq.c                        |   1 +
  hw/arm/xlnx-versal.c                        |   1 +
  hw/arm/xlnx-zynqmp.c                        |   2 +
  hw/char/mchp_pfsoc_mmuart.c                 |  86 ++++++
  hw/{riscv => char}/riscv_htif.c             |   2 +-
  hw/{riscv => char}/sifive_uart.c            |   2 +-
  hw/dma/sifive_pdma.c                        | 313 ++++++++++++++++++++
  hw/{riscv => gpio}/sifive_gpio.c            |   2 +-
  hw/{riscv => intc}/sifive_clint.c           |  28 +-
  hw/{riscv => intc}/sifive_plic.c            |   2 +-
  hw/{riscv => misc}/sifive_e_prci.c          |   2 +-
  hw/{riscv => misc}/sifive_test.c            |   4 +-
  hw/{riscv => misc}/sifive_u_otp.c           |   2 +-
  hw/{riscv => misc}/sifive_u_prci.c          |   2 +-
  hw/net/cadence_gem.c                        |   7 +-
  hw/riscv/microchip_pfsoc.c                  | 437 ++++++++++++++++++++++++++++
  hw/riscv/opentitan.c                        |   1 +
  hw/riscv/riscv_hart.c                       |   3 +
  hw/riscv/sifive_e.c                         |  12 +-
  hw/riscv/sifive_u.c                         |  41 ++-
  hw/riscv/spike.c                            |   7 +-
  hw/riscv/virt.c                             |   9 +-
  hw/sd/cadence_sdhci.c                       | 193 ++++++++++++
  target/riscv/cpu.c                          |  19 +-
  target/riscv/cpu_helper.c                   |   8 +-
  target/riscv/csr.c                          |   4 +-
  MAINTAINERS                                 |   9 +
  hw/char/Kconfig                             |   9 +
  hw/char/meson.build                         |   3 +
  hw/dma/Kconfig                              |   3 +
  hw/dma/meson.build                          |   1 +
  hw/gpio/Kconfig                             |   3 +
  hw/gpio/meson.build                         |   1 +
  hw/gpio/trace-events                        |   6 +
  hw/intc/Kconfig                             |   6 +
  hw/intc/meson.build                         |   2 +
  hw/misc/Kconfig                             |  12 +
  hw/misc/meson.build                         |   6 +
  hw/riscv/Kconfig                            |  70 +++--
  hw/riscv/meson.build                        |  12 +-
  hw/riscv/trace-events                       |   7 -
  hw/sd/Kconfig                               |   4 +
  hw/sd/meson.build                           |   1 +
  meson.build                                 |   1 -
 files changed, 1575 insertions(+), 105 deletions(-)
  rename {include/hw/riscv => hw/intc}/sifive_plic.h (100%)
  delete mode 100644 hw/riscv/trace.h
  create mode 100644 include/hw/char/mchp_pfsoc_mmuart.h
  rename include/hw/{riscv => char}/riscv_htif.h (100%)
  rename include/hw/{riscv => char}/sifive_uart.h (100%)
  create mode 100644 include/hw/dma/sifive_pdma.h
  rename include/hw/{riscv => gpio}/sifive_gpio.h (100%)
  rename include/hw/{riscv => intc}/sifive_clint.h (92%)
  rename include/hw/{riscv => misc}/sifive_e_prci.h (100%)
  rename include/hw/{riscv => misc}/sifive_test.h (100%)
  rename include/hw/{riscv => misc}/sifive_u_otp.h (100%)
  rename include/hw/{riscv => misc}/sifive_u_prci.h (100%)
  create mode 100644 include/hw/riscv/microchip_pfsoc.h
  create mode 100644 include/hw/sd/cadence_sdhci.h
  create mode 100644 hw/char/mchp_pfsoc_mmuart.c
  rename hw/{riscv => char}/riscv_htif.c (99%)
  rename hw/{riscv => char}/sifive_uart.c (99%)
  create mode 100644 hw/dma/sifive_pdma.c
  rename hw/{riscv => gpio}/sifive_gpio.c (99%)
  rename hw/{riscv => intc}/sifive_clint.c (90%)
  rename hw/{riscv => intc}/sifive_plic.c (99%)
  rename hw/{riscv => misc}/sifive_e_prci.c (99%)
  rename hw/{riscv => misc}/sifive_test.c (97%)
  rename hw/{riscv => misc}/sifive_u_otp.c (99%)
  rename hw/{riscv => misc}/sifive_u_prci.c (99%)
  create mode 100644 hw/riscv/microchip_pfsoc.c
  create mode 100644 hw/sd/cadence_sdhci.c
  delete mode 100644 hw/riscv/trace-events

-New patch
+[PULL v2 01/64] riscv: plic: Honour source priorities
+From: Jessica Clarke <jrtc27@jrtc27.com>
+The source priorities can be used to order sources with respect to other
+sources, not just as a way to enable/disable them based off a threshold.
+We must therefore always claim the highest-priority source, rather than
+the first source we find.
+Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200618202343.20455-1-jrtc27@jrtc27.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ hw/riscv/sifive_plic.c | 17 ++++++++++++-----
+file changed, 12 insertions(+), 5 deletions(-)
+diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
+index XXXXXXX..XXXXXXX 100644
+--- a/hw/riscv/sifive_plic.c
++++ b/hw/riscv/sifive_plic.c
+@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
+ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
+ {
+     int i, j;
++    uint32_t max_irq = 0;
++    uint32_t max_prio = plic->target_priority[addrid];
++
+     for (i = 0; i < plic->bitfield_words; i++) {
+         uint32_t pending_enabled_not_claimed =
+             (plic->pending[i] & ~plic->claimed[i]) &
+@@ -XXX,XX +XXX,XX @@ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
+             int irq = (i << 5) + j;
+             uint32_t prio = plic->source_priority[irq];
+             int enabled = pending_enabled_not_claimed & (1 << j);
+-            if (enabled && prio > plic->target_priority[addrid]) {
+-                sifive_plic_set_pending(plic, irq, false);
+-                sifive_plic_set_claimed(plic, irq, true);
+-                return irq;
++            if (enabled && prio > max_prio) {
++                max_irq = irq;
++                max_prio = prio;
+             }
+         }
+     }
+-    return 0;
++
++    if (max_irq) {
++        sifive_plic_set_pending(plic, max_irq, false);
++        sifive_plic_set_claimed(plic, max_irq, true);
++    }
++    return max_irq;
+ }
+ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+--
+.27.0

-[PULL 24/30] hw/riscv: Move sifive_plic model to hw/intc
+[PULL v2 02/64] riscv: plic: Add a couple of mising sifive_plic_update calls
-From: Bin Meng <bin.meng@windriver.com>
+From: Jessica Clarke <jrtc27@jrtc27.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Claiming an interrupt and changing the source priority both potentially
-should only contain the RISC-V SoC / machine codes plus generic
+affect whether an interrupt is pending, thus we must re-compute xEIP.
-codes. Let's move sifive_plic model to hw/intc directory.
+Note that we don't put the sifive_plic_update inside sifive_plic_claim
 so that the logging of a claim (and the resulting IRQ) happens before
 the state update, making the causal effect clear, and that we drop the
 explicit call to sifive_plic_print_state when claiming since
 sifive_plic_update already does that automatically at the end for us.
-Signed-off-by: Bin Meng <bin.meng@windriver.com>
+This can result in both spurious interrupt storms if you fail to
 complete an IRQ before enabling interrupts (and no other actions occur
 that result in a call to sifive_plic_update), but also more importantly
 lost interrupts if a disabled interrupt is pending and then becomes
 enabled.
 Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-7-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200618210649.22451-1-jrtc27@jrtc27.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- {include/hw/riscv => hw/intc}/sifive_plic.h | 0
+ hw/riscv/sifive_plic.c | 3 ++-
- hw/{riscv => intc}/sifive_plic.c            | 2 +-
+file changed, 2 insertions(+), 1 deletion(-)
  hw/riscv/microchip_pfsoc.c                  | 2 +-
  hw/riscv/sifive_e.c                         | 2 +-
  hw/riscv/sifive_u.c                         | 2 +-
  hw/riscv/virt.c                             | 2 +-
  hw/intc/Kconfig                             | 3 +++
  hw/intc/meson.build                         | 1 +
  hw/riscv/Kconfig                            | 5 +++++
  hw/riscv/meson.build                        | 1 -
 files changed, 14 insertions(+), 6 deletions(-)
  rename {include/hw/riscv => hw/intc}/sifive_plic.h (100%)
  rename hw/{riscv => intc}/sifive_plic.c (99%)
-diff --git a/include/hw/riscv/sifive_plic.h b/hw/intc/sifive_plic.h
+diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
 similarity index 100%
 rename from include/hw/riscv/sifive_plic.h
 rename to hw/intc/sifive_plic.h
 diff --git a/hw/riscv/sifive_plic.c b/hw/intc/sifive_plic.c
 similarity index 99%
 rename from hw/riscv/sifive_plic.c
 rename to hw/intc/sifive_plic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_plic.c
-+++ b/hw/intc/sifive_plic.c
++++ b/hw/riscv/sifive_plic.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
- #include "hw/pci/msi.h"
+                     plic->addr_config[addrid].hartid,
- #include "hw/boards.h"
+                     mode_to_char(plic->addr_config[addrid].mode),
- #include "hw/qdev-properties.h"
+                     value);
-+#include "hw/intc/sifive_plic.h"
+-                sifive_plic_print_state(plic);
- #include "target/riscv/cpu.h"
+             }
- #include "sysemu/sysemu.h"
++            sifive_plic_update(plic);
--#include "hw/riscv/sifive_plic.h"
+             return value;
+         }
- #define RISCV_DEBUG_PLIC 0
+     }
+@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
-diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
+             qemu_log("plic: write priority: irq=%d priority=%d\n",
-index XXXXXXX..XXXXXXX 100644
+                 irq, plic->source_priority[irq]);
---- a/hw/riscv/microchip_pfsoc.c
+         }
-+++ b/hw/riscv/microchip_pfsoc.c
++        sifive_plic_update(plic);
-@@ -XXX,XX +XXX,XX @@
+         return;
- #include "hw/misc/unimp.h"
+     } else if (addr >= plic->pending_base && /* 1 bit per source */
- #include "hw/riscv/boot.h"
+                addr < plic->pending_base + (plic->num_sources >> 3))
  #include "hw/riscv/riscv_hart.h"
 -#include "hw/riscv/sifive_plic.h"
  #include "hw/riscv/microchip_pfsoc.h"
  #include "hw/intc/sifive_clint.h"
 +#include "hw/intc/sifive_plic.h"
  #include "sysemu/sysemu.h"
  /*
 diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_e.c
 +++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/misc/unimp.h"
  #include "target/riscv/cpu.h"
  #include "hw/riscv/riscv_hart.h"
 -#include "hw/riscv/sifive_plic.h"
  #include "hw/riscv/sifive_uart.h"
  #include "hw/riscv/sifive_e.h"
  #include "hw/riscv/boot.h"
  #include "hw/intc/sifive_clint.h"
 +#include "hw/intc/sifive_plic.h"
  #include "hw/misc/sifive_e_prci.h"
  #include "chardev/char.h"
  #include "sysemu/arch_init.h"
 diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_u.c
 +++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/misc/unimp.h"
  #include "target/riscv/cpu.h"
  #include "hw/riscv/riscv_hart.h"
 -#include "hw/riscv/sifive_plic.h"
  #include "hw/riscv/sifive_uart.h"
  #include "hw/riscv/sifive_u.h"
  #include "hw/riscv/boot.h"
  #include "hw/intc/sifive_clint.h"
 +#include "hw/intc/sifive_plic.h"
  #include "chardev/char.h"
  #include "net/eth.h"
  #include "sysemu/arch_init.h"
 diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/virt.c
 +++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/char/serial.h"
  #include "target/riscv/cpu.h"
  #include "hw/riscv/riscv_hart.h"
 -#include "hw/riscv/sifive_plic.h"
  #include "hw/riscv/sifive_test.h"
  #include "hw/riscv/virt.h"
  #include "hw/riscv/boot.h"
  #include "hw/riscv/numa.h"
  #include "hw/intc/sifive_clint.h"
 +#include "hw/intc/sifive_plic.h"
  #include "chardev/char.h"
  #include "sysemu/arch_init.h"
  #include "sysemu/device_tree.h"
 diff --git a/hw/intc/Kconfig b/hw/intc/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/Kconfig
 +++ b/hw/intc/Kconfig
@@ -XXX,XX +XXX,XX @@ config LOONGSON_LIOINTC
  config SIFIVE_CLINT
      bool
 +
 +config SIFIVE_PLIC
 +    bool
 diff --git a/hw/intc/meson.build b/hw/intc/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/meson.build
 +++ b/hw/intc/meson.build
@@ -XXX,XX +XXX,XX @@ specific_ss.add(when: 'CONFIG_S390_FLIC', if_true: files('s390_flic.c'))
  specific_ss.add(when: 'CONFIG_S390_FLIC_KVM', if_true: files('s390_flic_kvm.c'))
  specific_ss.add(when: 'CONFIG_SH4', if_true: files('sh_intc.c'))
  specific_ss.add(when: 'CONFIG_SIFIVE_CLINT', if_true: files('sifive_clint.c'))
 +specific_ss.add(when: 'CONFIG_SIFIVE_PLIC', if_true: files('sifive_plic.c'))
  specific_ss.add(when: 'CONFIG_XICS', if_true: files('xics.c'))
  specific_ss.add(when: 'CONFIG_XICS_KVM', if_true: files('xics_kvm.c'))
  specific_ss.add(when: 'CONFIG_XICS_SPAPR', if_true: files('xics_spapr.c'))
 diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/Kconfig
 +++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
      select SIFIVE
      select SIFIVE_CLINT
      select SIFIVE_GPIO
 +    select SIFIVE_PLIC
      select SIFIVE_E_PRCI
      select UNIMP
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
      select SIFIVE_CLINT
      select SIFIVE_GPIO
      select SIFIVE_PDMA
 +    select SIFIVE_PLIC
      select SIFIVE_U_OTP
      select SIFIVE_U_PRCI
      select UNIMP
@@ -XXX,XX +XXX,XX @@ config SPIKE
      select HTIF
      select SIFIVE
      select SIFIVE_CLINT
 +    select SIFIVE_PLIC
  config OPENTITAN
      bool
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
      select PFLASH_CFI01
      select SIFIVE
      select SIFIVE_CLINT
 +    select SIFIVE_PLIC
  config MICROCHIP_PFSOC
      bool
@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
      select UNIMP
      select MCHP_PFSOC_MMUART
      select SIFIVE_PDMA
 +    select SIFIVE_PLIC
      select CADENCE_SDHCI
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/meson.build
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files('numa.c'))
  riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
  riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
  riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 --
-.28.0
+.27.0

-[PULL 02/30] riscv: sifive_test: Allow 16-bit writes to memory region
+[PULL v2 03/64] hw/riscv: Allow 64 bit access to SiFive CLINT
-From: Nathan Chancellor <natechancellor@gmail.com>
+Commit 5d971f9e672507210e77d020d89e0e89165c8fc9
 "memory: Revert "memory: accept mismatching sizes in
 memory_region_access_valid"" broke most RISC-V boards as they do 64 bit
 accesses to the CLINT and QEMU would trigger a fault. Fix this failure
 by allowing 8 byte accesses.
-When shutting down the machine running a mainline Linux kernel, the
-following error happens:
-$ build/riscv64-softmmu/qemu-system-riscv64 -bios default -M virt \
-    -display none -initrd rootfs.cpio -kernel Image -m 512m \
-    -nodefaults -serial mon:stdio
-...
-Requesting system poweroff
-[    4.999630] reboot: Power down
-sbi_trap_error: hart0: trap handler failed (error -2)
-sbi_trap_error: hart0: mcause=0x0000000000000007 mtval=0x0000000000100000
-sbi_trap_error: hart0: mepc=0x000000008000d4cc mstatus=0x0000000000001822
-sbi_trap_error: hart0: ra=0x000000008000999e sp=0x0000000080015c78
-sbi_trap_error: hart0: gp=0xffffffe000e76610 tp=0xffffffe0081b89c0
-sbi_trap_error: hart0: s0=0x0000000080015c88 s1=0x0000000000000040
-sbi_trap_error: hart0: a0=0x0000000000000000 a1=0x0000000080004024
-sbi_trap_error: hart0: a2=0x0000000080004024 a3=0x0000000080004024
-sbi_trap_error: hart0: a4=0x0000000000100000 a5=0x0000000000005555
-sbi_trap_error: hart0: a6=0x0000000000004024 a7=0x0000000080011158
-sbi_trap_error: hart0: s2=0x0000000000000000 s3=0x0000000080016000
-sbi_trap_error: hart0: s4=0x0000000000000000 s5=0x0000000000000000
-sbi_trap_error: hart0: s6=0x0000000000000001 s7=0x0000000000000000
-sbi_trap_error: hart0: s8=0x0000000000000000 s9=0x0000000000000000
-sbi_trap_error: hart0: s10=0x0000000000000000 s11=0x0000000000000008
-sbi_trap_error: hart0: t0=0x0000000000000000 t1=0x0000000000000000
-sbi_trap_error: hart0: t2=0x0000000000000000 t3=0x0000000000000000
-sbi_trap_error: hart0: t4=0x0000000000000000 t5=0x0000000000000000
-sbi_trap_error: hart0: t6=0x0000000000000000
-The kernel does a 16-bit write when powering off the machine, which
-was allowed before commit 5d971f9e67 ("memory: Revert "memory: accept
-mismatching sizes in memory_region_access_valid""). Make min_access_size
-match reality so that the machine can shut down properly now.
-Cc: qemu-stable@nongnu.org
-Fixes: 88a07990fa ("SiFive RISC-V Test Finisher")
-Fixes: 5d971f9e67 ("memory: Revert "memory: accept mismatching sizes in memory_region_access_valid"")
-Signed-off-by: Nathan Chancellor <natechancellor@gmail.com>
-Acked-by: Michael S. Tsirkin <mst@redhat.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <20200901055822.2721209-1-natechancellor@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: LIU Zhiwei<zhiwei_liu@c-sky.com>
+Message-Id: <122b78825b077e4dfd39b444d3a46fe894a7804c.1593547870.git.alistair.francis@wdc.com>
 ---
- hw/riscv/sifive_test.c | 2 +-
+ hw/riscv/sifive_clint.c | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/hw/riscv/sifive_test.c b/hw/riscv/sifive_test.c
+diff --git a/hw/riscv/sifive_clint.c b/hw/riscv/sifive_clint.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_test.c
+--- a/hw/riscv/sifive_clint.c
-+++ b/hw/riscv/sifive_test.c
++++ b/hw/riscv/sifive_clint.c
-@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_test_ops = {
+@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_clint_ops = {
-     .write = sifive_test_write,
+     .endianness = DEVICE_LITTLE_ENDIAN,
      .endianness = DEVICE_NATIVE_ENDIAN,
      .valid = {
--        .min_access_size = 4,
+         .min_access_size = 4,
-+        .min_access_size = 2,
+-        .max_access_size = 4
-         .max_access_size = 4
++        .max_access_size = 8
      }
  };
 --
-.28.0
+.27.0

-[PULL 05/30] target/riscv: cpu: Set reset vector based on the configured property value
+[PULL v2 04/64] target/riscv: add vector extension field in CPURISCVState
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Now that we have the newly introduced 'resetvec' property in the
+The 32 vector registers will be viewed as a continuous memory block.
-RISC-V CPU and HART, instead of hard-coding the reset vector addr
+It avoids the convension between element index and (regno, offset).
-in the CPU's instance_init(), move that to riscv_cpu_realize()
+Thus elements can be directly accessed by offset from the first vector
-based on the configured property value from the RISC-V machines.
+base address.
-Signed-off-by: Bin Meng <bin.meng@windriver.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Acked-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-Id: <1598924352-89526-4-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-2-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/opentitan.c | 1 +
+ target/riscv/cpu.h       | 12 ++++++++++++
- hw/riscv/sifive_e.c  | 1 +
+ target/riscv/translate.c |  3 ++-
- hw/riscv/sifive_u.c  | 2 ++
+files changed, 14 insertions(+), 1 deletion(-)
  target/riscv/cpu.c   | 7 ++-----
 files changed, 6 insertions(+), 5 deletions(-)
-diff --git a/hw/riscv/opentitan.c b/hw/riscv/opentitan.c
+diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/opentitan.c
+--- a/target/riscv/cpu.h
-+++ b/hw/riscv/opentitan.c
++++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ static void lowrisc_ibex_soc_realize(DeviceState *dev_soc, Error **errp)
+@@ -XXX,XX +XXX,XX @@
-                             &error_abort);
+ #define RVA RV('A')
-     object_property_set_int(OBJECT(&s->cpus), "num-harts", ms->smp.cpus,
+ #define RVF RV('F')
-                             &error_abort);
+ #define RVD RV('D')
-+    object_property_set_int(OBJECT(&s->cpus), "resetvec", 0x8090, &error_abort);
++#define RVV RV('V')
-     sysbus_realize(SYS_BUS_DEVICE(&s->cpus), &error_abort);
+ #define RVC RV('C')
+ #define RVS RV('S')
-     /* Boot ROM */
+ #define RVU RV('U')
-diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
+@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
  #include "pmp.h"
 +#define RV_VLEN_MAX 512
 +
  struct CPURISCVState {
      target_ulong gpr[32];
      uint64_t fpr[32]; /* assume both F and D extensions */
 +
 +    /* vector coprocessor state. */
 +    uint64_t vreg[32 * RV_VLEN_MAX / 64] QEMU_ALIGNED(16);
 +    target_ulong vxrm;
 +    target_ulong vxsat;
 +    target_ulong vl;
 +    target_ulong vstart;
 +    target_ulong vtype;
 +
      target_ulong pc;
      target_ulong load_res;
      target_ulong load_val;
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_e.c
+--- a/target/riscv/translate.c
-+++ b/hw/riscv/sifive_e.c
++++ b/target/riscv/translate.c
-@@ -XXX,XX +XXX,XX @@ static void sifive_e_soc_init(Object *obj)
+@@ -XXX,XX +XXX,XX @@
-     object_initialize_child(obj, "cpus", &s->cpus, TYPE_RISCV_HART_ARRAY);
+ #include "instmap.h"
-     object_property_set_int(OBJECT(&s->cpus), "num-harts", ms->smp.cpus,
-                             &error_abort);
+ /* global register indices */
-+    object_property_set_int(OBJECT(&s->cpus), "resetvec", 0x1004, &error_abort);
+-static TCGv cpu_gpr[32], cpu_pc;
-     object_initialize_child(obj, "riscv.sifive.e.gpio0", &s->gpio,
++static TCGv cpu_gpr[32], cpu_pc, cpu_vl;
-                             TYPE_SIFIVE_GPIO);
+ static TCGv_i64 cpu_fpr[32]; /* assume F and D extensions */
- }
+ static TCGv load_res;
-diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
+ static TCGv load_val;
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ void riscv_translate_init(void)
 --- a/hw/riscv/sifive_u.c
 +++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_instance_init(Object *obj)
      qdev_prop_set_uint32(DEVICE(&s->e_cpus), "num-harts", 1);
      qdev_prop_set_uint32(DEVICE(&s->e_cpus), "hartid-base", 0);
      qdev_prop_set_string(DEVICE(&s->e_cpus), "cpu-type", SIFIVE_E_CPU);
 +    qdev_prop_set_uint64(DEVICE(&s->e_cpus), "resetvec", 0x1004);
      object_initialize_child(obj, "u-cluster", &s->u_cluster, TYPE_CPU_CLUSTER);
      qdev_prop_set_uint32(DEVICE(&s->u_cluster), "cluster-id", 1);
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_instance_init(Object *obj)
      qdev_prop_set_uint32(DEVICE(&s->u_cpus), "num-harts", ms->smp.cpus - 1);
      qdev_prop_set_uint32(DEVICE(&s->u_cpus), "hartid-base", 1);
      qdev_prop_set_string(DEVICE(&s->u_cpus), "cpu-type", SIFIVE_U_CPU);
 +    qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", 0x1004);
      object_initialize_child(obj, "prci", &s->prci, TYPE_SIFIVE_U_PRCI);
      object_initialize_child(obj, "otp", &s->otp, TYPE_SIFIVE_U_OTP);
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static void riscv_any_cpu_init(Object *obj)
      CPURISCVState *env = &RISCV_CPU(obj)->env;
      set_misa(env, RVXLEN | RVI | RVM | RVA | RVF | RVD | RVC | RVU);
      set_priv_version(env, PRIV_VERSION_1_11_0);
 -    set_resetvec(env, DEFAULT_RSTVEC);
  }
  static void riscv_base_cpu_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void riscv_base_cpu_init(Object *obj)
      CPURISCVState *env = &RISCV_CPU(obj)->env;
      /* We set this in the realise function */
      set_misa(env, 0);
 -    set_resetvec(env, DEFAULT_RSTVEC);
  }
  static void rvxx_sifive_u_cpu_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void rvxx_sifive_u_cpu_init(Object *obj)
      CPURISCVState *env = &RISCV_CPU(obj)->env;
      set_misa(env, RVXLEN | RVI | RVM | RVA | RVF | RVD | RVC | RVS | RVU);
      set_priv_version(env, PRIV_VERSION_1_10_0);
 -    set_resetvec(env, 0x1004);
  }
  static void rvxx_sifive_e_cpu_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void rvxx_sifive_e_cpu_init(Object *obj)
      CPURISCVState *env = &RISCV_CPU(obj)->env;
      set_misa(env, RVXLEN | RVI | RVM | RVA | RVC | RVU);
      set_priv_version(env, PRIV_VERSION_1_10_0);
 -    set_resetvec(env, 0x1004);
      qdev_prop_set_bit(DEVICE(obj), "mmu", false);
  }
@@ -XXX,XX +XXX,XX @@ static void rv32_ibex_cpu_init(Object *obj)
      CPURISCVState *env = &RISCV_CPU(obj)->env;
      set_misa(env, RV32 | RVI | RVM | RVC | RVU);
      set_priv_version(env, PRIV_VERSION_1_10_0);
 -    set_resetvec(env, 0x8090);
      qdev_prop_set_bit(DEVICE(obj), "mmu", false);
  }
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
          set_feature(env, RISCV_FEATURE_PMP);
      }
-+    set_resetvec(env, cpu->cfg.resetvec);
+     cpu_pc = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, pc), "pc");
-+
++    cpu_vl = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, vl), "vl");
-     /* If misa isn't set (rv32 and rv64 machines) set it here */
+     load_res = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, load_res),
-     if (!env->misa) {
+                              "load_res");
-         /* Do some ISA extension error checking */
+     load_val = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, load_val),
 --
-.28.0
+.27.0

-[PULL 01/30] target/riscv: Fix bug in getting trap cause name for trace_riscv_trap
+[PULL v2 05/64] target/riscv: implementation-defined constant parameters
-From: Yifei Jiang <jiangyifei@huawei.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-When the cause number is equal to or greater than 23, print "(unknown)" in
+vlen is the vector register length in bits.
-trace_riscv_trap. The max valid number of riscv_excp_names is 23, so the last
+elen is the max element size in bits.
-excpetion "guest_store_page_fault" can not be printed.
+vext_spec is the vector specification version, default value is v0.7.1.
-In addition, the current check of cause is invalid for riscv_intr_names. So
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 introduce riscv_cpu_get_trap_name to get the trap cause name.
 Signed-off-by: Yifei Jiang <jiangyifei@huawei.com>
 Signed-off-by: Yipeng Yin <yinyipeng1@huawei.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <20200814035819.1214-1-jiangyifei@huawei.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-3-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h        |  1 +
+ target/riscv/cpu.h | 5 +++++
- target/riscv/cpu.c        | 11 +++++++++++
+ target/riscv/cpu.c | 7 +++++++
- target/riscv/cpu_helper.c |  4 ++--
+files changed, 12 insertions(+)
 files changed, 14 insertions(+), 2 deletions(-)
 diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.h
 +++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ extern const char * const riscv_fpr_regnames[];
+@@ -XXX,XX +XXX,XX @@ enum {
- extern const char * const riscv_excp_names[];
+ #define PRIV_VERSION_1_10_0 0x00011000
- extern const char * const riscv_intr_names[];
+ #define PRIV_VERSION_1_11_0 0x00011100
-+const char *riscv_cpu_get_trap_name(target_ulong cause, bool async);
++#define VEXT_VERSION_0_07_1 0x00000701
- void riscv_cpu_do_interrupt(CPUState *cpu);
++
- int riscv_cpu_gdb_read_register(CPUState *cpu, GByteArray *buf, int reg);
+ #define TRANSLATE_PMP_FAIL 2
- int riscv_cpu_gdb_write_register(CPUState *cpu, uint8_t *buf, int reg);
+ #define TRANSLATE_FAIL 1
  #define TRANSLATE_SUCCESS 0
@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
      target_ulong guest_phys_fault_addr;
      target_ulong priv_ver;
 +    target_ulong vext_ver;
      target_ulong misa;
      target_ulong misa_mask;
@@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
          char *priv_spec;
          char *user_spec;
 +        uint16_t vlen;
 +        uint16_t elen;
          bool mmu;
          bool pmp;
      } cfg;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ const char * const riscv_intr_names[] = {
+@@ -XXX,XX +XXX,XX @@ static void set_priv_version(CPURISCVState *env, int priv_ver)
-     "reserved"
+     env->priv_ver = priv_ver;
- };
+ }
-+const char *riscv_cpu_get_trap_name(target_ulong cause, bool async)
++static void set_vext_version(CPURISCVState *env, int vext_ver)
 +{
-+    if (async) {
++    env->vext_ver = vext_ver;
 +        return (cause < ARRAY_SIZE(riscv_intr_names)) ?
 +               riscv_intr_names[cause] : "(unknown)";
 +    } else {
 +        return (cause < ARRAY_SIZE(riscv_excp_names)) ?
 +               riscv_excp_names[cause] : "(unknown)";
 +    }
 +}
 +
- static void set_misa(CPURISCVState *env, target_ulong misa)
+ static void set_feature(CPURISCVState *env, int feature)
  {
-     env->misa_mask = env->misa = misa;
+     env->features |= (1ULL << feature);
-diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
+@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
-index XXXXXXX..XXXXXXX 100644
+     CPURISCVState *env = &cpu->env;
---- a/target/riscv/cpu_helper.c
+     RISCVCPUClass *mcc = RISCV_CPU_GET_CLASS(dev);
-+++ b/target/riscv/cpu_helper.c
+     int priv_version = PRIV_VERSION_1_11_0;
-@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
++    int vext_version = VEXT_VERSION_0_07_1;
-         }
+     target_ulong target_misa = 0;
      Error *local_err = NULL;
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
      }
--    trace_riscv_trap(env->mhartid, async, cause, env->pc, tval, cause < 23 ?
+     set_priv_version(env, priv_version);
--        (async ? riscv_intr_names : riscv_excp_names)[cause] : "(unknown)");
++    set_vext_version(env, vext_version);
-+    trace_riscv_trap(env->mhartid, async, cause, env->pc, tval,
-+        riscv_cpu_get_trap_name(cause, async));
+     if (cpu->cfg.mmu) {
+         set_feature(env, RISCV_FEATURE_MMU);
      if (env->priv <= PRV_S &&
              cause < TARGET_LONG_BITS && ((deleg >> cause) & 1)) {
 --
-.28.0
+.27.0

-[PULL 17/30] hw/riscv: clint: Avoid using hard-coded timebase frequency
+[PULL v2 06/64] target/riscv: support vector extension csr
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-At present the CLINT timestamp is using a hard-coded timebase
+The v0.7.1 specification does not define vector status within mstatus.
-frequency value SIFIVE_CLINT_TIMEBASE_FREQ. This might not be
+A future revision will define the privileged portion of the vector status.
 true for all boards.
-Add a new 'timebase-freq' property to the CLINT device, and
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 update various functions to accept this as a parameter.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1598924352-89526-16-git-send-email-bmeng.cn@gmail.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-4-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/sifive_clint.h |  4 +++-
+ target/riscv/cpu_bits.h | 15 +++++++++
- target/riscv/cpu.h              |  6 ++++--
+ target/riscv/csr.c      | 75 ++++++++++++++++++++++++++++++++++++++++-
- hw/riscv/microchip_pfsoc.c      |  6 +++++-
+files changed, 89 insertions(+), 1 deletion(-)
  hw/riscv/sifive_clint.c         | 26 +++++++++++++++-----------
  hw/riscv/sifive_e.c             |  3 ++-
  hw/riscv/sifive_u.c             |  3 ++-
  hw/riscv/spike.c                |  3 ++-
  hw/riscv/virt.c                 |  3 ++-
  target/riscv/cpu_helper.c       |  4 +++-
  target/riscv/csr.c              |  4 ++--
 files changed, 40 insertions(+), 22 deletions(-)
-diff --git a/include/hw/riscv/sifive_clint.h b/include/hw/riscv/sifive_clint.h
+diff --git a/target/riscv/cpu_bits.h b/target/riscv/cpu_bits.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/sifive_clint.h
+--- a/target/riscv/cpu_bits.h
-+++ b/include/hw/riscv/sifive_clint.h
++++ b/target/riscv/cpu_bits.h
@@ -XXX,XX +XXX,XX @@ typedef struct SiFiveCLINTState {
      uint32_t timecmp_base;
      uint32_t time_base;
      uint32_t aperture_size;
 +    uint32_t timebase_freq;
  } SiFiveCLINTState;
  DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
      uint32_t hartid_base, uint32_t num_harts, uint32_t sip_base,
 -    uint32_t timecmp_base, uint32_t time_base, bool provide_rdtime);
 +    uint32_t timecmp_base, uint32_t time_base, uint32_t timebase_freq,
 +    bool provide_rdtime);
  enum {
      SIFIVE_SIP_BASE     = 0x0,
 diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.h
 +++ b/target/riscv/cpu.h
@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
      pmp_table_t pmp_state;
      /* machine specific rdtime callback */
 -    uint64_t (*rdtime_fn)(void);
 +    uint64_t (*rdtime_fn)(uint32_t);
 +    uint32_t rdtime_fn_arg;
      /* True if in debugger mode.  */
      bool debugger;
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_swap_hypervisor_regs(CPURISCVState *env);
  int riscv_cpu_claim_interrupts(RISCVCPU *cpu, uint32_t interrupts);
  uint32_t riscv_cpu_update_mip(RISCVCPU *cpu, uint32_t mask, uint32_t value);
  #define BOOL_TO_MASK(x) (-!!(x)) /* helper for riscv_cpu_update_mip value */
 -void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(void));
 +void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(uint32_t),
 +                             uint32_t arg);
  #endif
  void riscv_cpu_set_mode(CPURISCVState *env, target_ulong newpriv);
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/microchip_pfsoc.c
 +++ b/hw/riscv/microchip_pfsoc.c
 @@ -XXX,XX +XXX,XX @@
- #define BIOS_FILENAME   "hss.bin"
+ #define FSR_NXA             (FPEXC_NX << FSR_AEXC_SHIFT)
- #define RESET_VECTOR    0x20220000
+ #define FSR_AEXC            (FSR_NVA | FSR_OFA | FSR_UFA | FSR_DZA | FSR_NXA)
-+/* CLINT timebase frequency */
++/* Vector Fixed-Point round model */
-+#define CLINT_TIMEBASE_FREQ 1000000
++#define FSR_VXRM_SHIFT      9
 +#define FSR_VXRM            (0x3 << FSR_VXRM_SHIFT)
 +
- /* GEM version */
++/* Vector Fixed-Point saturation flag */
- #define GEM_REVISION    0x0107010c
++#define FSR_VXSAT_SHIFT     8
++#define FSR_VXSAT           (0x1 << FSR_VXSAT_SHIFT)
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
++
-     /* CLINT */
+ /* Control and Status Registers */
-     sifive_clint_create(memmap[MICROCHIP_PFSOC_CLINT].base,
-         memmap[MICROCHIP_PFSOC_CLINT].size, 0, ms->smp.cpus,
+ /* User Trap Setup */
 -        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
 +        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
 +        CLINT_TIMEBASE_FREQ, false);
      /* L2 cache controller */
      create_unimplemented_device("microchip.pfsoc.l2cc",
 diff --git a/hw/riscv/sifive_clint.c b/hw/riscv/sifive_clint.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_clint.c
 +++ b/hw/riscv/sifive_clint.c
 @@ -XXX,XX +XXX,XX @@
- #include "hw/riscv/sifive_clint.h"
+ #define CSR_FRM             0x002
- #include "qemu/timer.h"
+ #define CSR_FCSR            0x003
--static uint64_t cpu_riscv_read_rtc(void)
++/* User Vector CSRs */
-+static uint64_t cpu_riscv_read_rtc(uint32_t timebase_freq)
++#define CSR_VSTART          0x008
- {
++#define CSR_VXSAT           0x009
-     return muldiv64(qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL),
++#define CSR_VXRM            0x00a
--        SIFIVE_CLINT_TIMEBASE_FREQ, NANOSECONDS_PER_SECOND);
++#define CSR_VL              0xc20
-+        timebase_freq, NANOSECONDS_PER_SECOND);
++#define CSR_VTYPE           0xc21
- }
++
+ /* User Timers and Counters */
- /*
+ #define CSR_CYCLE           0xc00
-  * Called when timecmp is written to update the QEMU timer or immediately
+ #define CSR_TIME            0xc01
   * trigger timer interrupt if mtimecmp <= current timer value.
   */
 -static void sifive_clint_write_timecmp(RISCVCPU *cpu, uint64_t value)
 +static void sifive_clint_write_timecmp(RISCVCPU *cpu, uint64_t value,
 +                                       uint32_t timebase_freq)
  {
      uint64_t next;
      uint64_t diff;
 -    uint64_t rtc_r = cpu_riscv_read_rtc();
 +    uint64_t rtc_r = cpu_riscv_read_rtc(timebase_freq);
      cpu->env.timecmp = value;
      if (cpu->env.timecmp <= rtc_r) {
@@ -XXX,XX +XXX,XX @@ static void sifive_clint_write_timecmp(RISCVCPU *cpu, uint64_t value)
      diff = cpu->env.timecmp - rtc_r;
      /* back to ns (note args switched in muldiv64) */
      next = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL) +
 -        muldiv64(diff, NANOSECONDS_PER_SECOND, SIFIVE_CLINT_TIMEBASE_FREQ);
 +        muldiv64(diff, NANOSECONDS_PER_SECOND, timebase_freq);
      timer_mod(cpu->env.timer, next);
  }
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_clint_read(void *opaque, hwaddr addr, unsigned size)
          }
      } else if (addr == clint->time_base) {
          /* time_lo */
 -        return cpu_riscv_read_rtc() & 0xFFFFFFFF;
 +        return cpu_riscv_read_rtc(clint->timebase_freq) & 0xFFFFFFFF;
      } else if (addr == clint->time_base + 4) {
          /* time_hi */
 -        return (cpu_riscv_read_rtc() >> 32) & 0xFFFFFFFF;
 +        return (cpu_riscv_read_rtc(clint->timebase_freq) >> 32) & 0xFFFFFFFF;
      }
      error_report("clint: invalid read: %08x", (uint32_t)addr);
@@ -XXX,XX +XXX,XX @@ static void sifive_clint_write(void *opaque, hwaddr addr, uint64_t value,
              /* timecmp_lo */
              uint64_t timecmp_hi = env->timecmp >> 32;
              sifive_clint_write_timecmp(RISCV_CPU(cpu),
 -                timecmp_hi << 32 | (value & 0xFFFFFFFF));
 +                timecmp_hi << 32 | (value & 0xFFFFFFFF), clint->timebase_freq);
              return;
          } else if ((addr & 0x7) == 4) {
              /* timecmp_hi */
              uint64_t timecmp_lo = env->timecmp;
              sifive_clint_write_timecmp(RISCV_CPU(cpu),
 -                value << 32 | (timecmp_lo & 0xFFFFFFFF));
 +                value << 32 | (timecmp_lo & 0xFFFFFFFF), clint->timebase_freq);
          } else {
              error_report("clint: invalid timecmp write: %08x", (uint32_t)addr);
          }
@@ -XXX,XX +XXX,XX @@ static Property sifive_clint_properties[] = {
      DEFINE_PROP_UINT32("timecmp-base", SiFiveCLINTState, timecmp_base, 0),
      DEFINE_PROP_UINT32("time-base", SiFiveCLINTState, time_base, 0),
      DEFINE_PROP_UINT32("aperture-size", SiFiveCLINTState, aperture_size, 0),
 +    DEFINE_PROP_UINT32("timebase-freq", SiFiveCLINTState, timebase_freq, 0),
      DEFINE_PROP_END_OF_LIST(),
  };
@@ -XXX,XX +XXX,XX @@ type_init(sifive_clint_register_types)
   */
  DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
      uint32_t hartid_base, uint32_t num_harts, uint32_t sip_base,
 -    uint32_t timecmp_base, uint32_t time_base, bool provide_rdtime)
 +    uint32_t timecmp_base, uint32_t time_base, uint32_t timebase_freq,
 +    bool provide_rdtime)
  {
      int i;
      for (i = 0; i < num_harts; i++) {
@@ -XXX,XX +XXX,XX @@ DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
              continue;
          }
          if (provide_rdtime) {
 -            riscv_cpu_set_rdtime_fn(env, cpu_riscv_read_rtc);
 +            riscv_cpu_set_rdtime_fn(env, cpu_riscv_read_rtc, timebase_freq);
          }
          env->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL,
                                    &sifive_clint_timer_cb, cpu);
@@ -XXX,XX +XXX,XX @@ DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
      qdev_prop_set_uint32(dev, "timecmp-base", timecmp_base);
      qdev_prop_set_uint32(dev, "time-base", time_base);
      qdev_prop_set_uint32(dev, "aperture-size", size);
 +    qdev_prop_set_uint32(dev, "timebase-freq", timebase_freq);
      sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
      sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
      return dev;
 diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_e.c
 +++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@ static void sifive_e_soc_realize(DeviceState *dev, Error **errp)
          memmap[SIFIVE_E_PLIC].size);
      sifive_clint_create(memmap[SIFIVE_E_CLINT].base,
          memmap[SIFIVE_E_CLINT].size, 0, ms->smp.cpus,
 -        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
 +        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
 +        SIFIVE_CLINT_TIMEBASE_FREQ, false);
      create_unimplemented_device("riscv.sifive.e.aon",
          memmap[SIFIVE_E_AON].base, memmap[SIFIVE_E_AON].size);
      sifive_e_prci_create(memmap[SIFIVE_E_PRCI].base);
 diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_u.c
 +++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_realize(DeviceState *dev, Error **errp)
          serial_hd(1), qdev_get_gpio_in(DEVICE(s->plic), SIFIVE_U_UART1_IRQ));
      sifive_clint_create(memmap[SIFIVE_U_CLINT].base,
          memmap[SIFIVE_U_CLINT].size, 0, ms->smp.cpus,
 -        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
 +        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
 +        SIFIVE_CLINT_TIMEBASE_FREQ, false);
      if (!sysbus_realize(SYS_BUS_DEVICE(&s->prci), errp)) {
          return;
 diff --git a/hw/riscv/spike.c b/hw/riscv/spike.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/spike.c
 +++ b/hw/riscv/spike.c
@@ -XXX,XX +XXX,XX @@ static void spike_board_init(MachineState *machine)
          sifive_clint_create(
              memmap[SPIKE_CLINT].base + i * memmap[SPIKE_CLINT].size,
              memmap[SPIKE_CLINT].size, base_hartid, hart_count,
 -            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
 +            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
 +            SIFIVE_CLINT_TIMEBASE_FREQ, false);
      }
      /* register system main memory (actual RAM) */
 diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/virt.c
 +++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@ static void virt_machine_init(MachineState *machine)
          sifive_clint_create(
              memmap[VIRT_CLINT].base + i * memmap[VIRT_CLINT].size,
              memmap[VIRT_CLINT].size, base_hartid, hart_count,
 -            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, true);
 +            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
 +            SIFIVE_CLINT_TIMEBASE_FREQ, true);
          /* Per-socket PLIC hart topology configuration string */
          plic_hart_config_len =
 diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_helper.c
 +++ b/target/riscv/cpu_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t riscv_cpu_update_mip(RISCVCPU *cpu, uint32_t mask, uint32_t value)
      return old;
  }
 -void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(void))
 +void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(uint32_t),
 +                             uint32_t arg)
  {
      env->rdtime_fn = fn;
 +    env->rdtime_fn_arg = arg;
  }
  void riscv_cpu_set_mode(CPURISCVState *env, target_ulong newpriv)
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ static int read_time(CPURISCVState *env, int csrno, target_ulong *val)
+@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops)
-         return -RISCV_EXCP_ILLEGAL_INST;
+ static int fs(CPURISCVState *env, int csrno)
  {
  #if !defined(CONFIG_USER_ONLY)
 +    /* loose check condition for fcsr in vector extension */
 +    if ((csrno == CSR_FCSR) && (env->misa & RVV)) {
 +        return 0;
 +    }
      if (!env->debugger && !riscv_cpu_fp_enabled(env)) {
          return -1;
      }
+@@ -XXX,XX +XXX,XX @@ static int fs(CPURISCVState *env, int csrno)
 -    *val = env->rdtime_fn() + delta;
 +    *val = env->rdtime_fn(env->rdtime_fn_arg) + delta;
      return 0;
  }
-@@ -XXX,XX +XXX,XX @@ static int read_timeh(CPURISCVState *env, int csrno, target_ulong *val)
++static int vs(CPURISCVState *env, int csrno)
-         return -RISCV_EXCP_ILLEGAL_INST;
++{
-     }
++    if (env->misa & RVV) {
++        return 0;
--    *val = (env->rdtime_fn() + delta) >> 32;
++    }
-+    *val = (env->rdtime_fn(env->rdtime_fn_arg) + delta) >> 32;
++    return -1;
 +}
 +
  static int ctr(CPURISCVState *env, int csrno)
  {
  #if !defined(CONFIG_USER_ONLY)
@@ -XXX,XX +XXX,XX @@ static int read_fcsr(CPURISCVState *env, int csrno, target_ulong *val)
  #endif
      *val = (riscv_cpu_get_fflags(env) << FSR_AEXC_SHIFT)
          | (env->frm << FSR_RD_SHIFT);
 +    if (vs(env, csrno) >= 0) {
 +        *val |= (env->vxrm << FSR_VXRM_SHIFT)
 +                | (env->vxsat << FSR_VXSAT_SHIFT);
 +    }
      return 0;
  }
+@@ -XXX,XX +XXX,XX @@ static int write_fcsr(CPURISCVState *env, int csrno, target_ulong val)
+     env->mstatus |= MSTATUS_FS;
  #endif
+     env->frm = (val & FSR_RD) >> FSR_RD_SHIFT;
++    if (vs(env, csrno) >= 0) {
++        env->vxrm = (val & FSR_VXRM) >> FSR_VXRM_SHIFT;
++        env->vxsat = (val & FSR_VXSAT) >> FSR_VXSAT_SHIFT;
++    }
+     riscv_cpu_set_fflags(env, (val & FSR_AEXC) >> FSR_AEXC_SHIFT);
+     return 0;
+ }
++static int read_vtype(CPURISCVState *env, int csrno, target_ulong *val)
++{
++    *val = env->vtype;
++    return 0;
++}
++
++static int read_vl(CPURISCVState *env, int csrno, target_ulong *val)
++{
++    *val = env->vl;
++    return 0;
++}
++
++static int read_vxrm(CPURISCVState *env, int csrno, target_ulong *val)
++{
++    *val = env->vxrm;
++    return 0;
++}
++
++static int write_vxrm(CPURISCVState *env, int csrno, target_ulong val)
++{
++    env->vxrm = val;
++    return 0;
++}
++
++static int read_vxsat(CPURISCVState *env, int csrno, target_ulong *val)
++{
++    *val = env->vxsat;
++    return 0;
++}
++
++static int write_vxsat(CPURISCVState *env, int csrno, target_ulong val)
++{
++    env->vxsat = val;
++    return 0;
++}
++
++static int read_vstart(CPURISCVState *env, int csrno, target_ulong *val)
++{
++    *val = env->vstart;
++    return 0;
++}
++
++static int write_vstart(CPURISCVState *env, int csrno, target_ulong val)
++{
++    env->vstart = val;
++    return 0;
++}
++
+ /* User Timers and Counters */
+ static int read_instret(CPURISCVState *env, int csrno, target_ulong *val)
+ {
+@@ -XXX,XX +XXX,XX @@ static riscv_csr_operations csr_ops[CSR_TABLE_SIZE] = {
+     [CSR_FFLAGS] =              { fs,   read_fflags,      write_fflags      },
+     [CSR_FRM] =                 { fs,   read_frm,         write_frm         },
+     [CSR_FCSR] =                { fs,   read_fcsr,        write_fcsr        },
+-
++    /* Vector CSRs */
++    [CSR_VSTART] =              { vs,   read_vstart,      write_vstart      },
++    [CSR_VXSAT] =               { vs,   read_vxsat,       write_vxsat       },
++    [CSR_VXRM] =                { vs,   read_vxrm,        write_vxrm        },
++    [CSR_VL] =                  { vs,   read_vl                             },
++    [CSR_VTYPE] =               { vs,   read_vtype                          },
+     /* User Timers and Counters */
+     [CSR_CYCLE] =               { ctr,  read_instret                        },
+     [CSR_INSTRET] =             { ctr,  read_instret                        },
 --
-.28.0
+.27.0

-[PULL 06/30] hw/riscv: Initial support for Microchip PolarFire SoC Icicle Kit board
+[PULL v2 07/64] target/riscv: add vector configure instruction
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an initial support for Microchip PolarFire SoC Icicle Kit.
+vsetvl and vsetvli are two configure instructions for vl, vtype. TB flags
-The Icicle Kit board integrates a PolarFire SoC, with one SiFive's
+should update after configure instructions. The (ill, lmul, sew ) of vtype
-E51 plus four U54 cores and many on-chip peripherals and an FPGA.
+and the bit of (VSTART == 0 && VL == VLMAX) will be placed within tb_flags.
-For more details about Microchip PolarFire Soc, please see:
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 https://www.microsemi.com/product-directory/soc-fpgas/5498-polarfire-soc-fpga
 Unlike SiFive FU540, the RISC-V core resect vector is at 0x20220000.
 The following perepherals are created as an unimplemented device:
 - Bus Error Uint 0/1/2/3/4
 - L2 cache controller
 - SYSREG
 - MPUCFG
 - IOSCBCFG
 More devices will be added later.
 The BIOS image used by this machine is hss.bin, aka Hart Software
 Services, which can be built from:
 https://github.com/polarfire-soc/hart-software-services
 To launch this machine:
 $ qemu-system-riscv64 -nographic -M microchip-icicle-kit
 The memory is set to 1 GiB by default to match the hardware.
 A sanity check on ram size is performed in the machine init routine
 to prompt user to increase the RAM size to > 1 GiB when less than
 GiB ram is detected.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1598924352-89526-5-git-send-email-bmeng.cn@gmail.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-5-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- default-configs/riscv64-softmmu.mak |   1 +
+ target/riscv/cpu.h                      | 63 +++++++++++++++++---
- include/hw/riscv/microchip_pfsoc.h  |  88 ++++++++
+ target/riscv/helper.h                   |  3 +
- hw/riscv/microchip_pfsoc.c          | 312 ++++++++++++++++++++++++++++
+ target/riscv/insn32.decode              |  5 ++
- MAINTAINERS                         |   7 +
+ target/riscv/insn_trans/trans_rvv.inc.c | 79 +++++++++++++++++++++++++
- hw/riscv/Kconfig                    |   6 +
+ target/riscv/translate.c                | 17 +++++-
- hw/riscv/meson.build                |   1 +
+ target/riscv/vector_helper.c            | 53 +++++++++++++++++
-files changed, 415 insertions(+)
+ target/riscv/Makefile.objs              |  2 +-
- create mode 100644 include/hw/riscv/microchip_pfsoc.h
+files changed, 210 insertions(+), 12 deletions(-)
- create mode 100644 hw/riscv/microchip_pfsoc.c
+ create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
+ create mode 100644 target/riscv/vector_helper.c
-diff --git a/default-configs/riscv64-softmmu.mak b/default-configs/riscv64-softmmu.mak
-index XXXXXXX..XXXXXXX 100644
+diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
---- a/default-configs/riscv64-softmmu.mak
+index XXXXXXX..XXXXXXX 100644
-+++ b/default-configs/riscv64-softmmu.mak
+--- a/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ CONFIG_SPIKE=y
++++ b/target/riscv/cpu.h
- CONFIG_SIFIVE_E=y
+@@ -XXX,XX +XXX,XX @@
- CONFIG_SIFIVE_U=y
+ #define RISCV_CPU_H
- CONFIG_RISCV_VIRT=y
-+CONFIG_MICROCHIP_PFSOC=y
+ #include "hw/core/cpu.h"
-diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
++#include "hw/registerfields.h"
  #include "exec/cpu-defs.h"
  #include "fpu/softfloat-types.h"
@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
  #define RV_VLEN_MAX 512
 +FIELD(VTYPE, VLMUL, 0, 2)
 +FIELD(VTYPE, VSEW, 2, 3)
 +FIELD(VTYPE, VEDIV, 5, 2)
 +FIELD(VTYPE, RESERVED, 7, sizeof(target_ulong) * 8 - 9)
 +FIELD(VTYPE, VILL, sizeof(target_ulong) * 8 - 2, 1)
 +
  struct CPURISCVState {
      target_ulong gpr[32];
      uint64_t fpr[32]; /* assume both F and D extensions */
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_set_fflags(CPURISCVState *env, target_ulong);
  #define TB_FLAGS_MMU_MASK   3
  #define TB_FLAGS_MSTATUS_FS MSTATUS_FS
 +typedef CPURISCVState CPUArchState;
 +typedef RISCVCPU ArchCPU;
 +#include "exec/cpu-all.h"
 +
 +FIELD(TB_FLAGS, VL_EQ_VLMAX, 2, 1)
 +FIELD(TB_FLAGS, LMUL, 3, 2)
 +FIELD(TB_FLAGS, SEW, 5, 3)
 +FIELD(TB_FLAGS, VILL, 8, 1)
 +
 +/*
 + * A simplification for VLMAX
 + * = (1 << LMUL) * VLEN / (8 * (1 << SEW))
 + * = (VLEN << LMUL) / (8 << SEW)
 + * = (VLEN << LMUL) >> (SEW + 3)
 + * = VLEN >> (SEW + 3 - LMUL)
 + */
 +static inline uint32_t vext_get_vlmax(RISCVCPU *cpu, target_ulong vtype)
 +{
 +    uint8_t sew, lmul;
 +
 +    sew = FIELD_EX64(vtype, VTYPE, VSEW);
 +    lmul = FIELD_EX64(vtype, VTYPE, VLMUL);
 +    return cpu->cfg.vlen >> (sew + 3 - lmul);
 +}
 +
  static inline void cpu_get_tb_cpu_state(CPURISCVState *env, target_ulong *pc,
 -                                        target_ulong *cs_base, uint32_t *flags)
 +                                        target_ulong *cs_base, uint32_t *pflags)
  {
 +    uint32_t flags = 0;
 +
      *pc = env->pc;
      *cs_base = 0;
 +
 +    if (riscv_has_ext(env, RVV)) {
 +        uint32_t vlmax = vext_get_vlmax(env_archcpu(env), env->vtype);
 +        bool vl_eq_vlmax = (env->vstart == 0) && (vlmax == env->vl);
 +        flags = FIELD_DP32(flags, TB_FLAGS, VILL,
 +                    FIELD_EX64(env->vtype, VTYPE, VILL));
 +        flags = FIELD_DP32(flags, TB_FLAGS, SEW,
 +                    FIELD_EX64(env->vtype, VTYPE, VSEW));
 +        flags = FIELD_DP32(flags, TB_FLAGS, LMUL,
 +                    FIELD_EX64(env->vtype, VTYPE, VLMUL));
 +        flags = FIELD_DP32(flags, TB_FLAGS, VL_EQ_VLMAX, vl_eq_vlmax);
 +    } else {
 +        flags = FIELD_DP32(flags, TB_FLAGS, VILL, 1);
 +    }
 +
  #ifdef CONFIG_USER_ONLY
 -    *flags = TB_FLAGS_MSTATUS_FS;
 +    flags |= TB_FLAGS_MSTATUS_FS;
  #else
 -    *flags = cpu_mmu_index(env, 0);
 +    flags |= cpu_mmu_index(env, 0);
      if (riscv_cpu_fp_enabled(env)) {
 -        *flags |= env->mstatus & MSTATUS_FS;
 +        flags |= env->mstatus & MSTATUS_FS;
      }
  #endif
 +    *pflags = flags;
  }
  int riscv_csrrw(CPURISCVState *env, int csrno, target_ulong *ret_value,
@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops);
  void riscv_cpu_register_gdb_regs_for_features(CPUState *cs);
 -typedef CPURISCVState CPUArchState;
 -typedef RISCVCPU ArchCPU;
 -
 -#include "exec/cpu-all.h"
 -
  #endif /* RISCV_CPU_H */
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(tlb_flush, void, env)
  #ifndef CONFIG_USER_ONLY
  DEF_HELPER_1(hyp_tlb_flush, void, env)
  #endif
 +
 +/* Vector functions */
 +DEF_HELPER_3(vsetvl, tl, env, tl, tl)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@
  @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
  @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
  @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
 +@r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
  @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
  @hfence_vvma ....... ..... .....   ... ..... ....... %rs2 %rs1
@@ -XXX,XX +XXX,XX @@ fcvt_d_wu  1101001  00001 ..... ... ..... 1010011 @r2_rm
  # *** RV32H Base Instruction Set ***
  hfence_gvma 0110001  .....  ..... 000 00000 1110011 @hfence_gvma
  hfence_vvma 0010001  .....  ..... 000 00000 1110011 @hfence_vvma
 +
 +# *** RV32V Extension ***
 +vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
 +vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/include/hw/riscv/microchip_pfsoc.h
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * Microchip PolarFire SoC machine interface
++ * RISC-V translation routines for the RVV Standard Extension.
 + *
-+ * Copyright (c) 2020 Wind River Systems, Inc.
++ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 ...
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
-+#ifndef HW_MICROCHIP_PFSOC_H
++static bool trans_vsetvl(DisasContext *ctx, arg_vsetvl *a)
-+#define HW_MICROCHIP_PFSOC_H
++{
-+
++    TCGv s1, s2, dst;
-+typedef struct MicrochipPFSoCState {
++
-+    /*< private >*/
++    if (!has_ext(ctx, RVV)) {
-+    DeviceState parent_obj;
++        return false;
-+
++    }
-+    /*< public >*/
++
-+    CPUClusterState e_cluster;
++    s2 = tcg_temp_new();
-+    CPUClusterState u_cluster;
++    dst = tcg_temp_new();
-+    RISCVHartArrayState e_cpus;
++
-+    RISCVHartArrayState u_cpus;
++    /* Using x0 as the rs1 register specifier, encodes an infinite AVL */
-+    DeviceState *plic;
++    if (a->rs1 == 0) {
-+} MicrochipPFSoCState;
++        /* As the mask is at least one bit, RV_VLEN_MAX is >= VLMAX */
-+
++        s1 = tcg_const_tl(RV_VLEN_MAX);
-+#define TYPE_MICROCHIP_PFSOC    "microchip.pfsoc"
++    } else {
-+#define MICROCHIP_PFSOC(obj) \
++        s1 = tcg_temp_new();
-+    OBJECT_CHECK(MicrochipPFSoCState, (obj), TYPE_MICROCHIP_PFSOC)
++        gen_get_gpr(s1, a->rs1);
-+
++    }
-+typedef struct MicrochipIcicleKitState {
++    gen_get_gpr(s2, a->rs2);
-+    /*< private >*/
++    gen_helper_vsetvl(dst, cpu_env, s1, s2);
-+    MachineState parent_obj;
++    gen_set_gpr(a->rd, dst);
-+
++    tcg_gen_movi_tl(cpu_pc, ctx->pc_succ_insn);
-+    /*< public >*/
++    lookup_and_goto_ptr(ctx);
-+    MicrochipPFSoCState soc;
++    ctx->base.is_jmp = DISAS_NORETURN;
-+} MicrochipIcicleKitState;
++
-+
++    tcg_temp_free(s1);
-+#define TYPE_MICROCHIP_ICICLE_KIT_MACHINE \
++    tcg_temp_free(s2);
-+    MACHINE_TYPE_NAME("microchip-icicle-kit")
++    tcg_temp_free(dst);
-+#define MICROCHIP_ICICLE_KIT_MACHINE(obj) \
++    return true;
-+    OBJECT_CHECK(MicrochipIcicleKitState, (obj), \
++}
-+                 TYPE_MICROCHIP_ICICLE_KIT_MACHINE)
++
-+
++static bool trans_vsetvli(DisasContext *ctx, arg_vsetvli *a)
-+enum {
++{
-+    MICROCHIP_PFSOC_DEBUG,
++    TCGv s1, s2, dst;
-+    MICROCHIP_PFSOC_E51_DTIM,
++
-+    MICROCHIP_PFSOC_BUSERR_UNIT0,
++    if (!has_ext(ctx, RVV)) {
-+    MICROCHIP_PFSOC_BUSERR_UNIT1,
++        return false;
-+    MICROCHIP_PFSOC_BUSERR_UNIT2,
++    }
-+    MICROCHIP_PFSOC_BUSERR_UNIT3,
++
-+    MICROCHIP_PFSOC_BUSERR_UNIT4,
++    s2 = tcg_const_tl(a->zimm);
-+    MICROCHIP_PFSOC_CLINT,
++    dst = tcg_temp_new();
-+    MICROCHIP_PFSOC_L2CC,
++
-+    MICROCHIP_PFSOC_L2LIM,
++    /* Using x0 as the rs1 register specifier, encodes an infinite AVL */
-+    MICROCHIP_PFSOC_PLIC,
++    if (a->rs1 == 0) {
-+    MICROCHIP_PFSOC_SYSREG,
++        /* As the mask is at least one bit, RV_VLEN_MAX is >= VLMAX */
-+    MICROCHIP_PFSOC_MPUCFG,
++        s1 = tcg_const_tl(RV_VLEN_MAX);
-+    MICROCHIP_PFSOC_ENVM_CFG,
++    } else {
-+    MICROCHIP_PFSOC_ENVM_DATA,
++        s1 = tcg_temp_new();
-+    MICROCHIP_PFSOC_IOSCB_CFG,
++        gen_get_gpr(s1, a->rs1);
-+    MICROCHIP_PFSOC_DRAM,
++    }
-+};
++    gen_helper_vsetvl(dst, cpu_env, s1, s2);
-+
++    gen_set_gpr(a->rd, dst);
-+#define MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT    1
++    gen_goto_tb(ctx, 0, ctx->pc_succ_insn);
-+#define MICROCHIP_PFSOC_COMPUTE_CPU_COUNT       4
++    ctx->base.is_jmp = DISAS_NORETURN;
 +
-+#define MICROCHIP_PFSOC_PLIC_HART_CONFIG        "MS"
++    tcg_temp_free(s1);
-+#define MICROCHIP_PFSOC_PLIC_NUM_SOURCES        185
++    tcg_temp_free(s2);
-+#define MICROCHIP_PFSOC_PLIC_NUM_PRIORITIES     7
++    tcg_temp_free(dst);
-+#define MICROCHIP_PFSOC_PLIC_PRIORITY_BASE      0x04
++    return true;
-+#define MICROCHIP_PFSOC_PLIC_PENDING_BASE       0x1000
++}
-+#define MICROCHIP_PFSOC_PLIC_ENABLE_BASE        0x2000
+diff --git a/target/riscv/translate.c b/target/riscv/translate.c
-+#define MICROCHIP_PFSOC_PLIC_ENABLE_STRIDE      0x80
+index XXXXXXX..XXXXXXX 100644
-+#define MICROCHIP_PFSOC_PLIC_CONTEXT_BASE       0x200000
+--- a/target/riscv/translate.c
-+#define MICROCHIP_PFSOC_PLIC_CONTEXT_STRIDE     0x1000
++++ b/target/riscv/translate.c
-+
+@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
-+#endif /* HW_MICROCHIP_PFSOC_H */
+        to reset this known value.  */
-diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
+     int frm;
      bool ext_ifencei;
 +    /* vector extension */
 +    bool vill;
 +    uint8_t lmul;
 +    uint8_t sew;
 +    uint16_t vlen;
 +    bool vl_eq_vlmax;
  } DisasContext;
  #ifdef TARGET_RISCV64
@@ -XXX,XX +XXX,XX @@ static bool gen_shift(DisasContext *ctx, arg_r *a,
  #include "insn_trans/trans_rvf.inc.c"
  #include "insn_trans/trans_rvd.inc.c"
  #include "insn_trans/trans_rvh.inc.c"
 +#include "insn_trans/trans_rvv.inc.c"
  #include "insn_trans/trans_privileged.inc.c"
  /* Include the auto-generated decoder for 16 bit insn */
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      DisasContext *ctx = container_of(dcbase, DisasContext, base);
      CPURISCVState *env = cs->env_ptr;
      RISCVCPU *cpu = RISCV_CPU(cs);
 +    uint32_t tb_flags = ctx->base.tb->flags;
      ctx->pc_succ_insn = ctx->base.pc_first;
 -    ctx->mem_idx = ctx->base.tb->flags & TB_FLAGS_MMU_MASK;
 -    ctx->mstatus_fs = ctx->base.tb->flags & TB_FLAGS_MSTATUS_FS;
 +    ctx->mem_idx = tb_flags & TB_FLAGS_MMU_MASK;
 +    ctx->mstatus_fs = tb_flags & TB_FLAGS_MSTATUS_FS;
      ctx->priv_ver = env->priv_ver;
  #if !defined(CONFIG_USER_ONLY)
      if (riscv_has_ext(env, RVH)) {
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      ctx->misa = env->misa;
      ctx->frm = -1;  /* unknown rounding mode */
      ctx->ext_ifencei = cpu->cfg.ext_ifencei;
 +    ctx->vlen = cpu->cfg.vlen;
 +    ctx->vill = FIELD_EX32(tb_flags, TB_FLAGS, VILL);
 +    ctx->sew = FIELD_EX32(tb_flags, TB_FLAGS, SEW);
 +    ctx->lmul = FIELD_EX32(tb_flags, TB_FLAGS, LMUL);
 +    ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
  }
  static void riscv_tr_tb_start(DisasContextBase *db, CPUState *cpu)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/vector_helper.c
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * QEMU RISC-V Board Compatible with Microchip PolarFire SoC Icicle Kit
++ * RISC-V Vector Extension Helpers for QEMU.
 + *
-+ * Copyright (c) 2020 Wind River Systems, Inc.
++ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * Provides a board compatible with the Microchip PolarFire SoC Icicle Kit
 + *
 + * 0) CLINT (Core Level Interruptor)
 + * 1) PLIC (Platform Level Interrupt Controller)
 + * 2) eNVM (Embedded Non-Volatile Memory)
 + *
 + * This board currently generates devicetree dynamically that indicates at least
 + * two harts and up to five harts.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 ...
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
-+#include "qemu/error-report.h"
++#include "cpu.h"
-+#include "qemu/log.h"
++#include "exec/exec-all.h"
-+#include "qemu/units.h"
++#include "exec/helper-proto.h"
-+#include "qemu/cutils.h"
++#include <math.h>
-+#include "qapi/error.h"
++
-+#include "hw/boards.h"
++target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
-+#include "hw/irq.h"
++                            target_ulong s2)
 +#include "hw/loader.h"
 +#include "hw/sysbus.h"
 +#include "hw/cpu/cluster.h"
 +#include "target/riscv/cpu.h"
 +#include "hw/misc/unimp.h"
 +#include "hw/riscv/boot.h"
 +#include "hw/riscv/riscv_hart.h"
 +#include "hw/riscv/sifive_clint.h"
 +#include "hw/riscv/sifive_plic.h"
 +#include "hw/riscv/microchip_pfsoc.h"
 +
 +/*
 + * The BIOS image used by this machine is called Hart Software Services (HSS).
 + * See https://github.com/polarfire-soc/hart-software-services
 + */
 +#define BIOS_FILENAME   "hss.bin"
 +#define RESET_VECTOR    0x20220000
 +
 +static const struct MemmapEntry {
 +    hwaddr base;
 +    hwaddr size;
 +} microchip_pfsoc_memmap[] = {
 +    [MICROCHIP_PFSOC_DEBUG] =           {        0x0,     0x1000 },
 +    [MICROCHIP_PFSOC_E51_DTIM] =        {  0x1000000,     0x2000 },
 +    [MICROCHIP_PFSOC_BUSERR_UNIT0] =    {  0x1700000,     0x1000 },
 +    [MICROCHIP_PFSOC_BUSERR_UNIT1] =    {  0x1701000,     0x1000 },
 +    [MICROCHIP_PFSOC_BUSERR_UNIT2] =    {  0x1702000,     0x1000 },
 +    [MICROCHIP_PFSOC_BUSERR_UNIT3] =    {  0x1703000,     0x1000 },
 +    [MICROCHIP_PFSOC_BUSERR_UNIT4] =    {  0x1704000,     0x1000 },
 +    [MICROCHIP_PFSOC_CLINT] =           {  0x2000000,    0x10000 },
 +    [MICROCHIP_PFSOC_L2CC] =            {  0x2010000,     0x1000 },
 +    [MICROCHIP_PFSOC_L2LIM] =           {  0x8000000,  0x2000000 },
 +    [MICROCHIP_PFSOC_PLIC] =            {  0xc000000,  0x4000000 },
 +    [MICROCHIP_PFSOC_SYSREG] =          { 0x20002000,     0x2000 },
 +    [MICROCHIP_PFSOC_MPUCFG] =          { 0x20005000,     0x1000 },
 +    [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
 +    [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
 +    [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
 +    [MICROCHIP_PFSOC_DRAM] =            { 0x80000000,        0x0 },
 +};
 +
 +static void microchip_pfsoc_soc_instance_init(Object *obj)
 +{
-+    MachineState *ms = MACHINE(qdev_get_machine());
++    int vlmax, vl;
-+    MicrochipPFSoCState *s = MICROCHIP_PFSOC(obj);
++    RISCVCPU *cpu = env_archcpu(env);
-+
++    uint16_t sew = 8 << FIELD_EX64(s2, VTYPE, VSEW);
-+    object_initialize_child(obj, "e-cluster", &s->e_cluster, TYPE_CPU_CLUSTER);
++    uint8_t ediv = FIELD_EX64(s2, VTYPE, VEDIV);
-+    qdev_prop_set_uint32(DEVICE(&s->e_cluster), "cluster-id", 0);
++    bool vill = FIELD_EX64(s2, VTYPE, VILL);
-+
++    target_ulong reserved = FIELD_EX64(s2, VTYPE, RESERVED);
-+    object_initialize_child(OBJECT(&s->e_cluster), "e-cpus", &s->e_cpus,
++
-+                            TYPE_RISCV_HART_ARRAY);
++    if ((sew > cpu->cfg.elen) || vill || (ediv != 0) || (reserved != 0)) {
-+    qdev_prop_set_uint32(DEVICE(&s->e_cpus), "num-harts", 1);
++        /* only set vill bit. */
-+    qdev_prop_set_uint32(DEVICE(&s->e_cpus), "hartid-base", 0);
++        env->vtype = FIELD_DP64(0, VTYPE, VILL, 1);
-+    qdev_prop_set_string(DEVICE(&s->e_cpus), "cpu-type",
++        env->vl = 0;
-+                         TYPE_RISCV_CPU_SIFIVE_E51);
++        env->vstart = 0;
-+    qdev_prop_set_uint64(DEVICE(&s->e_cpus), "resetvec", RESET_VECTOR);
++        return 0;
-+
++    }
-+    object_initialize_child(obj, "u-cluster", &s->u_cluster, TYPE_CPU_CLUSTER);
++
-+    qdev_prop_set_uint32(DEVICE(&s->u_cluster), "cluster-id", 1);
++    vlmax = vext_get_vlmax(cpu, s2);
-+
++    if (s1 <= vlmax) {
-+    object_initialize_child(OBJECT(&s->u_cluster), "u-cpus", &s->u_cpus,
++        vl = s1;
-+                            TYPE_RISCV_HART_ARRAY);
++    } else {
-+    qdev_prop_set_uint32(DEVICE(&s->u_cpus), "num-harts", ms->smp.cpus - 1);
++        vl = vlmax;
-+    qdev_prop_set_uint32(DEVICE(&s->u_cpus), "hartid-base", 1);
++    }
-+    qdev_prop_set_string(DEVICE(&s->u_cpus), "cpu-type",
++    env->vl = vl;
-+                         TYPE_RISCV_CPU_SIFIVE_U54);
++    env->vtype = s2;
-+    qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", RESET_VECTOR);
++    env->vstart = 0;
 +    return vl;
 +}
-+
+diff --git a/target/riscv/Makefile.objs b/target/riscv/Makefile.objs
-+static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
+index XXXXXXX..XXXXXXX 100644
-+{
+--- a/target/riscv/Makefile.objs
-+    MachineState *ms = MACHINE(qdev_get_machine());
++++ b/target/riscv/Makefile.objs
-+    MicrochipPFSoCState *s = MICROCHIP_PFSOC(dev);
+@@ -XXX,XX +XXX,XX @@
-+    const struct MemmapEntry *memmap = microchip_pfsoc_memmap;
+-obj-y += translate.o op_helper.o cpu_helper.o cpu.o csr.o fpu_helper.o gdbstub.o
-+    MemoryRegion *system_memory = get_system_memory();
++obj-y += translate.o op_helper.o cpu_helper.o cpu.o csr.o fpu_helper.o vector_helper.o gdbstub.o
-+    MemoryRegion *e51_dtim_mem = g_new(MemoryRegion, 1);
+ obj-$(CONFIG_SOFTMMU) += pmp.o
-+    MemoryRegion *l2lim_mem = g_new(MemoryRegion, 1);
-+    MemoryRegion *envm_data = g_new(MemoryRegion, 1);
+ ifeq ($(CONFIG_SOFTMMU),y)
 +    char *plic_hart_config;
 +    size_t plic_hart_config_len;
 +    int i;
 +
 +    sysbus_realize(SYS_BUS_DEVICE(&s->e_cpus), &error_abort);
 +    sysbus_realize(SYS_BUS_DEVICE(&s->u_cpus), &error_abort);
 +    /*
 +     * The cluster must be realized after the RISC-V hart array container,
 +     * as the container's CPU object is only created on realize, and the
 +     * CPU must exist and have been parented into the cluster before the
 +     * cluster is realized.
 +     */
 +    qdev_realize(DEVICE(&s->e_cluster), NULL, &error_abort);
 +    qdev_realize(DEVICE(&s->u_cluster), NULL, &error_abort);
 +
 +    /* E51 DTIM */
 +    memory_region_init_ram(e51_dtim_mem, NULL, "microchip.pfsoc.e51_dtim_mem",
 +                           memmap[MICROCHIP_PFSOC_E51_DTIM].size, &error_fatal);
 +    memory_region_add_subregion(system_memory,
 +                                memmap[MICROCHIP_PFSOC_E51_DTIM].base,
 +                                e51_dtim_mem);
 +
 +    /* Bus Error Units */
 +    create_unimplemented_device("microchip.pfsoc.buserr_unit0_mem",
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT0].base,
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT0].size);
 +    create_unimplemented_device("microchip.pfsoc.buserr_unit1_mem",
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT1].base,
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT1].size);
 +    create_unimplemented_device("microchip.pfsoc.buserr_unit2_mem",
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT2].base,
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT2].size);
 +    create_unimplemented_device("microchip.pfsoc.buserr_unit3_mem",
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT3].base,
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT3].size);
 +    create_unimplemented_device("microchip.pfsoc.buserr_unit4_mem",
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT4].base,
 +        memmap[MICROCHIP_PFSOC_BUSERR_UNIT4].size);
 +
 +    /* CLINT */
 +    sifive_clint_create(memmap[MICROCHIP_PFSOC_CLINT].base,
 +        memmap[MICROCHIP_PFSOC_CLINT].size, 0, ms->smp.cpus,
 +        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
 +
 +    /* L2 cache controller */
 +    create_unimplemented_device("microchip.pfsoc.l2cc",
 +        memmap[MICROCHIP_PFSOC_L2CC].base, memmap[MICROCHIP_PFSOC_L2CC].size);
 +
 +    /*
 +     * Add L2-LIM at reset size.
 +     * This should be reduced in size as the L2 Cache Controller WayEnable
 +     * register is incremented. Unfortunately I don't see a nice (or any) way
 +     * to handle reducing or blocking out the L2 LIM while still allowing it
 +     * be re returned to all enabled after a reset. For the time being, just
 +     * leave it enabled all the time. This won't break anything, but will be
 +     * too generous to misbehaving guests.
 +     */
 +    memory_region_init_ram(l2lim_mem, NULL, "microchip.pfsoc.l2lim",
 +                           memmap[MICROCHIP_PFSOC_L2LIM].size, &error_fatal);
 +    memory_region_add_subregion(system_memory,
 +                                memmap[MICROCHIP_PFSOC_L2LIM].base,
 +                                l2lim_mem);
 +
 +    /* create PLIC hart topology configuration string */
 +    plic_hart_config_len = (strlen(MICROCHIP_PFSOC_PLIC_HART_CONFIG) + 1) *
 +                           ms->smp.cpus;
 +    plic_hart_config = g_malloc0(plic_hart_config_len);
 +    for (i = 0; i < ms->smp.cpus; i++) {
 +        if (i != 0) {
 +            strncat(plic_hart_config, "," MICROCHIP_PFSOC_PLIC_HART_CONFIG,
 +                    plic_hart_config_len);
 +        } else {
 +            strncat(plic_hart_config, "M", plic_hart_config_len);
 +        }
 +        plic_hart_config_len -= (strlen(MICROCHIP_PFSOC_PLIC_HART_CONFIG) + 1);
 +    }
 +
 +    /* PLIC */
 +    s->plic = sifive_plic_create(memmap[MICROCHIP_PFSOC_PLIC].base,
 +        plic_hart_config, 0,
 +        MICROCHIP_PFSOC_PLIC_NUM_SOURCES,
 +        MICROCHIP_PFSOC_PLIC_NUM_PRIORITIES,
 +        MICROCHIP_PFSOC_PLIC_PRIORITY_BASE,
 +        MICROCHIP_PFSOC_PLIC_PENDING_BASE,
 +        MICROCHIP_PFSOC_PLIC_ENABLE_BASE,
 +        MICROCHIP_PFSOC_PLIC_ENABLE_STRIDE,
 +        MICROCHIP_PFSOC_PLIC_CONTEXT_BASE,
 +        MICROCHIP_PFSOC_PLIC_CONTEXT_STRIDE,
 +        memmap[MICROCHIP_PFSOC_PLIC].size);
 +    g_free(plic_hart_config);
 +
 +    /* SYSREG */
 +    create_unimplemented_device("microchip.pfsoc.sysreg",
 +        memmap[MICROCHIP_PFSOC_SYSREG].base,
 +        memmap[MICROCHIP_PFSOC_SYSREG].size);
 +
 +    /* MPUCFG */
 +    create_unimplemented_device("microchip.pfsoc.mpucfg",
 +        memmap[MICROCHIP_PFSOC_MPUCFG].base,
 +        memmap[MICROCHIP_PFSOC_MPUCFG].size);
 +
 +    /* eNVM */
 +    memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
 +                           memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
 +                           &error_fatal);
 +    memory_region_add_subregion(system_memory,
 +                                memmap[MICROCHIP_PFSOC_ENVM_DATA].base,
 +                                envm_data);
 +
 +    /* IOSCBCFG */
 +    create_unimplemented_device("microchip.pfsoc.ioscb.cfg",
 +        memmap[MICROCHIP_PFSOC_IOSCB_CFG].base,
 +        memmap[MICROCHIP_PFSOC_IOSCB_CFG].size);
 +}
 +
 +static void microchip_pfsoc_soc_class_init(ObjectClass *oc, void *data)
 +{
 +    DeviceClass *dc = DEVICE_CLASS(oc);
 +
 +    dc->realize = microchip_pfsoc_soc_realize;
 +    /* Reason: Uses serial_hds in realize function, thus can't be used twice */
 +    dc->user_creatable = false;
 +}
 +
 +static const TypeInfo microchip_pfsoc_soc_type_info = {
 +    .name = TYPE_MICROCHIP_PFSOC,
 +    .parent = TYPE_DEVICE,
 +    .instance_size = sizeof(MicrochipPFSoCState),
 +    .instance_init = microchip_pfsoc_soc_instance_init,
 +    .class_init = microchip_pfsoc_soc_class_init,
 +};
 +
 +static void microchip_pfsoc_soc_register_types(void)
 +{
 +    type_register_static(&microchip_pfsoc_soc_type_info);
 +}
 +
 +type_init(microchip_pfsoc_soc_register_types)
 +
 +static void microchip_icicle_kit_machine_init(MachineState *machine)
 +{
 +    MachineClass *mc = MACHINE_GET_CLASS(machine);
 +    const struct MemmapEntry *memmap = microchip_pfsoc_memmap;
 +    MicrochipIcicleKitState *s = MICROCHIP_ICICLE_KIT_MACHINE(machine);
 +    MemoryRegion *system_memory = get_system_memory();
 +    MemoryRegion *main_mem = g_new(MemoryRegion, 1);
 +
 +    /* Sanity check on RAM size */
 +    if (machine->ram_size < mc->default_ram_size) {
 +        char *sz = size_to_str(mc->default_ram_size);
 +        error_report("Invalid RAM size, should be bigger than %s", sz);
 +        g_free(sz);
 +        exit(EXIT_FAILURE);
 +    }
 +
 +    /* Initialize SoC */
 +    object_initialize_child(OBJECT(machine), "soc", &s->soc,
 +                            TYPE_MICROCHIP_PFSOC);
 +    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
 +
 +    /* Register RAM */
 +    memory_region_init_ram(main_mem, NULL, "microchip.icicle.kit.ram",
 +                           machine->ram_size, &error_fatal);
 +    memory_region_add_subregion(system_memory,
 +                                memmap[MICROCHIP_PFSOC_DRAM].base, main_mem);
 +
 +    /* Load the firmware */
 +    riscv_find_and_load_firmware(machine, BIOS_FILENAME, RESET_VECTOR, NULL);
 +}
 +
 +static void microchip_icicle_kit_machine_class_init(ObjectClass *oc, void *data)
 +{
 +    MachineClass *mc = MACHINE_CLASS(oc);
 +
 +    mc->desc = "Microchip PolarFire SoC Icicle Kit";
 +    mc->init = microchip_icicle_kit_machine_init;
 +    mc->max_cpus = MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT +
 +                   MICROCHIP_PFSOC_COMPUTE_CPU_COUNT;
 +    mc->min_cpus = MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT + 1;
 +    mc->default_cpus = mc->min_cpus;
 +    mc->default_ram_size = 1 * GiB;
 +}
 +
 +static const TypeInfo microchip_icicle_kit_machine_typeinfo = {
 +    .name       = MACHINE_TYPE_NAME("microchip-icicle-kit"),
 +    .parent     = TYPE_MACHINE,
 +    .class_init = microchip_icicle_kit_machine_class_init,
 +    .instance_size = sizeof(MicrochipIcicleKitState),
 +};
 +
 +static void microchip_icicle_kit_machine_init_register_types(void)
 +{
 +    type_register_static(&microchip_icicle_kit_machine_typeinfo);
 +}
 +
 +type_init(microchip_icicle_kit_machine_init_register_types)
 diff --git a/MAINTAINERS b/MAINTAINERS
 index XXXXXXX..XXXXXXX 100644
 --- a/MAINTAINERS
 +++ b/MAINTAINERS
@@ -XXX,XX +XXX,XX @@ F: include/hw/riscv/opentitan.h
  F: include/hw/char/ibex_uart.h
  F: include/hw/intc/ibex_plic.h
 +Microchip PolarFire SoC Icicle Kit
 +M: Bin Meng <bin.meng@windriver.com>
 +L: qemu-riscv@nongnu.org
 +S: Supported
 +F: hw/riscv/microchip_pfsoc.c
 +F: include/hw/riscv/microchip_pfsoc.h
 +
  RX Machines
  -----------
  rx-gdbsim
 diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/Kconfig
 +++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
      select PCI_EXPRESS_GENERIC_BRIDGE
      select PFLASH_CFI01
      select SIFIVE
 +
 +config MICROCHIP_PFSOC
 +    bool
 +    select HART
 +    select SIFIVE
 +    select UNIMP
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/meson.build
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_prci.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
 +riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
  hw_arch += {'riscv': riscv_ss}
 --
-.28.0
+.27.0

-New patch
+[PULL v2 08/64] target/riscv: add an internals.h header
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The internals.h keeps things that are not relevant to the actual architecture,
+only to the implementation, separate.
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-Id: <20200701152549.1218-6-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/internals.h | 24 ++++++++++++++++++++++++
+file changed, 24 insertions(+)
+ create mode 100644 target/riscv/internals.h
+diff --git a/target/riscv/internals.h b/target/riscv/internals.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/target/riscv/internals.h
+@@ -XXX,XX +XXX,XX @@
++/*
++ * QEMU RISC-V CPU -- internal functions and types
++ *
++ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
++ *
++ * This program is free software; you can redistribute it and/or modify it
++ * under the terms and conditions of the GNU General Public License,
++ * version 2 or later, as published by the Free Software Foundation.
++ *
++ * This program is distributed in the hope it will be useful, but WITHOUT
++ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
++ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
++ * more details.
++ *
++ * You should have received a copy of the GNU General Public License along with
++ * this program.  If not, see <http://www.gnu.org/licenses/>.
++ */
++
++#ifndef RISCV_CPU_INTERNALS_H
++#define RISCV_CPU_INTERNALS_H
++
++#include "hw/registerfields.h"
++
++#endif
+--
+.27.0

-[PULL 15/30] hw/riscv: microchip_pfsoc: Connect 2 Cadence GEMs
+[PULL v2 09/64] target/riscv: add vector stride load and store instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Microchip PolarFire SoC integrates 2 Candence GEMs to provide
+Vector strided operations access the first memory element at the base address,
-IEEE 802.3 standard-compliant 10/100/1000 Mbps ethernet interface.
+and then access subsequent elements at address increments given by the byte
 offset contained in the x register specified by rs2.
-On the Icicle Kit board, GEM0 connects to a PHY at address 8 while
+Vector unit-stride operations access elements stored contiguously in memory
-GEM1 connects to a PHY at address 9.
+starting from the base effective address. It can been seen as a special
 case of strided operations.
-The 2nd stage bootloader (U-Boot) is using GEM1 by default, so we
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-must specify 2 '-nic' options from the command line in order to get
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 a working ethernet.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-Id: <20200701152549.1218-7-zhiwei_liu@c-sky.com>
 Message-Id: <1598924352-89526-14-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/microchip_pfsoc.h |  7 ++++++
+ target/riscv/helper.h                   | 105 ++++++
- hw/riscv/microchip_pfsoc.c         | 39 ++++++++++++++++++++++++++++++
+ target/riscv/internals.h                |   5 +
-files changed, 46 insertions(+)
+ target/riscv/insn32.decode              |  32 ++
  target/riscv/insn_trans/trans_rvv.inc.c | 355 ++++++++++++++++++++
  target/riscv/translate.c                |   7 +
  target/riscv/vector_helper.c            | 410 ++++++++++++++++++++++++
 files changed, 914 insertions(+)
-diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/microchip_pfsoc.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/microchip_pfsoc.h
++++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(hyp_tlb_flush, void, env)
  /* Vector functions */
  DEF_HELPER_3(vsetvl, tl, env, tl, tl)
 +DEF_HELPER_5(vlb_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsw_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsw_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlswu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlswu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssw_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssw_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_d, void, ptr, ptr, tl, tl, env, i32)
 diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/internals.h
 +++ b/target/riscv/internals.h
 @@ -XXX,XX +XXX,XX @@
- #include "hw/char/mchp_pfsoc_mmuart.h"
+ #include "hw/registerfields.h"
- #include "hw/dma/sifive_pdma.h"
-+#include "hw/net/cadence_gem.h"
++/* share data between vector helpers and decode code */
- #include "hw/sd/cadence_sdhci.h"
++FIELD(VDATA, MLEN, 0, 8)
++FIELD(VDATA, VM, 8, 1)
- typedef struct MicrochipPFSoCState {
++FIELD(VDATA, LMUL, 9, 2)
-@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
++FIELD(VDATA, NF, 11, 4)
-     MchpPfSoCMMUartState *serial3;
+ #endif
-     MchpPfSoCMMUartState *serial4;
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
      SiFivePDMAState dma;
 +    CadenceGEMState gem0;
 +    CadenceGEMState gem1;
      CadenceSDHCIState sdhci;
  } MicrochipPFSoCState;
@@ -XXX,XX +XXX,XX @@ enum {
      MICROCHIP_PFSOC_MMUART2,
      MICROCHIP_PFSOC_MMUART3,
      MICROCHIP_PFSOC_MMUART4,
 +    MICROCHIP_PFSOC_GEM0,
 +    MICROCHIP_PFSOC_GEM1,
      MICROCHIP_PFSOC_ENVM_CFG,
      MICROCHIP_PFSOC_ENVM_DATA,
      MICROCHIP_PFSOC_IOSCB_CFG,
@@ -XXX,XX +XXX,XX @@ enum {
      MICROCHIP_PFSOC_DMA_IRQ5 = 10,
      MICROCHIP_PFSOC_DMA_IRQ6 = 11,
      MICROCHIP_PFSOC_DMA_IRQ7 = 12,
 +    MICROCHIP_PFSOC_GEM0_IRQ = 64,
 +    MICROCHIP_PFSOC_GEM1_IRQ = 70,
      MICROCHIP_PFSOC_EMMC_SD_IRQ = 88,
      MICROCHIP_PFSOC_MMUART0_IRQ = 90,
      MICROCHIP_PFSOC_MMUART1_IRQ = 91,
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/microchip_pfsoc.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/insn32.decode
 @@ -XXX,XX +XXX,XX @@
-  * 3) MMUARTs (Multi-Mode UART)
+ %sh10    20:10
-  * 4) Cadence eMMC/SDHC controller and an SD card connected to it
+ %csr    20:12
-  * 5) SiFive Platform DMA (Direct Memory Access Controller)
+ %rm     12:3
-+ * 6) GEM (Gigabit Ethernet MAC Controller)
++%nf     29:3                     !function=ex_plus_1
-  *
-  * This board currently generates devicetree dynamically that indicates at least
+ # immediates:
-  * two harts and up to five harts.
+ %imm_i    20:s12
 @@ -XXX,XX +XXX,XX @@
- #define BIOS_FILENAME   "hss.bin"
+ &u    imm rd
- #define RESET_VECTOR    0x20220000
+ &shift     shamt rs1 rd
+ &atomic    aq rl rs2 rs1 rd
-+/* GEM version */
++&r2nfvm    vm rd rs1 nf
-+#define GEM_REVISION    0x0107010c
++&rnfvm     vm rd rs1 rs2 nf
-+
- static const struct MemmapEntry {
+ # Formats 32:
-     hwaddr base;
+ @r       .......   ..... ..... ... ..... ....... &r                %rs2 %rs1 %rd
-     hwaddr size;
+@@ -XXX,XX +XXX,XX @@
-@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
+ @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
-     [MICROCHIP_PFSOC_MMUART2] =         { 0x20102000,     0x1000 },
+ @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
-     [MICROCHIP_PFSOC_MMUART3] =         { 0x20104000,     0x1000 },
+ @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
-     [MICROCHIP_PFSOC_MMUART4] =         { 0x20106000,     0x1000 },
++@r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
-+    [MICROCHIP_PFSOC_GEM0] =            { 0x20110000,     0x2000 },
++@r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
-+    [MICROCHIP_PFSOC_GEM1] =            { 0x20112000,     0x2000 },
+ @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
-     [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
-     [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
+ @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
-     [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
+@@ -XXX,XX +XXX,XX @@ hfence_gvma 0110001  .....  ..... 000 00000 1110011 @hfence_gvma
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_instance_init(Object *obj)
+ hfence_vvma 0010001  .....  ..... 000 00000 1110011 @hfence_vvma
-     object_initialize_child(obj, "dma-controller", &s->dma,
-                             TYPE_SIFIVE_PDMA);
+ # *** RV32V Extension ***
++
-+    object_initialize_child(obj, "gem0", &s->gem0, TYPE_CADENCE_GEM);
++# *** Vector loads and stores are encoded within LOADFP/STORE-FP ***
-+    object_initialize_child(obj, "gem1", &s->gem1, TYPE_CADENCE_GEM);
++vlb_v      ... 100 . 00000 ..... 000 ..... 0000111 @r2_nfvm
-+
++vlh_v      ... 100 . 00000 ..... 101 ..... 0000111 @r2_nfvm
-     object_initialize_child(obj, "sd-controller", &s->sdhci,
++vlw_v      ... 100 . 00000 ..... 110 ..... 0000111 @r2_nfvm
-                             TYPE_CADENCE_SDHCI);
++vle_v      ... 000 . 00000 ..... 111 ..... 0000111 @r2_nfvm
 +vlbu_v     ... 000 . 00000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhu_v     ... 000 . 00000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwu_v     ... 000 . 00000 ..... 110 ..... 0000111 @r2_nfvm
 +vsb_v      ... 000 . 00000 ..... 000 ..... 0100111 @r2_nfvm
 +vsh_v      ... 000 . 00000 ..... 101 ..... 0100111 @r2_nfvm
 +vsw_v      ... 000 . 00000 ..... 110 ..... 0100111 @r2_nfvm
 +vse_v      ... 000 . 00000 ..... 111 ..... 0100111 @r2_nfvm
 +
 +vlsb_v     ... 110 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlsh_v     ... 110 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlsw_v     ... 110 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vlse_v     ... 010 . ..... ..... 111 ..... 0000111 @r_nfvm
 +vlsbu_v    ... 010 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlshu_v    ... 010 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlswu_v    ... 010 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vssb_v     ... 010 . ..... ..... 000 ..... 0100111 @r_nfvm
 +vssh_v     ... 010 . ..... ..... 101 ..... 0100111 @r_nfvm
 +vssw_v     ... 010 . ..... ..... 110 ..... 0100111 @r_nfvm
 +vsse_v     ... 010 . ..... ..... 111 ..... 0100111 @r_nfvm
 +
 +# *** new major opcode OP-V ***
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@
   * You should have received a copy of the GNU General Public License along with
   * this program.  If not, see <http://www.gnu.org/licenses/>.
   */
 +#include "tcg/tcg-op-gvec.h"
 +#include "tcg/tcg-gvec-desc.h"
 +#include "internals.h"
  static bool trans_vsetvl(DisasContext *ctx, arg_vsetvl *a)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_vsetvli(DisasContext *ctx, arg_vsetvli *a)
      tcg_temp_free(dst);
      return true;
  }
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
++
-     MemoryRegion *envm_data = g_new(MemoryRegion, 1);
++/* vector register offset from env */
-     char *plic_hart_config;
++static uint32_t vreg_ofs(DisasContext *s, int reg)
-     size_t plic_hart_config_len;
++{
-+    NICInfo *nd;
++    return offsetof(CPURISCVState, vreg) + reg * s->vlen / 8;
-     int i;
++}
++
-     sysbus_realize(SYS_BUS_DEVICE(&s->e_cpus), &error_abort);
++/* check functions */
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
++
-         qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART4_IRQ),
++/*
-         serial_hd(4));
++ * In cpu_get_tb_cpu_state(), set VILL if RVV was not present.
++ * So RVV is also be checked in this function.
-+    /* GEMs */
++ */
-+
++static bool vext_check_isa_ill(DisasContext *s)
-+    nd = &nd_table[0];
++{
-+    if (nd->used) {
++    return !s->vill;
-+        qemu_check_nic_model(nd, TYPE_CADENCE_GEM);
++}
-+        qdev_set_nic_properties(DEVICE(&s->gem0), nd);
++
 +/*
 + * There are two rules check here.
 + *
 + * 1. Vector register numbers are multiples of LMUL. (Section 3.2)
 + *
 + * 2. For all widening instructions, the destination LMUL value must also be
 + *    a supported LMUL value. (Section 11.2)
 + */
 +static bool vext_check_reg(DisasContext *s, uint32_t reg, bool widen)
 +{
 +    /*
 +     * The destination vector register group results are arranged as if both
 +     * SEW and LMUL were at twice their current settings. (Section 11.2).
 +     */
 +    int legal = widen ? 2 << s->lmul : 1 << s->lmul;
 +
 +    return !((s->lmul == 0x3 && widen) || (reg % legal));
 +}
 +
 +/*
 + * There are two rules check here.
 + *
 + * 1. The destination vector register group for a masked vector instruction can
 + *    only overlap the source mask register (v0) when LMUL=1. (Section 5.3)
 + *
 + * 2. In widen instructions and some other insturctions, like vslideup.vx,
 + *    there is no need to check whether LMUL=1.
 + */
 +static bool vext_check_overlap_mask(DisasContext *s, uint32_t vd, bool vm,
 +    bool force)
 +{
 +    return (vm != 0 || vd != 0) || (!force && (s->lmul == 0));
 +}
 +
 +/* The LMUL setting must be such that LMUL * NFIELDS <= 8. (Section 7.8) */
 +static bool vext_check_nf(DisasContext *s, uint32_t nf)
 +{
 +    return (1 << s->lmul) * nf <= 8;
 +}
 +
 +/* common translation macro */
 +#define GEN_VEXT_TRANS(NAME, SEQ, ARGTYPE, OP, CHECK)      \
 +static bool trans_##NAME(DisasContext *s, arg_##ARGTYPE *a)\
 +{                                                          \
 +    if (CHECK(s, a)) {                                     \
 +        return OP(s, a, SEQ);                              \
 +    }                                                      \
 +    return false;                                          \
 +}
 +
 +/*
 + *** unit stride load and store
 + */
 +typedef void gen_helper_ldst_us(TCGv_ptr, TCGv_ptr, TCGv,
 +                                TCGv_env, TCGv_i32);
 +
 +static bool ldst_us_trans(uint32_t vd, uint32_t rs1, uint32_t data,
 +                          gen_helper_ldst_us *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +
 +    /*
 +     * As simd_desc supports at most 256 bytes, and in this implementation,
 +     * the max vector group length is 2048 bytes. So split it into two parts.
 +     *
 +     * The first part is vlen in bytes, encoded in maxsz of simd_desc.
 +     * The second part is lmul, encoded in data of simd_desc.
 +     */
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_us_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[2][7][4] = {
 +        /* masked unit stride load */
 +        { { gen_helper_vlb_v_b_mask,  gen_helper_vlb_v_h_mask,
 +            gen_helper_vlb_v_w_mask,  gen_helper_vlb_v_d_mask },
 +          { NULL,                     gen_helper_vlh_v_h_mask,
 +            gen_helper_vlh_v_w_mask,  gen_helper_vlh_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vlw_v_w_mask,  gen_helper_vlw_v_d_mask },
 +          { gen_helper_vle_v_b_mask,  gen_helper_vle_v_h_mask,
 +            gen_helper_vle_v_w_mask,  gen_helper_vle_v_d_mask },
 +          { gen_helper_vlbu_v_b_mask, gen_helper_vlbu_v_h_mask,
 +            gen_helper_vlbu_v_w_mask, gen_helper_vlbu_v_d_mask },
 +          { NULL,                     gen_helper_vlhu_v_h_mask,
 +            gen_helper_vlhu_v_w_mask, gen_helper_vlhu_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vlwu_v_w_mask, gen_helper_vlwu_v_d_mask } },
 +        /* unmasked unit stride load */
 +        { { gen_helper_vlb_v_b,  gen_helper_vlb_v_h,
 +            gen_helper_vlb_v_w,  gen_helper_vlb_v_d },
 +          { NULL,                gen_helper_vlh_v_h,
 +            gen_helper_vlh_v_w,  gen_helper_vlh_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vlw_v_w,  gen_helper_vlw_v_d },
 +          { gen_helper_vle_v_b,  gen_helper_vle_v_h,
 +            gen_helper_vle_v_w,  gen_helper_vle_v_d },
 +          { gen_helper_vlbu_v_b, gen_helper_vlbu_v_h,
 +            gen_helper_vlbu_v_w, gen_helper_vlbu_v_d },
 +          { NULL,                gen_helper_vlhu_v_h,
 +            gen_helper_vlhu_v_w, gen_helper_vlhu_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vlwu_v_w, gen_helper_vlwu_v_d } }
 +    };
 +
 +    fn =  fns[a->vm][seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
-+    nd = &nd_table[1];
++
-+    if (nd->used) {
++    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+        qemu_check_nic_model(nd, TYPE_CADENCE_GEM);
++    data = FIELD_DP32(data, VDATA, VM, a->vm);
-+        qdev_set_nic_properties(DEVICE(&s->gem1), nd);
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_us_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
 +static bool ld_us_check(DisasContext *s, arg_r2nfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlb_v, 0, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlh_v, 1, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlw_v, 2, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vle_v, 3, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlbu_v, 4, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhu_v, 5, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwu_v, 6, r2nfvm, ld_us_op, ld_us_check)
 +
 +static bool st_us_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[2][4][4] = {
 +        /* masked unit stride load and store */
 +        { { gen_helper_vsb_v_b_mask,  gen_helper_vsb_v_h_mask,
 +            gen_helper_vsb_v_w_mask,  gen_helper_vsb_v_d_mask },
 +          { NULL,                     gen_helper_vsh_v_h_mask,
 +            gen_helper_vsh_v_w_mask,  gen_helper_vsh_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vsw_v_w_mask,  gen_helper_vsw_v_d_mask },
 +          { gen_helper_vse_v_b_mask,  gen_helper_vse_v_h_mask,
 +            gen_helper_vse_v_w_mask,  gen_helper_vse_v_d_mask } },
 +        /* unmasked unit stride store */
 +        { { gen_helper_vsb_v_b,  gen_helper_vsb_v_h,
 +            gen_helper_vsb_v_w,  gen_helper_vsb_v_d },
 +          { NULL,                gen_helper_vsh_v_h,
 +            gen_helper_vsh_v_w,  gen_helper_vsh_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vsw_v_w,  gen_helper_vsw_v_d },
 +          { gen_helper_vse_v_b,  gen_helper_vse_v_h,
 +            gen_helper_vse_v_w,  gen_helper_vse_v_d } }
 +    };
 +
 +    fn =  fns[a->vm][seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
-+    object_property_set_int(OBJECT(&s->gem0), "revision", GEM_REVISION, errp);
++    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+    object_property_set_int(OBJECT(&s->gem0), "phy-addr", 8, errp);
++    data = FIELD_DP32(data, VDATA, VM, a->vm);
-+    sysbus_realize(SYS_BUS_DEVICE(&s->gem0), errp);
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->gem0), 0,
++    data = FIELD_DP32(data, VDATA, NF, a->nf);
-+                    memmap[MICROCHIP_PFSOC_GEM0].base);
++    return ldst_us_trans(a->rd, a->rs1, data, fn, s);
-+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->gem0), 0,
++}
-+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_GEM0_IRQ));
++
-+
++static bool st_us_check(DisasContext *s, arg_r2nfvm* a)
-+    object_property_set_int(OBJECT(&s->gem1), "revision", GEM_REVISION, errp);
++{
-+    object_property_set_int(OBJECT(&s->gem1), "phy-addr", 9, errp);
++    return (vext_check_isa_ill(s) &&
-+    sysbus_realize(SYS_BUS_DEVICE(&s->gem1), errp);
++            vext_check_reg(s, a->rd, false) &&
-+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->gem1), 0,
++            vext_check_nf(s, a->nf));
-+                    memmap[MICROCHIP_PFSOC_GEM1].base);
++}
-+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->gem1), 0,
++
-+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_GEM1_IRQ));
++GEN_VEXT_TRANS(vsb_v, 0, r2nfvm, st_us_op, st_us_check)
-+
++GEN_VEXT_TRANS(vsh_v, 1, r2nfvm, st_us_op, st_us_check)
-     /* eNVM */
++GEN_VEXT_TRANS(vsw_v, 2, r2nfvm, st_us_op, st_us_check)
-     memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
++GEN_VEXT_TRANS(vse_v, 3, r2nfvm, st_us_op, st_us_check)
-                            memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
++
 +/*
 + *** stride load and store
 + */
 +typedef void gen_helper_ldst_stride(TCGv_ptr, TCGv_ptr, TCGv,
 +                                    TCGv, TCGv_env, TCGv_i32);
 +
 +static bool ldst_stride_trans(uint32_t vd, uint32_t rs1, uint32_t rs2,
 +                              uint32_t data, gen_helper_ldst_stride *fn,
 +                              DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base, stride;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    stride = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    gen_get_gpr(stride, rs2);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, stride, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free(stride);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_stride_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_stride *fn;
 +    static gen_helper_ldst_stride * const fns[7][4] = {
 +        { gen_helper_vlsb_v_b,  gen_helper_vlsb_v_h,
 +          gen_helper_vlsb_v_w,  gen_helper_vlsb_v_d },
 +        { NULL,                 gen_helper_vlsh_v_h,
 +          gen_helper_vlsh_v_w,  gen_helper_vlsh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlsw_v_w,  gen_helper_vlsw_v_d },
 +        { gen_helper_vlse_v_b,  gen_helper_vlse_v_h,
 +          gen_helper_vlse_v_w,  gen_helper_vlse_v_d },
 +        { gen_helper_vlsbu_v_b, gen_helper_vlsbu_v_h,
 +          gen_helper_vlsbu_v_w, gen_helper_vlsbu_v_d },
 +        { NULL,                 gen_helper_vlshu_v_h,
 +          gen_helper_vlshu_v_w, gen_helper_vlshu_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlswu_v_w, gen_helper_vlswu_v_d },
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_stride_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool ld_stride_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlsb_v, 0, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsh_v, 1, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsw_v, 2, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlse_v, 3, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsbu_v, 4, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlshu_v, 5, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlswu_v, 6, rnfvm, ld_stride_op, ld_stride_check)
 +
 +static bool st_stride_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_stride *fn;
 +    static gen_helper_ldst_stride * const fns[4][4] = {
 +        /* masked stride store */
 +        { gen_helper_vssb_v_b,  gen_helper_vssb_v_h,
 +          gen_helper_vssb_v_w,  gen_helper_vssb_v_d },
 +        { NULL,                 gen_helper_vssh_v_h,
 +          gen_helper_vssh_v_w,  gen_helper_vssh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vssw_v_w,  gen_helper_vssw_v_d },
 +        { gen_helper_vsse_v_b,  gen_helper_vsse_v_h,
 +          gen_helper_vsse_v_w,  gen_helper_vsse_v_d }
 +    };
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    return ldst_stride_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool st_stride_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vssb_v, 0, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vssh_v, 1, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vssw_v, 2, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vsse_v, 3, rnfvm, st_stride_op, st_stride_check)
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
      uint8_t lmul;
      uint8_t sew;
      uint16_t vlen;
 +    uint16_t mlen;
      bool vl_eq_vlmax;
  } DisasContext;
@@ -XXX,XX +XXX,XX @@ static void decode_RV32_64C(DisasContext *ctx, uint16_t opcode)
      }
  }
 +static int ex_plus_1(DisasContext *ctx, int nf)
 +{
 +    return nf + 1;
 +}
 +
  #define EX_SH(amount) \
      static int ex_shift_##amount(DisasContext *ctx, int imm) \
      {                                         \
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      ctx->vill = FIELD_EX32(tb_flags, TB_FLAGS, VILL);
      ctx->sew = FIELD_EX32(tb_flags, TB_FLAGS, SEW);
      ctx->lmul = FIELD_EX32(tb_flags, TB_FLAGS, LMUL);
 +    ctx->mlen = 1 << (ctx->sew  + 3 - ctx->lmul);
      ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
  }
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "cpu.h"
 +#include "exec/memop.h"
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
 +#include "tcg/tcg-gvec-desc.h"
 +#include "internals.h"
  #include <math.h>
  target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
      env->vstart = 0;
      return vl;
  }
 +
 +/*
 + * Note that vector data is stored in host-endian 64-bit chunks,
 + * so addressing units smaller than that needs a host-endian fixup.
 + */
 +#ifdef HOST_WORDS_BIGENDIAN
 +#define H1(x)   ((x) ^ 7)
 +#define H1_2(x) ((x) ^ 6)
 +#define H1_4(x) ((x) ^ 4)
 +#define H2(x)   ((x) ^ 3)
 +#define H4(x)   ((x) ^ 1)
 +#define H8(x)   ((x))
 +#else
 +#define H1(x)   (x)
 +#define H1_2(x) (x)
 +#define H1_4(x) (x)
 +#define H2(x)   (x)
 +#define H4(x)   (x)
 +#define H8(x)   (x)
 +#endif
 +
 +static inline uint32_t vext_nf(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, NF);
 +}
 +
 +static inline uint32_t vext_mlen(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, MLEN);
 +}
 +
 +static inline uint32_t vext_vm(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, VM);
 +}
 +
 +static inline uint32_t vext_lmul(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, LMUL);
 +}
 +
 +/*
 + * Get vector group length in bytes. Its range is [64, 2048].
 + *
 + * As simd_desc support at most 256, the max vlen is 512 bits.
 + * So vlen in bytes is encoded as maxsz.
 + */
 +static inline uint32_t vext_maxsz(uint32_t desc)
 +{
 +    return simd_maxsz(desc) << vext_lmul(desc);
 +}
 +
 +/*
 + * This function checks watchpoint before real load operation.
 + *
 + * In softmmu mode, the TLB API probe_access is enough for watchpoint check.
 + * In user mode, there is no watchpoint support now.
 + *
 + * It will trigger an exception if there is no mapping in TLB
 + * and page table walk can't fill the TLB entry. Then the guest
 + * software can return here after process the exception or never return.
 + */
 +static void probe_pages(CPURISCVState *env, target_ulong addr,
 +                        target_ulong len, uintptr_t ra,
 +                        MMUAccessType access_type)
 +{
 +    target_ulong pagelen = -(addr | TARGET_PAGE_MASK);
 +    target_ulong curlen = MIN(pagelen, len);
 +
 +    probe_access(env, addr, curlen, access_type,
 +                 cpu_mmu_index(env, false), ra);
 +    if (len > curlen) {
 +        addr += curlen;
 +        curlen = len - curlen;
 +        probe_access(env, addr, curlen, access_type,
 +                     cpu_mmu_index(env, false), ra);
 +    }
 +}
 +
 +#ifdef HOST_WORDS_BIGENDIAN
 +static void vext_clear(void *tail, uint32_t cnt, uint32_t tot)
 +{
 +    /*
 +     * Split the remaining range to two parts.
 +     * The first part is in the last uint64_t unit.
 +     * The second part start from the next uint64_t unit.
 +     */
 +    int part1 = 0, part2 = tot - cnt;
 +    if (cnt % 8) {
 +        part1 = 8 - (cnt % 8);
 +        part2 = tot - cnt - part1;
 +        memset((void *)((uintptr_t)tail & ~(7ULL)), 0, part1);
 +        memset((void *)(((uintptr_t)tail + 8) & ~(7ULL)), 0, part2);
 +    } else {
 +        memset(tail, 0, part2);
 +    }
 +}
 +#else
 +static void vext_clear(void *tail, uint32_t cnt, uint32_t tot)
 +{
 +    memset(tail, 0, tot - cnt);
 +}
 +#endif
 +
 +static void clearb(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int8_t *cur = ((int8_t *)vd + H1(idx));
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +static void clearh(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int16_t *cur = ((int16_t *)vd + H2(idx));
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +static void clearl(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int32_t *cur = ((int32_t *)vd + H4(idx));
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +static void clearq(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int64_t *cur = (int64_t *)vd + idx;
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +
 +static inline int vext_elem_mask(void *v0, int mlen, int index)
 +{
 +    int idx = (index * mlen) / 64;
 +    int pos = (index * mlen) % 64;
 +    return (((uint64_t *)v0)[idx] >> pos) & 1;
 +}
 +
 +/* elements operations for load and store */
 +typedef void vext_ldst_elem_fn(CPURISCVState *env, target_ulong addr,
 +                               uint32_t idx, void *vd, uintptr_t retaddr);
 +typedef void clear_fn(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot);
 +
 +#define GEN_VEXT_LD_ELEM(NAME, MTYPE, ETYPE, H, LDSUF)     \
 +static void NAME(CPURISCVState *env, abi_ptr addr,         \
 +                 uint32_t idx, void *vd, uintptr_t retaddr)\
 +{                                                          \
 +    MTYPE data;                                            \
 +    ETYPE *cur = ((ETYPE *)vd + H(idx));                   \
 +    data = cpu_##LDSUF##_data_ra(env, addr, retaddr);      \
 +    *cur = data;                                           \
 +}                                                          \
 +
 +GEN_VEXT_LD_ELEM(ldb_b, int8_t,  int8_t,  H1, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_h, int8_t,  int16_t, H2, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_w, int8_t,  int32_t, H4, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_d, int8_t,  int64_t, H8, ldsb)
 +GEN_VEXT_LD_ELEM(ldh_h, int16_t, int16_t, H2, ldsw)
 +GEN_VEXT_LD_ELEM(ldh_w, int16_t, int32_t, H4, ldsw)
 +GEN_VEXT_LD_ELEM(ldh_d, int16_t, int64_t, H8, ldsw)
 +GEN_VEXT_LD_ELEM(ldw_w, int32_t, int32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(ldw_d, int32_t, int64_t, H8, ldl)
 +GEN_VEXT_LD_ELEM(lde_b, int8_t,  int8_t,  H1, ldsb)
 +GEN_VEXT_LD_ELEM(lde_h, int16_t, int16_t, H2, ldsw)
 +GEN_VEXT_LD_ELEM(lde_w, int32_t, int32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(lde_d, int64_t, int64_t, H8, ldq)
 +GEN_VEXT_LD_ELEM(ldbu_b, uint8_t,  uint8_t,  H1, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_h, uint8_t,  uint16_t, H2, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_w, uint8_t,  uint32_t, H4, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_d, uint8_t,  uint64_t, H8, ldub)
 +GEN_VEXT_LD_ELEM(ldhu_h, uint16_t, uint16_t, H2, lduw)
 +GEN_VEXT_LD_ELEM(ldhu_w, uint16_t, uint32_t, H4, lduw)
 +GEN_VEXT_LD_ELEM(ldhu_d, uint16_t, uint64_t, H8, lduw)
 +GEN_VEXT_LD_ELEM(ldwu_w, uint32_t, uint32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(ldwu_d, uint32_t, uint64_t, H8, ldl)
 +
 +#define GEN_VEXT_ST_ELEM(NAME, ETYPE, H, STSUF)            \
 +static void NAME(CPURISCVState *env, abi_ptr addr,         \
 +                 uint32_t idx, void *vd, uintptr_t retaddr)\
 +{                                                          \
 +    ETYPE data = *((ETYPE *)vd + H(idx));                  \
 +    cpu_##STSUF##_data_ra(env, addr, data, retaddr);       \
 +}
 +
 +GEN_VEXT_ST_ELEM(stb_b, int8_t,  H1, stb)
 +GEN_VEXT_ST_ELEM(stb_h, int16_t, H2, stb)
 +GEN_VEXT_ST_ELEM(stb_w, int32_t, H4, stb)
 +GEN_VEXT_ST_ELEM(stb_d, int64_t, H8, stb)
 +GEN_VEXT_ST_ELEM(sth_h, int16_t, H2, stw)
 +GEN_VEXT_ST_ELEM(sth_w, int32_t, H4, stw)
 +GEN_VEXT_ST_ELEM(sth_d, int64_t, H8, stw)
 +GEN_VEXT_ST_ELEM(stw_w, int32_t, H4, stl)
 +GEN_VEXT_ST_ELEM(stw_d, int64_t, H8, stl)
 +GEN_VEXT_ST_ELEM(ste_b, int8_t,  H1, stb)
 +GEN_VEXT_ST_ELEM(ste_h, int16_t, H2, stw)
 +GEN_VEXT_ST_ELEM(ste_w, int32_t, H4, stl)
 +GEN_VEXT_ST_ELEM(ste_d, int64_t, H8, stq)
 +
 +/*
 + *** stride: access vector element from strided memory
 + */
 +static void
 +vext_ldst_stride(void *vd, void *v0, target_ulong base,
 +                 target_ulong stride, CPURISCVState *env,
 +                 uint32_t desc, uint32_t vm,
 +                 vext_ldst_elem_fn *ldst_elem, clear_fn *clear_elem,
 +                 uint32_t esz, uint32_t msz, uintptr_t ra,
 +                 MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        probe_pages(env, base + stride * i, nf * msz, ra, access_type);
 +    }
 +    /* do real access */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            target_ulong addr = base + stride * i + k * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +#define GEN_VEXT_LD_STRIDE(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)       \
 +void HELPER(NAME)(void *vd, void * v0, target_ulong base,               \
 +                  target_ulong stride, CPURISCVState *env,              \
 +                  uint32_t desc)                                        \
 +{                                                                       \
 +    uint32_t vm = vext_vm(desc);                                        \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, vm, LOAD_FN,      \
 +                     CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),            \
 +                     GETPC(), MMU_DATA_LOAD);                           \
 +}
 +
 +GEN_VEXT_LD_STRIDE(vlsb_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LD_STRIDE(vlsb_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlsb_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsb_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsh_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlsh_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsh_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsw_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsw_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlse_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LD_STRIDE(vlse_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlse_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlse_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LD_STRIDE(vlshu_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LD_STRIDE(vlshu_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlshu_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LD_STRIDE(vlswu_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlswu_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_STRIDE(NAME, MTYPE, ETYPE, STORE_FN)                \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  target_ulong stride, CPURISCVState *env,              \
 +                  uint32_t desc)                                        \
 +{                                                                       \
 +    uint32_t vm = vext_vm(desc);                                        \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, vm, STORE_FN,     \
 +                     NULL, sizeof(ETYPE), sizeof(MTYPE),                \
 +                     GETPC(), MMU_DATA_STORE);                          \
 +}
 +
 +GEN_VEXT_ST_STRIDE(vssb_v_b, int8_t,  int8_t,  stb_b)
 +GEN_VEXT_ST_STRIDE(vssb_v_h, int8_t,  int16_t, stb_h)
 +GEN_VEXT_ST_STRIDE(vssb_v_w, int8_t,  int32_t, stb_w)
 +GEN_VEXT_ST_STRIDE(vssb_v_d, int8_t,  int64_t, stb_d)
 +GEN_VEXT_ST_STRIDE(vssh_v_h, int16_t, int16_t, sth_h)
 +GEN_VEXT_ST_STRIDE(vssh_v_w, int16_t, int32_t, sth_w)
 +GEN_VEXT_ST_STRIDE(vssh_v_d, int16_t, int64_t, sth_d)
 +GEN_VEXT_ST_STRIDE(vssw_v_w, int32_t, int32_t, stw_w)
 +GEN_VEXT_ST_STRIDE(vssw_v_d, int32_t, int64_t, stw_d)
 +GEN_VEXT_ST_STRIDE(vsse_v_b, int8_t,  int8_t,  ste_b)
 +GEN_VEXT_ST_STRIDE(vsse_v_h, int16_t, int16_t, ste_h)
 +GEN_VEXT_ST_STRIDE(vsse_v_w, int32_t, int32_t, ste_w)
 +GEN_VEXT_ST_STRIDE(vsse_v_d, int64_t, int64_t, ste_d)
 +
 +/*
 + *** unit-stride: access elements stored contiguously in memory
 + */
 +
 +/* unmasked unit-stride load and store operation*/
 +static void
 +vext_ldst_us(void *vd, target_ulong base, CPURISCVState *env, uint32_t desc,
 +             vext_ldst_elem_fn *ldst_elem, clear_fn *clear_elem,
 +             uint32_t esz, uint32_t msz, uintptr_t ra,
 +             MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access */
 +    probe_pages(env, base, env->vl * nf * msz, ra, access_type);
 +    /* load bytes from guest memory */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        while (k < nf) {
 +            target_ulong addr = base + (i * nf + k) * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +/*
 + * masked unit-stride load and store operation will be a special case of stride,
 + * stride = NF * sizeof (MTYPE)
 + */
 +
 +#define GEN_VEXT_LD_US(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)           \
 +void HELPER(NAME##_mask)(void *vd, void *v0, target_ulong base,         \
 +                         CPURISCVState *env, uint32_t desc)             \
 +{                                                                       \
 +    uint32_t stride = vext_nf(desc) * sizeof(MTYPE);                    \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, false, LOAD_FN,   \
 +                     CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),            \
 +                     GETPC(), MMU_DATA_LOAD);                           \
 +}                                                                       \
 +                                                                        \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  CPURISCVState *env, uint32_t desc)                    \
 +{                                                                       \
 +    vext_ldst_us(vd, base, env, desc, LOAD_FN, CLEAR_FN,                \
 +                 sizeof(ETYPE), sizeof(MTYPE), GETPC(), MMU_DATA_LOAD); \
 +}
 +
 +GEN_VEXT_LD_US(vlb_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LD_US(vlb_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LD_US(vlb_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LD_US(vlb_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LD_US(vlh_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LD_US(vlh_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LD_US(vlh_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LD_US(vlw_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LD_US(vlw_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LD_US(vle_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LD_US(vle_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LD_US(vle_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LD_US(vle_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LD_US(vlbu_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LD_US(vlbu_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LD_US(vlbu_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LD_US(vlbu_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LD_US(vlhu_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LD_US(vlhu_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LD_US(vlhu_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LD_US(vlwu_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LD_US(vlwu_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_US(NAME, MTYPE, ETYPE, STORE_FN)                    \
 +void HELPER(NAME##_mask)(void *vd, void *v0, target_ulong base,         \
 +                         CPURISCVState *env, uint32_t desc)             \
 +{                                                                       \
 +    uint32_t stride = vext_nf(desc) * sizeof(MTYPE);                    \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, false, STORE_FN,  \
 +                     NULL, sizeof(ETYPE), sizeof(MTYPE),                \
 +                     GETPC(), MMU_DATA_STORE);                          \
 +}                                                                       \
 +                                                                        \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  CPURISCVState *env, uint32_t desc)                    \
 +{                                                                       \
 +    vext_ldst_us(vd, base, env, desc, STORE_FN, NULL,                   \
 +                 sizeof(ETYPE), sizeof(MTYPE), GETPC(), MMU_DATA_STORE);\
 +}
 +
 +GEN_VEXT_ST_US(vsb_v_b, int8_t,  int8_t , stb_b)
 +GEN_VEXT_ST_US(vsb_v_h, int8_t,  int16_t, stb_h)
 +GEN_VEXT_ST_US(vsb_v_w, int8_t,  int32_t, stb_w)
 +GEN_VEXT_ST_US(vsb_v_d, int8_t,  int64_t, stb_d)
 +GEN_VEXT_ST_US(vsh_v_h, int16_t, int16_t, sth_h)
 +GEN_VEXT_ST_US(vsh_v_w, int16_t, int32_t, sth_w)
 +GEN_VEXT_ST_US(vsh_v_d, int16_t, int64_t, sth_d)
 +GEN_VEXT_ST_US(vsw_v_w, int32_t, int32_t, stw_w)
 +GEN_VEXT_ST_US(vsw_v_d, int32_t, int64_t, stw_d)
 +GEN_VEXT_ST_US(vse_v_b, int8_t,  int8_t , ste_b)
 +GEN_VEXT_ST_US(vse_v_h, int16_t, int16_t, ste_h)
 +GEN_VEXT_ST_US(vse_v_w, int32_t, int32_t, ste_w)
 +GEN_VEXT_ST_US(vse_v_d, int64_t, int64_t, ste_d)
 --
-.28.0
+.27.0

-New patch
+[PULL v2 10/64] target/riscv: add vector index load and store instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Vector indexed operations add the contents of each element of the
 vector offset operand specified by vs2 to the base effective address
 to give the effective address of each element.
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-8-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  35 +++++++
  target/riscv/insn32.decode              |  13 +++
  target/riscv/insn_trans/trans_rvv.inc.c | 129 ++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 116 +++++++++++++++++++++
 files changed, 293 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsse_v_b, void, ptr, ptr, tl, tl, env, i32)
  DEF_HELPER_6(vsse_v_h, void, ptr, ptr, tl, tl, env, i32)
  DEF_HELPER_6(vsse_v_w, void, ptr, ptr, tl, tl, env, i32)
  DEF_HELPER_6(vsse_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlxb_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxb_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxb_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxb_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxh_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxh_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxh_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxhu_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxhu_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxhu_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxwu_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxwu_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxh_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxh_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxh_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vssh_v     ... 010 . ..... ..... 101 ..... 0100111 @r_nfvm
  vssw_v     ... 010 . ..... ..... 110 ..... 0100111 @r_nfvm
  vsse_v     ... 010 . ..... ..... 111 ..... 0100111 @r_nfvm
 +vlxb_v     ... 111 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlxh_v     ... 111 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlxw_v     ... 111 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vlxe_v     ... 011 . ..... ..... 111 ..... 0000111 @r_nfvm
 +vlxbu_v    ... 011 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlxhu_v    ... 011 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlxwu_v    ... 011 . ..... ..... 110 ..... 0000111 @r_nfvm
 +# Vector ordered-indexed and unordered-indexed store insns.
 +vsxb_v     ... -11 . ..... ..... 000 ..... 0100111 @r_nfvm
 +vsxh_v     ... -11 . ..... ..... 101 ..... 0100111 @r_nfvm
 +vsxw_v     ... -11 . ..... ..... 110 ..... 0100111 @r_nfvm
 +vsxe_v     ... -11 . ..... ..... 111 ..... 0100111 @r_nfvm
 +
  # *** new major opcode OP-V ***
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vssb_v, 0, rnfvm, st_stride_op, st_stride_check)
  GEN_VEXT_TRANS(vssh_v, 1, rnfvm, st_stride_op, st_stride_check)
  GEN_VEXT_TRANS(vssw_v, 2, rnfvm, st_stride_op, st_stride_check)
  GEN_VEXT_TRANS(vsse_v, 3, rnfvm, st_stride_op, st_stride_check)
 +
 +/*
 + *** index load and store
 + */
 +typedef void gen_helper_ldst_index(TCGv_ptr, TCGv_ptr, TCGv,
 +                                   TCGv_ptr, TCGv_env, TCGv_i32);
 +
 +static bool ldst_index_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
 +                             uint32_t data, gen_helper_ldst_index *fn,
 +                             DisasContext *s)
 +{
 +    TCGv_ptr dest, mask, index;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    index = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(index, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, index, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(index);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_index_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_index *fn;
 +    static gen_helper_ldst_index * const fns[7][4] = {
 +        { gen_helper_vlxb_v_b,  gen_helper_vlxb_v_h,
 +          gen_helper_vlxb_v_w,  gen_helper_vlxb_v_d },
 +        { NULL,                 gen_helper_vlxh_v_h,
 +          gen_helper_vlxh_v_w,  gen_helper_vlxh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlxw_v_w,  gen_helper_vlxw_v_d },
 +        { gen_helper_vlxe_v_b,  gen_helper_vlxe_v_h,
 +          gen_helper_vlxe_v_w,  gen_helper_vlxe_v_d },
 +        { gen_helper_vlxbu_v_b, gen_helper_vlxbu_v_h,
 +          gen_helper_vlxbu_v_w, gen_helper_vlxbu_v_d },
 +        { NULL,                 gen_helper_vlxhu_v_h,
 +          gen_helper_vlxhu_v_w, gen_helper_vlxhu_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlxwu_v_w, gen_helper_vlxwu_v_d },
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_index_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool ld_index_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlxb_v, 0, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxh_v, 1, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxw_v, 2, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxe_v, 3, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxbu_v, 4, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxhu_v, 5, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxwu_v, 6, rnfvm, ld_index_op, ld_index_check)
 +
 +static bool st_index_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_index *fn;
 +    static gen_helper_ldst_index * const fns[4][4] = {
 +        { gen_helper_vsxb_v_b,  gen_helper_vsxb_v_h,
 +          gen_helper_vsxb_v_w,  gen_helper_vsxb_v_d },
 +        { NULL,                 gen_helper_vsxh_v_h,
 +          gen_helper_vsxh_v_w,  gen_helper_vsxh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vsxw_v_w,  gen_helper_vsxw_v_d },
 +        { gen_helper_vsxe_v_b,  gen_helper_vsxe_v_h,
 +          gen_helper_vsxe_v_w,  gen_helper_vsxe_v_d }
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_index_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool st_index_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vsxb_v, 0, rnfvm, st_index_op, st_index_check)
 +GEN_VEXT_TRANS(vsxh_v, 1, rnfvm, st_index_op, st_index_check)
 +GEN_VEXT_TRANS(vsxw_v, 2, rnfvm, st_index_op, st_index_check)
 +GEN_VEXT_TRANS(vsxe_v, 3, rnfvm, st_index_op, st_index_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_US(vse_v_b, int8_t,  int8_t , ste_b)
  GEN_VEXT_ST_US(vse_v_h, int16_t, int16_t, ste_h)
  GEN_VEXT_ST_US(vse_v_w, int32_t, int32_t, ste_w)
  GEN_VEXT_ST_US(vse_v_d, int64_t, int64_t, ste_d)
 +
 +/*
 + *** index: access vector element from indexed memory
 + */
 +typedef target_ulong vext_get_index_addr(target_ulong base,
 +        uint32_t idx, void *vs2);
 +
 +#define GEN_VEXT_GET_INDEX_ADDR(NAME, ETYPE, H)        \
 +static target_ulong NAME(target_ulong base,            \
 +                         uint32_t idx, void *vs2)      \
 +{                                                      \
 +    return (base + *((ETYPE *)vs2 + H(idx)));          \
 +}
 +
 +GEN_VEXT_GET_INDEX_ADDR(idx_b, int8_t,  H1)
 +GEN_VEXT_GET_INDEX_ADDR(idx_h, int16_t, H2)
 +GEN_VEXT_GET_INDEX_ADDR(idx_w, int32_t, H4)
 +GEN_VEXT_GET_INDEX_ADDR(idx_d, int64_t, H8)
 +
 +static inline void
 +vext_ldst_index(void *vd, void *v0, target_ulong base,
 +                void *vs2, CPURISCVState *env, uint32_t desc,
 +                vext_get_index_addr get_index_addr,
 +                vext_ldst_elem_fn *ldst_elem,
 +                clear_fn *clear_elem,
 +                uint32_t esz, uint32_t msz, uintptr_t ra,
 +                MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        probe_pages(env, get_index_addr(base, i, vs2), nf * msz, ra,
 +                    access_type);
 +    }
 +    /* load bytes from guest memory */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            abi_ptr addr = get_index_addr(base, i, vs2) + k * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +#define GEN_VEXT_LD_INDEX(NAME, MTYPE, ETYPE, INDEX_FN, LOAD_FN, CLEAR_FN) \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                   \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)            \
 +{                                                                          \
 +    vext_ldst_index(vd, v0, base, vs2, env, desc, INDEX_FN,                \
 +                    LOAD_FN, CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),       \
 +                    GETPC(), MMU_DATA_LOAD);                               \
 +}
 +
 +GEN_VEXT_LD_INDEX(vlxb_v_b,  int8_t,   int8_t,   idx_b, ldb_b,  clearb)
 +GEN_VEXT_LD_INDEX(vlxb_v_h,  int8_t,   int16_t,  idx_h, ldb_h,  clearh)
 +GEN_VEXT_LD_INDEX(vlxb_v_w,  int8_t,   int32_t,  idx_w, ldb_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxb_v_d,  int8_t,   int64_t,  idx_d, ldb_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxh_v_h,  int16_t,  int16_t,  idx_h, ldh_h,  clearh)
 +GEN_VEXT_LD_INDEX(vlxh_v_w,  int16_t,  int32_t,  idx_w, ldh_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxh_v_d,  int16_t,  int64_t,  idx_d, ldh_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxw_v_w,  int32_t,  int32_t,  idx_w, ldw_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxw_v_d,  int32_t,  int64_t,  idx_d, ldw_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxe_v_b,  int8_t,   int8_t,   idx_b, lde_b,  clearb)
 +GEN_VEXT_LD_INDEX(vlxe_v_h,  int16_t,  int16_t,  idx_h, lde_h,  clearh)
 +GEN_VEXT_LD_INDEX(vlxe_v_w,  int32_t,  int32_t,  idx_w, lde_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxe_v_d,  int64_t,  int64_t,  idx_d, lde_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxbu_v_b, uint8_t,  uint8_t,  idx_b, ldbu_b, clearb)
 +GEN_VEXT_LD_INDEX(vlxbu_v_h, uint8_t,  uint16_t, idx_h, ldbu_h, clearh)
 +GEN_VEXT_LD_INDEX(vlxbu_v_w, uint8_t,  uint32_t, idx_w, ldbu_w, clearl)
 +GEN_VEXT_LD_INDEX(vlxbu_v_d, uint8_t,  uint64_t, idx_d, ldbu_d, clearq)
 +GEN_VEXT_LD_INDEX(vlxhu_v_h, uint16_t, uint16_t, idx_h, ldhu_h, clearh)
 +GEN_VEXT_LD_INDEX(vlxhu_v_w, uint16_t, uint32_t, idx_w, ldhu_w, clearl)
 +GEN_VEXT_LD_INDEX(vlxhu_v_d, uint16_t, uint64_t, idx_d, ldhu_d, clearq)
 +GEN_VEXT_LD_INDEX(vlxwu_v_w, uint32_t, uint32_t, idx_w, ldwu_w, clearl)
 +GEN_VEXT_LD_INDEX(vlxwu_v_d, uint32_t, uint64_t, idx_d, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_INDEX(NAME, MTYPE, ETYPE, INDEX_FN, STORE_FN)\
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,         \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)  \
 +{                                                                \
 +    vext_ldst_index(vd, v0, base, vs2, env, desc, INDEX_FN,      \
 +                    STORE_FN, NULL, sizeof(ETYPE), sizeof(MTYPE),\
 +                    GETPC(), MMU_DATA_STORE);                    \
 +}
 +
 +GEN_VEXT_ST_INDEX(vsxb_v_b, int8_t,  int8_t,  idx_b, stb_b)
 +GEN_VEXT_ST_INDEX(vsxb_v_h, int8_t,  int16_t, idx_h, stb_h)
 +GEN_VEXT_ST_INDEX(vsxb_v_w, int8_t,  int32_t, idx_w, stb_w)
 +GEN_VEXT_ST_INDEX(vsxb_v_d, int8_t,  int64_t, idx_d, stb_d)
 +GEN_VEXT_ST_INDEX(vsxh_v_h, int16_t, int16_t, idx_h, sth_h)
 +GEN_VEXT_ST_INDEX(vsxh_v_w, int16_t, int32_t, idx_w, sth_w)
 +GEN_VEXT_ST_INDEX(vsxh_v_d, int16_t, int64_t, idx_d, sth_d)
 +GEN_VEXT_ST_INDEX(vsxw_v_w, int32_t, int32_t, idx_w, stw_w)
 +GEN_VEXT_ST_INDEX(vsxw_v_d, int32_t, int64_t, idx_d, stw_d)
 +GEN_VEXT_ST_INDEX(vsxe_v_b, int8_t,  int8_t,  idx_b, ste_b)
 +GEN_VEXT_ST_INDEX(vsxe_v_h, int16_t, int16_t, idx_h, ste_h)
 +GEN_VEXT_ST_INDEX(vsxe_v_w, int32_t, int32_t, idx_w, ste_w)
 +GEN_VEXT_ST_INDEX(vsxe_v_d, int64_t, int64_t, idx_d, ste_d)
 --
 .27.0

-New patch
+[PULL v2 11/64] target/riscv: add fault-only-first unit stride load
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 The unit-stride fault-only-fault load instructions are used to
 vectorize loops with data-dependent exit conditions(while loops).
 These instructions execute as a regular load except that they
 will only take a trap on element 0.
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-9-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  22 +++++
  target/riscv/insn32.decode              |   7 ++
  target/riscv/insn_trans/trans_rvv.inc.c |  73 ++++++++++++++++
  target/riscv/vector_helper.c            | 110 ++++++++++++++++++++++++
 files changed, 212 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vsxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vsxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vsxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_5(vlbff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwuff_v_d, void, ptr, ptr, tl, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vle_v      ... 000 . 00000 ..... 111 ..... 0000111 @r2_nfvm
  vlbu_v     ... 000 . 00000 ..... 000 ..... 0000111 @r2_nfvm
  vlhu_v     ... 000 . 00000 ..... 101 ..... 0000111 @r2_nfvm
  vlwu_v     ... 000 . 00000 ..... 110 ..... 0000111 @r2_nfvm
 +vlbff_v    ... 100 . 10000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhff_v    ... 100 . 10000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwff_v    ... 100 . 10000 ..... 110 ..... 0000111 @r2_nfvm
 +vleff_v    ... 000 . 10000 ..... 111 ..... 0000111 @r2_nfvm
 +vlbuff_v   ... 000 . 10000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhuff_v   ... 000 . 10000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwuff_v   ... 000 . 10000 ..... 110 ..... 0000111 @r2_nfvm
  vsb_v      ... 000 . 00000 ..... 000 ..... 0100111 @r2_nfvm
  vsh_v      ... 000 . 00000 ..... 101 ..... 0100111 @r2_nfvm
  vsw_v      ... 000 . 00000 ..... 110 ..... 0100111 @r2_nfvm
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vsxb_v, 0, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxh_v, 1, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxw_v, 2, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxe_v, 3, rnfvm, st_index_op, st_index_check)
 +
 +/*
 + *** unit stride fault-only-first load
 + */
 +static bool ldff_trans(uint32_t vd, uint32_t rs1, uint32_t data,
 +                       gen_helper_ldst_us *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ldff_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[7][4] = {
 +        { gen_helper_vlbff_v_b,  gen_helper_vlbff_v_h,
 +          gen_helper_vlbff_v_w,  gen_helper_vlbff_v_d },
 +        { NULL,                  gen_helper_vlhff_v_h,
 +          gen_helper_vlhff_v_w,  gen_helper_vlhff_v_d },
 +        { NULL,                  NULL,
 +          gen_helper_vlwff_v_w,  gen_helper_vlwff_v_d },
 +        { gen_helper_vleff_v_b,  gen_helper_vleff_v_h,
 +          gen_helper_vleff_v_w,  gen_helper_vleff_v_d },
 +        { gen_helper_vlbuff_v_b, gen_helper_vlbuff_v_h,
 +          gen_helper_vlbuff_v_w, gen_helper_vlbuff_v_d },
 +        { NULL,                  gen_helper_vlhuff_v_h,
 +          gen_helper_vlhuff_v_w, gen_helper_vlhuff_v_d },
 +        { NULL,                  NULL,
 +          gen_helper_vlwuff_v_w, gen_helper_vlwuff_v_d }
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldff_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
 +GEN_VEXT_TRANS(vlbff_v, 0, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhff_v, 1, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwff_v, 2, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vleff_v, 3, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlbuff_v, 4, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhuff_v, 5, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwuff_v, 6, r2nfvm, ldff_op, ld_us_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_INDEX(vsxe_v_b, int8_t,  int8_t,  idx_b, ste_b)
  GEN_VEXT_ST_INDEX(vsxe_v_h, int16_t, int16_t, idx_h, ste_h)
  GEN_VEXT_ST_INDEX(vsxe_v_w, int32_t, int32_t, idx_w, ste_w)
  GEN_VEXT_ST_INDEX(vsxe_v_d, int64_t, int64_t, idx_d, ste_d)
 +
 +/*
 + *** unit-stride fault-only-fisrt load instructions
 + */
 +static inline void
 +vext_ldff(void *vd, void *v0, target_ulong base,
 +          CPURISCVState *env, uint32_t desc,
 +          vext_ldst_elem_fn *ldst_elem,
 +          clear_fn *clear_elem,
 +          uint32_t esz, uint32_t msz, uintptr_t ra)
 +{
 +    void *host;
 +    uint32_t i, k, vl = 0;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    target_ulong addr, offset, remain;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        addr = base + nf * i * msz;
 +        if (i == 0) {
 +            probe_pages(env, addr, nf * msz, ra, MMU_DATA_LOAD);
 +        } else {
 +            /* if it triggers an exception, no need to check watchpoint */
 +            remain = nf * msz;
 +            while (remain > 0) {
 +                offset = -(addr | TARGET_PAGE_MASK);
 +                host = tlb_vaddr_to_host(env, addr, MMU_DATA_LOAD,
 +                                         cpu_mmu_index(env, false));
 +                if (host) {
 +#ifdef CONFIG_USER_ONLY
 +                    if (page_check_range(addr, nf * msz, PAGE_READ) < 0) {
 +                        vl = i;
 +                        goto ProbeSuccess;
 +                    }
 +#else
 +                    probe_pages(env, addr, nf * msz, ra, MMU_DATA_LOAD);
 +#endif
 +                } else {
 +                    vl = i;
 +                    goto ProbeSuccess;
 +                }
 +                if (remain <=  offset) {
 +                    break;
 +                }
 +                remain -= offset;
 +                addr += offset;
 +            }
 +        }
 +    }
 +ProbeSuccess:
 +    /* load bytes from guest memory */
 +    if (vl != 0) {
 +        env->vl = vl;
 +    }
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            target_ulong addr = base + (i * nf + k) * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (vl != 0) {
 +        return;
 +    }
 +    for (k = 0; k < nf; k++) {
 +        clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +    }
 +}
 +
 +#define GEN_VEXT_LDFF(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)     \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,         \
 +                  CPURISCVState *env, uint32_t desc)             \
 +{                                                                \
 +    vext_ldff(vd, v0, base, env, desc, LOAD_FN, CLEAR_FN,        \
 +              sizeof(ETYPE), sizeof(MTYPE), GETPC());            \
 +}
 +
 +GEN_VEXT_LDFF(vlbff_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LDFF(vlbff_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LDFF(vlbff_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LDFF(vlbff_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LDFF(vlhff_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LDFF(vlhff_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LDFF(vlhff_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LDFF(vlwff_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LDFF(vlwff_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LDFF(vleff_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LDFF(vleff_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LDFF(vleff_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LDFF(vleff_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LDFF(vlbuff_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LDFF(vlbuff_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LDFF(vlbuff_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LDFF(vlbuff_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LDFF(vlhuff_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LDFF(vlhuff_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LDFF(vlhuff_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LDFF(vlwuff_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LDFF(vlwuff_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 --
 .27.0

-New patch
+[PULL v2 12/64] target/riscv: add vector amo operations
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Vector AMOs operate as if aq and rl bits were zero on each element
+with regard to ordering relative to other instructions in the same hart.
+Vector AMOs provide no ordering guarantee between element operations
+in the same vector AMO instruction
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-Id: <20200701152549.1218-10-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  29 +++++
+ target/riscv/internals.h                |   1 +
+ target/riscv/insn32-64.decode           |  11 ++
+ target/riscv/insn32.decode              |  13 +++
+ target/riscv/insn_trans/trans_rvv.inc.c | 138 ++++++++++++++++++++++
+ target/riscv/vector_helper.c            | 147 ++++++++++++++++++++++++
+files changed, 339 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vlhuff_v_w, void, ptr, ptr, tl, env, i32)
+ DEF_HELPER_5(vlhuff_v_d, void, ptr, ptr, tl, env, i32)
+ DEF_HELPER_5(vlwuff_v_w, void, ptr, ptr, tl, env, i32)
+ DEF_HELPER_5(vlwuff_v_d, void, ptr, ptr, tl, env, i32)
++#ifdef TARGET_RISCV64
++DEF_HELPER_6(vamoswapw_v_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoswapd_v_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoaddw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoaddd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoxorw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoxord_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoandw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoandd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoorw_v_d,   void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoord_v_d,   void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamominw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomind_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomaxw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomaxd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamominuw_v_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamominud_v_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomaxuw_v_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomaxud_v_d, void, ptr, ptr, tl, ptr, env, i32)
++#endif
++DEF_HELPER_6(vamoswapw_v_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoaddw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoxorw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoandw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamoorw_v_w,   void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamominw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomaxw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamominuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vamomaxuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/internals.h b/target/riscv/internals.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/internals.h
++++ b/target/riscv/internals.h
+@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, MLEN, 0, 8)
+ FIELD(VDATA, VM, 8, 1)
+ FIELD(VDATA, LMUL, 9, 2)
+ FIELD(VDATA, NF, 11, 4)
++FIELD(VDATA, WD, 11, 1)
+ #endif
+diff --git a/target/riscv/insn32-64.decode b/target/riscv/insn32-64.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32-64.decode
++++ b/target/riscv/insn32-64.decode
+@@ -XXX,XX +XXX,XX @@ amomax_d   10100 . . ..... ..... 011 ..... 0101111 @atom_st
+ amominu_d  11000 . . ..... ..... 011 ..... 0101111 @atom_st
+ amomaxu_d  11100 . . ..... ..... 011 ..... 0101111 @atom_st
++#*** Vector AMO operations (in addition to Zvamo) ***
++vamoswapd_v     00001 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamoaddd_v      00000 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamoxord_v      00100 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamoandd_v      01100 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamoord_v       01000 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamomind_v      10000 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamomaxd_v      10100 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamominud_v     11000 . . ..... ..... 111 ..... 0101111 @r_wdvm
++vamomaxud_v     11100 . . ..... ..... 111 ..... 0101111 @r_wdvm
++
+ # *** RV64F Standard Extension (in addition to RV32F) ***
+ fcvt_l_s   1100000  00010 ..... ... ..... 1010011 @r2_rm
+ fcvt_lu_s  1100000  00011 ..... ... ..... 1010011 @r2_rm
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@
+ &u    imm rd
+ &shift     shamt rs1 rd
+ &atomic    aq rl rs2 rs1 rd
++&rwdvm     vm wd rd rs1 rs2
+ &r2nfvm    vm rd rs1 nf
+ &rnfvm     vm rd rs1 rs2 nf
+@@ -XXX,XX +XXX,XX @@
+ @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
+ @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
++@r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
+ @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
+ @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
+@@ -XXX,XX +XXX,XX @@ vsxh_v     ... -11 . ..... ..... 101 ..... 0100111 @r_nfvm
+ vsxw_v     ... -11 . ..... ..... 110 ..... 0100111 @r_nfvm
+ vsxe_v     ... -11 . ..... ..... 111 ..... 0100111 @r_nfvm
++#*** Vector AMO operations are encoded under the standard AMO major opcode ***
++vamoswapw_v     00001 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamoaddw_v      00000 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamoxorw_v      00100 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamoandw_v      01100 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamoorw_v       01000 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamominw_v      10000 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamomaxw_v      10100 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamominuw_v     11000 . . ..... ..... 110 ..... 0101111 @r_wdvm
++vamomaxuw_v     11100 . . ..... ..... 110 ..... 0101111 @r_wdvm
++
+ # *** new major opcode OP-V ***
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vleff_v, 3, r2nfvm, ldff_op, ld_us_check)
+ GEN_VEXT_TRANS(vlbuff_v, 4, r2nfvm, ldff_op, ld_us_check)
+ GEN_VEXT_TRANS(vlhuff_v, 5, r2nfvm, ldff_op, ld_us_check)
+ GEN_VEXT_TRANS(vlwuff_v, 6, r2nfvm, ldff_op, ld_us_check)
++
++/*
++ *** vector atomic operation
++ */
++typedef void gen_helper_amo(TCGv_ptr, TCGv_ptr, TCGv, TCGv_ptr,
++                            TCGv_env, TCGv_i32);
++
++static bool amo_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
++                      uint32_t data, gen_helper_amo *fn, DisasContext *s)
++{
++    TCGv_ptr dest, mask, index;
++    TCGv base;
++    TCGv_i32 desc;
++
++    TCGLabel *over = gen_new_label();
++    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++
++    dest = tcg_temp_new_ptr();
++    mask = tcg_temp_new_ptr();
++    index = tcg_temp_new_ptr();
++    base = tcg_temp_new();
++    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
++
++    gen_get_gpr(base, rs1);
++    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
++    tcg_gen_addi_ptr(index, cpu_env, vreg_ofs(s, vs2));
++    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
++
++    fn(dest, mask, base, index, cpu_env, desc);
++
++    tcg_temp_free_ptr(dest);
++    tcg_temp_free_ptr(mask);
++    tcg_temp_free_ptr(index);
++    tcg_temp_free(base);
++    tcg_temp_free_i32(desc);
++    gen_set_label(over);
++    return true;
++}
++
++static bool amo_op(DisasContext *s, arg_rwdvm *a, uint8_t seq)
++{
++    uint32_t data = 0;
++    gen_helper_amo *fn;
++    static gen_helper_amo *const fnsw[9] = {
++        /* no atomic operation */
++        gen_helper_vamoswapw_v_w,
++        gen_helper_vamoaddw_v_w,
++        gen_helper_vamoxorw_v_w,
++        gen_helper_vamoandw_v_w,
++        gen_helper_vamoorw_v_w,
++        gen_helper_vamominw_v_w,
++        gen_helper_vamomaxw_v_w,
++        gen_helper_vamominuw_v_w,
++        gen_helper_vamomaxuw_v_w
++    };
++#ifdef TARGET_RISCV64
++    static gen_helper_amo *const fnsd[18] = {
++        gen_helper_vamoswapw_v_d,
++        gen_helper_vamoaddw_v_d,
++        gen_helper_vamoxorw_v_d,
++        gen_helper_vamoandw_v_d,
++        gen_helper_vamoorw_v_d,
++        gen_helper_vamominw_v_d,
++        gen_helper_vamomaxw_v_d,
++        gen_helper_vamominuw_v_d,
++        gen_helper_vamomaxuw_v_d,
++        gen_helper_vamoswapd_v_d,
++        gen_helper_vamoaddd_v_d,
++        gen_helper_vamoxord_v_d,
++        gen_helper_vamoandd_v_d,
++        gen_helper_vamoord_v_d,
++        gen_helper_vamomind_v_d,
++        gen_helper_vamomaxd_v_d,
++        gen_helper_vamominud_v_d,
++        gen_helper_vamomaxud_v_d
++    };
++#endif
++
++    if (tb_cflags(s->base.tb) & CF_PARALLEL) {
++        gen_helper_exit_atomic(cpu_env);
++        s->base.is_jmp = DISAS_NORETURN;
++        return true;
++    } else {
++        if (s->sew == 3) {
++#ifdef TARGET_RISCV64
++            fn = fnsd[seq];
++#else
++            /* Check done in amo_check(). */
++            g_assert_not_reached();
++#endif
++        } else {
++            fn = fnsw[seq];
++        }
++    }
++
++    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++    data = FIELD_DP32(data, VDATA, VM, a->vm);
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++    data = FIELD_DP32(data, VDATA, WD, a->wd);
++    return amo_trans(a->rd, a->rs1, a->rs2, data, fn, s);
++}
++/*
++ * There are two rules check here.
++ *
++ * 1. SEW must be at least as wide as the AMO memory element size.
++ *
++ * 2. If SEW is greater than XLEN, an illegal instruction exception is raised.
++ */
++static bool amo_check(DisasContext *s, arg_rwdvm* a)
++{
++    return (!s->vill && has_ext(s, RVA) &&
++            (!a->wd || vext_check_overlap_mask(s, a->rd, a->vm, false)) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, false) &&
++            ((1 << s->sew) <= sizeof(target_ulong)) &&
++            ((1 << s->sew) >= 4));
++}
++
++GEN_VEXT_TRANS(vamoswapw_v, 0, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoaddw_v, 1, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoxorw_v, 2, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoandw_v, 3, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoorw_v, 4, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamominw_v, 5, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamomaxw_v, 6, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamominuw_v, 7, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamomaxuw_v, 8, rwdvm, amo_op, amo_check)
++#ifdef TARGET_RISCV64
++GEN_VEXT_TRANS(vamoswapd_v, 9, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoaddd_v, 10, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoxord_v, 11, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoandd_v, 12, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamoord_v, 13, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamomind_v, 14, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamomaxd_v, 15, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamominud_v, 16, rwdvm, amo_op, amo_check)
++GEN_VEXT_TRANS(vamomaxud_v, 17, rwdvm, amo_op, amo_check)
++#endif
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ static inline uint32_t vext_lmul(uint32_t desc)
+     return FIELD_EX32(simd_data(desc), VDATA, LMUL);
+ }
++static uint32_t vext_wd(uint32_t desc)
++{
++    return (simd_data(desc) >> 11) & 0x1;
++}
++
+ /*
+  * Get vector group length in bytes. Its range is [64, 2048].
+  *
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_LDFF(vlhuff_v_w, uint16_t, uint32_t, ldhu_w, clearl)
+ GEN_VEXT_LDFF(vlhuff_v_d, uint16_t, uint64_t, ldhu_d, clearq)
+ GEN_VEXT_LDFF(vlwuff_v_w, uint32_t, uint32_t, ldwu_w, clearl)
+ GEN_VEXT_LDFF(vlwuff_v_d, uint32_t, uint64_t, ldwu_d, clearq)
++
++/*
++ *** Vector AMO Operations (Zvamo)
++ */
++typedef void vext_amo_noatomic_fn(void *vs3, target_ulong addr,
++                                  uint32_t wd, uint32_t idx, CPURISCVState *env,
++                                  uintptr_t retaddr);
++
++/* no atomic opreation for vector atomic insructions */
++#define DO_SWAP(N, M) (M)
++#define DO_AND(N, M)  (N & M)
++#define DO_XOR(N, M)  (N ^ M)
++#define DO_OR(N, M)   (N | M)
++#define DO_ADD(N, M)  (N + M)
++
++#define GEN_VEXT_AMO_NOATOMIC_OP(NAME, ESZ, MSZ, H, DO_OP, SUF) \
++static void                                                     \
++vext_##NAME##_noatomic_op(void *vs3, target_ulong addr,         \
++                          uint32_t wd, uint32_t idx,            \
++                          CPURISCVState *env, uintptr_t retaddr)\
++{                                                               \
++    typedef int##ESZ##_t ETYPE;                                 \
++    typedef int##MSZ##_t MTYPE;                                 \
++    typedef uint##MSZ##_t UMTYPE __attribute__((unused));       \
++    ETYPE *pe3 = (ETYPE *)vs3 + H(idx);                         \
++    MTYPE  a = cpu_ld##SUF##_data(env, addr), b = *pe3;         \
++                                                                \
++    cpu_st##SUF##_data(env, addr, DO_OP(a, b));                 \
++    if (wd) {                                                   \
++        *pe3 = a;                                               \
++    }                                                           \
++}
++
++/* Signed min/max */
++#define DO_MAX(N, M)  ((N) >= (M) ? (N) : (M))
++#define DO_MIN(N, M)  ((N) >= (M) ? (M) : (N))
++
++/* Unsigned min/max */
++#define DO_MAXU(N, M) DO_MAX((UMTYPE)N, (UMTYPE)M)
++#define DO_MINU(N, M) DO_MIN((UMTYPE)N, (UMTYPE)M)
++
++GEN_VEXT_AMO_NOATOMIC_OP(vamoswapw_v_w, 32, 32, H4, DO_SWAP, l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoaddw_v_w,  32, 32, H4, DO_ADD,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoxorw_v_w,  32, 32, H4, DO_XOR,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoandw_v_w,  32, 32, H4, DO_AND,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoorw_v_w,   32, 32, H4, DO_OR,   l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamominw_v_w,  32, 32, H4, DO_MIN,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomaxw_v_w,  32, 32, H4, DO_MAX,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamominuw_v_w, 32, 32, H4, DO_MINU, l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomaxuw_v_w, 32, 32, H4, DO_MAXU, l)
++#ifdef TARGET_RISCV64
++GEN_VEXT_AMO_NOATOMIC_OP(vamoswapw_v_d, 64, 32, H8, DO_SWAP, l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoswapd_v_d, 64, 64, H8, DO_SWAP, q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoaddw_v_d,  64, 32, H8, DO_ADD,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoaddd_v_d,  64, 64, H8, DO_ADD,  q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoxorw_v_d,  64, 32, H8, DO_XOR,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoxord_v_d,  64, 64, H8, DO_XOR,  q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoandw_v_d,  64, 32, H8, DO_AND,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoandd_v_d,  64, 64, H8, DO_AND,  q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoorw_v_d,   64, 32, H8, DO_OR,   l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamoord_v_d,   64, 64, H8, DO_OR,   q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamominw_v_d,  64, 32, H8, DO_MIN,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomind_v_d,  64, 64, H8, DO_MIN,  q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomaxw_v_d,  64, 32, H8, DO_MAX,  l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomaxd_v_d,  64, 64, H8, DO_MAX,  q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamominuw_v_d, 64, 32, H8, DO_MINU, l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamominud_v_d, 64, 64, H8, DO_MINU, q)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomaxuw_v_d, 64, 32, H8, DO_MAXU, l)
++GEN_VEXT_AMO_NOATOMIC_OP(vamomaxud_v_d, 64, 64, H8, DO_MAXU, q)
++#endif
++
++static inline void
++vext_amo_noatomic(void *vs3, void *v0, target_ulong base,
++                  void *vs2, CPURISCVState *env, uint32_t desc,
++                  vext_get_index_addr get_index_addr,
++                  vext_amo_noatomic_fn *noatomic_op,
++                  clear_fn *clear_elem,
++                  uint32_t esz, uint32_t msz, uintptr_t ra)
++{
++    uint32_t i;
++    target_long addr;
++    uint32_t wd = vext_wd(desc);
++    uint32_t vm = vext_vm(desc);
++    uint32_t mlen = vext_mlen(desc);
++    uint32_t vlmax = vext_maxsz(desc) / esz;
++
++    for (i = 0; i < env->vl; i++) {
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++            continue;
++        }
++        probe_pages(env, get_index_addr(base, i, vs2), msz, ra, MMU_DATA_LOAD);
++        probe_pages(env, get_index_addr(base, i, vs2), msz, ra, MMU_DATA_STORE);
++    }
++    for (i = 0; i < env->vl; i++) {
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++            continue;
++        }
++        addr = get_index_addr(base, i, vs2);
++        noatomic_op(vs3, addr, wd, i, env, ra);
++    }
++    clear_elem(vs3, env->vl, env->vl * esz, vlmax * esz);
++}
++
++#define GEN_VEXT_AMO(NAME, MTYPE, ETYPE, INDEX_FN, CLEAR_FN)    \
++void HELPER(NAME)(void *vs3, void *v0, target_ulong base,       \
++                  void *vs2, CPURISCVState *env, uint32_t desc) \
++{                                                               \
++    vext_amo_noatomic(vs3, v0, base, vs2, env, desc,            \
++                      INDEX_FN, vext_##NAME##_noatomic_op,      \
++                      CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),   \
++                      GETPC());                                 \
++}
++
++#ifdef TARGET_RISCV64
++GEN_VEXT_AMO(vamoswapw_v_d, int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoswapd_v_d, int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoaddw_v_d,  int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoaddd_v_d,  int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoxorw_v_d,  int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoxord_v_d,  int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoandw_v_d,  int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoandd_v_d,  int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoorw_v_d,   int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamoord_v_d,   int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamominw_v_d,  int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamomind_v_d,  int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamomaxw_v_d,  int32_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamomaxd_v_d,  int64_t,  int64_t,  idx_d, clearq)
++GEN_VEXT_AMO(vamominuw_v_d, uint32_t, uint64_t, idx_d, clearq)
++GEN_VEXT_AMO(vamominud_v_d, uint64_t, uint64_t, idx_d, clearq)
++GEN_VEXT_AMO(vamomaxuw_v_d, uint32_t, uint64_t, idx_d, clearq)
++GEN_VEXT_AMO(vamomaxud_v_d, uint64_t, uint64_t, idx_d, clearq)
++#endif
++GEN_VEXT_AMO(vamoswapw_v_w, int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamoaddw_v_w,  int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamoxorw_v_w,  int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamoandw_v_w,  int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamoorw_v_w,   int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamominw_v_w,  int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamomaxw_v_w,  int32_t,  int32_t,  idx_w, clearl)
++GEN_VEXT_AMO(vamominuw_v_w, uint32_t, uint32_t, idx_w, clearl)
++GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
+--
+.27.0

-New patch
+[PULL v2 13/64] target/riscv: vector single-width integer add and subtract
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-Id: <20200701152549.1218-11-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  25 ++
+ target/riscv/insn32.decode              |  10 +
+ target/riscv/insn_trans/trans_rvv.inc.c | 291 ++++++++++++++++++++++++
+ target/riscv/vector_helper.c            | 183 +++++++++++++++
+files changed, 509 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vamominw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vamomaxw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vamominuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vamomaxuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_FLAGS_4(vec_rsubs8, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
++DEF_HELPER_FLAGS_4(vec_rsubs16, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
++DEF_HELPER_FLAGS_4(vec_rsubs32, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
++DEF_HELPER_FLAGS_4(vec_rsubs64, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@
+ &u    imm rd
+ &shift     shamt rs1 rd
+ &atomic    aq rl rs2 rs1 rd
++&rmrr      vm rd rs1 rs2
+ &rwdvm     vm wd rd rs1 rs2
+ &r2nfvm    vm rd rs1 nf
+ &rnfvm     vm rd rs1 rs2 nf
+@@ -XXX,XX +XXX,XX @@
+ @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
+ @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
++@r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
+ @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
+ @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
+@@ -XXX,XX +XXX,XX @@ vamominuw_v     11000 . . ..... ..... 110 ..... 0101111 @r_wdvm
+ vamomaxuw_v     11100 . . ..... ..... 110 ..... 0101111 @r_wdvm
+ # *** new major opcode OP-V ***
++vadd_vv         000000 . ..... ..... 000 ..... 1010111 @r_vm
++vadd_vx         000000 . ..... ..... 100 ..... 1010111 @r_vm
++vadd_vi         000000 . ..... ..... 011 ..... 1010111 @r_vm
++vsub_vv         000010 . ..... ..... 000 ..... 1010111 @r_vm
++vsub_vx         000010 . ..... ..... 100 ..... 1010111 @r_vm
++vrsub_vx        000011 . ..... ..... 100 ..... 1010111 @r_vm
++vrsub_vi        000011 . ..... ..... 011 ..... 1010111 @r_vm
++
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vamomaxd_v, 15, rwdvm, amo_op, amo_check)
+ GEN_VEXT_TRANS(vamominud_v, 16, rwdvm, amo_op, amo_check)
+ GEN_VEXT_TRANS(vamomaxud_v, 17, rwdvm, amo_op, amo_check)
+ #endif
++
++/*
++ *** Vector Integer Arithmetic Instructions
++ */
++#define MAXSZ(s) (s->vlen >> (3 - s->lmul))
++
++static bool opivv_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, false) &&
++            vext_check_reg(s, a->rs1, false));
++}
++
++typedef void GVecGen3Fn(unsigned, uint32_t, uint32_t,
++                        uint32_t, uint32_t, uint32_t);
++
++static inline bool
++do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
++              gen_helper_gvec_4_ptr *fn)
++{
++    TCGLabel *over = gen_new_label();
++    if (!opivv_check(s, a)) {
++        return false;
++    }
++
++    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++
++    if (a->vm && s->vl_eq_vlmax) {
++        gvec_fn(s->sew, vreg_ofs(s, a->rd),
++                vreg_ofs(s, a->rs2), vreg_ofs(s, a->rs1),
++                MAXSZ(s), MAXSZ(s));
++    } else {
++        uint32_t data = 0;
++
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++        data = FIELD_DP32(data, VDATA, VM, a->vm);
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
++                           vreg_ofs(s, a->rs1), vreg_ofs(s, a->rs2),
++                           cpu_env, 0, s->vlen / 8, data, fn);
++    }
++    gen_set_label(over);
++    return true;
++}
++
++/* OPIVV with GVEC IR */
++#define GEN_OPIVV_GVEC_TRANS(NAME, SUF) \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++{                                                                  \
++    static gen_helper_gvec_4_ptr * const fns[4] = {                \
++        gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
++        gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
++    };                                                             \
++    return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
++}
++
++GEN_OPIVV_GVEC_TRANS(vadd_vv, add)
++GEN_OPIVV_GVEC_TRANS(vsub_vv, sub)
++
++typedef void gen_helper_opivx(TCGv_ptr, TCGv_ptr, TCGv, TCGv_ptr,
++                              TCGv_env, TCGv_i32);
++
++static bool opivx_trans(uint32_t vd, uint32_t rs1, uint32_t vs2, uint32_t vm,
++                        gen_helper_opivx *fn, DisasContext *s)
++{
++    TCGv_ptr dest, src2, mask;
++    TCGv src1;
++    TCGv_i32 desc;
++    uint32_t data = 0;
++
++    TCGLabel *over = gen_new_label();
++    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++
++    dest = tcg_temp_new_ptr();
++    mask = tcg_temp_new_ptr();
++    src2 = tcg_temp_new_ptr();
++    src1 = tcg_temp_new();
++    gen_get_gpr(src1, rs1);
++
++    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++    data = FIELD_DP32(data, VDATA, VM, vm);
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
++
++    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
++    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
++    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
++
++    fn(dest, mask, src1, src2, cpu_env, desc);
++
++    tcg_temp_free_ptr(dest);
++    tcg_temp_free_ptr(mask);
++    tcg_temp_free_ptr(src2);
++    tcg_temp_free(src1);
++    tcg_temp_free_i32(desc);
++    gen_set_label(over);
++    return true;
++}
++
++static bool opivx_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, false));
++}
++
++typedef void GVecGen2sFn(unsigned, uint32_t, uint32_t, TCGv_i64,
++                         uint32_t, uint32_t);
++
++static inline bool
++do_opivx_gvec(DisasContext *s, arg_rmrr *a, GVecGen2sFn *gvec_fn,
++              gen_helper_opivx *fn)
++{
++    if (!opivx_check(s, a)) {
++        return false;
++    }
++
++    if (a->vm && s->vl_eq_vlmax) {
++        TCGv_i64 src1 = tcg_temp_new_i64();
++        TCGv tmp = tcg_temp_new();
++
++        gen_get_gpr(tmp, a->rs1);
++        tcg_gen_ext_tl_i64(src1, tmp);
++        gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
++                src1, MAXSZ(s), MAXSZ(s));
++
++        tcg_temp_free_i64(src1);
++        tcg_temp_free(tmp);
++        return true;
++    }
++    return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
++}
++
++/* OPIVX with GVEC IR */
++#define GEN_OPIVX_GVEC_TRANS(NAME, SUF) \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++{                                                                  \
++    static gen_helper_opivx * const fns[4] = {                     \
++        gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
++        gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
++    };                                                             \
++    return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
++}
++
++GEN_OPIVX_GVEC_TRANS(vadd_vx, adds)
++GEN_OPIVX_GVEC_TRANS(vsub_vx, subs)
++
++static void gen_vec_rsub8_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
++{
++    tcg_gen_vec_sub8_i64(d, b, a);
++}
++
++static void gen_vec_rsub16_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
++{
++    tcg_gen_vec_sub8_i64(d, b, a);
++}
++
++static void gen_rsub_i32(TCGv_i32 ret, TCGv_i32 arg1, TCGv_i32 arg2)
++{
++    tcg_gen_sub_i32(ret, arg2, arg1);
++}
++
++static void gen_rsub_i64(TCGv_i64 ret, TCGv_i64 arg1, TCGv_i64 arg2)
++{
++    tcg_gen_sub_i64(ret, arg2, arg1);
++}
++
++static void gen_rsub_vec(unsigned vece, TCGv_vec r, TCGv_vec a, TCGv_vec b)
++{
++    tcg_gen_sub_vec(vece, r, b, a);
++}
++
++static void tcg_gen_gvec_rsubs(unsigned vece, uint32_t dofs, uint32_t aofs,
++                               TCGv_i64 c, uint32_t oprsz, uint32_t maxsz)
++{
++    static const GVecGen2s rsub_op[4] = {
++        { .fni8 = gen_vec_rsub8_i64,
++          .fniv = gen_rsub_vec,
++          .fno = gen_helper_vec_rsubs8,
++          .vece = MO_8 },
++        { .fni8 = gen_vec_rsub16_i64,
++          .fniv = gen_rsub_vec,
++          .fno = gen_helper_vec_rsubs16,
++          .vece = MO_16 },
++        { .fni4 = gen_rsub_i32,
++          .fniv = gen_rsub_vec,
++          .fno = gen_helper_vec_rsubs32,
++          .vece = MO_32 },
++        { .fni8 = gen_rsub_i64,
++          .fniv = gen_rsub_vec,
++          .fno = gen_helper_vec_rsubs64,
++          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
++          .vece = MO_64 },
++    };
++
++    tcg_debug_assert(vece <= MO_64);
++    tcg_gen_gvec_2s(dofs, aofs, oprsz, maxsz, c, &rsub_op[vece]);
++}
++
++GEN_OPIVX_GVEC_TRANS(vrsub_vx, rsubs)
++
++static bool opivi_trans(uint32_t vd, uint32_t imm, uint32_t vs2, uint32_t vm,
++                        gen_helper_opivx *fn, DisasContext *s, int zx)
++{
++    TCGv_ptr dest, src2, mask;
++    TCGv src1;
++    TCGv_i32 desc;
++    uint32_t data = 0;
++
++    TCGLabel *over = gen_new_label();
++    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++
++    dest = tcg_temp_new_ptr();
++    mask = tcg_temp_new_ptr();
++    src2 = tcg_temp_new_ptr();
++    if (zx) {
++        src1 = tcg_const_tl(imm);
++    } else {
++        src1 = tcg_const_tl(sextract64(imm, 0, 5));
++    }
++    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++    data = FIELD_DP32(data, VDATA, VM, vm);
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
++
++    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
++    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
++    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
++
++    fn(dest, mask, src1, src2, cpu_env, desc);
++
++    tcg_temp_free_ptr(dest);
++    tcg_temp_free_ptr(mask);
++    tcg_temp_free_ptr(src2);
++    tcg_temp_free(src1);
++    tcg_temp_free_i32(desc);
++    gen_set_label(over);
++    return true;
++}
++
++typedef void GVecGen2iFn(unsigned, uint32_t, uint32_t, int64_t,
++                         uint32_t, uint32_t);
++
++static inline bool
++do_opivi_gvec(DisasContext *s, arg_rmrr *a, GVecGen2iFn *gvec_fn,
++              gen_helper_opivx *fn, int zx)
++{
++    if (!opivx_check(s, a)) {
++        return false;
++    }
++
++    if (a->vm && s->vl_eq_vlmax) {
++        if (zx) {
++            gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
++                    extract64(a->rs1, 0, 5), MAXSZ(s), MAXSZ(s));
++        } else {
++            gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
++                    sextract64(a->rs1, 0, 5), MAXSZ(s), MAXSZ(s));
++        }
++    } else {
++        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s, zx);
++    }
++    return true;
++}
++
++/* OPIVI with GVEC IR */
++#define GEN_OPIVI_GVEC_TRANS(NAME, ZX, OPIVX, SUF) \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++{                                                                  \
++    static gen_helper_opivx * const fns[4] = {                     \
++        gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,            \
++        gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,            \
++    };                                                             \
++    return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF,                 \
++                         fns[s->sew], ZX);                         \
++}
++
++GEN_OPIVI_GVEC_TRANS(vadd_vi, 0, vadd_vx, addi)
++
++static void tcg_gen_gvec_rsubi(unsigned vece, uint32_t dofs, uint32_t aofs,
++                               int64_t c, uint32_t oprsz, uint32_t maxsz)
++{
++    TCGv_i64 tmp = tcg_const_i64(c);
++    tcg_gen_gvec_rsubs(vece, dofs, aofs, tmp, oprsz, maxsz);
++    tcg_temp_free_i64(tmp);
++}
++
++GEN_OPIVI_GVEC_TRANS(vrsub_vi, 0, vrsub_vx, rsubi)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamominw_v_w,  int32_t,  int32_t,  idx_w, clearl)
+ GEN_VEXT_AMO(vamomaxw_v_w,  int32_t,  int32_t,  idx_w, clearl)
+ GEN_VEXT_AMO(vamominuw_v_w, uint32_t, uint32_t, idx_w, clearl)
+ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
++
++/*
++ *** Vector Integer Arithmetic Instructions
++ */
++
++/* expand macro args before macro */
++#define RVVCALL(macro, ...)  macro(__VA_ARGS__)
++
++/* (TD, T1, T2, TX1, TX2) */
++#define OP_SSS_B int8_t, int8_t, int8_t, int8_t, int8_t
++#define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
++#define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
++#define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
++
++/* operation of two vector elements */
++typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
++
++#define OPIVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
++static void do_##NAME(void *vd, void *vs1, void *vs2, int i)    \
++{                                                               \
++    TX1 s1 = *((T1 *)vs1 + HS1(i));                             \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                             \
++    *((TD *)vd + HD(i)) = OP(s2, s1);                           \
++}
++#define DO_SUB(N, M) (N - M)
++#define DO_RSUB(N, M) (M - N)
++
++RVVCALL(OPIVV2, vadd_vv_b, OP_SSS_B, H1, H1, H1, DO_ADD)
++RVVCALL(OPIVV2, vadd_vv_h, OP_SSS_H, H2, H2, H2, DO_ADD)
++RVVCALL(OPIVV2, vadd_vv_w, OP_SSS_W, H4, H4, H4, DO_ADD)
++RVVCALL(OPIVV2, vadd_vv_d, OP_SSS_D, H8, H8, H8, DO_ADD)
++RVVCALL(OPIVV2, vsub_vv_b, OP_SSS_B, H1, H1, H1, DO_SUB)
++RVVCALL(OPIVV2, vsub_vv_h, OP_SSS_H, H2, H2, H2, DO_SUB)
++RVVCALL(OPIVV2, vsub_vv_w, OP_SSS_W, H4, H4, H4, DO_SUB)
++RVVCALL(OPIVV2, vsub_vv_d, OP_SSS_D, H8, H8, H8, DO_SUB)
++
++static void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
++                       CPURISCVState *env, uint32_t desc,
++                       uint32_t esz, uint32_t dsz,
++                       opivv2_fn *fn, clear_fn *clearfn)
++{
++    uint32_t vlmax = vext_maxsz(desc) / esz;
++    uint32_t mlen = vext_mlen(desc);
++    uint32_t vm = vext_vm(desc);
++    uint32_t vl = env->vl;
++    uint32_t i;
++
++    for (i = 0; i < vl; i++) {
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++            continue;
++        }
++        fn(vd, vs1, vs2, i);
++    }
++    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++}
++
++/* generate the helpers for OPIVV */
++#define GEN_VEXT_VV(NAME, ESZ, DSZ, CLEAR_FN)             \
++void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
++                  void *vs2, CPURISCVState *env,          \
++                  uint32_t desc)                          \
++{                                                         \
++    do_vext_vv(vd, v0, vs1, vs2, env, desc, ESZ, DSZ,     \
++               do_##NAME, CLEAR_FN);                      \
++}
++
++GEN_VEXT_VV(vadd_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vadd_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vadd_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vadd_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vsub_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vsub_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vsub_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vsub_vv_d, 8, 8, clearq)
++
++typedef void opivx2_fn(void *vd, target_long s1, void *vs2, int i);
++
++/*
++ * (T1)s1 gives the real operator type.
++ * (TX1)(T1)s1 expands the operator type of widen or narrow operations.
++ */
++#define OPIVX2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
++static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
++{                                                                   \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
++    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1);                      \
++}
++
++RVVCALL(OPIVX2, vadd_vx_b, OP_SSS_B, H1, H1, DO_ADD)
++RVVCALL(OPIVX2, vadd_vx_h, OP_SSS_H, H2, H2, DO_ADD)
++RVVCALL(OPIVX2, vadd_vx_w, OP_SSS_W, H4, H4, DO_ADD)
++RVVCALL(OPIVX2, vadd_vx_d, OP_SSS_D, H8, H8, DO_ADD)
++RVVCALL(OPIVX2, vsub_vx_b, OP_SSS_B, H1, H1, DO_SUB)
++RVVCALL(OPIVX2, vsub_vx_h, OP_SSS_H, H2, H2, DO_SUB)
++RVVCALL(OPIVX2, vsub_vx_w, OP_SSS_W, H4, H4, DO_SUB)
++RVVCALL(OPIVX2, vsub_vx_d, OP_SSS_D, H8, H8, DO_SUB)
++RVVCALL(OPIVX2, vrsub_vx_b, OP_SSS_B, H1, H1, DO_RSUB)
++RVVCALL(OPIVX2, vrsub_vx_h, OP_SSS_H, H2, H2, DO_RSUB)
++RVVCALL(OPIVX2, vrsub_vx_w, OP_SSS_W, H4, H4, DO_RSUB)
++RVVCALL(OPIVX2, vrsub_vx_d, OP_SSS_D, H8, H8, DO_RSUB)
++
++static void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
++                       CPURISCVState *env, uint32_t desc,
++                       uint32_t esz, uint32_t dsz,
++                       opivx2_fn fn, clear_fn *clearfn)
++{
++    uint32_t vlmax = vext_maxsz(desc) / esz;
++    uint32_t mlen = vext_mlen(desc);
++    uint32_t vm = vext_vm(desc);
++    uint32_t vl = env->vl;
++    uint32_t i;
++
++    for (i = 0; i < vl; i++) {
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++            continue;
++        }
++        fn(vd, s1, vs2, i);
++    }
++    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++}
++
++/* generate the helpers for OPIVX */
++#define GEN_VEXT_VX(NAME, ESZ, DSZ, CLEAR_FN)             \
++void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
++                  void *vs2, CPURISCVState *env,          \
++                  uint32_t desc)                          \
++{                                                         \
++    do_vext_vx(vd, v0, s1, vs2, env, desc, ESZ, DSZ,      \
++               do_##NAME, CLEAR_FN);                      \
++}
++
++GEN_VEXT_VX(vadd_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vadd_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vadd_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vadd_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vsub_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vsub_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vsub_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vsub_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vrsub_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vrsub_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vrsub_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vrsub_vx_d, 8, 8, clearq)
++
++void HELPER(vec_rsubs8)(void *d, void *a, uint64_t b, uint32_t desc)
++{
++    intptr_t oprsz = simd_oprsz(desc);
++    intptr_t i;
++
++    for (i = 0; i < oprsz; i += sizeof(uint8_t)) {
++        *(uint8_t *)(d + i) = (uint8_t)b - *(uint8_t *)(a + i);
++    }
++}
++
++void HELPER(vec_rsubs16)(void *d, void *a, uint64_t b, uint32_t desc)
++{
++    intptr_t oprsz = simd_oprsz(desc);
++    intptr_t i;
++
++    for (i = 0; i < oprsz; i += sizeof(uint16_t)) {
++        *(uint16_t *)(d + i) = (uint16_t)b - *(uint16_t *)(a + i);
++    }
++}
++
++void HELPER(vec_rsubs32)(void *d, void *a, uint64_t b, uint32_t desc)
++{
++    intptr_t oprsz = simd_oprsz(desc);
++    intptr_t i;
++
++    for (i = 0; i < oprsz; i += sizeof(uint32_t)) {
++        *(uint32_t *)(d + i) = (uint32_t)b - *(uint32_t *)(a + i);
++    }
++}
++
++void HELPER(vec_rsubs64)(void *d, void *a, uint64_t b, uint32_t desc)
++{
++    intptr_t oprsz = simd_oprsz(desc);
++    intptr_t i;
++
++    for (i = 0; i < oprsz; i += sizeof(uint64_t)) {
++        *(uint64_t *)(d + i) = b - *(uint64_t *)(a + i);
++    }
++}
+--
+.27.0

-[PULL 18/30] hw/riscv: sifive_u: Connect a DMA controller
+[PULL v2 14/64] target/riscv: vector widening integer add and subtract
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-SiFive FU540 SoC integrates a platform DMA controller with 4 DMA
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-channels. This connects the exsiting SiFive PDMA model to the SoC,
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 and adds its device tree data as well.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1598924352-89526-17-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-12-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/sifive_u.h | 11 +++++++++++
+ target/riscv/helper.h                   |  49 +++++++
- hw/riscv/sifive_u.c         | 30 ++++++++++++++++++++++++++++++
+ target/riscv/insn32.decode              |  16 ++
- hw/riscv/Kconfig            |  1 +
+ target/riscv/insn_trans/trans_rvv.inc.c | 186 ++++++++++++++++++++++++
-files changed, 42 insertions(+)
+ target/riscv/vector_helper.c            | 111 ++++++++++++++
 files changed, 362 insertions(+)
-diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/sifive_u.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/sifive_u.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(vec_rsubs8, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
- #ifndef HW_SIFIVE_U_H
+ DEF_HELPER_FLAGS_4(vec_rsubs16, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
- #define HW_SIFIVE_U_H
+ DEF_HELPER_FLAGS_4(vec_rsubs32, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ DEF_HELPER_FLAGS_4(vec_rsubs64, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
-+#include "hw/dma/sifive_pdma.h"
++
- #include "hw/net/cadence_gem.h"
++DEF_HELPER_6(vwaddu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/riscv_hart.h"
++DEF_HELPER_6(vwaddu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/sifive_cpu.h"
++DEF_HELPER_6(vwaddu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ typedef struct SiFiveUSoCState {
++DEF_HELPER_6(vwsubu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-     SiFiveUPRCIState prci;
++DEF_HELPER_6(vwsubu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-     SIFIVEGPIOState gpio;
++DEF_HELPER_6(vwsubu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-     SiFiveUOTPState otp;
++DEF_HELPER_6(vwadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+    SiFivePDMAState dma;
++DEF_HELPER_6(vwadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-     CadenceGEMState gem;
++DEF_HELPER_6(vwadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-     uint32_t serial;
++DEF_HELPER_6(vwsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ enum {
++DEF_HELPER_6(vwsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-     SIFIVE_U_MROM,
++DEF_HELPER_6(vwaddu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_CLINT,
++DEF_HELPER_6(vwaddu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_L2CC,
++DEF_HELPER_6(vwaddu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+    SIFIVE_U_PDMA,
++DEF_HELPER_6(vwsubu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_L2LIM,
++DEF_HELPER_6(vwsubu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_PLIC,
++DEF_HELPER_6(vwsubu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_PRCI,
++DEF_HELPER_6(vwadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ enum {
++DEF_HELPER_6(vwadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_GPIO_IRQ13 = 20,
++DEF_HELPER_6(vwadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_GPIO_IRQ14 = 21,
++DEF_HELPER_6(vwsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-     SIFIVE_U_GPIO_IRQ15 = 22,
++DEF_HELPER_6(vwsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ0 = 23,
++DEF_HELPER_6(vwsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ1 = 24,
++DEF_HELPER_6(vwaddu_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ2 = 25,
++DEF_HELPER_6(vwaddu_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ3 = 26,
++DEF_HELPER_6(vwaddu_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ4 = 27,
++DEF_HELPER_6(vwsubu_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ5 = 28,
++DEF_HELPER_6(vwsubu_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ6 = 29,
++DEF_HELPER_6(vwsubu_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+    SIFIVE_U_PDMA_IRQ7 = 30,
++DEF_HELPER_6(vwadd_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
-     SIFIVE_U_GEM_IRQ = 0x35
++DEF_HELPER_6(vwadd_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
- };
++DEF_HELPER_6(vwadd_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwsub_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
++DEF_HELPER_6(vwsub_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_u.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/sifive_u.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vsub_vv         000010 . ..... ..... 000 ..... 1010111 @r_vm
-  * 4) GPIO (General Purpose Input/Output Controller)
+ vsub_vx         000010 . ..... ..... 100 ..... 1010111 @r_vm
-  * 5) OTP (One-Time Programmable) memory with stored serial number
+ vrsub_vx        000011 . ..... ..... 100 ..... 1010111 @r_vm
-  * 6) GEM (Gigabit Ethernet Controller) and management block
+ vrsub_vi        000011 . ..... ..... 011 ..... 1010111 @r_vm
-+ * 7) DMA (Direct Memory Access Controller)
++vwaddu_vv       110000 . ..... ..... 010 ..... 1010111 @r_vm
-  *
++vwaddu_vx       110000 . ..... ..... 110 ..... 1010111 @r_vm
-  * This board currently generates devicetree dynamically that indicates at least
++vwadd_vv        110001 . ..... ..... 010 ..... 1010111 @r_vm
-  * two harts and up to five harts.
++vwadd_vx        110001 . ..... ..... 110 ..... 1010111 @r_vm
-@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
++vwsubu_vv       110010 . ..... ..... 010 ..... 1010111 @r_vm
-     [SIFIVE_U_MROM] =     {     0x1000,     0xf000 },
++vwsubu_vx       110010 . ..... ..... 110 ..... 1010111 @r_vm
-     [SIFIVE_U_CLINT] =    {  0x2000000,    0x10000 },
++vwsub_vv        110011 . ..... ..... 010 ..... 1010111 @r_vm
-     [SIFIVE_U_L2CC] =     {  0x2010000,     0x1000 },
++vwsub_vx        110011 . ..... ..... 110 ..... 1010111 @r_vm
-+    [SIFIVE_U_PDMA] =     {  0x3000000,   0x100000 },
++vwaddu_wv       110100 . ..... ..... 010 ..... 1010111 @r_vm
-     [SIFIVE_U_L2LIM] =    {  0x8000000,  0x2000000 },
++vwaddu_wx       110100 . ..... ..... 110 ..... 1010111 @r_vm
-     [SIFIVE_U_PLIC] =     {  0xc000000,  0x4000000 },
++vwadd_wv        110101 . ..... ..... 010 ..... 1010111 @r_vm
-     [SIFIVE_U_PRCI] =     { 0x10000000,     0x1000 },
++vwadd_wx        110101 . ..... ..... 110 ..... 1010111 @r_vm
-@@ -XXX,XX +XXX,XX @@ static void create_fdt(SiFiveUState *s, const struct MemmapEntry *memmap,
++vwsubu_wv       110110 . ..... ..... 010 ..... 1010111 @r_vm
-     qemu_fdt_setprop_string(fdt, nodename, "compatible", "gpio-restart");
++vwsubu_wx       110110 . ..... ..... 110 ..... 1010111 @r_vm
-     g_free(nodename);
++vwsub_wv        110111 . ..... ..... 010 ..... 1010111 @r_vm
++vwsub_wx        110111 . ..... ..... 110 ..... 1010111 @r_vm
-+    nodename = g_strdup_printf("/soc/dma@%lx",
-+        (long)memmap[SIFIVE_U_PDMA].base);
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-+    qemu_fdt_add_subnode(fdt, nodename);
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-+    qemu_fdt_setprop_cell(fdt, nodename, "#dma-cells", 1);
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-+    qemu_fdt_setprop_cells(fdt, nodename, "interrupts",
+index XXXXXXX..XXXXXXX 100644
-+        SIFIVE_U_PDMA_IRQ0, SIFIVE_U_PDMA_IRQ1, SIFIVE_U_PDMA_IRQ2,
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+        SIFIVE_U_PDMA_IRQ3, SIFIVE_U_PDMA_IRQ4, SIFIVE_U_PDMA_IRQ5,
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-+        SIFIVE_U_PDMA_IRQ6, SIFIVE_U_PDMA_IRQ7);
+@@ -XXX,XX +XXX,XX @@ static bool vext_check_nf(DisasContext *s, uint32_t nf)
-+    qemu_fdt_setprop_cell(fdt, nodename, "interrupt-parent", plic_phandle);
+     return (1 << s->lmul) * nf <= 8;
 +    qemu_fdt_setprop_cells(fdt, nodename, "reg",
 +        0x0, memmap[SIFIVE_U_PDMA].base,
 +        0x0, memmap[SIFIVE_U_PDMA].size);
 +    qemu_fdt_setprop_string(fdt, nodename, "compatible",
 +                            "sifive,fu540-c000-pdma");
 +    g_free(nodename);
 +
      nodename = g_strdup_printf("/soc/cache-controller@%lx",
          (long)memmap[SIFIVE_U_L2CC].base);
      qemu_fdt_add_subnode(fdt, nodename);
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_instance_init(Object *obj)
      object_initialize_child(obj, "otp", &s->otp, TYPE_SIFIVE_U_OTP);
      object_initialize_child(obj, "gem", &s->gem, TYPE_CADENCE_GEM);
      object_initialize_child(obj, "gpio", &s->gpio, TYPE_SIFIVE_GPIO);
 +    object_initialize_child(obj, "pdma", &s->dma, TYPE_SIFIVE_PDMA);
  }
- static void sifive_u_soc_realize(DeviceState *dev, Error **errp)
++/*
-@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_realize(DeviceState *dev, Error **errp)
++ * The destination vector register group cannot overlap a source vector register
-                                             SIFIVE_U_GPIO_IRQ0 + i));
++ * group of a different element width. (Section 11.2)
 + */
 +static inline bool vext_check_overlap_group(int rd, int dlen, int rs, int slen)
 +{
 +    return ((rd >= rs + slen) || (rs >= rd + dlen));
 +}
  /* common translation macro */
  #define GEN_VEXT_TRANS(NAME, SEQ, ARGTYPE, OP, CHECK)      \
  static bool trans_##NAME(DisasContext *s, arg_##ARGTYPE *a)\
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_gvec_rsubi(unsigned vece, uint32_t dofs, uint32_t aofs,
  }
  GEN_OPIVI_GVEC_TRANS(vrsub_vi, 0, vrsub_vx, rsubi)
 +
 +/* Vector Widening Integer Add/Subtract */
 +
 +/* OPIVV with WIDEN */
 +static bool opivv_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
 +                                     1 << s->lmul) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opivv_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_gvec_4_ptr *fn,
 +                           bool (*checkfn)(DisasContext *, arg_rmrr *))
 +{
 +    if (checkfn(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1),
 +                           vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8,
 +                           data, fn);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
 +#define GEN_OPIVV_WIDEN_TRANS(NAME, CHECK) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_gvec_4_ptr * const fns[3] = {          \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opivv_widen(s, a, fns[s->sew], CHECK);         \
 +}
 +
 +GEN_OPIVV_WIDEN_TRANS(vwaddu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwadd_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsubu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsub_vv, opivv_widen_check)
 +
 +/* OPIVX with WIDEN */
 +static bool opivx_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opivx_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_opivx *fn)
 +{
 +    if (opivx_widen_check(s, a)) {
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +    }
 +    return true;
 +}
 +
 +#define GEN_OPIVX_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_opivx * const fns[3] = {               \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opivx_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIVX_WIDEN_TRANS(vwaddu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwadd_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsubu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsub_vx)
 +
 +/* WIDEN OPIVV with WIDEN */
 +static bool opiwv_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opiwv_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_gvec_4_ptr *fn)
 +{
 +    if (opiwv_widen_check(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1),
 +                           vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8, data, fn);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
 +#define GEN_OPIWV_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_gvec_4_ptr * const fns[3] = {          \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opiwv_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIWV_WIDEN_TRANS(vwaddu_wv)
 +GEN_OPIWV_WIDEN_TRANS(vwadd_wv)
 +GEN_OPIWV_WIDEN_TRANS(vwsubu_wv)
 +GEN_OPIWV_WIDEN_TRANS(vwsub_wv)
 +
 +/* WIDEN OPIVX with WIDEN */
 +static bool opiwx_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opiwx_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_opivx *fn)
 +{
 +    if (opiwx_widen_check(s, a)) {
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +    }
 +    return false;
 +}
 +
 +#define GEN_OPIWX_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_opivx * const fns[3] = {               \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opiwx_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIWX_WIDEN_TRANS(vwaddu_wx)
 +GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
 +GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
 +GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vec_rsubs64)(void *d, void *a, uint64_t b, uint32_t desc)
          *(uint64_t *)(d + i) = b - *(uint64_t *)(a + i);
      }
+ }
-+    /* PDMA */
++
-+    sysbus_realize(SYS_BUS_DEVICE(&s->dma), errp);
++/* Vector Widening Integer Add/Subtract */
-+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->dma), 0, memmap[SIFIVE_U_PDMA].base);
++#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
-+
++#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
-+    /* Connect PDMA interrupts to the PLIC */
++#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
-+    for (i = 0; i < SIFIVE_PDMA_IRQS; i++) {
++#define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
-+        sysbus_connect_irq(SYS_BUS_DEVICE(&s->dma), i,
++#define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
-+                           qdev_get_gpio_in(DEVICE(s->plic),
++#define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
-+                                            SIFIVE_U_PDMA_IRQ0 + i));
++#define WOP_WUUU_B  uint16_t, uint8_t, uint16_t, uint16_t, uint16_t
-+    }
++#define WOP_WUUU_H  uint32_t, uint16_t, uint32_t, uint32_t, uint32_t
-+
++#define WOP_WUUU_W  uint64_t, uint32_t, uint64_t, uint64_t, uint64_t
-     qdev_prop_set_uint32(DEVICE(&s->otp), "serial", s->serial);
++#define WOP_WSSS_B  int16_t, int8_t, int16_t, int16_t, int16_t
-     if (!sysbus_realize(SYS_BUS_DEVICE(&s->otp), errp)) {
++#define WOP_WSSS_H  int32_t, int16_t, int32_t, int32_t, int32_t
-         return;
++#define WOP_WSSS_W  int64_t, int32_t, int64_t, int64_t, int64_t
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++RVVCALL(OPIVV2, vwaddu_vv_b, WOP_UUU_B, H2, H1, H1, DO_ADD)
-index XXXXXXX..XXXXXXX 100644
++RVVCALL(OPIVV2, vwaddu_vv_h, WOP_UUU_H, H4, H2, H2, DO_ADD)
---- a/hw/riscv/Kconfig
++RVVCALL(OPIVV2, vwaddu_vv_w, WOP_UUU_W, H8, H4, H4, DO_ADD)
-+++ b/hw/riscv/Kconfig
++RVVCALL(OPIVV2, vwsubu_vv_b, WOP_UUU_B, H2, H1, H1, DO_SUB)
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
++RVVCALL(OPIVV2, vwsubu_vv_h, WOP_UUU_H, H4, H2, H2, DO_SUB)
-     select CADENCE
++RVVCALL(OPIVV2, vwsubu_vv_w, WOP_UUU_W, H8, H4, H4, DO_SUB)
-     select HART
++RVVCALL(OPIVV2, vwadd_vv_b, WOP_SSS_B, H2, H1, H1, DO_ADD)
-     select SIFIVE
++RVVCALL(OPIVV2, vwadd_vv_h, WOP_SSS_H, H4, H2, H2, DO_ADD)
-+    select SIFIVE_PDMA
++RVVCALL(OPIVV2, vwadd_vv_w, WOP_SSS_W, H8, H4, H4, DO_ADD)
-     select UNIMP
++RVVCALL(OPIVV2, vwsub_vv_b, WOP_SSS_B, H2, H1, H1, DO_SUB)
++RVVCALL(OPIVV2, vwsub_vv_h, WOP_SSS_H, H4, H2, H2, DO_SUB)
- config SPIKE
++RVVCALL(OPIVV2, vwsub_vv_w, WOP_SSS_W, H8, H4, H4, DO_SUB)
 +RVVCALL(OPIVV2, vwaddu_wv_b, WOP_WUUU_B, H2, H1, H1, DO_ADD)
 +RVVCALL(OPIVV2, vwaddu_wv_h, WOP_WUUU_H, H4, H2, H2, DO_ADD)
 +RVVCALL(OPIVV2, vwaddu_wv_w, WOP_WUUU_W, H8, H4, H4, DO_ADD)
 +RVVCALL(OPIVV2, vwsubu_wv_b, WOP_WUUU_B, H2, H1, H1, DO_SUB)
 +RVVCALL(OPIVV2, vwsubu_wv_h, WOP_WUUU_H, H4, H2, H2, DO_SUB)
 +RVVCALL(OPIVV2, vwsubu_wv_w, WOP_WUUU_W, H8, H4, H4, DO_SUB)
 +RVVCALL(OPIVV2, vwadd_wv_b, WOP_WSSS_B, H2, H1, H1, DO_ADD)
 +RVVCALL(OPIVV2, vwadd_wv_h, WOP_WSSS_H, H4, H2, H2, DO_ADD)
 +RVVCALL(OPIVV2, vwadd_wv_w, WOP_WSSS_W, H8, H4, H4, DO_ADD)
 +RVVCALL(OPIVV2, vwsub_wv_b, WOP_WSSS_B, H2, H1, H1, DO_SUB)
 +RVVCALL(OPIVV2, vwsub_wv_h, WOP_WSSS_H, H4, H2, H2, DO_SUB)
 +RVVCALL(OPIVV2, vwsub_wv_w, WOP_WSSS_W, H8, H4, H4, DO_SUB)
 +GEN_VEXT_VV(vwaddu_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwaddu_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwaddu_vv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwsubu_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwsubu_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwsubu_vv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwadd_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwadd_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwadd_vv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwsub_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwsub_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwsub_vv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwaddu_wv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwaddu_wv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwaddu_wv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwsubu_wv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwsubu_wv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwsubu_wv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwadd_wv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwadd_wv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwadd_wv_w, 4, 8, clearq)
 +GEN_VEXT_VV(vwsub_wv_b, 1, 2, clearh)
 +GEN_VEXT_VV(vwsub_wv_h, 2, 4, clearl)
 +GEN_VEXT_VV(vwsub_wv_w, 4, 8, clearq)
 +
 +RVVCALL(OPIVX2, vwaddu_vx_b, WOP_UUU_B, H2, H1, DO_ADD)
 +RVVCALL(OPIVX2, vwaddu_vx_h, WOP_UUU_H, H4, H2, DO_ADD)
 +RVVCALL(OPIVX2, vwaddu_vx_w, WOP_UUU_W, H8, H4, DO_ADD)
 +RVVCALL(OPIVX2, vwsubu_vx_b, WOP_UUU_B, H2, H1, DO_SUB)
 +RVVCALL(OPIVX2, vwsubu_vx_h, WOP_UUU_H, H4, H2, DO_SUB)
 +RVVCALL(OPIVX2, vwsubu_vx_w, WOP_UUU_W, H8, H4, DO_SUB)
 +RVVCALL(OPIVX2, vwadd_vx_b, WOP_SSS_B, H2, H1, DO_ADD)
 +RVVCALL(OPIVX2, vwadd_vx_h, WOP_SSS_H, H4, H2, DO_ADD)
 +RVVCALL(OPIVX2, vwadd_vx_w, WOP_SSS_W, H8, H4, DO_ADD)
 +RVVCALL(OPIVX2, vwsub_vx_b, WOP_SSS_B, H2, H1, DO_SUB)
 +RVVCALL(OPIVX2, vwsub_vx_h, WOP_SSS_H, H4, H2, DO_SUB)
 +RVVCALL(OPIVX2, vwsub_vx_w, WOP_SSS_W, H8, H4, DO_SUB)
 +RVVCALL(OPIVX2, vwaddu_wx_b, WOP_WUUU_B, H2, H1, DO_ADD)
 +RVVCALL(OPIVX2, vwaddu_wx_h, WOP_WUUU_H, H4, H2, DO_ADD)
 +RVVCALL(OPIVX2, vwaddu_wx_w, WOP_WUUU_W, H8, H4, DO_ADD)
 +RVVCALL(OPIVX2, vwsubu_wx_b, WOP_WUUU_B, H2, H1, DO_SUB)
 +RVVCALL(OPIVX2, vwsubu_wx_h, WOP_WUUU_H, H4, H2, DO_SUB)
 +RVVCALL(OPIVX2, vwsubu_wx_w, WOP_WUUU_W, H8, H4, DO_SUB)
 +RVVCALL(OPIVX2, vwadd_wx_b, WOP_WSSS_B, H2, H1, DO_ADD)
 +RVVCALL(OPIVX2, vwadd_wx_h, WOP_WSSS_H, H4, H2, DO_ADD)
 +RVVCALL(OPIVX2, vwadd_wx_w, WOP_WSSS_W, H8, H4, DO_ADD)
 +RVVCALL(OPIVX2, vwsub_wx_b, WOP_WSSS_B, H2, H1, DO_SUB)
 +RVVCALL(OPIVX2, vwsub_wx_h, WOP_WSSS_H, H4, H2, DO_SUB)
 +RVVCALL(OPIVX2, vwsub_wx_w, WOP_WSSS_W, H8, H4, DO_SUB)
 +GEN_VEXT_VX(vwaddu_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwaddu_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwaddu_vx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwsubu_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwsubu_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwsubu_vx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwadd_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwadd_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwadd_vx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwsub_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwsub_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwsub_vx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwaddu_wx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwaddu_wx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwaddu_wx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwsubu_wx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwsubu_wx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwsubu_wx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwadd_wx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwadd_wx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwadd_wx_w, 4, 8, clearq)
 +GEN_VEXT_VX(vwsub_wx_b, 1, 2, clearh)
 +GEN_VEXT_VX(vwsub_wx_h, 2, 4, clearl)
 +GEN_VEXT_VX(vwsub_wx_w, 4, 8, clearq)
 --
-.28.0
+.27.0

-[PULL 10/30] hw/riscv: microchip_pfsoc: Connect a Cadence SDHCI controller and an SD card
+[PULL v2 15/64] target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Microchip PolarFire SoC integrates one Cadence SDHCI controller.
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 On the Icicle Kit board, one eMMC chip and an external SD card
 connect to this controller depending on different configuration.
 As QEMU does not support eMMC yet, we just emulate the SD card
 configuration. To test this, the Hart Software Services (HSS)
 should choose the SD card configuration:
 $ cp boards/icicle-kit-es/def_config.sdcard .config
 $ make BOARD=icicle-kit-es
 The SD card image can be built from the Yocto BSP at:
 https://github.com/polarfire-soc/meta-polarfire-soc-yocto-bsp
 Note the generated SD card image should be resized before use:
 $ qemu-img resize /path/to/sdcard.img 4G
 Launch QEMU with the following command:
 $ qemu-system-riscv64 -nographic -M microchip-icicle-kit -sd sdcard.img
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1598924352-89526-9-git-send-email-bmeng.cn@gmail.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-13-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/microchip_pfsoc.h |  4 ++++
+ target/riscv/helper.h                   |  33 ++++++
- hw/riscv/microchip_pfsoc.c         | 23 +++++++++++++++++++++++
+ target/riscv/insn32.decode              |  11 ++
- hw/riscv/Kconfig                   |  1 +
+ target/riscv/insn_trans/trans_rvv.inc.c | 113 +++++++++++++++++++
-files changed, 28 insertions(+)
+ target/riscv/vector_helper.c            | 137 ++++++++++++++++++++++++
 files changed, 294 insertions(+)
-diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/microchip_pfsoc.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/microchip_pfsoc.h
++++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwadd_wx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsub_wx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsub_wx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsub_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vadc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
 @@ -XXX,XX +XXX,XX @@
- #define HW_MICROCHIP_PFSOC_H
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
+ @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
- #include "hw/char/mchp_pfsoc_mmuart.h"
+ @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
-+#include "hw/sd/cadence_sdhci.h"
++@r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
+ @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
- typedef struct MicrochipPFSoCState {
+ @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
-     /*< private >*/
-@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
+@@ -XXX,XX +XXX,XX @@ vwsubu_wv       110110 . ..... ..... 010 ..... 1010111 @r_vm
-     MchpPfSoCMMUartState *serial2;
+ vwsubu_wx       110110 . ..... ..... 110 ..... 1010111 @r_vm
-     MchpPfSoCMMUartState *serial3;
+ vwsub_wv        110111 . ..... ..... 010 ..... 1010111 @r_vm
-     MchpPfSoCMMUartState *serial4;
+ vwsub_wx        110111 . ..... ..... 110 ..... 1010111 @r_vm
-+    CadenceSDHCIState sdhci;
++vadc_vvm        010000 1 ..... ..... 000 ..... 1010111 @r_vm_1
- } MicrochipPFSoCState;
++vadc_vxm        010000 1 ..... ..... 100 ..... 1010111 @r_vm_1
++vadc_vim        010000 1 ..... ..... 011 ..... 1010111 @r_vm_1
- #define TYPE_MICROCHIP_PFSOC    "microchip.pfsoc"
++vmadc_vvm       010001 1 ..... ..... 000 ..... 1010111 @r_vm_1
-@@ -XXX,XX +XXX,XX @@ enum {
++vmadc_vxm       010001 1 ..... ..... 100 ..... 1010111 @r_vm_1
-     MICROCHIP_PFSOC_MMUART0,
++vmadc_vim       010001 1 ..... ..... 011 ..... 1010111 @r_vm_1
-     MICROCHIP_PFSOC_SYSREG,
++vsbc_vvm        010010 1 ..... ..... 000 ..... 1010111 @r_vm_1
-     MICROCHIP_PFSOC_MPUCFG,
++vsbc_vxm        010010 1 ..... ..... 100 ..... 1010111 @r_vm_1
-+    MICROCHIP_PFSOC_EMMC_SD,
++vmsbc_vvm       010011 1 ..... ..... 000 ..... 1010111 @r_vm_1
-     MICROCHIP_PFSOC_MMUART1,
++vmsbc_vxm       010011 1 ..... ..... 100 ..... 1010111 @r_vm_1
-     MICROCHIP_PFSOC_MMUART2,
-     MICROCHIP_PFSOC_MMUART3,
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-@@ -XXX,XX +XXX,XX @@ enum {
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
- };
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
  enum {
 +    MICROCHIP_PFSOC_EMMC_SD_IRQ = 88,
      MICROCHIP_PFSOC_MMUART0_IRQ = 90,
      MICROCHIP_PFSOC_MMUART1_IRQ = 91,
      MICROCHIP_PFSOC_MMUART2_IRQ = 92,
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/microchip_pfsoc.c
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ GEN_OPIWX_WIDEN_TRANS(vwaddu_wx)
-  * 1) PLIC (Platform Level Interrupt Controller)
+ GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
-  * 2) eNVM (Embedded Non-Volatile Memory)
+ GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
-  * 3) MMUARTs (Multi-Mode UART)
+ GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
-+ * 4) Cadence eMMC/SDHC controller and an SD card connected to it
++
-  *
++/* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
-  * This board currently generates devicetree dynamically that indicates at least
++/* OPIVV without GVEC IR */
-  * two harts and up to five harts.
++#define GEN_OPIVV_TRANS(NAME, CHECK)                               \
-@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-     [MICROCHIP_PFSOC_MMUART0] =         { 0x20000000,     0x1000 },
++{                                                                  \
-     [MICROCHIP_PFSOC_SYSREG] =          { 0x20002000,     0x2000 },
++    if (CHECK(s, a)) {                                             \
-     [MICROCHIP_PFSOC_MPUCFG] =          { 0x20005000,     0x1000 },
++        uint32_t data = 0;                                         \
-+    [MICROCHIP_PFSOC_EMMC_SD] =         { 0x20008000,     0x1000 },
++        static gen_helper_gvec_4_ptr * const fns[4] = {            \
-     [MICROCHIP_PFSOC_MMUART1] =         { 0x20100000,     0x1000 },
++            gen_helper_##NAME##_b, gen_helper_##NAME##_h,          \
-     [MICROCHIP_PFSOC_MMUART2] =         { 0x20102000,     0x1000 },
++            gen_helper_##NAME##_w, gen_helper_##NAME##_d,          \
-     [MICROCHIP_PFSOC_MMUART3] =         { 0x20104000,     0x1000 },
++        };                                                         \
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_instance_init(Object *obj)
++        TCGLabel *over = gen_new_label();                          \
-     qdev_prop_set_string(DEVICE(&s->u_cpus), "cpu-type",
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-                          TYPE_RISCV_CPU_SIFIVE_U54);
++                                                                   \
-     qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", RESET_VECTOR);
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+
++        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+    object_initialize_child(obj, "sd-controller", &s->sdhci,
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+                            TYPE_CADENCE_SDHCI);
++        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs1),                    \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew]);        \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +/*
 + * For vadc and vsbc, an illegal instruction exception is raised if the
 + * destination vector register is v0 and LMUL > 1. (Section 12.3)
 + */
 +static bool opivv_vadc_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            ((a->rd != 0) || (s->lmul == 0)));
 +}
 +
 +GEN_OPIVV_TRANS(vadc_vvm, opivv_vadc_check)
 +GEN_OPIVV_TRANS(vsbc_vvm, opivv_vadc_check)
 +
 +/*
 + * For vmadc and vmsbc, an illegal instruction exception is raised if the
 + * destination vector register overlaps a source vector register group.
 + */
 +static bool opivv_vmadc_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
 +            vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul));
 +}
 +
 +GEN_OPIVV_TRANS(vmadc_vvm, opivv_vmadc_check)
 +GEN_OPIVV_TRANS(vmsbc_vvm, opivv_vmadc_check)
 +
 +static bool opivx_vadc_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            ((a->rd != 0) || (s->lmul == 0)));
 +}
 +
 +/* OPIVX without GVEC IR */
 +#define GEN_OPIVX_TRANS(NAME, CHECK)                                     \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
 +{                                                                        \
 +    if (CHECK(s, a)) {                                                   \
 +        static gen_helper_opivx * const fns[4] = {                       \
 +            gen_helper_##NAME##_b, gen_helper_##NAME##_h,                \
 +            gen_helper_##NAME##_w, gen_helper_##NAME##_d,                \
 +        };                                                               \
 +                                                                         \
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
 +    }                                                                    \
 +    return false;                                                        \
 +}
 +
 +GEN_OPIVX_TRANS(vadc_vxm, opivx_vadc_check)
 +GEN_OPIVX_TRANS(vsbc_vxm, opivx_vadc_check)
 +
 +static bool opivx_vmadc_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul));
 +}
 +
 +GEN_OPIVX_TRANS(vmadc_vxm, opivx_vmadc_check)
 +GEN_OPIVX_TRANS(vmsbc_vxm, opivx_vmadc_check)
 +
 +/* OPIVI without GVEC IR */
 +#define GEN_OPIVI_TRANS(NAME, ZX, OPIVX, CHECK)                          \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
 +{                                                                        \
 +    if (CHECK(s, a)) {                                                   \
 +        static gen_helper_opivx * const fns[4] = {                       \
 +            gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,              \
 +            gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,              \
 +        };                                                               \
 +        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm,                 \
 +                           fns[s->sew], s, ZX);                          \
 +    }                                                                    \
 +    return false;                                                        \
 +}
 +
 +GEN_OPIVI_TRANS(vadc_vim, 0, vadc_vxm, opivx_vadc_check)
 +GEN_OPIVI_TRANS(vmadc_vim, 0, vmadc_vxm, opivx_vmadc_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ static void clearq(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
      vext_clear(cur, cnt, tot);
  }
- static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
++static inline void vext_set_elem_mask(void *v0, int mlen, int index,
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
++        uint8_t value)
-         memmap[MICROCHIP_PFSOC_MPUCFG].base,
++{
-         memmap[MICROCHIP_PFSOC_MPUCFG].size);
++    int idx = (index * mlen) / 64;
++    int pos = (index * mlen) % 64;
-+    /* SDHCI */
++    uint64_t old = ((uint64_t *)v0)[idx];
-+    sysbus_realize(SYS_BUS_DEVICE(&s->sdhci), errp);
++    ((uint64_t *)v0)[idx] = deposit64(old, pos, mlen, value);
-+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->sdhci), 0,
++}
-+                    memmap[MICROCHIP_PFSOC_EMMC_SD].base);
-+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->sdhci), 0,
+ static inline int vext_elem_mask(void *v0, int mlen, int index)
-+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_EMMC_SD_IRQ));
+ {
-+
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwadd_wx_w, 4, 8, clearq)
-     /* MMUARTs */
+ GEN_VEXT_VX(vwsub_wx_b, 1, 2, clearh)
-     s->serial0 = mchp_pfsoc_mmuart_create(system_memory,
+ GEN_VEXT_VX(vwsub_wx_h, 2, 4, clearl)
-         memmap[MICROCHIP_PFSOC_MMUART0].base,
+ GEN_VEXT_VX(vwsub_wx_w, 4, 8, clearq)
-@@ -XXX,XX +XXX,XX @@ static void microchip_icicle_kit_machine_init(MachineState *machine)
++
-     MicrochipIcicleKitState *s = MICROCHIP_ICICLE_KIT_MACHINE(machine);
++/* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
-     MemoryRegion *system_memory = get_system_memory();
++#define DO_VADC(N, M, C) (N + M + C)
-     MemoryRegion *main_mem = g_new(MemoryRegion, 1);
++#define DO_VSBC(N, M, C) (N - M - C)
-+    DriveInfo *dinfo = drive_get_next(IF_SD);
++
++#define GEN_VEXT_VADC_VVM(NAME, ETYPE, H, DO_OP, CLEAR_FN)    \
-     /* Sanity check on RAM size */
++void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
-     if (machine->ram_size < mc->default_ram_size) {
++                  CPURISCVState *env, uint32_t desc)          \
-@@ -XXX,XX +XXX,XX @@ static void microchip_icicle_kit_machine_init(MachineState *machine)
++{                                                             \
++    uint32_t mlen = vext_mlen(desc);                          \
-     /* Load the firmware */
++    uint32_t vl = env->vl;                                    \
-     riscv_find_and_load_firmware(machine, BIOS_FILENAME, RESET_VECTOR, NULL);
++    uint32_t esz = sizeof(ETYPE);                             \
-+
++    uint32_t vlmax = vext_maxsz(desc) / esz;                  \
-+    /* Attach an SD card */
++    uint32_t i;                                               \
-+    if (dinfo) {
++                                                              \
-+        CadenceSDHCIState *sdhci = &(s->soc.sdhci);
++    for (i = 0; i < vl; i++) {                                \
-+        DeviceState *card = qdev_new(TYPE_SD_CARD);
++        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
-+
++        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        qdev_prop_set_drive_err(card, "drive", blk_by_legacy_dinfo(dinfo),
++        uint8_t carry = vext_elem_mask(v0, mlen, i);          \
-+                                &error_fatal);
++                                                              \
-+        qdev_realize_and_unref(card, sdhci->bus, &error_fatal);
++        *((ETYPE *)vd + H(i)) = DO_OP(s2, s1, carry);         \
-+    }
++    }                                                         \
- }
++    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                  \
++}
- static void microchip_icicle_kit_machine_class_init(ObjectClass *oc, void *data)
++
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++GEN_VEXT_VADC_VVM(vadc_vvm_b, uint8_t,  H1, DO_VADC, clearb)
-index XXXXXXX..XXXXXXX 100644
++GEN_VEXT_VADC_VVM(vadc_vvm_h, uint16_t, H2, DO_VADC, clearh)
---- a/hw/riscv/Kconfig
++GEN_VEXT_VADC_VVM(vadc_vvm_w, uint32_t, H4, DO_VADC, clearl)
-+++ b/hw/riscv/Kconfig
++GEN_VEXT_VADC_VVM(vadc_vvm_d, uint64_t, H8, DO_VADC, clearq)
-@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
++
-     select SIFIVE
++GEN_VEXT_VADC_VVM(vsbc_vvm_b, uint8_t,  H1, DO_VSBC, clearb)
-     select UNIMP
++GEN_VEXT_VADC_VVM(vsbc_vvm_h, uint16_t, H2, DO_VSBC, clearh)
-     select MCHP_PFSOC_MMUART
++GEN_VEXT_VADC_VVM(vsbc_vvm_w, uint32_t, H4, DO_VSBC, clearl)
-+    select CADENCE_SDHCI
++GEN_VEXT_VADC_VVM(vsbc_vvm_d, uint64_t, H8, DO_VSBC, clearq)
 +
 +#define GEN_VEXT_VADC_VXM(NAME, ETYPE, H, DO_OP, CLEAR_FN)               \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,        \
 +                  CPURISCVState *env, uint32_t desc)                     \
 +{                                                                        \
 +    uint32_t mlen = vext_mlen(desc);                                     \
 +    uint32_t vl = env->vl;                                               \
 +    uint32_t esz = sizeof(ETYPE);                                        \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                             \
 +    uint32_t i;                                                          \
 +                                                                         \
 +    for (i = 0; i < vl; i++) {                                           \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                               \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);                     \
 +                                                                         \
 +        *((ETYPE *)vd + H(i)) = DO_OP(s2, (ETYPE)(target_long)s1, carry);\
 +    }                                                                    \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                             \
 +}
 +
 +GEN_VEXT_VADC_VXM(vadc_vxm_b, uint8_t,  H1, DO_VADC, clearb)
 +GEN_VEXT_VADC_VXM(vadc_vxm_h, uint16_t, H2, DO_VADC, clearh)
 +GEN_VEXT_VADC_VXM(vadc_vxm_w, uint32_t, H4, DO_VADC, clearl)
 +GEN_VEXT_VADC_VXM(vadc_vxm_d, uint64_t, H8, DO_VADC, clearq)
 +
 +GEN_VEXT_VADC_VXM(vsbc_vxm_b, uint8_t,  H1, DO_VSBC, clearb)
 +GEN_VEXT_VADC_VXM(vsbc_vxm_h, uint16_t, H2, DO_VSBC, clearh)
 +GEN_VEXT_VADC_VXM(vsbc_vxm_w, uint32_t, H4, DO_VSBC, clearl)
 +GEN_VEXT_VADC_VXM(vsbc_vxm_d, uint64_t, H8, DO_VSBC, clearq)
 +
 +#define DO_MADC(N, M, C) (C ? (__typeof(N))(N + M + 1) <= N :           \
 +                          (__typeof(N))(N + M) < N)
 +#define DO_MSBC(N, M, C) (C ? N <= M : N < M)
 +
 +#define GEN_VEXT_VMADC_VVM(NAME, ETYPE, H, DO_OP)             \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
 +                  CPURISCVState *env, uint32_t desc)          \
 +{                                                             \
 +    uint32_t mlen = vext_mlen(desc);                          \
 +    uint32_t vl = env->vl;                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
 +    uint32_t i;                                               \
 +                                                              \
 +    for (i = 0; i < vl; i++) {                                \
 +        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);          \
 +                                                              \
 +        vext_set_elem_mask(vd, mlen, i, DO_OP(s2, s1, carry));\
 +    }                                                         \
 +    for (; i < vlmax; i++) {                                  \
 +        vext_set_elem_mask(vd, mlen, i, 0);                   \
 +    }                                                         \
 +}
 +
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_b, uint8_t,  H1, DO_MADC)
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_h, uint16_t, H2, DO_MADC)
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_w, uint32_t, H4, DO_MADC)
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_d, uint64_t, H8, DO_MADC)
 +
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_b, uint8_t,  H1, DO_MSBC)
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_h, uint16_t, H2, DO_MSBC)
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_w, uint32_t, H4, DO_MSBC)
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_d, uint64_t, H8, DO_MSBC)
 +
 +#define GEN_VEXT_VMADC_VXM(NAME, ETYPE, H, DO_OP)               \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,          \
 +                  void *vs2, CPURISCVState *env, uint32_t desc) \
 +{                                                               \
 +    uint32_t mlen = vext_mlen(desc);                            \
 +    uint32_t vl = env->vl;                                      \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);          \
 +    uint32_t i;                                                 \
 +                                                                \
 +    for (i = 0; i < vl; i++) {                                  \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                      \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);            \
 +                                                                \
 +        vext_set_elem_mask(vd, mlen, i,                         \
 +                DO_OP(s2, (ETYPE)(target_long)s1, carry));      \
 +    }                                                           \
 +    for (; i < vlmax; i++) {                                    \
 +        vext_set_elem_mask(vd, mlen, i, 0);                     \
 +    }                                                           \
 +}
 +
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_b, uint8_t,  H1, DO_MADC)
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_h, uint16_t, H2, DO_MADC)
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_w, uint32_t, H4, DO_MADC)
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_d, uint64_t, H8, DO_MADC)
 +
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_b, uint8_t,  H1, DO_MSBC)
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_h, uint16_t, H2, DO_MSBC)
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_w, uint32_t, H4, DO_MSBC)
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_d, uint64_t, H8, DO_MSBC)
 --
-.28.0
+.27.0

-New patch
+[PULL v2 16/64] target/riscv: vector bitwise logical instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-14-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 25 ++++++++++++
+ target/riscv/insn32.decode              |  9 +++++
+ target/riscv/insn_trans/trans_rvv.inc.c | 11 ++++++
+ target/riscv/vector_helper.c            | 51 +++++++++++++++++++++++++
+files changed, 96 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vand_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vand_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vand_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vand_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vor_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vor_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vor_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vor_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vxor_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vxor_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vxor_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vxor_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vand_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vand_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vand_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vand_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vxor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vxor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vxor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vxor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vsbc_vvm        010010 1 ..... ..... 000 ..... 1010111 @r_vm_1
+ vsbc_vxm        010010 1 ..... ..... 100 ..... 1010111 @r_vm_1
+ vmsbc_vvm       010011 1 ..... ..... 000 ..... 1010111 @r_vm_1
+ vmsbc_vxm       010011 1 ..... ..... 100 ..... 1010111 @r_vm_1
++vand_vv         001001 . ..... ..... 000 ..... 1010111 @r_vm
++vand_vx         001001 . ..... ..... 100 ..... 1010111 @r_vm
++vand_vi         001001 . ..... ..... 011 ..... 1010111 @r_vm
++vor_vv          001010 . ..... ..... 000 ..... 1010111 @r_vm
++vor_vx          001010 . ..... ..... 100 ..... 1010111 @r_vm
++vor_vi          001010 . ..... ..... 011 ..... 1010111 @r_vm
++vxor_vv         001011 . ..... ..... 000 ..... 1010111 @r_vm
++vxor_vx         001011 . ..... ..... 100 ..... 1010111 @r_vm
++vxor_vi         001011 . ..... ..... 011 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
+ GEN_OPIVI_TRANS(vadc_vim, 0, vadc_vxm, opivx_vadc_check)
+ GEN_OPIVI_TRANS(vmadc_vim, 0, vmadc_vxm, opivx_vmadc_check)
++
++/* Vector Bitwise Logical Instructions */
++GEN_OPIVV_GVEC_TRANS(vand_vv, and)
++GEN_OPIVV_GVEC_TRANS(vor_vv,  or)
++GEN_OPIVV_GVEC_TRANS(vxor_vv, xor)
++GEN_OPIVX_GVEC_TRANS(vand_vx, ands)
++GEN_OPIVX_GVEC_TRANS(vor_vx,  ors)
++GEN_OPIVX_GVEC_TRANS(vxor_vx, xors)
++GEN_OPIVI_GVEC_TRANS(vand_vi, 0, vand_vx, andi)
++GEN_OPIVI_GVEC_TRANS(vor_vi, 0, vor_vx,  ori)
++GEN_OPIVI_GVEC_TRANS(vxor_vi, 0, vxor_vx, xori)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VMADC_VXM(vmsbc_vxm_b, uint8_t,  H1, DO_MSBC)
+ GEN_VEXT_VMADC_VXM(vmsbc_vxm_h, uint16_t, H2, DO_MSBC)
+ GEN_VEXT_VMADC_VXM(vmsbc_vxm_w, uint32_t, H4, DO_MSBC)
+ GEN_VEXT_VMADC_VXM(vmsbc_vxm_d, uint64_t, H8, DO_MSBC)
++
++/* Vector Bitwise Logical Instructions */
++RVVCALL(OPIVV2, vand_vv_b, OP_SSS_B, H1, H1, H1, DO_AND)
++RVVCALL(OPIVV2, vand_vv_h, OP_SSS_H, H2, H2, H2, DO_AND)
++RVVCALL(OPIVV2, vand_vv_w, OP_SSS_W, H4, H4, H4, DO_AND)
++RVVCALL(OPIVV2, vand_vv_d, OP_SSS_D, H8, H8, H8, DO_AND)
++RVVCALL(OPIVV2, vor_vv_b, OP_SSS_B, H1, H1, H1, DO_OR)
++RVVCALL(OPIVV2, vor_vv_h, OP_SSS_H, H2, H2, H2, DO_OR)
++RVVCALL(OPIVV2, vor_vv_w, OP_SSS_W, H4, H4, H4, DO_OR)
++RVVCALL(OPIVV2, vor_vv_d, OP_SSS_D, H8, H8, H8, DO_OR)
++RVVCALL(OPIVV2, vxor_vv_b, OP_SSS_B, H1, H1, H1, DO_XOR)
++RVVCALL(OPIVV2, vxor_vv_h, OP_SSS_H, H2, H2, H2, DO_XOR)
++RVVCALL(OPIVV2, vxor_vv_w, OP_SSS_W, H4, H4, H4, DO_XOR)
++RVVCALL(OPIVV2, vxor_vv_d, OP_SSS_D, H8, H8, H8, DO_XOR)
++GEN_VEXT_VV(vand_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vand_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vand_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vand_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vor_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vor_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vor_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vor_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vxor_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vxor_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vxor_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vxor_vv_d, 8, 8, clearq)
++
++RVVCALL(OPIVX2, vand_vx_b, OP_SSS_B, H1, H1, DO_AND)
++RVVCALL(OPIVX2, vand_vx_h, OP_SSS_H, H2, H2, DO_AND)
++RVVCALL(OPIVX2, vand_vx_w, OP_SSS_W, H4, H4, DO_AND)
++RVVCALL(OPIVX2, vand_vx_d, OP_SSS_D, H8, H8, DO_AND)
++RVVCALL(OPIVX2, vor_vx_b, OP_SSS_B, H1, H1, DO_OR)
++RVVCALL(OPIVX2, vor_vx_h, OP_SSS_H, H2, H2, DO_OR)
++RVVCALL(OPIVX2, vor_vx_w, OP_SSS_W, H4, H4, DO_OR)
++RVVCALL(OPIVX2, vor_vx_d, OP_SSS_D, H8, H8, DO_OR)
++RVVCALL(OPIVX2, vxor_vx_b, OP_SSS_B, H1, H1, DO_XOR)
++RVVCALL(OPIVX2, vxor_vx_h, OP_SSS_H, H2, H2, DO_XOR)
++RVVCALL(OPIVX2, vxor_vx_w, OP_SSS_W, H4, H4, DO_XOR)
++RVVCALL(OPIVX2, vxor_vx_d, OP_SSS_D, H8, H8, DO_XOR)
++GEN_VEXT_VX(vand_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vand_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vand_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vand_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vor_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vor_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vor_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vor_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vxor_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vxor_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vxor_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vxor_vx_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 17/64] target/riscv: vector single-width bit shift instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20200701152549.1218-15-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   | 25 ++++++++
  target/riscv/insn32.decode              |  9 +++
  target/riscv/insn_trans/trans_rvv.inc.c | 52 ++++++++++++++++
  target/riscv/vector_helper.c            | 79 +++++++++++++++++++++++++
 files changed, 165 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vxor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vxor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vxor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vxor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vsll_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsll_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsll_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsll_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsra_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsll_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsll_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsll_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsll_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vor_vi          001010 . ..... ..... 011 ..... 1010111 @r_vm
  vxor_vv         001011 . ..... ..... 000 ..... 1010111 @r_vm
  vxor_vx         001011 . ..... ..... 100 ..... 1010111 @r_vm
  vxor_vi         001011 . ..... ..... 011 ..... 1010111 @r_vm
 +vsll_vv         100101 . ..... ..... 000 ..... 1010111 @r_vm
 +vsll_vx         100101 . ..... ..... 100 ..... 1010111 @r_vm
 +vsll_vi         100101 . ..... ..... 011 ..... 1010111 @r_vm
 +vsrl_vv         101000 . ..... ..... 000 ..... 1010111 @r_vm
 +vsrl_vx         101000 . ..... ..... 100 ..... 1010111 @r_vm
 +vsrl_vi         101000 . ..... ..... 011 ..... 1010111 @r_vm
 +vsra_vv         101001 . ..... ..... 000 ..... 1010111 @r_vm
 +vsra_vx         101001 . ..... ..... 100 ..... 1010111 @r_vm
 +vsra_vi         101001 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_TRANS(vxor_vx, xors)
  GEN_OPIVI_GVEC_TRANS(vand_vi, 0, vand_vx, andi)
  GEN_OPIVI_GVEC_TRANS(vor_vi, 0, vor_vx,  ori)
  GEN_OPIVI_GVEC_TRANS(vxor_vi, 0, vxor_vx, xori)
 +
 +/* Vector Single-Width Bit Shift Instructions */
 +GEN_OPIVV_GVEC_TRANS(vsll_vv,  shlv)
 +GEN_OPIVV_GVEC_TRANS(vsrl_vv,  shrv)
 +GEN_OPIVV_GVEC_TRANS(vsra_vv,  sarv)
 +
 +typedef void GVecGen2sFn32(unsigned, uint32_t, uint32_t, TCGv_i32,
 +                           uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivx_gvec_shift(DisasContext *s, arg_rmrr *a, GVecGen2sFn32 *gvec_fn,
 +                    gen_helper_opivx *fn)
 +{
 +    if (!opivx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        TCGv_i32 src1 = tcg_temp_new_i32();
 +        TCGv tmp = tcg_temp_new();
 +
 +        gen_get_gpr(tmp, a->rs1);
 +        tcg_gen_trunc_tl_i32(src1, tmp);
 +        tcg_gen_extract_i32(src1, src1, 0, s->sew + 3);
 +        gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                src1, MAXSZ(s), MAXSZ(s));
 +
 +        tcg_temp_free_i32(src1);
 +        tcg_temp_free(tmp);
 +        return true;
 +    }
 +    return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +}
 +
 +#define GEN_OPIVX_GVEC_SHIFT_TRANS(NAME, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
 +{                                                                         \
 +    static gen_helper_opivx * const fns[4] = {                            \
 +        gen_helper_##NAME##_b, gen_helper_##NAME##_h,                     \
 +        gen_helper_##NAME##_w, gen_helper_##NAME##_d,                     \
 +    };                                                                    \
 +                                                                          \
 +    return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);    \
 +}
 +
 +GEN_OPIVX_GVEC_SHIFT_TRANS(vsll_vx,  shls)
 +GEN_OPIVX_GVEC_SHIFT_TRANS(vsrl_vx,  shrs)
 +GEN_OPIVX_GVEC_SHIFT_TRANS(vsra_vx,  sars)
 +
 +GEN_OPIVI_GVEC_TRANS(vsll_vi, 1, vsll_vx,  shli)
 +GEN_OPIVI_GVEC_TRANS(vsrl_vi, 1, vsrl_vx,  shri)
 +GEN_OPIVI_GVEC_TRANS(vsra_vi, 1, vsra_vx,  sari)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vxor_vx_b, 1, 1, clearb)
  GEN_VEXT_VX(vxor_vx_h, 2, 2, clearh)
  GEN_VEXT_VX(vxor_vx_w, 4, 4, clearl)
  GEN_VEXT_VX(vxor_vx_d, 8, 8, clearq)
 +
 +/* Vector Single-Width Bit Shift Instructions */
 +#define DO_SLL(N, M)  (N << (M))
 +#define DO_SRL(N, M)  (N >> (M))
 +
 +/* generate the helpers for shift instructions with two vector operators */
 +#define GEN_VEXT_SHIFT_VV(NAME, TS1, TS2, HS1, HS2, OP, MASK, CLEAR_FN)   \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,                          \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)           \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t esz = sizeof(TS1);                                           \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                              \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        TS1 s1 = *((TS1 *)vs1 + HS1(i));                                  \
 +        TS2 s2 = *((TS2 *)vs2 + HS2(i));                                  \
 +        *((TS1 *)vd + HS1(i)) = OP(s2, s1 & MASK);                        \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                              \
 +}
 +
 +GEN_VEXT_SHIFT_VV(vsll_vv_b, uint8_t,  uint8_t, H1, H1, DO_SLL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VV(vsll_vv_h, uint16_t, uint16_t, H2, H2, DO_SLL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VV(vsll_vv_w, uint32_t, uint32_t, H4, H4, DO_SLL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VV(vsll_vv_d, uint64_t, uint64_t, H8, H8, DO_SLL, 0x3f, clearq)
 +
 +GEN_VEXT_SHIFT_VV(vsrl_vv_b, uint8_t, uint8_t, H1, H1, DO_SRL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VV(vsrl_vv_h, uint16_t, uint16_t, H2, H2, DO_SRL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VV(vsrl_vv_w, uint32_t, uint32_t, H4, H4, DO_SRL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VV(vsrl_vv_d, uint64_t, uint64_t, H8, H8, DO_SRL, 0x3f, clearq)
 +
 +GEN_VEXT_SHIFT_VV(vsra_vv_b, uint8_t,  int8_t, H1, H1, DO_SRL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VV(vsra_vv_h, uint16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VV(vsra_vv_w, uint32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VV(vsra_vv_d, uint64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
 +
 +/* generate the helpers for shift instructions with one vector and one scalar */
 +#define GEN_VEXT_SHIFT_VX(NAME, TD, TS2, HD, HS2, OP, MASK, CLEAR_FN) \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,                \
 +        void *vs2, CPURISCVState *env, uint32_t desc)                 \
 +{                                                                     \
 +    uint32_t mlen = vext_mlen(desc);                                  \
 +    uint32_t vm = vext_vm(desc);                                      \
 +    uint32_t vl = env->vl;                                            \
 +    uint32_t esz = sizeof(TD);                                        \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                          \
 +    uint32_t i;                                                       \
 +                                                                      \
 +    for (i = 0; i < vl; i++) {                                        \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                    \
 +            continue;                                                 \
 +        }                                                             \
 +        TS2 s2 = *((TS2 *)vs2 + HS2(i));                              \
 +        *((TD *)vd + HD(i)) = OP(s2, s1 & MASK);                      \
 +    }                                                                 \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                          \
 +}
 +
 +GEN_VEXT_SHIFT_VX(vsll_vx_b, uint8_t, int8_t, H1, H1, DO_SLL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VX(vsll_vx_h, uint16_t, int16_t, H2, H2, DO_SLL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VX(vsll_vx_w, uint32_t, int32_t, H4, H4, DO_SLL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VX(vsll_vx_d, uint64_t, int64_t, H8, H8, DO_SLL, 0x3f, clearq)
 +
 +GEN_VEXT_SHIFT_VX(vsrl_vx_b, uint8_t, uint8_t, H1, H1, DO_SRL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VX(vsrl_vx_h, uint16_t, uint16_t, H2, H2, DO_SRL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VX(vsrl_vx_w, uint32_t, uint32_t, H4, H4, DO_SRL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VX(vsrl_vx_d, uint64_t, uint64_t, H8, H8, DO_SRL, 0x3f, clearq)
 +
 +GEN_VEXT_SHIFT_VX(vsra_vx_b, int8_t, int8_t, H1, H1, DO_SRL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VX(vsra_vx_h, int16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VX(vsra_vx_w, int32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VX(vsra_vx_d, int64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
 --
 .27.0

-New patch
+[PULL v2 18/64] target/riscv: vector narrowing integer right shift instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-16-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 13 ++++
+ target/riscv/insn32.decode              |  6 ++
+ target/riscv/insn_trans/trans_rvv.inc.c | 90 +++++++++++++++++++++++++
+ target/riscv/vector_helper.c            | 14 ++++
+files changed, 123 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vsra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vnsrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnsrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnsrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnsra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnsra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnsra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnsrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnsrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vsrl_vi         101000 . ..... ..... 011 ..... 1010111 @r_vm
+ vsra_vv         101001 . ..... ..... 000 ..... 1010111 @r_vm
+ vsra_vx         101001 . ..... ..... 100 ..... 1010111 @r_vm
+ vsra_vi         101001 . ..... ..... 011 ..... 1010111 @r_vm
++vnsrl_vv        101100 . ..... ..... 000 ..... 1010111 @r_vm
++vnsrl_vx        101100 . ..... ..... 100 ..... 1010111 @r_vm
++vnsrl_vi        101100 . ..... ..... 011 ..... 1010111 @r_vm
++vnsra_vv        101101 . ..... ..... 000 ..... 1010111 @r_vm
++vnsra_vx        101101 . ..... ..... 100 ..... 1010111 @r_vm
++vnsra_vi        101101 . ..... ..... 011 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_SHIFT_TRANS(vsra_vx,  sars)
+ GEN_OPIVI_GVEC_TRANS(vsll_vi, 1, vsll_vx,  shli)
+ GEN_OPIVI_GVEC_TRANS(vsrl_vi, 1, vsrl_vx,  shri)
+ GEN_OPIVI_GVEC_TRANS(vsra_vi, 1, vsra_vx,  sari)
++
++/* Vector Narrowing Integer Right Shift Instructions */
++static bool opivv_narrow_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, true) &&
++            vext_check_reg(s, a->rs1, false) &&
++            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
++                2 << s->lmul) &&
++            (s->lmul < 0x3) && (s->sew < 0x3));
++}
++
++/* OPIVV with NARROW */
++#define GEN_OPIVV_NARROW_TRANS(NAME)                               \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++{                                                                  \
++    if (opivv_narrow_check(s, a)) {                                \
++        uint32_t data = 0;                                         \
++        static gen_helper_gvec_4_ptr * const fns[3] = {            \
++            gen_helper_##NAME##_b,                                 \
++            gen_helper_##NAME##_h,                                 \
++            gen_helper_##NAME##_w,                                 \
++        };                                                         \
++        TCGLabel *over = gen_new_label();                          \
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
++                                                                   \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
++        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
++                           vreg_ofs(s, a->rs1),                    \
++                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
++                           s->vlen / 8, data, fns[s->sew]);        \
++        gen_set_label(over);                                       \
++        return true;                                               \
++    }                                                              \
++    return false;                                                  \
++}
++GEN_OPIVV_NARROW_TRANS(vnsra_vv)
++GEN_OPIVV_NARROW_TRANS(vnsrl_vv)
++
++static bool opivx_narrow_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, true) &&
++            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
++                2 << s->lmul) &&
++            (s->lmul < 0x3) && (s->sew < 0x3));
++}
++
++/* OPIVX with NARROW */
++#define GEN_OPIVX_NARROW_TRANS(NAME)                                     \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
++{                                                                        \
++    if (opivx_narrow_check(s, a)) {                                      \
++        static gen_helper_opivx * const fns[3] = {                       \
++            gen_helper_##NAME##_b,                                       \
++            gen_helper_##NAME##_h,                                       \
++            gen_helper_##NAME##_w,                                       \
++        };                                                               \
++        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
++    }                                                                    \
++    return false;                                                        \
++}
++
++GEN_OPIVX_NARROW_TRANS(vnsra_vx)
++GEN_OPIVX_NARROW_TRANS(vnsrl_vx)
++
++/* OPIVI with NARROW */
++#define GEN_OPIVI_NARROW_TRANS(NAME, ZX, OPIVX)                          \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
++{                                                                        \
++    if (opivx_narrow_check(s, a)) {                                      \
++        static gen_helper_opivx * const fns[3] = {                       \
++            gen_helper_##OPIVX##_b,                                      \
++            gen_helper_##OPIVX##_h,                                      \
++            gen_helper_##OPIVX##_w,                                      \
++        };                                                               \
++        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm,                 \
++                           fns[s->sew], s, ZX);                          \
++    }                                                                    \
++    return false;                                                        \
++}
++
++GEN_OPIVI_NARROW_TRANS(vnsra_vi, 1, vnsra_vx)
++GEN_OPIVI_NARROW_TRANS(vnsrl_vi, 1, vnsrl_vx)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_SHIFT_VX(vsra_vx_b, int8_t, int8_t, H1, H1, DO_SRL, 0x7, clearb)
+ GEN_VEXT_SHIFT_VX(vsra_vx_h, int16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
+ GEN_VEXT_SHIFT_VX(vsra_vx_w, int32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
+ GEN_VEXT_SHIFT_VX(vsra_vx_d, int64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
++
++/* Vector Narrowing Integer Right Shift Instructions */
++GEN_VEXT_SHIFT_VV(vnsrl_vv_b, uint8_t,  uint16_t, H1, H2, DO_SRL, 0xf, clearb)
++GEN_VEXT_SHIFT_VV(vnsrl_vv_h, uint16_t, uint32_t, H2, H4, DO_SRL, 0x1f, clearh)
++GEN_VEXT_SHIFT_VV(vnsrl_vv_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
++GEN_VEXT_SHIFT_VV(vnsra_vv_b, uint8_t,  int16_t, H1, H2, DO_SRL, 0xf, clearb)
++GEN_VEXT_SHIFT_VV(vnsra_vv_h, uint16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
++GEN_VEXT_SHIFT_VV(vnsra_vv_w, uint32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
++GEN_VEXT_SHIFT_VX(vnsrl_vx_b, uint8_t, uint16_t, H1, H2, DO_SRL, 0xf, clearb)
++GEN_VEXT_SHIFT_VX(vnsrl_vx_h, uint16_t, uint32_t, H2, H4, DO_SRL, 0x1f, clearh)
++GEN_VEXT_SHIFT_VX(vnsrl_vx_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
++GEN_VEXT_SHIFT_VX(vnsra_vx_b, int8_t, int16_t, H1, H2, DO_SRL, 0xf, clearb)
++GEN_VEXT_SHIFT_VX(vnsra_vx_h, int16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
++GEN_VEXT_SHIFT_VX(vnsra_vx_w, int32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
+--
+.27.0

-New patch
+[PULL v2 19/64] target/riscv: vector integer comparison instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20200701152549.1218-17-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  57 +++++++++++
  target/riscv/insn32.decode              |  20 ++++
  target/riscv/insn_trans/trans_rvv.inc.c |  46 +++++++++
  target/riscv/vector_helper.c            | 123 ++++++++++++++++++++++++
 files changed, 246 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vnsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vnsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vnsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vmseq_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmseq_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsne_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsltu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmslt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsleu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsle_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgtu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgtu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgtu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgtu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsgt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vnsrl_vi        101100 . ..... ..... 011 ..... 1010111 @r_vm
  vnsra_vv        101101 . ..... ..... 000 ..... 1010111 @r_vm
  vnsra_vx        101101 . ..... ..... 100 ..... 1010111 @r_vm
  vnsra_vi        101101 . ..... ..... 011 ..... 1010111 @r_vm
 +vmseq_vv        011000 . ..... ..... 000 ..... 1010111 @r_vm
 +vmseq_vx        011000 . ..... ..... 100 ..... 1010111 @r_vm
 +vmseq_vi        011000 . ..... ..... 011 ..... 1010111 @r_vm
 +vmsne_vv        011001 . ..... ..... 000 ..... 1010111 @r_vm
 +vmsne_vx        011001 . ..... ..... 100 ..... 1010111 @r_vm
 +vmsne_vi        011001 . ..... ..... 011 ..... 1010111 @r_vm
 +vmsltu_vv       011010 . ..... ..... 000 ..... 1010111 @r_vm
 +vmsltu_vx       011010 . ..... ..... 100 ..... 1010111 @r_vm
 +vmslt_vv        011011 . ..... ..... 000 ..... 1010111 @r_vm
 +vmslt_vx        011011 . ..... ..... 100 ..... 1010111 @r_vm
 +vmsleu_vv       011100 . ..... ..... 000 ..... 1010111 @r_vm
 +vmsleu_vx       011100 . ..... ..... 100 ..... 1010111 @r_vm
 +vmsleu_vi       011100 . ..... ..... 011 ..... 1010111 @r_vm
 +vmsle_vv        011101 . ..... ..... 000 ..... 1010111 @r_vm
 +vmsle_vx        011101 . ..... ..... 100 ..... 1010111 @r_vm
 +vmsle_vi        011101 . ..... ..... 011 ..... 1010111 @r_vm
 +vmsgtu_vx       011110 . ..... ..... 100 ..... 1010111 @r_vm
 +vmsgtu_vi       011110 . ..... ..... 011 ..... 1010111 @r_vm
 +vmsgt_vx        011111 . ..... ..... 100 ..... 1010111 @r_vm
 +vmsgt_vi        011111 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
  GEN_OPIVI_NARROW_TRANS(vnsra_vi, 1, vnsra_vx)
  GEN_OPIVI_NARROW_TRANS(vnsrl_vi, 1, vnsrl_vx)
 +
 +/* Vector Integer Comparison Instructions */
 +/*
 + * For all comparison instructions, an illegal instruction exception is raised
 + * if the destination vector register overlaps a source vector register group
 + * and LMUL > 1.
 + */
 +static bool opivv_cmp_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            ((vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
 +              vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul)) ||
 +             (s->lmul == 0)));
 +}
 +GEN_OPIVV_TRANS(vmseq_vv, opivv_cmp_check)
 +GEN_OPIVV_TRANS(vmsne_vv, opivv_cmp_check)
 +GEN_OPIVV_TRANS(vmsltu_vv, opivv_cmp_check)
 +GEN_OPIVV_TRANS(vmslt_vv, opivv_cmp_check)
 +GEN_OPIVV_TRANS(vmsleu_vv, opivv_cmp_check)
 +GEN_OPIVV_TRANS(vmsle_vv, opivv_cmp_check)
 +
 +static bool opivx_cmp_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul) ||
 +             (s->lmul == 0)));
 +}
 +
 +GEN_OPIVX_TRANS(vmseq_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmsne_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmsltu_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmslt_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmsleu_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmsle_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmsgtu_vx, opivx_cmp_check)
 +GEN_OPIVX_TRANS(vmsgt_vx, opivx_cmp_check)
 +
 +GEN_OPIVI_TRANS(vmseq_vi, 0, vmseq_vx, opivx_cmp_check)
 +GEN_OPIVI_TRANS(vmsne_vi, 0, vmsne_vx, opivx_cmp_check)
 +GEN_OPIVI_TRANS(vmsleu_vi, 1, vmsleu_vx, opivx_cmp_check)
 +GEN_OPIVI_TRANS(vmsle_vi, 0, vmsle_vx, opivx_cmp_check)
 +GEN_OPIVI_TRANS(vmsgtu_vi, 1, vmsgtu_vx, opivx_cmp_check)
 +GEN_OPIVI_TRANS(vmsgt_vi, 0, vmsgt_vx, opivx_cmp_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_SHIFT_VX(vnsrl_vx_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
  GEN_VEXT_SHIFT_VX(vnsra_vx_b, int8_t, int16_t, H1, H2, DO_SRL, 0xf, clearb)
  GEN_VEXT_SHIFT_VX(vnsra_vx_h, int16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
  GEN_VEXT_SHIFT_VX(vnsra_vx_w, int32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
 +
 +/* Vector Integer Comparison Instructions */
 +#define DO_MSEQ(N, M) (N == M)
 +#define DO_MSNE(N, M) (N != M)
 +#define DO_MSLT(N, M) (N < M)
 +#define DO_MSLE(N, M) (N <= M)
 +#define DO_MSGT(N, M) (N > M)
 +
 +#define GEN_VEXT_CMP_VV(NAME, ETYPE, H, DO_OP)                \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
 +                  CPURISCVState *env, uint32_t desc)          \
 +{                                                             \
 +    uint32_t mlen = vext_mlen(desc);                          \
 +    uint32_t vm = vext_vm(desc);                              \
 +    uint32_t vl = env->vl;                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
 +    uint32_t i;                                               \
 +                                                              \
 +    for (i = 0; i < vl; i++) {                                \
 +        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {            \
 +            continue;                                         \
 +        }                                                     \
 +        vext_set_elem_mask(vd, mlen, i, DO_OP(s2, s1));       \
 +    }                                                         \
 +    for (; i < vlmax; i++) {                                  \
 +        vext_set_elem_mask(vd, mlen, i, 0);                   \
 +    }                                                         \
 +}
 +
 +GEN_VEXT_CMP_VV(vmseq_vv_b, uint8_t,  H1, DO_MSEQ)
 +GEN_VEXT_CMP_VV(vmseq_vv_h, uint16_t, H2, DO_MSEQ)
 +GEN_VEXT_CMP_VV(vmseq_vv_w, uint32_t, H4, DO_MSEQ)
 +GEN_VEXT_CMP_VV(vmseq_vv_d, uint64_t, H8, DO_MSEQ)
 +
 +GEN_VEXT_CMP_VV(vmsne_vv_b, uint8_t,  H1, DO_MSNE)
 +GEN_VEXT_CMP_VV(vmsne_vv_h, uint16_t, H2, DO_MSNE)
 +GEN_VEXT_CMP_VV(vmsne_vv_w, uint32_t, H4, DO_MSNE)
 +GEN_VEXT_CMP_VV(vmsne_vv_d, uint64_t, H8, DO_MSNE)
 +
 +GEN_VEXT_CMP_VV(vmsltu_vv_b, uint8_t,  H1, DO_MSLT)
 +GEN_VEXT_CMP_VV(vmsltu_vv_h, uint16_t, H2, DO_MSLT)
 +GEN_VEXT_CMP_VV(vmsltu_vv_w, uint32_t, H4, DO_MSLT)
 +GEN_VEXT_CMP_VV(vmsltu_vv_d, uint64_t, H8, DO_MSLT)
 +
 +GEN_VEXT_CMP_VV(vmslt_vv_b, int8_t,  H1, DO_MSLT)
 +GEN_VEXT_CMP_VV(vmslt_vv_h, int16_t, H2, DO_MSLT)
 +GEN_VEXT_CMP_VV(vmslt_vv_w, int32_t, H4, DO_MSLT)
 +GEN_VEXT_CMP_VV(vmslt_vv_d, int64_t, H8, DO_MSLT)
 +
 +GEN_VEXT_CMP_VV(vmsleu_vv_b, uint8_t,  H1, DO_MSLE)
 +GEN_VEXT_CMP_VV(vmsleu_vv_h, uint16_t, H2, DO_MSLE)
 +GEN_VEXT_CMP_VV(vmsleu_vv_w, uint32_t, H4, DO_MSLE)
 +GEN_VEXT_CMP_VV(vmsleu_vv_d, uint64_t, H8, DO_MSLE)
 +
 +GEN_VEXT_CMP_VV(vmsle_vv_b, int8_t,  H1, DO_MSLE)
 +GEN_VEXT_CMP_VV(vmsle_vv_h, int16_t, H2, DO_MSLE)
 +GEN_VEXT_CMP_VV(vmsle_vv_w, int32_t, H4, DO_MSLE)
 +GEN_VEXT_CMP_VV(vmsle_vv_d, int64_t, H8, DO_MSLE)
 +
 +#define GEN_VEXT_CMP_VX(NAME, ETYPE, H, DO_OP)                      \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,   \
 +                  CPURISCVState *env, uint32_t desc)                \
 +{                                                                   \
 +    uint32_t mlen = vext_mlen(desc);                                \
 +    uint32_t vm = vext_vm(desc);                                    \
 +    uint32_t vl = env->vl;                                          \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);              \
 +    uint32_t i;                                                     \
 +                                                                    \
 +    for (i = 0; i < vl; i++) {                                      \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                          \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                  \
 +            continue;                                               \
 +        }                                                           \
 +        vext_set_elem_mask(vd, mlen, i,                             \
 +                DO_OP(s2, (ETYPE)(target_long)s1));                 \
 +    }                                                               \
 +    for (; i < vlmax; i++) {                                        \
 +        vext_set_elem_mask(vd, mlen, i, 0);                         \
 +    }                                                               \
 +}
 +
 +GEN_VEXT_CMP_VX(vmseq_vx_b, uint8_t,  H1, DO_MSEQ)
 +GEN_VEXT_CMP_VX(vmseq_vx_h, uint16_t, H2, DO_MSEQ)
 +GEN_VEXT_CMP_VX(vmseq_vx_w, uint32_t, H4, DO_MSEQ)
 +GEN_VEXT_CMP_VX(vmseq_vx_d, uint64_t, H8, DO_MSEQ)
 +
 +GEN_VEXT_CMP_VX(vmsne_vx_b, uint8_t,  H1, DO_MSNE)
 +GEN_VEXT_CMP_VX(vmsne_vx_h, uint16_t, H2, DO_MSNE)
 +GEN_VEXT_CMP_VX(vmsne_vx_w, uint32_t, H4, DO_MSNE)
 +GEN_VEXT_CMP_VX(vmsne_vx_d, uint64_t, H8, DO_MSNE)
 +
 +GEN_VEXT_CMP_VX(vmsltu_vx_b, uint8_t,  H1, DO_MSLT)
 +GEN_VEXT_CMP_VX(vmsltu_vx_h, uint16_t, H2, DO_MSLT)
 +GEN_VEXT_CMP_VX(vmsltu_vx_w, uint32_t, H4, DO_MSLT)
 +GEN_VEXT_CMP_VX(vmsltu_vx_d, uint64_t, H8, DO_MSLT)
 +
 +GEN_VEXT_CMP_VX(vmslt_vx_b, int8_t,  H1, DO_MSLT)
 +GEN_VEXT_CMP_VX(vmslt_vx_h, int16_t, H2, DO_MSLT)
 +GEN_VEXT_CMP_VX(vmslt_vx_w, int32_t, H4, DO_MSLT)
 +GEN_VEXT_CMP_VX(vmslt_vx_d, int64_t, H8, DO_MSLT)
 +
 +GEN_VEXT_CMP_VX(vmsleu_vx_b, uint8_t,  H1, DO_MSLE)
 +GEN_VEXT_CMP_VX(vmsleu_vx_h, uint16_t, H2, DO_MSLE)
 +GEN_VEXT_CMP_VX(vmsleu_vx_w, uint32_t, H4, DO_MSLE)
 +GEN_VEXT_CMP_VX(vmsleu_vx_d, uint64_t, H8, DO_MSLE)
 +
 +GEN_VEXT_CMP_VX(vmsle_vx_b, int8_t,  H1, DO_MSLE)
 +GEN_VEXT_CMP_VX(vmsle_vx_h, int16_t, H2, DO_MSLE)
 +GEN_VEXT_CMP_VX(vmsle_vx_w, int32_t, H4, DO_MSLE)
 +GEN_VEXT_CMP_VX(vmsle_vx_d, int64_t, H8, DO_MSLE)
 +
 +GEN_VEXT_CMP_VX(vmsgtu_vx_b, uint8_t,  H1, DO_MSGT)
 +GEN_VEXT_CMP_VX(vmsgtu_vx_h, uint16_t, H2, DO_MSGT)
 +GEN_VEXT_CMP_VX(vmsgtu_vx_w, uint32_t, H4, DO_MSGT)
 +GEN_VEXT_CMP_VX(vmsgtu_vx_d, uint64_t, H8, DO_MSGT)
 +
 +GEN_VEXT_CMP_VX(vmsgt_vx_b, int8_t,  H1, DO_MSGT)
 +GEN_VEXT_CMP_VX(vmsgt_vx_h, int16_t, H2, DO_MSGT)
 +GEN_VEXT_CMP_VX(vmsgt_vx_w, int32_t, H4, DO_MSGT)
 +GEN_VEXT_CMP_VX(vmsgt_vx_d, int64_t, H8, DO_MSGT)
 --
 .27.0

-New patch
+[PULL v2 20/64] target/riscv: vector integer min/max instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-18-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 33 ++++++++++++
+ target/riscv/insn32.decode              |  8 +++
+ target/riscv/insn_trans/trans_rvv.inc.c | 10 ++++
+ target/riscv/vector_helper.c            | 71 +++++++++++++++++++++++++
+files changed, 122 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmsgt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmsgt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmsgt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmsgt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vminu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vminu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vminu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vminu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmin_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmin_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmin_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmin_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmax_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmax_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmax_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmax_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vminu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vminu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vminu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vminu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmin_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmin_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmin_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmin_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmaxu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmax_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmax_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmax_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmax_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vmsgtu_vx       011110 . ..... ..... 100 ..... 1010111 @r_vm
+ vmsgtu_vi       011110 . ..... ..... 011 ..... 1010111 @r_vm
+ vmsgt_vx        011111 . ..... ..... 100 ..... 1010111 @r_vm
+ vmsgt_vi        011111 . ..... ..... 011 ..... 1010111 @r_vm
++vminu_vv        000100 . ..... ..... 000 ..... 1010111 @r_vm
++vminu_vx        000100 . ..... ..... 100 ..... 1010111 @r_vm
++vmin_vv         000101 . ..... ..... 000 ..... 1010111 @r_vm
++vmin_vx         000101 . ..... ..... 100 ..... 1010111 @r_vm
++vmaxu_vv        000110 . ..... ..... 000 ..... 1010111 @r_vm
++vmaxu_vx        000110 . ..... ..... 100 ..... 1010111 @r_vm
++vmax_vv         000111 . ..... ..... 000 ..... 1010111 @r_vm
++vmax_vx         000111 . ..... ..... 100 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vmsleu_vi, 1, vmsleu_vx, opivx_cmp_check)
+ GEN_OPIVI_TRANS(vmsle_vi, 0, vmsle_vx, opivx_cmp_check)
+ GEN_OPIVI_TRANS(vmsgtu_vi, 1, vmsgtu_vx, opivx_cmp_check)
+ GEN_OPIVI_TRANS(vmsgt_vi, 0, vmsgt_vx, opivx_cmp_check)
++
++/* Vector Integer Min/Max Instructions */
++GEN_OPIVV_GVEC_TRANS(vminu_vv, umin)
++GEN_OPIVV_GVEC_TRANS(vmin_vv,  smin)
++GEN_OPIVV_GVEC_TRANS(vmaxu_vv, umax)
++GEN_OPIVV_GVEC_TRANS(vmax_vv,  smax)
++GEN_OPIVX_TRANS(vminu_vx, opivx_check)
++GEN_OPIVX_TRANS(vmin_vx,  opivx_check)
++GEN_OPIVX_TRANS(vmaxu_vx, opivx_check)
++GEN_OPIVX_TRANS(vmax_vx,  opivx_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
+ #define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
+ #define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
+ #define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
++#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
++#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
++#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
++#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
+ /* operation of two vector elements */
+ typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VX(vmsgt_vx_b, int8_t,  H1, DO_MSGT)
+ GEN_VEXT_CMP_VX(vmsgt_vx_h, int16_t, H2, DO_MSGT)
+ GEN_VEXT_CMP_VX(vmsgt_vx_w, int32_t, H4, DO_MSGT)
+ GEN_VEXT_CMP_VX(vmsgt_vx_d, int64_t, H8, DO_MSGT)
++
++/* Vector Integer Min/Max Instructions */
++RVVCALL(OPIVV2, vminu_vv_b, OP_UUU_B, H1, H1, H1, DO_MIN)
++RVVCALL(OPIVV2, vminu_vv_h, OP_UUU_H, H2, H2, H2, DO_MIN)
++RVVCALL(OPIVV2, vminu_vv_w, OP_UUU_W, H4, H4, H4, DO_MIN)
++RVVCALL(OPIVV2, vminu_vv_d, OP_UUU_D, H8, H8, H8, DO_MIN)
++RVVCALL(OPIVV2, vmin_vv_b, OP_SSS_B, H1, H1, H1, DO_MIN)
++RVVCALL(OPIVV2, vmin_vv_h, OP_SSS_H, H2, H2, H2, DO_MIN)
++RVVCALL(OPIVV2, vmin_vv_w, OP_SSS_W, H4, H4, H4, DO_MIN)
++RVVCALL(OPIVV2, vmin_vv_d, OP_SSS_D, H8, H8, H8, DO_MIN)
++RVVCALL(OPIVV2, vmaxu_vv_b, OP_UUU_B, H1, H1, H1, DO_MAX)
++RVVCALL(OPIVV2, vmaxu_vv_h, OP_UUU_H, H2, H2, H2, DO_MAX)
++RVVCALL(OPIVV2, vmaxu_vv_w, OP_UUU_W, H4, H4, H4, DO_MAX)
++RVVCALL(OPIVV2, vmaxu_vv_d, OP_UUU_D, H8, H8, H8, DO_MAX)
++RVVCALL(OPIVV2, vmax_vv_b, OP_SSS_B, H1, H1, H1, DO_MAX)
++RVVCALL(OPIVV2, vmax_vv_h, OP_SSS_H, H2, H2, H2, DO_MAX)
++RVVCALL(OPIVV2, vmax_vv_w, OP_SSS_W, H4, H4, H4, DO_MAX)
++RVVCALL(OPIVV2, vmax_vv_d, OP_SSS_D, H8, H8, H8, DO_MAX)
++GEN_VEXT_VV(vminu_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vminu_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vminu_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vminu_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vmin_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vmin_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vmin_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vmin_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vmaxu_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vmaxu_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vmaxu_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vmaxu_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vmax_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vmax_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vmax_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vmax_vv_d, 8, 8, clearq)
++
++RVVCALL(OPIVX2, vminu_vx_b, OP_UUU_B, H1, H1, DO_MIN)
++RVVCALL(OPIVX2, vminu_vx_h, OP_UUU_H, H2, H2, DO_MIN)
++RVVCALL(OPIVX2, vminu_vx_w, OP_UUU_W, H4, H4, DO_MIN)
++RVVCALL(OPIVX2, vminu_vx_d, OP_UUU_D, H8, H8, DO_MIN)
++RVVCALL(OPIVX2, vmin_vx_b, OP_SSS_B, H1, H1, DO_MIN)
++RVVCALL(OPIVX2, vmin_vx_h, OP_SSS_H, H2, H2, DO_MIN)
++RVVCALL(OPIVX2, vmin_vx_w, OP_SSS_W, H4, H4, DO_MIN)
++RVVCALL(OPIVX2, vmin_vx_d, OP_SSS_D, H8, H8, DO_MIN)
++RVVCALL(OPIVX2, vmaxu_vx_b, OP_UUU_B, H1, H1, DO_MAX)
++RVVCALL(OPIVX2, vmaxu_vx_h, OP_UUU_H, H2, H2, DO_MAX)
++RVVCALL(OPIVX2, vmaxu_vx_w, OP_UUU_W, H4, H4, DO_MAX)
++RVVCALL(OPIVX2, vmaxu_vx_d, OP_UUU_D, H8, H8, DO_MAX)
++RVVCALL(OPIVX2, vmax_vx_b, OP_SSS_B, H1, H1, DO_MAX)
++RVVCALL(OPIVX2, vmax_vx_h, OP_SSS_H, H2, H2, DO_MAX)
++RVVCALL(OPIVX2, vmax_vx_w, OP_SSS_W, H4, H4, DO_MAX)
++RVVCALL(OPIVX2, vmax_vx_d, OP_SSS_D, H8, H8, DO_MAX)
++GEN_VEXT_VX(vminu_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vminu_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vminu_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vminu_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vmin_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vmin_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vmin_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vmin_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vmaxu_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vmaxu_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vmaxu_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vmaxu_vx_d, 8, 8,  clearq)
++GEN_VEXT_VX(vmax_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vmax_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vmax_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vmax_vx_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 21/64] target/riscv: vector single-width integer multiply instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-19-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  33 +++++
  target/riscv/insn32.decode              |   8 ++
  target/riscv/insn_trans/trans_rvv.inc.c |  10 ++
  target/riscv/vector_helper.c            | 163 ++++++++++++++++++++++++
 files changed, 214 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmax_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vmax_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vmax_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vmax_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulh_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmulhsu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmaxu_vv        000110 . ..... ..... 000 ..... 1010111 @r_vm
  vmaxu_vx        000110 . ..... ..... 100 ..... 1010111 @r_vm
  vmax_vv         000111 . ..... ..... 000 ..... 1010111 @r_vm
  vmax_vx         000111 . ..... ..... 100 ..... 1010111 @r_vm
 +vmul_vv         100101 . ..... ..... 010 ..... 1010111 @r_vm
 +vmul_vx         100101 . ..... ..... 110 ..... 1010111 @r_vm
 +vmulh_vv        100111 . ..... ..... 010 ..... 1010111 @r_vm
 +vmulh_vx        100111 . ..... ..... 110 ..... 1010111 @r_vm
 +vmulhu_vv       100100 . ..... ..... 010 ..... 1010111 @r_vm
 +vmulhu_vx       100100 . ..... ..... 110 ..... 1010111 @r_vm
 +vmulhsu_vv      100110 . ..... ..... 010 ..... 1010111 @r_vm
 +vmulhsu_vx      100110 . ..... ..... 110 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vminu_vx, opivx_check)
  GEN_OPIVX_TRANS(vmin_vx,  opivx_check)
  GEN_OPIVX_TRANS(vmaxu_vx, opivx_check)
  GEN_OPIVX_TRANS(vmax_vx,  opivx_check)
 +
 +/* Vector Single-Width Integer Multiply Instructions */
 +GEN_OPIVV_GVEC_TRANS(vmul_vv,  mul)
 +GEN_OPIVV_TRANS(vmulh_vv, opivv_check)
 +GEN_OPIVV_TRANS(vmulhu_vv, opivv_check)
 +GEN_OPIVV_TRANS(vmulhsu_vv, opivv_check)
 +GEN_OPIVX_GVEC_TRANS(vmul_vx,  muls)
 +GEN_OPIVX_TRANS(vmulh_vx, opivx_check)
 +GEN_OPIVX_TRANS(vmulhu_vx, opivx_check)
 +GEN_OPIVX_TRANS(vmulhsu_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
  #define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
  #define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
  #define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
 +#define OP_SUS_B int8_t, uint8_t, int8_t, uint8_t, int8_t
 +#define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
 +#define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
 +#define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
  /* operation of two vector elements */
  typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vmax_vx_b, 1, 1, clearb)
  GEN_VEXT_VX(vmax_vx_h, 2, 2, clearh)
  GEN_VEXT_VX(vmax_vx_w, 4, 4, clearl)
  GEN_VEXT_VX(vmax_vx_d, 8, 8, clearq)
 +
 +/* Vector Single-Width Integer Multiply Instructions */
 +#define DO_MUL(N, M) (N * M)
 +RVVCALL(OPIVV2, vmul_vv_b, OP_SSS_B, H1, H1, H1, DO_MUL)
 +RVVCALL(OPIVV2, vmul_vv_h, OP_SSS_H, H2, H2, H2, DO_MUL)
 +RVVCALL(OPIVV2, vmul_vv_w, OP_SSS_W, H4, H4, H4, DO_MUL)
 +RVVCALL(OPIVV2, vmul_vv_d, OP_SSS_D, H8, H8, H8, DO_MUL)
 +GEN_VEXT_VV(vmul_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vmul_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vmul_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vmul_vv_d, 8, 8, clearq)
 +
 +static int8_t do_mulh_b(int8_t s2, int8_t s1)
 +{
 +    return (int16_t)s2 * (int16_t)s1 >> 8;
 +}
 +
 +static int16_t do_mulh_h(int16_t s2, int16_t s1)
 +{
 +    return (int32_t)s2 * (int32_t)s1 >> 16;
 +}
 +
 +static int32_t do_mulh_w(int32_t s2, int32_t s1)
 +{
 +    return (int64_t)s2 * (int64_t)s1 >> 32;
 +}
 +
 +static int64_t do_mulh_d(int64_t s2, int64_t s1)
 +{
 +    uint64_t hi_64, lo_64;
 +
 +    muls64(&lo_64, &hi_64, s1, s2);
 +    return hi_64;
 +}
 +
 +static uint8_t do_mulhu_b(uint8_t s2, uint8_t s1)
 +{
 +    return (uint16_t)s2 * (uint16_t)s1 >> 8;
 +}
 +
 +static uint16_t do_mulhu_h(uint16_t s2, uint16_t s1)
 +{
 +    return (uint32_t)s2 * (uint32_t)s1 >> 16;
 +}
 +
 +static uint32_t do_mulhu_w(uint32_t s2, uint32_t s1)
 +{
 +    return (uint64_t)s2 * (uint64_t)s1 >> 32;
 +}
 +
 +static uint64_t do_mulhu_d(uint64_t s2, uint64_t s1)
 +{
 +    uint64_t hi_64, lo_64;
 +
 +    mulu64(&lo_64, &hi_64, s2, s1);
 +    return hi_64;
 +}
 +
 +static int8_t do_mulhsu_b(int8_t s2, uint8_t s1)
 +{
 +    return (int16_t)s2 * (uint16_t)s1 >> 8;
 +}
 +
 +static int16_t do_mulhsu_h(int16_t s2, uint16_t s1)
 +{
 +    return (int32_t)s2 * (uint32_t)s1 >> 16;
 +}
 +
 +static int32_t do_mulhsu_w(int32_t s2, uint32_t s1)
 +{
 +    return (int64_t)s2 * (uint64_t)s1 >> 32;
 +}
 +
 +/*
 + * Let  A = signed operand,
 + *      B = unsigned operand
 + *      P = mulu64(A, B), unsigned product
 + *
 + * LET  X = 2 ** 64  - A, 2's complement of A
 + *      SP = signed product
 + * THEN
 + *      IF A < 0
 + *          SP = -X * B
 + *             = -(2 ** 64 - A) * B
 + *             = A * B - 2 ** 64 * B
 + *             = P - 2 ** 64 * B
 + *      ELSE
 + *          SP = P
 + * THEN
 + *      HI_P -= (A < 0 ? B : 0)
 + */
 +
 +static int64_t do_mulhsu_d(int64_t s2, uint64_t s1)
 +{
 +    uint64_t hi_64, lo_64;
 +
 +    mulu64(&lo_64, &hi_64, s2, s1);
 +
 +    hi_64 -= s2 < 0 ? s1 : 0;
 +    return hi_64;
 +}
 +
 +RVVCALL(OPIVV2, vmulh_vv_b, OP_SSS_B, H1, H1, H1, do_mulh_b)
 +RVVCALL(OPIVV2, vmulh_vv_h, OP_SSS_H, H2, H2, H2, do_mulh_h)
 +RVVCALL(OPIVV2, vmulh_vv_w, OP_SSS_W, H4, H4, H4, do_mulh_w)
 +RVVCALL(OPIVV2, vmulh_vv_d, OP_SSS_D, H8, H8, H8, do_mulh_d)
 +RVVCALL(OPIVV2, vmulhu_vv_b, OP_UUU_B, H1, H1, H1, do_mulhu_b)
 +RVVCALL(OPIVV2, vmulhu_vv_h, OP_UUU_H, H2, H2, H2, do_mulhu_h)
 +RVVCALL(OPIVV2, vmulhu_vv_w, OP_UUU_W, H4, H4, H4, do_mulhu_w)
 +RVVCALL(OPIVV2, vmulhu_vv_d, OP_UUU_D, H8, H8, H8, do_mulhu_d)
 +RVVCALL(OPIVV2, vmulhsu_vv_b, OP_SUS_B, H1, H1, H1, do_mulhsu_b)
 +RVVCALL(OPIVV2, vmulhsu_vv_h, OP_SUS_H, H2, H2, H2, do_mulhsu_h)
 +RVVCALL(OPIVV2, vmulhsu_vv_w, OP_SUS_W, H4, H4, H4, do_mulhsu_w)
 +RVVCALL(OPIVV2, vmulhsu_vv_d, OP_SUS_D, H8, H8, H8, do_mulhsu_d)
 +GEN_VEXT_VV(vmulh_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vmulh_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vmulh_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vmulh_vv_d, 8, 8, clearq)
 +GEN_VEXT_VV(vmulhu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vmulhu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vmulhu_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vmulhu_vv_d, 8, 8, clearq)
 +GEN_VEXT_VV(vmulhsu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vmulhsu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vmulhsu_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vmulhsu_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2, vmul_vx_b, OP_SSS_B, H1, H1, DO_MUL)
 +RVVCALL(OPIVX2, vmul_vx_h, OP_SSS_H, H2, H2, DO_MUL)
 +RVVCALL(OPIVX2, vmul_vx_w, OP_SSS_W, H4, H4, DO_MUL)
 +RVVCALL(OPIVX2, vmul_vx_d, OP_SSS_D, H8, H8, DO_MUL)
 +RVVCALL(OPIVX2, vmulh_vx_b, OP_SSS_B, H1, H1, do_mulh_b)
 +RVVCALL(OPIVX2, vmulh_vx_h, OP_SSS_H, H2, H2, do_mulh_h)
 +RVVCALL(OPIVX2, vmulh_vx_w, OP_SSS_W, H4, H4, do_mulh_w)
 +RVVCALL(OPIVX2, vmulh_vx_d, OP_SSS_D, H8, H8, do_mulh_d)
 +RVVCALL(OPIVX2, vmulhu_vx_b, OP_UUU_B, H1, H1, do_mulhu_b)
 +RVVCALL(OPIVX2, vmulhu_vx_h, OP_UUU_H, H2, H2, do_mulhu_h)
 +RVVCALL(OPIVX2, vmulhu_vx_w, OP_UUU_W, H4, H4, do_mulhu_w)
 +RVVCALL(OPIVX2, vmulhu_vx_d, OP_UUU_D, H8, H8, do_mulhu_d)
 +RVVCALL(OPIVX2, vmulhsu_vx_b, OP_SUS_B, H1, H1, do_mulhsu_b)
 +RVVCALL(OPIVX2, vmulhsu_vx_h, OP_SUS_H, H2, H2, do_mulhsu_h)
 +RVVCALL(OPIVX2, vmulhsu_vx_w, OP_SUS_W, H4, H4, do_mulhsu_w)
 +RVVCALL(OPIVX2, vmulhsu_vx_d, OP_SUS_D, H8, H8, do_mulhsu_d)
 +GEN_VEXT_VX(vmul_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vmul_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vmul_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vmul_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vmulh_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vmulh_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vmulh_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vmulh_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vmulhu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vmulhu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vmulhu_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vmulhu_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vmulhsu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vmulhsu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vmulhsu_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vmulhsu_vx_d, 8, 8, clearq)
 --
 .27.0

-New patch
+[PULL v2 22/64] target/riscv: vector integer divide instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-20-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 33 +++++++++++
+ target/riscv/insn32.decode              |  8 +++
+ target/riscv/insn_trans/trans_rvv.inc.c | 10 ++++
+ target/riscv/vector_helper.c            | 74 +++++++++++++++++++++++++
+files changed, 125 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmulhsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmulhsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmulhsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vmulhsu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vdivu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdivu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdivu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdivu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdiv_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdiv_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdiv_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdiv_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vremu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vremu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vremu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vremu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrem_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrem_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrem_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrem_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vdivu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdivu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdivu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdivu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdiv_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdiv_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdiv_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vdiv_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vremu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vremu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vremu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vremu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrem_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrem_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrem_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrem_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vmulhu_vv       100100 . ..... ..... 010 ..... 1010111 @r_vm
+ vmulhu_vx       100100 . ..... ..... 110 ..... 1010111 @r_vm
+ vmulhsu_vv      100110 . ..... ..... 010 ..... 1010111 @r_vm
+ vmulhsu_vx      100110 . ..... ..... 110 ..... 1010111 @r_vm
++vdivu_vv        100000 . ..... ..... 010 ..... 1010111 @r_vm
++vdivu_vx        100000 . ..... ..... 110 ..... 1010111 @r_vm
++vdiv_vv         100001 . ..... ..... 010 ..... 1010111 @r_vm
++vdiv_vx         100001 . ..... ..... 110 ..... 1010111 @r_vm
++vremu_vv        100010 . ..... ..... 010 ..... 1010111 @r_vm
++vremu_vx        100010 . ..... ..... 110 ..... 1010111 @r_vm
++vrem_vv         100011 . ..... ..... 010 ..... 1010111 @r_vm
++vrem_vx         100011 . ..... ..... 110 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_TRANS(vmul_vx,  muls)
+ GEN_OPIVX_TRANS(vmulh_vx, opivx_check)
+ GEN_OPIVX_TRANS(vmulhu_vx, opivx_check)
+ GEN_OPIVX_TRANS(vmulhsu_vx, opivx_check)
++
++/* Vector Integer Divide Instructions */
++GEN_OPIVV_TRANS(vdivu_vv, opivv_check)
++GEN_OPIVV_TRANS(vdiv_vv, opivv_check)
++GEN_OPIVV_TRANS(vremu_vv, opivv_check)
++GEN_OPIVV_TRANS(vrem_vv, opivv_check)
++GEN_OPIVX_TRANS(vdivu_vx, opivx_check)
++GEN_OPIVX_TRANS(vdiv_vx, opivx_check)
++GEN_OPIVX_TRANS(vremu_vx, opivx_check)
++GEN_OPIVX_TRANS(vrem_vx, opivx_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vmulhsu_vx_b, 1, 1, clearb)
+ GEN_VEXT_VX(vmulhsu_vx_h, 2, 2, clearh)
+ GEN_VEXT_VX(vmulhsu_vx_w, 4, 4, clearl)
+ GEN_VEXT_VX(vmulhsu_vx_d, 8, 8, clearq)
++
++/* Vector Integer Divide Instructions */
++#define DO_DIVU(N, M) (unlikely(M == 0) ? (__typeof(N))(-1) : N / M)
++#define DO_REMU(N, M) (unlikely(M == 0) ? N : N % M)
++#define DO_DIV(N, M)  (unlikely(M == 0) ? (__typeof(N))(-1) :\
++        unlikely((N == -N) && (M == (__typeof(N))(-1))) ? N : N / M)
++#define DO_REM(N, M)  (unlikely(M == 0) ? N :\
++        unlikely((N == -N) && (M == (__typeof(N))(-1))) ? 0 : N % M)
++
++RVVCALL(OPIVV2, vdivu_vv_b, OP_UUU_B, H1, H1, H1, DO_DIVU)
++RVVCALL(OPIVV2, vdivu_vv_h, OP_UUU_H, H2, H2, H2, DO_DIVU)
++RVVCALL(OPIVV2, vdivu_vv_w, OP_UUU_W, H4, H4, H4, DO_DIVU)
++RVVCALL(OPIVV2, vdivu_vv_d, OP_UUU_D, H8, H8, H8, DO_DIVU)
++RVVCALL(OPIVV2, vdiv_vv_b, OP_SSS_B, H1, H1, H1, DO_DIV)
++RVVCALL(OPIVV2, vdiv_vv_h, OP_SSS_H, H2, H2, H2, DO_DIV)
++RVVCALL(OPIVV2, vdiv_vv_w, OP_SSS_W, H4, H4, H4, DO_DIV)
++RVVCALL(OPIVV2, vdiv_vv_d, OP_SSS_D, H8, H8, H8, DO_DIV)
++RVVCALL(OPIVV2, vremu_vv_b, OP_UUU_B, H1, H1, H1, DO_REMU)
++RVVCALL(OPIVV2, vremu_vv_h, OP_UUU_H, H2, H2, H2, DO_REMU)
++RVVCALL(OPIVV2, vremu_vv_w, OP_UUU_W, H4, H4, H4, DO_REMU)
++RVVCALL(OPIVV2, vremu_vv_d, OP_UUU_D, H8, H8, H8, DO_REMU)
++RVVCALL(OPIVV2, vrem_vv_b, OP_SSS_B, H1, H1, H1, DO_REM)
++RVVCALL(OPIVV2, vrem_vv_h, OP_SSS_H, H2, H2, H2, DO_REM)
++RVVCALL(OPIVV2, vrem_vv_w, OP_SSS_W, H4, H4, H4, DO_REM)
++RVVCALL(OPIVV2, vrem_vv_d, OP_SSS_D, H8, H8, H8, DO_REM)
++GEN_VEXT_VV(vdivu_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vdivu_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vdivu_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vdivu_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vdiv_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vdiv_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vdiv_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vdiv_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vremu_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vremu_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vremu_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vremu_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vrem_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vrem_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vrem_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vrem_vv_d, 8, 8, clearq)
++
++RVVCALL(OPIVX2, vdivu_vx_b, OP_UUU_B, H1, H1, DO_DIVU)
++RVVCALL(OPIVX2, vdivu_vx_h, OP_UUU_H, H2, H2, DO_DIVU)
++RVVCALL(OPIVX2, vdivu_vx_w, OP_UUU_W, H4, H4, DO_DIVU)
++RVVCALL(OPIVX2, vdivu_vx_d, OP_UUU_D, H8, H8, DO_DIVU)
++RVVCALL(OPIVX2, vdiv_vx_b, OP_SSS_B, H1, H1, DO_DIV)
++RVVCALL(OPIVX2, vdiv_vx_h, OP_SSS_H, H2, H2, DO_DIV)
++RVVCALL(OPIVX2, vdiv_vx_w, OP_SSS_W, H4, H4, DO_DIV)
++RVVCALL(OPIVX2, vdiv_vx_d, OP_SSS_D, H8, H8, DO_DIV)
++RVVCALL(OPIVX2, vremu_vx_b, OP_UUU_B, H1, H1, DO_REMU)
++RVVCALL(OPIVX2, vremu_vx_h, OP_UUU_H, H2, H2, DO_REMU)
++RVVCALL(OPIVX2, vremu_vx_w, OP_UUU_W, H4, H4, DO_REMU)
++RVVCALL(OPIVX2, vremu_vx_d, OP_UUU_D, H8, H8, DO_REMU)
++RVVCALL(OPIVX2, vrem_vx_b, OP_SSS_B, H1, H1, DO_REM)
++RVVCALL(OPIVX2, vrem_vx_h, OP_SSS_H, H2, H2, DO_REM)
++RVVCALL(OPIVX2, vrem_vx_w, OP_SSS_W, H4, H4, DO_REM)
++RVVCALL(OPIVX2, vrem_vx_d, OP_SSS_D, H8, H8, DO_REM)
++GEN_VEXT_VX(vdivu_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vdivu_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vdivu_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vdivu_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vdiv_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vdiv_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vdiv_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vdiv_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vremu_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vremu_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vremu_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vremu_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vrem_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vrem_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vrem_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vrem_vx_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 23/64] target/riscv: vector widening integer multiply instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-21-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 19 +++++++++
+ target/riscv/insn32.decode              |  6 +++
+ target/riscv/insn_trans/trans_rvv.inc.c |  8 ++++
+ target/riscv/vector_helper.c            | 51 +++++++++++++++++++++++++
+files changed, 84 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vrem_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vrem_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vrem_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vrem_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vwmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmulu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmulu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmulu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmulsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmulsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmulsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmulu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmulu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmulu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmulsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmulsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmulsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vremu_vv        100010 . ..... ..... 010 ..... 1010111 @r_vm
+ vremu_vx        100010 . ..... ..... 110 ..... 1010111 @r_vm
+ vrem_vv         100011 . ..... ..... 010 ..... 1010111 @r_vm
+ vrem_vx         100011 . ..... ..... 110 ..... 1010111 @r_vm
++vwmulu_vv       111000 . ..... ..... 010 ..... 1010111 @r_vm
++vwmulu_vx       111000 . ..... ..... 110 ..... 1010111 @r_vm
++vwmulsu_vv      111010 . ..... ..... 010 ..... 1010111 @r_vm
++vwmulsu_vx      111010 . ..... ..... 110 ..... 1010111 @r_vm
++vwmul_vv        111011 . ..... ..... 010 ..... 1010111 @r_vm
++vwmul_vx        111011 . ..... ..... 110 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vdivu_vx, opivx_check)
+ GEN_OPIVX_TRANS(vdiv_vx, opivx_check)
+ GEN_OPIVX_TRANS(vremu_vx, opivx_check)
+ GEN_OPIVX_TRANS(vrem_vx, opivx_check)
++
++/* Vector Widening Integer Multiply Instructions */
++GEN_OPIVV_WIDEN_TRANS(vwmul_vv, opivv_widen_check)
++GEN_OPIVV_WIDEN_TRANS(vwmulu_vv, opivv_widen_check)
++GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
++GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
++GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
++GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
+ #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
+ #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
+ #define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
++#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
++#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
++#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
++#define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
++#define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
++#define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
++#define WOP_SUS_B int16_t, uint8_t, int8_t, uint16_t, int16_t
++#define WOP_SUS_H int32_t, uint16_t, int16_t, uint32_t, int32_t
++#define WOP_SUS_W int64_t, uint32_t, int32_t, uint64_t, int64_t
++#define WOP_SSU_B int16_t, int8_t, uint8_t, int16_t, uint16_t
++#define WOP_SSU_H int32_t, int16_t, uint16_t, int32_t, uint32_t
++#define WOP_SSU_W int64_t, int32_t, uint32_t, int64_t, uint64_t
+ /* operation of two vector elements */
+ typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vrem_vx_b, 1, 1, clearb)
+ GEN_VEXT_VX(vrem_vx_h, 2, 2, clearh)
+ GEN_VEXT_VX(vrem_vx_w, 4, 4, clearl)
+ GEN_VEXT_VX(vrem_vx_d, 8, 8, clearq)
++
++/* Vector Widening Integer Multiply Instructions */
++RVVCALL(OPIVV2, vwmul_vv_b, WOP_SSS_B, H2, H1, H1, DO_MUL)
++RVVCALL(OPIVV2, vwmul_vv_h, WOP_SSS_H, H4, H2, H2, DO_MUL)
++RVVCALL(OPIVV2, vwmul_vv_w, WOP_SSS_W, H8, H4, H4, DO_MUL)
++RVVCALL(OPIVV2, vwmulu_vv_b, WOP_UUU_B, H2, H1, H1, DO_MUL)
++RVVCALL(OPIVV2, vwmulu_vv_h, WOP_UUU_H, H4, H2, H2, DO_MUL)
++RVVCALL(OPIVV2, vwmulu_vv_w, WOP_UUU_W, H8, H4, H4, DO_MUL)
++RVVCALL(OPIVV2, vwmulsu_vv_b, WOP_SUS_B, H2, H1, H1, DO_MUL)
++RVVCALL(OPIVV2, vwmulsu_vv_h, WOP_SUS_H, H4, H2, H2, DO_MUL)
++RVVCALL(OPIVV2, vwmulsu_vv_w, WOP_SUS_W, H8, H4, H4, DO_MUL)
++GEN_VEXT_VV(vwmul_vv_b, 1, 2, clearh)
++GEN_VEXT_VV(vwmul_vv_h, 2, 4, clearl)
++GEN_VEXT_VV(vwmul_vv_w, 4, 8, clearq)
++GEN_VEXT_VV(vwmulu_vv_b, 1, 2, clearh)
++GEN_VEXT_VV(vwmulu_vv_h, 2, 4, clearl)
++GEN_VEXT_VV(vwmulu_vv_w, 4, 8, clearq)
++GEN_VEXT_VV(vwmulsu_vv_b, 1, 2, clearh)
++GEN_VEXT_VV(vwmulsu_vv_h, 2, 4, clearl)
++GEN_VEXT_VV(vwmulsu_vv_w, 4, 8, clearq)
++
++RVVCALL(OPIVX2, vwmul_vx_b, WOP_SSS_B, H2, H1, DO_MUL)
++RVVCALL(OPIVX2, vwmul_vx_h, WOP_SSS_H, H4, H2, DO_MUL)
++RVVCALL(OPIVX2, vwmul_vx_w, WOP_SSS_W, H8, H4, DO_MUL)
++RVVCALL(OPIVX2, vwmulu_vx_b, WOP_UUU_B, H2, H1, DO_MUL)
++RVVCALL(OPIVX2, vwmulu_vx_h, WOP_UUU_H, H4, H2, DO_MUL)
++RVVCALL(OPIVX2, vwmulu_vx_w, WOP_UUU_W, H8, H4, DO_MUL)
++RVVCALL(OPIVX2, vwmulsu_vx_b, WOP_SUS_B, H2, H1, DO_MUL)
++RVVCALL(OPIVX2, vwmulsu_vx_h, WOP_SUS_H, H4, H2, DO_MUL)
++RVVCALL(OPIVX2, vwmulsu_vx_w, WOP_SUS_W, H8, H4, DO_MUL)
++GEN_VEXT_VX(vwmul_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmul_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmul_vx_w, 4, 8, clearq)
++GEN_VEXT_VX(vwmulu_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmulu_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmulu_vx_w, 4, 8, clearq)
++GEN_VEXT_VX(vwmulsu_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmulsu_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmulsu_vx_w, 4, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 24/64] target/riscv: vector single-width integer multiply-add instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-22-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 33 ++++++++++
+ target/riscv/insn32.decode              |  8 +++
+ target/riscv/insn_trans/trans_rvv.inc.c | 10 +++
+ target/riscv/vector_helper.c            | 88 +++++++++++++++++++++++++
+files changed, 139 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwmulu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vwmulsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vwmulsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vwmulsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmacc_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsac_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vmadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vnmsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vwmulsu_vv      111010 . ..... ..... 010 ..... 1010111 @r_vm
+ vwmulsu_vx      111010 . ..... ..... 110 ..... 1010111 @r_vm
+ vwmul_vv        111011 . ..... ..... 010 ..... 1010111 @r_vm
+ vwmul_vx        111011 . ..... ..... 110 ..... 1010111 @r_vm
++vmacc_vv        101101 . ..... ..... 010 ..... 1010111 @r_vm
++vmacc_vx        101101 . ..... ..... 110 ..... 1010111 @r_vm
++vnmsac_vv       101111 . ..... ..... 010 ..... 1010111 @r_vm
++vnmsac_vx       101111 . ..... ..... 110 ..... 1010111 @r_vm
++vmadd_vv        101001 . ..... ..... 010 ..... 1010111 @r_vm
++vmadd_vx        101001 . ..... ..... 110 ..... 1010111 @r_vm
++vnmsub_vv       101011 . ..... ..... 010 ..... 1010111 @r_vm
++vnmsub_vx       101011 . ..... ..... 110 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
+ GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
+ GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
+ GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
++
++/* Vector Single-Width Integer Multiply-Add Instructions */
++GEN_OPIVV_TRANS(vmacc_vv, opivv_check)
++GEN_OPIVV_TRANS(vnmsac_vv, opivv_check)
++GEN_OPIVV_TRANS(vmadd_vv, opivv_check)
++GEN_OPIVV_TRANS(vnmsub_vv, opivv_check)
++GEN_OPIVX_TRANS(vmacc_vx, opivx_check)
++GEN_OPIVX_TRANS(vnmsac_vx, opivx_check)
++GEN_OPIVX_TRANS(vmadd_vx, opivx_check)
++GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwmulu_vx_w, 4, 8, clearq)
+ GEN_VEXT_VX(vwmulsu_vx_b, 1, 2, clearh)
+ GEN_VEXT_VX(vwmulsu_vx_h, 2, 4, clearl)
+ GEN_VEXT_VX(vwmulsu_vx_w, 4, 8, clearq)
++
++/* Vector Single-Width Integer Multiply-Add Instructions */
++#define OPIVV3(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)   \
++static void do_##NAME(void *vd, void *vs1, void *vs2, int i)       \
++{                                                                  \
++    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
++    TD d = *((TD *)vd + HD(i));                                    \
++    *((TD *)vd + HD(i)) = OP(s2, s1, d);                           \
++}
++
++#define DO_MACC(N, M, D) (M * N + D)
++#define DO_NMSAC(N, M, D) (-(M * N) + D)
++#define DO_MADD(N, M, D) (M * D + N)
++#define DO_NMSUB(N, M, D) (-(M * D) + N)
++RVVCALL(OPIVV3, vmacc_vv_b, OP_SSS_B, H1, H1, H1, DO_MACC)
++RVVCALL(OPIVV3, vmacc_vv_h, OP_SSS_H, H2, H2, H2, DO_MACC)
++RVVCALL(OPIVV3, vmacc_vv_w, OP_SSS_W, H4, H4, H4, DO_MACC)
++RVVCALL(OPIVV3, vmacc_vv_d, OP_SSS_D, H8, H8, H8, DO_MACC)
++RVVCALL(OPIVV3, vnmsac_vv_b, OP_SSS_B, H1, H1, H1, DO_NMSAC)
++RVVCALL(OPIVV3, vnmsac_vv_h, OP_SSS_H, H2, H2, H2, DO_NMSAC)
++RVVCALL(OPIVV3, vnmsac_vv_w, OP_SSS_W, H4, H4, H4, DO_NMSAC)
++RVVCALL(OPIVV3, vnmsac_vv_d, OP_SSS_D, H8, H8, H8, DO_NMSAC)
++RVVCALL(OPIVV3, vmadd_vv_b, OP_SSS_B, H1, H1, H1, DO_MADD)
++RVVCALL(OPIVV3, vmadd_vv_h, OP_SSS_H, H2, H2, H2, DO_MADD)
++RVVCALL(OPIVV3, vmadd_vv_w, OP_SSS_W, H4, H4, H4, DO_MADD)
++RVVCALL(OPIVV3, vmadd_vv_d, OP_SSS_D, H8, H8, H8, DO_MADD)
++RVVCALL(OPIVV3, vnmsub_vv_b, OP_SSS_B, H1, H1, H1, DO_NMSUB)
++RVVCALL(OPIVV3, vnmsub_vv_h, OP_SSS_H, H2, H2, H2, DO_NMSUB)
++RVVCALL(OPIVV3, vnmsub_vv_w, OP_SSS_W, H4, H4, H4, DO_NMSUB)
++RVVCALL(OPIVV3, vnmsub_vv_d, OP_SSS_D, H8, H8, H8, DO_NMSUB)
++GEN_VEXT_VV(vmacc_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vmacc_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vmacc_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vmacc_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vnmsac_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vnmsac_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vnmsac_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vnmsac_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vmadd_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vmadd_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vmadd_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vmadd_vv_d, 8, 8, clearq)
++GEN_VEXT_VV(vnmsub_vv_b, 1, 1, clearb)
++GEN_VEXT_VV(vnmsub_vv_h, 2, 2, clearh)
++GEN_VEXT_VV(vnmsub_vv_w, 4, 4, clearl)
++GEN_VEXT_VV(vnmsub_vv_d, 8, 8, clearq)
++
++#define OPIVX3(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
++static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
++{                                                                   \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
++    TD d = *((TD *)vd + HD(i));                                     \
++    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, d);                   \
++}
++
++RVVCALL(OPIVX3, vmacc_vx_b, OP_SSS_B, H1, H1, DO_MACC)
++RVVCALL(OPIVX3, vmacc_vx_h, OP_SSS_H, H2, H2, DO_MACC)
++RVVCALL(OPIVX3, vmacc_vx_w, OP_SSS_W, H4, H4, DO_MACC)
++RVVCALL(OPIVX3, vmacc_vx_d, OP_SSS_D, H8, H8, DO_MACC)
++RVVCALL(OPIVX3, vnmsac_vx_b, OP_SSS_B, H1, H1, DO_NMSAC)
++RVVCALL(OPIVX3, vnmsac_vx_h, OP_SSS_H, H2, H2, DO_NMSAC)
++RVVCALL(OPIVX3, vnmsac_vx_w, OP_SSS_W, H4, H4, DO_NMSAC)
++RVVCALL(OPIVX3, vnmsac_vx_d, OP_SSS_D, H8, H8, DO_NMSAC)
++RVVCALL(OPIVX3, vmadd_vx_b, OP_SSS_B, H1, H1, DO_MADD)
++RVVCALL(OPIVX3, vmadd_vx_h, OP_SSS_H, H2, H2, DO_MADD)
++RVVCALL(OPIVX3, vmadd_vx_w, OP_SSS_W, H4, H4, DO_MADD)
++RVVCALL(OPIVX3, vmadd_vx_d, OP_SSS_D, H8, H8, DO_MADD)
++RVVCALL(OPIVX3, vnmsub_vx_b, OP_SSS_B, H1, H1, DO_NMSUB)
++RVVCALL(OPIVX3, vnmsub_vx_h, OP_SSS_H, H2, H2, DO_NMSUB)
++RVVCALL(OPIVX3, vnmsub_vx_w, OP_SSS_W, H4, H4, DO_NMSUB)
++RVVCALL(OPIVX3, vnmsub_vx_d, OP_SSS_D, H8, H8, DO_NMSUB)
++GEN_VEXT_VX(vmacc_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vmacc_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vmacc_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vmacc_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vnmsac_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vnmsac_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vnmsac_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vnmsac_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vmadd_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vmadd_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vmadd_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vmadd_vx_d, 8, 8, clearq)
++GEN_VEXT_VX(vnmsub_vx_b, 1, 1, clearb)
++GEN_VEXT_VX(vnmsub_vx_h, 2, 2, clearh)
++GEN_VEXT_VX(vnmsub_vx_w, 4, 4, clearl)
++GEN_VEXT_VX(vnmsub_vx_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 25/64] target/riscv: vector widening integer multiply-add instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-23-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 22 ++++++++++++
+ target/riscv/insn32.decode              |  7 ++++
+ target/riscv/insn_trans/trans_rvv.inc.c |  9 +++++
+ target/riscv/vector_helper.c            | 45 +++++++++++++++++++++++++
+files changed, 83 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnmsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vnmsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vnmsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vnmsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vwmaccu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmaccu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmaccu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmaccsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmaccsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmaccsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwmaccu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vmadd_vv        101001 . ..... ..... 010 ..... 1010111 @r_vm
+ vmadd_vx        101001 . ..... ..... 110 ..... 1010111 @r_vm
+ vnmsub_vv       101011 . ..... ..... 010 ..... 1010111 @r_vm
+ vnmsub_vx       101011 . ..... ..... 110 ..... 1010111 @r_vm
++vwmaccu_vv      111100 . ..... ..... 010 ..... 1010111 @r_vm
++vwmaccu_vx      111100 . ..... ..... 110 ..... 1010111 @r_vm
++vwmacc_vv       111101 . ..... ..... 010 ..... 1010111 @r_vm
++vwmacc_vx       111101 . ..... ..... 110 ..... 1010111 @r_vm
++vwmaccsu_vv     111110 . ..... ..... 010 ..... 1010111 @r_vm
++vwmaccsu_vx     111110 . ..... ..... 110 ..... 1010111 @r_vm
++vwmaccus_vx     111111 . ..... ..... 110 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vmacc_vx, opivx_check)
+ GEN_OPIVX_TRANS(vnmsac_vx, opivx_check)
+ GEN_OPIVX_TRANS(vmadd_vx, opivx_check)
+ GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
++
++/* Vector Widening Integer Multiply-Add Instructions */
++GEN_OPIVV_WIDEN_TRANS(vwmaccu_vv, opivv_widen_check)
++GEN_OPIVV_WIDEN_TRANS(vwmacc_vv, opivv_widen_check)
++GEN_OPIVV_WIDEN_TRANS(vwmaccsu_vv, opivv_widen_check)
++GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
++GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
++GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
++GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vnmsub_vx_b, 1, 1, clearb)
+ GEN_VEXT_VX(vnmsub_vx_h, 2, 2, clearh)
+ GEN_VEXT_VX(vnmsub_vx_w, 4, 4, clearl)
+ GEN_VEXT_VX(vnmsub_vx_d, 8, 8, clearq)
++
++/* Vector Widening Integer Multiply-Add Instructions */
++RVVCALL(OPIVV3, vwmaccu_vv_b, WOP_UUU_B, H2, H1, H1, DO_MACC)
++RVVCALL(OPIVV3, vwmaccu_vv_h, WOP_UUU_H, H4, H2, H2, DO_MACC)
++RVVCALL(OPIVV3, vwmaccu_vv_w, WOP_UUU_W, H8, H4, H4, DO_MACC)
++RVVCALL(OPIVV3, vwmacc_vv_b, WOP_SSS_B, H2, H1, H1, DO_MACC)
++RVVCALL(OPIVV3, vwmacc_vv_h, WOP_SSS_H, H4, H2, H2, DO_MACC)
++RVVCALL(OPIVV3, vwmacc_vv_w, WOP_SSS_W, H8, H4, H4, DO_MACC)
++RVVCALL(OPIVV3, vwmaccsu_vv_b, WOP_SSU_B, H2, H1, H1, DO_MACC)
++RVVCALL(OPIVV3, vwmaccsu_vv_h, WOP_SSU_H, H4, H2, H2, DO_MACC)
++RVVCALL(OPIVV3, vwmaccsu_vv_w, WOP_SSU_W, H8, H4, H4, DO_MACC)
++GEN_VEXT_VV(vwmaccu_vv_b, 1, 2, clearh)
++GEN_VEXT_VV(vwmaccu_vv_h, 2, 4, clearl)
++GEN_VEXT_VV(vwmaccu_vv_w, 4, 8, clearq)
++GEN_VEXT_VV(vwmacc_vv_b, 1, 2, clearh)
++GEN_VEXT_VV(vwmacc_vv_h, 2, 4, clearl)
++GEN_VEXT_VV(vwmacc_vv_w, 4, 8, clearq)
++GEN_VEXT_VV(vwmaccsu_vv_b, 1, 2, clearh)
++GEN_VEXT_VV(vwmaccsu_vv_h, 2, 4, clearl)
++GEN_VEXT_VV(vwmaccsu_vv_w, 4, 8, clearq)
++
++RVVCALL(OPIVX3, vwmaccu_vx_b, WOP_UUU_B, H2, H1, DO_MACC)
++RVVCALL(OPIVX3, vwmaccu_vx_h, WOP_UUU_H, H4, H2, DO_MACC)
++RVVCALL(OPIVX3, vwmaccu_vx_w, WOP_UUU_W, H8, H4, DO_MACC)
++RVVCALL(OPIVX3, vwmacc_vx_b, WOP_SSS_B, H2, H1, DO_MACC)
++RVVCALL(OPIVX3, vwmacc_vx_h, WOP_SSS_H, H4, H2, DO_MACC)
++RVVCALL(OPIVX3, vwmacc_vx_w, WOP_SSS_W, H8, H4, DO_MACC)
++RVVCALL(OPIVX3, vwmaccsu_vx_b, WOP_SSU_B, H2, H1, DO_MACC)
++RVVCALL(OPIVX3, vwmaccsu_vx_h, WOP_SSU_H, H4, H2, DO_MACC)
++RVVCALL(OPIVX3, vwmaccsu_vx_w, WOP_SSU_W, H8, H4, DO_MACC)
++RVVCALL(OPIVX3, vwmaccus_vx_b, WOP_SUS_B, H2, H1, DO_MACC)
++RVVCALL(OPIVX3, vwmaccus_vx_h, WOP_SUS_H, H4, H2, DO_MACC)
++RVVCALL(OPIVX3, vwmaccus_vx_w, WOP_SUS_W, H8, H4, DO_MACC)
++GEN_VEXT_VX(vwmaccu_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmaccu_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmaccu_vx_w, 4, 8, clearq)
++GEN_VEXT_VX(vwmacc_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmacc_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmacc_vx_w, 4, 8, clearq)
++GEN_VEXT_VX(vwmaccsu_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmaccsu_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmaccsu_vx_w, 4, 8, clearq)
++GEN_VEXT_VX(vwmaccus_vx_b, 1, 2, clearh)
++GEN_VEXT_VX(vwmaccus_vx_h, 2, 4, clearl)
++GEN_VEXT_VX(vwmaccus_vx_w, 4, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 26/64] target/riscv: vector integer merge and move instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-24-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  17 ++++
  target/riscv/insn32.decode              |   7 ++
  target/riscv/insn_trans/trans_rvv.inc.c | 113 ++++++++++++++++++++++++
  target/riscv/vector_helper.c            |  88 ++++++++++++++++++
 files changed, 225 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vmerge_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmerge_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_4(vmv_v_v_b, void, ptr, ptr, env, i32)
 +DEF_HELPER_4(vmv_v_v_h, void, ptr, ptr, env, i32)
 +DEF_HELPER_4(vmv_v_v_w, void, ptr, ptr, env, i32)
 +DEF_HELPER_4(vmv_v_v_d, void, ptr, ptr, env, i32)
 +DEF_HELPER_4(vmv_v_x_b, void, ptr, i64, env, i32)
 +DEF_HELPER_4(vmv_v_x_h, void, ptr, i64, env, i32)
 +DEF_HELPER_4(vmv_v_x_w, void, ptr, i64, env, i32)
 +DEF_HELPER_4(vmv_v_x_d, void, ptr, i64, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@
  @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
  @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
  @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
 +@r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
  @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
  @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
@@ -XXX,XX +XXX,XX @@ vwmacc_vx       111101 . ..... ..... 110 ..... 1010111 @r_vm
  vwmaccsu_vv     111110 . ..... ..... 010 ..... 1010111 @r_vm
  vwmaccsu_vx     111110 . ..... ..... 110 ..... 1010111 @r_vm
  vwmaccus_vx     111111 . ..... ..... 110 ..... 1010111 @r_vm
 +vmv_v_v         010111 1 00000 ..... 000 ..... 1010111 @r2
 +vmv_v_x         010111 1 00000 ..... 100 ..... 1010111 @r2
 +vmv_v_i         010111 1 00000 ..... 011 ..... 1010111 @r2
 +vmerge_vvm      010111 0 ..... ..... 000 ..... 1010111 @r_vm_0
 +vmerge_vxm      010111 0 ..... ..... 100 ..... 1010111 @r_vm_0
 +vmerge_vim      010111 0 ..... ..... 011 ..... 1010111 @r_vm_0
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
  GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
  GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
  GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
 +
 +/* Vector Integer Merge and Move Instructions */
 +static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        vext_check_reg(s, a->rs1, false)) {
 +
 +        if (s->vl_eq_vlmax) {
 +            tcg_gen_gvec_mov(s->sew, vreg_ofs(s, a->rd),
 +                             vreg_ofs(s, a->rs1),
 +                             MAXSZ(s), MAXSZ(s));
 +        } else {
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_gvec_2_ptr * const fns[4] = {
 +                gen_helper_vmv_v_v_b, gen_helper_vmv_v_v_h,
 +                gen_helper_vmv_v_v_w, gen_helper_vmv_v_v_d,
 +            };
 +            TCGLabel *over = gen_new_label();
 +            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +            tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
 +                               cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
 +            gen_set_label(over);
 +        }
 +        return true;
 +    }
 +    return false;
 +}
 +
 +typedef void gen_helper_vmv_vx(TCGv_ptr, TCGv_i64, TCGv_env, TCGv_i32);
 +static bool trans_vmv_v_x(DisasContext *s, arg_vmv_v_x *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false)) {
 +
 +        TCGv s1;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        s1 = tcg_temp_new();
 +        gen_get_gpr(s1, a->rs1);
 +
 +        if (s->vl_eq_vlmax) {
 +            tcg_gen_gvec_dup_tl(s->sew, vreg_ofs(s, a->rd),
 +                                MAXSZ(s), MAXSZ(s), s1);
 +        } else {
 +            TCGv_i32 desc ;
 +            TCGv_i64 s1_i64 = tcg_temp_new_i64();
 +            TCGv_ptr dest = tcg_temp_new_ptr();
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_vmv_vx * const fns[4] = {
 +                gen_helper_vmv_v_x_b, gen_helper_vmv_v_x_h,
 +                gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
 +            };
 +
 +            tcg_gen_ext_tl_i64(s1_i64, s1);
 +            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
 +            fns[s->sew](dest, s1_i64, cpu_env, desc);
 +
 +            tcg_temp_free_ptr(dest);
 +            tcg_temp_free_i32(desc);
 +            tcg_temp_free_i64(s1_i64);
 +        }
 +
 +        tcg_temp_free(s1);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
 +static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false)) {
 +
 +        int64_t simm = sextract64(a->rs1, 0, 5);
 +        if (s->vl_eq_vlmax) {
 +            tcg_gen_gvec_dup_imm(s->sew, vreg_ofs(s, a->rd),
 +                                 MAXSZ(s), MAXSZ(s), simm);
 +        } else {
 +            TCGv_i32 desc;
 +            TCGv_i64 s1;
 +            TCGv_ptr dest;
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_vmv_vx * const fns[4] = {
 +                gen_helper_vmv_v_x_b, gen_helper_vmv_v_x_h,
 +                gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
 +            };
 +            TCGLabel *over = gen_new_label();
 +            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +            s1 = tcg_const_i64(simm);
 +            dest = tcg_temp_new_ptr();
 +            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
 +            fns[s->sew](dest, s1, cpu_env, desc);
 +
 +            tcg_temp_free_ptr(dest);
 +            tcg_temp_free_i32(desc);
 +            tcg_temp_free_i64(s1);
 +            gen_set_label(over);
 +        }
 +        return true;
 +    }
 +    return false;
 +}
 +
 +GEN_OPIVV_TRANS(vmerge_vvm, opivv_vadc_check)
 +GEN_OPIVX_TRANS(vmerge_vxm, opivx_vadc_check)
 +GEN_OPIVI_TRANS(vmerge_vim, 0, vmerge_vxm, opivx_vadc_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwmaccsu_vx_w, 4, 8, clearq)
  GEN_VEXT_VX(vwmaccus_vx_b, 1, 2, clearh)
  GEN_VEXT_VX(vwmaccus_vx_h, 2, 4, clearl)
  GEN_VEXT_VX(vwmaccus_vx_w, 4, 8, clearq)
 +
 +/* Vector Integer Merge and Move Instructions */
 +#define GEN_VEXT_VMV_VV(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *vs1, CPURISCVState *env,           \
 +                  uint32_t desc)                                     \
 +{                                                                    \
 +    uint32_t vl = env->vl;                                           \
 +    uint32_t esz = sizeof(ETYPE);                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
 +    uint32_t i;                                                      \
 +                                                                     \
 +    for (i = 0; i < vl; i++) {                                       \
 +        ETYPE s1 = *((ETYPE *)vs1 + H(i));                           \
 +        *((ETYPE *)vd + H(i)) = s1;                                  \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
 +GEN_VEXT_VMV_VV(vmv_v_v_b, int8_t,  H1, clearb)
 +GEN_VEXT_VMV_VV(vmv_v_v_h, int16_t, H2, clearh)
 +GEN_VEXT_VMV_VV(vmv_v_v_w, int32_t, H4, clearl)
 +GEN_VEXT_VMV_VV(vmv_v_v_d, int64_t, H8, clearq)
 +
 +#define GEN_VEXT_VMV_VX(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, uint64_t s1, CPURISCVState *env,         \
 +                  uint32_t desc)                                     \
 +{                                                                    \
 +    uint32_t vl = env->vl;                                           \
 +    uint32_t esz = sizeof(ETYPE);                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
 +    uint32_t i;                                                      \
 +                                                                     \
 +    for (i = 0; i < vl; i++) {                                       \
 +        *((ETYPE *)vd + H(i)) = (ETYPE)s1;                           \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
 +GEN_VEXT_VMV_VX(vmv_v_x_b, int8_t,  H1, clearb)
 +GEN_VEXT_VMV_VX(vmv_v_x_h, int16_t, H2, clearh)
 +GEN_VEXT_VMV_VX(vmv_v_x_w, int32_t, H4, clearl)
 +GEN_VEXT_VMV_VX(vmv_v_x_d, int64_t, H8, clearq)
 +
 +#define GEN_VEXT_VMERGE_VV(NAME, ETYPE, H, CLEAR_FN)                 \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,          \
 +                  CPURISCVState *env, uint32_t desc)                 \
 +{                                                                    \
 +    uint32_t mlen = vext_mlen(desc);                                 \
 +    uint32_t vl = env->vl;                                           \
 +    uint32_t esz = sizeof(ETYPE);                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
 +    uint32_t i;                                                      \
 +                                                                     \
 +    for (i = 0; i < vl; i++) {                                       \
 +        ETYPE *vt = (!vext_elem_mask(v0, mlen, i) ? vs2 : vs1);      \
 +        *((ETYPE *)vd + H(i)) = *(vt + H(i));                        \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
 +GEN_VEXT_VMERGE_VV(vmerge_vvm_b, int8_t,  H1, clearb)
 +GEN_VEXT_VMERGE_VV(vmerge_vvm_h, int16_t, H2, clearh)
 +GEN_VEXT_VMERGE_VV(vmerge_vvm_w, int32_t, H4, clearl)
 +GEN_VEXT_VMERGE_VV(vmerge_vvm_d, int64_t, H8, clearq)
 +
 +#define GEN_VEXT_VMERGE_VX(NAME, ETYPE, H, CLEAR_FN)                 \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,               \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)      \
 +{                                                                    \
 +    uint32_t mlen = vext_mlen(desc);                                 \
 +    uint32_t vl = env->vl;                                           \
 +    uint32_t esz = sizeof(ETYPE);                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
 +    uint32_t i;                                                      \
 +                                                                     \
 +    for (i = 0; i < vl; i++) {                                       \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                           \
 +        ETYPE d = (!vext_elem_mask(v0, mlen, i) ? s2 :               \
 +                   (ETYPE)(target_long)s1);                          \
 +        *((ETYPE *)vd + H(i)) = d;                                   \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_b, int8_t,  H1, clearb)
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_h, int16_t, H2, clearh)
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_w, int32_t, H4, clearl)
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_d, int64_t, H8, clearq)
 --
 .27.0

-New patch
+[PULL v2 27/64] target/riscv: vector single-width saturating add and subtract
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-25-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  33 ++
+ target/riscv/insn32.decode              |  10 +
+ target/riscv/insn_trans/trans_rvv.inc.c |  16 +
+ target/riscv/vector_helper.c            | 385 ++++++++++++++++++++++++
+files changed, 444 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vmv_v_x_b, void, ptr, i64, env, i32)
+ DEF_HELPER_4(vmv_v_x_h, void, ptr, i64, env, i32)
+ DEF_HELPER_4(vmv_v_x_w, void, ptr, i64, env, i32)
+ DEF_HELPER_4(vmv_v_x_d, void, ptr, i64, env, i32)
++
++DEF_HELPER_6(vsaddu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssubu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssubu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssubu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssubu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vssub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsaddu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vsadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssubu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssubu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssubu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssubu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vssub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vmv_v_i         010111 1 00000 ..... 011 ..... 1010111 @r2
+ vmerge_vvm      010111 0 ..... ..... 000 ..... 1010111 @r_vm_0
+ vmerge_vxm      010111 0 ..... ..... 100 ..... 1010111 @r_vm_0
+ vmerge_vim      010111 0 ..... ..... 011 ..... 1010111 @r_vm_0
++vsaddu_vv       100000 . ..... ..... 000 ..... 1010111 @r_vm
++vsaddu_vx       100000 . ..... ..... 100 ..... 1010111 @r_vm
++vsaddu_vi       100000 . ..... ..... 011 ..... 1010111 @r_vm
++vsadd_vv        100001 . ..... ..... 000 ..... 1010111 @r_vm
++vsadd_vx        100001 . ..... ..... 100 ..... 1010111 @r_vm
++vsadd_vi        100001 . ..... ..... 011 ..... 1010111 @r_vm
++vssubu_vv       100010 . ..... ..... 000 ..... 1010111 @r_vm
++vssubu_vx       100010 . ..... ..... 100 ..... 1010111 @r_vm
++vssub_vv        100011 . ..... ..... 000 ..... 1010111 @r_vm
++vssub_vx        100011 . ..... ..... 100 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
+ GEN_OPIVV_TRANS(vmerge_vvm, opivv_vadc_check)
+ GEN_OPIVX_TRANS(vmerge_vxm, opivx_vadc_check)
+ GEN_OPIVI_TRANS(vmerge_vim, 0, vmerge_vxm, opivx_vadc_check)
++
++/*
++ *** Vector Fixed-Point Arithmetic Instructions
++ */
++
++/* Vector Single-Width Saturating Add and Subtract */
++GEN_OPIVV_TRANS(vsaddu_vv, opivv_check)
++GEN_OPIVV_TRANS(vsadd_vv,  opivv_check)
++GEN_OPIVV_TRANS(vssubu_vv, opivv_check)
++GEN_OPIVV_TRANS(vssub_vv,  opivv_check)
++GEN_OPIVX_TRANS(vsaddu_vx,  opivx_check)
++GEN_OPIVX_TRANS(vsadd_vx,  opivx_check)
++GEN_OPIVX_TRANS(vssubu_vx,  opivx_check)
++GEN_OPIVX_TRANS(vssub_vx,  opivx_check)
++GEN_OPIVI_TRANS(vsaddu_vi, 1, vsaddu_vx, opivx_check)
++GEN_OPIVI_TRANS(vsadd_vi, 0, vsadd_vx, opivx_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VMERGE_VX(vmerge_vxm_b, int8_t,  H1, clearb)
+ GEN_VEXT_VMERGE_VX(vmerge_vxm_h, int16_t, H2, clearh)
+ GEN_VEXT_VMERGE_VX(vmerge_vxm_w, int32_t, H4, clearl)
+ GEN_VEXT_VMERGE_VX(vmerge_vxm_d, int64_t, H8, clearq)
++
++/*
++ *** Vector Fixed-Point Arithmetic Instructions
++ */
++
++/* Vector Single-Width Saturating Add and Subtract */
++
++/*
++ * As fixed point instructions probably have round mode and saturation,
++ * define common macros for fixed point here.
++ */
++typedef void opivv2_rm_fn(void *vd, void *vs1, void *vs2, int i,
++                          CPURISCVState *env, int vxrm);
++
++#define OPIVV2_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)     \
++static inline void                                                  \
++do_##NAME(void *vd, void *vs1, void *vs2, int i,                    \
++          CPURISCVState *env, int vxrm)                             \
++{                                                                   \
++    TX1 s1 = *((T1 *)vs1 + HS1(i));                                 \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
++    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, s1);                    \
++}
++
++static inline void
++vext_vv_rm_1(void *vd, void *v0, void *vs1, void *vs2,
++             CPURISCVState *env,
++             uint32_t vl, uint32_t vm, uint32_t mlen, int vxrm,
++             opivv2_rm_fn *fn)
++{
++    for (uint32_t i = 0; i < vl; i++) {
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++            continue;
++        }
++        fn(vd, vs1, vs2, i, env, vxrm);
++    }
++}
++
++static inline void
++vext_vv_rm_2(void *vd, void *v0, void *vs1, void *vs2,
++             CPURISCVState *env,
++             uint32_t desc, uint32_t esz, uint32_t dsz,
++             opivv2_rm_fn *fn, clear_fn *clearfn)
++{
++    uint32_t vlmax = vext_maxsz(desc) / esz;
++    uint32_t mlen = vext_mlen(desc);
++    uint32_t vm = vext_vm(desc);
++    uint32_t vl = env->vl;
++
++    switch (env->vxrm) {
++    case 0: /* rnu */
++        vext_vv_rm_1(vd, v0, vs1, vs2,
++                     env, vl, vm, mlen, 0, fn);
++        break;
++    case 1: /* rne */
++        vext_vv_rm_1(vd, v0, vs1, vs2,
++                     env, vl, vm, mlen, 1, fn);
++        break;
++    case 2: /* rdn */
++        vext_vv_rm_1(vd, v0, vs1, vs2,
++                     env, vl, vm, mlen, 2, fn);
++        break;
++    default: /* rod */
++        vext_vv_rm_1(vd, v0, vs1, vs2,
++                     env, vl, vm, mlen, 3, fn);
++        break;
++    }
++
++    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++}
++
++/* generate helpers for fixed point instructions with OPIVV format */
++#define GEN_VEXT_VV_RM(NAME, ESZ, DSZ, CLEAR_FN)                \
++void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,     \
++                  CPURISCVState *env, uint32_t desc)            \
++{                                                               \
++    vext_vv_rm_2(vd, v0, vs1, vs2, env, desc, ESZ, DSZ,         \
++                 do_##NAME, CLEAR_FN);                          \
++}
++
++static inline uint8_t saddu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
++{
++    uint8_t res = a + b;
++    if (res < a) {
++        res = UINT8_MAX;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline uint16_t saddu16(CPURISCVState *env, int vxrm, uint16_t a,
++                               uint16_t b)
++{
++    uint16_t res = a + b;
++    if (res < a) {
++        res = UINT16_MAX;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline uint32_t saddu32(CPURISCVState *env, int vxrm, uint32_t a,
++                               uint32_t b)
++{
++    uint32_t res = a + b;
++    if (res < a) {
++        res = UINT32_MAX;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline uint64_t saddu64(CPURISCVState *env, int vxrm, uint64_t a,
++                               uint64_t b)
++{
++    uint64_t res = a + b;
++    if (res < a) {
++        res = UINT64_MAX;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++RVVCALL(OPIVV2_RM, vsaddu_vv_b, OP_UUU_B, H1, H1, H1, saddu8)
++RVVCALL(OPIVV2_RM, vsaddu_vv_h, OP_UUU_H, H2, H2, H2, saddu16)
++RVVCALL(OPIVV2_RM, vsaddu_vv_w, OP_UUU_W, H4, H4, H4, saddu32)
++RVVCALL(OPIVV2_RM, vsaddu_vv_d, OP_UUU_D, H8, H8, H8, saddu64)
++GEN_VEXT_VV_RM(vsaddu_vv_b, 1, 1, clearb)
++GEN_VEXT_VV_RM(vsaddu_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_RM(vsaddu_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_RM(vsaddu_vv_d, 8, 8, clearq)
++
++typedef void opivx2_rm_fn(void *vd, target_long s1, void *vs2, int i,
++                          CPURISCVState *env, int vxrm);
++
++#define OPIVX2_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)          \
++static inline void                                                  \
++do_##NAME(void *vd, target_long s1, void *vs2, int i,               \
++          CPURISCVState *env, int vxrm)                             \
++{                                                                   \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
++    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, (TX1)(T1)s1);           \
++}
++
++static inline void
++vext_vx_rm_1(void *vd, void *v0, target_long s1, void *vs2,
++             CPURISCVState *env,
++             uint32_t vl, uint32_t vm, uint32_t mlen, int vxrm,
++             opivx2_rm_fn *fn)
++{
++    for (uint32_t i = 0; i < vl; i++) {
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++            continue;
++        }
++        fn(vd, s1, vs2, i, env, vxrm);
++    }
++}
++
++static inline void
++vext_vx_rm_2(void *vd, void *v0, target_long s1, void *vs2,
++             CPURISCVState *env,
++             uint32_t desc, uint32_t esz, uint32_t dsz,
++             opivx2_rm_fn *fn, clear_fn *clearfn)
++{
++    uint32_t vlmax = vext_maxsz(desc) / esz;
++    uint32_t mlen = vext_mlen(desc);
++    uint32_t vm = vext_vm(desc);
++    uint32_t vl = env->vl;
++
++    switch (env->vxrm) {
++    case 0: /* rnu */
++        vext_vx_rm_1(vd, v0, s1, vs2,
++                     env, vl, vm, mlen, 0, fn);
++        break;
++    case 1: /* rne */
++        vext_vx_rm_1(vd, v0, s1, vs2,
++                     env, vl, vm, mlen, 1, fn);
++        break;
++    case 2: /* rdn */
++        vext_vx_rm_1(vd, v0, s1, vs2,
++                     env, vl, vm, mlen, 2, fn);
++        break;
++    default: /* rod */
++        vext_vx_rm_1(vd, v0, s1, vs2,
++                     env, vl, vm, mlen, 3, fn);
++        break;
++    }
++
++    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++}
++
++/* generate helpers for fixed point instructions with OPIVX format */
++#define GEN_VEXT_VX_RM(NAME, ESZ, DSZ, CLEAR_FN)          \
++void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
++        void *vs2, CPURISCVState *env, uint32_t desc)     \
++{                                                         \
++    vext_vx_rm_2(vd, v0, s1, vs2, env, desc, ESZ, DSZ,    \
++                 do_##NAME, CLEAR_FN);                    \
++}
++
++RVVCALL(OPIVX2_RM, vsaddu_vx_b, OP_UUU_B, H1, H1, saddu8)
++RVVCALL(OPIVX2_RM, vsaddu_vx_h, OP_UUU_H, H2, H2, saddu16)
++RVVCALL(OPIVX2_RM, vsaddu_vx_w, OP_UUU_W, H4, H4, saddu32)
++RVVCALL(OPIVX2_RM, vsaddu_vx_d, OP_UUU_D, H8, H8, saddu64)
++GEN_VEXT_VX_RM(vsaddu_vx_b, 1, 1, clearb)
++GEN_VEXT_VX_RM(vsaddu_vx_h, 2, 2, clearh)
++GEN_VEXT_VX_RM(vsaddu_vx_w, 4, 4, clearl)
++GEN_VEXT_VX_RM(vsaddu_vx_d, 8, 8, clearq)
++
++static inline int8_t sadd8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
++{
++    int8_t res = a + b;
++    if ((res ^ a) & (res ^ b) & INT8_MIN) {
++        res = a > 0 ? INT8_MAX : INT8_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline int16_t sadd16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
++{
++    int16_t res = a + b;
++    if ((res ^ a) & (res ^ b) & INT16_MIN) {
++        res = a > 0 ? INT16_MAX : INT16_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline int32_t sadd32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
++{
++    int32_t res = a + b;
++    if ((res ^ a) & (res ^ b) & INT32_MIN) {
++        res = a > 0 ? INT32_MAX : INT32_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline int64_t sadd64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
++{
++    int64_t res = a + b;
++    if ((res ^ a) & (res ^ b) & INT64_MIN) {
++        res = a > 0 ? INT64_MAX : INT64_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++RVVCALL(OPIVV2_RM, vsadd_vv_b, OP_SSS_B, H1, H1, H1, sadd8)
++RVVCALL(OPIVV2_RM, vsadd_vv_h, OP_SSS_H, H2, H2, H2, sadd16)
++RVVCALL(OPIVV2_RM, vsadd_vv_w, OP_SSS_W, H4, H4, H4, sadd32)
++RVVCALL(OPIVV2_RM, vsadd_vv_d, OP_SSS_D, H8, H8, H8, sadd64)
++GEN_VEXT_VV_RM(vsadd_vv_b, 1, 1, clearb)
++GEN_VEXT_VV_RM(vsadd_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_RM(vsadd_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_RM(vsadd_vv_d, 8, 8, clearq)
++
++RVVCALL(OPIVX2_RM, vsadd_vx_b, OP_SSS_B, H1, H1, sadd8)
++RVVCALL(OPIVX2_RM, vsadd_vx_h, OP_SSS_H, H2, H2, sadd16)
++RVVCALL(OPIVX2_RM, vsadd_vx_w, OP_SSS_W, H4, H4, sadd32)
++RVVCALL(OPIVX2_RM, vsadd_vx_d, OP_SSS_D, H8, H8, sadd64)
++GEN_VEXT_VX_RM(vsadd_vx_b, 1, 1, clearb)
++GEN_VEXT_VX_RM(vsadd_vx_h, 2, 2, clearh)
++GEN_VEXT_VX_RM(vsadd_vx_w, 4, 4, clearl)
++GEN_VEXT_VX_RM(vsadd_vx_d, 8, 8, clearq)
++
++static inline uint8_t ssubu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
++{
++    uint8_t res = a - b;
++    if (res > a) {
++        res = 0;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline uint16_t ssubu16(CPURISCVState *env, int vxrm, uint16_t a,
++                               uint16_t b)
++{
++    uint16_t res = a - b;
++    if (res > a) {
++        res = 0;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline uint32_t ssubu32(CPURISCVState *env, int vxrm, uint32_t a,
++                               uint32_t b)
++{
++    uint32_t res = a - b;
++    if (res > a) {
++        res = 0;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline uint64_t ssubu64(CPURISCVState *env, int vxrm, uint64_t a,
++                               uint64_t b)
++{
++    uint64_t res = a - b;
++    if (res > a) {
++        res = 0;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++RVVCALL(OPIVV2_RM, vssubu_vv_b, OP_UUU_B, H1, H1, H1, ssubu8)
++RVVCALL(OPIVV2_RM, vssubu_vv_h, OP_UUU_H, H2, H2, H2, ssubu16)
++RVVCALL(OPIVV2_RM, vssubu_vv_w, OP_UUU_W, H4, H4, H4, ssubu32)
++RVVCALL(OPIVV2_RM, vssubu_vv_d, OP_UUU_D, H8, H8, H8, ssubu64)
++GEN_VEXT_VV_RM(vssubu_vv_b, 1, 1, clearb)
++GEN_VEXT_VV_RM(vssubu_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_RM(vssubu_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_RM(vssubu_vv_d, 8, 8, clearq)
++
++RVVCALL(OPIVX2_RM, vssubu_vx_b, OP_UUU_B, H1, H1, ssubu8)
++RVVCALL(OPIVX2_RM, vssubu_vx_h, OP_UUU_H, H2, H2, ssubu16)
++RVVCALL(OPIVX2_RM, vssubu_vx_w, OP_UUU_W, H4, H4, ssubu32)
++RVVCALL(OPIVX2_RM, vssubu_vx_d, OP_UUU_D, H8, H8, ssubu64)
++GEN_VEXT_VX_RM(vssubu_vx_b, 1, 1, clearb)
++GEN_VEXT_VX_RM(vssubu_vx_h, 2, 2, clearh)
++GEN_VEXT_VX_RM(vssubu_vx_w, 4, 4, clearl)
++GEN_VEXT_VX_RM(vssubu_vx_d, 8, 8, clearq)
++
++static inline int8_t ssub8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
++{
++    int8_t res = a - b;
++    if ((res ^ a) & (a ^ b) & INT8_MIN) {
++        res = a > 0 ? INT8_MAX : INT8_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline int16_t ssub16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
++{
++    int16_t res = a - b;
++    if ((res ^ a) & (a ^ b) & INT16_MIN) {
++        res = a > 0 ? INT16_MAX : INT16_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline int32_t ssub32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
++{
++    int32_t res = a - b;
++    if ((res ^ a) & (a ^ b) & INT32_MIN) {
++        res = a > 0 ? INT32_MAX : INT32_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++static inline int64_t ssub64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
++{
++    int64_t res = a - b;
++    if ((res ^ a) & (a ^ b) & INT64_MIN) {
++        res = a > 0 ? INT64_MAX : INT64_MIN;
++        env->vxsat = 0x1;
++    }
++    return res;
++}
++
++RVVCALL(OPIVV2_RM, vssub_vv_b, OP_SSS_B, H1, H1, H1, ssub8)
++RVVCALL(OPIVV2_RM, vssub_vv_h, OP_SSS_H, H2, H2, H2, ssub16)
++RVVCALL(OPIVV2_RM, vssub_vv_w, OP_SSS_W, H4, H4, H4, ssub32)
++RVVCALL(OPIVV2_RM, vssub_vv_d, OP_SSS_D, H8, H8, H8, ssub64)
++GEN_VEXT_VV_RM(vssub_vv_b, 1, 1, clearb)
++GEN_VEXT_VV_RM(vssub_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_RM(vssub_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_RM(vssub_vv_d, 8, 8, clearq)
++
++RVVCALL(OPIVX2_RM, vssub_vx_b, OP_SSS_B, H1, H1, ssub8)
++RVVCALL(OPIVX2_RM, vssub_vx_h, OP_SSS_H, H2, H2, ssub16)
++RVVCALL(OPIVX2_RM, vssub_vx_w, OP_SSS_W, H4, H4, ssub32)
++RVVCALL(OPIVX2_RM, vssub_vx_d, OP_SSS_D, H8, H8, ssub64)
++GEN_VEXT_VX_RM(vssub_vx_b, 1, 1, clearb)
++GEN_VEXT_VX_RM(vssub_vx_h, 2, 2, clearh)
++GEN_VEXT_VX_RM(vssub_vx_w, 4, 4, clearl)
++GEN_VEXT_VX_RM(vssub_vx_d, 8, 8, clearq)
+--
+.27.0

-[PULL 07/30] hw/char: Add Microchip PolarFire SoC MMUART emulation
+[PULL v2 28/64] target/riscv: vector single-width averaging add and subtract
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Microchip PolarFire SoC MMUART is ns16550 compatible, with some
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 additional registers. Create a simple MMUART model built on top
 of the existing ns16550 model.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1598924352-89526-6-git-send-email-bmeng.cn@gmail.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-26-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/char/mchp_pfsoc_mmuart.h | 61 ++++++++++++++++++++
+ target/riscv/helper.h                   |  17 ++++
- hw/char/mchp_pfsoc_mmuart.c         | 86 +++++++++++++++++++++++++++++
+ target/riscv/insn32.decode              |   5 ++
- MAINTAINERS                         |  2 +
+ target/riscv/insn_trans/trans_rvv.inc.c |   7 ++
- hw/char/Kconfig                     |  3 +
+ target/riscv/vector_helper.c            | 100 ++++++++++++++++++++++++
- hw/char/meson.build                 |  1 +
+files changed, 129 insertions(+)
 files changed, 153 insertions(+)
  create mode 100644 include/hw/char/mchp_pfsoc_mmuart.h
  create mode 100644 hw/char/mchp_pfsoc_mmuart.c
-diff --git a/include/hw/char/mchp_pfsoc_mmuart.h b/include/hw/char/mchp_pfsoc_mmuart.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/target/riscv/helper.h
---- /dev/null
++++ b/target/riscv/helper.h
-+++ b/include/hw/char/mchp_pfsoc_mmuart.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vssub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@
+ DEF_HELPER_6(vssub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+/*
+ DEF_HELPER_6(vssub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+ * Microchip PolarFire SoC MMUART emulation
+ DEF_HELPER_6(vssub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 + *
 + * Copyright (c) 2020 Wind River Systems, Inc.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * Permission is hereby granted, free of charge, to any person obtaining a copy
 + * of this software and associated documentation files (the "Software"), to deal
 + * in the Software without restriction, including without limitation the rights
 + * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 + * copies of the Software, and to permit persons to whom the Software is
 + * furnished to do so, subject to the following conditions:
 + *
 + * The above copyright notice and this permission notice shall be included in
 + * all copies or substantial portions of the Software.
 + *
 + * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
 + * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
 + * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
 + * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 + * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 + * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 + * THE SOFTWARE.
 + */
 +
-+#ifndef HW_MCHP_PFSOC_MMUART_H
++DEF_HELPER_6(vaadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+#define HW_MCHP_PFSOC_MMUART_H
++DEF_HELPER_6(vaadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vssubu_vv       100010 . ..... ..... 000 ..... 1010111 @r_vm
  vssubu_vx       100010 . ..... ..... 100 ..... 1010111 @r_vm
  vssub_vv        100011 . ..... ..... 000 ..... 1010111 @r_vm
  vssub_vx        100011 . ..... ..... 100 ..... 1010111 @r_vm
 +vaadd_vv        100100 . ..... ..... 000 ..... 1010111 @r_vm
 +vaadd_vx        100100 . ..... ..... 100 ..... 1010111 @r_vm
 +vaadd_vi        100100 . ..... ..... 011 ..... 1010111 @r_vm
 +vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
 +vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vssubu_vx,  opivx_check)
  GEN_OPIVX_TRANS(vssub_vx,  opivx_check)
  GEN_OPIVI_TRANS(vsaddu_vi, 1, vsaddu_vx, opivx_check)
  GEN_OPIVI_TRANS(vsadd_vi, 0, vsadd_vx, opivx_check)
 +
-+#include "hw/char/serial.h"
++/* Vector Single-Width Averaging Add and Subtract */
 +GEN_OPIVV_TRANS(vaadd_vv, opivv_check)
 +GEN_OPIVV_TRANS(vasub_vv, opivv_check)
 +GEN_OPIVX_TRANS(vaadd_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vasub_vx,  opivx_check)
 +GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vssub_vx_b, 1, 1, clearb)
  GEN_VEXT_VX_RM(vssub_vx_h, 2, 2, clearh)
  GEN_VEXT_VX_RM(vssub_vx_w, 4, 4, clearl)
  GEN_VEXT_VX_RM(vssub_vx_d, 8, 8, clearq)
 +
-+#define MCHP_PFSOC_MMUART_REG_SIZE  52
++/* Vector Single-Width Averaging Add and Subtract */
 +static inline uint8_t get_round(int vxrm, uint64_t v, uint8_t shift)
 +{
 +    uint8_t d = extract64(v, shift, 1);
 +    uint8_t d1;
 +    uint64_t D1, D2;
 +
-+typedef struct MchpPfSoCMMUartState {
++    if (shift == 0 || shift > 64) {
 +    MemoryRegion iomem;
 +    hwaddr base;
 +    qemu_irq irq;
 +
 +    SerialMM *serial;
 +
 +    uint32_t reg[MCHP_PFSOC_MMUART_REG_SIZE / sizeof(uint32_t)];
 +} MchpPfSoCMMUartState;
 +
 +/**
 + * mchp_pfsoc_mmuart_create - Create a Microchip PolarFire SoC MMUART
 + *
 + * This is a helper routine for board to create a MMUART device that is
 + * compatible with Microchip PolarFire SoC.
 + *
 + * @sysmem: system memory region to map
 + * @base: base address of the MMUART registers
 + * @irq: IRQ number of the MMUART device
 + * @chr: character device to associate to
 + *
 + * @return: a pointer to the device specific control structure
 + */
 +MchpPfSoCMMUartState *mchp_pfsoc_mmuart_create(MemoryRegion *sysmem,
 +    hwaddr base, qemu_irq irq, Chardev *chr);
 +
 +#endif /* HW_MCHP_PFSOC_MMUART_H */
 diff --git a/hw/char/mchp_pfsoc_mmuart.c b/hw/char/mchp_pfsoc_mmuart.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/char/mchp_pfsoc_mmuart.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Microchip PolarFire SoC MMUART emulation
 + *
 + * Copyright (c) 2020 Wind River Systems, Inc.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License as
 + * published by the Free Software Foundation; either version 2 or
 + * (at your option) version 3 of the License.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/log.h"
 +#include "chardev/char.h"
 +#include "exec/address-spaces.h"
 +#include "hw/char/mchp_pfsoc_mmuart.h"
 +
 +static uint64_t mchp_pfsoc_mmuart_read(void *opaque, hwaddr addr, unsigned size)
 +{
 +    MchpPfSoCMMUartState *s = opaque;
 +
 +    if (addr >= MCHP_PFSOC_MMUART_REG_SIZE) {
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: read: addr=0x%" HWADDR_PRIx "\n",
 +                      __func__, addr);
 +        return 0;
 +    }
 +
-+    return s->reg[addr / sizeof(uint32_t)];
++    d1 = extract64(v, shift - 1, 1);
 +    D1 = extract64(v, 0, shift);
 +    if (vxrm == 0) { /* round-to-nearest-up (add +0.5 LSB) */
 +        return d1;
 +    } else if (vxrm == 1) { /* round-to-nearest-even */
 +        if (shift > 1) {
 +            D2 = extract64(v, 0, shift - 1);
 +            return d1 & ((D2 != 0) | d);
 +        } else {
 +            return d1 & d;
 +        }
 +    } else if (vxrm == 3) { /* round-to-odd (OR bits into LSB, aka "jam") */
 +        return !d & (D1 != 0);
 +    }
 +    return 0; /* round-down (truncate) */
 +}
 +
-+static void mchp_pfsoc_mmuart_write(void *opaque, hwaddr addr,
++static inline int32_t aadd32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +                                    uint64_t value, unsigned size)
 +{
-+    MchpPfSoCMMUartState *s = opaque;
++    int64_t res = (int64_t)a + b;
-+    uint32_t val32 = (uint32_t)value;
++    uint8_t round = get_round(vxrm, res, 1);
 +
-+    if (addr >= MCHP_PFSOC_MMUART_REG_SIZE) {
++    return (res >> 1) + round;
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: bad write: addr=0x%" HWADDR_PRIx
 +                      " v=0x%x\n", __func__, addr, val32);
 +        return;
 +    }
 +
 +    s->reg[addr / sizeof(uint32_t)] = val32;
 +}
 +
-+static const MemoryRegionOps mchp_pfsoc_mmuart_ops = {
++static inline int64_t aadd64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+    .read = mchp_pfsoc_mmuart_read,
++{
-+    .write = mchp_pfsoc_mmuart_write,
++    int64_t res = a + b;
-+    .endianness = DEVICE_LITTLE_ENDIAN,
++    uint8_t round = get_round(vxrm, res, 1);
-+    .impl = {
++    int64_t over = (res ^ a) & (res ^ b) & INT64_MIN;
 +        .min_access_size = 4,
 +        .max_access_size = 4,
 +    },
 +};
 +
-+MchpPfSoCMMUartState *mchp_pfsoc_mmuart_create(MemoryRegion *sysmem,
++    /* With signed overflow, bit 64 is inverse of bit 63. */
-+    hwaddr base, qemu_irq irq, Chardev *chr)
++    return ((res >> 1) ^ over) + round;
 +}
 +
 +RVVCALL(OPIVV2_RM, vaadd_vv_b, OP_SSS_B, H1, H1, H1, aadd32)
 +RVVCALL(OPIVV2_RM, vaadd_vv_h, OP_SSS_H, H2, H2, H2, aadd32)
 +RVVCALL(OPIVV2_RM, vaadd_vv_w, OP_SSS_W, H4, H4, H4, aadd32)
 +RVVCALL(OPIVV2_RM, vaadd_vv_d, OP_SSS_D, H8, H8, H8, aadd64)
 +GEN_VEXT_VV_RM(vaadd_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vaadd_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vaadd_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vaadd_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vaadd_vx_b, OP_SSS_B, H1, H1, aadd32)
 +RVVCALL(OPIVX2_RM, vaadd_vx_h, OP_SSS_H, H2, H2, aadd32)
 +RVVCALL(OPIVX2_RM, vaadd_vx_w, OP_SSS_W, H4, H4, aadd32)
 +RVVCALL(OPIVX2_RM, vaadd_vx_d, OP_SSS_D, H8, H8, aadd64)
 +GEN_VEXT_VX_RM(vaadd_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vaadd_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vaadd_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vaadd_vx_d, 8, 8, clearq)
 +
 +static inline int32_t asub32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
-+    MchpPfSoCMMUartState *s;
++    int64_t res = (int64_t)a - b;
 +    uint8_t round = get_round(vxrm, res, 1);
 +
-+    s = g_new0(MchpPfSoCMMUartState, 1);
++    return (res >> 1) + round;
 +}
 +
-+    memory_region_init_io(&s->iomem, NULL, &mchp_pfsoc_mmuart_ops, s,
++static inline int64_t asub64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+                          "mchp.pfsoc.mmuart", 0x1000);
++{
 +    int64_t res = (int64_t)a - b;
 +    uint8_t round = get_round(vxrm, res, 1);
 +    int64_t over = (res ^ a) & (a ^ b) & INT64_MIN;
 +
-+    s->base = base;
++    /* With signed overflow, bit 64 is inverse of bit 63. */
-+    s->irq = irq;
++    return ((res >> 1) ^ over) + round;
 +}
 +
-+    s->serial = serial_mm_init(sysmem, base, 2, irq, 399193, chr,
++RVVCALL(OPIVV2_RM, vasub_vv_b, OP_SSS_B, H1, H1, H1, asub32)
-+                               DEVICE_LITTLE_ENDIAN);
++RVVCALL(OPIVV2_RM, vasub_vv_h, OP_SSS_H, H2, H2, H2, asub32)
 +RVVCALL(OPIVV2_RM, vasub_vv_w, OP_SSS_W, H4, H4, H4, asub32)
 +RVVCALL(OPIVV2_RM, vasub_vv_d, OP_SSS_D, H8, H8, H8, asub64)
 +GEN_VEXT_VV_RM(vasub_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vasub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vasub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vasub_vv_d, 8, 8, clearq)
 +
-+    memory_region_add_subregion(sysmem, base + 0x20, &s->iomem);
++RVVCALL(OPIVX2_RM, vasub_vx_b, OP_SSS_B, H1, H1, asub32)
-+
++RVVCALL(OPIVX2_RM, vasub_vx_h, OP_SSS_H, H2, H2, asub32)
-+    return s;
++RVVCALL(OPIVX2_RM, vasub_vx_w, OP_SSS_W, H4, H4, asub32)
-+}
++RVVCALL(OPIVX2_RM, vasub_vx_d, OP_SSS_D, H8, H8, asub64)
-diff --git a/MAINTAINERS b/MAINTAINERS
++GEN_VEXT_VX_RM(vasub_vx_b, 1, 1, clearb)
-index XXXXXXX..XXXXXXX 100644
++GEN_VEXT_VX_RM(vasub_vx_h, 2, 2, clearh)
---- a/MAINTAINERS
++GEN_VEXT_VX_RM(vasub_vx_w, 4, 4, clearl)
-+++ b/MAINTAINERS
++GEN_VEXT_VX_RM(vasub_vx_d, 8, 8, clearq)
@@ -XXX,XX +XXX,XX @@ M: Bin Meng <bin.meng@windriver.com>
  L: qemu-riscv@nongnu.org
  S: Supported
  F: hw/riscv/microchip_pfsoc.c
 +F: hw/char/mchp_pfsoc_mmuart.c
  F: include/hw/riscv/microchip_pfsoc.h
 +F: include/hw/char/mchp_pfsoc_mmuart.h
  RX Machines
  -----------
 diff --git a/hw/char/Kconfig b/hw/char/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/char/Kconfig
 +++ b/hw/char/Kconfig
@@ -XXX,XX +XXX,XX @@ config RENESAS_SCI
  config AVR_USART
      bool
 +
 +config MCHP_PFSOC_MMUART
 +    bool
 diff --git a/hw/char/meson.build b/hw/char/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/char/meson.build
 +++ b/hw/char/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_aux.c'))
  softmmu_ss.add(when: 'CONFIG_RENESAS_SCI', if_true: files('renesas_sci.c'))
  softmmu_ss.add(when: 'CONFIG_SH4', if_true: files('sh_serial.c'))
  softmmu_ss.add(when: 'CONFIG_STM32F2XX_USART', if_true: files('stm32f2xx_usart.c'))
 +softmmu_ss.add(when: 'CONFIG_MCHP_PFSOC_MMUART', if_true: files('mchp_pfsoc_mmuart.c'))
  specific_ss.add(when: 'CONFIG_TERMINAL3270', if_true: files('terminal3270.c'))
  specific_ss.add(when: 'CONFIG_VIRTIO', if_true: files('virtio-serial-bus.c'))
 --
-.28.0
+.27.0

-[PULL 12/30] hw/riscv: microchip_pfsoc: Connect a DMA controller
+[PULL v2 29/64] target/riscv: vector single-width fractional multiply with rounding and saturation
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-On the Icicle Kit board, the HSS firmware utilizes the on-chip DMA
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 controller to move the 2nd stage bootloader in the system memory.
 Let's connect a DMA controller to Microchip PolarFire SoC.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1598924352-89526-11-git-send-email-bmeng.cn@gmail.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-27-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/microchip_pfsoc.h | 11 +++++++++++
+ target/riscv/helper.h                   |   9 ++
- hw/riscv/microchip_pfsoc.c         | 15 +++++++++++++++
+ target/riscv/insn32.decode              |   2 +
- hw/riscv/Kconfig                   |  1 +
+ target/riscv/insn_trans/trans_rvv.inc.c |   4 +
-files changed, 27 insertions(+)
+ target/riscv/vector_helper.c            | 107 ++++++++++++++++++++++++
 files changed, 122 insertions(+)
-diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/microchip_pfsoc.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/microchip_pfsoc.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vasub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- #define HW_MICROCHIP_PFSOC_H
+ DEF_HELPER_6(vasub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vasub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- #include "hw/char/mchp_pfsoc_mmuart.h"
+ DEF_HELPER_6(vasub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+#include "hw/dma/sifive_pdma.h"
++
- #include "hw/sd/cadence_sdhci.h"
++DEF_HELPER_6(vsmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vsmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
- typedef struct MicrochipPFSoCState {
++DEF_HELPER_6(vsmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
++DEF_HELPER_6(vsmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-     MchpPfSoCMMUartState *serial2;
++DEF_HELPER_6(vsmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-     MchpPfSoCMMUartState *serial3;
++DEF_HELPER_6(vsmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-     MchpPfSoCMMUartState *serial4;
++DEF_HELPER_6(vsmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+    SiFivePDMAState dma;
++DEF_HELPER_6(vsmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-     CadenceSDHCIState sdhci;
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
  } MicrochipPFSoCState;
@@ -XXX,XX +XXX,XX @@ enum {
      MICROCHIP_PFSOC_BUSERR_UNIT4,
      MICROCHIP_PFSOC_CLINT,
      MICROCHIP_PFSOC_L2CC,
 +    MICROCHIP_PFSOC_DMA,
      MICROCHIP_PFSOC_L2LIM,
      MICROCHIP_PFSOC_PLIC,
      MICROCHIP_PFSOC_MMUART0,
@@ -XXX,XX +XXX,XX @@ enum {
  };
  enum {
 +    MICROCHIP_PFSOC_DMA_IRQ0 = 5,
 +    MICROCHIP_PFSOC_DMA_IRQ1 = 6,
 +    MICROCHIP_PFSOC_DMA_IRQ2 = 7,
 +    MICROCHIP_PFSOC_DMA_IRQ3 = 8,
 +    MICROCHIP_PFSOC_DMA_IRQ4 = 9,
 +    MICROCHIP_PFSOC_DMA_IRQ5 = 10,
 +    MICROCHIP_PFSOC_DMA_IRQ6 = 11,
 +    MICROCHIP_PFSOC_DMA_IRQ7 = 12,
      MICROCHIP_PFSOC_EMMC_SD_IRQ = 88,
      MICROCHIP_PFSOC_MMUART0_IRQ = 90,
      MICROCHIP_PFSOC_MMUART1_IRQ = 91,
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/microchip_pfsoc.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vaadd_vx        100100 . ..... ..... 100 ..... 1010111 @r_vm
-  * 2) eNVM (Embedded Non-Volatile Memory)
+ vaadd_vi        100100 . ..... ..... 011 ..... 1010111 @r_vm
-  * 3) MMUARTs (Multi-Mode UART)
+ vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
-  * 4) Cadence eMMC/SDHC controller and an SD card connected to it
+ vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
-+ * 5) SiFive Platform DMA (Direct Memory Access Controller)
++vsmul_vv        100111 . ..... ..... 000 ..... 1010111 @r_vm
-  *
++vsmul_vx        100111 . ..... ..... 100 ..... 1010111 @r_vm
-  * This board currently generates devicetree dynamically that indicates at least
-  * two harts and up to five harts.
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-     [MICROCHIP_PFSOC_BUSERR_UNIT4] =    {  0x1704000,     0x1000 },
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-     [MICROCHIP_PFSOC_CLINT] =           {  0x2000000,    0x10000 },
+index XXXXXXX..XXXXXXX 100644
-     [MICROCHIP_PFSOC_L2CC] =            {  0x2010000,     0x1000 },
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+    [MICROCHIP_PFSOC_DMA] =             {  0x3000000,   0x100000 },
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-     [MICROCHIP_PFSOC_L2LIM] =           {  0x8000000,  0x2000000 },
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vasub_vv, opivv_check)
-     [MICROCHIP_PFSOC_PLIC] =            {  0xc000000,  0x4000000 },
+ GEN_OPIVX_TRANS(vaadd_vx,  opivx_check)
-     [MICROCHIP_PFSOC_MMUART0] =         { 0x20000000,     0x1000 },
+ GEN_OPIVX_TRANS(vasub_vx,  opivx_check)
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_instance_init(Object *obj)
+ GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
                           TYPE_RISCV_CPU_SIFIVE_U54);
      qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", RESET_VECTOR);
 +    object_initialize_child(obj, "dma-controller", &s->dma,
 +                            TYPE_SIFIVE_PDMA);
 +
-     object_initialize_child(obj, "sd-controller", &s->sdhci,
++/* Vector Single-Width Fractional Multiply with Rounding and Saturation */
-                             TYPE_CADENCE_SDHCI);
++GEN_OPIVV_TRANS(vsmul_vv, opivv_check)
- }
++GEN_OPIVX_TRANS(vsmul_vx,  opivx_check)
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-         memmap[MICROCHIP_PFSOC_PLIC].size);
+index XXXXXXX..XXXXXXX 100644
-     g_free(plic_hart_config);
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
-+    /* DMA */
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vasub_vx_b, 1, 1, clearb)
-+    sysbus_realize(SYS_BUS_DEVICE(&s->dma), errp);
+ GEN_VEXT_VX_RM(vasub_vx_h, 2, 2, clearh)
-+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->dma), 0,
+ GEN_VEXT_VX_RM(vasub_vx_w, 4, 4, clearl)
-+                    memmap[MICROCHIP_PFSOC_DMA].base);
+ GEN_VEXT_VX_RM(vasub_vx_d, 8, 8, clearq)
-+    for (i = 0; i < SIFIVE_PDMA_IRQS; i++) {
++
-+        sysbus_connect_irq(SYS_BUS_DEVICE(&s->dma), i,
++/* Vector Single-Width Fractional Multiply with Rounding and Saturation */
-+                           qdev_get_gpio_in(DEVICE(s->plic),
++static inline int8_t vsmul8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
-+                                            MICROCHIP_PFSOC_DMA_IRQ0 + i));
++{
 +    uint8_t round;
 +    int16_t res;
 +
 +    res = (int16_t)a * (int16_t)b;
 +    round = get_round(vxrm, res, 7);
 +    res   = (res >> 7) + round;
 +
 +    if (res > INT8_MAX) {
 +        env->vxsat = 0x1;
 +        return INT8_MAX;
 +    } else if (res < INT8_MIN) {
 +        env->vxsat = 0x1;
 +        return INT8_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static int16_t vsmul16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
 +{
 +    uint8_t round;
 +    int32_t res;
 +
 +    res = (int32_t)a * (int32_t)b;
 +    round = get_round(vxrm, res, 15);
 +    res   = (res >> 15) + round;
 +
 +    if (res > INT16_MAX) {
 +        env->vxsat = 0x1;
 +        return INT16_MAX;
 +    } else if (res < INT16_MIN) {
 +        env->vxsat = 0x1;
 +        return INT16_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static int32_t vsmul32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    uint8_t round;
 +    int64_t res;
 +
 +    res = (int64_t)a * (int64_t)b;
 +    round = get_round(vxrm, res, 31);
 +    res   = (res >> 31) + round;
 +
 +    if (res > INT32_MAX) {
 +        env->vxsat = 0x1;
 +        return INT32_MAX;
 +    } else if (res < INT32_MIN) {
 +        env->vxsat = 0x1;
 +        return INT32_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static int64_t vsmul64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    uint8_t round;
 +    uint64_t hi_64, lo_64;
 +    int64_t res;
 +
 +    if (a == INT64_MIN && b == INT64_MIN) {
 +        env->vxsat = 1;
 +        return INT64_MAX;
 +    }
 +
-     /* SYSREG */
++    muls64(&lo_64, &hi_64, a, b);
-     create_unimplemented_device("microchip.pfsoc.sysreg",
++    round = get_round(vxrm, lo_64, 63);
-         memmap[MICROCHIP_PFSOC_SYSREG].base,
++    /*
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++     * Cannot overflow, as there are always
-index XXXXXXX..XXXXXXX 100644
++     * 2 sign bits after multiply.
---- a/hw/riscv/Kconfig
++     */
-+++ b/hw/riscv/Kconfig
++    res = (hi_64 << 1) | (lo_64 >> 63);
-@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
++    if (round) {
-     select SIFIVE
++        if (res == INT64_MAX) {
-     select UNIMP
++            env->vxsat = 1;
-     select MCHP_PFSOC_MMUART
++        } else {
-+    select SIFIVE_PDMA
++            res += 1;
-     select CADENCE_SDHCI
++        }
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vsmul_vv_b, OP_SSS_B, H1, H1, H1, vsmul8)
 +RVVCALL(OPIVV2_RM, vsmul_vv_h, OP_SSS_H, H2, H2, H2, vsmul16)
 +RVVCALL(OPIVV2_RM, vsmul_vv_w, OP_SSS_W, H4, H4, H4, vsmul32)
 +RVVCALL(OPIVV2_RM, vsmul_vv_d, OP_SSS_D, H8, H8, H8, vsmul64)
 +GEN_VEXT_VV_RM(vsmul_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vsmul_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vsmul_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vsmul_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vsmul_vx_b, OP_SSS_B, H1, H1, vsmul8)
 +RVVCALL(OPIVX2_RM, vsmul_vx_h, OP_SSS_H, H2, H2, vsmul16)
 +RVVCALL(OPIVX2_RM, vsmul_vx_w, OP_SSS_W, H4, H4, vsmul32)
 +RVVCALL(OPIVX2_RM, vsmul_vx_d, OP_SSS_D, H8, H8, vsmul64)
 +GEN_VEXT_VX_RM(vsmul_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vsmul_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vsmul_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vsmul_vx_d, 8, 8, clearq)
 --
-.28.0
+.27.0

-New patch
+[PULL v2 30/64] target/riscv: vector widening saturating scaled multiply-add
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20200701152549.1218-28-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  22 +++
  target/riscv/insn32.decode              |   7 +
  target/riscv/insn_trans/trans_rvv.inc.c |   9 ++
  target/riscv/vector_helper.c            | 205 ++++++++++++++++++++++++
 files changed, 243 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vsmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vsmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vsmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vwsmaccu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
  vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
  vsmul_vv        100111 . ..... ..... 000 ..... 1010111 @r_vm
  vsmul_vx        100111 . ..... ..... 100 ..... 1010111 @r_vm
 +vwsmaccu_vv     111100 . ..... ..... 000 ..... 1010111 @r_vm
 +vwsmaccu_vx     111100 . ..... ..... 100 ..... 1010111 @r_vm
 +vwsmacc_vv      111101 . ..... ..... 000 ..... 1010111 @r_vm
 +vwsmacc_vx      111101 . ..... ..... 100 ..... 1010111 @r_vm
 +vwsmaccsu_vv    111110 . ..... ..... 000 ..... 1010111 @r_vm
 +vwsmaccsu_vx    111110 . ..... ..... 100 ..... 1010111 @r_vm
 +vwsmaccus_vx    111111 . ..... ..... 100 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
  /* Vector Single-Width Fractional Multiply with Rounding and Saturation */
  GEN_OPIVV_TRANS(vsmul_vv, opivv_check)
  GEN_OPIVX_TRANS(vsmul_vx,  opivx_check)
 +
 +/* Vector Widening Saturating Scaled Multiply-Add */
 +GEN_OPIVV_WIDEN_TRANS(vwsmaccu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsmacc_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsmaccsu_vv, opivv_widen_check)
 +GEN_OPIVX_WIDEN_TRANS(vwsmaccu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsmacc_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsmaccsu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsmaccus_vx)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vsmul_vx_b, 1, 1, clearb)
  GEN_VEXT_VX_RM(vsmul_vx_h, 2, 2, clearh)
  GEN_VEXT_VX_RM(vsmul_vx_w, 4, 4, clearl)
  GEN_VEXT_VX_RM(vsmul_vx_d, 8, 8, clearq)
 +
 +/* Vector Widening Saturating Scaled Multiply-Add */
 +static inline uint16_t
 +vwsmaccu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b,
 +          uint16_t c)
 +{
 +    uint8_t round;
 +    uint16_t res = (uint16_t)a * b;
 +
 +    round = get_round(vxrm, res, 4);
 +    res   = (res >> 4) + round;
 +    return saddu16(env, vxrm, c, res);
 +}
 +
 +static inline uint32_t
 +vwsmaccu16(CPURISCVState *env, int vxrm, uint16_t a, uint16_t b,
 +           uint32_t c)
 +{
 +    uint8_t round;
 +    uint32_t res = (uint32_t)a * b;
 +
 +    round = get_round(vxrm, res, 8);
 +    res   = (res >> 8) + round;
 +    return saddu32(env, vxrm, c, res);
 +}
 +
 +static inline uint64_t
 +vwsmaccu32(CPURISCVState *env, int vxrm, uint32_t a, uint32_t b,
 +           uint64_t c)
 +{
 +    uint8_t round;
 +    uint64_t res = (uint64_t)a * b;
 +
 +    round = get_round(vxrm, res, 16);
 +    res   = (res >> 16) + round;
 +    return saddu64(env, vxrm, c, res);
 +}
 +
 +#define OPIVV3_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
 +static inline void                                                 \
 +do_##NAME(void *vd, void *vs1, void *vs2, int i,                   \
 +          CPURISCVState *env, int vxrm)                            \
 +{                                                                  \
 +    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
 +    TD d = *((TD *)vd + HD(i));                                    \
 +    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, s1, d);                \
 +}
 +
 +RVVCALL(OPIVV3_RM, vwsmaccu_vv_b, WOP_UUU_B, H2, H1, H1, vwsmaccu8)
 +RVVCALL(OPIVV3_RM, vwsmaccu_vv_h, WOP_UUU_H, H4, H2, H2, vwsmaccu16)
 +RVVCALL(OPIVV3_RM, vwsmaccu_vv_w, WOP_UUU_W, H8, H4, H4, vwsmaccu32)
 +GEN_VEXT_VV_RM(vwsmaccu_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV_RM(vwsmaccu_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_RM(vwsmaccu_vv_w, 4, 8, clearq)
 +
 +#define OPIVX3_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)         \
 +static inline void                                                 \
 +do_##NAME(void *vd, target_long s1, void *vs2, int i,              \
 +          CPURISCVState *env, int vxrm)                            \
 +{                                                                  \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
 +    TD d = *((TD *)vd + HD(i));                                    \
 +    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, (TX1)(T1)s1, d);       \
 +}
 +
 +RVVCALL(OPIVX3_RM, vwsmaccu_vx_b, WOP_UUU_B, H2, H1, vwsmaccu8)
 +RVVCALL(OPIVX3_RM, vwsmaccu_vx_h, WOP_UUU_H, H4, H2, vwsmaccu16)
 +RVVCALL(OPIVX3_RM, vwsmaccu_vx_w, WOP_UUU_W, H8, H4, vwsmaccu32)
 +GEN_VEXT_VX_RM(vwsmaccu_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX_RM(vwsmaccu_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX_RM(vwsmaccu_vx_w, 4, 8, clearq)
 +
 +static inline int16_t
 +vwsmacc8(CPURISCVState *env, int vxrm, int8_t a, int8_t b, int16_t c)
 +{
 +    uint8_t round;
 +    int16_t res = (int16_t)a * b;
 +
 +    round = get_round(vxrm, res, 4);
 +    res   = (res >> 4) + round;
 +    return sadd16(env, vxrm, c, res);
 +}
 +
 +static inline int32_t
 +vwsmacc16(CPURISCVState *env, int vxrm, int16_t a, int16_t b, int32_t c)
 +{
 +    uint8_t round;
 +    int32_t res = (int32_t)a * b;
 +
 +    round = get_round(vxrm, res, 8);
 +    res   = (res >> 8) + round;
 +    return sadd32(env, vxrm, c, res);
 +
 +}
 +
 +static inline int64_t
 +vwsmacc32(CPURISCVState *env, int vxrm, int32_t a, int32_t b, int64_t c)
 +{
 +    uint8_t round;
 +    int64_t res = (int64_t)a * b;
 +
 +    round = get_round(vxrm, res, 16);
 +    res   = (res >> 16) + round;
 +    return sadd64(env, vxrm, c, res);
 +}
 +
 +RVVCALL(OPIVV3_RM, vwsmacc_vv_b, WOP_SSS_B, H2, H1, H1, vwsmacc8)
 +RVVCALL(OPIVV3_RM, vwsmacc_vv_h, WOP_SSS_H, H4, H2, H2, vwsmacc16)
 +RVVCALL(OPIVV3_RM, vwsmacc_vv_w, WOP_SSS_W, H8, H4, H4, vwsmacc32)
 +GEN_VEXT_VV_RM(vwsmacc_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV_RM(vwsmacc_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_RM(vwsmacc_vv_w, 4, 8, clearq)
 +RVVCALL(OPIVX3_RM, vwsmacc_vx_b, WOP_SSS_B, H2, H1, vwsmacc8)
 +RVVCALL(OPIVX3_RM, vwsmacc_vx_h, WOP_SSS_H, H4, H2, vwsmacc16)
 +RVVCALL(OPIVX3_RM, vwsmacc_vx_w, WOP_SSS_W, H8, H4, vwsmacc32)
 +GEN_VEXT_VX_RM(vwsmacc_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX_RM(vwsmacc_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX_RM(vwsmacc_vx_w, 4, 8, clearq)
 +
 +static inline int16_t
 +vwsmaccsu8(CPURISCVState *env, int vxrm, uint8_t a, int8_t b, int16_t c)
 +{
 +    uint8_t round;
 +    int16_t res = a * (int16_t)b;
 +
 +    round = get_round(vxrm, res, 4);
 +    res   = (res >> 4) + round;
 +    return ssub16(env, vxrm, c, res);
 +}
 +
 +static inline int32_t
 +vwsmaccsu16(CPURISCVState *env, int vxrm, uint16_t a, int16_t b, uint32_t c)
 +{
 +    uint8_t round;
 +    int32_t res = a * (int32_t)b;
 +
 +    round = get_round(vxrm, res, 8);
 +    res   = (res >> 8) + round;
 +    return ssub32(env, vxrm, c, res);
 +}
 +
 +static inline int64_t
 +vwsmaccsu32(CPURISCVState *env, int vxrm, uint32_t a, int32_t b, int64_t c)
 +{
 +    uint8_t round;
 +    int64_t res = a * (int64_t)b;
 +
 +    round = get_round(vxrm, res, 16);
 +    res   = (res >> 16) + round;
 +    return ssub64(env, vxrm, c, res);
 +}
 +
 +RVVCALL(OPIVV3_RM, vwsmaccsu_vv_b, WOP_SSU_B, H2, H1, H1, vwsmaccsu8)
 +RVVCALL(OPIVV3_RM, vwsmaccsu_vv_h, WOP_SSU_H, H4, H2, H2, vwsmaccsu16)
 +RVVCALL(OPIVV3_RM, vwsmaccsu_vv_w, WOP_SSU_W, H8, H4, H4, vwsmaccsu32)
 +GEN_VEXT_VV_RM(vwsmaccsu_vv_b, 1, 2, clearh)
 +GEN_VEXT_VV_RM(vwsmaccsu_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_RM(vwsmaccsu_vv_w, 4, 8, clearq)
 +RVVCALL(OPIVX3_RM, vwsmaccsu_vx_b, WOP_SSU_B, H2, H1, vwsmaccsu8)
 +RVVCALL(OPIVX3_RM, vwsmaccsu_vx_h, WOP_SSU_H, H4, H2, vwsmaccsu16)
 +RVVCALL(OPIVX3_RM, vwsmaccsu_vx_w, WOP_SSU_W, H8, H4, vwsmaccsu32)
 +GEN_VEXT_VX_RM(vwsmaccsu_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX_RM(vwsmaccsu_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX_RM(vwsmaccsu_vx_w, 4, 8, clearq)
 +
 +static inline int16_t
 +vwsmaccus8(CPURISCVState *env, int vxrm, int8_t a, uint8_t b, int16_t c)
 +{
 +    uint8_t round;
 +    int16_t res = (int16_t)a * b;
 +
 +    round = get_round(vxrm, res, 4);
 +    res   = (res >> 4) + round;
 +    return ssub16(env, vxrm, c, res);
 +}
 +
 +static inline int32_t
 +vwsmaccus16(CPURISCVState *env, int vxrm, int16_t a, uint16_t b, int32_t c)
 +{
 +    uint8_t round;
 +    int32_t res = (int32_t)a * b;
 +
 +    round = get_round(vxrm, res, 8);
 +    res   = (res >> 8) + round;
 +    return ssub32(env, vxrm, c, res);
 +}
 +
 +static inline int64_t
 +vwsmaccus32(CPURISCVState *env, int vxrm, int32_t a, uint32_t b, int64_t c)
 +{
 +    uint8_t round;
 +    int64_t res = (int64_t)a * b;
 +
 +    round = get_round(vxrm, res, 16);
 +    res   = (res >> 16) + round;
 +    return ssub64(env, vxrm, c, res);
 +}
 +
 +RVVCALL(OPIVX3_RM, vwsmaccus_vx_b, WOP_SUS_B, H2, H1, vwsmaccus8)
 +RVVCALL(OPIVX3_RM, vwsmaccus_vx_h, WOP_SUS_H, H4, H2, vwsmaccus16)
 +RVVCALL(OPIVX3_RM, vwsmaccus_vx_w, WOP_SUS_W, H8, H4, vwsmaccus32)
 +GEN_VEXT_VX_RM(vwsmaccus_vx_b, 1, 2, clearh)
 +GEN_VEXT_VX_RM(vwsmaccus_vx_h, 2, 4, clearl)
 +GEN_VEXT_VX_RM(vwsmaccus_vx_w, 4, 8, clearq)
 --
 .27.0

-New patch
+[PULL v2 31/64] target/riscv: vector single-width scaling shift instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20200701152549.1218-29-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  17 ++++
  target/riscv/insn32.decode              |   6 ++
  target/riscv/insn_trans/trans_rvv.inc.c |   8 ++
  target/riscv/vector_helper.c            | 117 ++++++++++++++++++++++++
 files changed, 148 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwsmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vssrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssra_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssrl_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vwsmacc_vx      111101 . ..... ..... 100 ..... 1010111 @r_vm
  vwsmaccsu_vv    111110 . ..... ..... 000 ..... 1010111 @r_vm
  vwsmaccsu_vx    111110 . ..... ..... 100 ..... 1010111 @r_vm
  vwsmaccus_vx    111111 . ..... ..... 100 ..... 1010111 @r_vm
 +vssrl_vv        101010 . ..... ..... 000 ..... 1010111 @r_vm
 +vssrl_vx        101010 . ..... ..... 100 ..... 1010111 @r_vm
 +vssrl_vi        101010 . ..... ..... 011 ..... 1010111 @r_vm
 +vssra_vv        101011 . ..... ..... 000 ..... 1010111 @r_vm
 +vssra_vx        101011 . ..... ..... 100 ..... 1010111 @r_vm
 +vssra_vi        101011 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_WIDEN_TRANS(vwsmaccu_vx)
  GEN_OPIVX_WIDEN_TRANS(vwsmacc_vx)
  GEN_OPIVX_WIDEN_TRANS(vwsmaccsu_vx)
  GEN_OPIVX_WIDEN_TRANS(vwsmaccus_vx)
 +
 +/* Vector Single-Width Scaling Shift Instructions */
 +GEN_OPIVV_TRANS(vssrl_vv, opivv_check)
 +GEN_OPIVV_TRANS(vssra_vv, opivv_check)
 +GEN_OPIVX_TRANS(vssrl_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vssra_vx,  opivx_check)
 +GEN_OPIVI_TRANS(vssrl_vi, 1, vssrl_vx, opivx_check)
 +GEN_OPIVI_TRANS(vssra_vi, 0, vssra_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX3_RM, vwsmaccus_vx_w, WOP_SUS_W, H8, H4, vwsmaccus32)
  GEN_VEXT_VX_RM(vwsmaccus_vx_b, 1, 2, clearh)
  GEN_VEXT_VX_RM(vwsmaccus_vx_h, 2, 4, clearl)
  GEN_VEXT_VX_RM(vwsmaccus_vx_w, 4, 8, clearq)
 +
 +/* Vector Single-Width Scaling Shift Instructions */
 +static inline uint8_t
 +vssrl8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
 +{
 +    uint8_t round, shift = b & 0x7;
 +    uint8_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +static inline uint16_t
 +vssrl16(CPURISCVState *env, int vxrm, uint16_t a, uint16_t b)
 +{
 +    uint8_t round, shift = b & 0xf;
 +    uint16_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +static inline uint32_t
 +vssrl32(CPURISCVState *env, int vxrm, uint32_t a, uint32_t b)
 +{
 +    uint8_t round, shift = b & 0x1f;
 +    uint32_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +static inline uint64_t
 +vssrl64(CPURISCVState *env, int vxrm, uint64_t a, uint64_t b)
 +{
 +    uint8_t round, shift = b & 0x3f;
 +    uint64_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +RVVCALL(OPIVV2_RM, vssrl_vv_b, OP_UUU_B, H1, H1, H1, vssrl8)
 +RVVCALL(OPIVV2_RM, vssrl_vv_h, OP_UUU_H, H2, H2, H2, vssrl16)
 +RVVCALL(OPIVV2_RM, vssrl_vv_w, OP_UUU_W, H4, H4, H4, vssrl32)
 +RVVCALL(OPIVV2_RM, vssrl_vv_d, OP_UUU_D, H8, H8, H8, vssrl64)
 +GEN_VEXT_VV_RM(vssrl_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vssrl_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vssrl_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vssrl_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vssrl_vx_b, OP_UUU_B, H1, H1, vssrl8)
 +RVVCALL(OPIVX2_RM, vssrl_vx_h, OP_UUU_H, H2, H2, vssrl16)
 +RVVCALL(OPIVX2_RM, vssrl_vx_w, OP_UUU_W, H4, H4, vssrl32)
 +RVVCALL(OPIVX2_RM, vssrl_vx_d, OP_UUU_D, H8, H8, vssrl64)
 +GEN_VEXT_VX_RM(vssrl_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vssrl_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vssrl_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vssrl_vx_d, 8, 8, clearq)
 +
 +static inline int8_t
 +vssra8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
 +{
 +    uint8_t round, shift = b & 0x7;
 +    int8_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +static inline int16_t
 +vssra16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
 +{
 +    uint8_t round, shift = b & 0xf;
 +    int16_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +static inline int32_t
 +vssra32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    uint8_t round, shift = b & 0x1f;
 +    int32_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +static inline int64_t
 +vssra64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    uint8_t round, shift = b & 0x3f;
 +    int64_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    return res;
 +}
 +RVVCALL(OPIVV2_RM, vssra_vv_b, OP_SSS_B, H1, H1, H1, vssra8)
 +RVVCALL(OPIVV2_RM, vssra_vv_h, OP_SSS_H, H2, H2, H2, vssra16)
 +RVVCALL(OPIVV2_RM, vssra_vv_w, OP_SSS_W, H4, H4, H4, vssra32)
 +RVVCALL(OPIVV2_RM, vssra_vv_d, OP_SSS_D, H8, H8, H8, vssra64)
 +GEN_VEXT_VV_RM(vssra_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vssra_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vssra_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vssra_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vssra_vx_b, OP_SSS_B, H1, H1, vssra8)
 +RVVCALL(OPIVX2_RM, vssra_vx_h, OP_SSS_H, H2, H2, vssra16)
 +RVVCALL(OPIVX2_RM, vssra_vx_w, OP_SSS_W, H4, H4, vssra32)
 +RVVCALL(OPIVX2_RM, vssra_vx_d, OP_SSS_D, H8, H8, vssra64)
 +GEN_VEXT_VX_RM(vssra_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vssra_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vssra_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vssra_vx_d, 8, 8, clearq)
 --
 .27.0

-New patch
+[PULL v2 32/64] target/riscv: vector narrowing fixed-point clip instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20200701152549.1218-30-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  13 +++
  target/riscv/insn32.decode              |   6 +
  target/riscv/insn_trans/trans_rvv.inc.c |   8 ++
  target/riscv/vector_helper.c            | 141 ++++++++++++++++++++++++
 files changed, 168 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vssra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vssra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vssra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vssra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vnclip_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vnclip_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vnclip_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vnclipu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vnclipu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vnclipu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vnclipu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vnclipu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vnclipu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vnclip_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vnclip_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vnclip_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vssrl_vi        101010 . ..... ..... 011 ..... 1010111 @r_vm
  vssra_vv        101011 . ..... ..... 000 ..... 1010111 @r_vm
  vssra_vx        101011 . ..... ..... 100 ..... 1010111 @r_vm
  vssra_vi        101011 . ..... ..... 011 ..... 1010111 @r_vm
 +vnclipu_vv      101110 . ..... ..... 000 ..... 1010111 @r_vm
 +vnclipu_vx      101110 . ..... ..... 100 ..... 1010111 @r_vm
 +vnclipu_vi      101110 . ..... ..... 011 ..... 1010111 @r_vm
 +vnclip_vv       101111 . ..... ..... 000 ..... 1010111 @r_vm
 +vnclip_vx       101111 . ..... ..... 100 ..... 1010111 @r_vm
 +vnclip_vi       101111 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vssrl_vx,  opivx_check)
  GEN_OPIVX_TRANS(vssra_vx,  opivx_check)
  GEN_OPIVI_TRANS(vssrl_vi, 1, vssrl_vx, opivx_check)
  GEN_OPIVI_TRANS(vssra_vi, 0, vssra_vx, opivx_check)
 +
 +/* Vector Narrowing Fixed-Point Clip Instructions */
 +GEN_OPIVV_NARROW_TRANS(vnclipu_vv)
 +GEN_OPIVV_NARROW_TRANS(vnclip_vv)
 +GEN_OPIVX_NARROW_TRANS(vnclipu_vx)
 +GEN_OPIVX_NARROW_TRANS(vnclip_vx)
 +GEN_OPIVI_NARROW_TRANS(vnclipu_vi, 1, vnclipu_vx)
 +GEN_OPIVI_NARROW_TRANS(vnclip_vi, 1, vnclip_vx)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
  #define WOP_SSU_B int16_t, int8_t, uint8_t, int16_t, uint16_t
  #define WOP_SSU_H int32_t, int16_t, uint16_t, int32_t, uint32_t
  #define WOP_SSU_W int64_t, int32_t, uint32_t, int64_t, uint64_t
 +#define NOP_SSS_B int8_t, int8_t, int16_t, int8_t, int16_t
 +#define NOP_SSS_H int16_t, int16_t, int32_t, int16_t, int32_t
 +#define NOP_SSS_W int32_t, int32_t, int64_t, int32_t, int64_t
 +#define NOP_UUU_B uint8_t, uint8_t, uint16_t, uint8_t, uint16_t
 +#define NOP_UUU_H uint16_t, uint16_t, uint32_t, uint16_t, uint32_t
 +#define NOP_UUU_W uint32_t, uint32_t, uint64_t, uint32_t, uint64_t
  /* operation of two vector elements */
  typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
@@ -XXX,XX +XXX,XX @@ vssra64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
      res   = (a >> shift)  + round;
      return res;
  }
 +
  RVVCALL(OPIVV2_RM, vssra_vv_b, OP_SSS_B, H1, H1, H1, vssra8)
  RVVCALL(OPIVV2_RM, vssra_vv_h, OP_SSS_H, H2, H2, H2, vssra16)
  RVVCALL(OPIVV2_RM, vssra_vv_w, OP_SSS_W, H4, H4, H4, vssra32)
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vssra_vx_b, 1, 1, clearb)
  GEN_VEXT_VX_RM(vssra_vx_h, 2, 2, clearh)
  GEN_VEXT_VX_RM(vssra_vx_w, 4, 4, clearl)
  GEN_VEXT_VX_RM(vssra_vx_d, 8, 8, clearq)
 +
 +/* Vector Narrowing Fixed-Point Clip Instructions */
 +static inline int8_t
 +vnclip8(CPURISCVState *env, int vxrm, int16_t a, int8_t b)
 +{
 +    uint8_t round, shift = b & 0xf;
 +    int16_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    if (res > INT8_MAX) {
 +        env->vxsat = 0x1;
 +        return INT8_MAX;
 +    } else if (res < INT8_MIN) {
 +        env->vxsat = 0x1;
 +        return INT8_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static inline int16_t
 +vnclip16(CPURISCVState *env, int vxrm, int32_t a, int16_t b)
 +{
 +    uint8_t round, shift = b & 0x1f;
 +    int32_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    if (res > INT16_MAX) {
 +        env->vxsat = 0x1;
 +        return INT16_MAX;
 +    } else if (res < INT16_MIN) {
 +        env->vxsat = 0x1;
 +        return INT16_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static inline int32_t
 +vnclip32(CPURISCVState *env, int vxrm, int64_t a, int32_t b)
 +{
 +    uint8_t round, shift = b & 0x3f;
 +    int64_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    if (res > INT32_MAX) {
 +        env->vxsat = 0x1;
 +        return INT32_MAX;
 +    } else if (res < INT32_MIN) {
 +        env->vxsat = 0x1;
 +        return INT32_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +RVVCALL(OPIVV2_RM, vnclip_vv_b, NOP_SSS_B, H1, H2, H1, vnclip8)
 +RVVCALL(OPIVV2_RM, vnclip_vv_h, NOP_SSS_H, H2, H4, H2, vnclip16)
 +RVVCALL(OPIVV2_RM, vnclip_vv_w, NOP_SSS_W, H4, H8, H4, vnclip32)
 +GEN_VEXT_VV_RM(vnclip_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vnclip_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vnclip_vv_w, 4, 4, clearl)
 +
 +RVVCALL(OPIVX2_RM, vnclip_vx_b, NOP_SSS_B, H1, H2, vnclip8)
 +RVVCALL(OPIVX2_RM, vnclip_vx_h, NOP_SSS_H, H2, H4, vnclip16)
 +RVVCALL(OPIVX2_RM, vnclip_vx_w, NOP_SSS_W, H4, H8, vnclip32)
 +GEN_VEXT_VX_RM(vnclip_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vnclip_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vnclip_vx_w, 4, 4, clearl)
 +
 +static inline uint8_t
 +vnclipu8(CPURISCVState *env, int vxrm, uint16_t a, uint8_t b)
 +{
 +    uint8_t round, shift = b & 0xf;
 +    uint16_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    if (res > UINT8_MAX) {
 +        env->vxsat = 0x1;
 +        return UINT8_MAX;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static inline uint16_t
 +vnclipu16(CPURISCVState *env, int vxrm, uint32_t a, uint16_t b)
 +{
 +    uint8_t round, shift = b & 0x1f;
 +    uint32_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    if (res > UINT16_MAX) {
 +        env->vxsat = 0x1;
 +        return UINT16_MAX;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +static inline uint32_t
 +vnclipu32(CPURISCVState *env, int vxrm, uint64_t a, uint32_t b)
 +{
 +    uint8_t round, shift = b & 0x3f;
 +    int64_t res;
 +
 +    round = get_round(vxrm, a, shift);
 +    res   = (a >> shift)  + round;
 +    if (res > UINT32_MAX) {
 +        env->vxsat = 0x1;
 +        return UINT32_MAX;
 +    } else {
 +        return res;
 +    }
 +}
 +
 +RVVCALL(OPIVV2_RM, vnclipu_vv_b, NOP_UUU_B, H1, H2, H1, vnclipu8)
 +RVVCALL(OPIVV2_RM, vnclipu_vv_h, NOP_UUU_H, H2, H4, H2, vnclipu16)
 +RVVCALL(OPIVV2_RM, vnclipu_vv_w, NOP_UUU_W, H4, H8, H4, vnclipu32)
 +GEN_VEXT_VV_RM(vnclipu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vnclipu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vnclipu_vv_w, 4, 4, clearl)
 +
 +RVVCALL(OPIVX2_RM, vnclipu_vx_b, NOP_UUU_B, H1, H2, vnclipu8)
 +RVVCALL(OPIVX2_RM, vnclipu_vx_h, NOP_UUU_H, H2, H4, vnclipu16)
 +RVVCALL(OPIVX2_RM, vnclipu_vx_w, NOP_UUU_W, H4, H8, vnclipu32)
 +GEN_VEXT_VX_RM(vnclipu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vnclipu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vnclipu_vx_w, 4, 4, clearl)
 --
 .27.0

-New patch
+[PULL v2 33/64] target/riscv: vector single-width floating-point add/subtract instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-31-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  16 ++++
+ target/riscv/insn32.decode              |   5 +
+ target/riscv/insn_trans/trans_rvv.inc.c | 118 ++++++++++++++++++++++++
+ target/riscv/vector_helper.c            | 111 ++++++++++++++++++++++
+files changed, 250 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnclipu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vnclip_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vnclip_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vnclip_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vfadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfrsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfrsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfrsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vnclipu_vi      101110 . ..... ..... 011 ..... 1010111 @r_vm
+ vnclip_vv       101111 . ..... ..... 000 ..... 1010111 @r_vm
+ vnclip_vx       101111 . ..... ..... 100 ..... 1010111 @r_vm
+ vnclip_vi       101111 . ..... ..... 011 ..... 1010111 @r_vm
++vfadd_vv        000000 . ..... ..... 001 ..... 1010111 @r_vm
++vfadd_vf        000000 . ..... ..... 101 ..... 1010111 @r_vm
++vfsub_vv        000010 . ..... ..... 001 ..... 1010111 @r_vm
++vfsub_vf        000010 . ..... ..... 101 ..... 1010111 @r_vm
++vfrsub_vf       100111 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_NARROW_TRANS(vnclipu_vx)
+ GEN_OPIVX_NARROW_TRANS(vnclip_vx)
+ GEN_OPIVI_NARROW_TRANS(vnclipu_vi, 1, vnclipu_vx)
+ GEN_OPIVI_NARROW_TRANS(vnclip_vi, 1, vnclip_vx)
++
++/*
++ *** Vector Float Point Arithmetic Instructions
++ */
++/* Vector Single-Width Floating-Point Add/Subtract Instructions */
++
++/*
++ * If the current SEW does not correspond to a supported IEEE floating-point
++ * type, an illegal instruction exception is raised.
++ */
++static bool opfvv_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, false) &&
++            vext_check_reg(s, a->rs1, false) &&
++            (s->sew != 0));
++}
++
++/* OPFVV without GVEC IR */
++#define GEN_OPFVV_TRANS(NAME, CHECK)                               \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++{                                                                  \
++    if (CHECK(s, a)) {                                             \
++        uint32_t data = 0;                                         \
++        static gen_helper_gvec_4_ptr * const fns[3] = {            \
++            gen_helper_##NAME##_h,                                 \
++            gen_helper_##NAME##_w,                                 \
++            gen_helper_##NAME##_d,                                 \
++        };                                                         \
++        TCGLabel *over = gen_new_label();                          \
++        gen_set_rm(s, 7);                                          \
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
++                                                                   \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
++        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
++                           vreg_ofs(s, a->rs1),                    \
++                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
++                           s->vlen / 8, data, fns[s->sew - 1]);    \
++        gen_set_label(over);                                       \
++        return true;                                               \
++    }                                                              \
++    return false;                                                  \
++}
++GEN_OPFVV_TRANS(vfadd_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfsub_vv, opfvv_check)
++
++typedef void gen_helper_opfvf(TCGv_ptr, TCGv_ptr, TCGv_i64, TCGv_ptr,
++                              TCGv_env, TCGv_i32);
++
++static bool opfvf_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
++                        uint32_t data, gen_helper_opfvf *fn, DisasContext *s)
++{
++    TCGv_ptr dest, src2, mask;
++    TCGv_i32 desc;
++
++    TCGLabel *over = gen_new_label();
++    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++
++    dest = tcg_temp_new_ptr();
++    mask = tcg_temp_new_ptr();
++    src2 = tcg_temp_new_ptr();
++    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
++
++    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
++    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
++    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
++
++    fn(dest, mask, cpu_fpr[rs1], src2, cpu_env, desc);
++
++    tcg_temp_free_ptr(dest);
++    tcg_temp_free_ptr(mask);
++    tcg_temp_free_ptr(src2);
++    tcg_temp_free_i32(desc);
++    gen_set_label(over);
++    return true;
++}
++
++static bool opfvf_check(DisasContext *s, arg_rmrr *a)
++{
++/*
++ * If the current SEW does not correspond to a supported IEEE floating-point
++ * type, an illegal instruction exception is raised
++ */
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, false) &&
++            (s->sew != 0));
++}
++
++/* OPFVF without GVEC IR */
++#define GEN_OPFVF_TRANS(NAME, CHECK)                              \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)            \
++{                                                                 \
++    if (CHECK(s, a)) {                                            \
++        uint32_t data = 0;                                        \
++        static gen_helper_opfvf *const fns[3] = {                 \
++            gen_helper_##NAME##_h,                                \
++            gen_helper_##NAME##_w,                                \
++            gen_helper_##NAME##_d,                                \
++        };                                                        \
++        gen_set_rm(s, 7);                                         \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);            \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);                \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);            \
++        return opfvf_trans(a->rd, a->rs1, a->rs2, data,           \
++                           fns[s->sew - 1], s);                   \
++    }                                                             \
++    return false;                                                 \
++}
++
++GEN_OPFVF_TRANS(vfadd_vf,  opfvf_check)
++GEN_OPFVF_TRANS(vfsub_vf,  opfvf_check)
++GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@
+ #include "exec/memop.h"
+ #include "exec/exec-all.h"
+ #include "exec/helper-proto.h"
++#include "fpu/softfloat.h"
+ #include "tcg/tcg-gvec-desc.h"
+ #include "internals.h"
+ #include <math.h>
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2_RM, vnclipu_vx_w, NOP_UUU_W, H4, H8, vnclipu32)
+ GEN_VEXT_VX_RM(vnclipu_vx_b, 1, 1, clearb)
+ GEN_VEXT_VX_RM(vnclipu_vx_h, 2, 2, clearh)
+ GEN_VEXT_VX_RM(vnclipu_vx_w, 4, 4, clearl)
++
++/*
++ *** Vector Float Point Arithmetic Instructions
++ */
++/* Vector Single-Width Floating-Point Add/Subtract Instructions */
++#define OPFVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)   \
++static void do_##NAME(void *vd, void *vs1, void *vs2, int i,   \
++                      CPURISCVState *env)                      \
++{                                                              \
++    TX1 s1 = *((T1 *)vs1 + HS1(i));                            \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                            \
++    *((TD *)vd + HD(i)) = OP(s2, s1, &env->fp_status);         \
++}
++
++#define GEN_VEXT_VV_ENV(NAME, ESZ, DSZ, CLEAR_FN)         \
++void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
++                  void *vs2, CPURISCVState *env,          \
++                  uint32_t desc)                          \
++{                                                         \
++    uint32_t vlmax = vext_maxsz(desc) / ESZ;              \
++    uint32_t mlen = vext_mlen(desc);                      \
++    uint32_t vm = vext_vm(desc);                          \
++    uint32_t vl = env->vl;                                \
++    uint32_t i;                                           \
++                                                          \
++    for (i = 0; i < vl; i++) {                            \
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
++            continue;                                     \
++        }                                                 \
++        do_##NAME(vd, vs1, vs2, i, env);                  \
++    }                                                     \
++    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);             \
++}
++
++RVVCALL(OPFVV2, vfadd_vv_h, OP_UUU_H, H2, H2, H2, float16_add)
++RVVCALL(OPFVV2, vfadd_vv_w, OP_UUU_W, H4, H4, H4, float32_add)
++RVVCALL(OPFVV2, vfadd_vv_d, OP_UUU_D, H8, H8, H8, float64_add)
++GEN_VEXT_VV_ENV(vfadd_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfadd_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfadd_vv_d, 8, 8, clearq)
++
++#define OPFVF2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)        \
++static void do_##NAME(void *vd, uint64_t s1, void *vs2, int i, \
++                      CPURISCVState *env)                      \
++{                                                              \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                            \
++    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, &env->fp_status);\
++}
++
++#define GEN_VEXT_VF(NAME, ESZ, DSZ, CLEAR_FN)             \
++void HELPER(NAME)(void *vd, void *v0, uint64_t s1,        \
++                  void *vs2, CPURISCVState *env,          \
++                  uint32_t desc)                          \
++{                                                         \
++    uint32_t vlmax = vext_maxsz(desc) / ESZ;              \
++    uint32_t mlen = vext_mlen(desc);                      \
++    uint32_t vm = vext_vm(desc);                          \
++    uint32_t vl = env->vl;                                \
++    uint32_t i;                                           \
++                                                          \
++    for (i = 0; i < vl; i++) {                            \
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
++            continue;                                     \
++        }                                                 \
++        do_##NAME(vd, s1, vs2, i, env);                   \
++    }                                                     \
++    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);             \
++}
++
++RVVCALL(OPFVF2, vfadd_vf_h, OP_UUU_H, H2, H2, float16_add)
++RVVCALL(OPFVF2, vfadd_vf_w, OP_UUU_W, H4, H4, float32_add)
++RVVCALL(OPFVF2, vfadd_vf_d, OP_UUU_D, H8, H8, float64_add)
++GEN_VEXT_VF(vfadd_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfadd_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfadd_vf_d, 8, 8, clearq)
++
++RVVCALL(OPFVV2, vfsub_vv_h, OP_UUU_H, H2, H2, H2, float16_sub)
++RVVCALL(OPFVV2, vfsub_vv_w, OP_UUU_W, H4, H4, H4, float32_sub)
++RVVCALL(OPFVV2, vfsub_vv_d, OP_UUU_D, H8, H8, H8, float64_sub)
++GEN_VEXT_VV_ENV(vfsub_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfsub_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfsub_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF2, vfsub_vf_h, OP_UUU_H, H2, H2, float16_sub)
++RVVCALL(OPFVF2, vfsub_vf_w, OP_UUU_W, H4, H4, float32_sub)
++RVVCALL(OPFVF2, vfsub_vf_d, OP_UUU_D, H8, H8, float64_sub)
++GEN_VEXT_VF(vfsub_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfsub_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfsub_vf_d, 8, 8, clearq)
++
++static uint16_t float16_rsub(uint16_t a, uint16_t b, float_status *s)
++{
++    return float16_sub(b, a, s);
++}
++
++static uint32_t float32_rsub(uint32_t a, uint32_t b, float_status *s)
++{
++    return float32_sub(b, a, s);
++}
++
++static uint64_t float64_rsub(uint64_t a, uint64_t b, float_status *s)
++{
++    return float64_sub(b, a, s);
++}
++
++RVVCALL(OPFVF2, vfrsub_vf_h, OP_UUU_H, H2, H2, float16_rsub)
++RVVCALL(OPFVF2, vfrsub_vf_w, OP_UUU_W, H4, H4, float32_rsub)
++RVVCALL(OPFVF2, vfrsub_vf_d, OP_UUU_D, H8, H8, float64_rsub)
++GEN_VEXT_VF(vfrsub_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfrsub_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfrsub_vf_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 34/64] target/riscv: vector widening floating-point add/subtract instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-32-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  17 +++
+ target/riscv/insn32.decode              |   8 ++
+ target/riscv/insn_trans/trans_rvv.inc.c | 149 ++++++++++++++++++++++++
+ target/riscv/vector_helper.c            |  83 +++++++++++++
+files changed, 257 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfrsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfrsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfrsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_6(vfwadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwadd_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwadd_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwsub_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwsub_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwadd_wf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwadd_wf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwsub_wf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwsub_wf_w, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfadd_vf        000000 . ..... ..... 101 ..... 1010111 @r_vm
+ vfsub_vv        000010 . ..... ..... 001 ..... 1010111 @r_vm
+ vfsub_vf        000010 . ..... ..... 101 ..... 1010111 @r_vm
+ vfrsub_vf       100111 . ..... ..... 101 ..... 1010111 @r_vm
++vfwadd_vv       110000 . ..... ..... 001 ..... 1010111 @r_vm
++vfwadd_vf       110000 . ..... ..... 101 ..... 1010111 @r_vm
++vfwadd_wv       110100 . ..... ..... 001 ..... 1010111 @r_vm
++vfwadd_wf       110100 . ..... ..... 101 ..... 1010111 @r_vm
++vfwsub_vv       110010 . ..... ..... 001 ..... 1010111 @r_vm
++vfwsub_vf       110010 . ..... ..... 101 ..... 1010111 @r_vm
++vfwsub_wv       110110 . ..... ..... 001 ..... 1010111 @r_vm
++vfwsub_wf       110110 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)            \
+ GEN_OPFVF_TRANS(vfadd_vf,  opfvf_check)
+ GEN_OPFVF_TRANS(vfsub_vf,  opfvf_check)
+ GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
++
++/* Vector Widening Floating-Point Add/Subtract Instructions */
++static bool opfvv_widen_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
++            vext_check_reg(s, a->rd, true) &&
++            vext_check_reg(s, a->rs2, false) &&
++            vext_check_reg(s, a->rs1, false) &&
++            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
++                                     1 << s->lmul) &&
++            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
++                                     1 << s->lmul) &&
++            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
++}
++
++/* OPFVV with WIDEN */
++#define GEN_OPFVV_WIDEN_TRANS(NAME, CHECK)                       \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
++{                                                                \
++    if (CHECK(s, a)) {                                           \
++        uint32_t data = 0;                                       \
++        static gen_helper_gvec_4_ptr * const fns[2] = {          \
++            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
++        };                                                       \
++        TCGLabel *over = gen_new_label();                        \
++        gen_set_rm(s, 7);                                        \
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);        \
++                                                                 \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
++        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),   \
++                           vreg_ofs(s, a->rs1),                  \
++                           vreg_ofs(s, a->rs2), cpu_env, 0,      \
++                           s->vlen / 8, data, fns[s->sew - 1]);  \
++        gen_set_label(over);                                     \
++        return true;                                             \
++    }                                                            \
++    return false;                                                \
++}
++
++GEN_OPFVV_WIDEN_TRANS(vfwadd_vv, opfvv_widen_check)
++GEN_OPFVV_WIDEN_TRANS(vfwsub_vv, opfvv_widen_check)
++
++static bool opfvf_widen_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
++            vext_check_reg(s, a->rd, true) &&
++            vext_check_reg(s, a->rs2, false) &&
++            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
++                                     1 << s->lmul) &&
++            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
++}
++
++/* OPFVF with WIDEN */
++#define GEN_OPFVF_WIDEN_TRANS(NAME)                              \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
++{                                                                \
++    if (opfvf_widen_check(s, a)) {                               \
++        uint32_t data = 0;                                       \
++        static gen_helper_opfvf *const fns[2] = {                \
++            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
++        };                                                       \
++        gen_set_rm(s, 7);                                        \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
++        return opfvf_trans(a->rd, a->rs1, a->rs2, data,          \
++                           fns[s->sew - 1], s);                  \
++    }                                                            \
++    return false;                                                \
++}
++
++GEN_OPFVF_WIDEN_TRANS(vfwadd_vf)
++GEN_OPFVF_WIDEN_TRANS(vfwsub_vf)
++
++static bool opfwv_widen_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
++            vext_check_reg(s, a->rd, true) &&
++            vext_check_reg(s, a->rs2, true) &&
++            vext_check_reg(s, a->rs1, false) &&
++            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
++                                     1 << s->lmul) &&
++            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
++}
++
++/* WIDEN OPFVV with WIDEN */
++#define GEN_OPFWV_WIDEN_TRANS(NAME)                                \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++{                                                                  \
++    if (opfwv_widen_check(s, a)) {                                 \
++        uint32_t data = 0;                                         \
++        static gen_helper_gvec_4_ptr * const fns[2] = {            \
++            gen_helper_##NAME##_h, gen_helper_##NAME##_w,          \
++        };                                                         \
++        TCGLabel *over = gen_new_label();                          \
++        gen_set_rm(s, 7);                                          \
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
++                                                                   \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
++        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
++                           vreg_ofs(s, a->rs1),                    \
++                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
++                           s->vlen / 8, data, fns[s->sew - 1]);    \
++        gen_set_label(over);                                       \
++        return true;                                               \
++    }                                                              \
++    return false;                                                  \
++}
++
++GEN_OPFWV_WIDEN_TRANS(vfwadd_wv)
++GEN_OPFWV_WIDEN_TRANS(vfwsub_wv)
++
++static bool opfwf_widen_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
++            vext_check_reg(s, a->rd, true) &&
++            vext_check_reg(s, a->rs2, true) &&
++            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
++}
++
++/* WIDEN OPFVF with WIDEN */
++#define GEN_OPFWF_WIDEN_TRANS(NAME)                              \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
++{                                                                \
++    if (opfwf_widen_check(s, a)) {                               \
++        uint32_t data = 0;                                       \
++        static gen_helper_opfvf *const fns[2] = {                \
++            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
++        };                                                       \
++        gen_set_rm(s, 7);                                        \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
++        return opfvf_trans(a->rd, a->rs1, a->rs2, data,          \
++                           fns[s->sew - 1], s);                  \
++    }                                                            \
++    return false;                                                \
++}
++
++GEN_OPFWF_WIDEN_TRANS(vfwadd_wf)
++GEN_OPFWF_WIDEN_TRANS(vfwsub_wf)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfrsub_vf_d, OP_UUU_D, H8, H8, float64_rsub)
+ GEN_VEXT_VF(vfrsub_vf_h, 2, 2, clearh)
+ GEN_VEXT_VF(vfrsub_vf_w, 4, 4, clearl)
+ GEN_VEXT_VF(vfrsub_vf_d, 8, 8, clearq)
++
++/* Vector Widening Floating-Point Add/Subtract Instructions */
++static uint32_t vfwadd16(uint16_t a, uint16_t b, float_status *s)
++{
++    return float32_add(float16_to_float32(a, true, s),
++            float16_to_float32(b, true, s), s);
++}
++
++static uint64_t vfwadd32(uint32_t a, uint32_t b, float_status *s)
++{
++    return float64_add(float32_to_float64(a, s),
++            float32_to_float64(b, s), s);
++
++}
++
++RVVCALL(OPFVV2, vfwadd_vv_h, WOP_UUU_H, H4, H2, H2, vfwadd16)
++RVVCALL(OPFVV2, vfwadd_vv_w, WOP_UUU_W, H8, H4, H4, vfwadd32)
++GEN_VEXT_VV_ENV(vfwadd_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwadd_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF2, vfwadd_vf_h, WOP_UUU_H, H4, H2, vfwadd16)
++RVVCALL(OPFVF2, vfwadd_vf_w, WOP_UUU_W, H8, H4, vfwadd32)
++GEN_VEXT_VF(vfwadd_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwadd_vf_w, 4, 8, clearq)
++
++static uint32_t vfwsub16(uint16_t a, uint16_t b, float_status *s)
++{
++    return float32_sub(float16_to_float32(a, true, s),
++            float16_to_float32(b, true, s), s);
++}
++
++static uint64_t vfwsub32(uint32_t a, uint32_t b, float_status *s)
++{
++    return float64_sub(float32_to_float64(a, s),
++            float32_to_float64(b, s), s);
++
++}
++
++RVVCALL(OPFVV2, vfwsub_vv_h, WOP_UUU_H, H4, H2, H2, vfwsub16)
++RVVCALL(OPFVV2, vfwsub_vv_w, WOP_UUU_W, H8, H4, H4, vfwsub32)
++GEN_VEXT_VV_ENV(vfwsub_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwsub_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF2, vfwsub_vf_h, WOP_UUU_H, H4, H2, vfwsub16)
++RVVCALL(OPFVF2, vfwsub_vf_w, WOP_UUU_W, H8, H4, vfwsub32)
++GEN_VEXT_VF(vfwsub_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwsub_vf_w, 4, 8, clearq)
++
++static uint32_t vfwaddw16(uint32_t a, uint16_t b, float_status *s)
++{
++    return float32_add(a, float16_to_float32(b, true, s), s);
++}
++
++static uint64_t vfwaddw32(uint64_t a, uint32_t b, float_status *s)
++{
++    return float64_add(a, float32_to_float64(b, s), s);
++}
++
++RVVCALL(OPFVV2, vfwadd_wv_h, WOP_WUUU_H, H4, H2, H2, vfwaddw16)
++RVVCALL(OPFVV2, vfwadd_wv_w, WOP_WUUU_W, H8, H4, H4, vfwaddw32)
++GEN_VEXT_VV_ENV(vfwadd_wv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwadd_wv_w, 4, 8, clearq)
++RVVCALL(OPFVF2, vfwadd_wf_h, WOP_WUUU_H, H4, H2, vfwaddw16)
++RVVCALL(OPFVF2, vfwadd_wf_w, WOP_WUUU_W, H8, H4, vfwaddw32)
++GEN_VEXT_VF(vfwadd_wf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwadd_wf_w, 4, 8, clearq)
++
++static uint32_t vfwsubw16(uint32_t a, uint16_t b, float_status *s)
++{
++    return float32_sub(a, float16_to_float32(b, true, s), s);
++}
++
++static uint64_t vfwsubw32(uint64_t a, uint32_t b, float_status *s)
++{
++    return float64_sub(a, float32_to_float64(b, s), s);
++}
++
++RVVCALL(OPFVV2, vfwsub_wv_h, WOP_WUUU_H, H4, H2, H2, vfwsubw16)
++RVVCALL(OPFVV2, vfwsub_wv_w, WOP_WUUU_W, H8, H4, H4, vfwsubw32)
++GEN_VEXT_VV_ENV(vfwsub_wv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwsub_wv_w, 4, 8, clearq)
++RVVCALL(OPFVF2, vfwsub_wf_h, WOP_WUUU_H, H4, H2, vfwsubw16)
++RVVCALL(OPFVF2, vfwsub_wf_w, WOP_WUUU_W, H8, H4, vfwsubw32)
++GEN_VEXT_VF(vfwsub_wf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwsub_wf_w, 4, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 35/64] target/riscv: vector single-width floating-point multiply/divide instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-33-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 16 ++++++++
+ target/riscv/insn32.decode              |  5 +++
+ target/riscv/insn_trans/trans_rvv.inc.c |  7 ++++
+ target/riscv/vector_helper.c            | 49 +++++++++++++++++++++++++
+files changed, 77 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwadd_wf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwadd_wf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwsub_wf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwsub_wf_w, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_6(vfmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfdiv_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfdiv_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfdiv_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmul_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfrdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfrdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfrdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfwsub_vv       110010 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwsub_vf       110010 . ..... ..... 101 ..... 1010111 @r_vm
+ vfwsub_wv       110110 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwsub_wf       110110 . ..... ..... 101 ..... 1010111 @r_vm
++vfmul_vv        100100 . ..... ..... 001 ..... 1010111 @r_vm
++vfmul_vf        100100 . ..... ..... 101 ..... 1010111 @r_vm
++vfdiv_vv        100000 . ..... ..... 001 ..... 1010111 @r_vm
++vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
++vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
+ GEN_OPFWF_WIDEN_TRANS(vfwadd_wf)
+ GEN_OPFWF_WIDEN_TRANS(vfwsub_wf)
++
++/* Vector Single-Width Floating-Point Multiply/Divide Instructions */
++GEN_OPFVV_TRANS(vfmul_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfdiv_vv, opfvv_check)
++GEN_OPFVF_TRANS(vfmul_vf,  opfvf_check)
++GEN_OPFVF_TRANS(vfdiv_vf,  opfvf_check)
++GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfwsub_wf_h, WOP_WUUU_H, H4, H2, vfwsubw16)
+ RVVCALL(OPFVF2, vfwsub_wf_w, WOP_WUUU_W, H8, H4, vfwsubw32)
+ GEN_VEXT_VF(vfwsub_wf_h, 2, 4, clearl)
+ GEN_VEXT_VF(vfwsub_wf_w, 4, 8, clearq)
++
++/* Vector Single-Width Floating-Point Multiply/Divide Instructions */
++RVVCALL(OPFVV2, vfmul_vv_h, OP_UUU_H, H2, H2, H2, float16_mul)
++RVVCALL(OPFVV2, vfmul_vv_w, OP_UUU_W, H4, H4, H4, float32_mul)
++RVVCALL(OPFVV2, vfmul_vv_d, OP_UUU_D, H8, H8, H8, float64_mul)
++GEN_VEXT_VV_ENV(vfmul_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmul_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmul_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF2, vfmul_vf_h, OP_UUU_H, H2, H2, float16_mul)
++RVVCALL(OPFVF2, vfmul_vf_w, OP_UUU_W, H4, H4, float32_mul)
++RVVCALL(OPFVF2, vfmul_vf_d, OP_UUU_D, H8, H8, float64_mul)
++GEN_VEXT_VF(vfmul_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmul_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmul_vf_d, 8, 8, clearq)
++
++RVVCALL(OPFVV2, vfdiv_vv_h, OP_UUU_H, H2, H2, H2, float16_div)
++RVVCALL(OPFVV2, vfdiv_vv_w, OP_UUU_W, H4, H4, H4, float32_div)
++RVVCALL(OPFVV2, vfdiv_vv_d, OP_UUU_D, H8, H8, H8, float64_div)
++GEN_VEXT_VV_ENV(vfdiv_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfdiv_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfdiv_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF2, vfdiv_vf_h, OP_UUU_H, H2, H2, float16_div)
++RVVCALL(OPFVF2, vfdiv_vf_w, OP_UUU_W, H4, H4, float32_div)
++RVVCALL(OPFVF2, vfdiv_vf_d, OP_UUU_D, H8, H8, float64_div)
++GEN_VEXT_VF(vfdiv_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfdiv_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfdiv_vf_d, 8, 8, clearq)
++
++static uint16_t float16_rdiv(uint16_t a, uint16_t b, float_status *s)
++{
++    return float16_div(b, a, s);
++}
++
++static uint32_t float32_rdiv(uint32_t a, uint32_t b, float_status *s)
++{
++    return float32_div(b, a, s);
++}
++
++static uint64_t float64_rdiv(uint64_t a, uint64_t b, float_status *s)
++{
++    return float64_div(b, a, s);
++}
++
++RVVCALL(OPFVF2, vfrdiv_vf_h, OP_UUU_H, H2, H2, float16_rdiv)
++RVVCALL(OPFVF2, vfrdiv_vf_w, OP_UUU_W, H4, H4, float32_rdiv)
++RVVCALL(OPFVF2, vfrdiv_vf_d, OP_UUU_D, H8, H8, float64_rdiv)
++GEN_VEXT_VF(vfrdiv_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfrdiv_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfrdiv_vf_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 36/64] target/riscv: vector widening floating-point multiply
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-34-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  5 +++++
+ target/riscv/insn32.decode              |  2 ++
+ target/riscv/insn_trans/trans_rvv.inc.c |  4 ++++
+ target/riscv/vector_helper.c            | 22 ++++++++++++++++++++++
+files changed, 33 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfrdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfrdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfrdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_6(vfwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfmul_vf        100100 . ..... ..... 101 ..... 1010111 @r_vm
+ vfdiv_vv        100000 . ..... ..... 001 ..... 1010111 @r_vm
+ vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
+ vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
++vfwmul_vv       111000 . ..... ..... 001 ..... 1010111 @r_vm
++vfwmul_vf       111000 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfdiv_vv, opfvv_check)
+ GEN_OPFVF_TRANS(vfmul_vf,  opfvf_check)
+ GEN_OPFVF_TRANS(vfdiv_vf,  opfvf_check)
+ GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
++
++/* Vector Widening Floating-Point Multiply */
++GEN_OPFVV_WIDEN_TRANS(vfwmul_vv, opfvv_widen_check)
++GEN_OPFVF_WIDEN_TRANS(vfwmul_vf)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfrdiv_vf_d, OP_UUU_D, H8, H8, float64_rdiv)
+ GEN_VEXT_VF(vfrdiv_vf_h, 2, 2, clearh)
+ GEN_VEXT_VF(vfrdiv_vf_w, 4, 4, clearl)
+ GEN_VEXT_VF(vfrdiv_vf_d, 8, 8, clearq)
++
++/* Vector Widening Floating-Point Multiply */
++static uint32_t vfwmul16(uint16_t a, uint16_t b, float_status *s)
++{
++    return float32_mul(float16_to_float32(a, true, s),
++            float16_to_float32(b, true, s), s);
++}
++
++static uint64_t vfwmul32(uint32_t a, uint32_t b, float_status *s)
++{
++    return float64_mul(float32_to_float64(a, s),
++            float32_to_float64(b, s), s);
++
++}
++RVVCALL(OPFVV2, vfwmul_vv_h, WOP_UUU_H, H4, H2, H2, vfwmul16)
++RVVCALL(OPFVV2, vfwmul_vv_w, WOP_UUU_W, H8, H4, H4, vfwmul32)
++GEN_VEXT_VV_ENV(vfwmul_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwmul_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF2, vfwmul_vf_h, WOP_UUU_H, H4, H2, vfwmul16)
++RVVCALL(OPFVF2, vfwmul_vf_w, WOP_UUU_W, H8, H4, vfwmul32)
++GEN_VEXT_VF(vfwmul_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwmul_vf_w, 4, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 37/64] target/riscv: vector single-width floating-point fused multiply-add instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-35-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  49 +++++
+ target/riscv/insn32.decode              |  16 ++
+ target/riscv/insn_trans/trans_rvv.inc.c |  18 ++
+ target/riscv/vector_helper.c            | 251 ++++++++++++++++++++++++
+files changed, 334 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_6(vfwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_6(vfwmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_6(vfmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfnmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmacc_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmacc_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmsac_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmsac_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfnmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
+ vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
+ vfwmul_vv       111000 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwmul_vf       111000 . ..... ..... 101 ..... 1010111 @r_vm
++vfmacc_vv       101100 . ..... ..... 001 ..... 1010111 @r_vm
++vfnmacc_vv      101101 . ..... ..... 001 ..... 1010111 @r_vm
++vfnmacc_vf      101101 . ..... ..... 101 ..... 1010111 @r_vm
++vfmacc_vf       101100 . ..... ..... 101 ..... 1010111 @r_vm
++vfmsac_vv       101110 . ..... ..... 001 ..... 1010111 @r_vm
++vfmsac_vf       101110 . ..... ..... 101 ..... 1010111 @r_vm
++vfnmsac_vv      101111 . ..... ..... 001 ..... 1010111 @r_vm
++vfnmsac_vf      101111 . ..... ..... 101 ..... 1010111 @r_vm
++vfmadd_vv       101000 . ..... ..... 001 ..... 1010111 @r_vm
++vfmadd_vf       101000 . ..... ..... 101 ..... 1010111 @r_vm
++vfnmadd_vv      101001 . ..... ..... 001 ..... 1010111 @r_vm
++vfnmadd_vf      101001 . ..... ..... 101 ..... 1010111 @r_vm
++vfmsub_vv       101010 . ..... ..... 001 ..... 1010111 @r_vm
++vfmsub_vf       101010 . ..... ..... 101 ..... 1010111 @r_vm
++vfnmsub_vv      101011 . ..... ..... 001 ..... 1010111 @r_vm
++vfnmsub_vf      101011 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
+ /* Vector Widening Floating-Point Multiply */
+ GEN_OPFVV_WIDEN_TRANS(vfwmul_vv, opfvv_widen_check)
+ GEN_OPFVF_WIDEN_TRANS(vfwmul_vf)
++
++/* Vector Single-Width Floating-Point Fused Multiply-Add Instructions */
++GEN_OPFVV_TRANS(vfmacc_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfnmacc_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfmsac_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfnmsac_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfmadd_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfnmadd_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfmsub_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfnmsub_vv, opfvv_check)
++GEN_OPFVF_TRANS(vfmacc_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfnmacc_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfmsac_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfnmsac_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfmadd_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfnmadd_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfmsub_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfnmsub_vf, opfvf_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfwmul_vf_h, WOP_UUU_H, H4, H2, vfwmul16)
+ RVVCALL(OPFVF2, vfwmul_vf_w, WOP_UUU_W, H8, H4, vfwmul32)
+ GEN_VEXT_VF(vfwmul_vf_h, 2, 4, clearl)
+ GEN_VEXT_VF(vfwmul_vf_w, 4, 8, clearq)
++
++/* Vector Single-Width Floating-Point Fused Multiply-Add Instructions */
++#define OPFVV3(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)       \
++static void do_##NAME(void *vd, void *vs1, void *vs2, int i,       \
++        CPURISCVState *env)                                        \
++{                                                                  \
++    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
++    TD d = *((TD *)vd + HD(i));                                    \
++    *((TD *)vd + HD(i)) = OP(s2, s1, d, &env->fp_status);          \
++}
++
++static uint16_t fmacc16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(a, b, d, 0, s);
++}
++
++static uint32_t fmacc32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(a, b, d, 0, s);
++}
++
++static uint64_t fmacc64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(a, b, d, 0, s);
++}
++
++RVVCALL(OPFVV3, vfmacc_vv_h, OP_UUU_H, H2, H2, H2, fmacc16)
++RVVCALL(OPFVV3, vfmacc_vv_w, OP_UUU_W, H4, H4, H4, fmacc32)
++RVVCALL(OPFVV3, vfmacc_vv_d, OP_UUU_D, H8, H8, H8, fmacc64)
++GEN_VEXT_VV_ENV(vfmacc_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmacc_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmacc_vv_d, 8, 8, clearq)
++
++#define OPFVF3(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)           \
++static void do_##NAME(void *vd, uint64_t s1, void *vs2, int i,    \
++        CPURISCVState *env)                                       \
++{                                                                 \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                               \
++    TD d = *((TD *)vd + HD(i));                                   \
++    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, d, &env->fp_status);\
++}
++
++RVVCALL(OPFVF3, vfmacc_vf_h, OP_UUU_H, H2, H2, fmacc16)
++RVVCALL(OPFVF3, vfmacc_vf_w, OP_UUU_W, H4, H4, fmacc32)
++RVVCALL(OPFVF3, vfmacc_vf_d, OP_UUU_D, H8, H8, fmacc64)
++GEN_VEXT_VF(vfmacc_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmacc_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmacc_vf_d, 8, 8, clearq)
++
++static uint16_t fnmacc16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(a, b, d,
++            float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++static uint32_t fnmacc32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(a, b, d,
++            float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++static uint64_t fnmacc64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(a, b, d,
++            float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++RVVCALL(OPFVV3, vfnmacc_vv_h, OP_UUU_H, H2, H2, H2, fnmacc16)
++RVVCALL(OPFVV3, vfnmacc_vv_w, OP_UUU_W, H4, H4, H4, fnmacc32)
++RVVCALL(OPFVV3, vfnmacc_vv_d, OP_UUU_D, H8, H8, H8, fnmacc64)
++GEN_VEXT_VV_ENV(vfnmacc_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfnmacc_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfnmacc_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfnmacc_vf_h, OP_UUU_H, H2, H2, fnmacc16)
++RVVCALL(OPFVF3, vfnmacc_vf_w, OP_UUU_W, H4, H4, fnmacc32)
++RVVCALL(OPFVF3, vfnmacc_vf_d, OP_UUU_D, H8, H8, fnmacc64)
++GEN_VEXT_VF(vfnmacc_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfnmacc_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfnmacc_vf_d, 8, 8, clearq)
++
++static uint16_t fmsac16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(a, b, d, float_muladd_negate_c, s);
++}
++
++static uint32_t fmsac32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(a, b, d, float_muladd_negate_c, s);
++}
++
++static uint64_t fmsac64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(a, b, d, float_muladd_negate_c, s);
++}
++
++RVVCALL(OPFVV3, vfmsac_vv_h, OP_UUU_H, H2, H2, H2, fmsac16)
++RVVCALL(OPFVV3, vfmsac_vv_w, OP_UUU_W, H4, H4, H4, fmsac32)
++RVVCALL(OPFVV3, vfmsac_vv_d, OP_UUU_D, H8, H8, H8, fmsac64)
++GEN_VEXT_VV_ENV(vfmsac_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmsac_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmsac_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfmsac_vf_h, OP_UUU_H, H2, H2, fmsac16)
++RVVCALL(OPFVF3, vfmsac_vf_w, OP_UUU_W, H4, H4, fmsac32)
++RVVCALL(OPFVF3, vfmsac_vf_d, OP_UUU_D, H8, H8, fmsac64)
++GEN_VEXT_VF(vfmsac_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmsac_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmsac_vf_d, 8, 8, clearq)
++
++static uint16_t fnmsac16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(a, b, d, float_muladd_negate_product, s);
++}
++
++static uint32_t fnmsac32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(a, b, d, float_muladd_negate_product, s);
++}
++
++static uint64_t fnmsac64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(a, b, d, float_muladd_negate_product, s);
++}
++
++RVVCALL(OPFVV3, vfnmsac_vv_h, OP_UUU_H, H2, H2, H2, fnmsac16)
++RVVCALL(OPFVV3, vfnmsac_vv_w, OP_UUU_W, H4, H4, H4, fnmsac32)
++RVVCALL(OPFVV3, vfnmsac_vv_d, OP_UUU_D, H8, H8, H8, fnmsac64)
++GEN_VEXT_VV_ENV(vfnmsac_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfnmsac_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfnmsac_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfnmsac_vf_h, OP_UUU_H, H2, H2, fnmsac16)
++RVVCALL(OPFVF3, vfnmsac_vf_w, OP_UUU_W, H4, H4, fnmsac32)
++RVVCALL(OPFVF3, vfnmsac_vf_d, OP_UUU_D, H8, H8, fnmsac64)
++GEN_VEXT_VF(vfnmsac_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfnmsac_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfnmsac_vf_d, 8, 8, clearq)
++
++static uint16_t fmadd16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(d, b, a, 0, s);
++}
++
++static uint32_t fmadd32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(d, b, a, 0, s);
++}
++
++static uint64_t fmadd64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(d, b, a, 0, s);
++}
++
++RVVCALL(OPFVV3, vfmadd_vv_h, OP_UUU_H, H2, H2, H2, fmadd16)
++RVVCALL(OPFVV3, vfmadd_vv_w, OP_UUU_W, H4, H4, H4, fmadd32)
++RVVCALL(OPFVV3, vfmadd_vv_d, OP_UUU_D, H8, H8, H8, fmadd64)
++GEN_VEXT_VV_ENV(vfmadd_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmadd_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmadd_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfmadd_vf_h, OP_UUU_H, H2, H2, fmadd16)
++RVVCALL(OPFVF3, vfmadd_vf_w, OP_UUU_W, H4, H4, fmadd32)
++RVVCALL(OPFVF3, vfmadd_vf_d, OP_UUU_D, H8, H8, fmadd64)
++GEN_VEXT_VF(vfmadd_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmadd_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmadd_vf_d, 8, 8, clearq)
++
++static uint16_t fnmadd16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(d, b, a,
++            float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++static uint32_t fnmadd32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(d, b, a,
++            float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++static uint64_t fnmadd64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(d, b, a,
++            float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++RVVCALL(OPFVV3, vfnmadd_vv_h, OP_UUU_H, H2, H2, H2, fnmadd16)
++RVVCALL(OPFVV3, vfnmadd_vv_w, OP_UUU_W, H4, H4, H4, fnmadd32)
++RVVCALL(OPFVV3, vfnmadd_vv_d, OP_UUU_D, H8, H8, H8, fnmadd64)
++GEN_VEXT_VV_ENV(vfnmadd_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfnmadd_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfnmadd_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfnmadd_vf_h, OP_UUU_H, H2, H2, fnmadd16)
++RVVCALL(OPFVF3, vfnmadd_vf_w, OP_UUU_W, H4, H4, fnmadd32)
++RVVCALL(OPFVF3, vfnmadd_vf_d, OP_UUU_D, H8, H8, fnmadd64)
++GEN_VEXT_VF(vfnmadd_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfnmadd_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfnmadd_vf_d, 8, 8, clearq)
++
++static uint16_t fmsub16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(d, b, a, float_muladd_negate_c, s);
++}
++
++static uint32_t fmsub32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(d, b, a, float_muladd_negate_c, s);
++}
++
++static uint64_t fmsub64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(d, b, a, float_muladd_negate_c, s);
++}
++
++RVVCALL(OPFVV3, vfmsub_vv_h, OP_UUU_H, H2, H2, H2, fmsub16)
++RVVCALL(OPFVV3, vfmsub_vv_w, OP_UUU_W, H4, H4, H4, fmsub32)
++RVVCALL(OPFVV3, vfmsub_vv_d, OP_UUU_D, H8, H8, H8, fmsub64)
++GEN_VEXT_VV_ENV(vfmsub_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmsub_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmsub_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfmsub_vf_h, OP_UUU_H, H2, H2, fmsub16)
++RVVCALL(OPFVF3, vfmsub_vf_w, OP_UUU_W, H4, H4, fmsub32)
++RVVCALL(OPFVF3, vfmsub_vf_d, OP_UUU_D, H8, H8, fmsub64)
++GEN_VEXT_VF(vfmsub_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmsub_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmsub_vf_d, 8, 8, clearq)
++
++static uint16_t fnmsub16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
++{
++    return float16_muladd(d, b, a, float_muladd_negate_product, s);
++}
++
++static uint32_t fnmsub32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(d, b, a, float_muladd_negate_product, s);
++}
++
++static uint64_t fnmsub64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(d, b, a, float_muladd_negate_product, s);
++}
++
++RVVCALL(OPFVV3, vfnmsub_vv_h, OP_UUU_H, H2, H2, H2, fnmsub16)
++RVVCALL(OPFVV3, vfnmsub_vv_w, OP_UUU_W, H4, H4, H4, fnmsub32)
++RVVCALL(OPFVV3, vfnmsub_vv_d, OP_UUU_D, H8, H8, H8, fnmsub64)
++GEN_VEXT_VV_ENV(vfnmsub_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfnmsub_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfnmsub_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF3, vfnmsub_vf_h, OP_UUU_H, H2, H2, fnmsub16)
++RVVCALL(OPFVF3, vfnmsub_vf_w, OP_UUU_W, H4, H4, fnmsub32)
++RVVCALL(OPFVF3, vfnmsub_vf_d, OP_UUU_D, H8, H8, fnmsub64)
++GEN_VEXT_VF(vfnmsub_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfnmsub_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfnmsub_vf_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 38/64] target/riscv: vector widening floating-point fused multiply-add instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-36-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 17 +++++
+ target/riscv/insn32.decode              |  8 +++
+ target/riscv/insn_trans/trans_rvv.inc.c | 10 +++
+ target/riscv/vector_helper.c            | 91 +++++++++++++++++++++++++
+files changed, 126 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfnmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfnmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfnmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_6(vfwmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwnmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwnmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfwmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwnmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwnmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfmsub_vv       101010 . ..... ..... 001 ..... 1010111 @r_vm
+ vfmsub_vf       101010 . ..... ..... 101 ..... 1010111 @r_vm
+ vfnmsub_vv      101011 . ..... ..... 001 ..... 1010111 @r_vm
+ vfnmsub_vf      101011 . ..... ..... 101 ..... 1010111 @r_vm
++vfwmacc_vv      111100 . ..... ..... 001 ..... 1010111 @r_vm
++vfwmacc_vf      111100 . ..... ..... 101 ..... 1010111 @r_vm
++vfwnmacc_vv     111101 . ..... ..... 001 ..... 1010111 @r_vm
++vfwnmacc_vf     111101 . ..... ..... 101 ..... 1010111 @r_vm
++vfwmsac_vv      111110 . ..... ..... 001 ..... 1010111 @r_vm
++vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
++vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
++vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfmadd_vf, opfvf_check)
+ GEN_OPFVF_TRANS(vfnmadd_vf, opfvf_check)
+ GEN_OPFVF_TRANS(vfmsub_vf, opfvf_check)
+ GEN_OPFVF_TRANS(vfnmsub_vf, opfvf_check)
++
++/* Vector Widening Floating-Point Fused Multiply-Add Instructions */
++GEN_OPFVV_WIDEN_TRANS(vfwmacc_vv, opfvv_widen_check)
++GEN_OPFVV_WIDEN_TRANS(vfwnmacc_vv, opfvv_widen_check)
++GEN_OPFVV_WIDEN_TRANS(vfwmsac_vv, opfvv_widen_check)
++GEN_OPFVV_WIDEN_TRANS(vfwnmsac_vv, opfvv_widen_check)
++GEN_OPFVF_WIDEN_TRANS(vfwmacc_vf)
++GEN_OPFVF_WIDEN_TRANS(vfwnmacc_vf)
++GEN_OPFVF_WIDEN_TRANS(vfwmsac_vf)
++GEN_OPFVF_WIDEN_TRANS(vfwnmsac_vf)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF3, vfnmsub_vf_d, OP_UUU_D, H8, H8, fnmsub64)
+ GEN_VEXT_VF(vfnmsub_vf_h, 2, 2, clearh)
+ GEN_VEXT_VF(vfnmsub_vf_w, 4, 4, clearl)
+ GEN_VEXT_VF(vfnmsub_vf_d, 8, 8, clearq)
++
++/* Vector Widening Floating-Point Fused Multiply-Add Instructions */
++static uint32_t fwmacc16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(float16_to_float32(a, true, s),
++                        float16_to_float32(b, true, s), d, 0, s);
++}
++
++static uint64_t fwmacc32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(float32_to_float64(a, s),
++                        float32_to_float64(b, s), d, 0, s);
++}
++
++RVVCALL(OPFVV3, vfwmacc_vv_h, WOP_UUU_H, H4, H2, H2, fwmacc16)
++RVVCALL(OPFVV3, vfwmacc_vv_w, WOP_UUU_W, H8, H4, H4, fwmacc32)
++GEN_VEXT_VV_ENV(vfwmacc_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwmacc_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF3, vfwmacc_vf_h, WOP_UUU_H, H4, H2, fwmacc16)
++RVVCALL(OPFVF3, vfwmacc_vf_w, WOP_UUU_W, H8, H4, fwmacc32)
++GEN_VEXT_VF(vfwmacc_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwmacc_vf_w, 4, 8, clearq)
++
++static uint32_t fwnmacc16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(float16_to_float32(a, true, s),
++                        float16_to_float32(b, true, s), d,
++                        float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++static uint64_t fwnmacc32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(float32_to_float64(a, s),
++                        float32_to_float64(b, s), d,
++                        float_muladd_negate_c | float_muladd_negate_product, s);
++}
++
++RVVCALL(OPFVV3, vfwnmacc_vv_h, WOP_UUU_H, H4, H2, H2, fwnmacc16)
++RVVCALL(OPFVV3, vfwnmacc_vv_w, WOP_UUU_W, H8, H4, H4, fwnmacc32)
++GEN_VEXT_VV_ENV(vfwnmacc_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwnmacc_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF3, vfwnmacc_vf_h, WOP_UUU_H, H4, H2, fwnmacc16)
++RVVCALL(OPFVF3, vfwnmacc_vf_w, WOP_UUU_W, H8, H4, fwnmacc32)
++GEN_VEXT_VF(vfwnmacc_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwnmacc_vf_w, 4, 8, clearq)
++
++static uint32_t fwmsac16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(float16_to_float32(a, true, s),
++                        float16_to_float32(b, true, s), d,
++                        float_muladd_negate_c, s);
++}
++
++static uint64_t fwmsac32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(float32_to_float64(a, s),
++                        float32_to_float64(b, s), d,
++                        float_muladd_negate_c, s);
++}
++
++RVVCALL(OPFVV3, vfwmsac_vv_h, WOP_UUU_H, H4, H2, H2, fwmsac16)
++RVVCALL(OPFVV3, vfwmsac_vv_w, WOP_UUU_W, H8, H4, H4, fwmsac32)
++GEN_VEXT_VV_ENV(vfwmsac_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwmsac_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF3, vfwmsac_vf_h, WOP_UUU_H, H4, H2, fwmsac16)
++RVVCALL(OPFVF3, vfwmsac_vf_w, WOP_UUU_W, H8, H4, fwmsac32)
++GEN_VEXT_VF(vfwmsac_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwmsac_vf_w, 4, 8, clearq)
++
++static uint32_t fwnmsac16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
++{
++    return float32_muladd(float16_to_float32(a, true, s),
++                        float16_to_float32(b, true, s), d,
++                        float_muladd_negate_product, s);
++}
++
++static uint64_t fwnmsac32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
++{
++    return float64_muladd(float32_to_float64(a, s),
++                        float32_to_float64(b, s), d,
++                        float_muladd_negate_product, s);
++}
++
++RVVCALL(OPFVV3, vfwnmsac_vv_h, WOP_UUU_H, H4, H2, H2, fwnmsac16)
++RVVCALL(OPFVV3, vfwnmsac_vv_w, WOP_UUU_W, H8, H4, H4, fwnmsac32)
++GEN_VEXT_VV_ENV(vfwnmsac_vv_h, 2, 4, clearl)
++GEN_VEXT_VV_ENV(vfwnmsac_vv_w, 4, 8, clearq)
++RVVCALL(OPFVF3, vfwnmsac_vf_h, WOP_UUU_H, H4, H2, fwnmsac16)
++RVVCALL(OPFVF3, vfwnmsac_vf_w, WOP_UUU_W, H8, H4, fwnmsac32)
++GEN_VEXT_VF(vfwnmsac_vf_h, 2, 4, clearl)
++GEN_VEXT_VF(vfwnmsac_vf_w, 4, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 39/64] target/riscv: vector floating-point square-root instruction
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-37-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  4 +++
+ target/riscv/insn32.decode              |  3 ++
+ target/riscv/insn_trans/trans_rvv.inc.c | 43 +++++++++++++++++++++++++
+ target/riscv/vector_helper.c            | 43 +++++++++++++++++++++++++
+files changed, 93 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_5(vfsqrt_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vfsqrt_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vfsqrt_v_d, void, ptr, ptr, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@
+ &shift     shamt rs1 rd
+ &atomic    aq rl rs2 rs1 rd
+ &rmrr      vm rd rs1 rs2
++&rmr       vm rd rs2
+ &rwdvm     vm wd rd rs1 rs2
+ &r2nfvm    vm rd rs1 nf
+ &rnfvm     vm rd rs1 rs2 nf
+@@ -XXX,XX +XXX,XX @@
+ @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
+ @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
++@r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
+ @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+ @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
+ @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
+@@ -XXX,XX +XXX,XX @@ vfwmsac_vv      111110 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
+ vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
++vfsqrt_v        100011 . ..... 00000 001 ..... 1010111 @r2_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_WIDEN_TRANS(vfwmacc_vf)
+ GEN_OPFVF_WIDEN_TRANS(vfwnmacc_vf)
+ GEN_OPFVF_WIDEN_TRANS(vfwmsac_vf)
+ GEN_OPFVF_WIDEN_TRANS(vfwnmsac_vf)
++
++/* Vector Floating-Point Square-Root Instruction */
++
++/*
++ * If the current SEW does not correspond to a supported IEEE floating-point
++ * type, an illegal instruction exception is raised
++ */
++static bool opfv_check(DisasContext *s, arg_rmr *a)
++{
++   return (vext_check_isa_ill(s) &&
++            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++            vext_check_reg(s, a->rd, false) &&
++            vext_check_reg(s, a->rs2, false) &&
++            (s->sew != 0));
++}
++
++#define GEN_OPFV_TRANS(NAME, CHECK)                                \
++static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
++{                                                                  \
++    if (CHECK(s, a)) {                                             \
++        uint32_t data = 0;                                         \
++        static gen_helper_gvec_3_ptr * const fns[3] = {            \
++            gen_helper_##NAME##_h,                                 \
++            gen_helper_##NAME##_w,                                 \
++            gen_helper_##NAME##_d,                                 \
++        };                                                         \
++        TCGLabel *over = gen_new_label();                          \
++        gen_set_rm(s, 7);                                          \
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
++                                                                   \
++        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
++        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
++        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
++                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
++                           s->vlen / 8, data, fns[s->sew - 1]);    \
++        gen_set_label(over);                                       \
++        return true;                                               \
++    }                                                              \
++    return false;                                                  \
++}
++
++GEN_OPFV_TRANS(vfsqrt_v, opfv_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF3, vfwnmsac_vf_h, WOP_UUU_H, H4, H2, fwnmsac16)
+ RVVCALL(OPFVF3, vfwnmsac_vf_w, WOP_UUU_W, H8, H4, fwnmsac32)
+ GEN_VEXT_VF(vfwnmsac_vf_h, 2, 4, clearl)
+ GEN_VEXT_VF(vfwnmsac_vf_w, 4, 8, clearq)
++
++/* Vector Floating-Point Square-Root Instruction */
++/* (TD, T2, TX2) */
++#define OP_UU_H uint16_t, uint16_t, uint16_t
++#define OP_UU_W uint32_t, uint32_t, uint32_t
++#define OP_UU_D uint64_t, uint64_t, uint64_t
++
++#define OPFVV1(NAME, TD, T2, TX2, HD, HS2, OP)        \
++static void do_##NAME(void *vd, void *vs2, int i,      \
++        CPURISCVState *env)                            \
++{                                                      \
++    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
++    *((TD *)vd + HD(i)) = OP(s2, &env->fp_status);     \
++}
++
++#define GEN_VEXT_V_ENV(NAME, ESZ, DSZ, CLEAR_FN)       \
++void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
++        CPURISCVState *env, uint32_t desc)             \
++{                                                      \
++    uint32_t vlmax = vext_maxsz(desc) / ESZ;           \
++    uint32_t mlen = vext_mlen(desc);                   \
++    uint32_t vm = vext_vm(desc);                       \
++    uint32_t vl = env->vl;                             \
++    uint32_t i;                                        \
++                                                       \
++    if (vl == 0) {                                     \
++        return;                                        \
++    }                                                  \
++    for (i = 0; i < vl; i++) {                         \
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {     \
++            continue;                                  \
++        }                                              \
++        do_##NAME(vd, vs2, i, env);                    \
++    }                                                  \
++    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);          \
++}
++
++RVVCALL(OPFVV1, vfsqrt_v_h, OP_UU_H, H2, H2, float16_sqrt)
++RVVCALL(OPFVV1, vfsqrt_v_w, OP_UU_W, H4, H4, float32_sqrt)
++RVVCALL(OPFVV1, vfsqrt_v_d, OP_UU_D, H8, H8, float64_sqrt)
++GEN_VEXT_V_ENV(vfsqrt_v_h, 2, 2, clearh)
++GEN_VEXT_V_ENV(vfsqrt_v_w, 4, 4, clearl)
++GEN_VEXT_V_ENV(vfsqrt_v_d, 8, 8, clearq)
+--
+.27.0

-New patch
+[PULL v2 40/64] target/riscv: vector floating-point min/max instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20200701152549.1218-38-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   | 13 ++++++++++++
+ target/riscv/insn32.decode              |  4 ++++
+ target/riscv/insn_trans/trans_rvv.inc.c |  6 ++++++
+ target/riscv/vector_helper.c            | 27 +++++++++++++++++++++++++
+files changed, 50 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_5(vfsqrt_v_h, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_5(vfsqrt_v_w, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_5(vfsqrt_v_d, void, ptr, ptr, ptr, env, i32)
++
++DEF_HELPER_6(vfmin_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmin_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmin_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmax_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmax_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmax_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfmin_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmin_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmin_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmax_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmax_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmax_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
+ vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
+ vfsqrt_v        100011 . ..... 00000 001 ..... 1010111 @r2_vm
++vfmin_vv        000100 . ..... ..... 001 ..... 1010111 @r_vm
++vfmin_vf        000100 . ..... ..... 101 ..... 1010111 @r_vm
++vfmax_vv        000110 . ..... ..... 001 ..... 1010111 @r_vm
++vfmax_vf        000110 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
+ }
+ GEN_OPFV_TRANS(vfsqrt_v, opfv_check)
++
++/* Vector Floating-Point MIN/MAX Instructions */
++GEN_OPFVV_TRANS(vfmin_vv, opfvv_check)
++GEN_OPFVV_TRANS(vfmax_vv, opfvv_check)
++GEN_OPFVF_TRANS(vfmin_vf, opfvf_check)
++GEN_OPFVF_TRANS(vfmax_vf, opfvf_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfsqrt_v_d, OP_UU_D, H8, H8, float64_sqrt)
+ GEN_VEXT_V_ENV(vfsqrt_v_h, 2, 2, clearh)
+ GEN_VEXT_V_ENV(vfsqrt_v_w, 4, 4, clearl)
+ GEN_VEXT_V_ENV(vfsqrt_v_d, 8, 8, clearq)
++
++/* Vector Floating-Point MIN/MAX Instructions */
++RVVCALL(OPFVV2, vfmin_vv_h, OP_UUU_H, H2, H2, H2, float16_minnum)
++RVVCALL(OPFVV2, vfmin_vv_w, OP_UUU_W, H4, H4, H4, float32_minnum)
++RVVCALL(OPFVV2, vfmin_vv_d, OP_UUU_D, H8, H8, H8, float64_minnum)
++GEN_VEXT_VV_ENV(vfmin_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmin_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmin_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF2, vfmin_vf_h, OP_UUU_H, H2, H2, float16_minnum)
++RVVCALL(OPFVF2, vfmin_vf_w, OP_UUU_W, H4, H4, float32_minnum)
++RVVCALL(OPFVF2, vfmin_vf_d, OP_UUU_D, H8, H8, float64_minnum)
++GEN_VEXT_VF(vfmin_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmin_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmin_vf_d, 8, 8, clearq)
++
++RVVCALL(OPFVV2, vfmax_vv_h, OP_UUU_H, H2, H2, H2, float16_maxnum)
++RVVCALL(OPFVV2, vfmax_vv_w, OP_UUU_W, H4, H4, H4, float32_maxnum)
++RVVCALL(OPFVV2, vfmax_vv_d, OP_UUU_D, H8, H8, H8, float64_maxnum)
++GEN_VEXT_VV_ENV(vfmax_vv_h, 2, 2, clearh)
++GEN_VEXT_VV_ENV(vfmax_vv_w, 4, 4, clearl)
++GEN_VEXT_VV_ENV(vfmax_vv_d, 8, 8, clearq)
++RVVCALL(OPFVF2, vfmax_vf_h, OP_UUU_H, H2, H2, float16_maxnum)
++RVVCALL(OPFVF2, vfmax_vf_w, OP_UUU_W, H4, H4, float32_maxnum)
++RVVCALL(OPFVF2, vfmax_vf_d, OP_UUU_D, H8, H8, float64_maxnum)
++GEN_VEXT_VF(vfmax_vf_h, 2, 2, clearh)
++GEN_VEXT_VF(vfmax_vf_w, 4, 4, clearl)
++GEN_VEXT_VF(vfmax_vf_d, 8, 8, clearq)
+--
+.27.0

-[PULL 11/30] hw/dma: Add SiFive platform DMA controller emulation
+[PULL v2 41/64] target/riscv: vector floating-point sign-injection instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Microchip PolarFire SoC integrates a DMA engine that supports:
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-* Independent concurrent DMA transfers using 4 DMA channels
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-* Generation of interrupts on various conditions during execution
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-which is actually an IP reused from the SiFive FU540 chip.
+Message-Id: <20200701152549.1218-39-zhiwei_liu@c-sky.com>
 This creates a model to support both polling and interrupt modes.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1598924352-89526-10-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/dma/sifive_pdma.h |  57 +++++++
+ target/riscv/helper.h                   | 19 ++++++
- hw/dma/sifive_pdma.c         | 313 +++++++++++++++++++++++++++++++++++
+ target/riscv/insn32.decode              |  6 ++
- hw/dma/Kconfig               |   3 +
+ target/riscv/insn_trans/trans_rvv.inc.c |  8 +++
- hw/dma/meson.build           |   1 +
+ target/riscv/vector_helper.c            | 85 +++++++++++++++++++++++++
-files changed, 374 insertions(+)
+files changed, 118 insertions(+)
  create mode 100644 include/hw/dma/sifive_pdma.h
  create mode 100644 hw/dma/sifive_pdma.c
-diff --git a/include/hw/dma/sifive_pdma.h b/include/hw/dma/sifive_pdma.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/target/riscv/helper.h
---- /dev/null
++++ b/target/riscv/helper.h
-+++ b/include/hw/dma/sifive_pdma.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfmin_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@
+ DEF_HELPER_6(vfmax_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+/*
+ DEF_HELPER_6(vfmax_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+ * SiFive Platform DMA emulation
+ DEF_HELPER_6(vfmax_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 + *
 + * Copyright (c) 2020 Wind River Systems, Inc.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License as
 + * published by the Free Software Foundation; either version 2 or
 + * (at your option) version 3 of the License.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
-+#ifndef SIFIVE_PDMA_H
++DEF_HELPER_6(vfsgnj_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+#define SIFIVE_PDMA_H
++DEF_HELPER_6(vfsgnj_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vfmin_vv        000100 . ..... ..... 001 ..... 1010111 @r_vm
  vfmin_vf        000100 . ..... ..... 101 ..... 1010111 @r_vm
  vfmax_vv        000110 . ..... ..... 001 ..... 1010111 @r_vm
  vfmax_vf        000110 . ..... ..... 101 ..... 1010111 @r_vm
 +vfsgnj_vv       001000 . ..... ..... 001 ..... 1010111 @r_vm
 +vfsgnj_vf       001000 . ..... ..... 101 ..... 1010111 @r_vm
 +vfsgnjn_vv      001001 . ..... ..... 001 ..... 1010111 @r_vm
 +vfsgnjn_vf      001001 . ..... ..... 101 ..... 1010111 @r_vm
 +vfsgnjx_vv      001010 . ..... ..... 001 ..... 1010111 @r_vm
 +vfsgnjx_vf      001010 . ..... ..... 101 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfmin_vv, opfvv_check)
  GEN_OPFVV_TRANS(vfmax_vv, opfvv_check)
  GEN_OPFVF_TRANS(vfmin_vf, opfvf_check)
  GEN_OPFVF_TRANS(vfmax_vf, opfvf_check)
 +
-+struct sifive_pdma_chan {
++/* Vector Floating-Point Sign-Injection Instructions */
-+    uint32_t control;
++GEN_OPFVV_TRANS(vfsgnj_vv, opfvv_check)
-+    uint32_t next_config;
++GEN_OPFVV_TRANS(vfsgnjn_vv, opfvv_check)
-+    uint64_t next_bytes;
++GEN_OPFVV_TRANS(vfsgnjx_vv, opfvv_check)
-+    uint64_t next_dst;
++GEN_OPFVF_TRANS(vfsgnj_vf, opfvf_check)
-+    uint64_t next_src;
++GEN_OPFVF_TRANS(vfsgnjn_vf, opfvf_check)
-+    uint32_t exec_config;
++GEN_OPFVF_TRANS(vfsgnjx_vf, opfvf_check)
-+    uint64_t exec_bytes;
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-+    uint64_t exec_dst;
+index XXXXXXX..XXXXXXX 100644
-+    uint64_t exec_src;
+--- a/target/riscv/vector_helper.c
-+    int state;
++++ b/target/riscv/vector_helper.c
-+};
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfmax_vf_d, OP_UUU_D, H8, H8, float64_maxnum)
  GEN_VEXT_VF(vfmax_vf_h, 2, 2, clearh)
  GEN_VEXT_VF(vfmax_vf_w, 4, 4, clearl)
  GEN_VEXT_VF(vfmax_vf_d, 8, 8, clearq)
 +
-+#define SIFIVE_PDMA_CHANS           4
++/* Vector Floating-Point Sign-Injection Instructions */
-+#define SIFIVE_PDMA_IRQS            (SIFIVE_PDMA_CHANS * 2)
++static uint16_t fsgnj16(uint16_t a, uint16_t b, float_status *s)
 +#define SIFIVE_PDMA_REG_SIZE        0x100000
 +#define SIFIVE_PDMA_CHAN_NO(reg)    ((reg & (SIFIVE_PDMA_REG_SIZE - 1)) >> 12)
 +
 +typedef struct SiFivePDMAState {
 +    SysBusDevice parent;
 +    MemoryRegion iomem;
 +    qemu_irq irq[SIFIVE_PDMA_IRQS];
 +
 +    struct sifive_pdma_chan chan[SIFIVE_PDMA_CHANS];
 +} SiFivePDMAState;
 +
 +#define TYPE_SIFIVE_PDMA    "sifive.pdma"
 +
 +#define SIFIVE_PDMA(obj)    \
 +    OBJECT_CHECK(SiFivePDMAState, (obj), TYPE_SIFIVE_PDMA)
 +
 +#endif /* SIFIVE_PDMA_H */
 diff --git a/hw/dma/sifive_pdma.c b/hw/dma/sifive_pdma.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/dma/sifive_pdma.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * SiFive Platform DMA emulation
 + *
 + * Copyright (c) 2020 Wind River Systems, Inc.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License as
 + * published by the Free Software Foundation; either version 2 or
 + * (at your option) version 3 of the License.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/bitops.h"
 +#include "qemu/log.h"
 +#include "qapi/error.h"
 +#include "hw/hw.h"
 +#include "hw/irq.h"
 +#include "hw/qdev-properties.h"
 +#include "hw/sysbus.h"
 +#include "migration/vmstate.h"
 +#include "sysemu/dma.h"
 +#include "hw/dma/sifive_pdma.h"
 +
 +#define DMA_CONTROL         0x000
 +#define   CONTROL_CLAIM     BIT(0)
 +#define   CONTROL_RUN       BIT(1)
 +#define   CONTROL_DONE_IE   BIT(14)
 +#define   CONTROL_ERR_IE    BIT(15)
 +#define   CONTROL_DONE      BIT(30)
 +#define   CONTROL_ERR       BIT(31)
 +
 +#define DMA_NEXT_CONFIG     0x004
 +#define   CONFIG_REPEAT     BIT(2)
 +#define   CONFIG_ORDER      BIT(3)
 +#define   CONFIG_WRSZ_SHIFT 24
 +#define   CONFIG_RDSZ_SHIFT 28
 +#define   CONFIG_SZ_MASK    0xf
 +
 +#define DMA_NEXT_BYTES      0x008
 +#define DMA_NEXT_DST        0x010
 +#define DMA_NEXT_SRC        0x018
 +#define DMA_EXEC_CONFIG     0x104
 +#define DMA_EXEC_BYTES      0x108
 +#define DMA_EXEC_DST        0x110
 +#define DMA_EXEC_SRC        0x118
 +
 +enum dma_chan_state {
 +    DMA_CHAN_STATE_IDLE,
 +    DMA_CHAN_STATE_STARTED,
 +    DMA_CHAN_STATE_ERROR,
 +    DMA_CHAN_STATE_DONE
 +};
 +
 +static void sifive_pdma_run(SiFivePDMAState *s, int ch)
 +{
-+    uint64_t bytes = s->chan[ch].next_bytes;
++    return deposit64(b, 0, 15, a);
 +    uint64_t dst = s->chan[ch].next_dst;
 +    uint64_t src = s->chan[ch].next_src;
 +    uint32_t config = s->chan[ch].next_config;
 +    int wsize, rsize, size;
 +    uint8_t buf[64];
 +    int n;
 +
 +    /* do nothing if bytes to transfer is zero */
 +    if (!bytes) {
 +        goto error;
 +    }
 +
 +    /*
 +     * The manual does not describe how the hardware behaviors when
 +     * config.wsize and config.rsize are given different values.
 +     * A common case is memory to memory DMA, and in this case they
 +     * are normally the same. Abort if this expectation fails.
 +     */
 +    wsize = (config >> CONFIG_WRSZ_SHIFT) & CONFIG_SZ_MASK;
 +    rsize = (config >> CONFIG_RDSZ_SHIFT) & CONFIG_SZ_MASK;
 +    if (wsize != rsize) {
 +        goto error;
 +    }
 +
 +    /*
 +     * Calculate the transaction size
 +     *
 +     * size field is base 2 logarithm of DMA transaction size,
 +     * but there is an upper limit of 64 bytes per transaction.
 +     */
 +    size = wsize;
 +    if (size > 6) {
 +        size = 6;
 +    }
 +    size = 1 << size;
 +
 +    /* the bytes to transfer should be multiple of transaction size */
 +    if (bytes % size) {
 +        goto error;
 +    }
 +
 +    /* indicate a DMA transfer is started */
 +    s->chan[ch].state = DMA_CHAN_STATE_STARTED;
 +    s->chan[ch].control &= ~CONTROL_DONE;
 +    s->chan[ch].control &= ~CONTROL_ERR;
 +
 +    /* load the next_ registers into their exec_ counterparts */
 +    s->chan[ch].exec_config = config;
 +    s->chan[ch].exec_bytes = bytes;
 +    s->chan[ch].exec_dst = dst;
 +    s->chan[ch].exec_src = src;
 +
 +    for (n = 0; n < bytes / size; n++) {
 +        cpu_physical_memory_read(s->chan[ch].exec_src, buf, size);
 +        cpu_physical_memory_write(s->chan[ch].exec_dst, buf, size);
 +        s->chan[ch].exec_src += size;
 +        s->chan[ch].exec_dst += size;
 +        s->chan[ch].exec_bytes -= size;
 +    }
 +
 +    /* indicate a DMA transfer is done */
 +    s->chan[ch].state = DMA_CHAN_STATE_DONE;
 +    s->chan[ch].control &= ~CONTROL_RUN;
 +    s->chan[ch].control |= CONTROL_DONE;
 +
 +    /* reload exec_ registers if repeat is required */
 +    if (s->chan[ch].next_config & CONFIG_REPEAT) {
 +        s->chan[ch].exec_bytes = bytes;
 +        s->chan[ch].exec_dst = dst;
 +        s->chan[ch].exec_src = src;
 +    }
 +
 +    return;
 +
 +error:
 +    s->chan[ch].state = DMA_CHAN_STATE_ERROR;
 +    s->chan[ch].control |= CONTROL_ERR;
 +    return;
 +}
 +
-+static inline void sifive_pdma_update_irq(SiFivePDMAState *s, int ch)
++static uint32_t fsgnj32(uint32_t a, uint32_t b, float_status *s)
 +{
-+    bool done_ie, err_ie;
++    return deposit64(b, 0, 31, a);
 +
 +    done_ie = !!(s->chan[ch].control & CONTROL_DONE_IE);
 +    err_ie = !!(s->chan[ch].control & CONTROL_ERR_IE);
 +
 +    if (done_ie && (s->chan[ch].control & CONTROL_DONE)) {
 +        qemu_irq_raise(s->irq[ch * 2]);
 +    } else {
 +        qemu_irq_lower(s->irq[ch * 2]);
 +    }
 +
 +    if (err_ie && (s->chan[ch].control & CONTROL_ERR)) {
 +        qemu_irq_raise(s->irq[ch * 2 + 1]);
 +    } else {
 +        qemu_irq_lower(s->irq[ch * 2 + 1]);
 +    }
 +
 +    s->chan[ch].state = DMA_CHAN_STATE_IDLE;
 +}
 +
-+static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
++static uint64_t fsgnj64(uint64_t a, uint64_t b, float_status *s)
 +{
-+    SiFivePDMAState *s = opaque;
++    return deposit64(b, 0, 63, a);
 +    int ch = SIFIVE_PDMA_CHAN_NO(offset);
 +    uint64_t val = 0;
 +
 +    if (ch >= SIFIVE_PDMA_CHANS) {
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
 +                      __func__, ch);
 +        return 0;
 +    }
 +
 +    offset &= 0xfff;
 +    switch (offset) {
 +    case DMA_CONTROL:
 +        val = s->chan[ch].control;
 +        break;
 +    case DMA_NEXT_CONFIG:
 +        val = s->chan[ch].next_config;
 +        break;
 +    case DMA_NEXT_BYTES:
 +        val = s->chan[ch].next_bytes;
 +        break;
 +    case DMA_NEXT_DST:
 +        val = s->chan[ch].next_dst;
 +        break;
 +    case DMA_NEXT_SRC:
 +        val = s->chan[ch].next_src;
 +        break;
 +    case DMA_EXEC_CONFIG:
 +        val = s->chan[ch].exec_config;
 +        break;
 +    case DMA_EXEC_BYTES:
 +        val = s->chan[ch].exec_bytes;
 +        break;
 +    case DMA_EXEC_DST:
 +        val = s->chan[ch].exec_dst;
 +        break;
 +    case DMA_EXEC_SRC:
 +        val = s->chan[ch].exec_src;
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
 +                      __func__, offset);
 +        break;
 +    }
 +
 +    return val;
 +}
 +
-+static void sifive_pdma_write(void *opaque, hwaddr offset,
++RVVCALL(OPFVV2, vfsgnj_vv_h, OP_UUU_H, H2, H2, H2, fsgnj16)
-+                              uint64_t value, unsigned size)
++RVVCALL(OPFVV2, vfsgnj_vv_w, OP_UUU_W, H4, H4, H4, fsgnj32)
 +RVVCALL(OPFVV2, vfsgnj_vv_d, OP_UUU_D, H8, H8, H8, fsgnj64)
 +GEN_VEXT_VV_ENV(vfsgnj_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfsgnj_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfsgnj_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsgnj_vf_h, OP_UUU_H, H2, H2, fsgnj16)
 +RVVCALL(OPFVF2, vfsgnj_vf_w, OP_UUU_W, H4, H4, fsgnj32)
 +RVVCALL(OPFVF2, vfsgnj_vf_d, OP_UUU_D, H8, H8, fsgnj64)
 +GEN_VEXT_VF(vfsgnj_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsgnj_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsgnj_vf_d, 8, 8, clearq)
 +
 +static uint16_t fsgnjn16(uint16_t a, uint16_t b, float_status *s)
 +{
-+    SiFivePDMAState *s = opaque;
++    return deposit64(~b, 0, 15, a);
 +    int ch = SIFIVE_PDMA_CHAN_NO(offset);
 +
 +    if (ch >= SIFIVE_PDMA_CHANS) {
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
 +                      __func__, ch);
 +        return;
 +    }
 +
 +    offset &= 0xfff;
 +    switch (offset) {
 +    case DMA_CONTROL:
 +        s->chan[ch].control = value;
 +
 +        if (value & CONTROL_RUN) {
 +            sifive_pdma_run(s, ch);
 +        }
 +
 +        sifive_pdma_update_irq(s, ch);
 +        break;
 +    case DMA_NEXT_CONFIG:
 +        s->chan[ch].next_config = value;
 +        break;
 +    case DMA_NEXT_BYTES:
 +        s->chan[ch].next_bytes = value;
 +        break;
 +    case DMA_NEXT_DST:
 +        s->chan[ch].next_dst = value;
 +        break;
 +    case DMA_NEXT_SRC:
 +        s->chan[ch].next_src = value;
 +        break;
 +    case DMA_EXEC_CONFIG:
 +    case DMA_EXEC_BYTES:
 +    case DMA_EXEC_DST:
 +    case DMA_EXEC_SRC:
 +        /* these are read-only registers */
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
 +                      __func__, offset);
 +        break;
 +    }
 +}
 +
-+static const MemoryRegionOps sifive_pdma_ops = {
++static uint32_t fsgnjn32(uint32_t a, uint32_t b, float_status *s)
 +    .read = sifive_pdma_read,
 +    .write = sifive_pdma_write,
 +    .endianness = DEVICE_LITTLE_ENDIAN,
 +    /* there are 32-bit and 64-bit wide registers */
 +    .impl = {
 +        .min_access_size = 4,
 +        .max_access_size = 8,
 +    }
 +};
 +
 +static void sifive_pdma_realize(DeviceState *dev, Error **errp)
 +{
-+    SiFivePDMAState *s = SIFIVE_PDMA(dev);
++    return deposit64(~b, 0, 31, a);
 +    int i;
 +
 +    memory_region_init_io(&s->iomem, OBJECT(dev), &sifive_pdma_ops, s,
 +                          TYPE_SIFIVE_PDMA, SIFIVE_PDMA_REG_SIZE);
 +    sysbus_init_mmio(SYS_BUS_DEVICE(dev), &s->iomem);
 +
 +    for (i = 0; i < SIFIVE_PDMA_IRQS; i++) {
 +        sysbus_init_irq(SYS_BUS_DEVICE(dev), &s->irq[i]);
 +    }
 +}
 +
-+static void sifive_pdma_class_init(ObjectClass *klass, void *data)
++static uint64_t fsgnjn64(uint64_t a, uint64_t b, float_status *s)
 +{
-+    DeviceClass *dc = DEVICE_CLASS(klass);
++    return deposit64(~b, 0, 63, a);
 +
 +    dc->desc = "SiFive Platform DMA controller";
 +    dc->realize = sifive_pdma_realize;
 +}
 +
-+static const TypeInfo sifive_pdma_info = {
++RVVCALL(OPFVV2, vfsgnjn_vv_h, OP_UUU_H, H2, H2, H2, fsgnjn16)
-+    .name          = TYPE_SIFIVE_PDMA,
++RVVCALL(OPFVV2, vfsgnjn_vv_w, OP_UUU_W, H4, H4, H4, fsgnjn32)
-+    .parent        = TYPE_SYS_BUS_DEVICE,
++RVVCALL(OPFVV2, vfsgnjn_vv_d, OP_UUU_D, H8, H8, H8, fsgnjn64)
-+    .instance_size = sizeof(SiFivePDMAState),
++GEN_VEXT_VV_ENV(vfsgnjn_vv_h, 2, 2, clearh)
-+    .class_init    = sifive_pdma_class_init,
++GEN_VEXT_VV_ENV(vfsgnjn_vv_w, 4, 4, clearl)
-+};
++GEN_VEXT_VV_ENV(vfsgnjn_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsgnjn_vf_h, OP_UUU_H, H2, H2, fsgnjn16)
 +RVVCALL(OPFVF2, vfsgnjn_vf_w, OP_UUU_W, H4, H4, fsgnjn32)
 +RVVCALL(OPFVF2, vfsgnjn_vf_d, OP_UUU_D, H8, H8, fsgnjn64)
 +GEN_VEXT_VF(vfsgnjn_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsgnjn_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsgnjn_vf_d, 8, 8, clearq)
 +
-+static void sifive_pdma_register_types(void)
++static uint16_t fsgnjx16(uint16_t a, uint16_t b, float_status *s)
 +{
-+    type_register_static(&sifive_pdma_info);
++    return deposit64(b ^ a, 0, 15, a);
 +}
 +
-+type_init(sifive_pdma_register_types)
++static uint32_t fsgnjx32(uint32_t a, uint32_t b, float_status *s)
-diff --git a/hw/dma/Kconfig b/hw/dma/Kconfig
++{
-index XXXXXXX..XXXXXXX 100644
++    return deposit64(b ^ a, 0, 31, a);
---- a/hw/dma/Kconfig
++}
 +++ b/hw/dma/Kconfig
@@ -XXX,XX +XXX,XX @@ config ZYNQ_DEVCFG
  config STP2000
      bool
 +
-+config SIFIVE_PDMA
++static uint64_t fsgnjx64(uint64_t a, uint64_t b, float_status *s)
-+    bool
++{
-diff --git a/hw/dma/meson.build b/hw/dma/meson.build
++    return deposit64(b ^ a, 0, 63, a);
-index XXXXXXX..XXXXXXX 100644
++}
---- a/hw/dma/meson.build
++
-+++ b/hw/dma/meson.build
++RVVCALL(OPFVV2, vfsgnjx_vv_h, OP_UUU_H, H2, H2, H2, fsgnjx16)
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP_ARM', if_true: files('xlnx-zdma.c'))
++RVVCALL(OPFVV2, vfsgnjx_vv_w, OP_UUU_W, H4, H4, H4, fsgnjx32)
- softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_dma.c', 'soc_dma.c'))
++RVVCALL(OPFVV2, vfsgnjx_vv_d, OP_UUU_D, H8, H8, H8, fsgnjx64)
- softmmu_ss.add(when: 'CONFIG_PXA2XX', if_true: files('pxa2xx_dma.c'))
++GEN_VEXT_VV_ENV(vfsgnjx_vv_h, 2, 2, clearh)
- softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_dma.c'))
++GEN_VEXT_VV_ENV(vfsgnjx_vv_w, 4, 4, clearl)
-+softmmu_ss.add(when: 'CONFIG_SIFIVE_PDMA', if_true: files('sifive_pdma.c'))
++GEN_VEXT_VV_ENV(vfsgnjx_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsgnjx_vf_h, OP_UUU_H, H2, H2, fsgnjx16)
 +RVVCALL(OPFVF2, vfsgnjx_vf_w, OP_UUU_W, H4, H4, fsgnjx32)
 +RVVCALL(OPFVF2, vfsgnjx_vf_d, OP_UUU_D, H8, H8, fsgnjx64)
 +GEN_VEXT_VF(vfsgnjx_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsgnjx_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsgnjx_vf_d, 8, 8, clearq)
 --
-.28.0
+.27.0

-New patch
+[PULL v2 42/64] target/riscv: vector floating-point compare instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-Id: <20200701152549.1218-40-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  37 +++++
+ target/riscv/insn32.decode              |  12 ++
+ target/riscv/insn_trans/trans_rvv.inc.c |  35 +++++
+ target/riscv/vector_helper.c            | 174 ++++++++++++++++++++++++
+files changed, 258 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfsgnjn_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfsgnjx_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfsgnjx_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfsgnjx_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++
++DEF_HELPER_6(vmfeq_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfeq_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfeq_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfne_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfne_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfne_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmflt_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmflt_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmflt_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfle_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfle_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfle_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmfeq_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfeq_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfeq_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfne_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfne_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfne_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmflt_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmflt_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmflt_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfle_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfle_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfle_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfgt_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfgt_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfgt_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfge_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfge_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmfge_vf_d, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmford_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmford_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmford_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmford_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmford_vf_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vfsgnjn_vv      001001 . ..... ..... 001 ..... 1010111 @r_vm
+ vfsgnjn_vf      001001 . ..... ..... 101 ..... 1010111 @r_vm
+ vfsgnjx_vv      001010 . ..... ..... 001 ..... 1010111 @r_vm
+ vfsgnjx_vf      001010 . ..... ..... 101 ..... 1010111 @r_vm
++vmfeq_vv        011000 . ..... ..... 001 ..... 1010111 @r_vm
++vmfeq_vf        011000 . ..... ..... 101 ..... 1010111 @r_vm
++vmfne_vv        011100 . ..... ..... 001 ..... 1010111 @r_vm
++vmfne_vf        011100 . ..... ..... 101 ..... 1010111 @r_vm
++vmflt_vv        011011 . ..... ..... 001 ..... 1010111 @r_vm
++vmflt_vf        011011 . ..... ..... 101 ..... 1010111 @r_vm
++vmfle_vv        011001 . ..... ..... 001 ..... 1010111 @r_vm
++vmfle_vf        011001 . ..... ..... 101 ..... 1010111 @r_vm
++vmfgt_vf        011101 . ..... ..... 101 ..... 1010111 @r_vm
++vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
++vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
++vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfsgnjx_vv, opfvv_check)
+ GEN_OPFVF_TRANS(vfsgnj_vf, opfvf_check)
+ GEN_OPFVF_TRANS(vfsgnjn_vf, opfvf_check)
+ GEN_OPFVF_TRANS(vfsgnjx_vf, opfvf_check)
++
++/* Vector Floating-Point Compare Instructions */
++static bool opfvv_cmp_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_reg(s, a->rs2, false) &&
++            vext_check_reg(s, a->rs1, false) &&
++            (s->sew != 0) &&
++            ((vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
++              vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul)) ||
++             (s->lmul == 0)));
++}
++
++GEN_OPFVV_TRANS(vmfeq_vv, opfvv_cmp_check)
++GEN_OPFVV_TRANS(vmfne_vv, opfvv_cmp_check)
++GEN_OPFVV_TRANS(vmflt_vv, opfvv_cmp_check)
++GEN_OPFVV_TRANS(vmfle_vv, opfvv_cmp_check)
++GEN_OPFVV_TRANS(vmford_vv, opfvv_cmp_check)
++
++static bool opfvf_cmp_check(DisasContext *s, arg_rmrr *a)
++{
++    return (vext_check_isa_ill(s) &&
++            vext_check_reg(s, a->rs2, false) &&
++            (s->sew != 0) &&
++            (vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul) ||
++             (s->lmul == 0)));
++}
++
++GEN_OPFVF_TRANS(vmfeq_vf, opfvf_cmp_check)
++GEN_OPFVF_TRANS(vmfne_vf, opfvf_cmp_check)
++GEN_OPFVF_TRANS(vmflt_vf, opfvf_cmp_check)
++GEN_OPFVF_TRANS(vmfle_vf, opfvf_cmp_check)
++GEN_OPFVF_TRANS(vmfgt_vf, opfvf_cmp_check)
++GEN_OPFVF_TRANS(vmfge_vf, opfvf_cmp_check)
++GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfsgnjx_vf_d, OP_UUU_D, H8, H8, fsgnjx64)
+ GEN_VEXT_VF(vfsgnjx_vf_h, 2, 2, clearh)
+ GEN_VEXT_VF(vfsgnjx_vf_w, 4, 4, clearl)
+ GEN_VEXT_VF(vfsgnjx_vf_d, 8, 8, clearq)
++
++/* Vector Floating-Point Compare Instructions */
++#define GEN_VEXT_CMP_VV_ENV(NAME, ETYPE, H, DO_OP)            \
++void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
++                  CPURISCVState *env, uint32_t desc)          \
++{                                                             \
++    uint32_t mlen = vext_mlen(desc);                          \
++    uint32_t vm = vext_vm(desc);                              \
++    uint32_t vl = env->vl;                                    \
++    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
++    uint32_t i;                                               \
++                                                              \
++    for (i = 0; i < vl; i++) {                                \
++        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
++        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {            \
++            continue;                                         \
++        }                                                     \
++        vext_set_elem_mask(vd, mlen, i,                       \
++                           DO_OP(s2, s1, &env->fp_status));   \
++    }                                                         \
++    for (; i < vlmax; i++) {                                  \
++        vext_set_elem_mask(vd, mlen, i, 0);                   \
++    }                                                         \
++}
++
++static bool float16_eq_quiet(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare_quiet(a, b, s);
++    return compare == float_relation_equal;
++}
++
++GEN_VEXT_CMP_VV_ENV(vmfeq_vv_h, uint16_t, H2, float16_eq_quiet)
++GEN_VEXT_CMP_VV_ENV(vmfeq_vv_w, uint32_t, H4, float32_eq_quiet)
++GEN_VEXT_CMP_VV_ENV(vmfeq_vv_d, uint64_t, H8, float64_eq_quiet)
++
++#define GEN_VEXT_CMP_VF(NAME, ETYPE, H, DO_OP)                      \
++void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2,       \
++                  CPURISCVState *env, uint32_t desc)                \
++{                                                                   \
++    uint32_t mlen = vext_mlen(desc);                                \
++    uint32_t vm = vext_vm(desc);                                    \
++    uint32_t vl = env->vl;                                          \
++    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);              \
++    uint32_t i;                                                     \
++                                                                    \
++    for (i = 0; i < vl; i++) {                                      \
++        ETYPE s2 = *((ETYPE *)vs2 + H(i));                          \
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {                  \
++            continue;                                               \
++        }                                                           \
++        vext_set_elem_mask(vd, mlen, i,                             \
++                           DO_OP(s2, (ETYPE)s1, &env->fp_status));  \
++    }                                                               \
++    for (; i < vlmax; i++) {                                        \
++        vext_set_elem_mask(vd, mlen, i, 0);                         \
++    }                                                               \
++}
++
++GEN_VEXT_CMP_VF(vmfeq_vf_h, uint16_t, H2, float16_eq_quiet)
++GEN_VEXT_CMP_VF(vmfeq_vf_w, uint32_t, H4, float32_eq_quiet)
++GEN_VEXT_CMP_VF(vmfeq_vf_d, uint64_t, H8, float64_eq_quiet)
++
++static bool vmfne16(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare_quiet(a, b, s);
++    return compare != float_relation_equal;
++}
++
++static bool vmfne32(uint32_t a, uint32_t b, float_status *s)
++{
++    FloatRelation compare = float32_compare_quiet(a, b, s);
++    return compare != float_relation_equal;
++}
++
++static bool vmfne64(uint64_t a, uint64_t b, float_status *s)
++{
++    FloatRelation compare = float64_compare_quiet(a, b, s);
++    return compare != float_relation_equal;
++}
++
++GEN_VEXT_CMP_VV_ENV(vmfne_vv_h, uint16_t, H2, vmfne16)
++GEN_VEXT_CMP_VV_ENV(vmfne_vv_w, uint32_t, H4, vmfne32)
++GEN_VEXT_CMP_VV_ENV(vmfne_vv_d, uint64_t, H8, vmfne64)
++GEN_VEXT_CMP_VF(vmfne_vf_h, uint16_t, H2, vmfne16)
++GEN_VEXT_CMP_VF(vmfne_vf_w, uint32_t, H4, vmfne32)
++GEN_VEXT_CMP_VF(vmfne_vf_d, uint64_t, H8, vmfne64)
++
++static bool float16_lt(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare(a, b, s);
++    return compare == float_relation_less;
++}
++
++GEN_VEXT_CMP_VV_ENV(vmflt_vv_h, uint16_t, H2, float16_lt)
++GEN_VEXT_CMP_VV_ENV(vmflt_vv_w, uint32_t, H4, float32_lt)
++GEN_VEXT_CMP_VV_ENV(vmflt_vv_d, uint64_t, H8, float64_lt)
++GEN_VEXT_CMP_VF(vmflt_vf_h, uint16_t, H2, float16_lt)
++GEN_VEXT_CMP_VF(vmflt_vf_w, uint32_t, H4, float32_lt)
++GEN_VEXT_CMP_VF(vmflt_vf_d, uint64_t, H8, float64_lt)
++
++static bool float16_le(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare(a, b, s);
++    return compare == float_relation_less ||
++           compare == float_relation_equal;
++}
++
++GEN_VEXT_CMP_VV_ENV(vmfle_vv_h, uint16_t, H2, float16_le)
++GEN_VEXT_CMP_VV_ENV(vmfle_vv_w, uint32_t, H4, float32_le)
++GEN_VEXT_CMP_VV_ENV(vmfle_vv_d, uint64_t, H8, float64_le)
++GEN_VEXT_CMP_VF(vmfle_vf_h, uint16_t, H2, float16_le)
++GEN_VEXT_CMP_VF(vmfle_vf_w, uint32_t, H4, float32_le)
++GEN_VEXT_CMP_VF(vmfle_vf_d, uint64_t, H8, float64_le)
++
++static bool vmfgt16(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare(a, b, s);
++    return compare == float_relation_greater;
++}
++
++static bool vmfgt32(uint32_t a, uint32_t b, float_status *s)
++{
++    FloatRelation compare = float32_compare(a, b, s);
++    return compare == float_relation_greater;
++}
++
++static bool vmfgt64(uint64_t a, uint64_t b, float_status *s)
++{
++    FloatRelation compare = float64_compare(a, b, s);
++    return compare == float_relation_greater;
++}
++
++GEN_VEXT_CMP_VF(vmfgt_vf_h, uint16_t, H2, vmfgt16)
++GEN_VEXT_CMP_VF(vmfgt_vf_w, uint32_t, H4, vmfgt32)
++GEN_VEXT_CMP_VF(vmfgt_vf_d, uint64_t, H8, vmfgt64)
++
++static bool vmfge16(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare(a, b, s);
++    return compare == float_relation_greater ||
++           compare == float_relation_equal;
++}
++
++static bool vmfge32(uint32_t a, uint32_t b, float_status *s)
++{
++    FloatRelation compare = float32_compare(a, b, s);
++    return compare == float_relation_greater ||
++           compare == float_relation_equal;
++}
++
++static bool vmfge64(uint64_t a, uint64_t b, float_status *s)
++{
++    FloatRelation compare = float64_compare(a, b, s);
++    return compare == float_relation_greater ||
++           compare == float_relation_equal;
++}
++
++GEN_VEXT_CMP_VF(vmfge_vf_h, uint16_t, H2, vmfge16)
++GEN_VEXT_CMP_VF(vmfge_vf_w, uint32_t, H4, vmfge32)
++GEN_VEXT_CMP_VF(vmfge_vf_d, uint64_t, H8, vmfge64)
++
++static bool float16_unordered_quiet(uint16_t a, uint16_t b, float_status *s)
++{
++    FloatRelation compare = float16_compare_quiet(a, b, s);
++    return compare == float_relation_unordered;
++}
++
++GEN_VEXT_CMP_VV_ENV(vmford_vv_h, uint16_t, H2, !float16_unordered_quiet)
++GEN_VEXT_CMP_VV_ENV(vmford_vv_w, uint32_t, H4, !float32_unordered_quiet)
++GEN_VEXT_CMP_VV_ENV(vmford_vv_d, uint64_t, H8, !float64_unordered_quiet)
++GEN_VEXT_CMP_VF(vmford_vf_h, uint16_t, H2, !float16_unordered_quiet)
++GEN_VEXT_CMP_VF(vmford_vf_w, uint32_t, H4, !float32_unordered_quiet)
++GEN_VEXT_CMP_VF(vmford_vf_d, uint64_t, H8, !float64_unordered_quiet)
+--
+.27.0

-New patch
+[PULL v2 43/64] target/riscv: vector floating-point classify instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20200701152549.1218-41-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  4 ++
  target/riscv/internals.h                |  5 ++
  target/riscv/insn32.decode              |  1 +
  target/riscv/fpu_helper.c               | 33 +--------
  target/riscv/insn_trans/trans_rvv.inc.c |  3 +
  target/riscv/vector_helper.c            | 91 +++++++++++++++++++++++++
 files changed, 107 insertions(+), 30 deletions(-)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmford_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
  DEF_HELPER_6(vmford_vf_h, void, ptr, ptr, i64, ptr, env, i32)
  DEF_HELPER_6(vmford_vf_w, void, ptr, ptr, i64, ptr, env, i32)
  DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +
 +DEF_HELPER_5(vfclass_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfclass_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/internals.h
 +++ b/target/riscv/internals.h
@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, VM, 8, 1)
  FIELD(VDATA, LMUL, 9, 2)
  FIELD(VDATA, NF, 11, 4)
  FIELD(VDATA, WD, 11, 1)
 +
 +/* float point classify helpers */
 +target_ulong fclass_h(uint64_t frs1);
 +target_ulong fclass_s(uint64_t frs1);
 +target_ulong fclass_d(uint64_t frs1);
  #endif
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmfgt_vf        011101 . ..... ..... 101 ..... 1010111 @r_vm
  vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
  vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
  vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
 +vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/fpu_helper.c b/target/riscv/fpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/fpu_helper.c
 +++ b/target/riscv/fpu_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
  #include "fpu/softfloat.h"
 +#include "internals.h"
  target_ulong riscv_cpu_get_fflags(CPURISCVState *env)
  {
@@ -XXX,XX +XXX,XX @@ uint64_t helper_fcvt_s_lu(CPURISCVState *env, uint64_t rs1)
  target_ulong helper_fclass_s(uint64_t frs1)
  {
 -    float32 f = frs1;
 -    bool sign = float32_is_neg(f);
 -
 -    if (float32_is_infinity(f)) {
 -        return sign ? 1 << 0 : 1 << 7;
 -    } else if (float32_is_zero(f)) {
 -        return sign ? 1 << 3 : 1 << 4;
 -    } else if (float32_is_zero_or_denormal(f)) {
 -        return sign ? 1 << 2 : 1 << 5;
 -    } else if (float32_is_any_nan(f)) {
 -        float_status s = { }; /* for snan_bit_is_one */
 -        return float32_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 -    } else {
 -        return sign ? 1 << 1 : 1 << 6;
 -    }
 +    return fclass_s(frs1);
  }
  uint64_t helper_fadd_d(CPURISCVState *env, uint64_t frs1, uint64_t frs2)
@@ -XXX,XX +XXX,XX @@ uint64_t helper_fcvt_d_lu(CPURISCVState *env, uint64_t rs1)
  target_ulong helper_fclass_d(uint64_t frs1)
  {
 -    float64 f = frs1;
 -    bool sign = float64_is_neg(f);
 -
 -    if (float64_is_infinity(f)) {
 -        return sign ? 1 << 0 : 1 << 7;
 -    } else if (float64_is_zero(f)) {
 -        return sign ? 1 << 3 : 1 << 4;
 -    } else if (float64_is_zero_or_denormal(f)) {
 -        return sign ? 1 << 2 : 1 << 5;
 -    } else if (float64_is_any_nan(f)) {
 -        float_status s = { }; /* for snan_bit_is_one */
 -        return float64_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 -    } else {
 -        return sign ? 1 << 1 : 1 << 6;
 -    }
 +    return fclass_d(frs1);
  }
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vmfle_vf, opfvf_cmp_check)
  GEN_OPFVF_TRANS(vmfgt_vf, opfvf_cmp_check)
  GEN_OPFVF_TRANS(vmfge_vf, opfvf_cmp_check)
  GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
 +
 +/* Vector Floating-Point Classify Instruction */
 +GEN_OPFV_TRANS(vfclass_v, opfv_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VV_ENV(vmford_vv_d, uint64_t, H8, !float64_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_h, uint16_t, H2, !float16_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_w, uint32_t, H4, !float32_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_d, uint64_t, H8, !float64_unordered_quiet)
 +
 +/* Vector Floating-Point Classify Instruction */
 +#define OPIVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
 +static void do_##NAME(void *vd, void *vs2, int i)      \
 +{                                                      \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
 +    *((TD *)vd + HD(i)) = OP(s2);                      \
 +}
 +
 +#define GEN_VEXT_V(NAME, ESZ, DSZ, CLEAR_FN)           \
 +void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
 +                  CPURISCVState *env, uint32_t desc)   \
 +{                                                      \
 +    uint32_t vlmax = vext_maxsz(desc) / ESZ;           \
 +    uint32_t mlen = vext_mlen(desc);                   \
 +    uint32_t vm = vext_vm(desc);                       \
 +    uint32_t vl = env->vl;                             \
 +    uint32_t i;                                        \
 +                                                       \
 +    for (i = 0; i < vl; i++) {                         \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {     \
 +            continue;                                  \
 +        }                                              \
 +        do_##NAME(vd, vs2, i);                         \
 +    }                                                  \
 +    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);          \
 +}
 +
 +target_ulong fclass_h(uint64_t frs1)
 +{
 +    float16 f = frs1;
 +    bool sign = float16_is_neg(f);
 +
 +    if (float16_is_infinity(f)) {
 +        return sign ? 1 << 0 : 1 << 7;
 +    } else if (float16_is_zero(f)) {
 +        return sign ? 1 << 3 : 1 << 4;
 +    } else if (float16_is_zero_or_denormal(f)) {
 +        return sign ? 1 << 2 : 1 << 5;
 +    } else if (float16_is_any_nan(f)) {
 +        float_status s = { }; /* for snan_bit_is_one */
 +        return float16_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 +    } else {
 +        return sign ? 1 << 1 : 1 << 6;
 +    }
 +}
 +
 +target_ulong fclass_s(uint64_t frs1)
 +{
 +    float32 f = frs1;
 +    bool sign = float32_is_neg(f);
 +
 +    if (float32_is_infinity(f)) {
 +        return sign ? 1 << 0 : 1 << 7;
 +    } else if (float32_is_zero(f)) {
 +        return sign ? 1 << 3 : 1 << 4;
 +    } else if (float32_is_zero_or_denormal(f)) {
 +        return sign ? 1 << 2 : 1 << 5;
 +    } else if (float32_is_any_nan(f)) {
 +        float_status s = { }; /* for snan_bit_is_one */
 +        return float32_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 +    } else {
 +        return sign ? 1 << 1 : 1 << 6;
 +    }
 +}
 +
 +target_ulong fclass_d(uint64_t frs1)
 +{
 +    float64 f = frs1;
 +    bool sign = float64_is_neg(f);
 +
 +    if (float64_is_infinity(f)) {
 +        return sign ? 1 << 0 : 1 << 7;
 +    } else if (float64_is_zero(f)) {
 +        return sign ? 1 << 3 : 1 << 4;
 +    } else if (float64_is_zero_or_denormal(f)) {
 +        return sign ? 1 << 2 : 1 << 5;
 +    } else if (float64_is_any_nan(f)) {
 +        float_status s = { }; /* for snan_bit_is_one */
 +        return float64_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 +    } else {
 +        return sign ? 1 << 1 : 1 << 6;
 +    }
 +}
 +
 +RVVCALL(OPIVV1, vfclass_v_h, OP_UU_H, H2, H2, fclass_h)
 +RVVCALL(OPIVV1, vfclass_v_w, OP_UU_W, H4, H4, fclass_s)
 +RVVCALL(OPIVV1, vfclass_v_d, OP_UU_D, H8, H8, fclass_d)
 +GEN_VEXT_V(vfclass_v_h, 2, 2, clearh)
 +GEN_VEXT_V(vfclass_v_w, 4, 4, clearl)
 +GEN_VEXT_V(vfclass_v_d, 8, 8, clearq)
 --
 .27.0

-New patch
+[PULL v2 44/64] target/riscv: vector floating-point merge instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-Id: <20200701152549.1218-42-zhiwei_liu@c-sky.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/helper.h                   |  4 +++
+ target/riscv/insn32.decode              |  2 ++
+ target/riscv/insn_trans/trans_rvv.inc.c | 38 +++++++++++++++++++++++++
+ target/riscv/vector_helper.c            | 24 ++++++++++++++++
+files changed, 68 insertions(+)
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_5(vfclass_v_h, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_5(vfclass_v_w, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
++
++DEF_HELPER_6(vfmerge_vfm_h, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmerge_vfm_w, void, ptr, ptr, i64, ptr, env, i32)
++DEF_HELPER_6(vfmerge_vfm_d, void, ptr, ptr, i64, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
+ vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
+ vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
+ vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
++vfmerge_vfm     010111 0 ..... ..... 101 ..... 1010111 @r_vm_0
++vfmv_v_f        010111 1 00000 ..... 101 ..... 1010111 @r2
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
+ /* Vector Floating-Point Classify Instruction */
+ GEN_OPFV_TRANS(vfclass_v, opfv_check)
++
++/* Vector Floating-Point Merge Instruction */
++GEN_OPFVF_TRANS(vfmerge_vfm,  opfvf_check)
++
++static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
++{
++    if (vext_check_isa_ill(s) &&
++        vext_check_reg(s, a->rd, false) &&
++        (s->sew != 0)) {
++
++        if (s->vl_eq_vlmax) {
++            tcg_gen_gvec_dup_i64(s->sew, vreg_ofs(s, a->rd),
++                                 MAXSZ(s), MAXSZ(s), cpu_fpr[a->rs1]);
++        } else {
++            TCGv_ptr dest;
++            TCGv_i32 desc;
++            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
++            static gen_helper_vmv_vx * const fns[3] = {
++                gen_helper_vmv_v_x_h,
++                gen_helper_vmv_v_x_w,
++                gen_helper_vmv_v_x_d,
++            };
++            TCGLabel *over = gen_new_label();
++            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++
++            dest = tcg_temp_new_ptr();
++            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
++            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
++            fns[s->sew - 1](dest, cpu_fpr[a->rs1], cpu_env, desc);
++
++            tcg_temp_free_ptr(dest);
++            tcg_temp_free_i32(desc);
++            gen_set_label(over);
++        }
++        return true;
++    }
++    return false;
++}
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV1, vfclass_v_d, OP_UU_D, H8, H8, fclass_d)
+ GEN_VEXT_V(vfclass_v_h, 2, 2, clearh)
+ GEN_VEXT_V(vfclass_v_w, 4, 4, clearl)
+ GEN_VEXT_V(vfclass_v_d, 8, 8, clearq)
++
++/* Vector Floating-Point Merge Instruction */
++#define GEN_VFMERGE_VF(NAME, ETYPE, H, CLEAR_FN)              \
++void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2, \
++                  CPURISCVState *env, uint32_t desc)          \
++{                                                             \
++    uint32_t mlen = vext_mlen(desc);                          \
++    uint32_t vm = vext_vm(desc);                              \
++    uint32_t vl = env->vl;                                    \
++    uint32_t esz = sizeof(ETYPE);                             \
++    uint32_t vlmax = vext_maxsz(desc) / esz;                  \
++    uint32_t i;                                               \
++                                                              \
++    for (i = 0; i < vl; i++) {                                \
++        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
++        *((ETYPE *)vd + H(i))                                 \
++          = (!vm && !vext_elem_mask(v0, mlen, i) ? s2 : s1);  \
++    }                                                         \
++    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                  \
++}
++
++GEN_VFMERGE_VF(vfmerge_vfm_h, int16_t, H2, clearh)
++GEN_VFMERGE_VF(vfmerge_vfm_w, int32_t, H4, clearl)
++GEN_VFMERGE_VF(vfmerge_vfm_d, int64_t, H8, clearq)
+--
+.27.0

-[PULL 30/30] hw/riscv: Sort the Kconfig options in alphabetical order
+[PULL v2 45/64] target/riscv: vector floating-point/integer type-convert instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-At present the Kconfig file is in disorder. Let's sort the options.
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-13-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-43-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/Kconfig | 58 ++++++++++++++++++++++++------------------------
+ target/riscv/helper.h                   | 13 ++++++++++
-file changed, 29 insertions(+), 29 deletions(-)
+ target/riscv/insn32.decode              |  4 +++
  target/riscv/insn_trans/trans_rvv.inc.c |  6 +++++
  target/riscv/vector_helper.c            | 33 +++++++++++++++++++++++++
 files changed, 56 insertions(+)
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/Kconfig
+--- a/target/riscv/helper.h
-+++ b/hw/riscv/Kconfig
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
- config IBEX
+ DEF_HELPER_6(vfmerge_vfm_h, void, ptr, ptr, i64, ptr, env, i32)
-     bool
+ DEF_HELPER_6(vfmerge_vfm_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_6(vfmerge_vfm_d, void, ptr, ptr, i64, ptr, env, i32)
 -config SIFIVE_E
 -    bool
 -    select MSI_NONBROKEN
 -    select SIFIVE_CLINT
 -    select SIFIVE_GPIO
 -    select SIFIVE_PLIC
 -    select SIFIVE_UART
 -    select SIFIVE_E_PRCI
 -    select UNIMP
 -
 -config SIFIVE_U
 +config MICROCHIP_PFSOC
      bool
 -    select CADENCE
 +    select CADENCE_SDHCI
 +    select MCHP_PFSOC_MMUART
      select MSI_NONBROKEN
      select SIFIVE_CLINT
 -    select SIFIVE_GPIO
      select SIFIVE_PDMA
      select SIFIVE_PLIC
 -    select SIFIVE_UART
 -    select SIFIVE_U_OTP
 -    select SIFIVE_U_PRCI
      select UNIMP
 -config SPIKE
 -    bool
 -    select HTIF
 -    select MSI_NONBROKEN
 -    select SIFIVE_CLINT
 -    select SIFIVE_PLIC
 -
  config OPENTITAN
      bool
      select IBEX
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
      bool
      imply PCI_DEVICES
      imply TEST_DEVICES
 +    select GOLDFISH_RTC
      select MSI_NONBROKEN
      select PCI
 -    select SERIAL
 -    select GOLDFISH_RTC
 -    select VIRTIO_MMIO
      select PCI_EXPRESS_GENERIC_BRIDGE
      select PFLASH_CFI01
 +    select SERIAL
      select SIFIVE_CLINT
      select SIFIVE_PLIC
      select SIFIVE_TEST
 +    select VIRTIO_MMIO
 -config MICROCHIP_PFSOC
 +config SIFIVE_E
      bool
      select MSI_NONBROKEN
      select SIFIVE_CLINT
 +    select SIFIVE_GPIO
 +    select SIFIVE_PLIC
 +    select SIFIVE_UART
 +    select SIFIVE_E_PRCI
      select UNIMP
 -    select MCHP_PFSOC_MMUART
 +
-+config SIFIVE_U
++DEF_HELPER_5(vfcvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
-+    bool
++DEF_HELPER_5(vfcvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
-+    select CADENCE
++DEF_HELPER_5(vfcvt_xu_f_v_d, void, ptr, ptr, ptr, env, i32)
-+    select MSI_NONBROKEN
++DEF_HELPER_5(vfcvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
-+    select SIFIVE_CLINT
++DEF_HELPER_5(vfcvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
-+    select SIFIVE_GPIO
++DEF_HELPER_5(vfcvt_x_f_v_d, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_PDMA
++DEF_HELPER_5(vfcvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_PLIC
++DEF_HELPER_5(vfcvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
--    select CADENCE_SDHCI
++DEF_HELPER_5(vfcvt_f_xu_v_d, void, ptr, ptr, ptr, env, i32)
-+    select SIFIVE_UART
++DEF_HELPER_5(vfcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-+    select SIFIVE_U_OTP
++DEF_HELPER_5(vfcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
-+    select SIFIVE_U_PRCI
++DEF_HELPER_5(vfcvt_f_x_v_d, void, ptr, ptr, ptr, env, i32)
-+    select UNIMP
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
  vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
  vfmerge_vfm     010111 0 ..... ..... 101 ..... 1010111 @r_vm_0
  vfmv_v_f        010111 1 00000 ..... 101 ..... 1010111 @r2
 +vfcvt_xu_f_v    100010 . ..... 00000 001 ..... 1010111 @r2_vm
 +vfcvt_x_f_v     100010 . ..... 00001 001 ..... 1010111 @r2_vm
 +vfcvt_f_xu_v    100010 . ..... 00010 001 ..... 1010111 @r2_vm
 +vfcvt_f_x_v     100010 . ..... 00011 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
      }
      return false;
  }
 +
-+config SPIKE
++/* Single-Width Floating-Point/Integer Type-Convert Instructions */
-+    bool
++GEN_OPFV_TRANS(vfcvt_xu_f_v, opfv_check)
-+    select HTIF
++GEN_OPFV_TRANS(vfcvt_x_f_v, opfv_check)
-+    select MSI_NONBROKEN
++GEN_OPFV_TRANS(vfcvt_f_xu_v, opfv_check)
-+    select SIFIVE_CLINT
++GEN_OPFV_TRANS(vfcvt_f_x_v, opfv_check)
-+    select SIFIVE_PLIC
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2, \
  GEN_VFMERGE_VF(vfmerge_vfm_h, int16_t, H2, clearh)
  GEN_VFMERGE_VF(vfmerge_vfm_w, int32_t, H4, clearl)
  GEN_VFMERGE_VF(vfmerge_vfm_d, int64_t, H8, clearq)
 +
 +/* Single-Width Floating-Point/Integer Type-Convert Instructions */
 +/* vfcvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. */
 +RVVCALL(OPFVV1, vfcvt_xu_f_v_h, OP_UU_H, H2, H2, float16_to_uint16)
 +RVVCALL(OPFVV1, vfcvt_xu_f_v_w, OP_UU_W, H4, H4, float32_to_uint32)
 +RVVCALL(OPFVV1, vfcvt_xu_f_v_d, OP_UU_D, H8, H8, float64_to_uint64)
 +GEN_VEXT_V_ENV(vfcvt_xu_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfcvt_xu_f_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfcvt_xu_f_v_d, 8, 8, clearq)
 +
 +/* vfcvt.x.f.v vd, vs2, vm # Convert float to signed integer. */
 +RVVCALL(OPFVV1, vfcvt_x_f_v_h, OP_UU_H, H2, H2, float16_to_int16)
 +RVVCALL(OPFVV1, vfcvt_x_f_v_w, OP_UU_W, H4, H4, float32_to_int32)
 +RVVCALL(OPFVV1, vfcvt_x_f_v_d, OP_UU_D, H8, H8, float64_to_int64)
 +GEN_VEXT_V_ENV(vfcvt_x_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfcvt_x_f_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfcvt_x_f_v_d, 8, 8, clearq)
 +
 +/* vfcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to float. */
 +RVVCALL(OPFVV1, vfcvt_f_xu_v_h, OP_UU_H, H2, H2, uint16_to_float16)
 +RVVCALL(OPFVV1, vfcvt_f_xu_v_w, OP_UU_W, H4, H4, uint32_to_float32)
 +RVVCALL(OPFVV1, vfcvt_f_xu_v_d, OP_UU_D, H8, H8, uint64_to_float64)
 +GEN_VEXT_V_ENV(vfcvt_f_xu_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfcvt_f_xu_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfcvt_f_xu_v_d, 8, 8, clearq)
 +
 +/* vfcvt.f.x.v vd, vs2, vm # Convert integer to float. */
 +RVVCALL(OPFVV1, vfcvt_f_x_v_h, OP_UU_H, H2, H2, int16_to_float16)
 +RVVCALL(OPFVV1, vfcvt_f_x_v_w, OP_UU_W, H4, H4, int32_to_float32)
 +RVVCALL(OPFVV1, vfcvt_f_x_v_d, OP_UU_D, H8, H8, int64_to_float64)
 +GEN_VEXT_V_ENV(vfcvt_f_x_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfcvt_f_x_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfcvt_f_x_v_d, 8, 8, clearq)
 --
-.28.0
+.27.0

-[PULL 29/30] hw/riscv: Drop CONFIG_SIFIVE
+[PULL v2 46/64] target/riscv: widening floating-point/integer type-convert instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-The name SIFIVE is too vague to convey the required component of
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-MSI_NONBROKEN. Let's drop the option, and select MSI_NONBROKEN in
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 each machine instead.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-12-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-44-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/Kconfig | 14 +++++---------
+ target/riscv/helper.h                   | 11 ++++++
-file changed, 5 insertions(+), 9 deletions(-)
+ target/riscv/insn32.decode              |  5 +++
  target/riscv/insn_trans/trans_rvv.inc.c | 48 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 42 ++++++++++++++++++++++
 files changed, 106 insertions(+)
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/Kconfig
+--- a/target/riscv/helper.h
-+++ b/hw/riscv/Kconfig
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfcvt_f_xu_v_d, void, ptr, ptr, ptr, env, i32)
- config IBEX
+ DEF_HELPER_5(vfcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-     bool
+ DEF_HELPER_5(vfcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_5(vfcvt_f_x_v_d, void, ptr, ptr, ptr, env, i32)
--config SIFIVE
++
--    bool
++DEF_HELPER_5(vfwcvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
--    select MSI_NONBROKEN
++DEF_HELPER_5(vfwcvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
--
++DEF_HELPER_5(vfwcvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
- config SIFIVE_E
++DEF_HELPER_5(vfwcvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
-     bool
++DEF_HELPER_5(vfwcvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
--    select SIFIVE
++DEF_HELPER_5(vfwcvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
-+    select MSI_NONBROKEN
++DEF_HELPER_5(vfwcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_CLINT
++DEF_HELPER_5(vfwcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_GPIO
++DEF_HELPER_5(vfwcvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_PLIC
++DEF_HELPER_5(vfwcvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
- config SIFIVE_U
+index XXXXXXX..XXXXXXX 100644
-     bool
+--- a/target/riscv/insn32.decode
-     select CADENCE
++++ b/target/riscv/insn32.decode
--    select SIFIVE
+@@ -XXX,XX +XXX,XX @@ vfcvt_xu_f_v    100010 . ..... 00000 001 ..... 1010111 @r2_vm
-+    select MSI_NONBROKEN
+ vfcvt_x_f_v     100010 . ..... 00001 001 ..... 1010111 @r2_vm
-     select SIFIVE_CLINT
+ vfcvt_f_xu_v    100010 . ..... 00010 001 ..... 1010111 @r2_vm
-     select SIFIVE_GPIO
+ vfcvt_f_x_v     100010 . ..... 00011 001 ..... 1010111 @r2_vm
-     select SIFIVE_PDMA
++vfwcvt_xu_f_v   100010 . ..... 01000 001 ..... 1010111 @r2_vm
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
++vfwcvt_x_f_v    100010 . ..... 01001 001 ..... 1010111 @r2_vm
- config SPIKE
++vfwcvt_f_xu_v   100010 . ..... 01010 001 ..... 1010111 @r2_vm
-     bool
++vfwcvt_f_x_v    100010 . ..... 01011 001 ..... 1010111 @r2_vm
-     select HTIF
++vfwcvt_f_f_v    100010 . ..... 01100 001 ..... 1010111 @r2_vm
--    select SIFIVE
-+    select MSI_NONBROKEN
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-     select SIFIVE_CLINT
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-     select SIFIVE_PLIC
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-     bool
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-     imply PCI_DEVICES
+@@ -XXX,XX +XXX,XX @@ GEN_OPFV_TRANS(vfcvt_xu_f_v, opfv_check)
-     imply TEST_DEVICES
+ GEN_OPFV_TRANS(vfcvt_x_f_v, opfv_check)
-+    select MSI_NONBROKEN
+ GEN_OPFV_TRANS(vfcvt_f_xu_v, opfv_check)
-     select PCI
+ GEN_OPFV_TRANS(vfcvt_f_x_v, opfv_check)
-     select SERIAL
++
-     select GOLDFISH_RTC
++/* Widening Floating-Point/Integer Type-Convert Instructions */
-     select VIRTIO_MMIO
++
-     select PCI_EXPRESS_GENERIC_BRIDGE
++/*
-     select PFLASH_CFI01
++ * If the current SEW does not correspond to a supported IEEE floating-point
--    select SIFIVE
++ * type, an illegal instruction exception is raised
-     select SIFIVE_CLINT
++ */
-     select SIFIVE_PLIC
++static bool opfv_widen_check(DisasContext *s, arg_rmr *a)
-     select SIFIVE_TEST
++{
++    return (vext_check_isa_ill(s) &&
- config MICROCHIP_PFSOC
++            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-     bool
++            vext_check_reg(s, a->rd, true) &&
--    select SIFIVE
++            vext_check_reg(s, a->rs2, false) &&
-+    select MSI_NONBROKEN
++            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
-     select SIFIVE_CLINT
++                                     1 << s->lmul) &&
-     select UNIMP
++            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-     select MCHP_PFSOC_MMUART
++}
 +
 +#define GEN_OPFV_WIDEN_TRANS(NAME)                                 \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (opfv_widen_check(s, a)) {                                  \
 +        uint32_t data = 0;                                         \
 +        static gen_helper_gvec_3_ptr * const fns[2] = {            \
 +            gen_helper_##NAME##_h,                                 \
 +            gen_helper_##NAME##_w,                                 \
 +        };                                                         \
 +        TCGLabel *over = gen_new_label();                          \
 +        gen_set_rm(s, 7);                                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew - 1]);    \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_xu_f_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_f_xu_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_f_x_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfcvt_f_x_v_d, OP_UU_D, H8, H8, int64_to_float64)
  GEN_VEXT_V_ENV(vfcvt_f_x_v_h, 2, 2, clearh)
  GEN_VEXT_V_ENV(vfcvt_f_x_v_w, 4, 4, clearl)
  GEN_VEXT_V_ENV(vfcvt_f_x_v_d, 8, 8, clearq)
 +
 +/* Widening Floating-Point/Integer Type-Convert Instructions */
 +/* (TD, T2, TX2) */
 +#define WOP_UU_H uint32_t, uint16_t, uint16_t
 +#define WOP_UU_W uint64_t, uint32_t, uint32_t
 +/* vfwcvt.xu.f.v vd, vs2, vm # Convert float to double-width unsigned integer.*/
 +RVVCALL(OPFVV1, vfwcvt_xu_f_v_h, WOP_UU_H, H4, H2, float16_to_uint32)
 +RVVCALL(OPFVV1, vfwcvt_xu_f_v_w, WOP_UU_W, H8, H4, float32_to_uint64)
 +GEN_VEXT_V_ENV(vfwcvt_xu_f_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_xu_f_v_w, 4, 8, clearq)
 +
 +/* vfwcvt.x.f.v vd, vs2, vm # Convert float to double-width signed integer. */
 +RVVCALL(OPFVV1, vfwcvt_x_f_v_h, WOP_UU_H, H4, H2, float16_to_int32)
 +RVVCALL(OPFVV1, vfwcvt_x_f_v_w, WOP_UU_W, H8, H4, float32_to_int64)
 +GEN_VEXT_V_ENV(vfwcvt_x_f_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_x_f_v_w, 4, 8, clearq)
 +
 +/* vfwcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to double-width float */
 +RVVCALL(OPFVV1, vfwcvt_f_xu_v_h, WOP_UU_H, H4, H2, uint16_to_float32)
 +RVVCALL(OPFVV1, vfwcvt_f_xu_v_w, WOP_UU_W, H8, H4, uint32_to_float64)
 +GEN_VEXT_V_ENV(vfwcvt_f_xu_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_f_xu_v_w, 4, 8, clearq)
 +
 +/* vfwcvt.f.x.v vd, vs2, vm # Convert integer to double-width float. */
 +RVVCALL(OPFVV1, vfwcvt_f_x_v_h, WOP_UU_H, H4, H2, int16_to_float32)
 +RVVCALL(OPFVV1, vfwcvt_f_x_v_w, WOP_UU_W, H8, H4, int32_to_float64)
 +GEN_VEXT_V_ENV(vfwcvt_f_x_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_f_x_v_w, 4, 8, clearq)
 +
 +/*
 + * vfwcvt.f.f.v vd, vs2, vm #
 + * Convert single-width float to double-width float.
 + */
 +static uint32_t vfwcvtffv16(uint16_t a, float_status *s)
 +{
 +    return float16_to_float32(a, true, s);
 +}
 +
 +RVVCALL(OPFVV1, vfwcvt_f_f_v_h, WOP_UU_H, H4, H2, vfwcvtffv16)
 +RVVCALL(OPFVV1, vfwcvt_f_f_v_w, WOP_UU_W, H8, H4, float32_to_float64)
 +GEN_VEXT_V_ENV(vfwcvt_f_f_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_f_f_v_w, 4, 8, clearq)
 --
-.28.0
+.27.0

-[PULL 28/30] hw/riscv: Always build riscv_hart.c
+[PULL v2 47/64] target/riscv: narrowing floating-point/integer type-convert instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Every RISC-V machine needs riscv_hart hence there is no need to
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-have a dedicated Kconfig option for it. Drop the Kconfig option
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 and always build riscv_hart.c.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-11-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-45-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/Kconfig     | 9 ---------
+ target/riscv/helper.h                   | 11 ++++++
- hw/riscv/meson.build | 2 +-
+ target/riscv/insn32.decode              |  5 +++
-files changed, 1 insertion(+), 10 deletions(-)
+ target/riscv/insn_trans/trans_rvv.inc.c | 48 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 39 ++++++++++++++++++++
 files changed, 103 insertions(+)
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/Kconfig
+--- a/target/riscv/helper.h
-+++ b/hw/riscv/Kconfig
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfwcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
--config HART
+ DEF_HELPER_5(vfwcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
--    bool
+ DEF_HELPER_5(vfwcvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
--
+ DEF_HELPER_5(vfwcvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
- config IBEX
++
-     bool
++DEF_HELPER_5(vfncvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vfncvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ config SIFIVE
++DEF_HELPER_5(vfncvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vfncvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
- config SIFIVE_E
++DEF_HELPER_5(vfncvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
-     bool
++DEF_HELPER_5(vfncvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
--    select HART
++DEF_HELPER_5(vfncvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE
++DEF_HELPER_5(vfncvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_CLINT
++DEF_HELPER_5(vfncvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
-     select SIFIVE_GPIO
++DEF_HELPER_5(vfncvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
  config SIFIVE_U
      bool
      select CADENCE
 -    select HART
      select SIFIVE
      select SIFIVE_CLINT
      select SIFIVE_GPIO
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
  config SPIKE
      bool
 -    select HART
      select HTIF
      select SIFIVE
      select SIFIVE_CLINT
@@ -XXX,XX +XXX,XX @@ config SPIKE
  config OPENTITAN
      bool
      select IBEX
 -    select HART
      select UNIMP
  config RISCV_VIRT
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
      imply PCI_DEVICES
      imply TEST_DEVICES
      select PCI
 -    select HART
      select SERIAL
      select GOLDFISH_RTC
      select VIRTIO_MMIO
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
  config MICROCHIP_PFSOC
      bool
 -    select HART
      select SIFIVE
      select SIFIVE_CLINT
      select UNIMP
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/meson.build
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/meson.build
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vfwcvt_x_f_v    100010 . ..... 01001 001 ..... 1010111 @r2_vm
- riscv_ss = ss.source_set()
+ vfwcvt_f_xu_v   100010 . ..... 01010 001 ..... 1010111 @r2_vm
- riscv_ss.add(files('boot.c'), fdt)
+ vfwcvt_f_x_v    100010 . ..... 01011 001 ..... 1010111 @r2_vm
- riscv_ss.add(files('numa.c'))
+ vfwcvt_f_f_v    100010 . ..... 01100 001 ..... 1010111 @r2_vm
--riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
++vfncvt_xu_f_v   100010 . ..... 10000 001 ..... 1010111 @r2_vm
-+riscv_ss.add(files('riscv_hart.c'))
++vfncvt_x_f_v    100010 . ..... 10001 001 ..... 1010111 @r2_vm
- riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
++vfncvt_f_xu_v   100010 . ..... 10010 001 ..... 1010111 @r2_vm
- riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
++vfncvt_f_x_v    100010 . ..... 10011 001 ..... 1010111 @r2_vm
- riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
++vfncvt_f_f_v    100010 . ..... 10100 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v)
  GEN_OPFV_WIDEN_TRANS(vfwcvt_f_xu_v)
  GEN_OPFV_WIDEN_TRANS(vfwcvt_f_x_v)
  GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v)
 +
 +/* Narrowing Floating-Point/Integer Type-Convert Instructions */
 +
 +/*
 + * If the current SEW does not correspond to a supported IEEE floating-point
 + * type, an illegal instruction exception is raised
 + */
 +static bool opfv_narrow_check(DisasContext *s, arg_rmr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
 +                                     2 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
 +}
 +
 +#define GEN_OPFV_NARROW_TRANS(NAME)                                \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (opfv_narrow_check(s, a)) {                                 \
 +        uint32_t data = 0;                                         \
 +        static gen_helper_gvec_3_ptr * const fns[2] = {            \
 +            gen_helper_##NAME##_h,                                 \
 +            gen_helper_##NAME##_w,                                 \
 +        };                                                         \
 +        TCGLabel *over = gen_new_label();                          \
 +        gen_set_rm(s, 7);                                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew - 1]);    \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_OPFV_NARROW_TRANS(vfncvt_xu_f_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_x_f_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_x_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_f_v)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfwcvt_f_f_v_h, WOP_UU_H, H4, H2, vfwcvtffv16)
  RVVCALL(OPFVV1, vfwcvt_f_f_v_w, WOP_UU_W, H8, H4, float32_to_float64)
  GEN_VEXT_V_ENV(vfwcvt_f_f_v_h, 2, 4, clearl)
  GEN_VEXT_V_ENV(vfwcvt_f_f_v_w, 4, 8, clearq)
 +
 +/* Narrowing Floating-Point/Integer Type-Convert Instructions */
 +/* (TD, T2, TX2) */
 +#define NOP_UU_H uint16_t, uint32_t, uint32_t
 +#define NOP_UU_W uint32_t, uint64_t, uint64_t
 +/* vfncvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. */
 +RVVCALL(OPFVV1, vfncvt_xu_f_v_h, NOP_UU_H, H2, H4, float32_to_uint16)
 +RVVCALL(OPFVV1, vfncvt_xu_f_v_w, NOP_UU_W, H4, H8, float64_to_uint32)
 +GEN_VEXT_V_ENV(vfncvt_xu_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_xu_f_v_w, 4, 4, clearl)
 +
 +/* vfncvt.x.f.v vd, vs2, vm # Convert double-width float to signed integer. */
 +RVVCALL(OPFVV1, vfncvt_x_f_v_h, NOP_UU_H, H2, H4, float32_to_int16)
 +RVVCALL(OPFVV1, vfncvt_x_f_v_w, NOP_UU_W, H4, H8, float64_to_int32)
 +GEN_VEXT_V_ENV(vfncvt_x_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_x_f_v_w, 4, 4, clearl)
 +
 +/* vfncvt.f.xu.v vd, vs2, vm # Convert double-width unsigned integer to float */
 +RVVCALL(OPFVV1, vfncvt_f_xu_v_h, NOP_UU_H, H2, H4, uint32_to_float16)
 +RVVCALL(OPFVV1, vfncvt_f_xu_v_w, NOP_UU_W, H4, H8, uint64_to_float32)
 +GEN_VEXT_V_ENV(vfncvt_f_xu_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_f_xu_v_w, 4, 4, clearl)
 +
 +/* vfncvt.f.x.v vd, vs2, vm # Convert double-width integer to float. */
 +RVVCALL(OPFVV1, vfncvt_f_x_v_h, NOP_UU_H, H2, H4, int32_to_float16)
 +RVVCALL(OPFVV1, vfncvt_f_x_v_w, NOP_UU_W, H4, H8, int64_to_float32)
 +GEN_VEXT_V_ENV(vfncvt_f_x_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_f_x_v_w, 4, 4, clearl)
 +
 +/* vfncvt.f.f.v vd, vs2, vm # Convert double float to single-width float. */
 +static uint16_t vfncvtffv16(uint32_t a, float_status *s)
 +{
 +    return float32_to_float16(a, true, s);
 +}
 +
 +RVVCALL(OPFVV1, vfncvt_f_f_v_h, NOP_UU_H, H2, H4, vfncvtffv16)
 +RVVCALL(OPFVV1, vfncvt_f_f_v_w, NOP_UU_W, H4, H8, float64_to_float32)
 +GEN_VEXT_V_ENV(vfncvt_f_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_f_f_v_w, 4, 4, clearl)
 --
-.28.0
+.27.0

-[PULL 27/30] hw/riscv: Move sifive_test model to hw/misc
+[PULL v2 48/64] target/riscv: vector single-width integer reduction instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 codes. Let's move sifive_test model to hw/misc directory.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-10-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-46-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => misc}/sifive_test.h | 0
+ target/riscv/helper.h                   | 33 +++++++++++
- hw/{riscv => misc}/sifive_test.c         | 2 +-
+ target/riscv/insn32.decode              |  8 +++
- hw/riscv/virt.c                          | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c | 18 ++++++
- hw/misc/Kconfig                          | 3 +++
+ target/riscv/vector_helper.c            | 74 +++++++++++++++++++++++++
- hw/misc/meson.build                      | 1 +
+files changed, 133 insertions(+)
  hw/riscv/Kconfig                         | 1 +
  hw/riscv/meson.build                     | 1 -
 files changed, 7 insertions(+), 3 deletions(-)
  rename include/hw/{riscv => misc}/sifive_test.h (100%)
  rename hw/{riscv => misc}/sifive_test.c (98%)
-diff --git a/include/hw/riscv/sifive_test.h b/include/hw/misc/sifive_test.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/sifive_test.h
 rename to include/hw/misc/sifive_test.h
 diff --git a/hw/riscv/sifive_test.c b/hw/misc/sifive_test.c
 similarity index 98%
 rename from hw/riscv/sifive_test.c
 rename to hw/misc/sifive_test.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_test.c
+--- a/target/riscv/helper.h
-+++ b/hw/misc/sifive_test.c
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfncvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
- #include "qemu/module.h"
+ DEF_HELPER_5(vfncvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
- #include "sysemu/runstate.h"
+ DEF_HELPER_5(vfncvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
- #include "hw/hw.h"
+ DEF_HELPER_5(vfncvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_test.h"
++
-+#include "hw/misc/sifive_test.h"
++DEF_HELPER_6(vredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- static uint64_t sifive_test_read(void *opaque, hwaddr addr, unsigned int size)
++DEF_HELPER_6(vredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- {
++DEF_HELPER_6(vredsum_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
++DEF_HELPER_6(vredmaxu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmaxu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmaxu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmaxu_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/virt.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/virt.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vfncvt_x_f_v    100010 . ..... 10001 001 ..... 1010111 @r2_vm
- #include "hw/char/serial.h"
+ vfncvt_f_xu_v   100010 . ..... 10010 001 ..... 1010111 @r2_vm
- #include "target/riscv/cpu.h"
+ vfncvt_f_x_v    100010 . ..... 10011 001 ..... 1010111 @r2_vm
- #include "hw/riscv/riscv_hart.h"
+ vfncvt_f_f_v    100010 . ..... 10100 001 ..... 1010111 @r2_vm
--#include "hw/riscv/sifive_test.h"
++vredsum_vs      000000 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/riscv/virt.h"
++vredand_vs      000001 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/riscv/boot.h"
++vredor_vs       000010 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/riscv/numa.h"
++vredxor_vs      000011 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/intc/sifive_clint.h"
++vredminu_vs     000100 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/intc/sifive_plic.h"
++vredmin_vs      000101 . ..... ..... 010 ..... 1010111 @r_vm
-+#include "hw/misc/sifive_test.h"
++vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
- #include "chardev/char.h"
++vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
- #include "sysemu/arch_init.h"
- #include "sysemu/device_tree.h"
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/Kconfig
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/misc/Kconfig
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ config MAC_VIA
+@@ -XXX,XX +XXX,XX @@ GEN_OPFV_NARROW_TRANS(vfncvt_x_f_v)
- config AVR_POWER
+ GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_v)
-     bool
+ GEN_OPFV_NARROW_TRANS(vfncvt_f_x_v)
+ GEN_OPFV_NARROW_TRANS(vfncvt_f_f_v)
 +config SIFIVE_TEST
 +    bool
 +
- config SIFIVE_E_PRCI
++/*
-     bool
++ *** Vector Reduction Operations
++ */
-diff --git a/hw/misc/meson.build b/hw/misc/meson.build
++/* Vector Single-Width Integer Reduction Instructions */
 +static bool reduction_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return vext_check_isa_ill(s) && vext_check_reg(s, a->rs2, false);
 +}
 +
 +GEN_OPIVV_TRANS(vredsum_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredmaxu_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredmax_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredminu_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredmin_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredand_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredor_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/meson.build
+--- a/target/riscv/vector_helper.c
-+++ b/hw/misc/meson.build
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_ARM11SCU', if_true: files('arm11scu.c'))
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfncvt_f_f_v_h, NOP_UU_H, H2, H4, vfncvtffv16)
- softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
+ RVVCALL(OPFVV1, vfncvt_f_f_v_w, NOP_UU_W, H4, H8, float64_to_float32)
+ GEN_VEXT_V_ENV(vfncvt_f_f_v_h, 2, 2, clearh)
- # RISC-V devices
+ GEN_VEXT_V_ENV(vfncvt_f_f_v_w, 4, 4, clearl)
-+softmmu_ss.add(when: 'CONFIG_SIFIVE_TEST', if_true: files('sifive_test.c'))
++
- softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
++/*
- softmmu_ss.add(when: 'CONFIG_SIFIVE_U_OTP', if_true: files('sifive_u_otp.c'))
++ *** Vector Reduction Operations
- softmmu_ss.add(when: 'CONFIG_SIFIVE_U_PRCI', if_true: files('sifive_u_prci.c'))
++ */
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++/* Vector Single-Width Integer Reduction Instructions */
-index XXXXXXX..XXXXXXX 100644
++#define GEN_VEXT_RED(NAME, TD, TS2, HD, HS2, OP, CLEAR_FN)\
---- a/hw/riscv/Kconfig
++void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
-+++ b/hw/riscv/Kconfig
++        void *vs2, CPURISCVState *env, uint32_t desc)     \
-@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
++{                                                         \
-     select SIFIVE
++    uint32_t mlen = vext_mlen(desc);                      \
-     select SIFIVE_CLINT
++    uint32_t vm = vext_vm(desc);                          \
-     select SIFIVE_PLIC
++    uint32_t vl = env->vl;                                \
-+    select SIFIVE_TEST
++    uint32_t i;                                           \
++    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;        \
- config MICROCHIP_PFSOC
++    TD s1 =  *((TD *)vs1 + HD(0));                        \
-     bool
++                                                          \
-diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
++    for (i = 0; i < vl; i++) {                            \
-index XXXXXXX..XXXXXXX 100644
++        TS2 s2 = *((TS2 *)vs2 + HS2(i));                  \
---- a/hw/riscv/meson.build
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
-+++ b/hw/riscv/meson.build
++            continue;                                     \
-@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files('numa.c'))
++        }                                                 \
- riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
++        s1 = OP(s1, (TD)s2);                              \
- riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
++    }                                                     \
- riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
++    *((TD *)vd + HD(0)) = s1;                             \
--riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
++    CLEAR_FN(vd, 1, sizeof(TD), tot);                     \
- riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
++}
- riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
++
- riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
++/* vd[0] = sum(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredsum_vs_b, int8_t, int8_t, H1, H1, DO_ADD, clearb)
 +GEN_VEXT_RED(vredsum_vs_h, int16_t, int16_t, H2, H2, DO_ADD, clearh)
 +GEN_VEXT_RED(vredsum_vs_w, int32_t, int32_t, H4, H4, DO_ADD, clearl)
 +GEN_VEXT_RED(vredsum_vs_d, int64_t, int64_t, H8, H8, DO_ADD, clearq)
 +
 +/* vd[0] = maxu(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredmaxu_vs_b, uint8_t, uint8_t, H1, H1, DO_MAX, clearb)
 +GEN_VEXT_RED(vredmaxu_vs_h, uint16_t, uint16_t, H2, H2, DO_MAX, clearh)
 +GEN_VEXT_RED(vredmaxu_vs_w, uint32_t, uint32_t, H4, H4, DO_MAX, clearl)
 +GEN_VEXT_RED(vredmaxu_vs_d, uint64_t, uint64_t, H8, H8, DO_MAX, clearq)
 +
 +/* vd[0] = max(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredmax_vs_b, int8_t, int8_t, H1, H1, DO_MAX, clearb)
 +GEN_VEXT_RED(vredmax_vs_h, int16_t, int16_t, H2, H2, DO_MAX, clearh)
 +GEN_VEXT_RED(vredmax_vs_w, int32_t, int32_t, H4, H4, DO_MAX, clearl)
 +GEN_VEXT_RED(vredmax_vs_d, int64_t, int64_t, H8, H8, DO_MAX, clearq)
 +
 +/* vd[0] = minu(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredminu_vs_b, uint8_t, uint8_t, H1, H1, DO_MIN, clearb)
 +GEN_VEXT_RED(vredminu_vs_h, uint16_t, uint16_t, H2, H2, DO_MIN, clearh)
 +GEN_VEXT_RED(vredminu_vs_w, uint32_t, uint32_t, H4, H4, DO_MIN, clearl)
 +GEN_VEXT_RED(vredminu_vs_d, uint64_t, uint64_t, H8, H8, DO_MIN, clearq)
 +
 +/* vd[0] = min(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredmin_vs_b, int8_t, int8_t, H1, H1, DO_MIN, clearb)
 +GEN_VEXT_RED(vredmin_vs_h, int16_t, int16_t, H2, H2, DO_MIN, clearh)
 +GEN_VEXT_RED(vredmin_vs_w, int32_t, int32_t, H4, H4, DO_MIN, clearl)
 +GEN_VEXT_RED(vredmin_vs_d, int64_t, int64_t, H8, H8, DO_MIN, clearq)
 +
 +/* vd[0] = and(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredand_vs_b, int8_t, int8_t, H1, H1, DO_AND, clearb)
 +GEN_VEXT_RED(vredand_vs_h, int16_t, int16_t, H2, H2, DO_AND, clearh)
 +GEN_VEXT_RED(vredand_vs_w, int32_t, int32_t, H4, H4, DO_AND, clearl)
 +GEN_VEXT_RED(vredand_vs_d, int64_t, int64_t, H8, H8, DO_AND, clearq)
 +
 +/* vd[0] = or(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredor_vs_b, int8_t, int8_t, H1, H1, DO_OR, clearb)
 +GEN_VEXT_RED(vredor_vs_h, int16_t, int16_t, H2, H2, DO_OR, clearh)
 +GEN_VEXT_RED(vredor_vs_w, int32_t, int32_t, H4, H4, DO_OR, clearl)
 +GEN_VEXT_RED(vredor_vs_d, int64_t, int64_t, H8, H8, DO_OR, clearq)
 +
 +/* vd[0] = xor(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredxor_vs_b, int8_t, int8_t, H1, H1, DO_XOR, clearb)
 +GEN_VEXT_RED(vredxor_vs_h, int16_t, int16_t, H2, H2, DO_XOR, clearh)
 +GEN_VEXT_RED(vredxor_vs_w, int32_t, int32_t, H4, H4, DO_XOR, clearl)
 +GEN_VEXT_RED(vredxor_vs_d, int64_t, int64_t, H8, H8, DO_XOR, clearq)
 --
-.28.0
+.27.0

-[PULL 26/30] hw/riscv: Move sifive_uart model to hw/char
+[PULL v2 49/64] target/riscv: vector wideing integer reduction instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 codes. Let's move sifive_uart model to hw/char directory.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-9-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-47-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => char}/sifive_uart.h | 0
+ target/riscv/helper.h                   |  7 +++++++
- hw/{riscv => char}/sifive_uart.c         | 2 +-
+ target/riscv/insn32.decode              |  2 ++
- hw/riscv/sifive_e.c                      | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c |  4 ++++
- hw/riscv/sifive_u.c                      | 2 +-
+ target/riscv/vector_helper.c            | 11 +++++++++++
- hw/char/Kconfig                          | 3 +++
+files changed, 24 insertions(+)
  hw/char/meson.build                      | 1 +
  hw/riscv/Kconfig                         | 2 ++
  hw/riscv/meson.build                     | 1 -
 files changed, 9 insertions(+), 4 deletions(-)
  rename include/hw/{riscv => char}/sifive_uart.h (100%)
  rename hw/{riscv => char}/sifive_uart.c (99%)
-diff --git a/include/hw/riscv/sifive_uart.h b/include/hw/char/sifive_uart.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/sifive_uart.h
 rename to include/hw/char/sifive_uart.h
 diff --git a/hw/riscv/sifive_uart.c b/hw/char/sifive_uart.c
 similarity index 99%
 rename from hw/riscv/sifive_uart.c
 rename to hw/char/sifive_uart.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_uart.c
+--- a/target/riscv/helper.h
-+++ b/hw/char/sifive_uart.c
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vredxor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
- #include "chardev/char-fe.h"
+ DEF_HELPER_6(vredxor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/hw.h"
+ DEF_HELPER_6(vredxor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/irq.h"
+ DEF_HELPER_6(vredxor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_uart.h"
++
-+#include "hw/char/sifive_uart.h"
++DEF_HELPER_6(vwredsumu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwredsumu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- /*
++DEF_HELPER_6(vwredsumu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-  * Not yet implemented:
++DEF_HELPER_6(vwredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
++DEF_HELPER_6(vwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_e.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/sifive_e.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vredminu_vs     000100 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/misc/unimp.h"
+ vredmin_vs      000101 . ..... ..... 010 ..... 1010111 @r_vm
- #include "target/riscv/cpu.h"
+ vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/riscv/riscv_hart.h"
+ vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
--#include "hw/riscv/sifive_uart.h"
++vwredsumu_vs    110000 . ..... ..... 000 ..... 1010111 @r_vm
- #include "hw/riscv/sifive_e.h"
++vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
- #include "hw/riscv/boot.h"
-+#include "hw/char/sifive_uart.h"
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- #include "hw/intc/sifive_clint.h"
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
- #include "hw/intc/sifive_plic.h"
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
  #include "hw/misc/sifive_e_prci.h"
 diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_u.c
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/riscv/sifive_u.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vredmin_vs, reduction_check)
- #include "hw/misc/unimp.h"
+ GEN_OPIVV_TRANS(vredand_vs, reduction_check)
- #include "target/riscv/cpu.h"
+ GEN_OPIVV_TRANS(vredor_vs, reduction_check)
- #include "hw/riscv/riscv_hart.h"
+ GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
--#include "hw/riscv/sifive_uart.h"
++
- #include "hw/riscv/sifive_u.h"
++/* Vector Widening Integer Reduction Instructions */
- #include "hw/riscv/boot.h"
++GEN_OPIVV_WIDEN_TRANS(vwredsum_vs, reduction_check)
-+#include "hw/char/sifive_uart.h"
++GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
- #include "hw/intc/sifive_clint.h"
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
  #include "hw/intc/sifive_plic.h"
  #include "chardev/char.h"
 diff --git a/hw/char/Kconfig b/hw/char/Kconfig
 index XXXXXXX..XXXXXXX 100644
---- a/hw/char/Kconfig
+--- a/target/riscv/vector_helper.c
-+++ b/hw/char/Kconfig
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ config AVR_USART
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_RED(vredxor_vs_b, int8_t, int8_t, H1, H1, DO_XOR, clearb)
+ GEN_VEXT_RED(vredxor_vs_h, int16_t, int16_t, H2, H2, DO_XOR, clearh)
- config MCHP_PFSOC_MMUART
+ GEN_VEXT_RED(vredxor_vs_w, int32_t, int32_t, H4, H4, DO_XOR, clearl)
-     bool
+ GEN_VEXT_RED(vredxor_vs_d, int64_t, int64_t, H8, H8, DO_XOR, clearq)
 +
-+config SIFIVE_UART
++/* Vector Widening Integer Reduction Instructions */
-+    bool
++/* signed sum reduction into double-width accumulator */
-diff --git a/hw/char/meson.build b/hw/char/meson.build
++GEN_VEXT_RED(vwredsum_vs_b, int16_t, int8_t, H2, H1, DO_ADD, clearh)
-index XXXXXXX..XXXXXXX 100644
++GEN_VEXT_RED(vwredsum_vs_h, int32_t, int16_t, H4, H2, DO_ADD, clearl)
---- a/hw/char/meson.build
++GEN_VEXT_RED(vwredsum_vs_w, int64_t, int32_t, H8, H4, DO_ADD, clearq)
-+++ b/hw/char/meson.build
++
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_EXYNOS4', if_true: files('exynos4210_uart.c'))
++/* Unsigned sum reduction into double-width accumulator */
- softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_uart.c'))
++GEN_VEXT_RED(vwredsumu_vs_b, uint16_t, uint8_t, H2, H1, DO_ADD, clearh)
- softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_aux.c'))
++GEN_VEXT_RED(vwredsumu_vs_h, uint32_t, uint16_t, H4, H2, DO_ADD, clearl)
- softmmu_ss.add(when: 'CONFIG_RENESAS_SCI', if_true: files('renesas_sci.c'))
++GEN_VEXT_RED(vwredsumu_vs_w, uint64_t, uint32_t, H8, H4, DO_ADD, clearq)
 +softmmu_ss.add(when: 'CONFIG_SIFIVE_UART', if_true: files('sifive_uart.c'))
  softmmu_ss.add(when: 'CONFIG_SH4', if_true: files('sh_serial.c'))
  softmmu_ss.add(when: 'CONFIG_STM32F2XX_USART', if_true: files('stm32f2xx_usart.c'))
  softmmu_ss.add(when: 'CONFIG_MCHP_PFSOC_MMUART', if_true: files('mchp_pfsoc_mmuart.c'))
 diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/Kconfig
 +++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
      select SIFIVE_CLINT
      select SIFIVE_GPIO
      select SIFIVE_PLIC
 +    select SIFIVE_UART
      select SIFIVE_E_PRCI
      select UNIMP
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
      select SIFIVE_GPIO
      select SIFIVE_PDMA
      select SIFIVE_PLIC
 +    select SIFIVE_UART
      select SIFIVE_U_OTP
      select SIFIVE_U_PRCI
      select UNIMP
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/meson.build
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
  riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
  riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
 --
-.28.0
+.27.0

-[PULL 25/30] hw/riscv: Move riscv_htif model to hw/char
+[PULL v2 50/64] target/riscv: vector single-width floating-point reduction instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 codes. Let's move riscv_htif model to hw/char directory.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-8-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-48-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => char}/riscv_htif.h | 0
+ target/riscv/helper.h                   | 10 +++++++
- hw/{riscv => char}/riscv_htif.c         | 2 +-
+ target/riscv/insn32.decode              |  4 +++
- hw/riscv/spike.c                        | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c |  5 ++++
- hw/char/Kconfig                         | 3 +++
+ target/riscv/vector_helper.c            | 39 +++++++++++++++++++++++++
- hw/char/meson.build                     | 1 +
+files changed, 58 insertions(+)
  hw/riscv/Kconfig                        | 3 ---
  hw/riscv/meson.build                    | 1 -
 files changed, 6 insertions(+), 6 deletions(-)
  rename include/hw/{riscv => char}/riscv_htif.h (100%)
  rename hw/{riscv => char}/riscv_htif.c (99%)
-diff --git a/include/hw/riscv/riscv_htif.h b/include/hw/char/riscv_htif.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/riscv_htif.h
 rename to include/hw/char/riscv_htif.h
 diff --git a/hw/riscv/riscv_htif.c b/hw/char/riscv_htif.c
 similarity index 99%
 rename from hw/riscv/riscv_htif.c
 rename to hw/char/riscv_htif.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/riscv_htif.c
+--- a/target/riscv/helper.h
-+++ b/hw/char/riscv_htif.c
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwredsumu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- #include "qapi/error.h"
+ DEF_HELPER_6(vwredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
- #include "qemu/log.h"
+ DEF_HELPER_6(vwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/sysbus.h"
+ DEF_HELPER_6(vwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+#include "hw/char/riscv_htif.h"
++
- #include "hw/char/serial.h"
++DEF_HELPER_6(vfredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "chardev/char.h"
++DEF_HELPER_6(vfredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- #include "chardev/char-fe.h"
++DEF_HELPER_6(vfredsum_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/riscv_htif.h"
++DEF_HELPER_6(vfredmax_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "qemu/timer.h"
++DEF_HELPER_6(vfredmax_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- #include "qemu/error-report.h"
++DEF_HELPER_6(vfredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vfredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/hw/riscv/spike.c b/hw/riscv/spike.c
++DEF_HELPER_6(vfredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/spike.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/spike.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/loader.h"
+ vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
- #include "hw/sysbus.h"
+ vwredsumu_vs    110000 . ..... ..... 000 ..... 1010111 @r_vm
- #include "target/riscv/cpu.h"
+ vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
--#include "hw/riscv/riscv_htif.h"
++# Vector ordered and unordered reduction sum
- #include "hw/riscv/riscv_hart.h"
++vfredsum_vs     0000-1 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/spike.h"
++vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/boot.h"
++vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/numa.h"
-+#include "hw/char/riscv_htif.h"
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- #include "hw/intc/sifive_clint.h"
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
- #include "chardev/char.h"
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
  #include "sysemu/arch_init.h"
 diff --git a/hw/char/Kconfig b/hw/char/Kconfig
 index XXXXXXX..XXXXXXX 100644
---- a/hw/char/Kconfig
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/char/Kconfig
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
- config ESCC
+ /* Vector Widening Integer Reduction Instructions */
-     bool
+ GEN_OPIVV_WIDEN_TRANS(vwredsum_vs, reduction_check)
+ GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
 +config HTIF
 +    bool
 +
- config PARALLEL
++/* Vector Single-Width Floating-Point Reduction Instructions */
-     bool
++GEN_OPFVV_TRANS(vfredsum_vs, reduction_check)
-     default y
++GEN_OPFVV_TRANS(vfredmax_vs, reduction_check)
-diff --git a/hw/char/meson.build b/hw/char/meson.build
++GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/char/meson.build
+--- a/target/riscv/vector_helper.c
-+++ b/hw/char/meson.build
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_SH4', if_true: files('sh_serial.c'))
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_RED(vwredsum_vs_w, int64_t, int32_t, H8, H4, DO_ADD, clearq)
- softmmu_ss.add(when: 'CONFIG_STM32F2XX_USART', if_true: files('stm32f2xx_usart.c'))
+ GEN_VEXT_RED(vwredsumu_vs_b, uint16_t, uint8_t, H2, H1, DO_ADD, clearh)
- softmmu_ss.add(when: 'CONFIG_MCHP_PFSOC_MMUART', if_true: files('mchp_pfsoc_mmuart.c'))
+ GEN_VEXT_RED(vwredsumu_vs_h, uint32_t, uint16_t, H4, H2, DO_ADD, clearl)
+ GEN_VEXT_RED(vwredsumu_vs_w, uint64_t, uint32_t, H8, H4, DO_ADD, clearq)
-+specific_ss.add(when: 'CONFIG_HTIF', if_true: files('riscv_htif.c'))
++
- specific_ss.add(when: 'CONFIG_TERMINAL3270', if_true: files('terminal3270.c'))
++/* Vector Single-Width Floating-Point Reduction Instructions */
- specific_ss.add(when: 'CONFIG_VIRTIO', if_true: files('virtio-serial-bus.c'))
++#define GEN_VEXT_FRED(NAME, TD, TS2, HD, HS2, OP, CLEAR_FN)\
- specific_ss.add(when: 'CONFIG_PSERIES', if_true: files('spapr_vty.c'))
++void HELPER(NAME)(void *vd, void *v0, void *vs1,           \
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++                  void *vs2, CPURISCVState *env,           \
-index XXXXXXX..XXXXXXX 100644
++                  uint32_t desc)                           \
---- a/hw/riscv/Kconfig
++{                                                          \
-+++ b/hw/riscv/Kconfig
++    uint32_t mlen = vext_mlen(desc);                       \
-@@ -XXX,XX +XXX,XX @@
++    uint32_t vm = vext_vm(desc);                           \
--config HTIF
++    uint32_t vl = env->vl;                                 \
--    bool
++    uint32_t i;                                            \
--
++    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;         \
- config HART
++    TD s1 =  *((TD *)vs1 + HD(0));                         \
-     bool
++                                                           \
++    for (i = 0; i < vl; i++) {                             \
-diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
++        TS2 s2 = *((TS2 *)vs2 + HS2(i));                   \
-index XXXXXXX..XXXXXXX 100644
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {         \
---- a/hw/riscv/meson.build
++            continue;                                      \
-+++ b/hw/riscv/meson.build
++        }                                                  \
-@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
++        s1 = OP(s1, (TD)s2, &env->fp_status);              \
- riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
++    }                                                      \
- riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
++    *((TD *)vd + HD(0)) = s1;                              \
- riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
++    CLEAR_FN(vd, 1, sizeof(TD), tot);                      \
--riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
++}
- riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
++
- riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
++/* Unordered sum */
++GEN_VEXT_FRED(vfredsum_vs_h, uint16_t, uint16_t, H2, H2, float16_add, clearh)
 +GEN_VEXT_FRED(vfredsum_vs_w, uint32_t, uint32_t, H4, H4, float32_add, clearl)
 +GEN_VEXT_FRED(vfredsum_vs_d, uint64_t, uint64_t, H8, H8, float64_add, clearq)
 +
 +/* Maximum value */
 +GEN_VEXT_FRED(vfredmax_vs_h, uint16_t, uint16_t, H2, H2, float16_maxnum, clearh)
 +GEN_VEXT_FRED(vfredmax_vs_w, uint32_t, uint32_t, H4, H4, float32_maxnum, clearl)
 +GEN_VEXT_FRED(vfredmax_vs_d, uint64_t, uint64_t, H8, H8, float64_maxnum, clearq)
 +
 +/* Minimum value */
 +GEN_VEXT_FRED(vfredmin_vs_h, uint16_t, uint16_t, H2, H2, float16_minnum, clearh)
 +GEN_VEXT_FRED(vfredmin_vs_w, uint32_t, uint32_t, H4, H4, float32_minnum, clearl)
 +GEN_VEXT_FRED(vfredmin_vs_d, uint64_t, uint64_t, H8, H8, float64_minnum, clearq)
 --
-.28.0
+.27.0

-[PULL 23/30] hw/riscv: Move sifive_clint model to hw/intc
+[PULL v2 51/64] target/riscv: vector widening floating-point reduction instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 codes. Let's move sifive_clint model to hw/intc directory.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <1599129623-68957-6-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-49-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => intc}/sifive_clint.h | 0
+ target/riscv/helper.h                   |  3 ++
- hw/{riscv => intc}/sifive_clint.c         | 2 +-
+ target/riscv/insn32.decode              |  2 ++
- hw/riscv/microchip_pfsoc.c                | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c |  3 ++
- hw/riscv/sifive_e.c                       | 2 +-
+ target/riscv/vector_helper.c            | 46 +++++++++++++++++++++++++
- hw/riscv/sifive_u.c                       | 2 +-
+files changed, 54 insertions(+)
  hw/riscv/spike.c                          | 2 +-
  hw/riscv/virt.c                           | 2 +-
  hw/intc/Kconfig                           | 3 +++
  hw/intc/meson.build                       | 1 +
  hw/riscv/Kconfig                          | 5 +++++
  hw/riscv/meson.build                      | 1 -
 files changed, 15 insertions(+), 7 deletions(-)
  rename include/hw/{riscv => intc}/sifive_clint.h (100%)
  rename hw/{riscv => intc}/sifive_clint.c (99%)
-diff --git a/include/hw/riscv/sifive_clint.h b/include/hw/intc/sifive_clint.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/sifive_clint.h
 rename to include/hw/intc/sifive_clint.h
 diff --git a/hw/riscv/sifive_clint.c b/hw/intc/sifive_clint.c
 similarity index 99%
 rename from hw/riscv/sifive_clint.c
 rename to hw/intc/sifive_clint.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_clint.c
+--- a/target/riscv/helper.h
-+++ b/hw/intc/sifive_clint.c
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/sysbus.h"
+ DEF_HELPER_6(vfredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "target/riscv/cpu.h"
+ DEF_HELPER_6(vfredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/qdev-properties.h"
+ DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_clint.h"
++
-+#include "hw/intc/sifive_clint.h"
++DEF_HELPER_6(vfwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "qemu/timer.h"
++DEF_HELPER_6(vfwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
  static uint64_t cpu_riscv_read_rtc(uint32_t timebase_freq)
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/microchip_pfsoc.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
- #include "hw/misc/unimp.h"
+ vfredsum_vs     0000-1 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/boot.h"
+ vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/riscv_hart.h"
+ vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
--#include "hw/riscv/sifive_clint.h"
++# Vector widening ordered and unordered float reduction sum
- #include "hw/riscv/sifive_plic.h"
++vfwredsum_vs    1100-1 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/microchip_pfsoc.h"
-+#include "hw/intc/sifive_clint.h"
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- #include "sysemu/sysemu.h"
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
  /*
 diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_e.c
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/riscv/sifive_e.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
- #include "target/riscv/cpu.h"
+ GEN_OPFVV_TRANS(vfredsum_vs, reduction_check)
- #include "hw/riscv/riscv_hart.h"
+ GEN_OPFVV_TRANS(vfredmax_vs, reduction_check)
- #include "hw/riscv/sifive_plic.h"
+ GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
--#include "hw/riscv/sifive_clint.h"
++
- #include "hw/riscv/sifive_uart.h"
++/* Vector Widening Floating-Point Reduction Instructions */
- #include "hw/riscv/sifive_e.h"
++GEN_OPFVV_WIDEN_TRANS(vfwredsum_vs, reduction_check)
- #include "hw/riscv/boot.h"
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 +#include "hw/intc/sifive_clint.h"
  #include "hw/misc/sifive_e_prci.h"
  #include "chardev/char.h"
  #include "sysemu/arch_init.h"
 diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_u.c
+--- a/target/riscv/vector_helper.c
-+++ b/hw/riscv/sifive_u.c
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_FRED(vfredmax_vs_d, uint64_t, uint64_t, H8, H8, float64_maxnum, clearq)
- #include "target/riscv/cpu.h"
+ GEN_VEXT_FRED(vfredmin_vs_h, uint16_t, uint16_t, H2, H2, float16_minnum, clearh)
- #include "hw/riscv/riscv_hart.h"
+ GEN_VEXT_FRED(vfredmin_vs_w, uint32_t, uint32_t, H4, H4, float32_minnum, clearl)
- #include "hw/riscv/sifive_plic.h"
+ GEN_VEXT_FRED(vfredmin_vs_d, uint64_t, uint64_t, H8, H8, float64_minnum, clearq)
 -#include "hw/riscv/sifive_clint.h"
  #include "hw/riscv/sifive_uart.h"
  #include "hw/riscv/sifive_u.h"
  #include "hw/riscv/boot.h"
 +#include "hw/intc/sifive_clint.h"
  #include "chardev/char.h"
  #include "net/eth.h"
  #include "sysemu/arch_init.h"
 diff --git a/hw/riscv/spike.c b/hw/riscv/spike.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/spike.c
 +++ b/hw/riscv/spike.c
@@ -XXX,XX +XXX,XX @@
  #include "target/riscv/cpu.h"
  #include "hw/riscv/riscv_htif.h"
  #include "hw/riscv/riscv_hart.h"
 -#include "hw/riscv/sifive_clint.h"
  #include "hw/riscv/spike.h"
  #include "hw/riscv/boot.h"
  #include "hw/riscv/numa.h"
 +#include "hw/intc/sifive_clint.h"
  #include "chardev/char.h"
  #include "sysemu/arch_init.h"
  #include "sysemu/device_tree.h"
 diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/virt.c
 +++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@
  #include "target/riscv/cpu.h"
  #include "hw/riscv/riscv_hart.h"
  #include "hw/riscv/sifive_plic.h"
 -#include "hw/riscv/sifive_clint.h"
  #include "hw/riscv/sifive_test.h"
  #include "hw/riscv/virt.h"
  #include "hw/riscv/boot.h"
  #include "hw/riscv/numa.h"
 +#include "hw/intc/sifive_clint.h"
  #include "chardev/char.h"
  #include "sysemu/arch_init.h"
  #include "sysemu/device_tree.h"
 diff --git a/hw/intc/Kconfig b/hw/intc/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/Kconfig
 +++ b/hw/intc/Kconfig
@@ -XXX,XX +XXX,XX @@ config RX_ICU
  config LOONGSON_LIOINTC
      bool
 +
-+config SIFIVE_CLINT
++/* Vector Widening Floating-Point Reduction Instructions */
-+    bool
++/* Unordered reduce 2*SEW = 2*SEW + sum(promote(SEW)) */
-diff --git a/hw/intc/meson.build b/hw/intc/meson.build
++void HELPER(vfwredsum_vs_h)(void *vd, void *v0, void *vs1,
-index XXXXXXX..XXXXXXX 100644
++                            void *vs2, CPURISCVState *env, uint32_t desc)
---- a/hw/intc/meson.build
++{
-+++ b/hw/intc/meson.build
++    uint32_t mlen = vext_mlen(desc);
-@@ -XXX,XX +XXX,XX @@ specific_ss.add(when: 'CONFIG_RX_ICU', if_true: files('rx_icu.c'))
++    uint32_t vm = vext_vm(desc);
- specific_ss.add(when: 'CONFIG_S390_FLIC', if_true: files('s390_flic.c'))
++    uint32_t vl = env->vl;
- specific_ss.add(when: 'CONFIG_S390_FLIC_KVM', if_true: files('s390_flic_kvm.c'))
++    uint32_t i;
- specific_ss.add(when: 'CONFIG_SH4', if_true: files('sh_intc.c'))
++    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;
-+specific_ss.add(when: 'CONFIG_SIFIVE_CLINT', if_true: files('sifive_clint.c'))
++    uint32_t s1 =  *((uint32_t *)vs1 + H4(0));
- specific_ss.add(when: 'CONFIG_XICS', if_true: files('xics.c'))
++
- specific_ss.add(when: 'CONFIG_XICS_KVM', if_true: files('xics_kvm.c'))
++    for (i = 0; i < vl; i++) {
- specific_ss.add(when: 'CONFIG_XICS_SPAPR', if_true: files('xics_spapr.c'))
++        uint16_t s2 = *((uint16_t *)vs2 + H2(i));
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-index XXXXXXX..XXXXXXX 100644
++            continue;
---- a/hw/riscv/Kconfig
++        }
-+++ b/hw/riscv/Kconfig
++        s1 = float32_add(s1, float16_to_float32(s2, true, &env->fp_status),
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
++                         &env->fp_status);
-     bool
++    }
-     select HART
++    *((uint32_t *)vd + H4(0)) = s1;
-     select SIFIVE
++    clearl(vd, 1, sizeof(uint32_t), tot);
-+    select SIFIVE_CLINT
++}
-     select SIFIVE_GPIO
++
-     select SIFIVE_E_PRCI
++void HELPER(vfwredsum_vs_w)(void *vd, void *v0, void *vs1,
-     select UNIMP
++                            void *vs2, CPURISCVState *env, uint32_t desc)
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
++{
-     select CADENCE
++    uint32_t mlen = vext_mlen(desc);
-     select HART
++    uint32_t vm = vext_vm(desc);
-     select SIFIVE
++    uint32_t vl = env->vl;
-+    select SIFIVE_CLINT
++    uint32_t i;
-     select SIFIVE_GPIO
++    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;
-     select SIFIVE_PDMA
++    uint64_t s1 =  *((uint64_t *)vs1);
-     select SIFIVE_U_OTP
++
-@@ -XXX,XX +XXX,XX @@ config SPIKE
++    for (i = 0; i < vl; i++) {
-     select HART
++        uint32_t s2 = *((uint32_t *)vs2 + H4(i));
-     select HTIF
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-     select SIFIVE
++            continue;
-+    select SIFIVE_CLINT
++        }
++        s1 = float64_add(s1, float32_to_float64(s2, &env->fp_status),
- config OPENTITAN
++                         &env->fp_status);
-     bool
++    }
-@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
++    *((uint64_t *)vd) = s1;
-     select PCI_EXPRESS_GENERIC_BRIDGE
++    clearq(vd, 1, sizeof(uint64_t), tot);
-     select PFLASH_CFI01
++}
      select SIFIVE
 +    select SIFIVE_CLINT
  config MICROCHIP_PFSOC
      bool
      select HART
      select SIFIVE
 +    select SIFIVE_CLINT
      select UNIMP
      select MCHP_PFSOC_MMUART
      select SIFIVE_PDMA
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/meson.build
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files('numa.c'))
  riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
  riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
  riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_clint.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 --
-.28.0
+.27.0

-[PULL 22/30] hw/riscv: Move sifive_gpio model to hw/gpio
+[PULL v2 52/64] target/riscv: vector mask-register logical instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-codes. Let's move sifive_gpio model to hw/gpio directory.
+Message-Id: <20200701152549.1218-50-zhiwei_liu@c-sky.com>
 Note this also removes the trace-events in the hw/riscv directory,
 since gpio is the only supported trace target in that directory.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1599129623-68957-5-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/trace.h                         | 1 -
+ target/riscv/helper.h                   |  9 ++++++
- include/hw/{riscv => gpio}/sifive_gpio.h | 0
+ target/riscv/insn32.decode              |  8 +++++
- include/hw/riscv/sifive_e.h              | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c | 35 ++++++++++++++++++++++
- include/hw/riscv/sifive_u.h              | 2 +-
+ target/riscv/vector_helper.c            | 40 +++++++++++++++++++++++++
- hw/{riscv => gpio}/sifive_gpio.c         | 2 +-
+files changed, 92 insertions(+)
  hw/gpio/Kconfig                          | 3 +++
  hw/gpio/meson.build                      | 1 +
  hw/gpio/trace-events                     | 6 ++++++
  hw/riscv/Kconfig                         | 2 ++
  hw/riscv/meson.build                     | 1 -
  hw/riscv/trace-events                    | 7 -------
  meson.build                              | 1 -
 files changed, 15 insertions(+), 13 deletions(-)
  delete mode 100644 hw/riscv/trace.h
  rename include/hw/{riscv => gpio}/sifive_gpio.h (100%)
  rename hw/{riscv => gpio}/sifive_gpio.c (99%)
  delete mode 100644 hw/riscv/trace-events
-diff --git a/hw/riscv/trace.h b/hw/riscv/trace.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 deleted file mode 100644
 index XXXXXXX..XXXXXXX
 --- a/hw/riscv/trace.h
 +++ /dev/null
@@ -1 +0,0 @@
 -#include "trace/trace-hw_riscv.h"
 diff --git a/include/hw/riscv/sifive_gpio.h b/include/hw/gpio/sifive_gpio.h
 similarity index 100%
 rename from include/hw/riscv/sifive_gpio.h
 rename to include/hw/gpio/sifive_gpio.h
 diff --git a/include/hw/riscv/sifive_e.h b/include/hw/riscv/sifive_e.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/sifive_e.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/sifive_e.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/riscv_hart.h"
+ DEF_HELPER_6(vfwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/sifive_cpu.h"
+ DEF_HELPER_6(vfwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_gpio.h"
++
-+#include "hw/gpio/sifive_gpio.h"
++DEF_HELPER_6(vmand_mm, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vmnand_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #define TYPE_RISCV_E_SOC "riscv.sifive.e.soc"
++DEF_HELPER_6(vmandnot_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #define RISCV_E_SOC(obj) \
++DEF_HELPER_6(vmxor_mm, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
++DEF_HELPER_6(vmor_mm, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/sifive_u.h
+--- a/target/riscv/insn32.decode
-+++ b/include/hw/riscv/sifive_u.h
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/net/cadence_gem.h"
+ vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
- #include "hw/riscv/riscv_hart.h"
+ # Vector widening ordered and unordered float reduction sum
- #include "hw/riscv/sifive_cpu.h"
+ vfwredsum_vs    1100-1 . ..... ..... 001 ..... 1010111 @r_vm
--#include "hw/riscv/sifive_gpio.h"
++vmand_mm        011001 - ..... ..... 010 ..... 1010111 @r
-+#include "hw/gpio/sifive_gpio.h"
++vmnand_mm       011101 - ..... ..... 010 ..... 1010111 @r
- #include "hw/misc/sifive_u_otp.h"
++vmandnot_mm     011000 - ..... ..... 010 ..... 1010111 @r
- #include "hw/misc/sifive_u_prci.h"
++vmxor_mm        011011 - ..... ..... 010 ..... 1010111 @r
++vmor_mm         011010 - ..... ..... 010 ..... 1010111 @r
-diff --git a/hw/riscv/sifive_gpio.c b/hw/gpio/sifive_gpio.c
++vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
-similarity index 99%
++vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
-rename from hw/riscv/sifive_gpio.c
++vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
-rename to hw/gpio/sifive_gpio.c
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_gpio.c
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/gpio/sifive_gpio.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
- #include "qemu/log.h"
- #include "hw/irq.h"
+ /* Vector Widening Floating-Point Reduction Instructions */
- #include "hw/qdev-properties.h"
+ GEN_OPFVV_WIDEN_TRANS(vfwredsum_vs, reduction_check)
--#include "hw/riscv/sifive_gpio.h"
++
-+#include "hw/gpio/sifive_gpio.h"
++/*
- #include "migration/vmstate.h"
++ *** Vector Mask Operations
- #include "trace.h"
++ */
++
-diff --git a/hw/gpio/Kconfig b/hw/gpio/Kconfig
++/* Vector Mask-Register Logical Instructions */
 +#define GEN_MM_TRANS(NAME)                                         \
 +static bool trans_##NAME(DisasContext *s, arg_r *a)                \
 +{                                                                  \
 +    if (vext_check_isa_ill(s)) {                                   \
 +        uint32_t data = 0;                                         \
 +        gen_helper_gvec_4_ptr *fn = gen_helper_##NAME;             \
 +        TCGLabel *over = gen_new_label();                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs1),                    \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fn);                 \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_MM_TRANS(vmand_mm)
 +GEN_MM_TRANS(vmnand_mm)
 +GEN_MM_TRANS(vmandnot_mm)
 +GEN_MM_TRANS(vmxor_mm)
 +GEN_MM_TRANS(vmor_mm)
 +GEN_MM_TRANS(vmnor_mm)
 +GEN_MM_TRANS(vmornot_mm)
 +GEN_MM_TRANS(vmxnor_mm)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/gpio/Kconfig
+--- a/target/riscv/vector_helper.c
-+++ b/hw/gpio/Kconfig
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ config PL061
+@@ -XXX,XX +XXX,XX @@ void HELPER(vfwredsum_vs_w)(void *vd, void *v0, void *vs1,
+     *((uint64_t *)vd) = s1;
- config GPIO_KEY
+     clearq(vd, 1, sizeof(uint64_t), tot);
-     bool
+ }
 +
-+config SIFIVE_GPIO
++/*
-+    bool
++ *** Vector Mask Operations
-diff --git a/hw/gpio/meson.build b/hw/gpio/meson.build
++ */
-index XXXXXXX..XXXXXXX 100644
++/* Vector Mask-Register Logical Instructions */
---- a/hw/gpio/meson.build
++#define GEN_VEXT_MASK_VV(NAME, OP)                        \
-+++ b/hw/gpio/meson.build
++void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_NRF51_SOC', if_true: files('nrf51_gpio.c'))
++                  void *vs2, CPURISCVState *env,          \
- softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_gpio.c'))
++                  uint32_t desc)                          \
- softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_gpio.c'))
++{                                                         \
- softmmu_ss.add(when: 'CONFIG_ASPEED_SOC', if_true: files('aspeed_gpio.c'))
++    uint32_t mlen = vext_mlen(desc);                      \
-+softmmu_ss.add(when: 'CONFIG_SIFIVE_GPIO', if_true: files('sifive_gpio.c'))
++    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;   \
-diff --git a/hw/gpio/trace-events b/hw/gpio/trace-events
++    uint32_t vl = env->vl;                                \
-index XXXXXXX..XXXXXXX 100644
++    uint32_t i;                                           \
---- a/hw/gpio/trace-events
++    int a, b;                                             \
-+++ b/hw/gpio/trace-events
++                                                          \
-@@ -XXX,XX +XXX,XX @@ nrf51_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PR
++    for (i = 0; i < vl; i++) {                            \
- nrf51_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
++        a = vext_elem_mask(vs1, mlen, i);                 \
- nrf51_gpio_set(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
++        b = vext_elem_mask(vs2, mlen, i);                 \
- nrf51_gpio_update_output_irq(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
++        vext_set_elem_mask(vd, mlen, i, OP(b, a));        \
 +    }                                                     \
 +    for (; i < vlmax; i++) {                              \
 +        vext_set_elem_mask(vd, mlen, i, 0);               \
 +    }                                                     \
 +}
 +
-+# sifive_gpio.c
++#define DO_NAND(N, M)  (!(N & M))
-+sifive_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PRIx64
++#define DO_ANDNOT(N, M)  (N & !M)
-+sifive_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
++#define DO_NOR(N, M)  (!(N | M))
-+sifive_gpio_set(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
++#define DO_ORNOT(N, M)  (N | !M)
-+sifive_gpio_update_output_irq(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
++#define DO_XNOR(N, M)  (!(N ^ M))
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++
-index XXXXXXX..XXXXXXX 100644
++GEN_VEXT_MASK_VV(vmand_mm, DO_AND)
---- a/hw/riscv/Kconfig
++GEN_VEXT_MASK_VV(vmnand_mm, DO_NAND)
-+++ b/hw/riscv/Kconfig
++GEN_VEXT_MASK_VV(vmandnot_mm, DO_ANDNOT)
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
++GEN_VEXT_MASK_VV(vmxor_mm, DO_XOR)
-     bool
++GEN_VEXT_MASK_VV(vmor_mm, DO_OR)
-     select HART
++GEN_VEXT_MASK_VV(vmnor_mm, DO_NOR)
-     select SIFIVE
++GEN_VEXT_MASK_VV(vmornot_mm, DO_ORNOT)
-+    select SIFIVE_GPIO
++GEN_VEXT_MASK_VV(vmxnor_mm, DO_XNOR)
      select SIFIVE_E_PRCI
      select UNIMP
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
      select CADENCE
      select HART
      select SIFIVE
 +    select SIFIVE_GPIO
      select SIFIVE_PDMA
      select SIFIVE_U_OTP
      select SIFIVE_U_PRCI
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/meson.build
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
  riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
  riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_clint.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_gpio.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 diff --git a/hw/riscv/trace-events b/hw/riscv/trace-events
 deleted file mode 100644
 index XXXXXXX..XXXXXXX
 --- a/hw/riscv/trace-events
 +++ /dev/null
@@ -XXX,XX +XXX,XX @@
 -# See docs/devel/tracing.txt for syntax documentation.
 -
 -# hw/gpio/sifive_gpio.c
 -sifive_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PRIx64
 -sifive_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
 -sifive_gpio_set(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
 -sifive_gpio_update_output_irq(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
 diff --git a/meson.build b/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/meson.build
 +++ b/meson.build
@@ -XXX,XX +XXX,XX @@ if have_system
      'hw/watchdog',
      'hw/xen',
      'hw/gpio',
 -    'hw/riscv',
      'migration',
      'net',
      'ui',
 --
-.28.0
+.27.0

-[PULL 21/30] hw/riscv: Move sifive_u_otp model to hw/misc
+[PULL v2 53/64] target/riscv: vector mask population count vmpopc
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-codes. Let's move sifive_u_otp model to hw/misc directory.
+Message-Id: <20200701152549.1218-51-zhiwei_liu@c-sky.com>
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1599129623-68957-4-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => misc}/sifive_u_otp.h | 0
+ target/riscv/helper.h                   |  2 ++
- include/hw/riscv/sifive_u.h               | 2 +-
+ target/riscv/insn32.decode              |  1 +
- hw/{riscv => misc}/sifive_u_otp.c         | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
- hw/misc/Kconfig                           | 3 +++
+ target/riscv/vector_helper.c            | 20 ++++++++++++++++
- hw/misc/meson.build                       | 1 +
+files changed, 55 insertions(+)
  hw/riscv/Kconfig                          | 1 +
  hw/riscv/meson.build                      | 1 -
 files changed, 7 insertions(+), 3 deletions(-)
  rename include/hw/{riscv => misc}/sifive_u_otp.h (100%)
  rename hw/{riscv => misc}/sifive_u_otp.c (99%)
-diff --git a/include/hw/riscv/sifive_u_otp.h b/include/hw/misc/sifive_u_otp.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/sifive_u_otp.h
 rename to include/hw/misc/sifive_u_otp.h
 diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/sifive_u.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/sifive_u.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmor_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/riscv_hart.h"
+ DEF_HELPER_6(vmnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/sifive_cpu.h"
+ DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/sifive_gpio.h"
+ DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_u_otp.h"
++
-+#include "hw/misc/sifive_u_otp.h"
++DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
- #include "hw/misc/sifive_u_prci.h"
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
  #define TYPE_RISCV_U_SOC "riscv.sifive.u.soc"
 diff --git a/hw/riscv/sifive_u_otp.c b/hw/misc/sifive_u_otp.c
 similarity index 99%
 rename from hw/riscv/sifive_u_otp.c
 rename to hw/misc/sifive_u_otp.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_u_otp.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/misc/sifive_u_otp.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vmor_mm         011010 - ..... ..... 010 ..... 1010111 @r
- #include "hw/sysbus.h"
+ vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
- #include "qemu/log.h"
+ vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
- #include "qemu/module.h"
+ vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
--#include "hw/riscv/sifive_u_otp.h"
++vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
-+#include "hw/misc/sifive_u_otp.h"
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- static uint64_t sifive_u_otp_read(void *opaque, hwaddr addr, unsigned int size)
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
- {
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/Kconfig
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/misc/Kconfig
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ config AVR_POWER
+@@ -XXX,XX +XXX,XX @@ GEN_MM_TRANS(vmor_mm)
- config SIFIVE_E_PRCI
+ GEN_MM_TRANS(vmnor_mm)
-     bool
+ GEN_MM_TRANS(vmornot_mm)
+ GEN_MM_TRANS(vmxnor_mm)
 +config SIFIVE_U_OTP
 +    bool
 +
- config SIFIVE_U_PRCI
++/* Vector mask population count vmpopc */
-     bool
++static bool trans_vmpopc_m(DisasContext *s, arg_rmr *a)
++{
-diff --git a/hw/misc/meson.build b/hw/misc/meson.build
++    if (vext_check_isa_ill(s)) {
 +        TCGv_ptr src2, mask;
 +        TCGv dst;
 +        TCGv_i32 desc;
 +        uint32_t data = 0;
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +
 +        mask = tcg_temp_new_ptr();
 +        src2 = tcg_temp_new_ptr();
 +        dst = tcg_temp_new();
 +        desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +        tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, a->rs2));
 +        tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +        gen_helper_vmpopc_m(dst, mask, src2, cpu_env, desc);
 +        gen_set_gpr(a->rd, dst);
 +
 +        tcg_temp_free_ptr(mask);
 +        tcg_temp_free_ptr(src2);
 +        tcg_temp_free(dst);
 +        tcg_temp_free_i32(desc);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/meson.build
+--- a/target/riscv/vector_helper.c
-+++ b/hw/misc/meson.build
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_MASK_VV(vmor_mm, DO_OR)
+ GEN_VEXT_MASK_VV(vmnor_mm, DO_NOR)
- # RISC-V devices
+ GEN_VEXT_MASK_VV(vmornot_mm, DO_ORNOT)
- softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
+ GEN_VEXT_MASK_VV(vmxnor_mm, DO_XNOR)
-+softmmu_ss.add(when: 'CONFIG_SIFIVE_U_OTP', if_true: files('sifive_u_otp.c'))
++
- softmmu_ss.add(when: 'CONFIG_SIFIVE_U_PRCI', if_true: files('sifive_u_prci.c'))
++/* Vector mask population count vmpopc */
++target_ulong HELPER(vmpopc_m)(void *v0, void *vs2, CPURISCVState *env,
- # PKUnity SoC devices
++                              uint32_t desc)
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++{
-index XXXXXXX..XXXXXXX 100644
++    target_ulong cnt = 0;
---- a/hw/riscv/Kconfig
++    uint32_t mlen = vext_mlen(desc);
-+++ b/hw/riscv/Kconfig
++    uint32_t vm = vext_vm(desc);
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
++    uint32_t vl = env->vl;
-     select HART
++    int i;
-     select SIFIVE
++
-     select SIFIVE_PDMA
++    for (i = 0; i < vl; i++) {
-+    select SIFIVE_U_OTP
++        if (vm || vext_elem_mask(v0, mlen, i)) {
-     select SIFIVE_U_PRCI
++            if (vext_elem_mask(vs2, mlen, i)) {
-     select UNIMP
++                cnt++;
++            }
-diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
++        }
-index XXXXXXX..XXXXXXX 100644
++    }
---- a/hw/riscv/meson.build
++    return cnt;
-+++ b/hw/riscv/meson.build
++}
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
  riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
 --
-.28.0
+.27.0

-[PULL 20/30] hw/riscv: Move sifive_u_prci model to hw/misc
+[PULL v2 54/64] target/riscv: vmfirst find-first-set mask bit
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-codes. Let's move sifive_u_prci model to hw/misc directory.
+Message-Id: <20200701152549.1218-52-zhiwei_liu@c-sky.com>
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1599129623-68957-3-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => misc}/sifive_u_prci.h | 0
+ target/riscv/helper.h                   |  2 ++
- include/hw/riscv/sifive_u.h                | 2 +-
+ target/riscv/insn32.decode              |  1 +
- hw/{riscv => misc}/sifive_u_prci.c         | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
- hw/misc/Kconfig                            | 3 +++
+ target/riscv/vector_helper.c            | 19 +++++++++++++++
- hw/misc/meson.build                        | 1 +
+files changed, 54 insertions(+)
  hw/riscv/Kconfig                           | 1 +
  hw/riscv/meson.build                       | 1 -
 files changed, 7 insertions(+), 3 deletions(-)
  rename include/hw/{riscv => misc}/sifive_u_prci.h (100%)
  rename hw/{riscv => misc}/sifive_u_prci.c (99%)
-diff --git a/include/hw/riscv/sifive_u_prci.h b/include/hw/misc/sifive_u_prci.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/sifive_u_prci.h
 rename to include/hw/misc/sifive_u_prci.h
 diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/sifive_u.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/sifive_u.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/riscv_hart.h"
+ DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #include "hw/riscv/sifive_cpu.h"
- #include "hw/riscv/sifive_gpio.h"
+ DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_u_prci.h"
++
- #include "hw/riscv/sifive_u_otp.h"
++DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
-+#include "hw/misc/sifive_u_prci.h"
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
  #define TYPE_RISCV_U_SOC "riscv.sifive.u.soc"
  #define RISCV_U_SOC(obj) \
 diff --git a/hw/riscv/sifive_u_prci.c b/hw/misc/sifive_u_prci.c
 similarity index 99%
 rename from hw/riscv/sifive_u_prci.c
 rename to hw/misc/sifive_u_prci.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_u_prci.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/misc/sifive_u_prci.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
- #include "hw/sysbus.h"
+ vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
- #include "qemu/log.h"
+ vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
- #include "qemu/module.h"
+ vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
--#include "hw/riscv/sifive_u_prci.h"
++vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
-+#include "hw/misc/sifive_u_prci.h"
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- static uint64_t sifive_u_prci_read(void *opaque, hwaddr addr, unsigned int size)
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
- {
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/Kconfig
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/misc/Kconfig
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ config AVR_POWER
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmpopc_m(DisasContext *s, arg_rmr *a)
- config SIFIVE_E_PRCI
+     }
-     bool
+     return false;
+ }
 +config SIFIVE_U_PRCI
 +    bool
 +
- source macio/Kconfig
++/* vmfirst find-first-set mask bit */
-diff --git a/hw/misc/meson.build b/hw/misc/meson.build
++static bool trans_vmfirst_m(DisasContext *s, arg_rmr *a)
 +{
 +    if (vext_check_isa_ill(s)) {
 +        TCGv_ptr src2, mask;
 +        TCGv dst;
 +        TCGv_i32 desc;
 +        uint32_t data = 0;
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +
 +        mask = tcg_temp_new_ptr();
 +        src2 = tcg_temp_new_ptr();
 +        dst = tcg_temp_new();
 +        desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +        tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, a->rs2));
 +        tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +        gen_helper_vmfirst_m(dst, mask, src2, cpu_env, desc);
 +        gen_set_gpr(a->rd, dst);
 +
 +        tcg_temp_free_ptr(mask);
 +        tcg_temp_free_ptr(src2);
 +        tcg_temp_free(dst);
 +        tcg_temp_free_i32(desc);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/misc/meson.build
+--- a/target/riscv/vector_helper.c
-+++ b/hw/misc/meson.build
++++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
+@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vmpopc_m)(void *v0, void *vs2, CPURISCVState *env,
+     }
- # RISC-V devices
+     return cnt;
- softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
+ }
-+softmmu_ss.add(when: 'CONFIG_SIFIVE_U_PRCI', if_true: files('sifive_u_prci.c'))
++
++/* vmfirst find-first-set mask bit*/
- # PKUnity SoC devices
++target_ulong HELPER(vmfirst_m)(void *v0, void *vs2, CPURISCVState *env,
- softmmu_ss.add(when: 'CONFIG_PUV3', if_true: files('puv3_pm.c'))
++                               uint32_t desc)
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++{
-index XXXXXXX..XXXXXXX 100644
++    uint32_t mlen = vext_mlen(desc);
---- a/hw/riscv/Kconfig
++    uint32_t vm = vext_vm(desc);
-+++ b/hw/riscv/Kconfig
++    uint32_t vl = env->vl;
-@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
++    int i;
-     select HART
++
-     select SIFIVE
++    for (i = 0; i < vl; i++) {
-     select SIFIVE_PDMA
++        if (vm || vext_elem_mask(v0, mlen, i)) {
-+    select SIFIVE_U_PRCI
++            if (vext_elem_mask(vs2, mlen, i)) {
-     select UNIMP
++                return i;
++            }
- config SPIKE
++        }
-diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
++    }
-index XXXXXXX..XXXXXXX 100644
++    return -1LL;
---- a/hw/riscv/meson.build
++}
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_prci.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
  riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
  riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
 --
-.28.0
+.27.0

-[PULL 08/30] hw/riscv: microchip_pfsoc: Connect 5 MMUARTs
+[PULL v2 55/64] target/riscv: set-X-first mask bit
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Microchip PolarFire SoC has 5 MMUARTs, and the Icicle Kit board
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-wires 4 of them out. Let's connect all 5 MMUARTs.
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-Id: <20200701152549.1218-53-zhiwei_liu@c-sky.com>
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1598924352-89526-7-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/microchip_pfsoc.h | 20 ++++++++++++++++++++
+ target/riscv/helper.h                   |  4 ++
- hw/riscv/microchip_pfsoc.c         | 30 ++++++++++++++++++++++++++++++
+ target/riscv/insn32.decode              |  3 ++
- hw/riscv/Kconfig                   |  1 +
+ target/riscv/insn_trans/trans_rvv.inc.c | 28 +++++++++++
-files changed, 51 insertions(+)
+ target/riscv/vector_helper.c            | 63 +++++++++++++++++++++++++
 files changed, 98 insertions(+)
-diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/microchip_pfsoc.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/microchip_pfsoc.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
- #ifndef HW_MICROCHIP_PFSOC_H
+ DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
- #define HW_MICROCHIP_PFSOC_H
+ DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
 +#include "hw/char/mchp_pfsoc_mmuart.h"
 +
- typedef struct MicrochipPFSoCState {
++DEF_HELPER_5(vmsbf_m, void, ptr, ptr, ptr, env, i32)
-     /*< private >*/
++DEF_HELPER_5(vmsif_m, void, ptr, ptr, ptr, env, i32)
-     DeviceState parent_obj;
++DEF_HELPER_5(vmsof_m, void, ptr, ptr, ptr, env, i32)
-@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-     RISCVHartArrayState e_cpus;
+index XXXXXXX..XXXXXXX 100644
-     RISCVHartArrayState u_cpus;
+--- a/target/riscv/insn32.decode
-     DeviceState *plic;
++++ b/target/riscv/insn32.decode
-+    MchpPfSoCMMUartState *serial0;
+@@ -XXX,XX +XXX,XX @@ vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
-+    MchpPfSoCMMUartState *serial1;
+ vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
-+    MchpPfSoCMMUartState *serial2;
+ vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
-+    MchpPfSoCMMUartState *serial3;
+ vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
-+    MchpPfSoCMMUartState *serial4;
++vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
- } MicrochipPFSoCState;
++vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
++vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
- #define TYPE_MICROCHIP_PFSOC    "microchip.pfsoc"
-@@ -XXX,XX +XXX,XX @@ enum {
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-     MICROCHIP_PFSOC_L2CC,
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-     MICROCHIP_PFSOC_L2LIM,
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-     MICROCHIP_PFSOC_PLIC,
+index XXXXXXX..XXXXXXX 100644
-+    MICROCHIP_PFSOC_MMUART0,
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-     MICROCHIP_PFSOC_SYSREG,
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-     MICROCHIP_PFSOC_MPUCFG,
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmfirst_m(DisasContext *s, arg_rmr *a)
-+    MICROCHIP_PFSOC_MMUART1,
+     }
-+    MICROCHIP_PFSOC_MMUART2,
+     return false;
-+    MICROCHIP_PFSOC_MMUART3,
+ }
-+    MICROCHIP_PFSOC_MMUART4,
++
-     MICROCHIP_PFSOC_ENVM_CFG,
++/* vmsbf.m set-before-first mask bit */
-     MICROCHIP_PFSOC_ENVM_DATA,
++/* vmsif.m set-includ-first mask bit */
-     MICROCHIP_PFSOC_IOSCB_CFG,
++/* vmsof.m set-only-first mask bit */
-     MICROCHIP_PFSOC_DRAM,
++#define GEN_M_TRANS(NAME)                                          \
- };
++static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
++{                                                                  \
-+enum {
++    if (vext_check_isa_ill(s)) {                                   \
-+    MICROCHIP_PFSOC_MMUART0_IRQ = 90,
++        uint32_t data = 0;                                         \
-+    MICROCHIP_PFSOC_MMUART1_IRQ = 91,
++        gen_helper_gvec_3_ptr *fn = gen_helper_##NAME;             \
-+    MICROCHIP_PFSOC_MMUART2_IRQ = 92,
++        TCGLabel *over = gen_new_label();                          \
-+    MICROCHIP_PFSOC_MMUART3_IRQ = 93,
++        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+    MICROCHIP_PFSOC_MMUART4_IRQ = 94,
++                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd),                     \
 +                           vreg_ofs(s, 0), vreg_ofs(s, a->rs2),    \
 +                           cpu_env, 0, s->vlen / 8, data, fn);     \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_M_TRANS(vmsbf_m)
 +GEN_M_TRANS(vmsif_m)
 +GEN_M_TRANS(vmsof_m)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vmfirst_m)(void *v0, void *vs2, CPURISCVState *env,
      }
      return -1LL;
  }
 +
 +enum set_mask_type {
 +    ONLY_FIRST = 1,
 +    INCLUDE_FIRST,
 +    BEFORE_FIRST,
 +};
 +
- #define MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT    1
++static void vmsetm(void *vd, void *v0, void *vs2, CPURISCVState *env,
- #define MICROCHIP_PFSOC_COMPUTE_CPU_COUNT       4
++                   uint32_t desc, enum set_mask_type type)
++{
-diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
++    uint32_t mlen = vext_mlen(desc);
-index XXXXXXX..XXXXXXX 100644
++    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;
---- a/hw/riscv/microchip_pfsoc.c
++    uint32_t vm = vext_vm(desc);
-+++ b/hw/riscv/microchip_pfsoc.c
++    uint32_t vl = env->vl;
-@@ -XXX,XX +XXX,XX @@
++    int i;
-  * 0) CLINT (Core Level Interruptor)
++    bool first_mask_bit = false;
   * 1) PLIC (Platform Level Interrupt Controller)
   * 2) eNVM (Embedded Non-Volatile Memory)
 + * 3) MMUARTs (Multi-Mode UART)
   *
   * This board currently generates devicetree dynamically that indicates at least
   * two harts and up to five harts.
@@ -XXX,XX +XXX,XX @@
  #include "hw/irq.h"
  #include "hw/loader.h"
  #include "hw/sysbus.h"
 +#include "chardev/char.h"
  #include "hw/cpu/cluster.h"
  #include "target/riscv/cpu.h"
  #include "hw/misc/unimp.h"
@@ -XXX,XX +XXX,XX @@
  #include "hw/riscv/sifive_clint.h"
  #include "hw/riscv/sifive_plic.h"
  #include "hw/riscv/microchip_pfsoc.h"
 +#include "sysemu/sysemu.h"
  /*
   * The BIOS image used by this machine is called Hart Software Services (HSS).
@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
      [MICROCHIP_PFSOC_L2CC] =            {  0x2010000,     0x1000 },
      [MICROCHIP_PFSOC_L2LIM] =           {  0x8000000,  0x2000000 },
      [MICROCHIP_PFSOC_PLIC] =            {  0xc000000,  0x4000000 },
 +    [MICROCHIP_PFSOC_MMUART0] =         { 0x20000000,     0x1000 },
      [MICROCHIP_PFSOC_SYSREG] =          { 0x20002000,     0x2000 },
      [MICROCHIP_PFSOC_MPUCFG] =          { 0x20005000,     0x1000 },
 +    [MICROCHIP_PFSOC_MMUART1] =         { 0x20100000,     0x1000 },
 +    [MICROCHIP_PFSOC_MMUART2] =         { 0x20102000,     0x1000 },
 +    [MICROCHIP_PFSOC_MMUART3] =         { 0x20104000,     0x1000 },
 +    [MICROCHIP_PFSOC_MMUART4] =         { 0x20106000,     0x1000 },
      [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
      [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
      [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
          memmap[MICROCHIP_PFSOC_MPUCFG].base,
          memmap[MICROCHIP_PFSOC_MPUCFG].size);
 +    /* MMUARTs */
 +    s->serial0 = mchp_pfsoc_mmuart_create(system_memory,
 +        memmap[MICROCHIP_PFSOC_MMUART0].base,
 +        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART0_IRQ),
 +        serial_hd(0));
 +    s->serial1 = mchp_pfsoc_mmuart_create(system_memory,
 +        memmap[MICROCHIP_PFSOC_MMUART1].base,
 +        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART1_IRQ),
 +        serial_hd(1));
 +    s->serial2 = mchp_pfsoc_mmuart_create(system_memory,
 +        memmap[MICROCHIP_PFSOC_MMUART2].base,
 +        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART2_IRQ),
 +        serial_hd(2));
 +    s->serial3 = mchp_pfsoc_mmuart_create(system_memory,
 +        memmap[MICROCHIP_PFSOC_MMUART3].base,
 +        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART3_IRQ),
 +        serial_hd(3));
 +    s->serial4 = mchp_pfsoc_mmuart_create(system_memory,
 +        memmap[MICROCHIP_PFSOC_MMUART4].base,
 +        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART4_IRQ),
 +        serial_hd(4));
 +
-     /* eNVM */
++    for (i = 0; i < vl; i++) {
-     memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
++        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-                            memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
++            continue;
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++        }
-index XXXXXXX..XXXXXXX 100644
++        /* write a zero to all following active elements */
---- a/hw/riscv/Kconfig
++        if (first_mask_bit) {
-+++ b/hw/riscv/Kconfig
++            vext_set_elem_mask(vd, mlen, i, 0);
-@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
++            continue;
-     select HART
++        }
-     select SIFIVE
++        if (vext_elem_mask(vs2, mlen, i)) {
-     select UNIMP
++            first_mask_bit = true;
-+    select MCHP_PFSOC_MMUART
++            if (type == BEFORE_FIRST) {
 +                vext_set_elem_mask(vd, mlen, i, 0);
 +            } else {
 +                vext_set_elem_mask(vd, mlen, i, 1);
 +            }
 +        } else {
 +            if (type == ONLY_FIRST) {
 +                vext_set_elem_mask(vd, mlen, i, 0);
 +            } else {
 +                vext_set_elem_mask(vd, mlen, i, 1);
 +            }
 +        }
 +    }
 +    for (; i < vlmax; i++) {
 +        vext_set_elem_mask(vd, mlen, i, 0);
 +    }
 +}
 +
 +void HELPER(vmsbf_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
 +                     uint32_t desc)
 +{
 +    vmsetm(vd, v0, vs2, env, desc, BEFORE_FIRST);
 +}
 +
 +void HELPER(vmsif_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
 +                     uint32_t desc)
 +{
 +    vmsetm(vd, v0, vs2, env, desc, INCLUDE_FIRST);
 +}
 +
 +void HELPER(vmsof_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
 +                     uint32_t desc)
 +{
 +    vmsetm(vd, v0, vs2, env, desc, ONLY_FIRST);
 +}
 --
-.28.0
+.27.0

-[PULL 19/30] hw/riscv: Move sifive_e_prci model to hw/misc
+[PULL v2 56/64] target/riscv: vector iota instruction
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-This is an effort to clean up the hw/riscv directory. Ideally it
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-should only contain the RISC-V SoC / machine codes plus generic
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-codes. Let's move sifive_e_prci model to hw/misc directory.
+Message-Id: <20200701152549.1218-54-zhiwei_liu@c-sky.com>
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1599129623-68957-2-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/{riscv => misc}/sifive_e_prci.h | 0
+ target/riscv/helper.h                   |  5 +++++
- hw/{riscv => misc}/sifive_e_prci.c         | 2 +-
+ target/riscv/insn32.decode              |  1 +
- hw/riscv/sifive_e.c                        | 2 +-
+ target/riscv/insn_trans/trans_rvv.inc.c | 27 +++++++++++++++++++++++
- hw/misc/Kconfig                            | 3 +++
+ target/riscv/vector_helper.c            | 29 +++++++++++++++++++++++++
- hw/misc/meson.build                        | 3 +++
+files changed, 62 insertions(+)
  hw/riscv/Kconfig                           | 1 +
  hw/riscv/meson.build                       | 1 -
 files changed, 9 insertions(+), 3 deletions(-)
  rename include/hw/{riscv => misc}/sifive_e_prci.h (100%)
  rename hw/{riscv => misc}/sifive_e_prci.c (99%)
-diff --git a/include/hw/riscv/sifive_e_prci.h b/include/hw/misc/sifive_e_prci.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 similarity index 100%
 rename from include/hw/riscv/sifive_e_prci.h
 rename to include/hw/misc/sifive_e_prci.h
 diff --git a/hw/riscv/sifive_e_prci.c b/hw/misc/sifive_e_prci.c
 similarity index 99%
 rename from hw/riscv/sifive_e_prci.c
 rename to hw/misc/sifive_e_prci.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_e_prci.c
+--- a/target/riscv/helper.h
-+++ b/hw/misc/sifive_e_prci.c
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
- #include "qemu/log.h"
+ DEF_HELPER_5(vmsbf_m, void, ptr, ptr, ptr, env, i32)
- #include "qemu/module.h"
+ DEF_HELPER_5(vmsif_m, void, ptr, ptr, ptr, env, i32)
- #include "hw/hw.h"
+ DEF_HELPER_5(vmsof_m, void, ptr, ptr, ptr, env, i32)
--#include "hw/riscv/sifive_e_prci.h"
++
-+#include "hw/misc/sifive_e_prci.h"
++DEF_HELPER_5(viota_m_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(viota_m_h, void, ptr, ptr, ptr, env, i32)
- static uint64_t sifive_e_prci_read(void *opaque, hwaddr addr, unsigned int size)
++DEF_HELPER_5(viota_m_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(viota_m_d, void, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
  vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
  vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
  vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
 +viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
  GEN_M_TRANS(vmsbf_m)
  GEN_M_TRANS(vmsif_m)
  GEN_M_TRANS(vmsof_m)
 +
 +/* Vector Iota Instruction */
 +static bool trans_viota_m(DisasContext *s, arg_viota_m *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2, 1) &&
 +        (a->vm != 0 || a->rd != 0)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        static gen_helper_gvec_3_ptr * const fns[4] = {
 +            gen_helper_viota_m_b, gen_helper_viota_m_h,
 +            gen_helper_viota_m_w, gen_helper_viota_m_d,
 +        };
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,
 +                           s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vmsof_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
  {
-diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
+     vmsetm(vd, v0, vs2, env, desc, ONLY_FIRST);
-index XXXXXXX..XXXXXXX 100644
+ }
 --- a/hw/riscv/sifive_e.c
 +++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@
  #include "hw/riscv/sifive_clint.h"
  #include "hw/riscv/sifive_uart.h"
  #include "hw/riscv/sifive_e.h"
 -#include "hw/riscv/sifive_e_prci.h"
  #include "hw/riscv/boot.h"
 +#include "hw/misc/sifive_e_prci.h"
  #include "chardev/char.h"
  #include "sysemu/arch_init.h"
  #include "sysemu/sysemu.h"
 diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/misc/Kconfig
 +++ b/hw/misc/Kconfig
@@ -XXX,XX +XXX,XX @@ config MAC_VIA
  config AVR_POWER
      bool
 +config SIFIVE_E_PRCI
 +    bool
 +
- source macio/Kconfig
++/* Vector Iota Instruction */
-diff --git a/hw/misc/meson.build b/hw/misc/meson.build
++#define GEN_VEXT_VIOTA_M(NAME, ETYPE, H, CLEAR_FN)                        \
-index XXXXXXX..XXXXXXX 100644
++void HELPER(NAME)(void *vd, void *v0, void *vs2, CPURISCVState *env,      \
---- a/hw/misc/meson.build
++                  uint32_t desc)                                          \
-+++ b/hw/misc/meson.build
++{                                                                         \
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_ARM11SCU', if_true: files('arm11scu.c'))
++    uint32_t mlen = vext_mlen(desc);                                      \
- # Mac devices
++    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
- softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
++    uint32_t vm = vext_vm(desc);                                          \
++    uint32_t vl = env->vl;                                                \
-+# RISC-V devices
++    uint32_t sum = 0;                                                     \
-+softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
++    int i;                                                                \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = sum;                                      \
 +        if (vext_elem_mask(vs2, mlen, i)) {                               \
 +            sum++;                                                        \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
- # PKUnity SoC devices
++GEN_VEXT_VIOTA_M(viota_m_b, uint8_t, H1, clearb)
- softmmu_ss.add(when: 'CONFIG_PUV3', if_true: files('puv3_pm.c'))
++GEN_VEXT_VIOTA_M(viota_m_h, uint16_t, H2, clearh)
++GEN_VEXT_VIOTA_M(viota_m_w, uint32_t, H4, clearl)
-diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
++GEN_VEXT_VIOTA_M(viota_m_d, uint64_t, H8, clearq)
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/Kconfig
 +++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
      bool
      select HART
      select SIFIVE
 +    select SIFIVE_E_PRCI
      select UNIMP
  config SIFIVE_U
 diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/meson.build
 +++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 -riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e_prci.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
  riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_prci.c'))
 --
-.28.0
+.27.0

-[PULL 16/30] hw/riscv: microchip_pfsoc: Hook GPIO controllers
+[PULL v2 57/64] target/riscv: vector element index instruction
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Microchip PolarFire SoC integrates 3 GPIOs controllers. It seems
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-enough to create unimplemented devices to cover their register
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-spaces at this point.
+Message-Id: <20200701152549.1218-55-zhiwei_liu@c-sky.com>
 With this commit, QEMU can boot to U-Boot (2nd stage bootloader)
 all the way to the Linux shell login prompt, with a modified HSS
 (1st stage bootloader).
 For detailed instructions on how to create images for the Icicle
 Kit board, please check QEMU RISC-V WiKi page at:
 https://wiki.qemu.org/Documentation/Platforms/RISCV
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-Id: <1598924352-89526-15-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/microchip_pfsoc.h |  3 +++
+ target/riscv/helper.h                   |  5 +++++
- hw/riscv/microchip_pfsoc.c         | 14 ++++++++++++++
+ target/riscv/insn32.decode              |  2 ++
-files changed, 17 insertions(+)
+ target/riscv/insn_trans/trans_rvv.inc.c | 25 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 24 ++++++++++++++++++++++++
 files changed, 56 insertions(+)
-diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/microchip_pfsoc.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/microchip_pfsoc.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ enum {
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(viota_m_b, void, ptr, ptr, ptr, env, i32)
-     MICROCHIP_PFSOC_MMUART4,
+ DEF_HELPER_5(viota_m_h, void, ptr, ptr, ptr, env, i32)
-     MICROCHIP_PFSOC_GEM0,
+ DEF_HELPER_5(viota_m_w, void, ptr, ptr, ptr, env, i32)
-     MICROCHIP_PFSOC_GEM1,
+ DEF_HELPER_5(viota_m_d, void, ptr, ptr, ptr, env, i32)
-+    MICROCHIP_PFSOC_GPIO0,
++
-+    MICROCHIP_PFSOC_GPIO1,
++DEF_HELPER_4(vid_v_b, void, ptr, ptr, env, i32)
-+    MICROCHIP_PFSOC_GPIO2,
++DEF_HELPER_4(vid_v_h, void, ptr, ptr, env, i32)
-     MICROCHIP_PFSOC_ENVM_CFG,
++DEF_HELPER_4(vid_v_w, void, ptr, ptr, env, i32)
-     MICROCHIP_PFSOC_ENVM_DATA,
++DEF_HELPER_4(vid_v_d, void, ptr, ptr, env, i32)
-     MICROCHIP_PFSOC_IOSCB_CFG,
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/microchip_pfsoc.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
+@@ -XXX,XX +XXX,XX @@
-     [MICROCHIP_PFSOC_MMUART4] =         { 0x20106000,     0x1000 },
+ @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
-     [MICROCHIP_PFSOC_GEM0] =            { 0x20110000,     0x2000 },
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
-     [MICROCHIP_PFSOC_GEM1] =            { 0x20112000,     0x2000 },
+ @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
-+    [MICROCHIP_PFSOC_GPIO0] =           { 0x20120000,     0x1000 },
++@r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
-+    [MICROCHIP_PFSOC_GPIO1] =           { 0x20121000,     0x1000 },
+ @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
-+    [MICROCHIP_PFSOC_GPIO2] =           { 0x20122000,     0x1000 },
+ @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
-     [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
+ @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
-     [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
+@@ -XXX,XX +XXX,XX @@ vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
-     [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
+ vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
-@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
+ vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
-     sysbus_connect_irq(SYS_BUS_DEVICE(&s->gem1), 0,
+ viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
-         qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_GEM1_IRQ));
++vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
-+    /* GPIOs */
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-+    create_unimplemented_device("microchip.pfsoc.gpio0",
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-+        memmap[MICROCHIP_PFSOC_GPIO0].base,
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-+        memmap[MICROCHIP_PFSOC_GPIO0].size);
+index XXXXXXX..XXXXXXX 100644
-+    create_unimplemented_device("microchip.pfsoc.gpio1",
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+        memmap[MICROCHIP_PFSOC_GPIO1].base,
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-+        memmap[MICROCHIP_PFSOC_GPIO1].size);
+@@ -XXX,XX +XXX,XX @@ static bool trans_viota_m(DisasContext *s, arg_viota_m *a)
-+    create_unimplemented_device("microchip.pfsoc.gpio2",
+     }
-+        memmap[MICROCHIP_PFSOC_GPIO2].base,
+     return false;
-+        memmap[MICROCHIP_PFSOC_GPIO2].size);
+ }
 +
-     /* eNVM */
++/* Vector Element Index Instruction */
-     memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
++static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
-                            memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
++{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        vext_check_overlap_mask(s, a->rd, a->vm, false)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        static gen_helper_gvec_2_ptr * const fns[4] = {
 +            gen_helper_vid_v_b, gen_helper_vid_v_h,
 +            gen_helper_vid_v_w, gen_helper_vid_v_d,
 +        };
 +        tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VIOTA_M(viota_m_b, uint8_t, H1, clearb)
  GEN_VEXT_VIOTA_M(viota_m_h, uint16_t, H2, clearh)
  GEN_VEXT_VIOTA_M(viota_m_w, uint32_t, H4, clearl)
  GEN_VEXT_VIOTA_M(viota_m_d, uint64_t, H8, clearq)
 +
 +/* Vector Element Index Instruction */
 +#define GEN_VEXT_VID_V(NAME, ETYPE, H, CLEAR_FN)                          \
 +void HELPER(NAME)(void *vd, void *v0, CPURISCVState *env, uint32_t desc)  \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    int i;                                                                \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = i;                                        \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +GEN_VEXT_VID_V(vid_v_b, uint8_t, H1, clearb)
 +GEN_VEXT_VID_V(vid_v_h, uint16_t, H2, clearh)
 +GEN_VEXT_VID_V(vid_v_w, uint32_t, H4, clearl)
 +GEN_VEXT_VID_V(vid_v_d, uint64_t, H8, clearq)
 --
-.28.0
+.27.0

-[PULL 09/30] hw/sd: Add Cadence SDHCI emulation
+[PULL v2 58/64] target/riscv: integer extract instruction
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Cadence SD/SDIO/eMMC Host Controller (SD4HC) is an SDHCI compatible
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-controller. The SDHCI compatible registers start from offset 0x200,
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-which are called Slot Register Set (SRS) in its datasheet.
+Message-Id: <20200701152549.1218-56-zhiwei_liu@c-sky.com>
 This creates a Cadence SDHCI model built on top of the existing
 generic SDHCI model. Cadence specific Host Register Set (HRS) is
 implemented to make guest software happy.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Acked-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1598924352-89526-8-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/sd/cadence_sdhci.h |  47 +++++++++
+ target/riscv/insn32.decode              |   1 +
- hw/sd/cadence_sdhci.c         | 193 ++++++++++++++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvv.inc.c | 116 ++++++++++++++++++++++++
- hw/sd/Kconfig                 |   4 +
+files changed, 117 insertions(+)
  hw/sd/meson.build             |   1 +
 files changed, 245 insertions(+)
  create mode 100644 include/hw/sd/cadence_sdhci.h
  create mode 100644 hw/sd/cadence_sdhci.c
-diff --git a/include/hw/sd/cadence_sdhci.h b/include/hw/sd/cadence_sdhci.h
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/target/riscv/insn32.decode
---- /dev/null
++++ b/target/riscv/insn32.decode
-+++ b/include/hw/sd/cadence_sdhci.h
+@@ -XXX,XX +XXX,XX @@ vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
-@@ -XXX,XX +XXX,XX @@
+ vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
  viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
  vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
 +vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
      }
      return false;
  }
 +
 +/*
-+ * Cadence SDHCI emulation
++ *** Vector Permutation Instructions
 + *
 + * Copyright (c) 2020 Wind River Systems, Inc.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License as
 + * published by the Free Software Foundation; either version 2 or
 + * (at your option) version 3 of the License.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
-+#ifndef CADENCE_SDHCI_H
++/* Integer Extract Instruction */
 +#define CADENCE_SDHCI_H
 +
-+#include "hw/sd/sdhci.h"
++static void load_element(TCGv_i64 dest, TCGv_ptr base,
-+
++                         int ofs, int sew)
 +#define CADENCE_SDHCI_REG_SIZE  0x100
 +#define CADENCE_SDHCI_NUM_REGS  (CADENCE_SDHCI_REG_SIZE / sizeof(uint32_t))
 +
 +typedef struct CadenceSDHCIState {
 +    SysBusDevice parent;
 +
 +    MemoryRegion container;
 +    MemoryRegion iomem;
 +    BusState *bus;
 +
 +    uint32_t regs[CADENCE_SDHCI_NUM_REGS];
 +
 +    SDHCIState sdhci;
 +} CadenceSDHCIState;
 +
 +#define TYPE_CADENCE_SDHCI  "cadence.sdhci"
 +#define CADENCE_SDHCI(obj)  OBJECT_CHECK(CadenceSDHCIState, (obj), \
 +                                         TYPE_CADENCE_SDHCI)
 +
 +#endif /* CADENCE_SDHCI_H */
 diff --git a/hw/sd/cadence_sdhci.c b/hw/sd/cadence_sdhci.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/hw/sd/cadence_sdhci.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * Cadence SDHCI emulation
 + *
 + * Copyright (c) 2020 Wind River Systems, Inc.
 + *
 + * Author:
 + *   Bin Meng <bin.meng@windriver.com>
 + *
 + * This program is free software; you can redistribute it and/or
 + * modify it under the terms of the GNU General Public License as
 + * published by the Free Software Foundation; either version 2 or
 + * (at your option) version 3 of the License.
 + *
 + * This program is distributed in the hope that it will be useful,
 + * but WITHOUT ANY WARRANTY; without even the implied warranty of
 + * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 + * GNU General Public License for more details.
 + *
 + * You should have received a copy of the GNU General Public License along
 + * with this program; if not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/bitops.h"
 +#include "qemu/error-report.h"
 +#include "qemu/log.h"
 +#include "qapi/error.h"
 +#include "migration/vmstate.h"
 +#include "hw/irq.h"
 +#include "hw/sd/cadence_sdhci.h"
 +#include "sdhci-internal.h"
 +
 +/* HRS - Host Register Set (specific to Cadence) */
 +
 +#define CADENCE_SDHCI_HRS00             0x00    /* general information */
 +#define CADENCE_SDHCI_HRS00_SWR             BIT(0)
 +#define CADENCE_SDHCI_HRS00_POR_VAL         0x00010000
 +
 +#define CADENCE_SDHCI_HRS04             0x10    /* PHY access port */
 +#define CADENCE_SDHCI_HRS04_WR              BIT(24)
 +#define CADENCE_SDHCI_HRS04_RD              BIT(25)
 +#define CADENCE_SDHCI_HRS04_ACK             BIT(26)
 +
 +#define CADENCE_SDHCI_HRS06             0x18    /* eMMC control */
 +#define CADENCE_SDHCI_HRS06_TUNE_UP         BIT(15)
 +
 +/* SRS - Slot Register Set (SDHCI-compatible) */
 +
 +#define CADENCE_SDHCI_SRS_BASE          0x200
 +
 +#define TO_REG(addr)    ((addr) / sizeof(uint32_t))
 +
 +static void cadence_sdhci_instance_init(Object *obj)
 +{
-+    CadenceSDHCIState *s = CADENCE_SDHCI(obj);
++    switch (sew) {
-+
++    case MO_8:
-+    object_initialize_child(OBJECT(s), "generic-sdhci",
++        tcg_gen_ld8u_i64(dest, base, ofs);
 +                            &s->sdhci, TYPE_SYSBUS_SDHCI);
 +}
 +
 +static void cadence_sdhci_reset(DeviceState *dev)
 +{
 +    CadenceSDHCIState *s = CADENCE_SDHCI(dev);
 +
 +    memset(s->regs, 0, CADENCE_SDHCI_REG_SIZE);
 +    s->regs[TO_REG(CADENCE_SDHCI_HRS00)] = CADENCE_SDHCI_HRS00_POR_VAL;
 +
 +    device_cold_reset(DEVICE(&s->sdhci));
 +}
 +
 +static uint64_t cadence_sdhci_read(void *opaque, hwaddr addr, unsigned int size)
 +{
 +    CadenceSDHCIState *s = opaque;
 +    uint32_t val;
 +
 +    val = s->regs[TO_REG(addr)];
 +
 +    return (uint64_t)val;
 +}
 +
 +static void cadence_sdhci_write(void *opaque, hwaddr addr, uint64_t val,
 +                                unsigned int size)
 +{
 +    CadenceSDHCIState *s = opaque;
 +    uint32_t val32 = (uint32_t)val;
 +
 +    switch (addr) {
 +    case CADENCE_SDHCI_HRS00:
 +        /*
 +         * The only writable bit is SWR (software reset) and it automatically
 +         * clears to zero, so essentially this register remains unchanged.
 +         */
 +        if (val32 & CADENCE_SDHCI_HRS00_SWR) {
 +            cadence_sdhci_reset(DEVICE(s));
 +        }
 +
 +        break;
-+    case CADENCE_SDHCI_HRS04:
++    case MO_16:
-+        /*
++        tcg_gen_ld16u_i64(dest, base, ofs);
 +         * Only emulate the ACK bit behavior when read or write transaction
 +         * are requested.
 +         */
 +        if (val32 & (CADENCE_SDHCI_HRS04_WR | CADENCE_SDHCI_HRS04_RD)) {
 +            val32 |= CADENCE_SDHCI_HRS04_ACK;
 +        } else {
 +            val32 &= ~CADENCE_SDHCI_HRS04_ACK;
 +        }
 +
 +        s->regs[TO_REG(addr)] = val32;
 +        break;
-+    case CADENCE_SDHCI_HRS06:
++    case MO_32:
-+        if (val32 & CADENCE_SDHCI_HRS06_TUNE_UP) {
++        tcg_gen_ld32u_i64(dest, base, ofs);
-+            val32 &= ~CADENCE_SDHCI_HRS06_TUNE_UP;
++        break;
-+        }
++    case MO_64:
-+
++        tcg_gen_ld_i64(dest, base, ofs);
 +        s->regs[TO_REG(addr)] = val32;
 +        break;
 +    default:
-+        s->regs[TO_REG(addr)] = val32;
++        g_assert_not_reached();
 +        break;
 +    }
 +}
 +
-+static const MemoryRegionOps cadence_sdhci_ops = {
++/* offset of the idx element with base regsiter r */
-+    .read = cadence_sdhci_read,
++static uint32_t endian_ofs(DisasContext *s, int r, int idx)
 +    .write = cadence_sdhci_write,
 +    .endianness = DEVICE_NATIVE_ENDIAN,
 +    .impl = {
 +        .min_access_size = 4,
 +        .max_access_size = 4,
 +    },
 +    .valid = {
 +        .min_access_size = 4,
 +        .max_access_size = 4,
 +    }
 +};
 +
 +static void cadence_sdhci_realize(DeviceState *dev, Error **errp)
 +{
-+    CadenceSDHCIState *s = CADENCE_SDHCI(dev);
++#ifdef HOST_WORDS_BIGENDIAN
-+    SysBusDevice *sbd = SYS_BUS_DEVICE(dev);
++    return vreg_ofs(s, r) + ((idx ^ (7 >> s->sew)) << s->sew);
-+    SysBusDevice *sbd_sdhci = SYS_BUS_DEVICE(&s->sdhci);
++#else
-+
++    return vreg_ofs(s, r) + (idx << s->sew);
-+    memory_region_init(&s->container, OBJECT(s),
++#endif
 +                       "cadence.sdhci-container", 0x1000);
 +    sysbus_init_mmio(sbd, &s->container);
 +
 +    memory_region_init_io(&s->iomem, OBJECT(s), &cadence_sdhci_ops,
 +                          s, TYPE_CADENCE_SDHCI, CADENCE_SDHCI_REG_SIZE);
 +    memory_region_add_subregion(&s->container, 0, &s->iomem);
 +
 +    sysbus_realize(sbd_sdhci, errp);
 +    memory_region_add_subregion(&s->container, CADENCE_SDHCI_SRS_BASE,
 +                                sysbus_mmio_get_region(sbd_sdhci, 0));
 +
 +    /* propagate irq and "sd-bus" from generic-sdhci */
 +    sysbus_pass_irq(sbd, sbd_sdhci);
 +    s->bus = qdev_get_child_bus(DEVICE(sbd_sdhci), "sd-bus");
 +}
 +
-+static const VMStateDescription vmstate_cadence_sdhci = {
++/* adjust the index according to the endian */
-+    .name = TYPE_CADENCE_SDHCI,
++static void endian_adjust(TCGv_i32 ofs, int sew)
 +    .version_id = 1,
 +    .fields = (VMStateField[]) {
 +        VMSTATE_UINT32_ARRAY(regs, CadenceSDHCIState, CADENCE_SDHCI_NUM_REGS),
 +        VMSTATE_END_OF_LIST(),
 +    },
 +};
 +
 +static void cadence_sdhci_class_init(ObjectClass *classp, void *data)
 +{
-+    DeviceClass *dc = DEVICE_CLASS(classp);
++#ifdef HOST_WORDS_BIGENDIAN
-+
++    tcg_gen_xori_i32(ofs, ofs, 7 >> sew);
-+    dc->desc = "Cadence SD/SDIO/eMMC Host Controller (SD4HC)";
++#endif
 +    dc->realize = cadence_sdhci_realize;
 +    dc->reset = cadence_sdhci_reset;
 +    dc->vmsd = &vmstate_cadence_sdhci;
 +}
 +
-+static TypeInfo cadence_sdhci_info = {
++/* Load idx >= VLMAX ? 0 : vreg[idx] */
-+    .name          = TYPE_CADENCE_SDHCI,
++static void vec_element_loadx(DisasContext *s, TCGv_i64 dest,
-+    .parent        = TYPE_SYS_BUS_DEVICE,
++                              int vreg, TCGv idx, int vlmax)
-+    .instance_size = sizeof(CadenceSDHCIState),
++{
-+    .instance_init = cadence_sdhci_instance_init,
++    TCGv_i32 ofs = tcg_temp_new_i32();
-+    .class_init    = cadence_sdhci_class_init,
++    TCGv_ptr base = tcg_temp_new_ptr();
-+};
++    TCGv_i64 t_idx = tcg_temp_new_i64();
 +    TCGv_i64 t_vlmax, t_zero;
 +
-+static void cadence_sdhci_register_types(void)
++    /*
-+{
++     * Mask the index to the length so that we do
-+    type_register_static(&cadence_sdhci_info);
++     * not produce an out-of-range load.
 +     */
 +    tcg_gen_trunc_tl_i32(ofs, idx);
 +    tcg_gen_andi_i32(ofs, ofs, vlmax - 1);
 +
 +    /* Convert the index to an offset. */
 +    endian_adjust(ofs, s->sew);
 +    tcg_gen_shli_i32(ofs, ofs, s->sew);
 +
 +    /* Convert the index to a pointer. */
 +    tcg_gen_ext_i32_ptr(base, ofs);
 +    tcg_gen_add_ptr(base, base, cpu_env);
 +
 +    /* Perform the load. */
 +    load_element(dest, base,
 +                 vreg_ofs(s, vreg), s->sew);
 +    tcg_temp_free_ptr(base);
 +    tcg_temp_free_i32(ofs);
 +
 +    /* Flush out-of-range indexing to zero.  */
 +    t_vlmax = tcg_const_i64(vlmax);
 +    t_zero = tcg_const_i64(0);
 +    tcg_gen_extu_tl_i64(t_idx, idx);
 +
 +    tcg_gen_movcond_i64(TCG_COND_LTU, dest, t_idx,
 +                        t_vlmax, dest, t_zero);
 +
 +    tcg_temp_free_i64(t_vlmax);
 +    tcg_temp_free_i64(t_zero);
 +    tcg_temp_free_i64(t_idx);
 +}
 +
-+type_init(cadence_sdhci_register_types)
++static void vec_element_loadi(DisasContext *s, TCGv_i64 dest,
-diff --git a/hw/sd/Kconfig b/hw/sd/Kconfig
++                              int vreg, int idx)
-index XXXXXXX..XXXXXXX 100644
++{
---- a/hw/sd/Kconfig
++    load_element(dest, cpu_env, endian_ofs(s, vreg, idx), s->sew);
-+++ b/hw/sd/Kconfig
++}
@@ -XXX,XX +XXX,XX @@ config SDHCI_PCI
      default y if PCI_DEVICES
      depends on PCI
      select SDHCI
 +
-+config CADENCE_SDHCI
++static bool trans_vext_x_v(DisasContext *s, arg_r *a)
-+    bool
++{
-+    select SDHCI
++    TCGv_i64 tmp = tcg_temp_new_i64();
-diff --git a/hw/sd/meson.build b/hw/sd/meson.build
++    TCGv dest = tcg_temp_new();
-index XXXXXXX..XXXXXXX 100644
++
---- a/hw/sd/meson.build
++    if (a->rs1 == 0) {
-+++ b/hw/sd/meson.build
++        /* Special case vmv.x.s rd, vs2. */
-@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_PXA2XX', if_true: files('pxa2xx_mmci.c'))
++        vec_element_loadi(s, tmp, a->rs2, 0);
- softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_sdhost.c'))
++    } else {
- softmmu_ss.add(when: 'CONFIG_ASPEED_SOC', if_true: files('aspeed_sdhci.c'))
++        /* This instruction ignores LMUL and vector register groups */
- softmmu_ss.add(when: 'CONFIG_ALLWINNER_H3', if_true: files('allwinner-sdhost.c'))
++        int vlmax = s->vlen >> (3 + s->sew);
-+softmmu_ss.add(when: 'CONFIG_CADENCE_SDHCI', if_true: files('cadence_sdhci.c'))
++        vec_element_loadx(s, tmp, a->rs2, cpu_gpr[a->rs1], vlmax);
 +    }
 +    tcg_gen_trunc_i64_tl(dest, tmp);
 +    gen_set_gpr(a->rd, dest);
 +
 +    tcg_temp_free(dest);
 +    tcg_temp_free_i64(tmp);
 +    return true;
 +}
 --
-.28.0
+.27.0

-[PULL 14/30] hw/arm: xlnx: Set all boards' GEM 'phy-addr' property value to 23
+[PULL v2 59/64] target/riscv: integer scalar move instruction
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-When cadence_gem model was created for Xilinx boards, the PHY address
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-was hard-coded to 23 in the GEM model. Now that we have introduced a
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-property we can use that to tell GEM model what our PHY address is.
+Message-Id: <20200701152549.1218-57-zhiwei_liu@c-sky.com>
 Change all boards' GEM 'phy-addr' property value to 23, and set the
 PHY address default value to 0 in the GEM model.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1598924352-89526-13-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/arm/xilinx_zynq.c | 1 +
+ target/riscv/internals.h                |  6 +++
- hw/arm/xlnx-versal.c | 1 +
+ target/riscv/insn32.decode              |  1 +
- hw/arm/xlnx-zynqmp.c | 2 ++
+ target/riscv/insn_trans/trans_rvv.inc.c | 60 +++++++++++++++++++++++++
- hw/net/cadence_gem.c | 6 +++---
+files changed, 67 insertions(+)
 files changed, 7 insertions(+), 3 deletions(-)
-diff --git a/hw/arm/xilinx_zynq.c b/hw/arm/xilinx_zynq.c
+diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/xilinx_zynq.c
+--- a/target/riscv/internals.h
-+++ b/hw/arm/xilinx_zynq.c
++++ b/target/riscv/internals.h
-@@ -XXX,XX +XXX,XX @@ static void gem_init(NICInfo *nd, uint32_t base, qemu_irq irq)
+@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, WD, 11, 1)
-         qemu_check_nic_model(nd, TYPE_CADENCE_GEM);
+ target_ulong fclass_h(uint64_t frs1);
-         qdev_set_nic_properties(dev, nd);
+ target_ulong fclass_s(uint64_t frs1);
-     }
+ target_ulong fclass_d(uint64_t frs1);
-+    object_property_set_int(OBJECT(dev), "phy-addr", 23, &error_abort);
++
-     s = SYS_BUS_DEVICE(dev);
++#define SEW8  0
-     sysbus_realize_and_unref(s, &error_fatal);
++#define SEW16 1
-     sysbus_mmio_map(s, 0, base);
++#define SEW32 2
-diff --git a/hw/arm/xlnx-versal.c b/hw/arm/xlnx-versal.c
++#define SEW64 3
 +
  #endif
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/xlnx-versal.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/arm/xlnx-versal.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ static void versal_create_gems(Versal *s, qemu_irq *pic)
+@@ -XXX,XX +XXX,XX @@ vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
-             qemu_check_nic_model(nd, "cadence_gem");
+ viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
-             qdev_set_nic_properties(dev, nd);
+ vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
-         }
+ vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
-+        object_property_set_int(OBJECT(dev), "phy-addr", 23, &error_abort);
++vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
-         object_property_set_int(OBJECT(dev), "num-priority-queues", 2,
-                                 &error_abort);
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
-         object_property_set_link(OBJECT(dev), "dma", OBJECT(&s->mr_ps),
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/hw/arm/xlnx-zynqmp.c b/hw/arm/xlnx-zynqmp.c
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/arm/xlnx-zynqmp.c
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/arm/xlnx-zynqmp.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static void xlnx_zynqmp_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@ static bool trans_vext_x_v(DisasContext *s, arg_r *a)
-         }
+     tcg_temp_free_i64(tmp);
-         object_property_set_int(OBJECT(&s->gem[i]), "revision", GEM_REVISION,
+     return true;
-                                 &error_abort);
+ }
-+        object_property_set_int(OBJECT(&s->gem[i]), "phy-addr", 23,
++
-+                                &error_abort);
++/* Integer Scalar Move Instruction */
-         object_property_set_int(OBJECT(&s->gem[i]), "num-priority-queues", 2,
++
-                                 &error_abort);
++static void store_element(TCGv_i64 val, TCGv_ptr base,
-         if (!sysbus_realize(SYS_BUS_DEVICE(&s->gem[i]), errp)) {
++                          int ofs, int sew)
-diff --git a/hw/net/cadence_gem.c b/hw/net/cadence_gem.c
++{
-index XXXXXXX..XXXXXXX 100644
++    switch (sew) {
---- a/hw/net/cadence_gem.c
++    case MO_8:
-+++ b/hw/net/cadence_gem.c
++        tcg_gen_st8_i64(val, base, ofs);
-@@ -XXX,XX +XXX,XX @@
++        break;
- #define GEM_PHYMNTNC_REG_SHIFT 18
++    case MO_16:
++        tcg_gen_st16_i64(val, base, ofs);
- /* Marvell PHY definitions */
++        break;
--#define BOARD_PHY_ADDRESS    23 /* PHY address we will emulate a device at */
++    case MO_32:
-+#define BOARD_PHY_ADDRESS    0 /* PHY address we will emulate a device at */
++        tcg_gen_st32_i64(val, base, ofs);
++        break;
- #define PHY_REG_CONTROL      0
++    case MO_64:
- #define PHY_REG_STATUS       1
++        tcg_gen_st_i64(val, base, ofs);
-@@ -XXX,XX +XXX,XX @@ static uint64_t gem_read(void *opaque, hwaddr offset, unsigned size)
++        break;
-             uint32_t phy_addr, reg_num;
++    default:
++        g_assert_not_reached();
-             phy_addr = (retval & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
++        break;
--            if (phy_addr == s->phy_addr || phy_addr == 0) {
++    }
-+            if (phy_addr == s->phy_addr) {
++}
-                 reg_num = (retval & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
++
-                 retval &= 0xFFFF0000;
++/*
-                 retval |= gem_phy_read(s, reg_num);
++ * Store vreg[idx] = val.
-@@ -XXX,XX +XXX,XX @@ static void gem_write(void *opaque, hwaddr offset, uint64_t val,
++ * The index must be in range of VLMAX.
-             uint32_t phy_addr, reg_num;
++ */
++static void vec_element_storei(DisasContext *s, int vreg,
-             phy_addr = (val & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
++                               int idx, TCGv_i64 val)
--            if (phy_addr == s->phy_addr || phy_addr == 0) {
++{
-+            if (phy_addr == s->phy_addr) {
++    store_element(val, cpu_env, endian_ofs(s, vreg, idx), s->sew);
-                 reg_num = (val & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
++}
-                 gem_phy_write(s, reg_num, val);
++
-             }
++/* vmv.s.x vd, rs1 # vd[0] = rs1 */
 +static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
 +{
 +    if (vext_check_isa_ill(s)) {
 +        /* This instruction ignores LMUL and vector register groups */
 +        int maxsz = s->vlen >> 3;
 +        TCGv_i64 t1;
 +        TCGLabel *over = gen_new_label();
 +
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +        tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd), maxsz, maxsz, 0);
 +        if (a->rs1 == 0) {
 +            goto done;
 +        }
 +
 +        t1 = tcg_temp_new_i64();
 +        tcg_gen_extu_tl_i64(t1, cpu_gpr[a->rs1]);
 +        vec_element_storei(s, a->rd, 0, t1);
 +        tcg_temp_free_i64(t1);
 +    done:
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 --
-.28.0
+.27.0

-[PULL 13/30] hw/net: cadence_gem: Add a new 'phy-addr' property
+[PULL v2 60/64] target/riscv: floating-point scalar move instructions
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-At present the PHY address of the PHY connected to GEM is hard-coded
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-to either 23 (BOARD_PHY_ADDRESS) or 0. This might not be the case for
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-all boards. Add a new 'phy-addr' property so that board can specify
+Message-Id: <20200701152549.1218-58-zhiwei_liu@c-sky.com>
 the PHY address for each GEM instance.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <1598924352-89526-12-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/net/cadence_gem.h | 2 ++
+ target/riscv/insn32.decode              |  3 ++
- hw/net/cadence_gem.c         | 5 +++--
+ target/riscv/insn_trans/trans_rvv.inc.c | 49 +++++++++++++++++++++++++
-files changed, 5 insertions(+), 2 deletions(-)
+files changed, 52 insertions(+)
-diff --git a/include/hw/net/cadence_gem.h b/include/hw/net/cadence_gem.h
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/net/cadence_gem.h
+--- a/target/riscv/insn32.decode
-+++ b/include/hw/net/cadence_gem.h
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ typedef struct CadenceGEMState {
+@@ -XXX,XX +XXX,XX @@
-     /* Mask of register bits which are write 1 to clear */
+ @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
-     uint32_t regs_w1c[CADENCE_GEM_MAXREG];
+ @r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
+ @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
-+    /* PHY address */
++@r2rd    .......   ..... ..... ... ..... ....... %rs2 %rd
-+    uint8_t phy_addr;
+ @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
-     /* PHY registers backing store */
+ @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
-     uint16_t phy_regs[32];
+ @r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
+@@ -XXX,XX +XXX,XX @@ viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
-diff --git a/hw/net/cadence_gem.c b/hw/net/cadence_gem.c
+ vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
  vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
  vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
 +vfmv_f_s        001100 1 ..... 00000 001 ..... 1010111 @r2rd
 +vfmv_s_f        001101 1 00000 ..... 101 ..... 1010111 @r2
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/net/cadence_gem.c
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/hw/net/cadence_gem.c
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t gem_read(void *opaque, hwaddr offset, unsigned size)
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
-             uint32_t phy_addr, reg_num;
+     }
+     return false;
-             phy_addr = (retval & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
+ }
--            if (phy_addr == BOARD_PHY_ADDRESS || phy_addr == 0) {
++
-+            if (phy_addr == s->phy_addr || phy_addr == 0) {
++/* Floating-Point Scalar Move Instructions */
-                 reg_num = (retval & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
++static bool trans_vfmv_f_s(DisasContext *s, arg_vfmv_f_s *a)
-                 retval &= 0xFFFF0000;
++{
-                 retval |= gem_phy_read(s, reg_num);
++    if (!s->vill && has_ext(s, RVF) &&
-@@ -XXX,XX +XXX,XX @@ static void gem_write(void *opaque, hwaddr offset, uint64_t val,
++        (s->mstatus_fs != 0) && (s->sew != 0)) {
-             uint32_t phy_addr, reg_num;
++        unsigned int len = 8 << s->sew;
++
-             phy_addr = (val & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
++        vec_element_loadi(s, cpu_fpr[a->rd], a->rs2, 0);
--            if (phy_addr == BOARD_PHY_ADDRESS || phy_addr == 0) {
++        if (len < 64) {
-+            if (phy_addr == s->phy_addr || phy_addr == 0) {
++            tcg_gen_ori_i64(cpu_fpr[a->rd], cpu_fpr[a->rd],
-                 reg_num = (val & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
++                            MAKE_64BIT_MASK(len, 64 - len));
-                 gem_phy_write(s, reg_num, val);
++        }
-             }
++
-@@ -XXX,XX +XXX,XX @@ static Property gem_properties[] = {
++        mark_fs_dirty(s);
-     DEFINE_NIC_PROPERTIES(CadenceGEMState, conf),
++        return true;
-     DEFINE_PROP_UINT32("revision", CadenceGEMState, revision,
++    }
-                        GEM_MODID_VALUE),
++    return false;
-+    DEFINE_PROP_UINT8("phy-addr", CadenceGEMState, phy_addr, BOARD_PHY_ADDRESS),
++}
-     DEFINE_PROP_UINT8("num-priority-queues", CadenceGEMState,
++
-                       num_priority_queues, 1),
++/* vfmv.s.f vd, rs1 # vd[0] = rs1 (vs2=0) */
-     DEFINE_PROP_UINT8("num-type1-screeners", CadenceGEMState,
++static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
 +{
 +    if (!s->vill && has_ext(s, RVF) && (s->sew != 0)) {
 +        TCGv_i64 t1;
 +        /* The instructions ignore LMUL and vector register group. */
 +        uint32_t vlmax = s->vlen >> 3;
 +
 +        /* if vl == 0, skip vector register write back */
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        /* zeroed all elements */
 +        tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd), vlmax, vlmax, 0);
 +
 +        /* NaN-box f[rs1] as necessary for SEW */
 +        t1 = tcg_temp_new_i64();
 +        if (s->sew == MO_64 && !has_ext(s, RVD)) {
 +            tcg_gen_ori_i64(t1, cpu_fpr[a->rs1], MAKE_64BIT_MASK(32, 32));
 +        } else {
 +            tcg_gen_mov_i64(t1, cpu_fpr[a->rs1]);
 +        }
 +        vec_element_storei(s, a->rd, 0, t1);
 +        tcg_temp_free_i64(t1);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 --
-.28.0
+.27.0

-New patch
+[PULL v2 61/64] target/riscv: vector slide instructions
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-59-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  17 ++++
  target/riscv/insn32.decode              |   6 ++
  target/riscv/insn_trans/trans_rvv.inc.c |  18 ++++
  target/riscv/vector_helper.c            | 114 ++++++++++++++++++++++++
 files changed, 155 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vid_v_b, void, ptr, ptr, env, i32)
  DEF_HELPER_4(vid_v_h, void, ptr, ptr, env, i32)
  DEF_HELPER_4(vid_v_w, void, ptr, ptr, env, i32)
  DEF_HELPER_4(vid_v_d, void, ptr, ptr, env, i32)
 +
 +DEF_HELPER_6(vslideup_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslideup_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslideup_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslideup_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
  vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
  vfmv_f_s        001100 1 ..... 00000 001 ..... 1010111 @r2rd
  vfmv_s_f        001101 1 00000 ..... 101 ..... 1010111 @r2
 +vslideup_vx     001110 . ..... ..... 100 ..... 1010111 @r_vm
 +vslideup_vi     001110 . ..... ..... 011 ..... 1010111 @r_vm
 +vslide1up_vx    001110 . ..... ..... 110 ..... 1010111 @r_vm
 +vslidedown_vx   001111 . ..... ..... 100 ..... 1010111 @r_vm
 +vslidedown_vi   001111 . ..... ..... 011 ..... 1010111 @r_vm
 +vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
      }
      return false;
  }
 +
 +/* Vector Slide Instructions */
 +static bool slideup_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2));
 +}
 +
 +GEN_OPIVX_TRANS(vslideup_vx, slideup_check)
 +GEN_OPIVX_TRANS(vslide1up_vx, slideup_check)
 +GEN_OPIVI_TRANS(vslideup_vi, 1, vslideup_vx, slideup_check)
 +
 +GEN_OPIVX_TRANS(vslidedown_vx, opivx_check)
 +GEN_OPIVX_TRANS(vslide1down_vx, opivx_check)
 +GEN_OPIVI_TRANS(vslidedown_vi, 1, vslidedown_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VID_V(vid_v_b, uint8_t, H1, clearb)
  GEN_VEXT_VID_V(vid_v_h, uint16_t, H2, clearh)
  GEN_VEXT_VID_V(vid_v_w, uint32_t, H4, clearl)
  GEN_VEXT_VID_V(vid_v_d, uint64_t, H8, clearq)
 +
 +/*
 + *** Vector Permutation Instructions
 + */
 +
 +/* Vector Slide Instructions */
 +#define GEN_VEXT_VSLIDEUP_VX(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    target_ulong offset = s1, i;                                          \
 +                                                                          \
 +    for (i = offset; i < vl; i++) {                                       \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i - offset));          \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslideup.vx vd, vs2, rs1, vm # vd[i+rs1] = vs2[i] */
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDEDOWN_VX(NAME, ETYPE, H, CLEAR_FN)                  \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    target_ulong offset = s1, i;                                          \
 +                                                                          \
 +    for (i = 0; i < vl; ++i) {                                            \
 +        target_ulong j = i + offset;                                      \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = j >= vlmax ? 0 : *((ETYPE *)vs2 + H(j));  \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslidedown.vx vd, vs2, rs1, vm # vd[i] = vs2[i+rs1] */
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDE1UP_VX(NAME, ETYPE, H, CLEAR_FN)                   \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (i == 0) {                                                     \
 +            *((ETYPE *)vd + H(i)) = s1;                                   \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i - 1));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslide1up.vx vd, vs2, rs1, vm # vd[0]=x[rs1], vd[i+1] = vs2[i] */
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDE1DOWN_VX(NAME, ETYPE, H, CLEAR_FN)                 \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (i == vl - 1) {                                                \
 +            *((ETYPE *)vd + H(i)) = s1;                                   \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i + 1));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslide1down.vx vd, vs2, rs1, vm # vd[i] = vs2[i+1], vd[vl-1]=x[rs1] */
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_d, uint64_t, H8, clearq)
 --
 .27.0

-New patch
+[PULL v2 62/64] target/riscv: vector register gather instruction
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-Id: <20200701152549.1218-60-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/helper.h                   |  9 +++
  target/riscv/insn32.decode              |  3 +
  target/riscv/insn_trans/trans_rvv.inc.c | 78 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 60 +++++++++++++++++++
 files changed, 150 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vslide1down_vx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vslide1down_vx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vslide1down_vx_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vslide1down_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vrgather_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vslide1up_vx    001110 . ..... ..... 110 ..... 1010111 @r_vm
  vslidedown_vx   001111 . ..... ..... 100 ..... 1010111 @r_vm
  vslidedown_vi   001111 . ..... ..... 011 ..... 1010111 @r_vm
  vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
 +vrgather_vv     001100 . ..... ..... 000 ..... 1010111 @r_vm
 +vrgather_vx     001100 . ..... ..... 100 ..... 1010111 @r_vm
 +vrgather_vi     001100 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vslideup_vi, 1, vslideup_vx, slideup_check)
  GEN_OPIVX_TRANS(vslidedown_vx, opivx_check)
  GEN_OPIVX_TRANS(vslide1down_vx, opivx_check)
  GEN_OPIVI_TRANS(vslidedown_vi, 1, vslidedown_vx, opivx_check)
 +
 +/* Vector Register Gather Instruction */
 +static bool vrgather_vv_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2) && (a->rd != a->rs1));
 +}
 +
 +GEN_OPIVV_TRANS(vrgather_vv, vrgather_vv_check)
 +
 +static bool vrgather_vx_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2));
 +}
 +
 +/* vrgather.vx vd, vs2, rs1, vm # vd[i] = (x[rs1] >= VLMAX) ? 0 : vs2[rs1] */
 +static bool trans_vrgather_vx(DisasContext *s, arg_rmrr *a)
 +{
 +    if (!vrgather_vx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        int vlmax = s->vlen / s->mlen;
 +        TCGv_i64 dest = tcg_temp_new_i64();
 +
 +        if (a->rs1 == 0) {
 +            vec_element_loadi(s, dest, a->rs2, 0);
 +        } else {
 +            vec_element_loadx(s, dest, a->rs2, cpu_gpr[a->rs1], vlmax);
 +        }
 +
 +        tcg_gen_gvec_dup_i64(s->sew, vreg_ofs(s, a->rd),
 +                             MAXSZ(s), MAXSZ(s), dest);
 +        tcg_temp_free_i64(dest);
 +    } else {
 +        static gen_helper_opivx * const fns[4] = {
 +            gen_helper_vrgather_vx_b, gen_helper_vrgather_vx_h,
 +            gen_helper_vrgather_vx_w, gen_helper_vrgather_vx_d
 +        };
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);
 +    }
 +    return true;
 +}
 +
 +/* vrgather.vi vd, vs2, imm, vm # vd[i] = (imm >= VLMAX) ? 0 : vs2[imm] */
 +static bool trans_vrgather_vi(DisasContext *s, arg_rmrr *a)
 +{
 +    if (!vrgather_vx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        if (a->rs1 >= s->vlen / s->mlen) {
 +            tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd),
 +                                 MAXSZ(s), MAXSZ(s), 0);
 +        } else {
 +            tcg_gen_gvec_dup_mem(s->sew, vreg_ofs(s, a->rd),
 +                                 endian_ofs(s, a->rs2, a->rs1),
 +                                 MAXSZ(s), MAXSZ(s));
 +        }
 +    } else {
 +        static gen_helper_opivx * const fns[4] = {
 +            gen_helper_vrgather_vx_b, gen_helper_vrgather_vx_h,
 +            gen_helper_vrgather_vx_w, gen_helper_vrgather_vx_d
 +        };
 +        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s, 1);
 +    }
 +    return true;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_b, uint8_t, H1, clearb)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_h, uint16_t, H2, clearh)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_w, uint32_t, H4, clearl)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_d, uint64_t, H8, clearq)
 +
 +/* Vector Register Gather Instruction */
 +#define GEN_VEXT_VRGATHER_VV(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,               \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t index, i;                                                    \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        index = *((ETYPE *)vs1 + H(i));                                   \
 +        if (index >= vlmax) {                                             \
 +            *((ETYPE *)vd + H(i)) = 0;                                    \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(index));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vd[i] = (vs1[i] >= VLMAX) ? 0 : vs2[vs1[i]]; */
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_b, uint8_t, H1, clearb)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_h, uint16_t, H2, clearh)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_w, uint32_t, H4, clearl)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VRGATHER_VX(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t index = s1, i;                                               \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (index >= vlmax) {                                             \
 +            *((ETYPE *)vd + H(i)) = 0;                                    \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(index));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vd[i] = (x[rs1] >= VLMAX) ? 0 : vs2[rs1] */
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_d, uint64_t, H8, clearq)
 --
 .27.0

-[PULL 04/30] hw/riscv: hart: Add a new 'resetvec' property
+[PULL v2 63/64] target/riscv: vector compress instruction
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-RISC-V machines do not instantiate RISC-V CPUs directly, instead
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-they do that via the hart array. Add a new property for the reset
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-vector address to allow the value to be passed to the CPU, before
+Message-Id: <20200701152549.1218-61-zhiwei_liu@c-sky.com>
 CPU is realized.
 Signed-off-by: Bin Meng <bin.meng@windriver.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Message-Id: <1598924352-89526-3-git-send-email-bmeng.cn@gmail.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/hw/riscv/riscv_hart.h | 1 +
+ target/riscv/helper.h                   |  5 ++++
- hw/riscv/riscv_hart.c         | 3 +++
+ target/riscv/insn32.decode              |  1 +
-files changed, 4 insertions(+)
+ target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 26 ++++++++++++++++++++
 files changed, 64 insertions(+)
-diff --git a/include/hw/riscv/riscv_hart.h b/include/hw/riscv/riscv_hart.h
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/riscv_hart.h
+--- a/target/riscv/helper.h
-+++ b/include/hw/riscv/riscv_hart.h
++++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ typedef struct RISCVHartArrayState {
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vrgather_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-     uint32_t num_harts;
+ DEF_HELPER_6(vrgather_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-     uint32_t hartid_base;
+ DEF_HELPER_6(vrgather_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-     char *cpu_type;
+ DEF_HELPER_6(vrgather_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+    uint64_t resetvec;
++
-     RISCVCPU *harts;
++DEF_HELPER_6(vcompress_vm_b, void, ptr, ptr, ptr, ptr, env, i32)
- } RISCVHartArrayState;
++DEF_HELPER_6(vcompress_vm_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vcompress_vm_w, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/hw/riscv/riscv_hart.c b/hw/riscv/riscv_hart.c
++DEF_HELPER_6(vcompress_vm_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/riscv_hart.c
+--- a/target/riscv/insn32.decode
-+++ b/hw/riscv/riscv_hart.c
++++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ static Property riscv_harts_props[] = {
+@@ -XXX,XX +XXX,XX @@ vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
-     DEFINE_PROP_UINT32("num-harts", RISCVHartArrayState, num_harts, 1),
+ vrgather_vv     001100 . ..... ..... 000 ..... 1010111 @r_vm
-     DEFINE_PROP_UINT32("hartid-base", RISCVHartArrayState, hartid_base, 0),
+ vrgather_vx     001100 . ..... ..... 100 ..... 1010111 @r_vm
-     DEFINE_PROP_STRING("cpu-type", RISCVHartArrayState, cpu_type),
+ vrgather_vi     001100 . ..... ..... 011 ..... 1010111 @r_vm
-+    DEFINE_PROP_UINT64("resetvec", RISCVHartArrayState, resetvec,
++vcompress_vm    010111 - ..... ..... 010 ..... 1010111 @r
-+                       DEFAULT_RSTVEC),
-     DEFINE_PROP_END_OF_LIST(),
+ vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- };
+ vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool riscv_hart_realize(RISCVHartArrayState *s, int idx,
+index XXXXXXX..XXXXXXX 100644
-                                char *cpu_type, Error **errp)
+--- a/target/riscv/insn_trans/trans_rvv.inc.c
- {
++++ b/target/riscv/insn_trans/trans_rvv.inc.c
-     object_initialize_child(OBJECT(s), "harts[*]", &s->harts[idx], cpu_type);
+@@ -XXX,XX +XXX,XX @@ static bool trans_vrgather_vi(DisasContext *s, arg_rmrr *a)
-+    qdev_prop_set_uint64(DEVICE(&s->harts[idx]), "resetvec", s->resetvec);
+     }
-     s->harts[idx].env.mhartid = s->hartid_base + idx;
+     return true;
-     qemu_register_reset(riscv_harts_cpu_reset, &s->harts[idx]);
+ }
-     return qdev_realize(DEVICE(&s->harts[idx]), NULL, errp);
++
 +/* Vector Compress Instruction */
 +static bool vcompress_vm_check(DisasContext *s, arg_r *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs1, 1) &&
 +            (a->rd != a->rs2));
 +}
 +
 +static bool trans_vcompress_vm(DisasContext *s, arg_r *a)
 +{
 +    if (vcompress_vm_check(s, a)) {
 +        uint32_t data = 0;
 +        static gen_helper_gvec_4_ptr * const fns[4] = {
 +            gen_helper_vcompress_vm_b, gen_helper_vcompress_vm_h,
 +            gen_helper_vcompress_vm_w, gen_helper_vcompress_vm_d,
 +        };
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1), vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VRGATHER_VX(vrgather_vx_b, uint8_t, H1, clearb)
  GEN_VEXT_VRGATHER_VX(vrgather_vx_h, uint16_t, H2, clearh)
  GEN_VEXT_VRGATHER_VX(vrgather_vx_w, uint32_t, H4, clearl)
  GEN_VEXT_VRGATHER_VX(vrgather_vx_d, uint64_t, H8, clearq)
 +
 +/* Vector Compress Instruction */
 +#define GEN_VEXT_VCOMPRESS_VM(NAME, ETYPE, H, CLEAR_FN)                   \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,               \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t num = 0, i;                                                  \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vext_elem_mask(vs1, mlen, i)) {                              \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(num)) = *((ETYPE *)vs2 + H(i));                 \
 +        num++;                                                            \
 +    }                                                                     \
 +    CLEAR_FN(vd, num, num * sizeof(ETYPE), vlmax * sizeof(ETYPE));        \
 +}
 +
 +/* Compress into vd elements of vs2 where vs1 is enabled */
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_b, uint8_t, H1, clearb)
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_h, uint16_t, H2, clearh)
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_w, uint32_t, H4, clearl)
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_d, uint64_t, H8, clearq)
 --
-.28.0
+.27.0

-[PULL 03/30] target/riscv: cpu: Add a new 'resetvec' property
+[PULL v2 64/64] target/riscv: configure and turn on vector extension from command line
-From: Bin Meng <bin.meng@windriver.com>
+From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Currently the reset vector address is hard-coded in a RISC-V CPU's
+Vector extension is default off. The only way to use vector extension is
-instance_init() routine. In a real world we can have 2 exact same
+. use cpu rv32 or rv64
-CPUs except for the reset vector address, which is pretty common in
+. turn on it by command line
-the RISC-V core IP licensing business.
+   "-cpu rv64,x-v=true,vlen=128,elen=64,vext_spec=v0.7.1".
-Normally reset vector address is a configurable parameter. Let's
+vlen is the vector register length, default value is 128 bit.
-create a 64-bit property to store the reset vector address which
+elen is the max operator size in bits, default value is 64 bit.
-covers both 32-bit and 64-bit CPUs.
+vext_spec is the vector specification version, default value is v0.7.1.
 These properties can be specified with other values.
-Signed-off-by: Bin Meng <bin.meng@windriver.com>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-Id: <1598924352-89526-2-git-send-email-bmeng.cn@gmail.com>
+Message-Id: <20200701152549.1218-62-zhiwei_liu@c-sky.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h | 1 +
+ target/riscv/cpu.h |  4 +++-
- target/riscv/cpu.c | 1 +
+ target/riscv/cpu.c | 43 +++++++++++++++++++++++++++++++++++++++++++
-files changed, 2 insertions(+)
+files changed, 46 insertions(+), 1 deletion(-)
 diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.h
 +++ b/target/riscv/cpu.h
+@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
+ #include "pmp.h"
+-#define RV_VLEN_MAX 512
++#define RV_VLEN_MAX 256
+ FIELD(VTYPE, VLMUL, 0, 2)
+ FIELD(VTYPE, VSEW, 2, 3)
 @@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
+         bool ext_s;
+         bool ext_u;
+         bool ext_h;
++        bool ext_v;
+         bool ext_counters;
+         bool ext_ifencei;
+         bool ext_icsr;
+         char *priv_spec;
+         char *user_spec;
++        char *vext_spec;
+         uint16_t vlen;
          uint16_t elen;
          bool mmu;
-         bool pmp;
-+        uint64_t resetvec;
-     } cfg;
- } RISCVCPU;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
+@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
+         if (cpu->cfg.ext_h) {
+             target_misa |= RVH;
+         }
++        if (cpu->cfg.ext_v) {
++            target_misa |= RVV;
++            if (!is_power_of_2(cpu->cfg.vlen)) {
++                error_setg(errp,
++                        "Vector extension VLEN must be power of 2");
++                return;
++            }
++            if (cpu->cfg.vlen > RV_VLEN_MAX || cpu->cfg.vlen < 128) {
++                error_setg(errp,
++                        "Vector extension implementation only supports VLEN "
++                        "in the range [128, %d]", RV_VLEN_MAX);
++                return;
++            }
++            if (!is_power_of_2(cpu->cfg.elen)) {
++                error_setg(errp,
++                        "Vector extension ELEN must be power of 2");
++                return;
++            }
++            if (cpu->cfg.elen > 64 || cpu->cfg.vlen < 8) {
++                error_setg(errp,
++                        "Vector extension implementation only supports ELEN "
++                        "in the range [8, 64]");
++                return;
++            }
++            if (cpu->cfg.vext_spec) {
++                if (!g_strcmp0(cpu->cfg.vext_spec, "v0.7.1")) {
++                    vext_version = VEXT_VERSION_0_07_1;
++                } else {
++                    error_setg(errp,
++                           "Unsupported vector spec version '%s'",
++                           cpu->cfg.vext_spec);
++                    return;
++                }
++            } else {
++                qemu_log("vector verison is not specified, "
++                        "use the default value v0.7.1\n");
++            }
++            set_vext_version(env, vext_version);
++        }
+         set_misa(env, RVXLEN | target_misa);
+     }
 @@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
-     DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
+     DEFINE_PROP_BOOL("u", RISCVCPU, cfg.ext_u, true),
      /* This is experimental so mark with 'x-' */
      DEFINE_PROP_BOOL("x-h", RISCVCPU, cfg.ext_h, false),
 +    DEFINE_PROP_BOOL("x-v", RISCVCPU, cfg.ext_v, false),
      DEFINE_PROP_BOOL("Counters", RISCVCPU, cfg.ext_counters, true),
      DEFINE_PROP_BOOL("Zifencei", RISCVCPU, cfg.ext_ifencei, true),
      DEFINE_PROP_BOOL("Zicsr", RISCVCPU, cfg.ext_icsr, true),
      DEFINE_PROP_STRING("priv_spec", RISCVCPU, cfg.priv_spec),
 +    DEFINE_PROP_STRING("vext_spec", RISCVCPU, cfg.vext_spec),
 +    DEFINE_PROP_UINT16("vlen", RISCVCPU, cfg.vlen, 128),
 +    DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
      DEFINE_PROP_BOOL("mmu", RISCVCPU, cfg.mmu, true),
      DEFINE_PROP_BOOL("pmp", RISCVCPU, cfg.pmp, true),
-+    DEFINE_PROP_UINT64("resetvec", RISCVCPU, cfg.resetvec, DEFAULT_RSTVEC),
      DEFINE_PROP_END_OF_LIST(),
- };
 --
-.28.0
+.27.0

The following changes since commit 9435a8b3dd35f1f926f1b9127e8a906217a5518a:

Merge remote-tracking branch 'remotes/kraxel/tags/sirius/ipxe-20200908-pull-request' into staging (2020-09-08 21:21:13 +0100)

are available in the Git repository at:

git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200910

for you to fetch changes up to 7595a65818ea9b49c36650a8c217a1ef9bd6e62a:

hw/riscv: Sort the Kconfig options in alphabetical order (2020-09-09 15:54:19 -0700)

----------------------------------------------------------------
This PR includes multiple fixes and features for RISC-V:
 - Fixes a bug in printing trap causes
 - Allows 16-bit writes to the SiFive test device. This fixes the
   failure to reboot the RISC-V virt machine
 - Support for the Microchip PolarFire SoC and Icicle Kit
 - A reafactor of RISC-V code out of hw/riscv

----------------------------------------------------------------
Bin Meng (28):
      target/riscv: cpu: Add a new 'resetvec' property
      hw/riscv: hart: Add a new 'resetvec' property
      target/riscv: cpu: Set reset vector based on the configured property value
      hw/riscv: Initial support for Microchip PolarFire SoC Icicle Kit board
      hw/char: Add Microchip PolarFire SoC MMUART emulation
      hw/riscv: microchip_pfsoc: Connect 5 MMUARTs
      hw/sd: Add Cadence SDHCI emulation
      hw/riscv: microchip_pfsoc: Connect a Cadence SDHCI controller and an SD card
      hw/dma: Add SiFive platform DMA controller emulation
      hw/riscv: microchip_pfsoc: Connect a DMA controller
      hw/net: cadence_gem: Add a new 'phy-addr' property
      hw/arm: xlnx: Set all boards' GEM 'phy-addr' property value to 23
      hw/riscv: microchip_pfsoc: Connect 2 Cadence GEMs
      hw/riscv: microchip_pfsoc: Hook GPIO controllers
      hw/riscv: clint: Avoid using hard-coded timebase frequency
      hw/riscv: sifive_u: Connect a DMA controller
      hw/riscv: Move sifive_e_prci model to hw/misc
      hw/riscv: Move sifive_u_prci model to hw/misc
      hw/riscv: Move sifive_u_otp model to hw/misc
      hw/riscv: Move sifive_gpio model to hw/gpio
      hw/riscv: Move sifive_clint model to hw/intc
      hw/riscv: Move sifive_plic model to hw/intc
      hw/riscv: Move riscv_htif model to hw/char
      hw/riscv: Move sifive_uart model to hw/char
      hw/riscv: Move sifive_test model to hw/misc
      hw/riscv: Always build riscv_hart.c
      hw/riscv: Drop CONFIG_SIFIVE
      hw/riscv: Sort the Kconfig options in alphabetical order

Nathan Chancellor (1):
      riscv: sifive_test: Allow 16-bit writes to memory region

Yifei Jiang (1):
      target/riscv: Fix bug in getting trap cause name for trace_riscv_trap

default-configs/riscv64-softmmu.mak         |   1 +
 {include/hw/riscv => hw/intc}/sifive_plic.h |   0
 hw/riscv/trace.h                            |   1 -
 include/hw/char/mchp_pfsoc_mmuart.h         |  61 ++++
 include/hw/{riscv => char}/riscv_htif.h     |   0
 include/hw/{riscv => char}/sifive_uart.h    |   0
 include/hw/dma/sifive_pdma.h                |  57 ++++
 include/hw/{riscv => gpio}/sifive_gpio.h    |   0
 include/hw/{riscv => intc}/sifive_clint.h   |   4 +-
 include/hw/{riscv => misc}/sifive_e_prci.h  |   0
 include/hw/{riscv => misc}/sifive_test.h    |   0
 include/hw/{riscv => misc}/sifive_u_otp.h   |   0
 include/hw/{riscv => misc}/sifive_u_prci.h  |   0
 include/hw/net/cadence_gem.h                |   2 +
 include/hw/riscv/microchip_pfsoc.h          | 133 +++++++++
 include/hw/riscv/riscv_hart.h               |   1 +
 include/hw/riscv/sifive_e.h                 |   2 +-
 include/hw/riscv/sifive_u.h                 |  17 +-
 include/hw/sd/cadence_sdhci.h               |  47 +++
 target/riscv/cpu.h                          |   8 +-
 hw/arm/xilinx_zynq.c                        |   1 +
 hw/arm/xlnx-versal.c                        |   1 +
 hw/arm/xlnx-zynqmp.c                        |   2 +
 hw/char/mchp_pfsoc_mmuart.c                 |  86 ++++++
 hw/{riscv => char}/riscv_htif.c             |   2 +-
 hw/{riscv => char}/sifive_uart.c            |   2 +-
 hw/dma/sifive_pdma.c                        | 313 ++++++++++++++++++++
 hw/{riscv => gpio}/sifive_gpio.c            |   2 +-
 hw/{riscv => intc}/sifive_clint.c           |  28 +-
 hw/{riscv => intc}/sifive_plic.c            |   2 +-
 hw/{riscv => misc}/sifive_e_prci.c          |   2 +-
 hw/{riscv => misc}/sifive_test.c            |   4 +-
 hw/{riscv => misc}/sifive_u_otp.c           |   2 +-
 hw/{riscv => misc}/sifive_u_prci.c          |   2 +-
 hw/net/cadence_gem.c                        |   7 +-
 hw/riscv/microchip_pfsoc.c                  | 437 ++++++++++++++++++++++++++++
 hw/riscv/opentitan.c                        |   1 +
 hw/riscv/riscv_hart.c                       |   3 +
 hw/riscv/sifive_e.c                         |  12 +-
 hw/riscv/sifive_u.c                         |  41 ++-
 hw/riscv/spike.c                            |   7 +-
 hw/riscv/virt.c                             |   9 +-
 hw/sd/cadence_sdhci.c                       | 193 ++++++++++++
 target/riscv/cpu.c                          |  19 +-
 target/riscv/cpu_helper.c                   |   8 +-
 target/riscv/csr.c                          |   4 +-
 MAINTAINERS                                 |   9 +
 hw/char/Kconfig                             |   9 +
 hw/char/meson.build                         |   3 +
 hw/dma/Kconfig                              |   3 +
 hw/dma/meson.build                          |   1 +
 hw/gpio/Kconfig                             |   3 +
 hw/gpio/meson.build                         |   1 +
 hw/gpio/trace-events                        |   6 +
 hw/intc/Kconfig                             |   6 +
 hw/intc/meson.build                         |   2 +
 hw/misc/Kconfig                             |  12 +
 hw/misc/meson.build                         |   6 +
 hw/riscv/Kconfig                            |  70 +++--
 hw/riscv/meson.build                        |  12 +-
 hw/riscv/trace-events                       |   7 -
 hw/sd/Kconfig                               |   4 +
 hw/sd/meson.build                           |   1 +
 meson.build                                 |   1 -
 64 files changed, 1575 insertions(+), 105 deletions(-)
 rename {include/hw/riscv => hw/intc}/sifive_plic.h (100%)
 delete mode 100644 hw/riscv/trace.h
 create mode 100644 include/hw/char/mchp_pfsoc_mmuart.h
 rename include/hw/{riscv => char}/riscv_htif.h (100%)
 rename include/hw/{riscv => char}/sifive_uart.h (100%)
 create mode 100644 include/hw/dma/sifive_pdma.h
 rename include/hw/{riscv => gpio}/sifive_gpio.h (100%)
 rename include/hw/{riscv => intc}/sifive_clint.h (92%)
 rename include/hw/{riscv => misc}/sifive_e_prci.h (100%)
 rename include/hw/{riscv => misc}/sifive_test.h (100%)
 rename include/hw/{riscv => misc}/sifive_u_otp.h (100%)
 rename include/hw/{riscv => misc}/sifive_u_prci.h (100%)
 create mode 100644 include/hw/riscv/microchip_pfsoc.h
 create mode 100644 include/hw/sd/cadence_sdhci.h
 create mode 100644 hw/char/mchp_pfsoc_mmuart.c
 rename hw/{riscv => char}/riscv_htif.c (99%)
 rename hw/{riscv => char}/sifive_uart.c (99%)
 create mode 100644 hw/dma/sifive_pdma.c
 rename hw/{riscv => gpio}/sifive_gpio.c (99%)
 rename hw/{riscv => intc}/sifive_clint.c (90%)
 rename hw/{riscv => intc}/sifive_plic.c (99%)
 rename hw/{riscv => misc}/sifive_e_prci.c (99%)
 rename hw/{riscv => misc}/sifive_test.c (97%)
 rename hw/{riscv => misc}/sifive_u_otp.c (99%)
 rename hw/{riscv => misc}/sifive_u_prci.c (99%)
 create mode 100644 hw/riscv/microchip_pfsoc.c
 create mode 100644 hw/sd/cadence_sdhci.c
 delete mode 100644 hw/riscv/trace-events

From: Yifei Jiang <jiangyifei@huawei.com>

When the cause number is equal to or greater than 23, print "(unknown)" in
trace_riscv_trap. The max valid number of riscv_excp_names is 23, so the last
excpetion "guest_store_page_fault" can not be printed.

In addition, the current check of cause is invalid for riscv_intr_names. So
introduce riscv_cpu_get_trap_name to get the trap cause name.

Signed-off-by: Yifei Jiang <jiangyifei@huawei.com>
Signed-off-by: Yipeng Yin <yinyipeng1@huawei.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20200814035819.1214-1-jiangyifei@huawei.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/cpu.h        |  1 +
 target/riscv/cpu.c        | 11 +++++++++++
 target/riscv/cpu_helper.c |  4 ++--
 3 files changed, 14 insertions(+), 2 deletions(-)

diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.h
+++ b/target/riscv/cpu.h
@@ -XXX,XX +XXX,XX @@ extern const char * const riscv_fpr_regnames[];
 extern const char * const riscv_excp_names[];
 extern const char * const riscv_intr_names[];
 
+const char *riscv_cpu_get_trap_name(target_ulong cause, bool async);
 void riscv_cpu_do_interrupt(CPUState *cpu);
 int riscv_cpu_gdb_read_register(CPUState *cpu, GByteArray *buf, int reg);
 int riscv_cpu_gdb_write_register(CPUState *cpu, uint8_t *buf, int reg);
diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.c
+++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ const char * const riscv_intr_names[] = {
     "reserved"
 };
 
+const char *riscv_cpu_get_trap_name(target_ulong cause, bool async)
+{
+    if (async) {
+        return (cause < ARRAY_SIZE(riscv_intr_names)) ?
+               riscv_intr_names[cause] : "(unknown)";
+    } else {
+        return (cause < ARRAY_SIZE(riscv_excp_names)) ?
+               riscv_excp_names[cause] : "(unknown)";
+    }
+}
+
 static void set_misa(CPURISCVState *env, target_ulong misa)
 {
     env->misa_mask = env->misa = misa;
diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu_helper.c
+++ b/target/riscv/cpu_helper.c
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
         }
     }
 
-    trace_riscv_trap(env->mhartid, async, cause, env->pc, tval, cause < 23 ?
-        (async ? riscv_intr_names : riscv_excp_names)[cause] : "(unknown)");
+    trace_riscv_trap(env->mhartid, async, cause, env->pc, tval,
+        riscv_cpu_get_trap_name(cause, async));
 
     if (env->priv <= PRV_S &&
             cause < TARGET_LONG_BITS && ((deleg >> cause) & 1)) {
-- 
2.28.0

From: Nathan Chancellor <natechancellor@gmail.com>

When shutting down the machine running a mainline Linux kernel, the
following error happens:

$ build/riscv64-softmmu/qemu-system-riscv64 -bios default -M virt \
    -display none -initrd rootfs.cpio -kernel Image -m 512m \
    -nodefaults -serial mon:stdio
...
Requesting system poweroff
[    4.999630] reboot: Power down
sbi_trap_error: hart0: trap handler failed (error -2)
sbi_trap_error: hart0: mcause=0x0000000000000007 mtval=0x0000000000100000
sbi_trap_error: hart0: mepc=0x000000008000d4cc mstatus=0x0000000000001822
sbi_trap_error: hart0: ra=0x000000008000999e sp=0x0000000080015c78
sbi_trap_error: hart0: gp=0xffffffe000e76610 tp=0xffffffe0081b89c0
sbi_trap_error: hart0: s0=0x0000000080015c88 s1=0x0000000000000040
sbi_trap_error: hart0: a0=0x0000000000000000 a1=0x0000000080004024
sbi_trap_error: hart0: a2=0x0000000080004024 a3=0x0000000080004024
sbi_trap_error: hart0: a4=0x0000000000100000 a5=0x0000000000005555
sbi_trap_error: hart0: a6=0x0000000000004024 a7=0x0000000080011158
sbi_trap_error: hart0: s2=0x0000000000000000 s3=0x0000000080016000
sbi_trap_error: hart0: s4=0x0000000000000000 s5=0x0000000000000000
sbi_trap_error: hart0: s6=0x0000000000000001 s7=0x0000000000000000
sbi_trap_error: hart0: s8=0x0000000000000000 s9=0x0000000000000000
sbi_trap_error: hart0: s10=0x0000000000000000 s11=0x0000000000000008
sbi_trap_error: hart0: t0=0x0000000000000000 t1=0x0000000000000000
sbi_trap_error: hart0: t2=0x0000000000000000 t3=0x0000000000000000
sbi_trap_error: hart0: t4=0x0000000000000000 t5=0x0000000000000000
sbi_trap_error: hart0: t6=0x0000000000000000

The kernel does a 16-bit write when powering off the machine, which
was allowed before commit 5d971f9e67 ("memory: Revert "memory: accept
mismatching sizes in memory_region_access_valid""). Make min_access_size
match reality so that the machine can shut down properly now.

Cc: qemu-stable@nongnu.org
Fixes: 88a07990fa ("SiFive RISC-V Test Finisher")
Fixes: 5d971f9e67 ("memory: Revert "memory: accept mismatching sizes in memory_region_access_valid"")
Signed-off-by: Nathan Chancellor <natechancellor@gmail.com>
Acked-by: Michael S. Tsirkin <mst@redhat.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20200901055822.2721209-1-natechancellor@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_test.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/hw/riscv/sifive_test.c b/hw/riscv/sifive_test.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_test.c
+++ b/hw/riscv/sifive_test.c
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_test_ops = {
     .write = sifive_test_write,
     .endianness = DEVICE_NATIVE_ENDIAN,
     .valid = {
-        .min_access_size = 4,
+        .min_access_size = 2,
         .max_access_size = 4
     }
 };
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Currently the reset vector address is hard-coded in a RISC-V CPU's
instance_init() routine. In a real world we can have 2 exact same
CPUs except for the reset vector address, which is pretty common in
the RISC-V core IP licensing business.

Normally reset vector address is a configurable parameter. Let's
create a 64-bit property to store the reset vector address which
covers both 32-bit and 64-bit CPUs.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-Id: <1598924352-89526-2-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/cpu.h | 1 +
 target/riscv/cpu.c | 1 +
 2 files changed, 2 insertions(+)

diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.h
+++ b/target/riscv/cpu.h
@@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
         uint16_t elen;
         bool mmu;
         bool pmp;
+        uint64_t resetvec;
     } cfg;
 } RISCVCPU;
 
diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.c
+++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
     DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
     DEFINE_PROP_BOOL("mmu", RISCVCPU, cfg.mmu, true),
     DEFINE_PROP_BOOL("pmp", RISCVCPU, cfg.pmp, true),
+    DEFINE_PROP_UINT64("resetvec", RISCVCPU, cfg.resetvec, DEFAULT_RSTVEC),
     DEFINE_PROP_END_OF_LIST(),
 };
 
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

RISC-V machines do not instantiate RISC-V CPUs directly, instead
they do that via the hart array. Add a new property for the reset
vector address to allow the value to be passed to the CPU, before
CPU is realized.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-Id: <1598924352-89526-3-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/riscv_hart.h | 1 +
 hw/riscv/riscv_hart.c         | 3 +++
 2 files changed, 4 insertions(+)

diff --git a/include/hw/riscv/riscv_hart.h b/include/hw/riscv/riscv_hart.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/riscv_hart.h
+++ b/include/hw/riscv/riscv_hart.h
@@ -XXX,XX +XXX,XX @@ typedef struct RISCVHartArrayState {
     uint32_t num_harts;
     uint32_t hartid_base;
     char *cpu_type;
+    uint64_t resetvec;
     RISCVCPU *harts;
 } RISCVHartArrayState;
 
diff --git a/hw/riscv/riscv_hart.c b/hw/riscv/riscv_hart.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/riscv_hart.c
+++ b/hw/riscv/riscv_hart.c
@@ -XXX,XX +XXX,XX @@ static Property riscv_harts_props[] = {
     DEFINE_PROP_UINT32("num-harts", RISCVHartArrayState, num_harts, 1),
     DEFINE_PROP_UINT32("hartid-base", RISCVHartArrayState, hartid_base, 0),
     DEFINE_PROP_STRING("cpu-type", RISCVHartArrayState, cpu_type),
+    DEFINE_PROP_UINT64("resetvec", RISCVHartArrayState, resetvec,
+                       DEFAULT_RSTVEC),
     DEFINE_PROP_END_OF_LIST(),
 };
 
@@ -XXX,XX +XXX,XX @@ static bool riscv_hart_realize(RISCVHartArrayState *s, int idx,
                                char *cpu_type, Error **errp)
 {
     object_initialize_child(OBJECT(s), "harts[*]", &s->harts[idx], cpu_type);
+    qdev_prop_set_uint64(DEVICE(&s->harts[idx]), "resetvec", s->resetvec);
     s->harts[idx].env.mhartid = s->hartid_base + idx;
     qemu_register_reset(riscv_harts_cpu_reset, &s->harts[idx]);
     return qdev_realize(DEVICE(&s->harts[idx]), NULL, errp);
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Now that we have the newly introduced 'resetvec' property in the
RISC-V CPU and HART, instead of hard-coding the reset vector addr
in the CPU's instance_init(), move that to riscv_cpu_realize()
based on the configured property value from the RISC-V machines.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-Id: <1598924352-89526-4-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/opentitan.c | 1 +
 hw/riscv/sifive_e.c  | 1 +
 hw/riscv/sifive_u.c  | 2 ++
 target/riscv/cpu.c   | 7 ++-----
 4 files changed, 6 insertions(+), 5 deletions(-)

diff --git a/hw/riscv/opentitan.c b/hw/riscv/opentitan.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/opentitan.c
+++ b/hw/riscv/opentitan.c
@@ -XXX,XX +XXX,XX @@ static void lowrisc_ibex_soc_realize(DeviceState *dev_soc, Error **errp)
                             &error_abort);
     object_property_set_int(OBJECT(&s->cpus), "num-harts", ms->smp.cpus,
                             &error_abort);
+    object_property_set_int(OBJECT(&s->cpus), "resetvec", 0x8090, &error_abort);
     sysbus_realize(SYS_BUS_DEVICE(&s->cpus), &error_abort);
 
     /* Boot ROM */
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@ static void sifive_e_soc_init(Object *obj)
     object_initialize_child(obj, "cpus", &s->cpus, TYPE_RISCV_HART_ARRAY);
     object_property_set_int(OBJECT(&s->cpus), "num-harts", ms->smp.cpus,
                             &error_abort);
+    object_property_set_int(OBJECT(&s->cpus), "resetvec", 0x1004, &error_abort);
     object_initialize_child(obj, "riscv.sifive.e.gpio0", &s->gpio,
                             TYPE_SIFIVE_GPIO);
 }
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_instance_init(Object *obj)
     qdev_prop_set_uint32(DEVICE(&s->e_cpus), "num-harts", 1);
     qdev_prop_set_uint32(DEVICE(&s->e_cpus), "hartid-base", 0);
     qdev_prop_set_string(DEVICE(&s->e_cpus), "cpu-type", SIFIVE_E_CPU);
+    qdev_prop_set_uint64(DEVICE(&s->e_cpus), "resetvec", 0x1004);
 
     object_initialize_child(obj, "u-cluster", &s->u_cluster, TYPE_CPU_CLUSTER);
     qdev_prop_set_uint32(DEVICE(&s->u_cluster), "cluster-id", 1);
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_instance_init(Object *obj)
     qdev_prop_set_uint32(DEVICE(&s->u_cpus), "num-harts", ms->smp.cpus - 1);
     qdev_prop_set_uint32(DEVICE(&s->u_cpus), "hartid-base", 1);
     qdev_prop_set_string(DEVICE(&s->u_cpus), "cpu-type", SIFIVE_U_CPU);
+    qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", 0x1004);
 
     object_initialize_child(obj, "prci", &s->prci, TYPE_SIFIVE_U_PRCI);
     object_initialize_child(obj, "otp", &s->otp, TYPE_SIFIVE_U_OTP);
diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.c
+++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static void riscv_any_cpu_init(Object *obj)
     CPURISCVState *env = &RISCV_CPU(obj)->env;
     set_misa(env, RVXLEN | RVI | RVM | RVA | RVF | RVD | RVC | RVU);
     set_priv_version(env, PRIV_VERSION_1_11_0);
-    set_resetvec(env, DEFAULT_RSTVEC);
 }
 
 static void riscv_base_cpu_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void riscv_base_cpu_init(Object *obj)
     CPURISCVState *env = &RISCV_CPU(obj)->env;
     /* We set this in the realise function */
     set_misa(env, 0);
-    set_resetvec(env, DEFAULT_RSTVEC);
 }
 
 static void rvxx_sifive_u_cpu_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void rvxx_sifive_u_cpu_init(Object *obj)
     CPURISCVState *env = &RISCV_CPU(obj)->env;
     set_misa(env, RVXLEN | RVI | RVM | RVA | RVF | RVD | RVC | RVS | RVU);
     set_priv_version(env, PRIV_VERSION_1_10_0);
-    set_resetvec(env, 0x1004);
 }
 
 static void rvxx_sifive_e_cpu_init(Object *obj)
@@ -XXX,XX +XXX,XX @@ static void rvxx_sifive_e_cpu_init(Object *obj)
     CPURISCVState *env = &RISCV_CPU(obj)->env;
     set_misa(env, RVXLEN | RVI | RVM | RVA | RVC | RVU);
     set_priv_version(env, PRIV_VERSION_1_10_0);
-    set_resetvec(env, 0x1004);
     qdev_prop_set_bit(DEVICE(obj), "mmu", false);
 }
 
@@ -XXX,XX +XXX,XX @@ static void rv32_ibex_cpu_init(Object *obj)
     CPURISCVState *env = &RISCV_CPU(obj)->env;
     set_misa(env, RV32 | RVI | RVM | RVC | RVU);
     set_priv_version(env, PRIV_VERSION_1_10_0);
-    set_resetvec(env, 0x8090);
     qdev_prop_set_bit(DEVICE(obj), "mmu", false);
 }
 
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
         set_feature(env, RISCV_FEATURE_PMP);
     }
 
+    set_resetvec(env, cpu->cfg.resetvec);
+
     /* If misa isn't set (rv32 and rv64 machines) set it here */
     if (!env->misa) {
         /* Do some ISA extension error checking */
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an initial support for Microchip PolarFire SoC Icicle Kit.
The Icicle Kit board integrates a PolarFire SoC, with one SiFive's
E51 plus four U54 cores and many on-chip peripherals and an FPGA.

For more details about Microchip PolarFire Soc, please see:
https://www.microsemi.com/product-directory/soc-fpgas/5498-polarfire-soc-fpga

Unlike SiFive FU540, the RISC-V core resect vector is at 0x20220000.
The following perepherals are created as an unimplemented device:

- Bus Error Uint 0/1/2/3/4
- L2 cache controller
- SYSREG
- MPUCFG
- IOSCBCFG

More devices will be added later.

The BIOS image used by this machine is hss.bin, aka Hart Software
Services, which can be built from:
https://github.com/polarfire-soc/hart-software-services

To launch this machine:
$ qemu-system-riscv64 -nographic -M microchip-icicle-kit

The memory is set to 1 GiB by default to match the hardware.
A sanity check on ram size is performed in the machine init routine
to prompt user to increase the RAM size to > 1 GiB when less than
1 GiB ram is detected.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-5-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 default-configs/riscv64-softmmu.mak |   1 +
 include/hw/riscv/microchip_pfsoc.h  |  88 ++++++++
 hw/riscv/microchip_pfsoc.c          | 312 ++++++++++++++++++++++++++++
 MAINTAINERS                         |   7 +
 hw/riscv/Kconfig                    |   6 +
 hw/riscv/meson.build                |   1 +
 6 files changed, 415 insertions(+)
 create mode 100644 include/hw/riscv/microchip_pfsoc.h
 create mode 100644 hw/riscv/microchip_pfsoc.c

diff --git a/default-configs/riscv64-softmmu.mak b/default-configs/riscv64-softmmu.mak
index XXXXXXX..XXXXXXX 100644
--- a/default-configs/riscv64-softmmu.mak
+++ b/default-configs/riscv64-softmmu.mak
@@ -XXX,XX +XXX,XX @@ CONFIG_SPIKE=y
 CONFIG_SIFIVE_E=y
 CONFIG_SIFIVE_U=y
 CONFIG_RISCV_VIRT=y
+CONFIG_MICROCHIP_PFSOC=y
diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/riscv/microchip_pfsoc.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * Microchip PolarFire SoC machine interface
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms and conditions of the GNU General Public License,
+ * version 2 or later, as published by the Free Software Foundation.
+ *
+ * This program is distributed in the hope it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
+ * more details.
+ *
+ * You should have received a copy of the GNU General Public License along with
+ * this program.  If not, see <http://www.gnu.org/licenses/>.
+ */
+
+#ifndef HW_MICROCHIP_PFSOC_H
+#define HW_MICROCHIP_PFSOC_H
+
+typedef struct MicrochipPFSoCState {
+    /*< private >*/
+    DeviceState parent_obj;
+
+    /*< public >*/
+    CPUClusterState e_cluster;
+    CPUClusterState u_cluster;
+    RISCVHartArrayState e_cpus;
+    RISCVHartArrayState u_cpus;
+    DeviceState *plic;
+} MicrochipPFSoCState;
+
+#define TYPE_MICROCHIP_PFSOC    "microchip.pfsoc"
+#define MICROCHIP_PFSOC(obj) \
+    OBJECT_CHECK(MicrochipPFSoCState, (obj), TYPE_MICROCHIP_PFSOC)
+
+typedef struct MicrochipIcicleKitState {
+    /*< private >*/
+    MachineState parent_obj;
+
+    /*< public >*/
+    MicrochipPFSoCState soc;
+} MicrochipIcicleKitState;
+
+#define TYPE_MICROCHIP_ICICLE_KIT_MACHINE \
+    MACHINE_TYPE_NAME("microchip-icicle-kit")
+#define MICROCHIP_ICICLE_KIT_MACHINE(obj) \
+    OBJECT_CHECK(MicrochipIcicleKitState, (obj), \
+                 TYPE_MICROCHIP_ICICLE_KIT_MACHINE)
+
+enum {
+    MICROCHIP_PFSOC_DEBUG,
+    MICROCHIP_PFSOC_E51_DTIM,
+    MICROCHIP_PFSOC_BUSERR_UNIT0,
+    MICROCHIP_PFSOC_BUSERR_UNIT1,
+    MICROCHIP_PFSOC_BUSERR_UNIT2,
+    MICROCHIP_PFSOC_BUSERR_UNIT3,
+    MICROCHIP_PFSOC_BUSERR_UNIT4,
+    MICROCHIP_PFSOC_CLINT,
+    MICROCHIP_PFSOC_L2CC,
+    MICROCHIP_PFSOC_L2LIM,
+    MICROCHIP_PFSOC_PLIC,
+    MICROCHIP_PFSOC_SYSREG,
+    MICROCHIP_PFSOC_MPUCFG,
+    MICROCHIP_PFSOC_ENVM_CFG,
+    MICROCHIP_PFSOC_ENVM_DATA,
+    MICROCHIP_PFSOC_IOSCB_CFG,
+    MICROCHIP_PFSOC_DRAM,
+};
+
+#define MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT    1
+#define MICROCHIP_PFSOC_COMPUTE_CPU_COUNT       4
+
+#define MICROCHIP_PFSOC_PLIC_HART_CONFIG        "MS"
+#define MICROCHIP_PFSOC_PLIC_NUM_SOURCES        185
+#define MICROCHIP_PFSOC_PLIC_NUM_PRIORITIES     7
+#define MICROCHIP_PFSOC_PLIC_PRIORITY_BASE      0x04
+#define MICROCHIP_PFSOC_PLIC_PENDING_BASE       0x1000
+#define MICROCHIP_PFSOC_PLIC_ENABLE_BASE        0x2000
+#define MICROCHIP_PFSOC_PLIC_ENABLE_STRIDE      0x80
+#define MICROCHIP_PFSOC_PLIC_CONTEXT_BASE       0x200000
+#define MICROCHIP_PFSOC_PLIC_CONTEXT_STRIDE     0x1000
+
+#endif /* HW_MICROCHIP_PFSOC_H */
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * QEMU RISC-V Board Compatible with Microchip PolarFire SoC Icicle Kit
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * Provides a board compatible with the Microchip PolarFire SoC Icicle Kit
+ *
+ * 0) CLINT (Core Level Interruptor)
+ * 1) PLIC (Platform Level Interrupt Controller)
+ * 2) eNVM (Embedded Non-Volatile Memory)
+ *
+ * This board currently generates devicetree dynamically that indicates at least
+ * two harts and up to five harts.
+ *
+ * This program is free software; you can redistribute it and/or modify it
+ * under the terms and conditions of the GNU General Public License,
+ * version 2 or later, as published by the Free Software Foundation.
+ *
+ * This program is distributed in the hope it will be useful, but WITHOUT
+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
+ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
+ * more details.
+ *
+ * You should have received a copy of the GNU General Public License along with
+ * this program.  If not, see <http://www.gnu.org/licenses/>.
+ */
+
+#include "qemu/osdep.h"
+#include "qemu/error-report.h"
+#include "qemu/log.h"
+#include "qemu/units.h"
+#include "qemu/cutils.h"
+#include "qapi/error.h"
+#include "hw/boards.h"
+#include "hw/irq.h"
+#include "hw/loader.h"
+#include "hw/sysbus.h"
+#include "hw/cpu/cluster.h"
+#include "target/riscv/cpu.h"
+#include "hw/misc/unimp.h"
+#include "hw/riscv/boot.h"
+#include "hw/riscv/riscv_hart.h"
+#include "hw/riscv/sifive_clint.h"
+#include "hw/riscv/sifive_plic.h"
+#include "hw/riscv/microchip_pfsoc.h"
+
+/*
+ * The BIOS image used by this machine is called Hart Software Services (HSS).
+ * See https://github.com/polarfire-soc/hart-software-services
+ */
+#define BIOS_FILENAME   "hss.bin"
+#define RESET_VECTOR    0x20220000
+
+static const struct MemmapEntry {
+    hwaddr base;
+    hwaddr size;
+} microchip_pfsoc_memmap[] = {
+    [MICROCHIP_PFSOC_DEBUG] =           {        0x0,     0x1000 },
+    [MICROCHIP_PFSOC_E51_DTIM] =        {  0x1000000,     0x2000 },
+    [MICROCHIP_PFSOC_BUSERR_UNIT0] =    {  0x1700000,     0x1000 },
+    [MICROCHIP_PFSOC_BUSERR_UNIT1] =    {  0x1701000,     0x1000 },
+    [MICROCHIP_PFSOC_BUSERR_UNIT2] =    {  0x1702000,     0x1000 },
+    [MICROCHIP_PFSOC_BUSERR_UNIT3] =    {  0x1703000,     0x1000 },
+    [MICROCHIP_PFSOC_BUSERR_UNIT4] =    {  0x1704000,     0x1000 },
+    [MICROCHIP_PFSOC_CLINT] =           {  0x2000000,    0x10000 },
+    [MICROCHIP_PFSOC_L2CC] =            {  0x2010000,     0x1000 },
+    [MICROCHIP_PFSOC_L2LIM] =           {  0x8000000,  0x2000000 },
+    [MICROCHIP_PFSOC_PLIC] =            {  0xc000000,  0x4000000 },
+    [MICROCHIP_PFSOC_SYSREG] =          { 0x20002000,     0x2000 },
+    [MICROCHIP_PFSOC_MPUCFG] =          { 0x20005000,     0x1000 },
+    [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
+    [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
+    [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
+    [MICROCHIP_PFSOC_DRAM] =            { 0x80000000,        0x0 },
+};
+
+static void microchip_pfsoc_soc_instance_init(Object *obj)
+{
+    MachineState *ms = MACHINE(qdev_get_machine());
+    MicrochipPFSoCState *s = MICROCHIP_PFSOC(obj);
+
+    object_initialize_child(obj, "e-cluster", &s->e_cluster, TYPE_CPU_CLUSTER);
+    qdev_prop_set_uint32(DEVICE(&s->e_cluster), "cluster-id", 0);
+
+    object_initialize_child(OBJECT(&s->e_cluster), "e-cpus", &s->e_cpus,
+                            TYPE_RISCV_HART_ARRAY);
+    qdev_prop_set_uint32(DEVICE(&s->e_cpus), "num-harts", 1);
+    qdev_prop_set_uint32(DEVICE(&s->e_cpus), "hartid-base", 0);
+    qdev_prop_set_string(DEVICE(&s->e_cpus), "cpu-type",
+                         TYPE_RISCV_CPU_SIFIVE_E51);
+    qdev_prop_set_uint64(DEVICE(&s->e_cpus), "resetvec", RESET_VECTOR);
+
+    object_initialize_child(obj, "u-cluster", &s->u_cluster, TYPE_CPU_CLUSTER);
+    qdev_prop_set_uint32(DEVICE(&s->u_cluster), "cluster-id", 1);
+
+    object_initialize_child(OBJECT(&s->u_cluster), "u-cpus", &s->u_cpus,
+                            TYPE_RISCV_HART_ARRAY);
+    qdev_prop_set_uint32(DEVICE(&s->u_cpus), "num-harts", ms->smp.cpus - 1);
+    qdev_prop_set_uint32(DEVICE(&s->u_cpus), "hartid-base", 1);
+    qdev_prop_set_string(DEVICE(&s->u_cpus), "cpu-type",
+                         TYPE_RISCV_CPU_SIFIVE_U54);
+    qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", RESET_VECTOR);
+}
+
+static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
+{
+    MachineState *ms = MACHINE(qdev_get_machine());
+    MicrochipPFSoCState *s = MICROCHIP_PFSOC(dev);
+    const struct MemmapEntry *memmap = microchip_pfsoc_memmap;
+    MemoryRegion *system_memory = get_system_memory();
+    MemoryRegion *e51_dtim_mem = g_new(MemoryRegion, 1);
+    MemoryRegion *l2lim_mem = g_new(MemoryRegion, 1);
+    MemoryRegion *envm_data = g_new(MemoryRegion, 1);
+    char *plic_hart_config;
+    size_t plic_hart_config_len;
+    int i;
+
+    sysbus_realize(SYS_BUS_DEVICE(&s->e_cpus), &error_abort);
+    sysbus_realize(SYS_BUS_DEVICE(&s->u_cpus), &error_abort);
+    /*
+     * The cluster must be realized after the RISC-V hart array container,
+     * as the container's CPU object is only created on realize, and the
+     * CPU must exist and have been parented into the cluster before the
+     * cluster is realized.
+     */
+    qdev_realize(DEVICE(&s->e_cluster), NULL, &error_abort);
+    qdev_realize(DEVICE(&s->u_cluster), NULL, &error_abort);
+
+    /* E51 DTIM */
+    memory_region_init_ram(e51_dtim_mem, NULL, "microchip.pfsoc.e51_dtim_mem",
+                           memmap[MICROCHIP_PFSOC_E51_DTIM].size, &error_fatal);
+    memory_region_add_subregion(system_memory,
+                                memmap[MICROCHIP_PFSOC_E51_DTIM].base,
+                                e51_dtim_mem);
+
+    /* Bus Error Units */
+    create_unimplemented_device("microchip.pfsoc.buserr_unit0_mem",
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT0].base,
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT0].size);
+    create_unimplemented_device("microchip.pfsoc.buserr_unit1_mem",
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT1].base,
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT1].size);
+    create_unimplemented_device("microchip.pfsoc.buserr_unit2_mem",
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT2].base,
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT2].size);
+    create_unimplemented_device("microchip.pfsoc.buserr_unit3_mem",
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT3].base,
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT3].size);
+    create_unimplemented_device("microchip.pfsoc.buserr_unit4_mem",
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT4].base,
+        memmap[MICROCHIP_PFSOC_BUSERR_UNIT4].size);
+
+    /* CLINT */
+    sifive_clint_create(memmap[MICROCHIP_PFSOC_CLINT].base,
+        memmap[MICROCHIP_PFSOC_CLINT].size, 0, ms->smp.cpus,
+        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
+
+    /* L2 cache controller */
+    create_unimplemented_device("microchip.pfsoc.l2cc",
+        memmap[MICROCHIP_PFSOC_L2CC].base, memmap[MICROCHIP_PFSOC_L2CC].size);
+
+    /*
+     * Add L2-LIM at reset size.
+     * This should be reduced in size as the L2 Cache Controller WayEnable
+     * register is incremented. Unfortunately I don't see a nice (or any) way
+     * to handle reducing or blocking out the L2 LIM while still allowing it
+     * be re returned to all enabled after a reset. For the time being, just
+     * leave it enabled all the time. This won't break anything, but will be
+     * too generous to misbehaving guests.
+     */
+    memory_region_init_ram(l2lim_mem, NULL, "microchip.pfsoc.l2lim",
+                           memmap[MICROCHIP_PFSOC_L2LIM].size, &error_fatal);
+    memory_region_add_subregion(system_memory,
+                                memmap[MICROCHIP_PFSOC_L2LIM].base,
+                                l2lim_mem);
+
+    /* create PLIC hart topology configuration string */
+    plic_hart_config_len = (strlen(MICROCHIP_PFSOC_PLIC_HART_CONFIG) + 1) *
+                           ms->smp.cpus;
+    plic_hart_config = g_malloc0(plic_hart_config_len);
+    for (i = 0; i < ms->smp.cpus; i++) {
+        if (i != 0) {
+            strncat(plic_hart_config, "," MICROCHIP_PFSOC_PLIC_HART_CONFIG,
+                    plic_hart_config_len);
+        } else {
+            strncat(plic_hart_config, "M", plic_hart_config_len);
+        }
+        plic_hart_config_len -= (strlen(MICROCHIP_PFSOC_PLIC_HART_CONFIG) + 1);
+    }
+
+    /* PLIC */
+    s->plic = sifive_plic_create(memmap[MICROCHIP_PFSOC_PLIC].base,
+        plic_hart_config, 0,
+        MICROCHIP_PFSOC_PLIC_NUM_SOURCES,
+        MICROCHIP_PFSOC_PLIC_NUM_PRIORITIES,
+        MICROCHIP_PFSOC_PLIC_PRIORITY_BASE,
+        MICROCHIP_PFSOC_PLIC_PENDING_BASE,
+        MICROCHIP_PFSOC_PLIC_ENABLE_BASE,
+        MICROCHIP_PFSOC_PLIC_ENABLE_STRIDE,
+        MICROCHIP_PFSOC_PLIC_CONTEXT_BASE,
+        MICROCHIP_PFSOC_PLIC_CONTEXT_STRIDE,
+        memmap[MICROCHIP_PFSOC_PLIC].size);
+    g_free(plic_hart_config);
+
+    /* SYSREG */
+    create_unimplemented_device("microchip.pfsoc.sysreg",
+        memmap[MICROCHIP_PFSOC_SYSREG].base,
+        memmap[MICROCHIP_PFSOC_SYSREG].size);
+
+    /* MPUCFG */
+    create_unimplemented_device("microchip.pfsoc.mpucfg",
+        memmap[MICROCHIP_PFSOC_MPUCFG].base,
+        memmap[MICROCHIP_PFSOC_MPUCFG].size);
+
+    /* eNVM */
+    memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
+                           memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
+                           &error_fatal);
+    memory_region_add_subregion(system_memory,
+                                memmap[MICROCHIP_PFSOC_ENVM_DATA].base,
+                                envm_data);
+
+    /* IOSCBCFG */
+    create_unimplemented_device("microchip.pfsoc.ioscb.cfg",
+        memmap[MICROCHIP_PFSOC_IOSCB_CFG].base,
+        memmap[MICROCHIP_PFSOC_IOSCB_CFG].size);
+}
+
+static void microchip_pfsoc_soc_class_init(ObjectClass *oc, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(oc);
+
+    dc->realize = microchip_pfsoc_soc_realize;
+    /* Reason: Uses serial_hds in realize function, thus can't be used twice */
+    dc->user_creatable = false;
+}
+
+static const TypeInfo microchip_pfsoc_soc_type_info = {
+    .name = TYPE_MICROCHIP_PFSOC,
+    .parent = TYPE_DEVICE,
+    .instance_size = sizeof(MicrochipPFSoCState),
+    .instance_init = microchip_pfsoc_soc_instance_init,
+    .class_init = microchip_pfsoc_soc_class_init,
+};
+
+static void microchip_pfsoc_soc_register_types(void)
+{
+    type_register_static(&microchip_pfsoc_soc_type_info);
+}
+
+type_init(microchip_pfsoc_soc_register_types)
+
+static void microchip_icicle_kit_machine_init(MachineState *machine)
+{
+    MachineClass *mc = MACHINE_GET_CLASS(machine);
+    const struct MemmapEntry *memmap = microchip_pfsoc_memmap;
+    MicrochipIcicleKitState *s = MICROCHIP_ICICLE_KIT_MACHINE(machine);
+    MemoryRegion *system_memory = get_system_memory();
+    MemoryRegion *main_mem = g_new(MemoryRegion, 1);
+
+    /* Sanity check on RAM size */
+    if (machine->ram_size < mc->default_ram_size) {
+        char *sz = size_to_str(mc->default_ram_size);
+        error_report("Invalid RAM size, should be bigger than %s", sz);
+        g_free(sz);
+        exit(EXIT_FAILURE);
+    }
+
+    /* Initialize SoC */
+    object_initialize_child(OBJECT(machine), "soc", &s->soc,
+                            TYPE_MICROCHIP_PFSOC);
+    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+
+    /* Register RAM */
+    memory_region_init_ram(main_mem, NULL, "microchip.icicle.kit.ram",
+                           machine->ram_size, &error_fatal);
+    memory_region_add_subregion(system_memory,
+                                memmap[MICROCHIP_PFSOC_DRAM].base, main_mem);
+
+    /* Load the firmware */
+    riscv_find_and_load_firmware(machine, BIOS_FILENAME, RESET_VECTOR, NULL);
+}
+
+static void microchip_icicle_kit_machine_class_init(ObjectClass *oc, void *data)
+{
+    MachineClass *mc = MACHINE_CLASS(oc);
+
+    mc->desc = "Microchip PolarFire SoC Icicle Kit";
+    mc->init = microchip_icicle_kit_machine_init;
+    mc->max_cpus = MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT +
+                   MICROCHIP_PFSOC_COMPUTE_CPU_COUNT;
+    mc->min_cpus = MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT + 1;
+    mc->default_cpus = mc->min_cpus;
+    mc->default_ram_size = 1 * GiB;
+}
+
+static const TypeInfo microchip_icicle_kit_machine_typeinfo = {
+    .name       = MACHINE_TYPE_NAME("microchip-icicle-kit"),
+    .parent     = TYPE_MACHINE,
+    .class_init = microchip_icicle_kit_machine_class_init,
+    .instance_size = sizeof(MicrochipIcicleKitState),
+};
+
+static void microchip_icicle_kit_machine_init_register_types(void)
+{
+    type_register_static(&microchip_icicle_kit_machine_typeinfo);
+}
+
+type_init(microchip_icicle_kit_machine_init_register_types)
diff --git a/MAINTAINERS b/MAINTAINERS
index XXXXXXX..XXXXXXX 100644
--- a/MAINTAINERS
+++ b/MAINTAINERS
@@ -XXX,XX +XXX,XX @@ F: include/hw/riscv/opentitan.h
 F: include/hw/char/ibex_uart.h
 F: include/hw/intc/ibex_plic.h
 
+Microchip PolarFire SoC Icicle Kit
+M: Bin Meng <bin.meng@windriver.com>
+L: qemu-riscv@nongnu.org
+S: Supported
+F: hw/riscv/microchip_pfsoc.c
+F: include/hw/riscv/microchip_pfsoc.h
+
 RX Machines
 -----------
 rx-gdbsim
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
     select PCI_EXPRESS_GENERIC_BRIDGE
     select PFLASH_CFI01
     select SIFIVE
+
+config MICROCHIP_PFSOC
+    bool
+    select HART
+    select SIFIVE
+    select UNIMP
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_prci.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
+riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
 
 hw_arch += {'riscv': riscv_ss}
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Microchip PolarFire SoC MMUART is ns16550 compatible, with some
additional registers. Create a simple MMUART model built on top
of the existing ns16550 model.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-6-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/char/mchp_pfsoc_mmuart.h | 61 ++++++++++++++++++++
 hw/char/mchp_pfsoc_mmuart.c         | 86 +++++++++++++++++++++++++++++
 MAINTAINERS                         |  2 +
 hw/char/Kconfig                     |  3 +
 hw/char/meson.build                 |  1 +
 5 files changed, 153 insertions(+)
 create mode 100644 include/hw/char/mchp_pfsoc_mmuart.h
 create mode 100644 hw/char/mchp_pfsoc_mmuart.c

diff --git a/include/hw/char/mchp_pfsoc_mmuart.h b/include/hw/char/mchp_pfsoc_mmuart.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/char/mchp_pfsoc_mmuart.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * Microchip PolarFire SoC MMUART emulation
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a copy
+ * of this software and associated documentation files (the "Software"), to deal
+ * in the Software without restriction, including without limitation the rights
+ * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+ * copies of the Software, and to permit persons to whom the Software is
+ * furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included in
+ * all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+ * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
+ * THE SOFTWARE.
+ */
+
+#ifndef HW_MCHP_PFSOC_MMUART_H
+#define HW_MCHP_PFSOC_MMUART_H
+
+#include "hw/char/serial.h"
+
+#define MCHP_PFSOC_MMUART_REG_SIZE  52
+
+typedef struct MchpPfSoCMMUartState {
+    MemoryRegion iomem;
+    hwaddr base;
+    qemu_irq irq;
+
+    SerialMM *serial;
+
+    uint32_t reg[MCHP_PFSOC_MMUART_REG_SIZE / sizeof(uint32_t)];
+} MchpPfSoCMMUartState;
+
+/**
+ * mchp_pfsoc_mmuart_create - Create a Microchip PolarFire SoC MMUART
+ *
+ * This is a helper routine for board to create a MMUART device that is
+ * compatible with Microchip PolarFire SoC.
+ *
+ * @sysmem: system memory region to map
+ * @base: base address of the MMUART registers
+ * @irq: IRQ number of the MMUART device
+ * @chr: character device to associate to
+ *
+ * @return: a pointer to the device specific control structure
+ */
+MchpPfSoCMMUartState *mchp_pfsoc_mmuart_create(MemoryRegion *sysmem,
+    hwaddr base, qemu_irq irq, Chardev *chr);
+
+#endif /* HW_MCHP_PFSOC_MMUART_H */
diff --git a/hw/char/mchp_pfsoc_mmuart.c b/hw/char/mchp_pfsoc_mmuart.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/char/mchp_pfsoc_mmuart.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Microchip PolarFire SoC MMUART emulation
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License as
+ * published by the Free Software Foundation; either version 2 or
+ * (at your option) version 3 of the License.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, see <http://www.gnu.org/licenses/>.
+ */
+
+#include "qemu/osdep.h"
+#include "qemu/log.h"
+#include "chardev/char.h"
+#include "exec/address-spaces.h"
+#include "hw/char/mchp_pfsoc_mmuart.h"
+
+static uint64_t mchp_pfsoc_mmuart_read(void *opaque, hwaddr addr, unsigned size)
+{
+    MchpPfSoCMMUartState *s = opaque;
+
+    if (addr >= MCHP_PFSOC_MMUART_REG_SIZE) {
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: read: addr=0x%" HWADDR_PRIx "\n",
+                      __func__, addr);
+        return 0;
+    }
+
+    return s->reg[addr / sizeof(uint32_t)];
+}
+
+static void mchp_pfsoc_mmuart_write(void *opaque, hwaddr addr,
+                                    uint64_t value, unsigned size)
+{
+    MchpPfSoCMMUartState *s = opaque;
+    uint32_t val32 = (uint32_t)value;
+
+    if (addr >= MCHP_PFSOC_MMUART_REG_SIZE) {
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: bad write: addr=0x%" HWADDR_PRIx
+                      " v=0x%x\n", __func__, addr, val32);
+        return;
+    }
+
+    s->reg[addr / sizeof(uint32_t)] = val32;
+}
+
+static const MemoryRegionOps mchp_pfsoc_mmuart_ops = {
+    .read = mchp_pfsoc_mmuart_read,
+    .write = mchp_pfsoc_mmuart_write,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    .impl = {
+        .min_access_size = 4,
+        .max_access_size = 4,
+    },
+};
+
+MchpPfSoCMMUartState *mchp_pfsoc_mmuart_create(MemoryRegion *sysmem,
+    hwaddr base, qemu_irq irq, Chardev *chr)
+{
+    MchpPfSoCMMUartState *s;
+
+    s = g_new0(MchpPfSoCMMUartState, 1);
+
+    memory_region_init_io(&s->iomem, NULL, &mchp_pfsoc_mmuart_ops, s,
+                          "mchp.pfsoc.mmuart", 0x1000);
+
+    s->base = base;
+    s->irq = irq;
+
+    s->serial = serial_mm_init(sysmem, base, 2, irq, 399193, chr,
+                               DEVICE_LITTLE_ENDIAN);
+
+    memory_region_add_subregion(sysmem, base + 0x20, &s->iomem);
+
+    return s;
+}
diff --git a/MAINTAINERS b/MAINTAINERS
index XXXXXXX..XXXXXXX 100644
--- a/MAINTAINERS
+++ b/MAINTAINERS
@@ -XXX,XX +XXX,XX @@ M: Bin Meng <bin.meng@windriver.com>
 L: qemu-riscv@nongnu.org
 S: Supported
 F: hw/riscv/microchip_pfsoc.c
+F: hw/char/mchp_pfsoc_mmuart.c
 F: include/hw/riscv/microchip_pfsoc.h
+F: include/hw/char/mchp_pfsoc_mmuart.h
 
 RX Machines
 -----------
diff --git a/hw/char/Kconfig b/hw/char/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/Kconfig
+++ b/hw/char/Kconfig
@@ -XXX,XX +XXX,XX @@ config RENESAS_SCI
 
 config AVR_USART
     bool
+
+config MCHP_PFSOC_MMUART
+    bool
diff --git a/hw/char/meson.build b/hw/char/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/meson.build
+++ b/hw/char/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_aux.c'))
 softmmu_ss.add(when: 'CONFIG_RENESAS_SCI', if_true: files('renesas_sci.c'))
 softmmu_ss.add(when: 'CONFIG_SH4', if_true: files('sh_serial.c'))
 softmmu_ss.add(when: 'CONFIG_STM32F2XX_USART', if_true: files('stm32f2xx_usart.c'))
+softmmu_ss.add(when: 'CONFIG_MCHP_PFSOC_MMUART', if_true: files('mchp_pfsoc_mmuart.c'))
 
 specific_ss.add(when: 'CONFIG_TERMINAL3270', if_true: files('terminal3270.c'))
 specific_ss.add(when: 'CONFIG_VIRTIO', if_true: files('virtio-serial-bus.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Microchip PolarFire SoC has 5 MMUARTs, and the Icicle Kit board
wires 4 of them out. Let's connect all 5 MMUARTs.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-7-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/microchip_pfsoc.h | 20 ++++++++++++++++++++
 hw/riscv/microchip_pfsoc.c         | 30 ++++++++++++++++++++++++++++++
 hw/riscv/Kconfig                   |  1 +
 3 files changed, 51 insertions(+)

diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/microchip_pfsoc.h
+++ b/include/hw/riscv/microchip_pfsoc.h
@@ -XXX,XX +XXX,XX @@
 #ifndef HW_MICROCHIP_PFSOC_H
 #define HW_MICROCHIP_PFSOC_H
 
+#include "hw/char/mchp_pfsoc_mmuart.h"
+
 typedef struct MicrochipPFSoCState {
     /*< private >*/
     DeviceState parent_obj;
@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
     RISCVHartArrayState e_cpus;
     RISCVHartArrayState u_cpus;
     DeviceState *plic;
+    MchpPfSoCMMUartState *serial0;
+    MchpPfSoCMMUartState *serial1;
+    MchpPfSoCMMUartState *serial2;
+    MchpPfSoCMMUartState *serial3;
+    MchpPfSoCMMUartState *serial4;
 } MicrochipPFSoCState;
 
 #define TYPE_MICROCHIP_PFSOC    "microchip.pfsoc"
@@ -XXX,XX +XXX,XX @@ enum {
     MICROCHIP_PFSOC_L2CC,
     MICROCHIP_PFSOC_L2LIM,
     MICROCHIP_PFSOC_PLIC,
+    MICROCHIP_PFSOC_MMUART0,
     MICROCHIP_PFSOC_SYSREG,
     MICROCHIP_PFSOC_MPUCFG,
+    MICROCHIP_PFSOC_MMUART1,
+    MICROCHIP_PFSOC_MMUART2,
+    MICROCHIP_PFSOC_MMUART3,
+    MICROCHIP_PFSOC_MMUART4,
     MICROCHIP_PFSOC_ENVM_CFG,
     MICROCHIP_PFSOC_ENVM_DATA,
     MICROCHIP_PFSOC_IOSCB_CFG,
     MICROCHIP_PFSOC_DRAM,
 };
 
+enum {
+    MICROCHIP_PFSOC_MMUART0_IRQ = 90,
+    MICROCHIP_PFSOC_MMUART1_IRQ = 91,
+    MICROCHIP_PFSOC_MMUART2_IRQ = 92,
+    MICROCHIP_PFSOC_MMUART3_IRQ = 93,
+    MICROCHIP_PFSOC_MMUART4_IRQ = 94,
+};
+
 #define MICROCHIP_PFSOC_MANAGEMENT_CPU_COUNT    1
 #define MICROCHIP_PFSOC_COMPUTE_CPU_COUNT       4
 
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
  * 0) CLINT (Core Level Interruptor)
  * 1) PLIC (Platform Level Interrupt Controller)
  * 2) eNVM (Embedded Non-Volatile Memory)
+ * 3) MMUARTs (Multi-Mode UART)
  *
  * This board currently generates devicetree dynamically that indicates at least
  * two harts and up to five harts.
@@ -XXX,XX +XXX,XX @@
 #include "hw/irq.h"
 #include "hw/loader.h"
 #include "hw/sysbus.h"
+#include "chardev/char.h"
 #include "hw/cpu/cluster.h"
 #include "target/riscv/cpu.h"
 #include "hw/misc/unimp.h"
@@ -XXX,XX +XXX,XX @@
 #include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/sifive_plic.h"
 #include "hw/riscv/microchip_pfsoc.h"
+#include "sysemu/sysemu.h"
 
 /*
  * The BIOS image used by this machine is called Hart Software Services (HSS).
@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
     [MICROCHIP_PFSOC_L2CC] =            {  0x2010000,     0x1000 },
     [MICROCHIP_PFSOC_L2LIM] =           {  0x8000000,  0x2000000 },
     [MICROCHIP_PFSOC_PLIC] =            {  0xc000000,  0x4000000 },
+    [MICROCHIP_PFSOC_MMUART0] =         { 0x20000000,     0x1000 },
     [MICROCHIP_PFSOC_SYSREG] =          { 0x20002000,     0x2000 },
     [MICROCHIP_PFSOC_MPUCFG] =          { 0x20005000,     0x1000 },
+    [MICROCHIP_PFSOC_MMUART1] =         { 0x20100000,     0x1000 },
+    [MICROCHIP_PFSOC_MMUART2] =         { 0x20102000,     0x1000 },
+    [MICROCHIP_PFSOC_MMUART3] =         { 0x20104000,     0x1000 },
+    [MICROCHIP_PFSOC_MMUART4] =         { 0x20106000,     0x1000 },
     [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
     [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
     [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
         memmap[MICROCHIP_PFSOC_MPUCFG].base,
         memmap[MICROCHIP_PFSOC_MPUCFG].size);
 
+    /* MMUARTs */
+    s->serial0 = mchp_pfsoc_mmuart_create(system_memory,
+        memmap[MICROCHIP_PFSOC_MMUART0].base,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART0_IRQ),
+        serial_hd(0));
+    s->serial1 = mchp_pfsoc_mmuart_create(system_memory,
+        memmap[MICROCHIP_PFSOC_MMUART1].base,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART1_IRQ),
+        serial_hd(1));
+    s->serial2 = mchp_pfsoc_mmuart_create(system_memory,
+        memmap[MICROCHIP_PFSOC_MMUART2].base,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART2_IRQ),
+        serial_hd(2));
+    s->serial3 = mchp_pfsoc_mmuart_create(system_memory,
+        memmap[MICROCHIP_PFSOC_MMUART3].base,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART3_IRQ),
+        serial_hd(3));
+    s->serial4 = mchp_pfsoc_mmuart_create(system_memory,
+        memmap[MICROCHIP_PFSOC_MMUART4].base,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART4_IRQ),
+        serial_hd(4));
+
     /* eNVM */
     memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
                            memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
     select HART
     select SIFIVE
     select UNIMP
+    select MCHP_PFSOC_MMUART
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Cadence SD/SDIO/eMMC Host Controller (SD4HC) is an SDHCI compatible
controller. The SDHCI compatible registers start from offset 0x200,
which are called Slot Register Set (SRS) in its datasheet.

This creates a Cadence SDHCI model built on top of the existing
generic SDHCI model. Cadence specific Host Register Set (HRS) is
implemented to make guest software happy.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Acked-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Acked-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-8-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/sd/cadence_sdhci.h |  47 +++++++++
 hw/sd/cadence_sdhci.c         | 193 ++++++++++++++++++++++++++++++++++
 hw/sd/Kconfig                 |   4 +
 hw/sd/meson.build             |   1 +
 4 files changed, 245 insertions(+)
 create mode 100644 include/hw/sd/cadence_sdhci.h
 create mode 100644 hw/sd/cadence_sdhci.c

diff --git a/include/hw/sd/cadence_sdhci.h b/include/hw/sd/cadence_sdhci.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/sd/cadence_sdhci.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * Cadence SDHCI emulation
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License as
+ * published by the Free Software Foundation; either version 2 or
+ * (at your option) version 3 of the License.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, see <http://www.gnu.org/licenses/>.
+ */
+
+#ifndef CADENCE_SDHCI_H
+#define CADENCE_SDHCI_H
+
+#include "hw/sd/sdhci.h"
+
+#define CADENCE_SDHCI_REG_SIZE  0x100
+#define CADENCE_SDHCI_NUM_REGS  (CADENCE_SDHCI_REG_SIZE / sizeof(uint32_t))
+
+typedef struct CadenceSDHCIState {
+    SysBusDevice parent;
+
+    MemoryRegion container;
+    MemoryRegion iomem;
+    BusState *bus;
+
+    uint32_t regs[CADENCE_SDHCI_NUM_REGS];
+
+    SDHCIState sdhci;
+} CadenceSDHCIState;
+
+#define TYPE_CADENCE_SDHCI  "cadence.sdhci"
+#define CADENCE_SDHCI(obj)  OBJECT_CHECK(CadenceSDHCIState, (obj), \
+                                         TYPE_CADENCE_SDHCI)
+
+#endif /* CADENCE_SDHCI_H */
diff --git a/hw/sd/cadence_sdhci.c b/hw/sd/cadence_sdhci.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/sd/cadence_sdhci.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Cadence SDHCI emulation
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License as
+ * published by the Free Software Foundation; either version 2 or
+ * (at your option) version 3 of the License.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, see <http://www.gnu.org/licenses/>.
+ */
+
+#include "qemu/osdep.h"
+#include "qemu/bitops.h"
+#include "qemu/error-report.h"
+#include "qemu/log.h"
+#include "qapi/error.h"
+#include "migration/vmstate.h"
+#include "hw/irq.h"
+#include "hw/sd/cadence_sdhci.h"
+#include "sdhci-internal.h"
+
+/* HRS - Host Register Set (specific to Cadence) */
+
+#define CADENCE_SDHCI_HRS00             0x00    /* general information */
+#define CADENCE_SDHCI_HRS00_SWR             BIT(0)
+#define CADENCE_SDHCI_HRS00_POR_VAL         0x00010000
+
+#define CADENCE_SDHCI_HRS04             0x10    /* PHY access port */
+#define CADENCE_SDHCI_HRS04_WR              BIT(24)
+#define CADENCE_SDHCI_HRS04_RD              BIT(25)
+#define CADENCE_SDHCI_HRS04_ACK             BIT(26)
+
+#define CADENCE_SDHCI_HRS06             0x18    /* eMMC control */
+#define CADENCE_SDHCI_HRS06_TUNE_UP         BIT(15)
+
+/* SRS - Slot Register Set (SDHCI-compatible) */
+
+#define CADENCE_SDHCI_SRS_BASE          0x200
+
+#define TO_REG(addr)    ((addr) / sizeof(uint32_t))
+
+static void cadence_sdhci_instance_init(Object *obj)
+{
+    CadenceSDHCIState *s = CADENCE_SDHCI(obj);
+
+    object_initialize_child(OBJECT(s), "generic-sdhci",
+                            &s->sdhci, TYPE_SYSBUS_SDHCI);
+}
+
+static void cadence_sdhci_reset(DeviceState *dev)
+{
+    CadenceSDHCIState *s = CADENCE_SDHCI(dev);
+
+    memset(s->regs, 0, CADENCE_SDHCI_REG_SIZE);
+    s->regs[TO_REG(CADENCE_SDHCI_HRS00)] = CADENCE_SDHCI_HRS00_POR_VAL;
+
+    device_cold_reset(DEVICE(&s->sdhci));
+}
+
+static uint64_t cadence_sdhci_read(void *opaque, hwaddr addr, unsigned int size)
+{
+    CadenceSDHCIState *s = opaque;
+    uint32_t val;
+
+    val = s->regs[TO_REG(addr)];
+
+    return (uint64_t)val;
+}
+
+static void cadence_sdhci_write(void *opaque, hwaddr addr, uint64_t val,
+                                unsigned int size)
+{
+    CadenceSDHCIState *s = opaque;
+    uint32_t val32 = (uint32_t)val;
+
+    switch (addr) {
+    case CADENCE_SDHCI_HRS00:
+        /*
+         * The only writable bit is SWR (software reset) and it automatically
+         * clears to zero, so essentially this register remains unchanged.
+         */
+        if (val32 & CADENCE_SDHCI_HRS00_SWR) {
+            cadence_sdhci_reset(DEVICE(s));
+        }
+
+        break;
+    case CADENCE_SDHCI_HRS04:
+        /*
+         * Only emulate the ACK bit behavior when read or write transaction
+         * are requested.
+         */
+        if (val32 & (CADENCE_SDHCI_HRS04_WR | CADENCE_SDHCI_HRS04_RD)) {
+            val32 |= CADENCE_SDHCI_HRS04_ACK;
+        } else {
+            val32 &= ~CADENCE_SDHCI_HRS04_ACK;
+        }
+
+        s->regs[TO_REG(addr)] = val32;
+        break;
+    case CADENCE_SDHCI_HRS06:
+        if (val32 & CADENCE_SDHCI_HRS06_TUNE_UP) {
+            val32 &= ~CADENCE_SDHCI_HRS06_TUNE_UP;
+        }
+
+        s->regs[TO_REG(addr)] = val32;
+        break;
+    default:
+        s->regs[TO_REG(addr)] = val32;
+        break;
+    }
+}
+
+static const MemoryRegionOps cadence_sdhci_ops = {
+    .read = cadence_sdhci_read,
+    .write = cadence_sdhci_write,
+    .endianness = DEVICE_NATIVE_ENDIAN,
+    .impl = {
+        .min_access_size = 4,
+        .max_access_size = 4,
+    },
+    .valid = {
+        .min_access_size = 4,
+        .max_access_size = 4,
+    }
+};
+
+static void cadence_sdhci_realize(DeviceState *dev, Error **errp)
+{
+    CadenceSDHCIState *s = CADENCE_SDHCI(dev);
+    SysBusDevice *sbd = SYS_BUS_DEVICE(dev);
+    SysBusDevice *sbd_sdhci = SYS_BUS_DEVICE(&s->sdhci);
+
+    memory_region_init(&s->container, OBJECT(s),
+                       "cadence.sdhci-container", 0x1000);
+    sysbus_init_mmio(sbd, &s->container);
+
+    memory_region_init_io(&s->iomem, OBJECT(s), &cadence_sdhci_ops,
+                          s, TYPE_CADENCE_SDHCI, CADENCE_SDHCI_REG_SIZE);
+    memory_region_add_subregion(&s->container, 0, &s->iomem);
+
+    sysbus_realize(sbd_sdhci, errp);
+    memory_region_add_subregion(&s->container, CADENCE_SDHCI_SRS_BASE,
+                                sysbus_mmio_get_region(sbd_sdhci, 0));
+
+    /* propagate irq and "sd-bus" from generic-sdhci */
+    sysbus_pass_irq(sbd, sbd_sdhci);
+    s->bus = qdev_get_child_bus(DEVICE(sbd_sdhci), "sd-bus");
+}
+
+static const VMStateDescription vmstate_cadence_sdhci = {
+    .name = TYPE_CADENCE_SDHCI,
+    .version_id = 1,
+    .fields = (VMStateField[]) {
+        VMSTATE_UINT32_ARRAY(regs, CadenceSDHCIState, CADENCE_SDHCI_NUM_REGS),
+        VMSTATE_END_OF_LIST(),
+    },
+};
+
+static void cadence_sdhci_class_init(ObjectClass *classp, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(classp);
+
+    dc->desc = "Cadence SD/SDIO/eMMC Host Controller (SD4HC)";
+    dc->realize = cadence_sdhci_realize;
+    dc->reset = cadence_sdhci_reset;
+    dc->vmsd = &vmstate_cadence_sdhci;
+}
+
+static TypeInfo cadence_sdhci_info = {
+    .name          = TYPE_CADENCE_SDHCI,
+    .parent        = TYPE_SYS_BUS_DEVICE,
+    .instance_size = sizeof(CadenceSDHCIState),
+    .instance_init = cadence_sdhci_instance_init,
+    .class_init    = cadence_sdhci_class_init,
+};
+
+static void cadence_sdhci_register_types(void)
+{
+    type_register_static(&cadence_sdhci_info);
+}
+
+type_init(cadence_sdhci_register_types)
diff --git a/hw/sd/Kconfig b/hw/sd/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/Kconfig
+++ b/hw/sd/Kconfig
@@ -XXX,XX +XXX,XX @@ config SDHCI_PCI
     default y if PCI_DEVICES
     depends on PCI
     select SDHCI
+
+config CADENCE_SDHCI
+    bool
+    select SDHCI
diff --git a/hw/sd/meson.build b/hw/sd/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/sd/meson.build
+++ b/hw/sd/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_PXA2XX', if_true: files('pxa2xx_mmci.c'))
 softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_sdhost.c'))
 softmmu_ss.add(when: 'CONFIG_ASPEED_SOC', if_true: files('aspeed_sdhci.c'))
 softmmu_ss.add(when: 'CONFIG_ALLWINNER_H3', if_true: files('allwinner-sdhost.c'))
+softmmu_ss.add(when: 'CONFIG_CADENCE_SDHCI', if_true: files('cadence_sdhci.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Microchip PolarFire SoC integrates one Cadence SDHCI controller.
On the Icicle Kit board, one eMMC chip and an external SD card
connect to this controller depending on different configuration.

As QEMU does not support eMMC yet, we just emulate the SD card
configuration. To test this, the Hart Software Services (HSS)
should choose the SD card configuration:

$ cp boards/icicle-kit-es/def_config.sdcard .config
$ make BOARD=icicle-kit-es

The SD card image can be built from the Yocto BSP at:
https://github.com/polarfire-soc/meta-polarfire-soc-yocto-bsp

Note the generated SD card image should be resized before use:
$ qemu-img resize /path/to/sdcard.img 4G

Launch QEMU with the following command:
$ qemu-system-riscv64 -nographic -M microchip-icicle-kit -sd sdcard.img

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-9-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/microchip_pfsoc.h |  4 ++++
 hw/riscv/microchip_pfsoc.c         | 23 +++++++++++++++++++++++
 hw/riscv/Kconfig                   |  1 +
 3 files changed, 28 insertions(+)

diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/microchip_pfsoc.h
+++ b/include/hw/riscv/microchip_pfsoc.h
@@ -XXX,XX +XXX,XX @@
 #define HW_MICROCHIP_PFSOC_H
 
 #include "hw/char/mchp_pfsoc_mmuart.h"
+#include "hw/sd/cadence_sdhci.h"
 
 typedef struct MicrochipPFSoCState {
     /*< private >*/
@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
     MchpPfSoCMMUartState *serial2;
     MchpPfSoCMMUartState *serial3;
     MchpPfSoCMMUartState *serial4;
+    CadenceSDHCIState sdhci;
 } MicrochipPFSoCState;
 
 #define TYPE_MICROCHIP_PFSOC    "microchip.pfsoc"
@@ -XXX,XX +XXX,XX @@ enum {
     MICROCHIP_PFSOC_MMUART0,
     MICROCHIP_PFSOC_SYSREG,
     MICROCHIP_PFSOC_MPUCFG,
+    MICROCHIP_PFSOC_EMMC_SD,
     MICROCHIP_PFSOC_MMUART1,
     MICROCHIP_PFSOC_MMUART2,
     MICROCHIP_PFSOC_MMUART3,
@@ -XXX,XX +XXX,XX @@ enum {
 };
 
 enum {
+    MICROCHIP_PFSOC_EMMC_SD_IRQ = 88,
     MICROCHIP_PFSOC_MMUART0_IRQ = 90,
     MICROCHIP_PFSOC_MMUART1_IRQ = 91,
     MICROCHIP_PFSOC_MMUART2_IRQ = 92,
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
  * 1) PLIC (Platform Level Interrupt Controller)
  * 2) eNVM (Embedded Non-Volatile Memory)
  * 3) MMUARTs (Multi-Mode UART)
+ * 4) Cadence eMMC/SDHC controller and an SD card connected to it
  *
  * This board currently generates devicetree dynamically that indicates at least
  * two harts and up to five harts.
@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
     [MICROCHIP_PFSOC_MMUART0] =         { 0x20000000,     0x1000 },
     [MICROCHIP_PFSOC_SYSREG] =          { 0x20002000,     0x2000 },
     [MICROCHIP_PFSOC_MPUCFG] =          { 0x20005000,     0x1000 },
+    [MICROCHIP_PFSOC_EMMC_SD] =         { 0x20008000,     0x1000 },
     [MICROCHIP_PFSOC_MMUART1] =         { 0x20100000,     0x1000 },
     [MICROCHIP_PFSOC_MMUART2] =         { 0x20102000,     0x1000 },
     [MICROCHIP_PFSOC_MMUART3] =         { 0x20104000,     0x1000 },
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_instance_init(Object *obj)
     qdev_prop_set_string(DEVICE(&s->u_cpus), "cpu-type",
                          TYPE_RISCV_CPU_SIFIVE_U54);
     qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", RESET_VECTOR);
+
+    object_initialize_child(obj, "sd-controller", &s->sdhci,
+                            TYPE_CADENCE_SDHCI);
 }
 
 static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
         memmap[MICROCHIP_PFSOC_MPUCFG].base,
         memmap[MICROCHIP_PFSOC_MPUCFG].size);
 
+    /* SDHCI */
+    sysbus_realize(SYS_BUS_DEVICE(&s->sdhci), errp);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->sdhci), 0,
+                    memmap[MICROCHIP_PFSOC_EMMC_SD].base);
+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->sdhci), 0,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_EMMC_SD_IRQ));
+
     /* MMUARTs */
     s->serial0 = mchp_pfsoc_mmuart_create(system_memory,
         memmap[MICROCHIP_PFSOC_MMUART0].base,
@@ -XXX,XX +XXX,XX @@ static void microchip_icicle_kit_machine_init(MachineState *machine)
     MicrochipIcicleKitState *s = MICROCHIP_ICICLE_KIT_MACHINE(machine);
     MemoryRegion *system_memory = get_system_memory();
     MemoryRegion *main_mem = g_new(MemoryRegion, 1);
+    DriveInfo *dinfo = drive_get_next(IF_SD);
 
     /* Sanity check on RAM size */
     if (machine->ram_size < mc->default_ram_size) {
@@ -XXX,XX +XXX,XX @@ static void microchip_icicle_kit_machine_init(MachineState *machine)
 
     /* Load the firmware */
     riscv_find_and_load_firmware(machine, BIOS_FILENAME, RESET_VECTOR, NULL);
+
+    /* Attach an SD card */
+    if (dinfo) {
+        CadenceSDHCIState *sdhci = &(s->soc.sdhci);
+        DeviceState *card = qdev_new(TYPE_SD_CARD);
+
+        qdev_prop_set_drive_err(card, "drive", blk_by_legacy_dinfo(dinfo),
+                                &error_fatal);
+        qdev_realize_and_unref(card, sdhci->bus, &error_fatal);
+    }
 }
 
 static void microchip_icicle_kit_machine_class_init(ObjectClass *oc, void *data)
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
     select SIFIVE
     select UNIMP
     select MCHP_PFSOC_MMUART
+    select CADENCE_SDHCI
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Microchip PolarFire SoC integrates a DMA engine that supports:
* Independent concurrent DMA transfers using 4 DMA channels
* Generation of interrupts on various conditions during execution
which is actually an IP reused from the SiFive FU540 chip.

This creates a model to support both polling and interrupt modes.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Acked-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-10-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/dma/sifive_pdma.h |  57 +++++++
 hw/dma/sifive_pdma.c         | 313 +++++++++++++++++++++++++++++++++++
 hw/dma/Kconfig               |   3 +
 hw/dma/meson.build           |   1 +
 4 files changed, 374 insertions(+)
 create mode 100644 include/hw/dma/sifive_pdma.h
 create mode 100644 hw/dma/sifive_pdma.c

diff --git a/include/hw/dma/sifive_pdma.h b/include/hw/dma/sifive_pdma.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/include/hw/dma/sifive_pdma.h
@@ -XXX,XX +XXX,XX @@
+/*
+ * SiFive Platform DMA emulation
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License as
+ * published by the Free Software Foundation; either version 2 or
+ * (at your option) version 3 of the License.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, see <http://www.gnu.org/licenses/>.
+ */
+
+#ifndef SIFIVE_PDMA_H
+#define SIFIVE_PDMA_H
+
+struct sifive_pdma_chan {
+    uint32_t control;
+    uint32_t next_config;
+    uint64_t next_bytes;
+    uint64_t next_dst;
+    uint64_t next_src;
+    uint32_t exec_config;
+    uint64_t exec_bytes;
+    uint64_t exec_dst;
+    uint64_t exec_src;
+    int state;
+};
+
+#define SIFIVE_PDMA_CHANS           4
+#define SIFIVE_PDMA_IRQS            (SIFIVE_PDMA_CHANS * 2)
+#define SIFIVE_PDMA_REG_SIZE        0x100000
+#define SIFIVE_PDMA_CHAN_NO(reg)    ((reg & (SIFIVE_PDMA_REG_SIZE - 1)) >> 12)
+
+typedef struct SiFivePDMAState {
+    SysBusDevice parent;
+    MemoryRegion iomem;
+    qemu_irq irq[SIFIVE_PDMA_IRQS];
+
+    struct sifive_pdma_chan chan[SIFIVE_PDMA_CHANS];
+} SiFivePDMAState;
+
+#define TYPE_SIFIVE_PDMA    "sifive.pdma"
+
+#define SIFIVE_PDMA(obj)    \
+    OBJECT_CHECK(SiFivePDMAState, (obj), TYPE_SIFIVE_PDMA)
+
+#endif /* SIFIVE_PDMA_H */
diff --git a/hw/dma/sifive_pdma.c b/hw/dma/sifive_pdma.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/hw/dma/sifive_pdma.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * SiFive Platform DMA emulation
+ *
+ * Copyright (c) 2020 Wind River Systems, Inc.
+ *
+ * Author:
+ *   Bin Meng <bin.meng@windriver.com>
+ *
+ * This program is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU General Public License as
+ * published by the Free Software Foundation; either version 2 or
+ * (at your option) version 3 of the License.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, see <http://www.gnu.org/licenses/>.
+ */
+
+#include "qemu/osdep.h"
+#include "qemu/bitops.h"
+#include "qemu/log.h"
+#include "qapi/error.h"
+#include "hw/hw.h"
+#include "hw/irq.h"
+#include "hw/qdev-properties.h"
+#include "hw/sysbus.h"
+#include "migration/vmstate.h"
+#include "sysemu/dma.h"
+#include "hw/dma/sifive_pdma.h"
+
+#define DMA_CONTROL         0x000
+#define   CONTROL_CLAIM     BIT(0)
+#define   CONTROL_RUN       BIT(1)
+#define   CONTROL_DONE_IE   BIT(14)
+#define   CONTROL_ERR_IE    BIT(15)
+#define   CONTROL_DONE      BIT(30)
+#define   CONTROL_ERR       BIT(31)
+
+#define DMA_NEXT_CONFIG     0x004
+#define   CONFIG_REPEAT     BIT(2)
+#define   CONFIG_ORDER      BIT(3)
+#define   CONFIG_WRSZ_SHIFT 24
+#define   CONFIG_RDSZ_SHIFT 28
+#define   CONFIG_SZ_MASK    0xf
+
+#define DMA_NEXT_BYTES      0x008
+#define DMA_NEXT_DST        0x010
+#define DMA_NEXT_SRC        0x018
+#define DMA_EXEC_CONFIG     0x104
+#define DMA_EXEC_BYTES      0x108
+#define DMA_EXEC_DST        0x110
+#define DMA_EXEC_SRC        0x118
+
+enum dma_chan_state {
+    DMA_CHAN_STATE_IDLE,
+    DMA_CHAN_STATE_STARTED,
+    DMA_CHAN_STATE_ERROR,
+    DMA_CHAN_STATE_DONE
+};
+
+static void sifive_pdma_run(SiFivePDMAState *s, int ch)
+{
+    uint64_t bytes = s->chan[ch].next_bytes;
+    uint64_t dst = s->chan[ch].next_dst;
+    uint64_t src = s->chan[ch].next_src;
+    uint32_t config = s->chan[ch].next_config;
+    int wsize, rsize, size;
+    uint8_t buf[64];
+    int n;
+
+    /* do nothing if bytes to transfer is zero */
+    if (!bytes) {
+        goto error;
+    }
+
+    /*
+     * The manual does not describe how the hardware behaviors when
+     * config.wsize and config.rsize are given different values.
+     * A common case is memory to memory DMA, and in this case they
+     * are normally the same. Abort if this expectation fails.
+     */
+    wsize = (config >> CONFIG_WRSZ_SHIFT) & CONFIG_SZ_MASK;
+    rsize = (config >> CONFIG_RDSZ_SHIFT) & CONFIG_SZ_MASK;
+    if (wsize != rsize) {
+        goto error;
+    }
+
+    /*
+     * Calculate the transaction size
+     *
+     * size field is base 2 logarithm of DMA transaction size,
+     * but there is an upper limit of 64 bytes per transaction.
+     */
+    size = wsize;
+    if (size > 6) {
+        size = 6;
+    }
+    size = 1 << size;
+
+    /* the bytes to transfer should be multiple of transaction size */
+    if (bytes % size) {
+        goto error;
+    }
+
+    /* indicate a DMA transfer is started */
+    s->chan[ch].state = DMA_CHAN_STATE_STARTED;
+    s->chan[ch].control &= ~CONTROL_DONE;
+    s->chan[ch].control &= ~CONTROL_ERR;
+
+    /* load the next_ registers into their exec_ counterparts */
+    s->chan[ch].exec_config = config;
+    s->chan[ch].exec_bytes = bytes;
+    s->chan[ch].exec_dst = dst;
+    s->chan[ch].exec_src = src;
+
+    for (n = 0; n < bytes / size; n++) {
+        cpu_physical_memory_read(s->chan[ch].exec_src, buf, size);
+        cpu_physical_memory_write(s->chan[ch].exec_dst, buf, size);
+        s->chan[ch].exec_src += size;
+        s->chan[ch].exec_dst += size;
+        s->chan[ch].exec_bytes -= size;
+    }
+
+    /* indicate a DMA transfer is done */
+    s->chan[ch].state = DMA_CHAN_STATE_DONE;
+    s->chan[ch].control &= ~CONTROL_RUN;
+    s->chan[ch].control |= CONTROL_DONE;
+
+    /* reload exec_ registers if repeat is required */
+    if (s->chan[ch].next_config & CONFIG_REPEAT) {
+        s->chan[ch].exec_bytes = bytes;
+        s->chan[ch].exec_dst = dst;
+        s->chan[ch].exec_src = src;
+    }
+
+    return;
+
+error:
+    s->chan[ch].state = DMA_CHAN_STATE_ERROR;
+    s->chan[ch].control |= CONTROL_ERR;
+    return;
+}
+
+static inline void sifive_pdma_update_irq(SiFivePDMAState *s, int ch)
+{
+    bool done_ie, err_ie;
+
+    done_ie = !!(s->chan[ch].control & CONTROL_DONE_IE);
+    err_ie = !!(s->chan[ch].control & CONTROL_ERR_IE);
+
+    if (done_ie && (s->chan[ch].control & CONTROL_DONE)) {
+        qemu_irq_raise(s->irq[ch * 2]);
+    } else {
+        qemu_irq_lower(s->irq[ch * 2]);
+    }
+
+    if (err_ie && (s->chan[ch].control & CONTROL_ERR)) {
+        qemu_irq_raise(s->irq[ch * 2 + 1]);
+    } else {
+        qemu_irq_lower(s->irq[ch * 2 + 1]);
+    }
+
+    s->chan[ch].state = DMA_CHAN_STATE_IDLE;
+}
+
+static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
+{
+    SiFivePDMAState *s = opaque;
+    int ch = SIFIVE_PDMA_CHAN_NO(offset);
+    uint64_t val = 0;
+
+    if (ch >= SIFIVE_PDMA_CHANS) {
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
+                      __func__, ch);
+        return 0;
+    }
+
+    offset &= 0xfff;
+    switch (offset) {
+    case DMA_CONTROL:
+        val = s->chan[ch].control;
+        break;
+    case DMA_NEXT_CONFIG:
+        val = s->chan[ch].next_config;
+        break;
+    case DMA_NEXT_BYTES:
+        val = s->chan[ch].next_bytes;
+        break;
+    case DMA_NEXT_DST:
+        val = s->chan[ch].next_dst;
+        break;
+    case DMA_NEXT_SRC:
+        val = s->chan[ch].next_src;
+        break;
+    case DMA_EXEC_CONFIG:
+        val = s->chan[ch].exec_config;
+        break;
+    case DMA_EXEC_BYTES:
+        val = s->chan[ch].exec_bytes;
+        break;
+    case DMA_EXEC_DST:
+        val = s->chan[ch].exec_dst;
+        break;
+    case DMA_EXEC_SRC:
+        val = s->chan[ch].exec_src;
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
+                      __func__, offset);
+        break;
+    }
+
+    return val;
+}
+
+static void sifive_pdma_write(void *opaque, hwaddr offset,
+                              uint64_t value, unsigned size)
+{
+    SiFivePDMAState *s = opaque;
+    int ch = SIFIVE_PDMA_CHAN_NO(offset);
+
+    if (ch >= SIFIVE_PDMA_CHANS) {
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
+                      __func__, ch);
+        return;
+    }
+
+    offset &= 0xfff;
+    switch (offset) {
+    case DMA_CONTROL:
+        s->chan[ch].control = value;
+
+        if (value & CONTROL_RUN) {
+            sifive_pdma_run(s, ch);
+        }
+
+        sifive_pdma_update_irq(s, ch);
+        break;
+    case DMA_NEXT_CONFIG:
+        s->chan[ch].next_config = value;
+        break;
+    case DMA_NEXT_BYTES:
+        s->chan[ch].next_bytes = value;
+        break;
+    case DMA_NEXT_DST:
+        s->chan[ch].next_dst = value;
+        break;
+    case DMA_NEXT_SRC:
+        s->chan[ch].next_src = value;
+        break;
+    case DMA_EXEC_CONFIG:
+    case DMA_EXEC_BYTES:
+    case DMA_EXEC_DST:
+    case DMA_EXEC_SRC:
+        /* these are read-only registers */
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
+                      __func__, offset);
+        break;
+    }
+}
+
+static const MemoryRegionOps sifive_pdma_ops = {
+    .read = sifive_pdma_read,
+    .write = sifive_pdma_write,
+    .endianness = DEVICE_LITTLE_ENDIAN,
+    /* there are 32-bit and 64-bit wide registers */
+    .impl = {
+        .min_access_size = 4,
+        .max_access_size = 8,
+    }
+};
+
+static void sifive_pdma_realize(DeviceState *dev, Error **errp)
+{
+    SiFivePDMAState *s = SIFIVE_PDMA(dev);
+    int i;
+
+    memory_region_init_io(&s->iomem, OBJECT(dev), &sifive_pdma_ops, s,
+                          TYPE_SIFIVE_PDMA, SIFIVE_PDMA_REG_SIZE);
+    sysbus_init_mmio(SYS_BUS_DEVICE(dev), &s->iomem);
+
+    for (i = 0; i < SIFIVE_PDMA_IRQS; i++) {
+        sysbus_init_irq(SYS_BUS_DEVICE(dev), &s->irq[i]);
+    }
+}
+
+static void sifive_pdma_class_init(ObjectClass *klass, void *data)
+{
+    DeviceClass *dc = DEVICE_CLASS(klass);
+
+    dc->desc = "SiFive Platform DMA controller";
+    dc->realize = sifive_pdma_realize;
+}
+
+static const TypeInfo sifive_pdma_info = {
+    .name          = TYPE_SIFIVE_PDMA,
+    .parent        = TYPE_SYS_BUS_DEVICE,
+    .instance_size = sizeof(SiFivePDMAState),
+    .class_init    = sifive_pdma_class_init,
+};
+
+static void sifive_pdma_register_types(void)
+{
+    type_register_static(&sifive_pdma_info);
+}
+
+type_init(sifive_pdma_register_types)
diff --git a/hw/dma/Kconfig b/hw/dma/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/Kconfig
+++ b/hw/dma/Kconfig
@@ -XXX,XX +XXX,XX @@ config ZYNQ_DEVCFG
 
 config STP2000
     bool
+
+config SIFIVE_PDMA
+    bool
diff --git a/hw/dma/meson.build b/hw/dma/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/meson.build
+++ b/hw/dma/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_XLNX_ZYNQMP_ARM', if_true: files('xlnx-zdma.c'))
 softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_dma.c', 'soc_dma.c'))
 softmmu_ss.add(when: 'CONFIG_PXA2XX', if_true: files('pxa2xx_dma.c'))
 softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_dma.c'))
+softmmu_ss.add(when: 'CONFIG_SIFIVE_PDMA', if_true: files('sifive_pdma.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

On the Icicle Kit board, the HSS firmware utilizes the on-chip DMA
controller to move the 2nd stage bootloader in the system memory.
Let's connect a DMA controller to Microchip PolarFire SoC.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-11-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/microchip_pfsoc.h | 11 +++++++++++
 hw/riscv/microchip_pfsoc.c         | 15 +++++++++++++++
 hw/riscv/Kconfig                   |  1 +
 3 files changed, 27 insertions(+)

diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/microchip_pfsoc.h
+++ b/include/hw/riscv/microchip_pfsoc.h
@@ -XXX,XX +XXX,XX @@
 #define HW_MICROCHIP_PFSOC_H
 
 #include "hw/char/mchp_pfsoc_mmuart.h"
+#include "hw/dma/sifive_pdma.h"
 #include "hw/sd/cadence_sdhci.h"
 
 typedef struct MicrochipPFSoCState {
@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
     MchpPfSoCMMUartState *serial2;
     MchpPfSoCMMUartState *serial3;
     MchpPfSoCMMUartState *serial4;
+    SiFivePDMAState dma;
     CadenceSDHCIState sdhci;
 } MicrochipPFSoCState;
 
@@ -XXX,XX +XXX,XX @@ enum {
     MICROCHIP_PFSOC_BUSERR_UNIT4,
     MICROCHIP_PFSOC_CLINT,
     MICROCHIP_PFSOC_L2CC,
+    MICROCHIP_PFSOC_DMA,
     MICROCHIP_PFSOC_L2LIM,
     MICROCHIP_PFSOC_PLIC,
     MICROCHIP_PFSOC_MMUART0,
@@ -XXX,XX +XXX,XX @@ enum {
 };
 
 enum {
+    MICROCHIP_PFSOC_DMA_IRQ0 = 5,
+    MICROCHIP_PFSOC_DMA_IRQ1 = 6,
+    MICROCHIP_PFSOC_DMA_IRQ2 = 7,
+    MICROCHIP_PFSOC_DMA_IRQ3 = 8,
+    MICROCHIP_PFSOC_DMA_IRQ4 = 9,
+    MICROCHIP_PFSOC_DMA_IRQ5 = 10,
+    MICROCHIP_PFSOC_DMA_IRQ6 = 11,
+    MICROCHIP_PFSOC_DMA_IRQ7 = 12,
     MICROCHIP_PFSOC_EMMC_SD_IRQ = 88,
     MICROCHIP_PFSOC_MMUART0_IRQ = 90,
     MICROCHIP_PFSOC_MMUART1_IRQ = 91,
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
  * 2) eNVM (Embedded Non-Volatile Memory)
  * 3) MMUARTs (Multi-Mode UART)
  * 4) Cadence eMMC/SDHC controller and an SD card connected to it
+ * 5) SiFive Platform DMA (Direct Memory Access Controller)
  *
  * This board currently generates devicetree dynamically that indicates at least
  * two harts and up to five harts.
@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
     [MICROCHIP_PFSOC_BUSERR_UNIT4] =    {  0x1704000,     0x1000 },
     [MICROCHIP_PFSOC_CLINT] =           {  0x2000000,    0x10000 },
     [MICROCHIP_PFSOC_L2CC] =            {  0x2010000,     0x1000 },
+    [MICROCHIP_PFSOC_DMA] =             {  0x3000000,   0x100000 },
     [MICROCHIP_PFSOC_L2LIM] =           {  0x8000000,  0x2000000 },
     [MICROCHIP_PFSOC_PLIC] =            {  0xc000000,  0x4000000 },
     [MICROCHIP_PFSOC_MMUART0] =         { 0x20000000,     0x1000 },
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_instance_init(Object *obj)
                          TYPE_RISCV_CPU_SIFIVE_U54);
     qdev_prop_set_uint64(DEVICE(&s->u_cpus), "resetvec", RESET_VECTOR);
 
+    object_initialize_child(obj, "dma-controller", &s->dma,
+                            TYPE_SIFIVE_PDMA);
+
     object_initialize_child(obj, "sd-controller", &s->sdhci,
                             TYPE_CADENCE_SDHCI);
 }
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
         memmap[MICROCHIP_PFSOC_PLIC].size);
     g_free(plic_hart_config);
 
+    /* DMA */
+    sysbus_realize(SYS_BUS_DEVICE(&s->dma), errp);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->dma), 0,
+                    memmap[MICROCHIP_PFSOC_DMA].base);
+    for (i = 0; i < SIFIVE_PDMA_IRQS; i++) {
+        sysbus_connect_irq(SYS_BUS_DEVICE(&s->dma), i,
+                           qdev_get_gpio_in(DEVICE(s->plic),
+                                            MICROCHIP_PFSOC_DMA_IRQ0 + i));
+    }
+
     /* SYSREG */
     create_unimplemented_device("microchip.pfsoc.sysreg",
         memmap[MICROCHIP_PFSOC_SYSREG].base,
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
     select SIFIVE
     select UNIMP
     select MCHP_PFSOC_MMUART
+    select SIFIVE_PDMA
     select CADENCE_SDHCI
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

At present the PHY address of the PHY connected to GEM is hard-coded
to either 23 (BOARD_PHY_ADDRESS) or 0. This might not be the case for
all boards. Add a new 'phy-addr' property so that board can specify
the PHY address for each GEM instance.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Edgar E. Iglesias <edgar.iglesias@xilinx.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-12-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/net/cadence_gem.h | 2 ++
 hw/net/cadence_gem.c         | 5 +++--
 2 files changed, 5 insertions(+), 2 deletions(-)

diff --git a/include/hw/net/cadence_gem.h b/include/hw/net/cadence_gem.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/net/cadence_gem.h
+++ b/include/hw/net/cadence_gem.h
@@ -XXX,XX +XXX,XX @@ typedef struct CadenceGEMState {
     /* Mask of register bits which are write 1 to clear */
     uint32_t regs_w1c[CADENCE_GEM_MAXREG];
 
+    /* PHY address */
+    uint8_t phy_addr;
     /* PHY registers backing store */
     uint16_t phy_regs[32];
 
diff --git a/hw/net/cadence_gem.c b/hw/net/cadence_gem.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/net/cadence_gem.c
+++ b/hw/net/cadence_gem.c
@@ -XXX,XX +XXX,XX @@ static uint64_t gem_read(void *opaque, hwaddr offset, unsigned size)
             uint32_t phy_addr, reg_num;
 
             phy_addr = (retval & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
-            if (phy_addr == BOARD_PHY_ADDRESS || phy_addr == 0) {
+            if (phy_addr == s->phy_addr || phy_addr == 0) {
                 reg_num = (retval & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
                 retval &= 0xFFFF0000;
                 retval |= gem_phy_read(s, reg_num);
@@ -XXX,XX +XXX,XX @@ static void gem_write(void *opaque, hwaddr offset, uint64_t val,
             uint32_t phy_addr, reg_num;
 
             phy_addr = (val & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
-            if (phy_addr == BOARD_PHY_ADDRESS || phy_addr == 0) {
+            if (phy_addr == s->phy_addr || phy_addr == 0) {
                 reg_num = (val & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
                 gem_phy_write(s, reg_num, val);
             }
@@ -XXX,XX +XXX,XX @@ static Property gem_properties[] = {
     DEFINE_NIC_PROPERTIES(CadenceGEMState, conf),
     DEFINE_PROP_UINT32("revision", CadenceGEMState, revision,
                        GEM_MODID_VALUE),
+    DEFINE_PROP_UINT8("phy-addr", CadenceGEMState, phy_addr, BOARD_PHY_ADDRESS),
     DEFINE_PROP_UINT8("num-priority-queues", CadenceGEMState,
                       num_priority_queues, 1),
     DEFINE_PROP_UINT8("num-type1-screeners", CadenceGEMState,
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

When cadence_gem model was created for Xilinx boards, the PHY address
was hard-coded to 23 in the GEM model. Now that we have introduced a
property we can use that to tell GEM model what our PHY address is.
Change all boards' GEM 'phy-addr' property value to 23, and set the
PHY address default value to 0 in the GEM model.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-13-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/arm/xilinx_zynq.c | 1 +
 hw/arm/xlnx-versal.c | 1 +
 hw/arm/xlnx-zynqmp.c | 2 ++
 hw/net/cadence_gem.c | 6 +++---
 4 files changed, 7 insertions(+), 3 deletions(-)

diff --git a/hw/arm/xilinx_zynq.c b/hw/arm/xilinx_zynq.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/xilinx_zynq.c
+++ b/hw/arm/xilinx_zynq.c
@@ -XXX,XX +XXX,XX @@ static void gem_init(NICInfo *nd, uint32_t base, qemu_irq irq)
         qemu_check_nic_model(nd, TYPE_CADENCE_GEM);
         qdev_set_nic_properties(dev, nd);
     }
+    object_property_set_int(OBJECT(dev), "phy-addr", 23, &error_abort);
     s = SYS_BUS_DEVICE(dev);
     sysbus_realize_and_unref(s, &error_fatal);
     sysbus_mmio_map(s, 0, base);
diff --git a/hw/arm/xlnx-versal.c b/hw/arm/xlnx-versal.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/xlnx-versal.c
+++ b/hw/arm/xlnx-versal.c
@@ -XXX,XX +XXX,XX @@ static void versal_create_gems(Versal *s, qemu_irq *pic)
             qemu_check_nic_model(nd, "cadence_gem");
             qdev_set_nic_properties(dev, nd);
         }
+        object_property_set_int(OBJECT(dev), "phy-addr", 23, &error_abort);
         object_property_set_int(OBJECT(dev), "num-priority-queues", 2,
                                 &error_abort);
         object_property_set_link(OBJECT(dev), "dma", OBJECT(&s->mr_ps),
diff --git a/hw/arm/xlnx-zynqmp.c b/hw/arm/xlnx-zynqmp.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/arm/xlnx-zynqmp.c
+++ b/hw/arm/xlnx-zynqmp.c
@@ -XXX,XX +XXX,XX @@ static void xlnx_zynqmp_realize(DeviceState *dev, Error **errp)
         }
         object_property_set_int(OBJECT(&s->gem[i]), "revision", GEM_REVISION,
                                 &error_abort);
+        object_property_set_int(OBJECT(&s->gem[i]), "phy-addr", 23,
+                                &error_abort);
         object_property_set_int(OBJECT(&s->gem[i]), "num-priority-queues", 2,
                                 &error_abort);
         if (!sysbus_realize(SYS_BUS_DEVICE(&s->gem[i]), errp)) {
diff --git a/hw/net/cadence_gem.c b/hw/net/cadence_gem.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/net/cadence_gem.c
+++ b/hw/net/cadence_gem.c
@@ -XXX,XX +XXX,XX @@
 #define GEM_PHYMNTNC_REG_SHIFT 18
 
 /* Marvell PHY definitions */
-#define BOARD_PHY_ADDRESS    23 /* PHY address we will emulate a device at */
+#define BOARD_PHY_ADDRESS    0 /* PHY address we will emulate a device at */
 
 #define PHY_REG_CONTROL      0
 #define PHY_REG_STATUS       1
@@ -XXX,XX +XXX,XX @@ static uint64_t gem_read(void *opaque, hwaddr offset, unsigned size)
             uint32_t phy_addr, reg_num;
 
             phy_addr = (retval & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
-            if (phy_addr == s->phy_addr || phy_addr == 0) {
+            if (phy_addr == s->phy_addr) {
                 reg_num = (retval & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
                 retval &= 0xFFFF0000;
                 retval |= gem_phy_read(s, reg_num);
@@ -XXX,XX +XXX,XX @@ static void gem_write(void *opaque, hwaddr offset, uint64_t val,
             uint32_t phy_addr, reg_num;
 
             phy_addr = (val & GEM_PHYMNTNC_ADDR) >> GEM_PHYMNTNC_ADDR_SHFT;
-            if (phy_addr == s->phy_addr || phy_addr == 0) {
+            if (phy_addr == s->phy_addr) {
                 reg_num = (val & GEM_PHYMNTNC_REG) >> GEM_PHYMNTNC_REG_SHIFT;
                 gem_phy_write(s, reg_num, val);
             }
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Microchip PolarFire SoC integrates 2 Candence GEMs to provide
IEEE 802.3 standard-compliant 10/100/1000 Mbps ethernet interface.

On the Icicle Kit board, GEM0 connects to a PHY at address 8 while
GEM1 connects to a PHY at address 9.

The 2nd stage bootloader (U-Boot) is using GEM1 by default, so we
must specify 2 '-nic' options from the command line in order to get
a working ethernet.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-Id: <1598924352-89526-14-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/microchip_pfsoc.h |  7 ++++++
 hw/riscv/microchip_pfsoc.c         | 39 ++++++++++++++++++++++++++++++
 2 files changed, 46 insertions(+)

diff --git a/include/hw/riscv/microchip_pfsoc.h b/include/hw/riscv/microchip_pfsoc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/microchip_pfsoc.h
+++ b/include/hw/riscv/microchip_pfsoc.h
@@ -XXX,XX +XXX,XX @@
 
 #include "hw/char/mchp_pfsoc_mmuart.h"
 #include "hw/dma/sifive_pdma.h"
+#include "hw/net/cadence_gem.h"
 #include "hw/sd/cadence_sdhci.h"
 
 typedef struct MicrochipPFSoCState {
@@ -XXX,XX +XXX,XX @@ typedef struct MicrochipPFSoCState {
     MchpPfSoCMMUartState *serial3;
     MchpPfSoCMMUartState *serial4;
     SiFivePDMAState dma;
+    CadenceGEMState gem0;
+    CadenceGEMState gem1;
     CadenceSDHCIState sdhci;
 } MicrochipPFSoCState;
 
@@ -XXX,XX +XXX,XX @@ enum {
     MICROCHIP_PFSOC_MMUART2,
     MICROCHIP_PFSOC_MMUART3,
     MICROCHIP_PFSOC_MMUART4,
+    MICROCHIP_PFSOC_GEM0,
+    MICROCHIP_PFSOC_GEM1,
     MICROCHIP_PFSOC_ENVM_CFG,
     MICROCHIP_PFSOC_ENVM_DATA,
     MICROCHIP_PFSOC_IOSCB_CFG,
@@ -XXX,XX +XXX,XX @@ enum {
     MICROCHIP_PFSOC_DMA_IRQ5 = 10,
     MICROCHIP_PFSOC_DMA_IRQ6 = 11,
     MICROCHIP_PFSOC_DMA_IRQ7 = 12,
+    MICROCHIP_PFSOC_GEM0_IRQ = 64,
+    MICROCHIP_PFSOC_GEM1_IRQ = 70,
     MICROCHIP_PFSOC_EMMC_SD_IRQ = 88,
     MICROCHIP_PFSOC_MMUART0_IRQ = 90,
     MICROCHIP_PFSOC_MMUART1_IRQ = 91,
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
  * 3) MMUARTs (Multi-Mode UART)
  * 4) Cadence eMMC/SDHC controller and an SD card connected to it
  * 5) SiFive Platform DMA (Direct Memory Access Controller)
+ * 6) GEM (Gigabit Ethernet MAC Controller)
  *
  * This board currently generates devicetree dynamically that indicates at least
  * two harts and up to five harts.
@@ -XXX,XX +XXX,XX @@
 #define BIOS_FILENAME   "hss.bin"
 #define RESET_VECTOR    0x20220000
 
+/* GEM version */
+#define GEM_REVISION    0x0107010c
+
 static const struct MemmapEntry {
     hwaddr base;
     hwaddr size;
@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
     [MICROCHIP_PFSOC_MMUART2] =         { 0x20102000,     0x1000 },
     [MICROCHIP_PFSOC_MMUART3] =         { 0x20104000,     0x1000 },
     [MICROCHIP_PFSOC_MMUART4] =         { 0x20106000,     0x1000 },
+    [MICROCHIP_PFSOC_GEM0] =            { 0x20110000,     0x2000 },
+    [MICROCHIP_PFSOC_GEM1] =            { 0x20112000,     0x2000 },
     [MICROCHIP_PFSOC_ENVM_CFG] =        { 0x20200000,     0x1000 },
     [MICROCHIP_PFSOC_ENVM_DATA] =       { 0x20220000,    0x20000 },
     [MICROCHIP_PFSOC_IOSCB_CFG] =       { 0x37080000,     0x1000 },
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_instance_init(Object *obj)
     object_initialize_child(obj, "dma-controller", &s->dma,
                             TYPE_SIFIVE_PDMA);
 
+    object_initialize_child(obj, "gem0", &s->gem0, TYPE_CADENCE_GEM);
+    object_initialize_child(obj, "gem1", &s->gem1, TYPE_CADENCE_GEM);
+
     object_initialize_child(obj, "sd-controller", &s->sdhci,
                             TYPE_CADENCE_SDHCI);
 }
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
     MemoryRegion *envm_data = g_new(MemoryRegion, 1);
     char *plic_hart_config;
     size_t plic_hart_config_len;
+    NICInfo *nd;
     int i;
 
     sysbus_realize(SYS_BUS_DEVICE(&s->e_cpus), &error_abort);
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
         qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_MMUART4_IRQ),
         serial_hd(4));
 
+    /* GEMs */
+
+    nd = &nd_table[0];
+    if (nd->used) {
+        qemu_check_nic_model(nd, TYPE_CADENCE_GEM);
+        qdev_set_nic_properties(DEVICE(&s->gem0), nd);
+    }
+    nd = &nd_table[1];
+    if (nd->used) {
+        qemu_check_nic_model(nd, TYPE_CADENCE_GEM);
+        qdev_set_nic_properties(DEVICE(&s->gem1), nd);
+    }
+
+    object_property_set_int(OBJECT(&s->gem0), "revision", GEM_REVISION, errp);
+    object_property_set_int(OBJECT(&s->gem0), "phy-addr", 8, errp);
+    sysbus_realize(SYS_BUS_DEVICE(&s->gem0), errp);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->gem0), 0,
+                    memmap[MICROCHIP_PFSOC_GEM0].base);
+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->gem0), 0,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_GEM0_IRQ));
+
+    object_property_set_int(OBJECT(&s->gem1), "revision", GEM_REVISION, errp);
+    object_property_set_int(OBJECT(&s->gem1), "phy-addr", 9, errp);
+    sysbus_realize(SYS_BUS_DEVICE(&s->gem1), errp);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->gem1), 0,
+                    memmap[MICROCHIP_PFSOC_GEM1].base);
+    sysbus_connect_irq(SYS_BUS_DEVICE(&s->gem1), 0,
+        qdev_get_gpio_in(DEVICE(s->plic), MICROCHIP_PFSOC_GEM1_IRQ));
+
     /* eNVM */
     memory_region_init_rom(envm_data, OBJECT(dev), "microchip.pfsoc.envm.data",
                            memmap[MICROCHIP_PFSOC_ENVM_DATA].size,
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Microchip PolarFire SoC integrates 3 GPIOs controllers. It seems
enough to create unimplemented devices to cover their register
spaces at this point.

With this commit, QEMU can boot to U-Boot (2nd stage bootloader)
all the way to the Linux shell login prompt, with a modified HSS
(1st stage bootloader).

For detailed instructions on how to create images for the Icicle
Kit board, please check QEMU RISC-V WiKi page at:
https://wiki.qemu.org/Documentation/Platforms/RISCV

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Message-Id: <1598924352-89526-15-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/microchip_pfsoc.h |  3 +++
 hw/riscv/microchip_pfsoc.c         | 14 ++++++++++++++
 2 files changed, 17 insertions(+)

From: Bin Meng <bin.meng@windriver.com>

At present the CLINT timestamp is using a hard-coded timebase
frequency value SIFIVE_CLINT_TIMEBASE_FREQ. This might not be
true for all boards.

Add a new 'timebase-freq' property to the CLINT device, and
update various functions to accept this as a parameter.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-16-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/sifive_clint.h |  4 +++-
 target/riscv/cpu.h              |  6 ++++--
 hw/riscv/microchip_pfsoc.c      |  6 +++++-
 hw/riscv/sifive_clint.c         | 26 +++++++++++++++-----------
 hw/riscv/sifive_e.c             |  3 ++-
 hw/riscv/sifive_u.c             |  3 ++-
 hw/riscv/spike.c                |  3 ++-
 hw/riscv/virt.c                 |  3 ++-
 target/riscv/cpu_helper.c       |  4 +++-
 target/riscv/csr.c              |  4 ++--
 10 files changed, 40 insertions(+), 22 deletions(-)

diff --git a/include/hw/riscv/sifive_clint.h b/include/hw/riscv/sifive_clint.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/sifive_clint.h
+++ b/include/hw/riscv/sifive_clint.h
@@ -XXX,XX +XXX,XX @@ typedef struct SiFiveCLINTState {
     uint32_t timecmp_base;
     uint32_t time_base;
     uint32_t aperture_size;
+    uint32_t timebase_freq;
 } SiFiveCLINTState;
 
 DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
     uint32_t hartid_base, uint32_t num_harts, uint32_t sip_base,
-    uint32_t timecmp_base, uint32_t time_base, bool provide_rdtime);
+    uint32_t timecmp_base, uint32_t time_base, uint32_t timebase_freq,
+    bool provide_rdtime);
 
 enum {
     SIFIVE_SIP_BASE     = 0x0,
diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.h
+++ b/target/riscv/cpu.h
@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
     pmp_table_t pmp_state;
 
     /* machine specific rdtime callback */
-    uint64_t (*rdtime_fn)(void);
+    uint64_t (*rdtime_fn)(uint32_t);
+    uint32_t rdtime_fn_arg;
 
     /* True if in debugger mode.  */
     bool debugger;
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_swap_hypervisor_regs(CPURISCVState *env);
 int riscv_cpu_claim_interrupts(RISCVCPU *cpu, uint32_t interrupts);
 uint32_t riscv_cpu_update_mip(RISCVCPU *cpu, uint32_t mask, uint32_t value);
 #define BOOL_TO_MASK(x) (-!!(x)) /* helper for riscv_cpu_update_mip value */
-void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(void));
+void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(uint32_t),
+                             uint32_t arg);
 #endif
 void riscv_cpu_set_mode(CPURISCVState *env, target_ulong newpriv);
 
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
 #define BIOS_FILENAME   "hss.bin"
 #define RESET_VECTOR    0x20220000
 
+/* CLINT timebase frequency */
+#define CLINT_TIMEBASE_FREQ 1000000
+
 /* GEM version */
 #define GEM_REVISION    0x0107010c
 
@@ -XXX,XX +XXX,XX @@ static void microchip_pfsoc_soc_realize(DeviceState *dev, Error **errp)
     /* CLINT */
     sifive_clint_create(memmap[MICROCHIP_PFSOC_CLINT].base,
         memmap[MICROCHIP_PFSOC_CLINT].size, 0, ms->smp.cpus,
-        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
+        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
+        CLINT_TIMEBASE_FREQ, false);
 
     /* L2 cache controller */
     create_unimplemented_device("microchip.pfsoc.l2cc",
diff --git a/hw/riscv/sifive_clint.c b/hw/riscv/sifive_clint.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_clint.c
+++ b/hw/riscv/sifive_clint.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/riscv/sifive_clint.h"
 #include "qemu/timer.h"
 
-static uint64_t cpu_riscv_read_rtc(void)
+static uint64_t cpu_riscv_read_rtc(uint32_t timebase_freq)
 {
     return muldiv64(qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL),
-        SIFIVE_CLINT_TIMEBASE_FREQ, NANOSECONDS_PER_SECOND);
+        timebase_freq, NANOSECONDS_PER_SECOND);
 }
 
 /*
  * Called when timecmp is written to update the QEMU timer or immediately
  * trigger timer interrupt if mtimecmp <= current timer value.
  */
-static void sifive_clint_write_timecmp(RISCVCPU *cpu, uint64_t value)
+static void sifive_clint_write_timecmp(RISCVCPU *cpu, uint64_t value,
+                                       uint32_t timebase_freq)
 {
     uint64_t next;
     uint64_t diff;
 
-    uint64_t rtc_r = cpu_riscv_read_rtc();
+    uint64_t rtc_r = cpu_riscv_read_rtc(timebase_freq);
 
     cpu->env.timecmp = value;
     if (cpu->env.timecmp <= rtc_r) {
@@ -XXX,XX +XXX,XX @@ static void sifive_clint_write_timecmp(RISCVCPU *cpu, uint64_t value)
     diff = cpu->env.timecmp - rtc_r;
     /* back to ns (note args switched in muldiv64) */
     next = qemu_clock_get_ns(QEMU_CLOCK_VIRTUAL) +
-        muldiv64(diff, NANOSECONDS_PER_SECOND, SIFIVE_CLINT_TIMEBASE_FREQ);
+        muldiv64(diff, NANOSECONDS_PER_SECOND, timebase_freq);
     timer_mod(cpu->env.timer, next);
 }
 
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_clint_read(void *opaque, hwaddr addr, unsigned size)
         }
     } else if (addr == clint->time_base) {
         /* time_lo */
-        return cpu_riscv_read_rtc() & 0xFFFFFFFF;
+        return cpu_riscv_read_rtc(clint->timebase_freq) & 0xFFFFFFFF;
     } else if (addr == clint->time_base + 4) {
         /* time_hi */
-        return (cpu_riscv_read_rtc() >> 32) & 0xFFFFFFFF;
+        return (cpu_riscv_read_rtc(clint->timebase_freq) >> 32) & 0xFFFFFFFF;
     }
 
     error_report("clint: invalid read: %08x", (uint32_t)addr);
@@ -XXX,XX +XXX,XX @@ static void sifive_clint_write(void *opaque, hwaddr addr, uint64_t value,
             /* timecmp_lo */
             uint64_t timecmp_hi = env->timecmp >> 32;
             sifive_clint_write_timecmp(RISCV_CPU(cpu),
-                timecmp_hi << 32 | (value & 0xFFFFFFFF));
+                timecmp_hi << 32 | (value & 0xFFFFFFFF), clint->timebase_freq);
             return;
         } else if ((addr & 0x7) == 4) {
             /* timecmp_hi */
             uint64_t timecmp_lo = env->timecmp;
             sifive_clint_write_timecmp(RISCV_CPU(cpu),
-                value << 32 | (timecmp_lo & 0xFFFFFFFF));
+                value << 32 | (timecmp_lo & 0xFFFFFFFF), clint->timebase_freq);
         } else {
             error_report("clint: invalid timecmp write: %08x", (uint32_t)addr);
         }
@@ -XXX,XX +XXX,XX @@ static Property sifive_clint_properties[] = {
     DEFINE_PROP_UINT32("timecmp-base", SiFiveCLINTState, timecmp_base, 0),
     DEFINE_PROP_UINT32("time-base", SiFiveCLINTState, time_base, 0),
     DEFINE_PROP_UINT32("aperture-size", SiFiveCLINTState, aperture_size, 0),
+    DEFINE_PROP_UINT32("timebase-freq", SiFiveCLINTState, timebase_freq, 0),
     DEFINE_PROP_END_OF_LIST(),
 };
 
@@ -XXX,XX +XXX,XX @@ type_init(sifive_clint_register_types)
  */
 DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
     uint32_t hartid_base, uint32_t num_harts, uint32_t sip_base,
-    uint32_t timecmp_base, uint32_t time_base, bool provide_rdtime)
+    uint32_t timecmp_base, uint32_t time_base, uint32_t timebase_freq,
+    bool provide_rdtime)
 {
     int i;
     for (i = 0; i < num_harts; i++) {
@@ -XXX,XX +XXX,XX @@ DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
             continue;
         }
         if (provide_rdtime) {
-            riscv_cpu_set_rdtime_fn(env, cpu_riscv_read_rtc);
+            riscv_cpu_set_rdtime_fn(env, cpu_riscv_read_rtc, timebase_freq);
         }
         env->timer = timer_new_ns(QEMU_CLOCK_VIRTUAL,
                                   &sifive_clint_timer_cb, cpu);
@@ -XXX,XX +XXX,XX @@ DeviceState *sifive_clint_create(hwaddr addr, hwaddr size,
     qdev_prop_set_uint32(dev, "timecmp-base", timecmp_base);
     qdev_prop_set_uint32(dev, "time-base", time_base);
     qdev_prop_set_uint32(dev, "aperture-size", size);
+    qdev_prop_set_uint32(dev, "timebase-freq", timebase_freq);
     sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
     sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
     return dev;
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@ static void sifive_e_soc_realize(DeviceState *dev, Error **errp)
         memmap[SIFIVE_E_PLIC].size);
     sifive_clint_create(memmap[SIFIVE_E_CLINT].base,
         memmap[SIFIVE_E_CLINT].size, 0, ms->smp.cpus,
-        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
+        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
+        SIFIVE_CLINT_TIMEBASE_FREQ, false);
     create_unimplemented_device("riscv.sifive.e.aon",
         memmap[SIFIVE_E_AON].base, memmap[SIFIVE_E_AON].size);
     sifive_e_prci_create(memmap[SIFIVE_E_PRCI].base);
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_realize(DeviceState *dev, Error **errp)
         serial_hd(1), qdev_get_gpio_in(DEVICE(s->plic), SIFIVE_U_UART1_IRQ));
     sifive_clint_create(memmap[SIFIVE_U_CLINT].base,
         memmap[SIFIVE_U_CLINT].size, 0, ms->smp.cpus,
-        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
+        SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
+        SIFIVE_CLINT_TIMEBASE_FREQ, false);
 
     if (!sysbus_realize(SYS_BUS_DEVICE(&s->prci), errp)) {
         return;
diff --git a/hw/riscv/spike.c b/hw/riscv/spike.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/spike.c
+++ b/hw/riscv/spike.c
@@ -XXX,XX +XXX,XX @@ static void spike_board_init(MachineState *machine)
         sifive_clint_create(
             memmap[SPIKE_CLINT].base + i * memmap[SPIKE_CLINT].size,
             memmap[SPIKE_CLINT].size, base_hartid, hart_count,
-            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, false);
+            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
+            SIFIVE_CLINT_TIMEBASE_FREQ, false);
     }
 
     /* register system main memory (actual RAM) */
diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/virt.c
+++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@ static void virt_machine_init(MachineState *machine)
         sifive_clint_create(
             memmap[VIRT_CLINT].base + i * memmap[VIRT_CLINT].size,
             memmap[VIRT_CLINT].size, base_hartid, hart_count,
-            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE, true);
+            SIFIVE_SIP_BASE, SIFIVE_TIMECMP_BASE, SIFIVE_TIME_BASE,
+            SIFIVE_CLINT_TIMEBASE_FREQ, true);
 
         /* Per-socket PLIC hart topology configuration string */
         plic_hart_config_len =
diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu_helper.c
+++ b/target/riscv/cpu_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t riscv_cpu_update_mip(RISCVCPU *cpu, uint32_t mask, uint32_t value)
     return old;
 }
 
-void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(void))
+void riscv_cpu_set_rdtime_fn(CPURISCVState *env, uint64_t (*fn)(uint32_t),
+                             uint32_t arg)
 {
     env->rdtime_fn = fn;
+    env->rdtime_fn_arg = arg;
 }
 
 void riscv_cpu_set_mode(CPURISCVState *env, target_ulong newpriv)
diff --git a/target/riscv/csr.c b/target/riscv/csr.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/csr.c
+++ b/target/riscv/csr.c
@@ -XXX,XX +XXX,XX @@ static int read_time(CPURISCVState *env, int csrno, target_ulong *val)
         return -RISCV_EXCP_ILLEGAL_INST;
     }
 
-    *val = env->rdtime_fn() + delta;
+    *val = env->rdtime_fn(env->rdtime_fn_arg) + delta;
     return 0;
 }
 
@@ -XXX,XX +XXX,XX @@ static int read_timeh(CPURISCVState *env, int csrno, target_ulong *val)
         return -RISCV_EXCP_ILLEGAL_INST;
     }
 
-    *val = (env->rdtime_fn() + delta) >> 32;
+    *val = (env->rdtime_fn(env->rdtime_fn_arg) + delta) >> 32;
     return 0;
 }
 #endif
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

SiFive FU540 SoC integrates a platform DMA controller with 4 DMA
channels. This connects the exsiting SiFive PDMA model to the SoC,
and adds its device tree data as well.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1598924352-89526-17-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/riscv/sifive_u.h | 11 +++++++++++
 hw/riscv/sifive_u.c         | 30 ++++++++++++++++++++++++++++++
 hw/riscv/Kconfig            |  1 +
 3 files changed, 42 insertions(+)

diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/sifive_u.h
+++ b/include/hw/riscv/sifive_u.h
@@ -XXX,XX +XXX,XX @@
 #ifndef HW_SIFIVE_U_H
 #define HW_SIFIVE_U_H
 
+#include "hw/dma/sifive_pdma.h"
 #include "hw/net/cadence_gem.h"
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_cpu.h"
@@ -XXX,XX +XXX,XX @@ typedef struct SiFiveUSoCState {
     SiFiveUPRCIState prci;
     SIFIVEGPIOState gpio;
     SiFiveUOTPState otp;
+    SiFivePDMAState dma;
     CadenceGEMState gem;
 
     uint32_t serial;
@@ -XXX,XX +XXX,XX @@ enum {
     SIFIVE_U_MROM,
     SIFIVE_U_CLINT,
     SIFIVE_U_L2CC,
+    SIFIVE_U_PDMA,
     SIFIVE_U_L2LIM,
     SIFIVE_U_PLIC,
     SIFIVE_U_PRCI,
@@ -XXX,XX +XXX,XX @@ enum {
     SIFIVE_U_GPIO_IRQ13 = 20,
     SIFIVE_U_GPIO_IRQ14 = 21,
     SIFIVE_U_GPIO_IRQ15 = 22,
+    SIFIVE_U_PDMA_IRQ0 = 23,
+    SIFIVE_U_PDMA_IRQ1 = 24,
+    SIFIVE_U_PDMA_IRQ2 = 25,
+    SIFIVE_U_PDMA_IRQ3 = 26,
+    SIFIVE_U_PDMA_IRQ4 = 27,
+    SIFIVE_U_PDMA_IRQ5 = 28,
+    SIFIVE_U_PDMA_IRQ6 = 29,
+    SIFIVE_U_PDMA_IRQ7 = 30,
     SIFIVE_U_GEM_IRQ = 0x35
 };
 
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@
  * 4) GPIO (General Purpose Input/Output Controller)
  * 5) OTP (One-Time Programmable) memory with stored serial number
  * 6) GEM (Gigabit Ethernet Controller) and management block
+ * 7) DMA (Direct Memory Access Controller)
  *
  * This board currently generates devicetree dynamically that indicates at least
  * two harts and up to five harts.
@@ -XXX,XX +XXX,XX @@ static const struct MemmapEntry {
     [SIFIVE_U_MROM] =     {     0x1000,     0xf000 },
     [SIFIVE_U_CLINT] =    {  0x2000000,    0x10000 },
     [SIFIVE_U_L2CC] =     {  0x2010000,     0x1000 },
+    [SIFIVE_U_PDMA] =     {  0x3000000,   0x100000 },
     [SIFIVE_U_L2LIM] =    {  0x8000000,  0x2000000 },
     [SIFIVE_U_PLIC] =     {  0xc000000,  0x4000000 },
     [SIFIVE_U_PRCI] =     { 0x10000000,     0x1000 },
@@ -XXX,XX +XXX,XX @@ static void create_fdt(SiFiveUState *s, const struct MemmapEntry *memmap,
     qemu_fdt_setprop_string(fdt, nodename, "compatible", "gpio-restart");
     g_free(nodename);
 
+    nodename = g_strdup_printf("/soc/dma@%lx",
+        (long)memmap[SIFIVE_U_PDMA].base);
+    qemu_fdt_add_subnode(fdt, nodename);
+    qemu_fdt_setprop_cell(fdt, nodename, "#dma-cells", 1);
+    qemu_fdt_setprop_cells(fdt, nodename, "interrupts",
+        SIFIVE_U_PDMA_IRQ0, SIFIVE_U_PDMA_IRQ1, SIFIVE_U_PDMA_IRQ2,
+        SIFIVE_U_PDMA_IRQ3, SIFIVE_U_PDMA_IRQ4, SIFIVE_U_PDMA_IRQ5,
+        SIFIVE_U_PDMA_IRQ6, SIFIVE_U_PDMA_IRQ7);
+    qemu_fdt_setprop_cell(fdt, nodename, "interrupt-parent", plic_phandle);
+    qemu_fdt_setprop_cells(fdt, nodename, "reg",
+        0x0, memmap[SIFIVE_U_PDMA].base,
+        0x0, memmap[SIFIVE_U_PDMA].size);
+    qemu_fdt_setprop_string(fdt, nodename, "compatible",
+                            "sifive,fu540-c000-pdma");
+    g_free(nodename);
+
     nodename = g_strdup_printf("/soc/cache-controller@%lx",
         (long)memmap[SIFIVE_U_L2CC].base);
     qemu_fdt_add_subnode(fdt, nodename);
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_instance_init(Object *obj)
     object_initialize_child(obj, "otp", &s->otp, TYPE_SIFIVE_U_OTP);
     object_initialize_child(obj, "gem", &s->gem, TYPE_CADENCE_GEM);
     object_initialize_child(obj, "gpio", &s->gpio, TYPE_SIFIVE_GPIO);
+    object_initialize_child(obj, "pdma", &s->dma, TYPE_SIFIVE_PDMA);
 }
 
 static void sifive_u_soc_realize(DeviceState *dev, Error **errp)
@@ -XXX,XX +XXX,XX @@ static void sifive_u_soc_realize(DeviceState *dev, Error **errp)
                                             SIFIVE_U_GPIO_IRQ0 + i));
     }
 
+    /* PDMA */
+    sysbus_realize(SYS_BUS_DEVICE(&s->dma), errp);
+    sysbus_mmio_map(SYS_BUS_DEVICE(&s->dma), 0, memmap[SIFIVE_U_PDMA].base);
+
+    /* Connect PDMA interrupts to the PLIC */
+    for (i = 0; i < SIFIVE_PDMA_IRQS; i++) {
+        sysbus_connect_irq(SYS_BUS_DEVICE(&s->dma), i,
+                           qdev_get_gpio_in(DEVICE(s->plic),
+                                            SIFIVE_U_PDMA_IRQ0 + i));
+    }
+
     qdev_prop_set_uint32(DEVICE(&s->otp), "serial", s->serial);
     if (!sysbus_realize(SYS_BUS_DEVICE(&s->otp), errp)) {
         return;
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select CADENCE
     select HART
     select SIFIVE
+    select SIFIVE_PDMA
     select UNIMP
 
 config SPIKE
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_e_prci model to hw/misc directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-2-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => misc}/sifive_e_prci.h | 0
 hw/{riscv => misc}/sifive_e_prci.c         | 2 +-
 hw/riscv/sifive_e.c                        | 2 +-
 hw/misc/Kconfig                            | 3 +++
 hw/misc/meson.build                        | 3 +++
 hw/riscv/Kconfig                           | 1 +
 hw/riscv/meson.build                       | 1 -
 7 files changed, 9 insertions(+), 3 deletions(-)
 rename include/hw/{riscv => misc}/sifive_e_prci.h (100%)
 rename hw/{riscv => misc}/sifive_e_prci.c (99%)

diff --git a/include/hw/riscv/sifive_e_prci.h b/include/hw/misc/sifive_e_prci.h
similarity index 100%
rename from include/hw/riscv/sifive_e_prci.h
rename to include/hw/misc/sifive_e_prci.h
diff --git a/hw/riscv/sifive_e_prci.c b/hw/misc/sifive_e_prci.c
similarity index 99%
rename from hw/riscv/sifive_e_prci.c
rename to hw/misc/sifive_e_prci.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e_prci.c
+++ b/hw/misc/sifive_e_prci.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/log.h"
 #include "qemu/module.h"
 #include "hw/hw.h"
-#include "hw/riscv/sifive_e_prci.h"
+#include "hw/misc/sifive_e_prci.h"
 
 static uint64_t sifive_e_prci_read(void *opaque, hwaddr addr, unsigned int size)
 {
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_e.h"
-#include "hw/riscv/sifive_e_prci.h"
 #include "hw/riscv/boot.h"
+#include "hw/misc/sifive_e_prci.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
 #include "sysemu/sysemu.h"
diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/Kconfig
+++ b/hw/misc/Kconfig
@@ -XXX,XX +XXX,XX @@ config MAC_VIA
 config AVR_POWER
     bool
 
+config SIFIVE_E_PRCI
+    bool
+
 source macio/Kconfig
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_ARM11SCU', if_true: files('arm11scu.c'))
 # Mac devices
 softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
 
+# RISC-V devices
+softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
+
 # PKUnity SoC devices
 softmmu_ss.add(when: 'CONFIG_PUV3', if_true: files('puv3_pm.c'))
 
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
     bool
     select HART
     select SIFIVE
+    select SIFIVE_E_PRCI
     select UNIMP
 
 config SIFIVE_U
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e_prci.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_prci.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_u_prci model to hw/misc directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-3-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => misc}/sifive_u_prci.h | 0
 include/hw/riscv/sifive_u.h                | 2 +-
 hw/{riscv => misc}/sifive_u_prci.c         | 2 +-
 hw/misc/Kconfig                            | 3 +++
 hw/misc/meson.build                        | 1 +
 hw/riscv/Kconfig                           | 1 +
 hw/riscv/meson.build                       | 1 -
 7 files changed, 7 insertions(+), 3 deletions(-)
 rename include/hw/{riscv => misc}/sifive_u_prci.h (100%)
 rename hw/{riscv => misc}/sifive_u_prci.c (99%)

diff --git a/include/hw/riscv/sifive_u_prci.h b/include/hw/misc/sifive_u_prci.h
similarity index 100%
rename from include/hw/riscv/sifive_u_prci.h
rename to include/hw/misc/sifive_u_prci.h
diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/sifive_u.h
+++ b/include/hw/riscv/sifive_u.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_cpu.h"
 #include "hw/riscv/sifive_gpio.h"
-#include "hw/riscv/sifive_u_prci.h"
 #include "hw/riscv/sifive_u_otp.h"
+#include "hw/misc/sifive_u_prci.h"
 
 #define TYPE_RISCV_U_SOC "riscv.sifive.u.soc"
 #define RISCV_U_SOC(obj) \
diff --git a/hw/riscv/sifive_u_prci.c b/hw/misc/sifive_u_prci.c
similarity index 99%
rename from hw/riscv/sifive_u_prci.c
rename to hw/misc/sifive_u_prci.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u_prci.c
+++ b/hw/misc/sifive_u_prci.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/sysbus.h"
 #include "qemu/log.h"
 #include "qemu/module.h"
-#include "hw/riscv/sifive_u_prci.h"
+#include "hw/misc/sifive_u_prci.h"
 
 static uint64_t sifive_u_prci_read(void *opaque, hwaddr addr, unsigned int size)
 {
diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/Kconfig
+++ b/hw/misc/Kconfig
@@ -XXX,XX +XXX,XX @@ config AVR_POWER
 config SIFIVE_E_PRCI
     bool
 
+config SIFIVE_U_PRCI
+    bool
+
 source macio/Kconfig
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
 
 # RISC-V devices
 softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
+softmmu_ss.add(when: 'CONFIG_SIFIVE_U_PRCI', if_true: files('sifive_u_prci.c'))
 
 # PKUnity SoC devices
 softmmu_ss.add(when: 'CONFIG_PUV3', if_true: files('puv3_pm.c'))
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select HART
     select SIFIVE
     select SIFIVE_PDMA
+    select SIFIVE_U_PRCI
     select UNIMP
 
 config SPIKE
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_prci.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
 riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_u_otp model to hw/misc directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-4-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => misc}/sifive_u_otp.h | 0
 include/hw/riscv/sifive_u.h               | 2 +-
 hw/{riscv => misc}/sifive_u_otp.c         | 2 +-
 hw/misc/Kconfig                           | 3 +++
 hw/misc/meson.build                       | 1 +
 hw/riscv/Kconfig                          | 1 +
 hw/riscv/meson.build                      | 1 -
 7 files changed, 7 insertions(+), 3 deletions(-)
 rename include/hw/{riscv => misc}/sifive_u_otp.h (100%)
 rename hw/{riscv => misc}/sifive_u_otp.c (99%)

diff --git a/include/hw/riscv/sifive_u_otp.h b/include/hw/misc/sifive_u_otp.h
similarity index 100%
rename from include/hw/riscv/sifive_u_otp.h
rename to include/hw/misc/sifive_u_otp.h
diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/sifive_u.h
+++ b/include/hw/riscv/sifive_u.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_cpu.h"
 #include "hw/riscv/sifive_gpio.h"
-#include "hw/riscv/sifive_u_otp.h"
+#include "hw/misc/sifive_u_otp.h"
 #include "hw/misc/sifive_u_prci.h"
 
 #define TYPE_RISCV_U_SOC "riscv.sifive.u.soc"
diff --git a/hw/riscv/sifive_u_otp.c b/hw/misc/sifive_u_otp.c
similarity index 99%
rename from hw/riscv/sifive_u_otp.c
rename to hw/misc/sifive_u_otp.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u_otp.c
+++ b/hw/misc/sifive_u_otp.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/sysbus.h"
 #include "qemu/log.h"
 #include "qemu/module.h"
-#include "hw/riscv/sifive_u_otp.h"
+#include "hw/misc/sifive_u_otp.h"
 
 static uint64_t sifive_u_otp_read(void *opaque, hwaddr addr, unsigned int size)
 {
diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/Kconfig
+++ b/hw/misc/Kconfig
@@ -XXX,XX +XXX,XX @@ config AVR_POWER
 config SIFIVE_E_PRCI
     bool
 
+config SIFIVE_U_OTP
+    bool
+
 config SIFIVE_U_PRCI
     bool
 
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
 
 # RISC-V devices
 softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
+softmmu_ss.add(when: 'CONFIG_SIFIVE_U_OTP', if_true: files('sifive_u_otp.c'))
 softmmu_ss.add(when: 'CONFIG_SIFIVE_U_PRCI', if_true: files('sifive_u_prci.c'))
 
 # PKUnity SoC devices
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select HART
     select SIFIVE
     select SIFIVE_PDMA
+    select SIFIVE_U_OTP
     select SIFIVE_U_PRCI
     select UNIMP
 
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u_otp.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
 riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_gpio model to hw/gpio directory.

Note this also removes the trace-events in the hw/riscv directory,
since gpio is the only supported trace target in that directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-5-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/trace.h                         | 1 -
 include/hw/{riscv => gpio}/sifive_gpio.h | 0
 include/hw/riscv/sifive_e.h              | 2 +-
 include/hw/riscv/sifive_u.h              | 2 +-
 hw/{riscv => gpio}/sifive_gpio.c         | 2 +-
 hw/gpio/Kconfig                          | 3 +++
 hw/gpio/meson.build                      | 1 +
 hw/gpio/trace-events                     | 6 ++++++
 hw/riscv/Kconfig                         | 2 ++
 hw/riscv/meson.build                     | 1 -
 hw/riscv/trace-events                    | 7 -------
 meson.build                              | 1 -
 12 files changed, 15 insertions(+), 13 deletions(-)
 delete mode 100644 hw/riscv/trace.h
 rename include/hw/{riscv => gpio}/sifive_gpio.h (100%)
 rename hw/{riscv => gpio}/sifive_gpio.c (99%)
 delete mode 100644 hw/riscv/trace-events

diff --git a/hw/riscv/trace.h b/hw/riscv/trace.h
deleted file mode 100644
index XXXXXXX..XXXXXXX
--- a/hw/riscv/trace.h
+++ /dev/null
@@ -1 +0,0 @@
-#include "trace/trace-hw_riscv.h"
diff --git a/include/hw/riscv/sifive_gpio.h b/include/hw/gpio/sifive_gpio.h
similarity index 100%
rename from include/hw/riscv/sifive_gpio.h
rename to include/hw/gpio/sifive_gpio.h
diff --git a/include/hw/riscv/sifive_e.h b/include/hw/riscv/sifive_e.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/sifive_e.h
+++ b/include/hw/riscv/sifive_e.h
@@ -XXX,XX +XXX,XX @@
 
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_cpu.h"
-#include "hw/riscv/sifive_gpio.h"
+#include "hw/gpio/sifive_gpio.h"
 
 #define TYPE_RISCV_E_SOC "riscv.sifive.e.soc"
 #define RISCV_E_SOC(obj) \
diff --git a/include/hw/riscv/sifive_u.h b/include/hw/riscv/sifive_u.h
index XXXXXXX..XXXXXXX 100644
--- a/include/hw/riscv/sifive_u.h
+++ b/include/hw/riscv/sifive_u.h
@@ -XXX,XX +XXX,XX @@
 #include "hw/net/cadence_gem.h"
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_cpu.h"
-#include "hw/riscv/sifive_gpio.h"
+#include "hw/gpio/sifive_gpio.h"
 #include "hw/misc/sifive_u_otp.h"
 #include "hw/misc/sifive_u_prci.h"
 
diff --git a/hw/riscv/sifive_gpio.c b/hw/gpio/sifive_gpio.c
similarity index 99%
rename from hw/riscv/sifive_gpio.c
rename to hw/gpio/sifive_gpio.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_gpio.c
+++ b/hw/gpio/sifive_gpio.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/log.h"
 #include "hw/irq.h"
 #include "hw/qdev-properties.h"
-#include "hw/riscv/sifive_gpio.h"
+#include "hw/gpio/sifive_gpio.h"
 #include "migration/vmstate.h"
 #include "trace.h"
 
diff --git a/hw/gpio/Kconfig b/hw/gpio/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/gpio/Kconfig
+++ b/hw/gpio/Kconfig
@@ -XXX,XX +XXX,XX @@ config PL061
 
 config GPIO_KEY
     bool
+
+config SIFIVE_GPIO
+    bool
diff --git a/hw/gpio/meson.build b/hw/gpio/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/gpio/meson.build
+++ b/hw/gpio/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_NRF51_SOC', if_true: files('nrf51_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_gpio.c'))
 softmmu_ss.add(when: 'CONFIG_ASPEED_SOC', if_true: files('aspeed_gpio.c'))
+softmmu_ss.add(when: 'CONFIG_SIFIVE_GPIO', if_true: files('sifive_gpio.c'))
diff --git a/hw/gpio/trace-events b/hw/gpio/trace-events
index XXXXXXX..XXXXXXX 100644
--- a/hw/gpio/trace-events
+++ b/hw/gpio/trace-events
@@ -XXX,XX +XXX,XX @@ nrf51_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PR
 nrf51_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
 nrf51_gpio_set(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
 nrf51_gpio_update_output_irq(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
+
+# sifive_gpio.c
+sifive_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PRIx64
+sifive_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
+sifive_gpio_set(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
+sifive_gpio_update_output_irq(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
     bool
     select HART
     select SIFIVE
+    select SIFIVE_GPIO
     select SIFIVE_E_PRCI
     select UNIMP
 
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select CADENCE
     select HART
     select SIFIVE
+    select SIFIVE_GPIO
     select SIFIVE_PDMA
     select SIFIVE_U_OTP
     select SIFIVE_U_PRCI
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
 riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
 riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_clint.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_gpio.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
diff --git a/hw/riscv/trace-events b/hw/riscv/trace-events
deleted file mode 100644
index XXXXXXX..XXXXXXX
--- a/hw/riscv/trace-events
+++ /dev/null
@@ -XXX,XX +XXX,XX @@
-# See docs/devel/tracing.txt for syntax documentation.
-
-# hw/gpio/sifive_gpio.c
-sifive_gpio_read(uint64_t offset, uint64_t r) "offset 0x%" PRIx64 " value 0x%" PRIx64
-sifive_gpio_write(uint64_t offset, uint64_t value) "offset 0x%" PRIx64 " value 0x%" PRIx64
-sifive_gpio_set(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
-sifive_gpio_update_output_irq(int64_t line, int64_t value) "line %" PRIi64 " value %" PRIi64
diff --git a/meson.build b/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/meson.build
+++ b/meson.build
@@ -XXX,XX +XXX,XX @@ if have_system
     'hw/watchdog',
     'hw/xen',
     'hw/gpio',
-    'hw/riscv',
     'migration',
     'net',
     'ui',
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_clint model to hw/intc directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-6-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => intc}/sifive_clint.h | 0
 hw/{riscv => intc}/sifive_clint.c         | 2 +-
 hw/riscv/microchip_pfsoc.c                | 2 +-
 hw/riscv/sifive_e.c                       | 2 +-
 hw/riscv/sifive_u.c                       | 2 +-
 hw/riscv/spike.c                          | 2 +-
 hw/riscv/virt.c                           | 2 +-
 hw/intc/Kconfig                           | 3 +++
 hw/intc/meson.build                       | 1 +
 hw/riscv/Kconfig                          | 5 +++++
 hw/riscv/meson.build                      | 1 -
 11 files changed, 15 insertions(+), 7 deletions(-)
 rename include/hw/{riscv => intc}/sifive_clint.h (100%)
 rename hw/{riscv => intc}/sifive_clint.c (99%)

diff --git a/include/hw/riscv/sifive_clint.h b/include/hw/intc/sifive_clint.h
similarity index 100%
rename from include/hw/riscv/sifive_clint.h
rename to include/hw/intc/sifive_clint.h
diff --git a/hw/riscv/sifive_clint.c b/hw/intc/sifive_clint.c
similarity index 99%
rename from hw/riscv/sifive_clint.c
rename to hw/intc/sifive_clint.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_clint.c
+++ b/hw/intc/sifive_clint.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/sysbus.h"
 #include "target/riscv/cpu.h"
 #include "hw/qdev-properties.h"
-#include "hw/riscv/sifive_clint.h"
+#include "hw/intc/sifive_clint.h"
 #include "qemu/timer.h"
 
 static uint64_t cpu_riscv_read_rtc(uint32_t timebase_freq)
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/unimp.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/sifive_plic.h"
 #include "hw/riscv/microchip_pfsoc.h"
+#include "hw/intc/sifive_clint.h"
 #include "sysemu/sysemu.h"
 
 /*
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_plic.h"
-#include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_e.h"
 #include "hw/riscv/boot.h"
+#include "hw/intc/sifive_clint.h"
 #include "hw/misc/sifive_e_prci.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_plic.h"
-#include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_u.h"
 #include "hw/riscv/boot.h"
+#include "hw/intc/sifive_clint.h"
 #include "chardev/char.h"
 #include "net/eth.h"
 #include "sysemu/arch_init.h"
diff --git a/hw/riscv/spike.c b/hw/riscv/spike.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/spike.c
+++ b/hw/riscv/spike.c
@@ -XXX,XX +XXX,XX @@
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_htif.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/spike.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/numa.h"
+#include "hw/intc/sifive_clint.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
 #include "sysemu/device_tree.h"
diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/virt.c
+++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/sifive_plic.h"
-#include "hw/riscv/sifive_clint.h"
 #include "hw/riscv/sifive_test.h"
 #include "hw/riscv/virt.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/numa.h"
+#include "hw/intc/sifive_clint.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
 #include "sysemu/device_tree.h"
diff --git a/hw/intc/Kconfig b/hw/intc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/Kconfig
+++ b/hw/intc/Kconfig
@@ -XXX,XX +XXX,XX @@ config RX_ICU
 
 config LOONGSON_LIOINTC
     bool
+
+config SIFIVE_CLINT
+    bool
diff --git a/hw/intc/meson.build b/hw/intc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/meson.build
+++ b/hw/intc/meson.build
@@ -XXX,XX +XXX,XX @@ specific_ss.add(when: 'CONFIG_RX_ICU', if_true: files('rx_icu.c'))
 specific_ss.add(when: 'CONFIG_S390_FLIC', if_true: files('s390_flic.c'))
 specific_ss.add(when: 'CONFIG_S390_FLIC_KVM', if_true: files('s390_flic_kvm.c'))
 specific_ss.add(when: 'CONFIG_SH4', if_true: files('sh_intc.c'))
+specific_ss.add(when: 'CONFIG_SIFIVE_CLINT', if_true: files('sifive_clint.c'))
 specific_ss.add(when: 'CONFIG_XICS', if_true: files('xics.c'))
 specific_ss.add(when: 'CONFIG_XICS_KVM', if_true: files('xics_kvm.c'))
 specific_ss.add(when: 'CONFIG_XICS_SPAPR', if_true: files('xics_spapr.c'))
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
     bool
     select HART
     select SIFIVE
+    select SIFIVE_CLINT
     select SIFIVE_GPIO
     select SIFIVE_E_PRCI
     select UNIMP
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select CADENCE
     select HART
     select SIFIVE
+    select SIFIVE_CLINT
     select SIFIVE_GPIO
     select SIFIVE_PDMA
     select SIFIVE_U_OTP
@@ -XXX,XX +XXX,XX @@ config SPIKE
     select HART
     select HTIF
     select SIFIVE
+    select SIFIVE_CLINT
 
 config OPENTITAN
     bool
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
     select PCI_EXPRESS_GENERIC_BRIDGE
     select PFLASH_CFI01
     select SIFIVE
+    select SIFIVE_CLINT
 
 config MICROCHIP_PFSOC
     bool
     select HART
     select SIFIVE
+    select SIFIVE_CLINT
     select UNIMP
     select MCHP_PFSOC_MMUART
     select SIFIVE_PDMA
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files('numa.c'))
 riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
 riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
 riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_clint.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_plic model to hw/intc directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-7-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 {include/hw/riscv => hw/intc}/sifive_plic.h | 0
 hw/{riscv => intc}/sifive_plic.c            | 2 +-
 hw/riscv/microchip_pfsoc.c                  | 2 +-
 hw/riscv/sifive_e.c                         | 2 +-
 hw/riscv/sifive_u.c                         | 2 +-
 hw/riscv/virt.c                             | 2 +-
 hw/intc/Kconfig                             | 3 +++
 hw/intc/meson.build                         | 1 +
 hw/riscv/Kconfig                            | 5 +++++
 hw/riscv/meson.build                        | 1 -
 10 files changed, 14 insertions(+), 6 deletions(-)
 rename {include/hw/riscv => hw/intc}/sifive_plic.h (100%)
 rename hw/{riscv => intc}/sifive_plic.c (99%)

diff --git a/include/hw/riscv/sifive_plic.h b/hw/intc/sifive_plic.h
similarity index 100%
rename from include/hw/riscv/sifive_plic.h
rename to hw/intc/sifive_plic.h
diff --git a/hw/riscv/sifive_plic.c b/hw/intc/sifive_plic.c
similarity index 99%
rename from hw/riscv/sifive_plic.c
rename to hw/intc/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/intc/sifive_plic.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/pci/msi.h"
 #include "hw/boards.h"
 #include "hw/qdev-properties.h"
+#include "hw/intc/sifive_plic.h"
 #include "target/riscv/cpu.h"
 #include "sysemu/sysemu.h"
-#include "hw/riscv/sifive_plic.h"
 
 #define RISCV_DEBUG_PLIC 0
 
diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/unimp.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_plic.h"
 #include "hw/riscv/microchip_pfsoc.h"
 #include "hw/intc/sifive_clint.h"
+#include "hw/intc/sifive_plic.h"
 #include "sysemu/sysemu.h"
 
 /*
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/unimp.h"
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_plic.h"
 #include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_e.h"
 #include "hw/riscv/boot.h"
 #include "hw/intc/sifive_clint.h"
+#include "hw/intc/sifive_plic.h"
 #include "hw/misc/sifive_e_prci.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/unimp.h"
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_plic.h"
 #include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_u.h"
 #include "hw/riscv/boot.h"
 #include "hw/intc/sifive_clint.h"
+#include "hw/intc/sifive_plic.h"
 #include "chardev/char.h"
 #include "net/eth.h"
 #include "sysemu/arch_init.h"
diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/virt.c
+++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/char/serial.h"
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_plic.h"
 #include "hw/riscv/sifive_test.h"
 #include "hw/riscv/virt.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/numa.h"
 #include "hw/intc/sifive_clint.h"
+#include "hw/intc/sifive_plic.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
 #include "sysemu/device_tree.h"
diff --git a/hw/intc/Kconfig b/hw/intc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/Kconfig
+++ b/hw/intc/Kconfig
@@ -XXX,XX +XXX,XX @@ config LOONGSON_LIOINTC
 
 config SIFIVE_CLINT
     bool
+
+config SIFIVE_PLIC
+    bool
diff --git a/hw/intc/meson.build b/hw/intc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/meson.build
+++ b/hw/intc/meson.build
@@ -XXX,XX +XXX,XX @@ specific_ss.add(when: 'CONFIG_S390_FLIC', if_true: files('s390_flic.c'))
 specific_ss.add(when: 'CONFIG_S390_FLIC_KVM', if_true: files('s390_flic_kvm.c'))
 specific_ss.add(when: 'CONFIG_SH4', if_true: files('sh_intc.c'))
 specific_ss.add(when: 'CONFIG_SIFIVE_CLINT', if_true: files('sifive_clint.c'))
+specific_ss.add(when: 'CONFIG_SIFIVE_PLIC', if_true: files('sifive_plic.c'))
 specific_ss.add(when: 'CONFIG_XICS', if_true: files('xics.c'))
 specific_ss.add(when: 'CONFIG_XICS_KVM', if_true: files('xics_kvm.c'))
 specific_ss.add(when: 'CONFIG_XICS_SPAPR', if_true: files('xics_spapr.c'))
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
     select SIFIVE
     select SIFIVE_CLINT
     select SIFIVE_GPIO
+    select SIFIVE_PLIC
     select SIFIVE_E_PRCI
     select UNIMP
 
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select SIFIVE_CLINT
     select SIFIVE_GPIO
     select SIFIVE_PDMA
+    select SIFIVE_PLIC
     select SIFIVE_U_OTP
     select SIFIVE_U_PRCI
     select UNIMP
@@ -XXX,XX +XXX,XX @@ config SPIKE
     select HTIF
     select SIFIVE
     select SIFIVE_CLINT
+    select SIFIVE_PLIC
 
 config OPENTITAN
     bool
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
     select PFLASH_CFI01
     select SIFIVE
     select SIFIVE_CLINT
+    select SIFIVE_PLIC
 
 config MICROCHIP_PFSOC
     bool
@@ -XXX,XX +XXX,XX @@ config MICROCHIP_PFSOC
     select UNIMP
     select MCHP_PFSOC_MMUART
     select SIFIVE_PDMA
+    select SIFIVE_PLIC
     select CADENCE_SDHCI
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files('numa.c'))
 riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
 riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
 riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_plic.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move riscv_htif model to hw/char directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-8-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => char}/riscv_htif.h | 0
 hw/{riscv => char}/riscv_htif.c         | 2 +-
 hw/riscv/spike.c                        | 2 +-
 hw/char/Kconfig                         | 3 +++
 hw/char/meson.build                     | 1 +
 hw/riscv/Kconfig                        | 3 ---
 hw/riscv/meson.build                    | 1 -
 7 files changed, 6 insertions(+), 6 deletions(-)
 rename include/hw/{riscv => char}/riscv_htif.h (100%)
 rename hw/{riscv => char}/riscv_htif.c (99%)

diff --git a/include/hw/riscv/riscv_htif.h b/include/hw/char/riscv_htif.h
similarity index 100%
rename from include/hw/riscv/riscv_htif.h
rename to include/hw/char/riscv_htif.h
diff --git a/hw/riscv/riscv_htif.c b/hw/char/riscv_htif.c
similarity index 99%
rename from hw/riscv/riscv_htif.c
rename to hw/char/riscv_htif.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/riscv_htif.c
+++ b/hw/char/riscv_htif.c
@@ -XXX,XX +XXX,XX @@
 #include "qapi/error.h"
 #include "qemu/log.h"
 #include "hw/sysbus.h"
+#include "hw/char/riscv_htif.h"
 #include "hw/char/serial.h"
 #include "chardev/char.h"
 #include "chardev/char-fe.h"
-#include "hw/riscv/riscv_htif.h"
 #include "qemu/timer.h"
 #include "qemu/error-report.h"
 
diff --git a/hw/riscv/spike.c b/hw/riscv/spike.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/spike.c
+++ b/hw/riscv/spike.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/loader.h"
 #include "hw/sysbus.h"
 #include "target/riscv/cpu.h"
-#include "hw/riscv/riscv_htif.h"
 #include "hw/riscv/riscv_hart.h"
 #include "hw/riscv/spike.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/numa.h"
+#include "hw/char/riscv_htif.h"
 #include "hw/intc/sifive_clint.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
diff --git a/hw/char/Kconfig b/hw/char/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/Kconfig
+++ b/hw/char/Kconfig
@@ -XXX,XX +XXX,XX @@
 config ESCC
     bool
 
+config HTIF
+    bool
+
 config PARALLEL
     bool
     default y
diff --git a/hw/char/meson.build b/hw/char/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/meson.build
+++ b/hw/char/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_SH4', if_true: files('sh_serial.c'))
 softmmu_ss.add(when: 'CONFIG_STM32F2XX_USART', if_true: files('stm32f2xx_usart.c'))
 softmmu_ss.add(when: 'CONFIG_MCHP_PFSOC_MMUART', if_true: files('mchp_pfsoc_mmuart.c'))
 
+specific_ss.add(when: 'CONFIG_HTIF', if_true: files('riscv_htif.c'))
 specific_ss.add(when: 'CONFIG_TERMINAL3270', if_true: files('terminal3270.c'))
 specific_ss.add(when: 'CONFIG_VIRTIO', if_true: files('virtio-serial-bus.c'))
 specific_ss.add(when: 'CONFIG_PSERIES', if_true: files('spapr_vty.c'))
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@
-config HTIF
-    bool
-
 config HART
     bool
 
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
-riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('riscv_htif.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
 riscv_ss.add(when: 'CONFIG_MICROCHIP_PFSOC', if_true: files('microchip_pfsoc.c'))
 
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_uart model to hw/char directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-9-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => char}/sifive_uart.h | 0
 hw/{riscv => char}/sifive_uart.c         | 2 +-
 hw/riscv/sifive_e.c                      | 2 +-
 hw/riscv/sifive_u.c                      | 2 +-
 hw/char/Kconfig                          | 3 +++
 hw/char/meson.build                      | 1 +
 hw/riscv/Kconfig                         | 2 ++
 hw/riscv/meson.build                     | 1 -
 8 files changed, 9 insertions(+), 4 deletions(-)
 rename include/hw/{riscv => char}/sifive_uart.h (100%)
 rename hw/{riscv => char}/sifive_uart.c (99%)

diff --git a/include/hw/riscv/sifive_uart.h b/include/hw/char/sifive_uart.h
similarity index 100%
rename from include/hw/riscv/sifive_uart.h
rename to include/hw/char/sifive_uart.h
diff --git a/hw/riscv/sifive_uart.c b/hw/char/sifive_uart.c
similarity index 99%
rename from hw/riscv/sifive_uart.c
rename to hw/char/sifive_uart.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_uart.c
+++ b/hw/char/sifive_uart.c
@@ -XXX,XX +XXX,XX @@
 #include "chardev/char-fe.h"
 #include "hw/hw.h"
 #include "hw/irq.h"
-#include "hw/riscv/sifive_uart.h"
+#include "hw/char/sifive_uart.h"
 
 /*
  * Not yet implemented:
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/unimp.h"
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_e.h"
 #include "hw/riscv/boot.h"
+#include "hw/char/sifive_uart.h"
 #include "hw/intc/sifive_clint.h"
 #include "hw/intc/sifive_plic.h"
 #include "hw/misc/sifive_e_prci.h"
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/misc/unimp.h"
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_uart.h"
 #include "hw/riscv/sifive_u.h"
 #include "hw/riscv/boot.h"
+#include "hw/char/sifive_uart.h"
 #include "hw/intc/sifive_clint.h"
 #include "hw/intc/sifive_plic.h"
 #include "chardev/char.h"
diff --git a/hw/char/Kconfig b/hw/char/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/Kconfig
+++ b/hw/char/Kconfig
@@ -XXX,XX +XXX,XX @@ config AVR_USART
 
 config MCHP_PFSOC_MMUART
     bool
+
+config SIFIVE_UART
+    bool
diff --git a/hw/char/meson.build b/hw/char/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/char/meson.build
+++ b/hw/char/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_EXYNOS4', if_true: files('exynos4210_uart.c'))
 softmmu_ss.add(when: 'CONFIG_OMAP', if_true: files('omap_uart.c'))
 softmmu_ss.add(when: 'CONFIG_RASPI', if_true: files('bcm2835_aux.c'))
 softmmu_ss.add(when: 'CONFIG_RENESAS_SCI', if_true: files('renesas_sci.c'))
+softmmu_ss.add(when: 'CONFIG_SIFIVE_UART', if_true: files('sifive_uart.c'))
 softmmu_ss.add(when: 'CONFIG_SH4', if_true: files('sh_serial.c'))
 softmmu_ss.add(when: 'CONFIG_STM32F2XX_USART', if_true: files('stm32f2xx_usart.c'))
 softmmu_ss.add(when: 'CONFIG_MCHP_PFSOC_MMUART', if_true: files('mchp_pfsoc_mmuart.c'))
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
     select SIFIVE_CLINT
     select SIFIVE_GPIO
     select SIFIVE_PLIC
+    select SIFIVE_UART
     select SIFIVE_E_PRCI
     select UNIMP
 
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
     select SIFIVE_GPIO
     select SIFIVE_PDMA
     select SIFIVE_PLIC
+    select SIFIVE_UART
     select SIFIVE_U_OTP
     select SIFIVE_U_PRCI
     select UNIMP
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
 riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
 riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_uart.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

This is an effort to clean up the hw/riscv directory. Ideally it
should only contain the RISC-V SoC / machine codes plus generic
codes. Let's move sifive_test model to hw/misc directory.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-10-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 include/hw/{riscv => misc}/sifive_test.h | 0
 hw/{riscv => misc}/sifive_test.c         | 2 +-
 hw/riscv/virt.c                          | 2 +-
 hw/misc/Kconfig                          | 3 +++
 hw/misc/meson.build                      | 1 +
 hw/riscv/Kconfig                         | 1 +
 hw/riscv/meson.build                     | 1 -
 7 files changed, 7 insertions(+), 3 deletions(-)
 rename include/hw/{riscv => misc}/sifive_test.h (100%)
 rename hw/{riscv => misc}/sifive_test.c (98%)

diff --git a/include/hw/riscv/sifive_test.h b/include/hw/misc/sifive_test.h
similarity index 100%
rename from include/hw/riscv/sifive_test.h
rename to include/hw/misc/sifive_test.h
diff --git a/hw/riscv/sifive_test.c b/hw/misc/sifive_test.c
similarity index 98%
rename from hw/riscv/sifive_test.c
rename to hw/misc/sifive_test.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_test.c
+++ b/hw/misc/sifive_test.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/module.h"
 #include "sysemu/runstate.h"
 #include "hw/hw.h"
-#include "hw/riscv/sifive_test.h"
+#include "hw/misc/sifive_test.h"
 
 static uint64_t sifive_test_read(void *opaque, hwaddr addr, unsigned int size)
 {
diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/virt.c
+++ b/hw/riscv/virt.c
@@ -XXX,XX +XXX,XX @@
 #include "hw/char/serial.h"
 #include "target/riscv/cpu.h"
 #include "hw/riscv/riscv_hart.h"
-#include "hw/riscv/sifive_test.h"
 #include "hw/riscv/virt.h"
 #include "hw/riscv/boot.h"
 #include "hw/riscv/numa.h"
 #include "hw/intc/sifive_clint.h"
 #include "hw/intc/sifive_plic.h"
+#include "hw/misc/sifive_test.h"
 #include "chardev/char.h"
 #include "sysemu/arch_init.h"
 #include "sysemu/device_tree.h"
diff --git a/hw/misc/Kconfig b/hw/misc/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/Kconfig
+++ b/hw/misc/Kconfig
@@ -XXX,XX +XXX,XX @@ config MAC_VIA
 config AVR_POWER
     bool
 
+config SIFIVE_TEST
+    bool
+
 config SIFIVE_E_PRCI
     bool
 
diff --git a/hw/misc/meson.build b/hw/misc/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/misc/meson.build
+++ b/hw/misc/meson.build
@@ -XXX,XX +XXX,XX @@ softmmu_ss.add(when: 'CONFIG_ARM11SCU', if_true: files('arm11scu.c'))
 softmmu_ss.add(when: 'CONFIG_MOS6522', if_true: files('mos6522.c'))
 
 # RISC-V devices
+softmmu_ss.add(when: 'CONFIG_SIFIVE_TEST', if_true: files('sifive_test.c'))
 softmmu_ss.add(when: 'CONFIG_SIFIVE_E_PRCI', if_true: files('sifive_e_prci.c'))
 softmmu_ss.add(when: 'CONFIG_SIFIVE_U_OTP', if_true: files('sifive_u_otp.c'))
 softmmu_ss.add(when: 'CONFIG_SIFIVE_U_PRCI', if_true: files('sifive_u_prci.c'))
diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
     select SIFIVE
     select SIFIVE_CLINT
     select SIFIVE_PLIC
+    select SIFIVE_TEST
 
 config MICROCHIP_PFSOC
     bool
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files('numa.c'))
 riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
 riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
 riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
-riscv_ss.add(when: 'CONFIG_SIFIVE', if_true: files('sifive_test.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_U', if_true: files('sifive_u.c'))
 riscv_ss.add(when: 'CONFIG_SPIKE', if_true: files('spike.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

Every RISC-V machine needs riscv_hart hence there is no need to
have a dedicated Kconfig option for it. Drop the Kconfig option
and always build riscv_hart.c.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-11-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/Kconfig     | 9 ---------
 hw/riscv/meson.build | 2 +-
 2 files changed, 1 insertion(+), 10 deletions(-)

diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@
-config HART
-    bool
-
 config IBEX
     bool
 
@@ -XXX,XX +XXX,XX @@ config SIFIVE
 
 config SIFIVE_E
     bool
-    select HART
     select SIFIVE
     select SIFIVE_CLINT
     select SIFIVE_GPIO
@@ -XXX,XX +XXX,XX @@ config SIFIVE_E
 config SIFIVE_U
     bool
     select CADENCE
-    select HART
     select SIFIVE
     select SIFIVE_CLINT
     select SIFIVE_GPIO
@@ -XXX,XX +XXX,XX @@ config SIFIVE_U
 
 config SPIKE
     bool
-    select HART
     select HTIF
     select SIFIVE
     select SIFIVE_CLINT
@@ -XXX,XX +XXX,XX @@ config SPIKE
 config OPENTITAN
     bool
     select IBEX
-    select HART
     select UNIMP
 
 config RISCV_VIRT
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
     imply PCI_DEVICES
     imply TEST_DEVICES
     select PCI
-    select HART
     select SERIAL
     select GOLDFISH_RTC
     select VIRTIO_MMIO
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
 
 config MICROCHIP_PFSOC
     bool
-    select HART
     select SIFIVE
     select SIFIVE_CLINT
     select UNIMP
diff --git a/hw/riscv/meson.build b/hw/riscv/meson.build
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/meson.build
+++ b/hw/riscv/meson.build
@@ -XXX,XX +XXX,XX @@
 riscv_ss = ss.source_set()
 riscv_ss.add(files('boot.c'), fdt)
 riscv_ss.add(files('numa.c'))
-riscv_ss.add(when: 'CONFIG_HART', if_true: files('riscv_hart.c'))
+riscv_ss.add(files('riscv_hart.c'))
 riscv_ss.add(when: 'CONFIG_OPENTITAN', if_true: files('opentitan.c'))
 riscv_ss.add(when: 'CONFIG_RISCV_VIRT', if_true: files('virt.c'))
 riscv_ss.add(when: 'CONFIG_SIFIVE_E', if_true: files('sifive_e.c'))
-- 
2.28.0

From: Bin Meng <bin.meng@windriver.com>

The name SIFIVE is too vague to convey the required component of
MSI_NONBROKEN. Let's drop the option, and select MSI_NONBROKEN in
each machine instead.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-12-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/Kconfig | 14 +++++---------
 1 file changed, 5 insertions(+), 9 deletions(-)

From: Bin Meng <bin.meng@windriver.com>

At present the Kconfig file is in disorder. Let's sort the options.

Signed-off-by: Bin Meng <bin.meng@windriver.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <1599129623-68957-13-git-send-email-bmeng.cn@gmail.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/Kconfig | 58 ++++++++++++++++++++++++------------------------
 1 file changed, 29 insertions(+), 29 deletions(-)

diff --git a/hw/riscv/Kconfig b/hw/riscv/Kconfig
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/Kconfig
+++ b/hw/riscv/Kconfig
@@ -XXX,XX +XXX,XX @@
 config IBEX
     bool
 
-config SIFIVE_E
-    bool
-    select MSI_NONBROKEN
-    select SIFIVE_CLINT
-    select SIFIVE_GPIO
-    select SIFIVE_PLIC
-    select SIFIVE_UART
-    select SIFIVE_E_PRCI
-    select UNIMP
-
-config SIFIVE_U
+config MICROCHIP_PFSOC
     bool
-    select CADENCE
+    select CADENCE_SDHCI
+    select MCHP_PFSOC_MMUART
     select MSI_NONBROKEN
     select SIFIVE_CLINT
-    select SIFIVE_GPIO
     select SIFIVE_PDMA
     select SIFIVE_PLIC
-    select SIFIVE_UART
-    select SIFIVE_U_OTP
-    select SIFIVE_U_PRCI
     select UNIMP
 
-config SPIKE
-    bool
-    select HTIF
-    select MSI_NONBROKEN
-    select SIFIVE_CLINT
-    select SIFIVE_PLIC
-
 config OPENTITAN
     bool
     select IBEX
@@ -XXX,XX +XXX,XX @@ config RISCV_VIRT
     bool
     imply PCI_DEVICES
     imply TEST_DEVICES
+    select GOLDFISH_RTC
     select MSI_NONBROKEN
     select PCI
-    select SERIAL
-    select GOLDFISH_RTC
-    select VIRTIO_MMIO
     select PCI_EXPRESS_GENERIC_BRIDGE
     select PFLASH_CFI01
+    select SERIAL
     select SIFIVE_CLINT
     select SIFIVE_PLIC
     select SIFIVE_TEST
+    select VIRTIO_MMIO
 
-config MICROCHIP_PFSOC
+config SIFIVE_E
     bool
     select MSI_NONBROKEN
     select SIFIVE_CLINT
+    select SIFIVE_GPIO
+    select SIFIVE_PLIC
+    select SIFIVE_UART
+    select SIFIVE_E_PRCI
     select UNIMP
-    select MCHP_PFSOC_MMUART
+
+config SIFIVE_U
+    bool
+    select CADENCE
+    select MSI_NONBROKEN
+    select SIFIVE_CLINT
+    select SIFIVE_GPIO
     select SIFIVE_PDMA
     select SIFIVE_PLIC
-    select CADENCE_SDHCI
+    select SIFIVE_UART
+    select SIFIVE_U_OTP
+    select SIFIVE_U_PRCI
+    select UNIMP
+
+config SPIKE
+    bool
+    select HTIF
+    select MSI_NONBROKEN
+    select SIFIVE_CLINT
+    select SIFIVE_PLIC
-- 
2.28.0

The following changes since commit 64f0ad8ad8e13257e7c912df470d46784b55c3fd:

Merge remote-tracking branch 'remotes/armbru/tags/pull-error-2020-07-02' into staging (2020-07-02 15:54:09 +0100)

are available in the Git repository at:

git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200702-1

for you to fetch changes up to 6bf91617f47c74efc99ef48236765d9677c0898e:

target/riscv: configure and turn on vector extension from command line (2020-07-02 09:19:34 -0700)

----------------------------------------------------------------
This PR contains two patches to improve PLIC support in QEMU.

It also contains one patch that fixes CLINT accesses for RISC-V. This
fixes a regression for most RISC-V boards.

The rest of the PR is adding support for the v0.7.1 RISC-V vector
extensions. This is experimental support as the vector extensions are
still in a draft state.

This is a v2 pull request that has fixed the building on big endian
machines failure.

----------------------------------------------------------------
Alistair Francis (1):
      hw/riscv: Allow 64 bit access to SiFive CLINT

Jessica Clarke (2):
      riscv: plic: Honour source priorities
      riscv: plic: Add a couple of mising sifive_plic_update calls

LIU Zhiwei (61):
      target/riscv: add vector extension field in CPURISCVState
      target/riscv: implementation-defined constant parameters
      target/riscv: support vector extension csr
      target/riscv: add vector configure instruction
      target/riscv: add an internals.h header
      target/riscv: add vector stride load and store instructions
      target/riscv: add vector index load and store instructions
      target/riscv: add fault-only-first unit stride load
      target/riscv: add vector amo operations
      target/riscv: vector single-width integer add and subtract
      target/riscv: vector widening integer add and subtract
      target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
      target/riscv: vector bitwise logical instructions
      target/riscv: vector single-width bit shift instructions
      target/riscv: vector narrowing integer right shift instructions
      target/riscv: vector integer comparison instructions
      target/riscv: vector integer min/max instructions
      target/riscv: vector single-width integer multiply instructions
      target/riscv: vector integer divide instructions
      target/riscv: vector widening integer multiply instructions
      target/riscv: vector single-width integer multiply-add instructions
      target/riscv: vector widening integer multiply-add instructions
      target/riscv: vector integer merge and move instructions
      target/riscv: vector single-width saturating add and subtract
      target/riscv: vector single-width averaging add and subtract
      target/riscv: vector single-width fractional multiply with rounding and saturation
      target/riscv: vector widening saturating scaled multiply-add
      target/riscv: vector single-width scaling shift instructions
      target/riscv: vector narrowing fixed-point clip instructions
      target/riscv: vector single-width floating-point add/subtract instructions
      target/riscv: vector widening floating-point add/subtract instructions
      target/riscv: vector single-width floating-point multiply/divide instructions
      target/riscv: vector widening floating-point multiply
      target/riscv: vector single-width floating-point fused multiply-add instructions
      target/riscv: vector widening floating-point fused multiply-add instructions
      target/riscv: vector floating-point square-root instruction
      target/riscv: vector floating-point min/max instructions
      target/riscv: vector floating-point sign-injection instructions
      target/riscv: vector floating-point compare instructions
      target/riscv: vector floating-point classify instructions
      target/riscv: vector floating-point merge instructions
      target/riscv: vector floating-point/integer type-convert instructions
      target/riscv: widening floating-point/integer type-convert instructions
      target/riscv: narrowing floating-point/integer type-convert instructions
      target/riscv: vector single-width integer reduction instructions
      target/riscv: vector wideing integer reduction instructions
      target/riscv: vector single-width floating-point reduction instructions
      target/riscv: vector widening floating-point reduction instructions
      target/riscv: vector mask-register logical instructions
      target/riscv: vector mask population count vmpopc
      target/riscv: vmfirst find-first-set mask bit
      target/riscv: set-X-first mask bit
      target/riscv: vector iota instruction
      target/riscv: vector element index instruction
      target/riscv: integer extract instruction
      target/riscv: integer scalar move instruction
      target/riscv: floating-point scalar move instructions
      target/riscv: vector slide instructions
      target/riscv: vector register gather instruction
      target/riscv: vector compress instruction
      target/riscv: configure and turn on vector extension from command line

target/riscv/cpu.h                      |   82 +-
 target/riscv/cpu_bits.h                 |   15 +
 target/riscv/helper.h                   | 1069 +++++++
 target/riscv/internals.h                |   41 +
 target/riscv/insn32-64.decode           |   11 +
 target/riscv/insn32.decode              |  372 +++
 hw/riscv/sifive_clint.c                 |    2 +-
 hw/riscv/sifive_plic.c                  |   20 +-
 target/riscv/cpu.c                      |   50 +
 target/riscv/csr.c                      |   75 +-
 target/riscv/fpu_helper.c               |   33 +-
 target/riscv/insn_trans/trans_rvv.inc.c | 2888 ++++++++++++++++++
 target/riscv/translate.c                |   27 +-
 target/riscv/vector_helper.c            | 4899 +++++++++++++++++++++++++++++++
 target/riscv/Makefile.objs              |    2 +-
 15 files changed, 9535 insertions(+), 51 deletions(-)
 create mode 100644 target/riscv/internals.h
 create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
 create mode 100644 target/riscv/vector_helper.c

From: Jessica Clarke <jrtc27@jrtc27.com>

The source priorities can be used to order sources with respect to other
sources, not just as a way to enable/disable them based off a threshold.
We must therefore always claim the highest-priority source, rather than
the first source we find.

Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20200618202343.20455-1-jrtc27@jrtc27.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_plic.c | 17 ++++++++++++-----
 1 file changed, 12 insertions(+), 5 deletions(-)

diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/riscv/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
 static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
 {
     int i, j;
+    uint32_t max_irq = 0;
+    uint32_t max_prio = plic->target_priority[addrid];
+
     for (i = 0; i < plic->bitfield_words; i++) {
         uint32_t pending_enabled_not_claimed =
             (plic->pending[i] & ~plic->claimed[i]) &
@@ -XXX,XX +XXX,XX @@ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
             int irq = (i << 5) + j;
             uint32_t prio = plic->source_priority[irq];
             int enabled = pending_enabled_not_claimed & (1 << j);
-            if (enabled && prio > plic->target_priority[addrid]) {
-                sifive_plic_set_pending(plic, irq, false);
-                sifive_plic_set_claimed(plic, irq, true);
-                return irq;
+            if (enabled && prio > max_prio) {
+                max_irq = irq;
+                max_prio = prio;
             }
         }
     }
-    return 0;
+
+    if (max_irq) {
+        sifive_plic_set_pending(plic, max_irq, false);
+        sifive_plic_set_claimed(plic, max_irq, true);
+    }
+    return max_irq;
 }
 
 static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
-- 
2.27.0

From: Jessica Clarke <jrtc27@jrtc27.com>

Claiming an interrupt and changing the source priority both potentially
affect whether an interrupt is pending, thus we must re-compute xEIP.
Note that we don't put the sifive_plic_update inside sifive_plic_claim
so that the logging of a claim (and the resulting IRQ) happens before
the state update, making the causal effect clear, and that we drop the
explicit call to sifive_plic_print_state when claiming since
sifive_plic_update already does that automatically at the end for us.

This can result in both spurious interrupt storms if you fail to
complete an IRQ before enabling interrupts (and no other actions occur
that result in a call to sifive_plic_update), but also more importantly
lost interrupts if a disabled interrupt is pending and then becomes
enabled.

Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20200618210649.22451-1-jrtc27@jrtc27.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_plic.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/riscv/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
                     plic->addr_config[addrid].hartid,
                     mode_to_char(plic->addr_config[addrid].mode),
                     value);
-                sifive_plic_print_state(plic);
             }
+            sifive_plic_update(plic);
             return value;
         }
     }
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
             qemu_log("plic: write priority: irq=%d priority=%d\n",
                 irq, plic->source_priority[irq]);
         }
+        sifive_plic_update(plic);
         return;
     } else if (addr >= plic->pending_base && /* 1 bit per source */
                addr < plic->pending_base + (plic->num_sources >> 3))
-- 
2.27.0