Series comparison

-[PULL 00/63] riscv-to-apply queue
+[PULL 00/28] riscv-to-apply queue
-The following changes since commit 553cf5d7c47bee05a3dec9461c1f8430316d516b:
+The following changes since commit ad10b4badc1dd5b28305f9b9f1168cf0aa3ae946:
-  Merge remote-tracking branch 'remotes/pmaydell/tags/pull-target-arm-20200626' into staging (2020-06-26 18:22:36 +0100)
+  Merge tag 'pull-error-2024-05-27' of https://repo.or.cz/qemu/armbru into staging (2024-05-27 06:40:42 -0700)
 are available in the Git repository at:
-  git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200626-1
+  https://github.com/alistair23/qemu.git tags/pull-riscv-to-apply-20240528
-for you to fetch changes up to b39d59434ea10649fdb9e0a339c30c76e38c5e17:
+for you to fetch changes up to 1806da76cb81088ea026ca3441551782b850e393:
-  target/riscv: configure and turn on vector extension from command line (2020-06-26 14:22:15 -0700)
+  target/riscv: raise an exception when CSRRS/CSRRC writes a read-only CSR (2024-05-28 12:20:27 +1000)
 ----------------------------------------------------------------
-This PR contains two patches to improve PLIC support in QEMU.
+RISC-V PR for 9.1
-The rest of the PR is adding support for the v0.7.1 RISC-V vector
+* APLICs add child earlier than realize
-extensions. This is experimental support as the vector extensions are
+* Fix exposure of Zkr
-still in a draft state.
+* Raise exceptions on wrs.nto
 * Implement SBI debug console (DBCN) calls for KVM
 * Support 64-bit addresses for initrd
 * Change RISCV_EXCP_SEMIHOST exception number to 63
 * Tolerate KVM disable ext errors
 * Set tval in breakpoints
 * Add support for Zve32x extension
 * Add support for Zve64x extension
 * Relax vector register check in RISCV gdbstub
 * Fix the element agnostic Vector function problem
 * Fix Zvkb extension config
 * Implement dynamic establishment of custom decoder
 * Add th.sxstatus CSR emulation
 * Fix Zvfhmin checking for vfwcvt.f.f.v and vfncvt.f.f.w instructions
 * Check single width operator for vector fp widen instructions
 * Check single width operator for vfncvt.rod.f.f.w
 * Remove redudant SEW checking for vector fp narrow/widen instructions
 * Prioritize pmp errors in raise_mmu_exception()
 * Do not set mtval2 for non guest-page faults
 * Remove experimental prefix from "B" extension
 * Fixup CBO extension register calculation
 * Fix the hart bit setting of AIA
 * Fix reg_width in ricsv_gen_dynamic_vector_feature()
 * Decode all of the pmpcfg and pmpaddr CSRs
 * Raise an exception when CSRRS/CSRRC writes a read-only CSR
 ----------------------------------------------------------------
-Jessica Clarke (2):
+Alexei Filippov (1):
-      riscv: plic: Honour source priorities
+      target/riscv: do not set mtval2 for non guest-page faults
       riscv: plic: Add a couple of mising sifive_plic_update calls
-LIU Zhiwei (61):
+Alistair Francis (2):
-      target/riscv: add vector extension field in CPURISCVState
+      target/riscv: rvzicbo: Fixup CBO extension register calculation
-      target/riscv: implementation-defined constant parameters
+      disas/riscv: Decode all of the pmpcfg and pmpaddr CSRs
       target/riscv: support vector extension csr
       target/riscv: add vector configure instruction
       target/riscv: add an internals.h header
       target/riscv: add vector stride load and store instructions
       target/riscv: add vector index load and store instructions
       target/riscv: add fault-only-first unit stride load
       target/riscv: add vector amo operations
       target/riscv: vector single-width integer add and subtract
       target/riscv: vector widening integer add and subtract
       target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
       target/riscv: vector bitwise logical instructions
       target/riscv: vector single-width bit shift instructions
       target/riscv: vector narrowing integer right shift instructions
       target/riscv: vector integer comparison instructions
       target/riscv: vector integer min/max instructions
       target/riscv: vector single-width integer multiply instructions
       target/riscv: vector integer divide instructions
       target/riscv: vector widening integer multiply instructions
       target/riscv: vector single-width integer multiply-add instructions
       target/riscv: vector widening integer multiply-add instructions
       target/riscv: vector integer merge and move instructions
       target/riscv: vector single-width saturating add and subtract
       target/riscv: vector single-width averaging add and subtract
       target/riscv: vector single-width fractional multiply with rounding and saturation
       target/riscv: vector widening saturating scaled multiply-add
       target/riscv: vector single-width scaling shift instructions
       target/riscv: vector narrowing fixed-point clip instructions
       target/riscv: vector single-width floating-point add/subtract instructions
       target/riscv: vector widening floating-point add/subtract instructions
       target/riscv: vector single-width floating-point multiply/divide instructions
       target/riscv: vector widening floating-point multiply
       target/riscv: vector single-width floating-point fused multiply-add instructions
       target/riscv: vector widening floating-point fused multiply-add instructions
       target/riscv: vector floating-point square-root instruction
       target/riscv: vector floating-point min/max instructions
       target/riscv: vector floating-point sign-injection instructions
       target/riscv: vector floating-point compare instructions
       target/riscv: vector floating-point classify instructions
       target/riscv: vector floating-point merge instructions
       target/riscv: vector floating-point/integer type-convert instructions
       target/riscv: widening floating-point/integer type-convert instructions
       target/riscv: narrowing floating-point/integer type-convert instructions
       target/riscv: vector single-width integer reduction instructions
       target/riscv: vector wideing integer reduction instructions
       target/riscv: vector single-width floating-point reduction instructions
       target/riscv: vector widening floating-point reduction instructions
       target/riscv: vector mask-register logical instructions
       target/riscv: vector mask population count vmpopc
       target/riscv: vmfirst find-first-set mask bit
       target/riscv: set-X-first mask bit
       target/riscv: vector iota instruction
       target/riscv: vector element index instruction
       target/riscv: integer extract instruction
       target/riscv: integer scalar move instruction
       target/riscv: floating-point scalar move instructions
       target/riscv: vector slide instructions
       target/riscv: vector register gather instruction
       target/riscv: vector compress instruction
       target/riscv: configure and turn on vector extension from command line
- target/riscv/cpu.h                      |   82 +-
+Andrew Jones (2):
- target/riscv/cpu_bits.h                 |   15 +
+      target/riscv/kvm: Fix exposure of Zkr
- target/riscv/helper.h                   | 1069 +++++++
+      target/riscv: Raise exceptions on wrs.nto
  target/riscv/internals.h                |   41 +
  target/riscv/insn32-64.decode           |   11 +
  target/riscv/insn32.decode              |  372 +++
  hw/riscv/sifive_plic.c                  |   20 +-
  target/riscv/cpu.c                      |   50 +
  target/riscv/csr.c                      |   75 +-
  target/riscv/fpu_helper.c               |   33 +-
  target/riscv/insn_trans/trans_rvv.inc.c | 2888 ++++++++++++++++++
  target/riscv/translate.c                |   27 +-
  target/riscv/vector_helper.c            | 4899 +++++++++++++++++++++++++++++++
  target/riscv/Makefile.objs              |    2 +-
 files changed, 9534 insertions(+), 50 deletions(-)
  create mode 100644 target/riscv/internals.h
  create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
  create mode 100644 target/riscv/vector_helper.c
+Cheng Yang (1):
+      hw/riscv/boot.c: Support 64-bit address for initrd
+Christoph Müllner (1):
+      riscv: thead: Add th.sxstatus CSR emulation
+Clément Léger (1):
+      target/riscv: change RISCV_EXCP_SEMIHOST exception number to 63
+Daniel Henrique Barboza (6):
+      target/riscv/kvm: implement SBI debug console (DBCN) calls
+      target/riscv/kvm: tolerate KVM disable ext errors
+      target/riscv/debug: set tval=pc in breakpoint exceptions
+      trans_privileged.c.inc: set (m|s)tval on ebreak breakpoint
+      target/riscv: prioritize pmp errors in raise_mmu_exception()
+      riscv, gdbstub.c: fix reg_width in ricsv_gen_dynamic_vector_feature()
+Huang Tao (2):
+      target/riscv: Fix the element agnostic function problem
+      target/riscv: Implement dynamic establishment of custom decoder
+Jason Chien (3):
+      target/riscv: Add support for Zve32x extension
+      target/riscv: Add support for Zve64x extension
+      target/riscv: Relax vector register check in RISCV gdbstub
+Max Chou (4):
+      target/riscv: rvv: Fix Zvfhmin checking for vfwcvt.f.f.v and vfncvt.f.f.w instructions
+      target/riscv: rvv: Check single width operator for vector fp widen instructions
+      target/riscv: rvv: Check single width operator for vfncvt.rod.f.f.w
+      target/riscv: rvv: Remove redudant SEW checking for vector fp narrow/widen instructions
+Rob Bradford (1):
+      target/riscv: Remove experimental prefix from "B" extension
+Yangyu Chen (1):
+      target/riscv/cpu.c: fix Zvkb extension config
+Yong-Xuan Wang (1):
+      target/riscv/kvm.c: Fix the hart bit setting of AIA
+Yu-Ming Chang (1):
+      target/riscv: raise an exception when CSRRS/CSRRC writes a read-only CSR
+yang.zhang (1):
+      hw/intc/riscv_aplic: APLICs should add child earlier than realize
+ MAINTAINERS                                    |   1 +
+ target/riscv/cpu.h                             |  11 ++
+ target/riscv/cpu_bits.h                        |   2 +-
+ target/riscv/cpu_cfg.h                         |   2 +
+ target/riscv/helper.h                          |   1 +
+ target/riscv/sbi_ecall_interface.h             |  17 +++
+ target/riscv/tcg/tcg-cpu.h                     |  15 +++
+ disas/riscv.c                                  |  65 +++++++++-
+ hw/intc/riscv_aplic.c                          |   8 +-
+ hw/riscv/boot.c                                |   4 +-
+ target/riscv/cpu.c                             |  10 +-
+ target/riscv/cpu_helper.c                      |  37 +++---
+ target/riscv/csr.c                             |  71 +++++++++--
+ target/riscv/debug.c                           |   3 +
+ target/riscv/gdbstub.c                         |   8 +-
+ target/riscv/kvm/kvm-cpu.c                     | 157 ++++++++++++++++++++++++-
+ target/riscv/op_helper.c                       |  17 ++-
+ target/riscv/tcg/tcg-cpu.c                     |  50 +++++---
+ target/riscv/th_csr.c                          |  79 +++++++++++++
+ target/riscv/translate.c                       |  31 +++--
+ target/riscv/vector_internals.c                |  22 ++++
+ target/riscv/insn_trans/trans_privileged.c.inc |   2 +
+ target/riscv/insn_trans/trans_rvv.c.inc        |  46 +++++---
+ target/riscv/insn_trans/trans_rvzawrs.c.inc    |  29 +++--
+ target/riscv/insn_trans/trans_rvzicbo.c.inc    |  16 ++-
+ target/riscv/meson.build                       |   1 +
+files changed, 596 insertions(+), 109 deletions(-)
+ create mode 100644 target/riscv/th_csr.c

-[PULL 61/63] target/riscv: vector register gather instruction
+[PULL 01/28] hw/intc/riscv_aplic: APLICs should add child earlier than realize
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: "yang.zhang" <yang.zhang@hexintek.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Since only root APLICs can have hw IRQ lines, aplic->parent should
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+be initialized first.
-Message-id: 20200623215920.2594-60-zhiwei_liu@c-sky.com
 Fixes: e8f79343cf ("hw/intc: Add RISC-V AIA APLIC device emulation")
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Signed-off-by: yang.zhang <yang.zhang@hexintek.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240409014445.278-1-gaoshanliukou@163.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  9 +++
+ hw/intc/riscv_aplic.c | 8 ++++----
- target/riscv/insn32.decode              |  3 +
+file changed, 4 insertions(+), 4 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 78 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 60 +++++++++++++++++++
 files changed, 150 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/intc/riscv_aplic.c b/hw/intc/riscv_aplic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/intc/riscv_aplic.c
-+++ b/target/riscv/helper.h
++++ b/hw/intc/riscv_aplic.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vslide1down_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DeviceState *riscv_aplic_create(hwaddr addr, hwaddr size,
- DEF_HELPER_6(vslide1down_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+     qdev_prop_set_bit(dev, "msimode", msimode);
- DEF_HELPER_6(vslide1down_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+     qdev_prop_set_bit(dev, "mmode", mmode);
- DEF_HELPER_6(vslide1down_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
++    if (parent) {
-+DEF_HELPER_6(vrgather_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++        riscv_aplic_add_child(parent, dev);
 +DEF_HELPER_6(vrgather_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vslide1up_vx    001110 . ..... ..... 110 ..... 1010111 @r_vm
  vslidedown_vx   001111 . ..... ..... 100 ..... 1010111 @r_vm
  vslidedown_vi   001111 . ..... ..... 011 ..... 1010111 @r_vm
  vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
 +vrgather_vv     001100 . ..... ..... 000 ..... 1010111 @r_vm
 +vrgather_vx     001100 . ..... ..... 100 ..... 1010111 @r_vm
 +vrgather_vi     001100 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vslideup_vi, 1, vslideup_vx, slideup_check)
  GEN_OPIVX_TRANS(vslidedown_vx, opivx_check)
  GEN_OPIVX_TRANS(vslide1down_vx, opivx_check)
  GEN_OPIVI_TRANS(vslidedown_vi, 1, vslidedown_vx, opivx_check)
 +
 +/* Vector Register Gather Instruction */
 +static bool vrgather_vv_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2) && (a->rd != a->rs1));
 +}
 +
 +GEN_OPIVV_TRANS(vrgather_vv, vrgather_vv_check)
 +
 +static bool vrgather_vx_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2));
 +}
 +
 +/* vrgather.vx vd, vs2, rs1, vm # vd[i] = (x[rs1] >= VLMAX) ? 0 : vs2[rs1] */
 +static bool trans_vrgather_vx(DisasContext *s, arg_rmrr *a)
 +{
 +    if (!vrgather_vx_check(s, a)) {
 +        return false;
 +    }
 +
-+    if (a->vm && s->vl_eq_vlmax) {
+     sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
-+        int vlmax = s->vlen / s->mlen;
-+        TCGv_i64 dest = tcg_temp_new_i64();
+     if (!is_kvm_aia(msimode)) {
-+
+         sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
-+        if (a->rs1 == 0) {
+     }
-+            vec_element_loadi(s, dest, a->rs2, 0);
-+        } else {
+-    if (parent) {
-+            vec_element_loadx(s, dest, a->rs2, cpu_gpr[a->rs1], vlmax);
+-        riscv_aplic_add_child(parent, dev);
-+        }
+-    }
-+
+-
-+        tcg_gen_gvec_dup_i64(s->sew, vreg_ofs(s, a->rd),
+     if (!msimode) {
-+                             MAXSZ(s), MAXSZ(s), dest);
+         for (i = 0; i < num_harts; i++) {
-+        tcg_temp_free_i64(dest);
+             CPUState *cpu = cpu_by_arch_id(hartid_base + i);
 +    } else {
 +        static gen_helper_opivx * const fns[4] = {
 +            gen_helper_vrgather_vx_b, gen_helper_vrgather_vx_h,
 +            gen_helper_vrgather_vx_w, gen_helper_vrgather_vx_d
 +        };
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);
 +    }
 +    return true;
 +}
 +
 +/* vrgather.vi vd, vs2, imm, vm # vd[i] = (imm >= VLMAX) ? 0 : vs2[imm] */
 +static bool trans_vrgather_vi(DisasContext *s, arg_rmrr *a)
 +{
 +    if (!vrgather_vx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        if (a->rs1 >= s->vlen / s->mlen) {
 +            tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd),
 +                                 MAXSZ(s), MAXSZ(s), 0);
 +        } else {
 +            tcg_gen_gvec_dup_mem(s->sew, vreg_ofs(s, a->rd),
 +                                 endian_ofs(s, a->rs2, a->rs1),
 +                                 MAXSZ(s), MAXSZ(s));
 +        }
 +    } else {
 +        static gen_helper_opivx * const fns[4] = {
 +            gen_helper_vrgather_vx_b, gen_helper_vrgather_vx_h,
 +            gen_helper_vrgather_vx_w, gen_helper_vrgather_vx_d
 +        };
 +        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s, 1);
 +    }
 +    return true;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_b, uint8_t, H1, clearb)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_h, uint16_t, H2, clearh)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_w, uint32_t, H4, clearl)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_d, uint64_t, H8, clearq)
 +
 +/* Vector Register Gather Instruction */
 +#define GEN_VEXT_VRGATHER_VV(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,               \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t index, i;                                                    \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        index = *((ETYPE *)vs1 + H(i));                                   \
 +        if (index >= vlmax) {                                             \
 +            *((ETYPE *)vd + H(i)) = 0;                                    \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(index));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vd[i] = (vs1[i] >= VLMAX) ? 0 : vs2[vs1[i]]; */
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_b, uint8_t, H1, clearb)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_h, uint16_t, H2, clearh)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_w, uint32_t, H4, clearl)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VRGATHER_VX(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t index = s1, i;                                               \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (index >= vlmax) {                                             \
 +            *((ETYPE *)vd + H(i)) = 0;                                    \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(index));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vd[i] = (x[rs1] >= VLMAX) ? 0 : vs2[rs1] */
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_d, uint64_t, H8, clearq)
 --
-.27.0
+.45.1

-[PULL 26/63] target/riscv: vector single-width saturating add and subtract
+[PULL 02/28] target/riscv/kvm: Fix exposure of Zkr
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Andrew Jones <ajones@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The Zkr extension may only be exposed to KVM guests if the VMM
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+implements the SEED CSR. Use the same implementation as TCG.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-25-zhiwei_liu@c-sky.com
+Without this patch, running with a KVM which does not forward the
 SEED CSR access to QEMU will result in an ILL exception being
 injected into the guest (this results in Linux guests crashing on
 boot). And, when running with a KVM which does forward the access,
 QEMU will crash, since QEMU doesn't know what to do with the exit.
 Fixes: 3108e2f1c69d ("target/riscv/kvm: update KVM exts to Linux 6.8")
 Signed-off-by: Andrew Jones <ajones@ventanamicro.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240422134605.534207-2-ajones@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  33 ++
+ target/riscv/cpu.h         |  3 +++
- target/riscv/insn32.decode              |  10 +
+ target/riscv/csr.c         | 18 ++++++++++++++----
- target/riscv/insn_trans/trans_rvv.inc.c |  16 +
+ target/riscv/kvm/kvm-cpu.c | 25 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 385 ++++++++++++++++++++++++
+files changed, 42 insertions(+), 4 deletions(-)
 files changed, 444 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vmv_v_x_b, void, ptr, i64, env, i32)
+@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops);
- DEF_HELPER_4(vmv_v_x_h, void, ptr, i64, env, i32)
- DEF_HELPER_4(vmv_v_x_w, void, ptr, i64, env, i32)
+ void riscv_cpu_register_gdb_regs_for_features(CPUState *cs);
- DEF_HELPER_4(vmv_v_x_d, void, ptr, i64, env, i32)
 +target_ulong riscv_new_csr_seed(target_ulong new_value,
 +                                target_ulong write_mask);
 +
-+DEF_HELPER_6(vsaddu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+ uint8_t satp_mode_max_from_map(uint32_t map);
-+DEF_HELPER_6(vsaddu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+ const char *satp_mode_str(uint8_t satp_mode, bool is_32_bit);
-+DEF_HELPER_6(vsaddu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsaddu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 +DEF_HELPER_6(vsadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/csr.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ vmv_v_i         010111 1 00000 ..... 011 ..... 1010111 @r2
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_upmbase(CPURISCVState *env, int csrno,
- vmerge_vvm      010111 0 ..... ..... 000 ..... 1010111 @r_vm_0
+ #endif
- vmerge_vxm      010111 0 ..... ..... 100 ..... 1010111 @r_vm_0
- vmerge_vim      010111 0 ..... ..... 011 ..... 1010111 @r_vm_0
+ /* Crypto Extension */
-+vsaddu_vv       100000 . ..... ..... 000 ..... 1010111 @r_vm
+-static RISCVException rmw_seed(CPURISCVState *env, int csrno,
-+vsaddu_vx       100000 . ..... ..... 100 ..... 1010111 @r_vm
+-                               target_ulong *ret_value,
-+vsaddu_vi       100000 . ..... ..... 011 ..... 1010111 @r_vm
+-                               target_ulong new_value,
-+vsadd_vv        100001 . ..... ..... 000 ..... 1010111 @r_vm
+-                               target_ulong write_mask)
-+vsadd_vx        100001 . ..... ..... 100 ..... 1010111 @r_vm
++target_ulong riscv_new_csr_seed(target_ulong new_value,
-+vsadd_vi        100001 . ..... ..... 011 ..... 1010111 @r_vm
++                                target_ulong write_mask)
-+vssubu_vv       100010 . ..... ..... 000 ..... 1010111 @r_vm
+ {
-+vssubu_vx       100010 . ..... ..... 100 ..... 1010111 @r_vm
+     uint16_t random_v;
-+vssub_vv        100011 . ..... ..... 000 ..... 1010111 @r_vm
+     Error *random_e = NULL;
-+vssub_vx        100011 . ..... ..... 100 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ static RISCVException rmw_seed(CPURISCVState *env, int csrno,
+         rval = random_v | SEED_OPST_ES16;
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+     }
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++    return rval;
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
  GEN_OPIVV_TRANS(vmerge_vvm, opivv_vadc_check)
  GEN_OPIVX_TRANS(vmerge_vxm, opivx_vadc_check)
  GEN_OPIVI_TRANS(vmerge_vim, 0, vmerge_vxm, opivx_vadc_check)
 +
 +/*
 + *** Vector Fixed-Point Arithmetic Instructions
 + */
 +
 +/* Vector Single-Width Saturating Add and Subtract */
 +GEN_OPIVV_TRANS(vsaddu_vv, opivv_check)
 +GEN_OPIVV_TRANS(vsadd_vv,  opivv_check)
 +GEN_OPIVV_TRANS(vssubu_vv, opivv_check)
 +GEN_OPIVV_TRANS(vssub_vv,  opivv_check)
 +GEN_OPIVX_TRANS(vsaddu_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vsadd_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vssubu_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vssub_vx,  opivx_check)
 +GEN_OPIVI_TRANS(vsaddu_vi, 1, vsaddu_vx, opivx_check)
 +GEN_OPIVI_TRANS(vsadd_vi, 0, vsadd_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VMERGE_VX(vmerge_vxm_b, int8_t,  H1, clearb)
  GEN_VEXT_VMERGE_VX(vmerge_vxm_h, int16_t, H2, clearh)
  GEN_VEXT_VMERGE_VX(vmerge_vxm_w, int32_t, H4, clearl)
  GEN_VEXT_VMERGE_VX(vmerge_vxm_d, int64_t, H8, clearq)
 +
 +/*
 + *** Vector Fixed-Point Arithmetic Instructions
 + */
 +
 +/* Vector Single-Width Saturating Add and Subtract */
 +
 +/*
 + * As fixed point instructions probably have round mode and saturation,
 + * define common macros for fixed point here.
 + */
 +typedef void opivv2_rm_fn(void *vd, void *vs1, void *vs2, int i,
 +                          CPURISCVState *env, int vxrm);
 +
 +#define OPIVV2_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)     \
 +static inline void                                                  \
 +do_##NAME(void *vd, void *vs1, void *vs2, int i,                    \
 +          CPURISCVState *env, int vxrm)                             \
 +{                                                                   \
 +    TX1 s1 = *((T1 *)vs1 + HS1(i));                                 \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, s1);                    \
 +}
 +
-+static inline void
++static RISCVException rmw_seed(CPURISCVState *env, int csrno,
-+vext_vv_rm_1(void *vd, void *v0, void *vs1, void *vs2,
++                               target_ulong *ret_value,
-+             CPURISCVState *env,
++                               target_ulong new_value,
-+             uint32_t vl, uint32_t vm, uint32_t mlen, int vxrm,
++                               target_ulong write_mask)
 +             opivv2_rm_fn *fn)
 +{
-+    for (uint32_t i = 0; i < vl; i++) {
++    target_ulong rval;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, vs1, vs2, i, env, vxrm);
 +    }
 +}
 +
-+static inline void
++    rval = riscv_new_csr_seed(new_value, write_mask);
-+vext_vv_rm_2(void *vd, void *v0, void *vs1, void *vs2,
++
-+             CPURISCVState *env,
+     if (ret_value) {
-+             uint32_t desc, uint32_t esz, uint32_t dsz,
+         *ret_value = rval;
-+             opivv2_rm_fn *fn, clear_fn *clearfn)
+     }
 diff --git a/target/riscv/kvm/kvm-cpu.c b/target/riscv/kvm/kvm-cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/kvm/kvm-cpu.c
 +++ b/target/riscv/kvm/kvm-cpu.c
@@ -XXX,XX +XXX,XX @@ static int kvm_riscv_handle_sbi(CPUState *cs, struct kvm_run *run)
      return ret;
  }
 +static int kvm_riscv_handle_csr(CPUState *cs, struct kvm_run *run)
 +{
-+    uint32_t vlmax = vext_maxsz(desc) / esz;
++    target_ulong csr_num = run->riscv_csr.csr_num;
-+    uint32_t mlen = vext_mlen(desc);
++    target_ulong new_value = run->riscv_csr.new_value;
-+    uint32_t vm = vext_vm(desc);
++    target_ulong write_mask = run->riscv_csr.write_mask;
-+    uint32_t vl = env->vl;
++    int ret = 0;
 +
-+    switch (env->vxrm) {
++    switch (csr_num) {
-+    case 0: /* rnu */
++    case CSR_SEED:
-+        vext_vv_rm_1(vd, v0, vs1, vs2,
++        run->riscv_csr.ret_value = riscv_new_csr_seed(new_value, write_mask);
 +                     env, vl, vm, mlen, 0, fn);
 +        break;
-+    case 1: /* rne */
++    default:
-+        vext_vv_rm_1(vd, v0, vs1, vs2,
++        qemu_log_mask(LOG_UNIMP,
-+                     env, vl, vm, mlen, 1, fn);
++                      "%s: un-handled CSR EXIT for CSR %lx\n",
-+        break;
++                      __func__, csr_num);
-+    case 2: /* rdn */
++        ret = -1;
 +        vext_vv_rm_1(vd, v0, vs1, vs2,
 +                     env, vl, vm, mlen, 2, fn);
 +        break;
 +    default: /* rod */
 +        vext_vv_rm_1(vd, v0, vs1, vs2,
 +                     env, vl, vm, mlen, 3, fn);
 +        break;
 +    }
 +
-+    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++    return ret;
 +}
 +
-+/* generate helpers for fixed point instructions with OPIVV format */
+ int kvm_arch_handle_exit(CPUState *cs, struct kvm_run *run)
-+#define GEN_VEXT_VV_RM(NAME, ESZ, DSZ, CLEAR_FN)                \
+ {
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,     \
+     int ret = 0;
-+                  CPURISCVState *env, uint32_t desc)            \
+@@ -XXX,XX +XXX,XX @@ int kvm_arch_handle_exit(CPUState *cs, struct kvm_run *run)
-+{                                                               \
+     case KVM_EXIT_RISCV_SBI:
-+    vext_vv_rm_2(vd, v0, vs1, vs2, env, desc, ESZ, DSZ,         \
+         ret = kvm_riscv_handle_sbi(cs, run);
-+                 do_##NAME, CLEAR_FN);                          \
+         break;
-+}
++    case KVM_EXIT_RISCV_CSR:
-+
++        ret = kvm_riscv_handle_csr(cs, run);
 +static inline uint8_t saddu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
 +{
 +    uint8_t res = a + b;
 +    if (res < a) {
 +        res = UINT8_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint16_t saddu16(CPURISCVState *env, int vxrm, uint16_t a,
 +                               uint16_t b)
 +{
 +    uint16_t res = a + b;
 +    if (res < a) {
 +        res = UINT16_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint32_t saddu32(CPURISCVState *env, int vxrm, uint32_t a,
 +                               uint32_t b)
 +{
 +    uint32_t res = a + b;
 +    if (res < a) {
 +        res = UINT32_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint64_t saddu64(CPURISCVState *env, int vxrm, uint64_t a,
 +                               uint64_t b)
 +{
 +    uint64_t res = a + b;
 +    if (res < a) {
 +        res = UINT64_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vsaddu_vv_b, OP_UUU_B, H1, H1, H1, saddu8)
 +RVVCALL(OPIVV2_RM, vsaddu_vv_h, OP_UUU_H, H2, H2, H2, saddu16)
 +RVVCALL(OPIVV2_RM, vsaddu_vv_w, OP_UUU_W, H4, H4, H4, saddu32)
 +RVVCALL(OPIVV2_RM, vsaddu_vv_d, OP_UUU_D, H8, H8, H8, saddu64)
 +GEN_VEXT_VV_RM(vsaddu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vsaddu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vsaddu_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vsaddu_vv_d, 8, 8, clearq)
 +
 +typedef void opivx2_rm_fn(void *vd, target_long s1, void *vs2, int i,
 +                          CPURISCVState *env, int vxrm);
 +
 +#define OPIVX2_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)          \
 +static inline void                                                  \
 +do_##NAME(void *vd, target_long s1, void *vs2, int i,               \
 +          CPURISCVState *env, int vxrm)                             \
 +{                                                                   \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, (TX1)(T1)s1);           \
 +}
 +
 +static inline void
 +vext_vx_rm_1(void *vd, void *v0, target_long s1, void *vs2,
 +             CPURISCVState *env,
 +             uint32_t vl, uint32_t vm, uint32_t mlen, int vxrm,
 +             opivx2_rm_fn *fn)
 +{
 +    for (uint32_t i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, s1, vs2, i, env, vxrm);
 +    }
 +}
 +
 +static inline void
 +vext_vx_rm_2(void *vd, void *v0, target_long s1, void *vs2,
 +             CPURISCVState *env,
 +             uint32_t desc, uint32_t esz, uint32_t dsz,
 +             opivx2_rm_fn *fn, clear_fn *clearfn)
 +{
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +
 +    switch (env->vxrm) {
 +    case 0: /* rnu */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 0, fn);
 +        break;
-+    case 1: /* rne */
+     default:
-+        vext_vx_rm_1(vd, v0, s1, vs2,
+         qemu_log_mask(LOG_UNIMP, "%s: un-handled exit reason %d\n",
-+                     env, vl, vm, mlen, 1, fn);
+                       __func__, run->exit_reason);
 +        break;
 +    case 2: /* rdn */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 2, fn);
 +        break;
 +    default: /* rod */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 3, fn);
 +        break;
 +    }
 +
 +    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
 +}
 +
 +/* generate helpers for fixed point instructions with OPIVX format */
 +#define GEN_VEXT_VX_RM(NAME, ESZ, DSZ, CLEAR_FN)          \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
 +        void *vs2, CPURISCVState *env, uint32_t desc)     \
 +{                                                         \
 +    vext_vx_rm_2(vd, v0, s1, vs2, env, desc, ESZ, DSZ,    \
 +                 do_##NAME, CLEAR_FN);                    \
 +}
 +
 +RVVCALL(OPIVX2_RM, vsaddu_vx_b, OP_UUU_B, H1, H1, saddu8)
 +RVVCALL(OPIVX2_RM, vsaddu_vx_h, OP_UUU_H, H2, H2, saddu16)
 +RVVCALL(OPIVX2_RM, vsaddu_vx_w, OP_UUU_W, H4, H4, saddu32)
 +RVVCALL(OPIVX2_RM, vsaddu_vx_d, OP_UUU_D, H8, H8, saddu64)
 +GEN_VEXT_VX_RM(vsaddu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vsaddu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vsaddu_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vsaddu_vx_d, 8, 8, clearq)
 +
 +static inline int8_t sadd8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
 +{
 +    int8_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT8_MIN) {
 +        res = a > 0 ? INT8_MAX : INT8_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int16_t sadd16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
 +{
 +    int16_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT16_MIN) {
 +        res = a > 0 ? INT16_MAX : INT16_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int32_t sadd32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    int32_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT32_MIN) {
 +        res = a > 0 ? INT32_MAX : INT32_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int64_t sadd64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    int64_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT64_MIN) {
 +        res = a > 0 ? INT64_MAX : INT64_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vsadd_vv_b, OP_SSS_B, H1, H1, H1, sadd8)
 +RVVCALL(OPIVV2_RM, vsadd_vv_h, OP_SSS_H, H2, H2, H2, sadd16)
 +RVVCALL(OPIVV2_RM, vsadd_vv_w, OP_SSS_W, H4, H4, H4, sadd32)
 +RVVCALL(OPIVV2_RM, vsadd_vv_d, OP_SSS_D, H8, H8, H8, sadd64)
 +GEN_VEXT_VV_RM(vsadd_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vsadd_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vsadd_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vsadd_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vsadd_vx_b, OP_SSS_B, H1, H1, sadd8)
 +RVVCALL(OPIVX2_RM, vsadd_vx_h, OP_SSS_H, H2, H2, sadd16)
 +RVVCALL(OPIVX2_RM, vsadd_vx_w, OP_SSS_W, H4, H4, sadd32)
 +RVVCALL(OPIVX2_RM, vsadd_vx_d, OP_SSS_D, H8, H8, sadd64)
 +GEN_VEXT_VX_RM(vsadd_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vsadd_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vsadd_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vsadd_vx_d, 8, 8, clearq)
 +
 +static inline uint8_t ssubu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
 +{
 +    uint8_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint16_t ssubu16(CPURISCVState *env, int vxrm, uint16_t a,
 +                               uint16_t b)
 +{
 +    uint16_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint32_t ssubu32(CPURISCVState *env, int vxrm, uint32_t a,
 +                               uint32_t b)
 +{
 +    uint32_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint64_t ssubu64(CPURISCVState *env, int vxrm, uint64_t a,
 +                               uint64_t b)
 +{
 +    uint64_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vssubu_vv_b, OP_UUU_B, H1, H1, H1, ssubu8)
 +RVVCALL(OPIVV2_RM, vssubu_vv_h, OP_UUU_H, H2, H2, H2, ssubu16)
 +RVVCALL(OPIVV2_RM, vssubu_vv_w, OP_UUU_W, H4, H4, H4, ssubu32)
 +RVVCALL(OPIVV2_RM, vssubu_vv_d, OP_UUU_D, H8, H8, H8, ssubu64)
 +GEN_VEXT_VV_RM(vssubu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vssubu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vssubu_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vssubu_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vssubu_vx_b, OP_UUU_B, H1, H1, ssubu8)
 +RVVCALL(OPIVX2_RM, vssubu_vx_h, OP_UUU_H, H2, H2, ssubu16)
 +RVVCALL(OPIVX2_RM, vssubu_vx_w, OP_UUU_W, H4, H4, ssubu32)
 +RVVCALL(OPIVX2_RM, vssubu_vx_d, OP_UUU_D, H8, H8, ssubu64)
 +GEN_VEXT_VX_RM(vssubu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vssubu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vssubu_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vssubu_vx_d, 8, 8, clearq)
 +
 +static inline int8_t ssub8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
 +{
 +    int8_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT8_MIN) {
 +        res = a > 0 ? INT8_MAX : INT8_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int16_t ssub16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
 +{
 +    int16_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT16_MIN) {
 +        res = a > 0 ? INT16_MAX : INT16_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int32_t ssub32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    int32_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT32_MIN) {
 +        res = a > 0 ? INT32_MAX : INT32_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int64_t ssub64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    int64_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT64_MIN) {
 +        res = a > 0 ? INT64_MAX : INT64_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vssub_vv_b, OP_SSS_B, H1, H1, H1, ssub8)
 +RVVCALL(OPIVV2_RM, vssub_vv_h, OP_SSS_H, H2, H2, H2, ssub16)
 +RVVCALL(OPIVV2_RM, vssub_vv_w, OP_SSS_W, H4, H4, H4, ssub32)
 +RVVCALL(OPIVV2_RM, vssub_vv_d, OP_SSS_D, H8, H8, H8, ssub64)
 +GEN_VEXT_VV_RM(vssub_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vssub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vssub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vssub_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vssub_vx_b, OP_SSS_B, H1, H1, ssub8)
 +RVVCALL(OPIVX2_RM, vssub_vx_h, OP_SSS_H, H2, H2, ssub16)
 +RVVCALL(OPIVX2_RM, vssub_vx_w, OP_SSS_W, H4, H4, ssub32)
 +RVVCALL(OPIVX2_RM, vssub_vx_d, OP_SSS_D, H8, H8, ssub64)
 +GEN_VEXT_VX_RM(vssub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vssub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vssub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vssub_vx_d, 8, 8, clearq)
 --
-.27.0
+.45.1

-[PULL 12/63] target/riscv: vector single-width integer add and subtract
+[PULL 03/28] target/riscv: Raise exceptions on wrs.nto
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Andrew Jones <ajones@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Implementing wrs.nto to always just return is consistent with the
 specification, as the instruction is permitted to terminate the
 stall for any reason, but it's not useful for virtualization, where
 we'd like the guest to trap to the hypervisor in order to allow
 scheduling of the lock holding VCPU. Change to always immediately
 raise exceptions when the appropriate conditions are present,
 otherwise continue to just return. Note, immediately raising
 exceptions is also consistent with the specification since the
 time limit that should expire prior to the exception is
 implementation-specific.
 Signed-off-by: Andrew Jones <ajones@ventanamicro.com>
 Reviewed-by: Christoph Müllner <christoph.muellner@vrull.eu>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20240424142808.62936-2-ajones@ventanamicro.com>
 Message-id: 20200623215920.2594-11-zhiwei_liu@c-sky.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  25 ++
+ target/riscv/helper.h                       |  1 +
- target/riscv/insn32.decode              |  10 +
+ target/riscv/op_helper.c                    | 11 ++++++++
- target/riscv/insn_trans/trans_rvv.inc.c | 291 ++++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvzawrs.c.inc | 29 ++++++++++++++-------
- target/riscv/vector_helper.c            | 183 +++++++++++++++
+files changed, 32 insertions(+), 9 deletions(-)
 files changed, 509 insertions(+)
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vamominw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(csrrw_i128, tl, env, int, tl, tl, tl, tl)
- DEF_HELPER_6(vamomaxw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_1(sret, tl, env)
- DEF_HELPER_6(vamominuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_1(mret, tl, env)
- DEF_HELPER_6(vamomaxuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_1(wfi, void, env)
-+
++DEF_HELPER_1(wrs_nto, void, env)
-+DEF_HELPER_6(vadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_1(tlb_flush, void, env)
-+DEF_HELPER_6(vadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_1(tlb_flush_all, void, env)
-+DEF_HELPER_6(vadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+ /* Native Debug */
-+DEF_HELPER_6(vadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+diff --git a/target/riscv/op_helper.c b/target/riscv/op_helper.c
 +DEF_HELPER_6(vsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs8, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs16, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs32, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs64, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/op_helper.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/op_helper.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void helper_wfi(CPURISCVState *env)
- &u    imm rd
+     }
- &shift     shamt rs1 rd
+ }
- &atomic    aq rl rs2 rs1 rd
-+&rmrr      vm rd rs1 rs2
++void helper_wrs_nto(CPURISCVState *env)
  &rwdvm     vm wd rd rs1 rs2
  &r2nfvm    vm rd rs1 nf
  &rnfvm     vm rd rs1 rs2 nf
@@ -XXX,XX +XXX,XX @@
  @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
  @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
  @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
 +@r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
  @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
  @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
@@ -XXX,XX +XXX,XX @@ vamominuw_v     11000 . . ..... ..... 110 ..... 0101111 @r_wdvm
  vamomaxuw_v     11100 . . ..... ..... 110 ..... 0101111 @r_wdvm
  # *** new major opcode OP-V ***
 +vadd_vv         000000 . ..... ..... 000 ..... 1010111 @r_vm
 +vadd_vx         000000 . ..... ..... 100 ..... 1010111 @r_vm
 +vadd_vi         000000 . ..... ..... 011 ..... 1010111 @r_vm
 +vsub_vv         000010 . ..... ..... 000 ..... 1010111 @r_vm
 +vsub_vx         000010 . ..... ..... 100 ..... 1010111 @r_vm
 +vrsub_vx        000011 . ..... ..... 100 ..... 1010111 @r_vm
 +vrsub_vi        000011 . ..... ..... 011 ..... 1010111 @r_vm
 +
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vamomaxd_v, 15, rwdvm, amo_op, amo_check)
  GEN_VEXT_TRANS(vamominud_v, 16, rwdvm, amo_op, amo_check)
  GEN_VEXT_TRANS(vamomaxud_v, 17, rwdvm, amo_op, amo_check)
  #endif
 +
 +/*
 + *** Vector Integer Arithmetic Instructions
 + */
 +#define MAXSZ(s) (s->vlen >> (3 - s->lmul))
 +
 +static bool opivv_check(DisasContext *s, arg_rmrr *a)
 +{
-+    return (vext_check_isa_ill(s) &&
++    if (env->virt_enabled && (env->priv == PRV_S || env->priv == PRV_U) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++        get_field(env->hstatus, HSTATUS_VTW) &&
-+            vext_check_reg(s, a->rd, false) &&
++        !get_field(env->mstatus, MSTATUS_TW)) {
-+            vext_check_reg(s, a->rs2, false) &&
++        riscv_raise_exception(env, RISCV_EXCP_VIRT_INSTRUCTION_FAULT, GETPC());
-+            vext_check_reg(s, a->rs1, false));
++    } else if (env->priv != PRV_M && get_field(env->mstatus, MSTATUS_TW)) {
-+}
++        riscv_raise_exception(env, RISCV_EXCP_ILLEGAL_INST, GETPC());
 +
 +typedef void GVecGen3Fn(unsigned, uint32_t, uint32_t,
 +                        uint32_t, uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
 +              gen_helper_gvec_4_ptr *fn)
 +{
 +    TCGLabel *over = gen_new_label();
 +    if (!opivv_check(s, a)) {
 +        return false;
 +    }
 +
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        gvec_fn(s->sew, vreg_ofs(s, a->rd),
 +                vreg_ofs(s, a->rs2), vreg_ofs(s, a->rs1),
 +                MAXSZ(s), MAXSZ(s));
 +    } else {
 +        uint32_t data = 0;
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1), vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8, data, fn);
 +    }
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +/* OPIVV with GVEC IR */
 +#define GEN_OPIVV_GVEC_TRANS(NAME, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
 +{                                                                  \
 +    static gen_helper_gvec_4_ptr * const fns[4] = {                \
 +        gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
 +        gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
 +    };                                                             \
 +    return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
 +}
 +
 +GEN_OPIVV_GVEC_TRANS(vadd_vv, add)
 +GEN_OPIVV_GVEC_TRANS(vsub_vv, sub)
 +
 +typedef void gen_helper_opivx(TCGv_ptr, TCGv_ptr, TCGv, TCGv_ptr,
 +                              TCGv_env, TCGv_i32);
 +
 +static bool opivx_trans(uint32_t vd, uint32_t rs1, uint32_t vs2, uint32_t vm,
 +                        gen_helper_opivx *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, src2, mask;
 +    TCGv src1;
 +    TCGv_i32 desc;
 +    uint32_t data = 0;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    src2 = tcg_temp_new_ptr();
 +    src1 = tcg_temp_new();
 +    gen_get_gpr(src1, rs1);
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, src1, src2, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(src2);
 +    tcg_temp_free(src1);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool opivx_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false));
 +}
 +
 +typedef void GVecGen2sFn(unsigned, uint32_t, uint32_t, TCGv_i64,
 +                         uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivx_gvec(DisasContext *s, arg_rmrr *a, GVecGen2sFn *gvec_fn,
 +              gen_helper_opivx *fn)
 +{
 +    if (!opivx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        TCGv_i64 src1 = tcg_temp_new_i64();
 +        TCGv tmp = tcg_temp_new();
 +
 +        gen_get_gpr(tmp, a->rs1);
 +        tcg_gen_ext_tl_i64(src1, tmp);
 +        gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                src1, MAXSZ(s), MAXSZ(s));
 +
 +        tcg_temp_free_i64(src1);
 +        tcg_temp_free(tmp);
 +        return true;
 +    }
 +    return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +}
 +
 +/* OPIVX with GVEC IR */
 +#define GEN_OPIVX_GVEC_TRANS(NAME, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
 +{                                                                  \
 +    static gen_helper_opivx * const fns[4] = {                     \
 +        gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
 +        gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
 +    };                                                             \
 +    return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
 +}
 +
 +GEN_OPIVX_GVEC_TRANS(vadd_vx, adds)
 +GEN_OPIVX_GVEC_TRANS(vsub_vx, subs)
 +
 +static void gen_vec_rsub8_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    tcg_gen_vec_sub8_i64(d, b, a);
 +}
 +
 +static void gen_vec_rsub16_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    tcg_gen_vec_sub8_i64(d, b, a);
 +}
 +
 +static void gen_rsub_i32(TCGv_i32 ret, TCGv_i32 arg1, TCGv_i32 arg2)
 +{
 +    tcg_gen_sub_i32(ret, arg2, arg1);
 +}
 +
 +static void gen_rsub_i64(TCGv_i64 ret, TCGv_i64 arg1, TCGv_i64 arg2)
 +{
 +    tcg_gen_sub_i64(ret, arg2, arg1);
 +}
 +
 +static void gen_rsub_vec(unsigned vece, TCGv_vec r, TCGv_vec a, TCGv_vec b)
 +{
 +    tcg_gen_sub_vec(vece, r, b, a);
 +}
 +
 +static void tcg_gen_gvec_rsubs(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                               TCGv_i64 c, uint32_t oprsz, uint32_t maxsz)
 +{
 +    static const GVecGen2s rsub_op[4] = {
 +        { .fni8 = gen_vec_rsub8_i64,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs8,
 +          .vece = MO_8 },
 +        { .fni8 = gen_vec_rsub16_i64,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs16,
 +          .vece = MO_16 },
 +        { .fni4 = gen_rsub_i32,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs32,
 +          .vece = MO_32 },
 +        { .fni8 = gen_rsub_i64,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs64,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .vece = MO_64 },
 +    };
 +
 +    tcg_debug_assert(vece <= MO_64);
 +    tcg_gen_gvec_2s(dofs, aofs, oprsz, maxsz, c, &rsub_op[vece]);
 +}
 +
 +GEN_OPIVX_GVEC_TRANS(vrsub_vx, rsubs)
 +
 +static bool opivi_trans(uint32_t vd, uint32_t imm, uint32_t vs2, uint32_t vm,
 +                        gen_helper_opivx *fn, DisasContext *s, int zx)
 +{
 +    TCGv_ptr dest, src2, mask;
 +    TCGv src1;
 +    TCGv_i32 desc;
 +    uint32_t data = 0;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    src2 = tcg_temp_new_ptr();
 +    if (zx) {
 +        src1 = tcg_const_tl(imm);
 +    } else {
 +        src1 = tcg_const_tl(sextract64(imm, 0, 5));
 +    }
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, src1, src2, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(src2);
 +    tcg_temp_free(src1);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +typedef void GVecGen2iFn(unsigned, uint32_t, uint32_t, int64_t,
 +                         uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivi_gvec(DisasContext *s, arg_rmrr *a, GVecGen2iFn *gvec_fn,
 +              gen_helper_opivx *fn, int zx)
 +{
 +    if (!opivx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        if (zx) {
 +            gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                    extract64(a->rs1, 0, 5), MAXSZ(s), MAXSZ(s));
 +        } else {
 +            gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                    sextract64(a->rs1, 0, 5), MAXSZ(s), MAXSZ(s));
 +        }
 +    } else {
 +        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s, zx);
 +    }
 +    return true;
 +}
 +
 +/* OPIVI with GVEC IR */
 +#define GEN_OPIVI_GVEC_TRANS(NAME, ZX, OPIVX, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
 +{                                                                  \
 +    static gen_helper_opivx * const fns[4] = {                     \
 +        gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,            \
 +        gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,            \
 +    };                                                             \
 +    return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF,                 \
 +                         fns[s->sew], ZX);                         \
 +}
 +
 +GEN_OPIVI_GVEC_TRANS(vadd_vi, 0, vadd_vx, addi)
 +
 +static void tcg_gen_gvec_rsubi(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                               int64_t c, uint32_t oprsz, uint32_t maxsz)
 +{
 +    TCGv_i64 tmp = tcg_const_i64(c);
 +    tcg_gen_gvec_rsubs(vece, dofs, aofs, tmp, oprsz, maxsz);
 +    tcg_temp_free_i64(tmp);
 +}
 +
 +GEN_OPIVI_GVEC_TRANS(vrsub_vi, 0, vrsub_vx, rsubi)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamominw_v_w,  int32_t,  int32_t,  idx_w, clearl)
  GEN_VEXT_AMO(vamomaxw_v_w,  int32_t,  int32_t,  idx_w, clearl)
  GEN_VEXT_AMO(vamominuw_v_w, uint32_t, uint32_t, idx_w, clearl)
  GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
 +
 +/*
 + *** Vector Integer Arithmetic Instructions
 + */
 +
 +/* expand macro args before macro */
 +#define RVVCALL(macro, ...)  macro(__VA_ARGS__)
 +
 +/* (TD, T1, T2, TX1, TX2) */
 +#define OP_SSS_B int8_t, int8_t, int8_t, int8_t, int8_t
 +#define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
 +#define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
 +#define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
 +
 +/* operation of two vector elements */
 +typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
 +
 +#define OPIVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
 +static void do_##NAME(void *vd, void *vs1, void *vs2, int i)    \
 +{                                                               \
 +    TX1 s1 = *((T1 *)vs1 + HS1(i));                             \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                             \
 +    *((TD *)vd + HD(i)) = OP(s2, s1);                           \
 +}
 +#define DO_SUB(N, M) (N - M)
 +#define DO_RSUB(N, M) (M - N)
 +
 +RVVCALL(OPIVV2, vadd_vv_b, OP_SSS_B, H1, H1, H1, DO_ADD)
 +RVVCALL(OPIVV2, vadd_vv_h, OP_SSS_H, H2, H2, H2, DO_ADD)
 +RVVCALL(OPIVV2, vadd_vv_w, OP_SSS_W, H4, H4, H4, DO_ADD)
 +RVVCALL(OPIVV2, vadd_vv_d, OP_SSS_D, H8, H8, H8, DO_ADD)
 +RVVCALL(OPIVV2, vsub_vv_b, OP_SSS_B, H1, H1, H1, DO_SUB)
 +RVVCALL(OPIVV2, vsub_vv_h, OP_SSS_H, H2, H2, H2, DO_SUB)
 +RVVCALL(OPIVV2, vsub_vv_w, OP_SSS_W, H4, H4, H4, DO_SUB)
 +RVVCALL(OPIVV2, vsub_vv_d, OP_SSS_D, H8, H8, H8, DO_SUB)
 +
 +static void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
 +                       CPURISCVState *env, uint32_t desc,
 +                       uint32_t esz, uint32_t dsz,
 +                       opivv2_fn *fn, clear_fn *clearfn)
 +{
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    uint32_t i;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, vs1, vs2, i);
 +    }
 +    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
 +}
 +
 +/* generate the helpers for OPIVV */
 +#define GEN_VEXT_VV(NAME, ESZ, DSZ, CLEAR_FN)             \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
 +    do_vext_vv(vd, v0, vs1, vs2, env, desc, ESZ, DSZ,     \
 +               do_##NAME, CLEAR_FN);                      \
 +}
 +
 +GEN_VEXT_VV(vadd_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vadd_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vadd_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vadd_vv_d, 8, 8, clearq)
 +GEN_VEXT_VV(vsub_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vsub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vsub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vsub_vv_d, 8, 8, clearq)
 +
 +typedef void opivx2_fn(void *vd, target_long s1, void *vs2, int i);
 +
 +/*
 + * (T1)s1 gives the real operator type.
 + * (TX1)(T1)s1 expands the operator type of widen or narrow operations.
 + */
 +#define OPIVX2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
 +static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
 +{                                                                   \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1);                      \
 +}
 +
 +RVVCALL(OPIVX2, vadd_vx_b, OP_SSS_B, H1, H1, DO_ADD)
 +RVVCALL(OPIVX2, vadd_vx_h, OP_SSS_H, H2, H2, DO_ADD)
 +RVVCALL(OPIVX2, vadd_vx_w, OP_SSS_W, H4, H4, DO_ADD)
 +RVVCALL(OPIVX2, vadd_vx_d, OP_SSS_D, H8, H8, DO_ADD)
 +RVVCALL(OPIVX2, vsub_vx_b, OP_SSS_B, H1, H1, DO_SUB)
 +RVVCALL(OPIVX2, vsub_vx_h, OP_SSS_H, H2, H2, DO_SUB)
 +RVVCALL(OPIVX2, vsub_vx_w, OP_SSS_W, H4, H4, DO_SUB)
 +RVVCALL(OPIVX2, vsub_vx_d, OP_SSS_D, H8, H8, DO_SUB)
 +RVVCALL(OPIVX2, vrsub_vx_b, OP_SSS_B, H1, H1, DO_RSUB)
 +RVVCALL(OPIVX2, vrsub_vx_h, OP_SSS_H, H2, H2, DO_RSUB)
 +RVVCALL(OPIVX2, vrsub_vx_w, OP_SSS_W, H4, H4, DO_RSUB)
 +RVVCALL(OPIVX2, vrsub_vx_d, OP_SSS_D, H8, H8, DO_RSUB)
 +
 +static void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
 +                       CPURISCVState *env, uint32_t desc,
 +                       uint32_t esz, uint32_t dsz,
 +                       opivx2_fn fn, clear_fn *clearfn)
 +{
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    uint32_t i;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, s1, vs2, i);
 +    }
 +    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
 +}
 +
 +/* generate the helpers for OPIVX */
 +#define GEN_VEXT_VX(NAME, ESZ, DSZ, CLEAR_FN)             \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
 +    do_vext_vx(vd, v0, s1, vs2, env, desc, ESZ, DSZ,      \
 +               do_##NAME, CLEAR_FN);                      \
 +}
 +
 +GEN_VEXT_VX(vadd_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vadd_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vadd_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vadd_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vsub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vsub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vsub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vsub_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vrsub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vrsub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vrsub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vrsub_vx_d, 8, 8, clearq)
 +
 +void HELPER(vec_rsubs8)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint8_t)) {
 +        *(uint8_t *)(d + i) = (uint8_t)b - *(uint8_t *)(a + i);
 +    }
 +}
 +
-+void HELPER(vec_rsubs16)(void *d, void *a, uint64_t b, uint32_t desc)
+ void helper_tlb_flush(CPURISCVState *env)
  {
      CPUState *cs = env_cpu(env);
 diff --git a/target/riscv/insn_trans/trans_rvzawrs.c.inc b/target/riscv/insn_trans/trans_rvzawrs.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvzawrs.c.inc
 +++ b/target/riscv/insn_trans/trans_rvzawrs.c.inc
@@ -XXX,XX +XXX,XX @@
   * this program.  If not, see <http://www.gnu.org/licenses/>.
   */
 -static bool trans_wrs(DisasContext *ctx)
 +static bool trans_wrs_sto(DisasContext *ctx, arg_wrs_sto *a)
  {
      if (!ctx->cfg_ptr->ext_zawrs) {
          return false;
@@ -XXX,XX +XXX,XX @@ static bool trans_wrs(DisasContext *ctx)
      return true;
  }
 -#define GEN_TRANS_WRS(insn)                                     \
 -static bool trans_ ## insn(DisasContext *ctx, arg_ ## insn *a)  \
 -{                                                               \
 -    (void)a;                                                    \
 -    return trans_wrs(ctx);                                      \
 -}
 +static bool trans_wrs_nto(DisasContext *ctx, arg_wrs_nto *a)
 +{
-+    intptr_t oprsz = simd_oprsz(desc);
++    if (!ctx->cfg_ptr->ext_zawrs) {
-+    intptr_t i;
++        return false;
 +    }
 -GEN_TRANS_WRS(wrs_nto)
 -GEN_TRANS_WRS(wrs_sto)
 +    /*
 +     * Depending on the mode of execution, mstatus.TW and hstatus.VTW, wrs.nto
 +     * should raise an exception when the implementation-specific bounded time
 +     * limit has expired. Our time limit is zero, so we either return
 +     * immediately, as does our implementation of wrs.sto, or raise an
 +     * exception, as handled by the wrs.nto helper.
 +     */
 +#ifndef CONFIG_USER_ONLY
 +    gen_helper_wrs_nto(tcg_env);
 +#endif
 +
-+    for (i = 0; i < oprsz; i += sizeof(uint16_t)) {
++    /* We only get here when helper_wrs_nto() doesn't raise an exception. */
-+        *(uint16_t *)(d + i) = (uint16_t)b - *(uint16_t *)(a + i);
++    return trans_wrs_sto(ctx, NULL);
 +    }
 +}
 +
 +void HELPER(vec_rsubs32)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint32_t)) {
 +        *(uint32_t *)(d + i) = (uint32_t)b - *(uint32_t *)(a + i);
 +    }
 +}
 +
 +void HELPER(vec_rsubs64)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint64_t)) {
 +        *(uint64_t *)(d + i) = b - *(uint64_t *)(a + i);
 +    }
 +}
 --
-.27.0
+.45.1

-[PULL 54/63] target/riscv: set-X-first mask bit
+[PULL 04/28] target/riscv/kvm: implement SBI debug console (DBCN) calls
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+SBI defines a Debug Console extension "DBCN" that will, in time, replace
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+the legacy console putchar and getchar SBI extensions.
-Message-id: 20200623215920.2594-53-zhiwei_liu@c-sky.com
 The appeal of the DBCN extension is that it allows multiple bytes to be
 read/written in the SBI console in a single SBI call.
 As far as KVM goes, the DBCN calls are forwarded by an in-kernel KVM
 module to userspace. But this will only happens if the KVM module
 actually supports this SBI extension and we activate it.
 We'll check for DBCN support during init time, checking if get-reg-list
 is advertising KVM_RISCV_SBI_EXT_DBCN. In that case, we'll enable it via
 kvm_set_one_reg() during kvm_arch_init_vcpu().
 Finally, change kvm_riscv_handle_sbi() to handle the incoming calls for
 SBI_EXT_DBCN, reading and writing as required.
 A simple KVM guest with 'earlycon=sbi', running in an emulated RISC-V
 host, takes around 20 seconds to boot without using DBCN. With this
 patch we're taking around 14 seconds to boot due to the speed-up in the
 terminal output.  There's no change in boot time if the guest isn't
 using earlycon.
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20240425155012.581366-1-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  4 ++
+ target/riscv/sbi_ecall_interface.h |  17 +++++
- target/riscv/insn32.decode              |  3 ++
+ target/riscv/kvm/kvm-cpu.c         | 111 +++++++++++++++++++++++++++++
- target/riscv/insn_trans/trans_rvv.inc.c | 28 +++++++++++
+files changed, 128 insertions(+)
- target/riscv/vector_helper.c            | 63 +++++++++++++++++++++++++
-files changed, 98 insertions(+)
+diff --git a/target/riscv/sbi_ecall_interface.h b/target/riscv/sbi_ecall_interface.h
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/sbi_ecall_interface.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/sbi_ecall_interface.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
+ /* clang-format off */
- DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
-+
++#define SBI_SUCCESS                      0
-+DEF_HELPER_5(vmsbf_m, void, ptr, ptr, ptr, env, i32)
++#define SBI_ERR_FAILED                  -1
-+DEF_HELPER_5(vmsif_m, void, ptr, ptr, ptr, env, i32)
++#define SBI_ERR_NOT_SUPPORTED           -2
-+DEF_HELPER_5(vmsof_m, void, ptr, ptr, ptr, env, i32)
++#define SBI_ERR_INVALID_PARAM           -3
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++#define SBI_ERR_DENIED                  -4
 +#define SBI_ERR_INVALID_ADDRESS         -5
 +#define SBI_ERR_ALREADY_AVAILABLE       -6
 +#define SBI_ERR_ALREADY_STARTED         -7
 +#define SBI_ERR_ALREADY_STOPPED         -8
 +#define SBI_ERR_NO_SHMEM                -9
 +
  /* SBI Extension IDs */
  #define SBI_EXT_0_1_SET_TIMER           0x0
  #define SBI_EXT_0_1_CONSOLE_PUTCHAR     0x1
@@ -XXX,XX +XXX,XX @@
  #define SBI_EXT_IPI                     0x735049
  #define SBI_EXT_RFENCE                  0x52464E43
  #define SBI_EXT_HSM                     0x48534D
 +#define SBI_EXT_DBCN                    0x4442434E
  /* SBI function IDs for BASE extension */
  #define SBI_EXT_BASE_GET_SPEC_VERSION   0x0
@@ -XXX,XX +XXX,XX @@
  #define SBI_EXT_HSM_HART_STOP           0x1
  #define SBI_EXT_HSM_HART_GET_STATUS     0x2
 +/* SBI function IDs for DBCN extension */
 +#define SBI_EXT_DBCN_CONSOLE_WRITE      0x0
 +#define SBI_EXT_DBCN_CONSOLE_READ       0x1
 +#define SBI_EXT_DBCN_CONSOLE_WRITE_BYTE 0x2
 +
  #define SBI_HSM_HART_STATUS_STARTED     0x0
  #define SBI_HSM_HART_STATUS_STOPPED     0x1
  #define SBI_HSM_HART_STATUS_START_PENDING   0x2
 diff --git a/target/riscv/kvm/kvm-cpu.c b/target/riscv/kvm/kvm-cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/kvm/kvm-cpu.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/kvm/kvm-cpu.c
-@@ -XXX,XX +XXX,XX @@ vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@ static KVMCPUConfig kvm_v_vlenb = {
- vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
+                    KVM_REG_RISCV_VECTOR_CSR_REG(vlenb)
- vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
+ };
- vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
-+vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
++static KVMCPUConfig kvm_sbi_dbcn = {
-+vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
++    .name = "sbi_dbcn",
-+vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
++    .kvm_reg_id = KVM_REG_RISCV | KVM_REG_SIZE_U64 |
++                  KVM_REG_RISCV_SBI_EXT | KVM_RISCV_SBI_EXT_DBCN
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vmfirst_m(DisasContext *s, arg_rmr *a)
      }
      return false;
  }
 +
 +/* vmsbf.m set-before-first mask bit */
 +/* vmsif.m set-includ-first mask bit */
 +/* vmsof.m set-only-first mask bit */
 +#define GEN_M_TRANS(NAME)                                          \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (vext_check_isa_ill(s)) {                                   \
 +        uint32_t data = 0;                                         \
 +        gen_helper_gvec_3_ptr *fn = gen_helper_##NAME;             \
 +        TCGLabel *over = gen_new_label();                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd),                     \
 +                           vreg_ofs(s, 0), vreg_ofs(s, a->rs2),    \
 +                           cpu_env, 0, s->vlen / 8, data, fn);     \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_M_TRANS(vmsbf_m)
 +GEN_M_TRANS(vmsif_m)
 +GEN_M_TRANS(vmsof_m)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vmfirst_m)(void *v0, void *vs2, CPURISCVState *env,
      }
      return -1LL;
  }
 +
 +enum set_mask_type {
 +    ONLY_FIRST = 1,
 +    INCLUDE_FIRST,
 +    BEFORE_FIRST,
 +};
 +
-+static void vmsetm(void *vd, void *v0, void *vs2, CPURISCVState *env,
+ static void kvm_riscv_update_cpu_cfg_isa_ext(RISCVCPU *cpu, CPUState *cs)
-+                   uint32_t desc, enum set_mask_type type)
+ {
      CPURISCVState *env = &cpu->env;
@@ -XXX,XX +XXX,XX @@ static int uint64_cmp(const void *a, const void *b)
      return 0;
  }
 +static void kvm_riscv_check_sbi_dbcn_support(RISCVCPU *cpu,
 +                                             KVMScratchCPU *kvmcpu,
 +                                             struct kvm_reg_list *reglist)
 +{
-+    uint32_t mlen = vext_mlen(desc);
++    struct kvm_reg_list *reg_search;
-+    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;
++
-+    uint32_t vm = vext_vm(desc);
++    reg_search = bsearch(&kvm_sbi_dbcn.kvm_reg_id, reglist->reg, reglist->n,
-+    uint32_t vl = env->vl;
++                         sizeof(uint64_t), uint64_cmp);
-+    int i;
++
-+    bool first_mask_bit = false;
++    if (reg_search) {
-+
++        kvm_sbi_dbcn.supported = true;
 +    for (i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        /* write a zero to all following active elements */
 +        if (first_mask_bit) {
 +            vext_set_elem_mask(vd, mlen, i, 0);
 +            continue;
 +        }
 +        if (vext_elem_mask(vs2, mlen, i)) {
 +            first_mask_bit = true;
 +            if (type == BEFORE_FIRST) {
 +                vext_set_elem_mask(vd, mlen, i, 0);
 +            } else {
 +                vext_set_elem_mask(vd, mlen, i, 1);
 +            }
 +        } else {
 +            if (type == ONLY_FIRST) {
 +                vext_set_elem_mask(vd, mlen, i, 0);
 +            } else {
 +                vext_set_elem_mask(vd, mlen, i, 1);
 +            }
 +        }
 +    }
 +    for (; i < vlmax; i++) {
 +        vext_set_elem_mask(vd, mlen, i, 0);
 +    }
 +}
 +
-+void HELPER(vmsbf_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
+ static void kvm_riscv_read_vlenb(RISCVCPU *cpu, KVMScratchCPU *kvmcpu,
-+                     uint32_t desc)
+                                  struct kvm_reg_list *reglist)
  {
@@ -XXX,XX +XXX,XX @@ static void kvm_riscv_init_multiext_cfg(RISCVCPU *cpu, KVMScratchCPU *kvmcpu)
      if (riscv_has_ext(&cpu->env, RVV)) {
          kvm_riscv_read_vlenb(cpu, kvmcpu, reglist);
      }
 +
 +    kvm_riscv_check_sbi_dbcn_support(cpu, kvmcpu, reglist);
  }
  static void riscv_init_kvm_registers(Object *cpu_obj)
@@ -XXX,XX +XXX,XX @@ static int kvm_vcpu_set_machine_ids(RISCVCPU *cpu, CPUState *cs)
      return ret;
  }
 +static int kvm_vcpu_enable_sbi_dbcn(RISCVCPU *cpu, CPUState *cs)
 +{
-+    vmsetm(vd, v0, vs2, env, desc, BEFORE_FIRST);
++    target_ulong reg = 1;
 +
 +    if (!kvm_sbi_dbcn.supported) {
 +        return 0;
 +    }
 +
 +    return kvm_set_one_reg(cs, kvm_sbi_dbcn.kvm_reg_id, &reg);
 +}
 +
-+void HELPER(vmsif_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
+ int kvm_arch_init_vcpu(CPUState *cs)
-+                     uint32_t desc)
+ {
      int ret = 0;
@@ -XXX,XX +XXX,XX @@ int kvm_arch_init_vcpu(CPUState *cs)
      kvm_riscv_update_cpu_misa_ext(cpu, cs);
      kvm_riscv_update_cpu_cfg_isa_ext(cpu, cs);
 +    ret = kvm_vcpu_enable_sbi_dbcn(cpu, cs);
 +
      return ret;
  }
@@ -XXX,XX +XXX,XX @@ bool kvm_arch_stop_on_emulation_error(CPUState *cs)
      return true;
  }
 +static void kvm_riscv_handle_sbi_dbcn(CPUState *cs, struct kvm_run *run)
 +{
-+    vmsetm(vd, v0, vs2, env, desc, INCLUDE_FIRST);
++    g_autofree uint8_t *buf = NULL;
 +    RISCVCPU *cpu = RISCV_CPU(cs);
 +    target_ulong num_bytes;
 +    uint64_t addr;
 +    unsigned char ch;
 +    int ret;
 +
 +    switch (run->riscv_sbi.function_id) {
 +    case SBI_EXT_DBCN_CONSOLE_READ:
 +    case SBI_EXT_DBCN_CONSOLE_WRITE:
 +        num_bytes = run->riscv_sbi.args[0];
 +
 +        if (num_bytes == 0) {
 +            run->riscv_sbi.ret[0] = SBI_SUCCESS;
 +            run->riscv_sbi.ret[1] = 0;
 +            break;
 +        }
 +
 +        addr = run->riscv_sbi.args[1];
 +
 +        /*
 +         * Handle the case where a 32 bit CPU is running in a
 +         * 64 bit addressing env.
 +         */
 +        if (riscv_cpu_mxl(&cpu->env) == MXL_RV32) {
 +            addr |= (uint64_t)run->riscv_sbi.args[2] << 32;
 +        }
 +
 +        buf = g_malloc0(num_bytes);
 +
 +        if (run->riscv_sbi.function_id == SBI_EXT_DBCN_CONSOLE_READ) {
 +            ret = qemu_chr_fe_read_all(serial_hd(0)->be, buf, num_bytes);
 +            if (ret < 0) {
 +                error_report("SBI_EXT_DBCN_CONSOLE_READ: error when "
 +                             "reading chardev");
 +                exit(1);
 +            }
 +
 +            cpu_physical_memory_write(addr, buf, ret);
 +        } else {
 +            cpu_physical_memory_read(addr, buf, num_bytes);
 +
 +            ret = qemu_chr_fe_write_all(serial_hd(0)->be, buf, num_bytes);
 +            if (ret < 0) {
 +                error_report("SBI_EXT_DBCN_CONSOLE_WRITE: error when "
 +                             "writing chardev");
 +                exit(1);
 +            }
 +        }
 +
 +        run->riscv_sbi.ret[0] = SBI_SUCCESS;
 +        run->riscv_sbi.ret[1] = ret;
 +        break;
 +    case SBI_EXT_DBCN_CONSOLE_WRITE_BYTE:
 +        ch = run->riscv_sbi.args[0];
 +        ret = qemu_chr_fe_write(serial_hd(0)->be, &ch, sizeof(ch));
 +
 +        if (ret < 0) {
 +            error_report("SBI_EXT_DBCN_CONSOLE_WRITE_BYTE: error when "
 +                         "writing chardev");
 +            exit(1);
 +        }
 +
 +        run->riscv_sbi.ret[0] = SBI_SUCCESS;
 +        run->riscv_sbi.ret[1] = 0;
 +        break;
 +    default:
 +        run->riscv_sbi.ret[0] = SBI_ERR_NOT_SUPPORTED;
 +    }
 +}
 +
-+void HELPER(vmsof_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
+ static int kvm_riscv_handle_sbi(CPUState *cs, struct kvm_run *run)
-+                     uint32_t desc)
+ {
-+{
+     int ret = 0;
-+    vmsetm(vd, v0, vs2, env, desc, ONLY_FIRST);
+@@ -XXX,XX +XXX,XX @@ static int kvm_riscv_handle_sbi(CPUState *cs, struct kvm_run *run)
-+}
+         }
          ret = 0;
          break;
 +    case SBI_EXT_DBCN:
 +        kvm_riscv_handle_sbi_dbcn(cs, run);
 +        break;
      default:
          qemu_log_mask(LOG_UNIMP,
                        "%s: un-handled SBI EXIT, specific reasons is %lu\n",
 --
-.27.0
+.45.1

-[PULL 39/63] target/riscv: vector floating-point min/max instructions
+[PULL 05/28] hw/riscv/boot.c: Support 64-bit address for initrd
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Cheng Yang <yangcheng.work@foxmail.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Use qemu_fdt_setprop_u64() instead of qemu_fdt_setprop_cell()
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+to set the address of initrd in FDT to support 64-bit address.
 Signed-off-by: Cheng Yang <yangcheng.work@foxmail.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-38-zhiwei_liu@c-sky.com
+Message-ID: <tencent_A4482251DD0890F312758FA6B33F60815609@qq.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 13 ++++++++++++
+ hw/riscv/boot.c | 4 ++--
- target/riscv/insn32.decode              |  4 ++++
+file changed, 2 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c |  6 ++++++
  target/riscv/vector_helper.c            | 27 +++++++++++++++++++++++++
 files changed, 50 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/riscv/boot.c b/hw/riscv/boot.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/riscv/boot.c
-+++ b/target/riscv/helper.h
++++ b/hw/riscv/boot.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void riscv_load_initrd(MachineState *machine, uint64_t kernel_entry)
- DEF_HELPER_5(vfsqrt_v_h, void, ptr, ptr, ptr, env, i32)
+     /* Some RISC-V machines (e.g. opentitan) don't have a fdt. */
- DEF_HELPER_5(vfsqrt_v_w, void, ptr, ptr, ptr, env, i32)
+     if (fdt) {
- DEF_HELPER_5(vfsqrt_v_d, void, ptr, ptr, ptr, env, i32)
+         end = start + size;
-+
+-        qemu_fdt_setprop_cell(fdt, "/chosen", "linux,initrd-start", start);
-+DEF_HELPER_6(vfmin_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+-        qemu_fdt_setprop_cell(fdt, "/chosen", "linux,initrd-end", end);
-+DEF_HELPER_6(vfmin_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++        qemu_fdt_setprop_u64(fdt, "/chosen", "linux,initrd-start", start);
-+DEF_HELPER_6(vfmin_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++        qemu_fdt_setprop_u64(fdt, "/chosen", "linux,initrd-end", end);
-+DEF_HELPER_6(vfmax_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     }
 +DEF_HELPER_6(vfmax_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfmax_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfmin_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfmin_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfmin_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfmax_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfmax_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfmax_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
  vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
  vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
  vfsqrt_v        100011 . ..... 00000 001 ..... 1010111 @r2_vm
 +vfmin_vv        000100 . ..... ..... 001 ..... 1010111 @r_vm
 +vfmin_vf        000100 . ..... ..... 101 ..... 1010111 @r_vm
 +vfmax_vv        000110 . ..... ..... 001 ..... 1010111 @r_vm
 +vfmax_vf        000110 . ..... ..... 101 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
  }
- GEN_OPFV_TRANS(vfsqrt_v, opfv_check)
-+
-+/* Vector Floating-Point MIN/MAX Instructions */
-+GEN_OPFVV_TRANS(vfmin_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmax_vv, opfvv_check)
-+GEN_OPFVF_TRANS(vfmin_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmax_vf, opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfsqrt_v_d, OP_UU_D, H8, H8, float64_sqrt)
- GEN_VEXT_V_ENV(vfsqrt_v_h, 2, 2, clearh)
- GEN_VEXT_V_ENV(vfsqrt_v_w, 4, 4, clearl)
- GEN_VEXT_V_ENV(vfsqrt_v_d, 8, 8, clearq)
-+
-+/* Vector Floating-Point MIN/MAX Instructions */
-+RVVCALL(OPFVV2, vfmin_vv_h, OP_UUU_H, H2, H2, H2, float16_minnum)
-+RVVCALL(OPFVV2, vfmin_vv_w, OP_UUU_W, H4, H4, H4, float32_minnum)
-+RVVCALL(OPFVV2, vfmin_vv_d, OP_UUU_D, H8, H8, H8, float64_minnum)
-+GEN_VEXT_VV_ENV(vfmin_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmin_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmin_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfmin_vf_h, OP_UUU_H, H2, H2, float16_minnum)
-+RVVCALL(OPFVF2, vfmin_vf_w, OP_UUU_W, H4, H4, float32_minnum)
-+RVVCALL(OPFVF2, vfmin_vf_d, OP_UUU_D, H8, H8, float64_minnum)
-+GEN_VEXT_VF(vfmin_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmin_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmin_vf_d, 8, 8, clearq)
-+
-+RVVCALL(OPFVV2, vfmax_vv_h, OP_UUU_H, H2, H2, H2, float16_maxnum)
-+RVVCALL(OPFVV2, vfmax_vv_w, OP_UUU_W, H4, H4, H4, float32_maxnum)
-+RVVCALL(OPFVV2, vfmax_vv_d, OP_UUU_D, H8, H8, H8, float64_maxnum)
-+GEN_VEXT_VV_ENV(vfmax_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmax_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmax_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfmax_vf_h, OP_UUU_H, H2, H2, float16_maxnum)
-+RVVCALL(OPFVF2, vfmax_vf_w, OP_UUU_W, H4, H4, float32_maxnum)
-+RVVCALL(OPFVF2, vfmax_vf_d, OP_UUU_D, H8, H8, float64_maxnum)
-+GEN_VEXT_VF(vfmax_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmax_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmax_vf_d, 8, 8, clearq)
 --
-.27.0
+.45.1

-[PULL 05/63] target/riscv: support vector extension csr
+[PULL 06/28] target/riscv: change RISCV_EXCP_SEMIHOST exception number to 63
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Clément Léger <cleger@rivosinc.com>
-The v0.7.1 specification does not define vector status within mstatus.
+The current semihost exception number (16) is a reserved number (range
-A future revision will define the privileged portion of the vector status.
+[16-17]). The upcoming double trap specification uses that number for
 the double trap exception. Since the privileged spec (Table 22) defines
 ranges for custom uses change the semihosting exception number to 63
 which belongs to the range [48-63] in order to avoid any future
 collisions with reserved exception.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: Clément Léger <cleger@rivosinc.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20240422135840.1959967-1-cleger@rivosinc.com>
 Message-id: 20200623215920.2594-4-zhiwei_liu@c-sky.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu_bits.h | 15 +++++++++
+ target/riscv/cpu_bits.h | 2 +-
- target/riscv/csr.c      | 75 ++++++++++++++++++++++++++++++++++++++++-
+file changed, 1 insertion(+), 1 deletion(-)
 files changed, 89 insertions(+), 1 deletion(-)
 diff --git a/target/riscv/cpu_bits.h b/target/riscv/cpu_bits.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_bits.h
 +++ b/target/riscv/cpu_bits.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef enum RISCVException {
- #define FSR_NXA             (FPEXC_NX << FSR_AEXC_SHIFT)
+     RISCV_EXCP_INST_PAGE_FAULT = 0xc, /* since: priv-1.10.0 */
- #define FSR_AEXC            (FSR_NVA | FSR_OFA | FSR_UFA | FSR_DZA | FSR_NXA)
+     RISCV_EXCP_LOAD_PAGE_FAULT = 0xd, /* since: priv-1.10.0 */
+     RISCV_EXCP_STORE_PAGE_FAULT = 0xf, /* since: priv-1.10.0 */
-+/* Vector Fixed-Point round model */
+-    RISCV_EXCP_SEMIHOST = 0x10,
-+#define FSR_VXRM_SHIFT      9
+     RISCV_EXCP_INST_GUEST_PAGE_FAULT = 0x14,
-+#define FSR_VXRM            (0x3 << FSR_VXRM_SHIFT)
+     RISCV_EXCP_LOAD_GUEST_ACCESS_FAULT = 0x15,
-+
+     RISCV_EXCP_VIRT_INSTRUCTION_FAULT = 0x16,
-+/* Vector Fixed-Point saturation flag */
+     RISCV_EXCP_STORE_GUEST_AMO_ACCESS_FAULT = 0x17,
-+#define FSR_VXSAT_SHIFT     8
++    RISCV_EXCP_SEMIHOST = 0x3f,
-+#define FSR_VXSAT           (0x1 << FSR_VXSAT_SHIFT)
+ } RISCVException;
-+
- /* Control and Status Registers */
+ #define RISCV_EXCP_INT_FLAG                0x80000000
  /* User Trap Setup */
@@ -XXX,XX +XXX,XX @@
  #define CSR_FRM             0x002
  #define CSR_FCSR            0x003
 +/* User Vector CSRs */
 +#define CSR_VSTART          0x008
 +#define CSR_VXSAT           0x009
 +#define CSR_VXRM            0x00a
 +#define CSR_VL              0xc20
 +#define CSR_VTYPE           0xc21
 +
  /* User Timers and Counters */
  #define CSR_CYCLE           0xc00
  #define CSR_TIME            0xc01
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops)
  static int fs(CPURISCVState *env, int csrno)
  {
  #if !defined(CONFIG_USER_ONLY)
 +    /* loose check condition for fcsr in vector extension */
 +    if ((csrno == CSR_FCSR) && (env->misa & RVV)) {
 +        return 0;
 +    }
      if (!env->debugger && !riscv_cpu_fp_enabled(env)) {
          return -1;
      }
@@ -XXX,XX +XXX,XX @@ static int fs(CPURISCVState *env, int csrno)
      return 0;
  }
 +static int vs(CPURISCVState *env, int csrno)
 +{
 +    if (env->misa & RVV) {
 +        return 0;
 +    }
 +    return -1;
 +}
 +
  static int ctr(CPURISCVState *env, int csrno)
  {
  #if !defined(CONFIG_USER_ONLY)
@@ -XXX,XX +XXX,XX @@ static int read_fcsr(CPURISCVState *env, int csrno, target_ulong *val)
  #endif
      *val = (riscv_cpu_get_fflags(env) << FSR_AEXC_SHIFT)
          | (env->frm << FSR_RD_SHIFT);
 +    if (vs(env, csrno) >= 0) {
 +        *val |= (env->vxrm << FSR_VXRM_SHIFT)
 +                | (env->vxsat << FSR_VXSAT_SHIFT);
 +    }
      return 0;
  }
@@ -XXX,XX +XXX,XX @@ static int write_fcsr(CPURISCVState *env, int csrno, target_ulong val)
      env->mstatus |= MSTATUS_FS;
  #endif
      env->frm = (val & FSR_RD) >> FSR_RD_SHIFT;
 +    if (vs(env, csrno) >= 0) {
 +        env->vxrm = (val & FSR_VXRM) >> FSR_VXRM_SHIFT;
 +        env->vxsat = (val & FSR_VXSAT) >> FSR_VXSAT_SHIFT;
 +    }
      riscv_cpu_set_fflags(env, (val & FSR_AEXC) >> FSR_AEXC_SHIFT);
      return 0;
  }
 +static int read_vtype(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vtype;
 +    return 0;
 +}
 +
 +static int read_vl(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vl;
 +    return 0;
 +}
 +
 +static int read_vxrm(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vxrm;
 +    return 0;
 +}
 +
 +static int write_vxrm(CPURISCVState *env, int csrno, target_ulong val)
 +{
 +    env->vxrm = val;
 +    return 0;
 +}
 +
 +static int read_vxsat(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vxsat;
 +    return 0;
 +}
 +
 +static int write_vxsat(CPURISCVState *env, int csrno, target_ulong val)
 +{
 +    env->vxsat = val;
 +    return 0;
 +}
 +
 +static int read_vstart(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vstart;
 +    return 0;
 +}
 +
 +static int write_vstart(CPURISCVState *env, int csrno, target_ulong val)
 +{
 +    env->vstart = val;
 +    return 0;
 +}
 +
  /* User Timers and Counters */
  static int read_instret(CPURISCVState *env, int csrno, target_ulong *val)
  {
@@ -XXX,XX +XXX,XX @@ static riscv_csr_operations csr_ops[CSR_TABLE_SIZE] = {
      [CSR_FFLAGS] =              { fs,   read_fflags,      write_fflags      },
      [CSR_FRM] =                 { fs,   read_frm,         write_frm         },
      [CSR_FCSR] =                { fs,   read_fcsr,        write_fcsr        },
 -
 +    /* Vector CSRs */
 +    [CSR_VSTART] =              { vs,   read_vstart,      write_vstart      },
 +    [CSR_VXSAT] =               { vs,   read_vxsat,       write_vxsat       },
 +    [CSR_VXRM] =                { vs,   read_vxrm,        write_vxrm        },
 +    [CSR_VL] =                  { vs,   read_vl                             },
 +    [CSR_VTYPE] =               { vs,   read_vtype                          },
      /* User Timers and Counters */
      [CSR_CYCLE] =               { ctr,  read_instret                        },
      [CSR_INSTRET] =             { ctr,  read_instret                        },
 --
-.27.0
+.45.1

-[PULL 02/63] riscv: plic: Add a couple of mising sifive_plic_update calls
+[PULL 07/28] target/riscv/kvm: tolerate KVM disable ext errors
-From: Jessica Clarke <jrtc27@jrtc27.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Claiming an interrupt and changing the source priority both potentially
+Running a KVM guest using a 6.9-rc3 kernel, in a 6.8 host that has zkr
-affect whether an interrupt is pending, thus we must re-compute xEIP.
+enabled, will fail with a kernel oops SIGILL right at the start. The
-Note that we don't put the sifive_plic_update inside sifive_plic_claim
+reason is that we can't expose zkr without implementing the SEED CSR.
-so that the logging of a claim (and the resulting IRQ) happens before
+Disabling zkr in the guest would be a workaround, but if the KVM doesn't
-the state update, making the causal effect clear, and that we drop the
+allow it we'll error out and never boot.
 explicit call to sifive_plic_print_state when claiming since
 sifive_plic_update already does that automatically at the end for us.
-This can result in both spurious interrupt storms if you fail to
+In hindsight this is too strict. If we keep proceeding, despite not
-complete an IRQ before enabling interrupts (and no other actions occur
+disabling the extension in the KVM vcpu, we'll not add the extension in
-that result in a call to sifive_plic_update), but also more importantly
+the riscv,isa. The guest kernel will be unaware of the extension, i.e.
-lost interrupts if a disabled interrupt is pending and then becomes
+it doesn't matter if the KVM vcpu has it enabled underneath or not. So
-enabled.
+it's ok to keep booting in this case.
-Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
+Change our current logic to not error out if we fail to disable an
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+extension in kvm_set_one_reg(), but show a warning and keep booting. It
-Message-id: 20200618210649.22451-1-jrtc27@jrtc27.com
+is important to throw a warning because we must make the user aware that
-Message-Id: <20200618210649.22451-1-jrtc27@jrtc27.com>
+the extension is still available in the vcpu, meaning that an
 ill-behaved guest can ignore the riscv,isa settings and  use the
 extension.
 The case we're handling happens with an EINVAL error code. If we fail to
 disable the extension in KVM for any other reason, error out.
 We'll also keep erroring out when we fail to enable an extension in KVM,
 since adding the extension in riscv,isa at this point will cause a guest
 malfunction because the extension isn't enabled in the vcpu.
 Suggested-by: Andrew Jones <ajones@ventanamicro.com>
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240422171425.333037-2-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/sifive_plic.c | 3 ++-
+ target/riscv/kvm/kvm-cpu.c | 12 ++++++++----
-file changed, 2 insertions(+), 1 deletion(-)
+file changed, 8 insertions(+), 4 deletions(-)
-diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
+diff --git a/target/riscv/kvm/kvm-cpu.c b/target/riscv/kvm/kvm-cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_plic.c
+--- a/target/riscv/kvm/kvm-cpu.c
-+++ b/hw/riscv/sifive_plic.c
++++ b/target/riscv/kvm/kvm-cpu.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+@@ -XXX,XX +XXX,XX @@ static void kvm_riscv_update_cpu_cfg_isa_ext(RISCVCPU *cpu, CPUState *cs)
-                     plic->addr_config[addrid].hartid,
+         reg = kvm_cpu_cfg_get(cpu, multi_ext_cfg);
-                     mode_to_char(plic->addr_config[addrid].mode),
+         ret = kvm_set_one_reg(cs, id, &reg);
-                     value);
+         if (ret != 0) {
--                sifive_plic_print_state(plic);
+-            error_report("Unable to %s extension %s in KVM, error %d",
-             }
+-                         reg ? "enable" : "disable",
-+            sifive_plic_update(plic);
+-                         multi_ext_cfg->name, ret);
-             return value;
+-            exit(EXIT_FAILURE);
 +            if (!reg && ret == -EINVAL) {
 +                warn_report("KVM cannot disable extension %s",
 +                            multi_ext_cfg->name);
 +            } else {
 +                error_report("Unable to enable extension %s in KVM, error %d",
 +                             multi_ext_cfg->name, ret);
 +                exit(EXIT_FAILURE);
 +            }
          }
      }
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
+ }
              qemu_log("plic: write priority: irq=%d priority=%d\n",
                  irq, plic->source_priority[irq]);
          }
 +        sifive_plic_update(plic);
          return;
      } else if (addr >= plic->pending_base && /* 1 bit per source */
                 addr < plic->pending_base + (plic->num_sources >> 3))
 --
-.27.0
+.45.1

-[PULL 60/63] target/riscv: vector slide instructions
+[PULL 08/28] target/riscv/debug: set tval=pc in breakpoint exceptions
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+We're not setting (s/m)tval when triggering breakpoints of type 2
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+(mcontrol) and 6 (mcontrol6). According to the debug spec section
-Message-id: 20200623215920.2594-59-zhiwei_liu@c-sky.com
+.7.12, "Match Control Type 6":
 "The Privileged Spec says that breakpoint exceptions that occur on
 instruction fetches, loads, or stores update the tval CSR with either
 zero or the faulting virtual address. The faulting virtual address for
 an mcontrol6 trigger with action = 0 is the address being accessed and
 which caused that trigger to fire."
 A similar text is also found in the Debug spec section 5.7.11 w.r.t.
 mcontrol.
 Note that what we're doing ATM is not violating the spec, but it's
 simple enough to set mtval/stval and it makes life easier for any
 software that relies on this info.
 Given that we always use action = 0, save the faulting address for the
 mcontrol and mcontrol6 trigger breakpoints into env->badaddr, which is
 used as as scratch area for traps with address information. 'tval' is
 then set during riscv_cpu_do_interrupt().
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Message-ID: <20240416230437.1869024-2-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  17 ++++
+ target/riscv/cpu_helper.c | 1 +
- target/riscv/insn32.decode              |   6 ++
+ target/riscv/debug.c      | 3 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  18 ++++
+files changed, 4 insertions(+)
  target/riscv/vector_helper.c            | 114 ++++++++++++++++++++++++
 files changed, 155 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu_helper.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu_helper.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vid_v_b, void, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
- DEF_HELPER_4(vid_v_h, void, ptr, ptr, env, i32)
+             tval = env->bins;
- DEF_HELPER_4(vid_v_w, void, ptr, ptr, env, i32)
+             break;
- DEF_HELPER_4(vid_v_d, void, ptr, ptr, env, i32)
+         case RISCV_EXCP_BREAKPOINT:
-+
++            tval = env->badaddr;
-+DEF_HELPER_6(vslideup_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+             if (cs->watchpoint_hit) {
-+DEF_HELPER_6(vslideup_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+                 tval = cs->watchpoint_hit->hitaddr;
-+DEF_HELPER_6(vslideup_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+                 cs->watchpoint_hit = NULL;
-+DEF_HELPER_6(vslideup_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+diff --git a/target/riscv/debug.c b/target/riscv/debug.c
 +DEF_HELPER_6(vslidedown_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/debug.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/debug.c
-@@ -XXX,XX +XXX,XX @@ vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@ bool riscv_cpu_debug_check_breakpoint(CPUState *cs)
- vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
+                 if ((ctrl & TYPE2_EXEC) && (bp->pc == pc)) {
- vfmv_f_s        001100 1 ..... 00000 001 ..... 1010111 @r2rd
+                     /* check U/S/M bit against current privilege level */
- vfmv_s_f        001101 1 00000 ..... 101 ..... 1010111 @r2
+                     if ((ctrl >> 3) & BIT(env->priv)) {
-+vslideup_vx     001110 . ..... ..... 100 ..... 1010111 @r_vm
++                        env->badaddr = pc;
-+vslideup_vi     001110 . ..... ..... 011 ..... 1010111 @r_vm
+                         return true;
-+vslide1up_vx    001110 . ..... ..... 110 ..... 1010111 @r_vm
+                     }
-+vslidedown_vx   001111 . ..... ..... 100 ..... 1010111 @r_vm
+                 }
-+vslidedown_vi   001111 . ..... ..... 011 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ bool riscv_cpu_debug_check_breakpoint(CPUState *cs)
-+vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
+                     if (env->virt_enabled) {
+                         /* check VU/VS bit against current privilege level */
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+                         if ((ctrl >> 23) & BIT(env->priv)) {
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++                            env->badaddr = pc;
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+                             return true;
-index XXXXXXX..XXXXXXX 100644
+                         }
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+                     } else {
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+                         /* check U/S/M bit against current privilege level */
-@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
+                         if ((ctrl >> 3) & BIT(env->priv)) {
-     }
++                            env->badaddr = pc;
-     return false;
+                             return true;
- }
+                         }
-+
+                     }
 +/* Vector Slide Instructions */
 +static bool slideup_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2));
 +}
 +
 +GEN_OPIVX_TRANS(vslideup_vx, slideup_check)
 +GEN_OPIVX_TRANS(vslide1up_vx, slideup_check)
 +GEN_OPIVI_TRANS(vslideup_vi, 1, vslideup_vx, slideup_check)
 +
 +GEN_OPIVX_TRANS(vslidedown_vx, opivx_check)
 +GEN_OPIVX_TRANS(vslide1down_vx, opivx_check)
 +GEN_OPIVI_TRANS(vslidedown_vi, 1, vslidedown_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VID_V(vid_v_b, uint8_t, H1, clearb)
  GEN_VEXT_VID_V(vid_v_h, uint16_t, H2, clearh)
  GEN_VEXT_VID_V(vid_v_w, uint32_t, H4, clearl)
  GEN_VEXT_VID_V(vid_v_d, uint64_t, H8, clearq)
 +
 +/*
 + *** Vector Permutation Instructions
 + */
 +
 +/* Vector Slide Instructions */
 +#define GEN_VEXT_VSLIDEUP_VX(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    target_ulong offset = s1, i;                                          \
 +                                                                          \
 +    for (i = offset; i < vl; i++) {                                       \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i - offset));          \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslideup.vx vd, vs2, rs1, vm # vd[i+rs1] = vs2[i] */
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDEUP_VX(vslideup_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDEDOWN_VX(NAME, ETYPE, H, CLEAR_FN)                  \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    target_ulong offset = s1, i;                                          \
 +                                                                          \
 +    for (i = 0; i < vl; ++i) {                                            \
 +        target_ulong j = i + offset;                                      \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = j >= vlmax ? 0 : *((ETYPE *)vs2 + H(j));  \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslidedown.vx vd, vs2, rs1, vm # vd[i] = vs2[i+rs1] */
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDE1UP_VX(NAME, ETYPE, H, CLEAR_FN)                   \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (i == 0) {                                                     \
 +            *((ETYPE *)vd + H(i)) = s1;                                   \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i - 1));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslide1up.vx vd, vs2, rs1, vm # vd[0]=x[rs1], vd[i+1] = vs2[i] */
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDE1DOWN_VX(NAME, ETYPE, H, CLEAR_FN)                 \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (i == vl - 1) {                                                \
 +            *((ETYPE *)vd + H(i)) = s1;                                   \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i + 1));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslide1down.vx vd, vs2, rs1, vm # vd[i] = vs2[i+1], vd[vl-1]=x[rs1] */
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_d, uint64_t, H8, clearq)
 --
-.27.0
+.45.1

-[PULL 62/63] target/riscv: vector compress instruction
+[PULL 09/28] trans_privileged.c.inc: set (m|s)tval on ebreak breakpoint
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Privileged spec section 4.1.9 mentions:
 "When a trap is taken into S-mode, stval is written with
 exception-specific information to assist software in handling the trap.
 (...)
 If stval is written with a nonzero value when a breakpoint,
 address-misaligned, access-fault, or page-fault exception occurs on an
 instruction fetch, load, or store, then stval will contain the faulting
 virtual address."
 A similar text is found for mtval in section 3.1.16.
 Setting mtval/stval in this scenario is optional, but some softwares read
 these regs when handling ebreaks.
 Write 'badaddr' in all ebreak breakpoints to write the appropriate
 'tval' during riscv_do_cpu_interrrupt().
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-61-zhiwei_liu@c-sky.com
+Message-ID: <20240416230437.1869024-3-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  5 ++++
+ target/riscv/insn_trans/trans_privileged.c.inc | 2 ++
- target/riscv/insn32.decode              |  1 +
+file changed, 2 insertions(+)
  target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 26 ++++++++++++++++++++
 files changed, 64 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_privileged.c.inc b/target/riscv/insn_trans/trans_privileged.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_privileged.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_privileged.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vrgather_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool trans_ebreak(DisasContext *ctx, arg_ebreak *a)
- DEF_HELPER_6(vrgather_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+     if (pre == 0x01f01013 && ebreak == 0x00100073 && post == 0x40705013) {
- DEF_HELPER_6(vrgather_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+         generate_exception(ctx, RISCV_EXCP_SEMIHOST);
- DEF_HELPER_6(vrgather_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+     } else {
-+
++        tcg_gen_st_tl(tcg_constant_tl(ebreak_addr), tcg_env,
-+DEF_HELPER_6(vcompress_vm_b, void, ptr, ptr, ptr, ptr, env, i32)
++                      offsetof(CPURISCVState, badaddr));
-+DEF_HELPER_6(vcompress_vm_h, void, ptr, ptr, ptr, ptr, env, i32)
+         generate_exception(ctx, RISCV_EXCP_BREAKPOINT);
 +DEF_HELPER_6(vcompress_vm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vcompress_vm_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
  vrgather_vv     001100 . ..... ..... 000 ..... 1010111 @r_vm
  vrgather_vx     001100 . ..... ..... 100 ..... 1010111 @r_vm
  vrgather_vi     001100 . ..... ..... 011 ..... 1010111 @r_vm
 +vcompress_vm    010111 - ..... ..... 010 ..... 1010111 @r
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vrgather_vi(DisasContext *s, arg_rmrr *a)
      }
      return true;
- }
-+
-+/* Vector Compress Instruction */
-+static bool vcompress_vm_check(DisasContext *s, arg_r *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs1, 1) &&
-+            (a->rd != a->rs2));
-+}
-+
-+static bool trans_vcompress_vm(DisasContext *s, arg_r *a)
-+{
-+    if (vcompress_vm_check(s, a)) {
-+        uint32_t data = 0;
-+        static gen_helper_gvec_4_ptr * const fns[4] = {
-+            gen_helper_vcompress_vm_b, gen_helper_vcompress_vm_h,
-+            gen_helper_vcompress_vm_w, gen_helper_vcompress_vm_d,
-+        };
-+        TCGLabel *over = gen_new_label();
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
-+                           vreg_ofs(s, a->rs1), vreg_ofs(s, a->rs2),
-+                           cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
-+        gen_set_label(over);
-+        return true;
-+    }
-+    return false;
-+}
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VRGATHER_VX(vrgather_vx_b, uint8_t, H1, clearb)
- GEN_VEXT_VRGATHER_VX(vrgather_vx_h, uint16_t, H2, clearh)
- GEN_VEXT_VRGATHER_VX(vrgather_vx_w, uint32_t, H4, clearl)
- GEN_VEXT_VRGATHER_VX(vrgather_vx_d, uint64_t, H8, clearq)
-+
-+/* Vector Compress Instruction */
-+#define GEN_VEXT_VCOMPRESS_VM(NAME, ETYPE, H, CLEAR_FN)                   \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,               \
-+                  CPURISCVState *env, uint32_t desc)                      \
-+{                                                                         \
-+    uint32_t mlen = vext_mlen(desc);                                      \
-+    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
-+    uint32_t vl = env->vl;                                                \
-+    uint32_t num = 0, i;                                                  \
-+                                                                          \
-+    for (i = 0; i < vl; i++) {                                            \
-+        if (!vext_elem_mask(vs1, mlen, i)) {                              \
-+            continue;                                                     \
-+        }                                                                 \
-+        *((ETYPE *)vd + H(num)) = *((ETYPE *)vs2 + H(i));                 \
-+        num++;                                                            \
-+    }                                                                     \
-+    CLEAR_FN(vd, num, num * sizeof(ETYPE), vlmax * sizeof(ETYPE));        \
-+}
-+
-+/* Compress into vd elements of vs2 where vs1 is enabled */
-+GEN_VEXT_VCOMPRESS_VM(vcompress_vm_b, uint8_t, H1, clearb)
-+GEN_VEXT_VCOMPRESS_VM(vcompress_vm_h, uint16_t, H2, clearh)
-+GEN_VEXT_VCOMPRESS_VM(vcompress_vm_w, uint32_t, H4, clearl)
-+GEN_VEXT_VCOMPRESS_VM(vcompress_vm_d, uint64_t, H8, clearq)
 --
-.27.0
+.45.1

-[PULL 59/63] target/riscv: floating-point scalar move instructions
+[PULL 10/28] target/riscv: Add support for Zve32x extension
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Jason Chien <jason.chien@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Add support for Zve32x extension and replace some checks for Zve32f with
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Zve32x, since Zve32f depends on Zve32x.
-Message-id: 20200623215920.2594-58-zhiwei_liu@c-sky.com
 Signed-off-by: Jason Chien <jason.chien@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Reviewed-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Message-ID: <20240328022343.6871-2-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn32.decode              |  3 ++
+ target/riscv/cpu_cfg.h                  |  1 +
- target/riscv/insn_trans/trans_rvv.inc.c | 49 +++++++++++++++++++++++++
+ target/riscv/cpu.c                      |  2 ++
-files changed, 52 insertions(+)
+ target/riscv/cpu_helper.c               |  2 +-
  target/riscv/csr.c                      |  2 +-
  target/riscv/tcg/tcg-cpu.c              | 16 ++++++++--------
  target/riscv/insn_trans/trans_rvv.c.inc |  4 ++--
 files changed, 15 insertions(+), 12 deletions(-)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/cpu_cfg.h
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/cpu_cfg.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
- @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
+     bool ext_zhinx;
- @r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
+     bool ext_zhinxmin;
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+     bool ext_zve32f;
-+@r2rd    .......   ..... ..... ... ..... ....... %rs2 %rd
++    bool ext_zve32x;
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
+     bool ext_zve64f;
- @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
+     bool ext_zve64d;
- @r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
+     bool ext_zvbb;
-@@ -XXX,XX +XXX,XX @@ viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
  vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
  vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
  vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
 +vfmv_f_s        001100 1 ..... 00000 001 ..... 1010111 @r2rd
 +vfmv_s_f        001101 1 00000 ..... 101 ..... 1010111 @r2
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
+@@ -XXX,XX +XXX,XX @@ const RISCVIsaExtData isa_edata_arr[] = {
      ISA_EXT_DATA_ENTRY(zvbb, PRIV_VERSION_1_12_0, ext_zvbb),
      ISA_EXT_DATA_ENTRY(zvbc, PRIV_VERSION_1_12_0, ext_zvbc),
      ISA_EXT_DATA_ENTRY(zve32f, PRIV_VERSION_1_10_0, ext_zve32f),
 +    ISA_EXT_DATA_ENTRY(zve32x, PRIV_VERSION_1_10_0, ext_zve32x),
      ISA_EXT_DATA_ENTRY(zve64f, PRIV_VERSION_1_10_0, ext_zve64f),
      ISA_EXT_DATA_ENTRY(zve64d, PRIV_VERSION_1_10_0, ext_zve64d),
      ISA_EXT_DATA_ENTRY(zvfbfmin, PRIV_VERSION_1_12_0, ext_zvfbfmin),
@@ -XXX,XX +XXX,XX @@ const RISCVCPUMultiExtConfig riscv_cpu_extensions[] = {
      MULTI_EXT_CFG_BOOL("zfh", ext_zfh, false),
      MULTI_EXT_CFG_BOOL("zfhmin", ext_zfhmin, false),
      MULTI_EXT_CFG_BOOL("zve32f", ext_zve32f, false),
 +    MULTI_EXT_CFG_BOOL("zve32x", ext_zve32x, false),
      MULTI_EXT_CFG_BOOL("zve64f", ext_zve64f, false),
      MULTI_EXT_CFG_BOOL("zve64d", ext_zve64d, false),
      MULTI_EXT_CFG_BOOL("zvfbfmin", ext_zvfbfmin, false),
 diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_helper.c
 +++ b/target/riscv/cpu_helper.c
@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPURISCVState *env, vaddr *pc,
      *pc = env->xl == MXL_RV32 ? env->pc & UINT32_MAX : env->pc;
      *cs_base = 0;
 -    if (cpu->cfg.ext_zve32f) {
 +    if (cpu->cfg.ext_zve32x) {
          /*
           * If env->vl equals to VLMAX, we can use generic vector operation
           * expanders (GVEC) to accerlate the vector operations.
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
@@ -XXX,XX +XXX,XX @@ static RISCVException fs(CPURISCVState *env, int csrno)
  static RISCVException vs(CPURISCVState *env, int csrno)
  {
 -    if (riscv_cpu_cfg(env)->ext_zve32f) {
 +    if (riscv_cpu_cfg(env)->ext_zve32x) {
  #if !defined(CONFIG_USER_ONLY)
          if (!env->debugger && !riscv_cpu_vector_enabled(env)) {
              return RISCV_EXCP_ILLEGAL_INST;
 diff --git a/target/riscv/tcg/tcg-cpu.c b/target/riscv/tcg/tcg-cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/tcg/tcg-cpu.c
 +++ b/target/riscv/tcg/tcg-cpu.c
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
          return;
      }
-     return false;
- }
+-    if (cpu->cfg.ext_zve32f && !riscv_has_ext(env, RVF)) {
-+
+-        error_setg(errp, "Zve32f/Zve64f extensions require F extension");
-+/* Floating-Point Scalar Move Instructions */
+-        return;
-+static bool trans_vfmv_f_s(DisasContext *s, arg_vfmv_f_s *a)
++    /* The Zve32f extension depends on the Zve32x extension */
-+{
++    if (cpu->cfg.ext_zve32f) {
-+    if (!s->vill && has_ext(s, RVF) &&
++        if (!riscv_has_ext(env, RVF)) {
-+        (s->mstatus_fs != 0) && (s->sew != 0)) {
++            error_setg(errp, "Zve32f/Zve64f extensions require F extension");
-+        unsigned int len = 8 << s->sew;
++            return;
 +
 +        vec_element_loadi(s, cpu_fpr[a->rd], a->rs2, 0);
 +        if (len < 64) {
 +            tcg_gen_ori_i64(cpu_fpr[a->rd], cpu_fpr[a->rd],
 +                            MAKE_64BIT_MASK(len, 64 - len));
 +        }
-+
++        cpu_cfg_ext_auto_update(cpu, CPU_CFG_OFFSET(ext_zve32x), true);
-+        mark_fs_dirty(s);
+     }
-+        return true;
-+    }
+     if (cpu->cfg.ext_zvfh) {
-+    return false;
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
-+}
+         cpu_cfg_ext_auto_update(cpu, CPU_CFG_OFFSET(ext_zvbc), true);
-+
+     }
-+/* vfmv.s.f vd, rs1 # vd[0] = rs1 (vs2=0) */
-+static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
+-    /*
-+{
+-     * In principle Zve*x would also suffice here, were they supported
-+    if (!s->vill && has_ext(s, RVF) && (s->sew != 0)) {
+-     * in qemu
-+        TCGv_i64 t1;
+-     */
-+        /* The instructions ignore LMUL and vector register group. */
+     if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkb || cpu->cfg.ext_zvkg ||
-+        uint32_t vlmax = s->vlen >> 3;
+          cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksed ||
-+
+-         cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
-+        /* if vl == 0, skip vector register write back */
++         cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32x) {
-+        TCGLabel *over = gen_new_label();
+         error_setg(errp,
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
+                    "Vector crypto extensions require V or Zve* extensions");
-+
+         return;
-+        /* zeroed all elements */
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
-+        tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd), vlmax, vlmax, 0);
+index XXXXXXX..XXXXXXX 100644
-+
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+        /* NaN-box f[rs1] as necessary for SEW */
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-+        t1 = tcg_temp_new_i64();
+@@ -XXX,XX +XXX,XX @@ static bool do_vsetvl(DisasContext *s, int rd, int rs1, TCGv s2)
-+        if (s->sew == MO_64 && !has_ext(s, RVD)) {
+ {
-+            tcg_gen_ori_i64(t1, cpu_fpr[a->rs1], MAKE_64BIT_MASK(32, 32));
+     TCGv s1, dst;
-+        } else {
-+            tcg_gen_mov_i64(t1, cpu_fpr[a->rs1]);
+-    if (!require_rvv(s) || !s->cfg_ptr->ext_zve32f) {
-+        }
++    if (!require_rvv(s) || !s->cfg_ptr->ext_zve32x) {
-+        vec_element_storei(s, a->rd, 0, t1);
+         return false;
-+        tcg_temp_free_i64(t1);
+     }
-+        gen_set_label(over);
-+        return true;
+@@ -XXX,XX +XXX,XX @@ static bool do_vsetivli(DisasContext *s, int rd, TCGv s1, TCGv s2)
-+    }
+ {
-+    return false;
+     TCGv dst;
-+}
 -    if (!require_rvv(s) || !s->cfg_ptr->ext_zve32f) {
 +    if (!require_rvv(s) || !s->cfg_ptr->ext_zve32x) {
          return false;
      }
 --
-.27.0
+.45.1

-[PULL 04/63] target/riscv: implementation-defined constant parameters
+[PULL 11/28] target/riscv: Add support for Zve64x extension
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Jason Chien <jason.chien@sifive.com>
-vlen is the vector register length in bits.
+Add support for Zve64x extension. Enabling Zve64f enables Zve64x and
-elen is the max element size in bits.
+enabling Zve64x enables Zve32x according to their dependency.
 vext_spec is the vector specification version, default value is v0.7.1.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Resolves: https://gitlab.com/qemu-project/qemu/-/issues/2107
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Signed-off-by: Jason Chien <jason.chien@sifive.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Frank Chang <frank.chang@sifive.com>
-Message-id: 20200623215920.2594-3-zhiwei_liu@c-sky.com
+Reviewed-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Message-ID: <20240328022343.6871-3-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h | 5 +++++
+ target/riscv/cpu_cfg.h     |  1 +
- target/riscv/cpu.c | 7 +++++++
+ target/riscv/cpu.c         |  2 ++
-files changed, 12 insertions(+)
+ target/riscv/tcg/tcg-cpu.c | 17 +++++++++++------
 files changed, 14 insertions(+), 6 deletions(-)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
+--- a/target/riscv/cpu_cfg.h
-+++ b/target/riscv/cpu.h
++++ b/target/riscv/cpu_cfg.h
-@@ -XXX,XX +XXX,XX @@ enum {
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
- #define PRIV_VERSION_1_10_0 0x00011000
+     bool ext_zve32x;
- #define PRIV_VERSION_1_11_0 0x00011100
+     bool ext_zve64f;
+     bool ext_zve64d;
-+#define VEXT_VERSION_0_07_1 0x00000701
++    bool ext_zve64x;
-+
+     bool ext_zvbb;
- #define TRANSLATE_PMP_FAIL 2
+     bool ext_zvbc;
- #define TRANSLATE_FAIL 1
+     bool ext_zvkb;
  #define TRANSLATE_SUCCESS 0
@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
      target_ulong guest_phys_fault_addr;
      target_ulong priv_ver;
 +    target_ulong vext_ver;
      target_ulong misa;
      target_ulong misa_mask;
@@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
          char *priv_spec;
          char *user_spec;
 +        uint16_t vlen;
 +        uint16_t elen;
          bool mmu;
          bool pmp;
      } cfg;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void set_priv_version(CPURISCVState *env, int priv_ver)
+@@ -XXX,XX +XXX,XX @@ const RISCVIsaExtData isa_edata_arr[] = {
-     env->priv_ver = priv_ver;
+     ISA_EXT_DATA_ENTRY(zve32x, PRIV_VERSION_1_10_0, ext_zve32x),
- }
+     ISA_EXT_DATA_ENTRY(zve64f, PRIV_VERSION_1_10_0, ext_zve64f),
+     ISA_EXT_DATA_ENTRY(zve64d, PRIV_VERSION_1_10_0, ext_zve64d),
-+static void set_vext_version(CPURISCVState *env, int vext_ver)
++    ISA_EXT_DATA_ENTRY(zve64x, PRIV_VERSION_1_10_0, ext_zve64x),
-+{
+     ISA_EXT_DATA_ENTRY(zvfbfmin, PRIV_VERSION_1_12_0, ext_zvfbfmin),
-+    env->vext_ver = vext_ver;
+     ISA_EXT_DATA_ENTRY(zvfbfwma, PRIV_VERSION_1_12_0, ext_zvfbfwma),
-+}
+     ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
-+
+@@ -XXX,XX +XXX,XX @@ const RISCVCPUMultiExtConfig riscv_cpu_extensions[] = {
- static void set_feature(CPURISCVState *env, int feature)
+     MULTI_EXT_CFG_BOOL("zve32x", ext_zve32x, false),
- {
+     MULTI_EXT_CFG_BOOL("zve64f", ext_zve64f, false),
-     env->features |= (1ULL << feature);
+     MULTI_EXT_CFG_BOOL("zve64d", ext_zve64d, false),
-@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
++    MULTI_EXT_CFG_BOOL("zve64x", ext_zve64x, false),
-     CPURISCVState *env = &cpu->env;
+     MULTI_EXT_CFG_BOOL("zvfbfmin", ext_zvfbfmin, false),
-     RISCVCPUClass *mcc = RISCV_CPU_GET_CLASS(dev);
+     MULTI_EXT_CFG_BOOL("zvfbfwma", ext_zvfbfwma, false),
-     int priv_version = PRIV_VERSION_1_11_0;
+     MULTI_EXT_CFG_BOOL("zvfh", ext_zvfh, false),
-+    int vext_version = VEXT_VERSION_0_07_1;
+diff --git a/target/riscv/tcg/tcg-cpu.c b/target/riscv/tcg/tcg-cpu.c
-     target_ulong target_misa = 0;
+index XXXXXXX..XXXXXXX 100644
-     Error *local_err = NULL;
+--- a/target/riscv/tcg/tcg-cpu.c
++++ b/target/riscv/tcg/tcg-cpu.c
-@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
      /* The Zve64d extension depends on the Zve64f extension */
      if (cpu->cfg.ext_zve64d) {
 +        if (!riscv_has_ext(env, RVD)) {
 +            error_setg(errp, "Zve64d/V extensions require D extension");
 +            return;
 +        }
          cpu_cfg_ext_auto_update(cpu, CPU_CFG_OFFSET(ext_zve64f), true);
      }
-     set_priv_version(env, priv_version);
+-    /* The Zve64f extension depends on the Zve32f extension */
-+    set_vext_version(env, vext_version);
++    /* The Zve64f extension depends on the Zve64x and Zve32f extensions */
+     if (cpu->cfg.ext_zve64f) {
-     if (cpu->cfg.mmu) {
++        cpu_cfg_ext_auto_update(cpu, CPU_CFG_OFFSET(ext_zve64x), true);
-         set_feature(env, RISCV_FEATURE_MMU);
+         cpu_cfg_ext_auto_update(cpu, CPU_CFG_OFFSET(ext_zve32f), true);
      }
 -    if (cpu->cfg.ext_zve64d && !riscv_has_ext(env, RVD)) {
 -        error_setg(errp, "Zve64d/V extensions require D extension");
 -        return;
 +    /* The Zve64x extension depends on the Zve32x extension */
 +    if (cpu->cfg.ext_zve64x) {
 +        cpu_cfg_ext_auto_update(cpu, CPU_CFG_OFFSET(ext_zve32x), true);
      }
      /* The Zve32f extension depends on the Zve32x extension */
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
          return;
      }
 -    if ((cpu->cfg.ext_zvbc || cpu->cfg.ext_zvknhb) && !cpu->cfg.ext_zve64f) {
 +    if ((cpu->cfg.ext_zvbc || cpu->cfg.ext_zvknhb) && !cpu->cfg.ext_zve64x) {
          error_setg(
              errp,
 -            "Zvbc and Zvknhb extensions require V or Zve64{f,d} extensions");
 +            "Zvbc and Zvknhb extensions require V or Zve64x extensions");
          return;
      }
 --
-.27.0
+.45.1

-[PULL 58/63] target/riscv: integer scalar move instruction
+[PULL 12/28] target/riscv: Relax vector register check in RISCV gdbstub
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Jason Chien <jason.chien@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+In current implementation, the gdbstub allows reading vector registers
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+only if V extension is supported. However, all vector extensions and
-Message-id: 20200623215920.2594-57-zhiwei_liu@c-sky.com
+vector crypto extensions have the vector registers and they all depend
 on Zve32x. The gdbstub should check for Zve32x instead.
 Signed-off-by: Jason Chien <jason.chien@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Reviewed-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20240328022343.6871-4-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/internals.h                |  6 +++
+ target/riscv/gdbstub.c | 2 +-
- target/riscv/insn32.decode              |  1 +
+file changed, 1 insertion(+), 1 deletion(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 60 +++++++++++++++++++++++++
 files changed, 67 insertions(+)
-diff --git a/target/riscv/internals.h b/target/riscv/internals.h
+diff --git a/target/riscv/gdbstub.c b/target/riscv/gdbstub.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/internals.h
+--- a/target/riscv/gdbstub.c
-+++ b/target/riscv/internals.h
++++ b/target/riscv/gdbstub.c
-@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, WD, 11, 1)
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_register_gdb_regs_for_features(CPUState *cs)
- target_ulong fclass_h(uint64_t frs1);
+                                  gdb_find_static_feature("riscv-32bit-fpu.xml"),
- target_ulong fclass_s(uint64_t frs1);
+);
- target_ulong fclass_d(uint64_t frs1);
+     }
-+
+-    if (env->misa_ext & RVV) {
-+#define SEW8  0
++    if (cpu->cfg.ext_zve32x) {
-+#define SEW16 1
+         gdb_register_coprocessor(cs, riscv_gdb_get_vector,
-+#define SEW32 2
+                                  riscv_gdb_set_vector,
-+#define SEW64 3
+                                  ricsv_gen_dynamic_vector_feature(cs, cs->gdb_num_regs),
 +
  #endif
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
  viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
  vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
  vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
 +vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vext_x_v(DisasContext *s, arg_r *a)
      tcg_temp_free_i64(tmp);
      return true;
  }
 +
 +/* Integer Scalar Move Instruction */
 +
 +static void store_element(TCGv_i64 val, TCGv_ptr base,
 +                          int ofs, int sew)
 +{
 +    switch (sew) {
 +    case MO_8:
 +        tcg_gen_st8_i64(val, base, ofs);
 +        break;
 +    case MO_16:
 +        tcg_gen_st16_i64(val, base, ofs);
 +        break;
 +    case MO_32:
 +        tcg_gen_st32_i64(val, base, ofs);
 +        break;
 +    case MO_64:
 +        tcg_gen_st_i64(val, base, ofs);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +        break;
 +    }
 +}
 +
 +/*
 + * Store vreg[idx] = val.
 + * The index must be in range of VLMAX.
 + */
 +static void vec_element_storei(DisasContext *s, int vreg,
 +                               int idx, TCGv_i64 val)
 +{
 +    store_element(val, cpu_env, endian_ofs(s, vreg, idx), s->sew);
 +}
 +
 +/* vmv.s.x vd, rs1 # vd[0] = rs1 */
 +static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
 +{
 +    if (vext_check_isa_ill(s)) {
 +        /* This instruction ignores LMUL and vector register groups */
 +        int maxsz = s->vlen >> 3;
 +        TCGv_i64 t1;
 +        TCGLabel *over = gen_new_label();
 +
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +        tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd), maxsz, maxsz, 0);
 +        if (a->rs1 == 0) {
 +            goto done;
 +        }
 +
 +        t1 = tcg_temp_new_i64();
 +        tcg_gen_extu_tl_i64(t1, cpu_gpr[a->rs1]);
 +        vec_element_storei(s, a->rd, 0, t1);
 +        tcg_temp_free_i64(t1);
 +    done:
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 --
-.27.0
+.45.1

-[PULL 11/63] target/riscv: add vector amo operations
+[PULL 13/28] target/riscv: Fix the element agnostic function problem
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Huang Tao <eric.huang@linux.alibaba.com>
-Vector AMOs operate as if aq and rl bits were zero on each element
+In RVV and vcrypto instructions, the masked and tail elements are set to 1s
-with regard to ordering relative to other instructions in the same hart.
+using vext_set_elems_1s function if the vma/vta bit is set. It is the element
-Vector AMOs provide no ordering guarantee between element operations
+agnostic policy.
 in the same vector AMO instruction
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+However, this function can't deal the big endian situation. This patch fixes
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+the problem by adding handling of such case.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-10-zhiwei_liu@c-sky.com
+Signed-off-by: Huang Tao <eric.huang@linux.alibaba.com>
 Suggested-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240325021654.6594-1-eric.huang@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  29 +++++
+ target/riscv/vector_internals.c | 22 ++++++++++++++++++++++
- target/riscv/internals.h                |   1 +
+file changed, 22 insertions(+)
  target/riscv/insn32-64.decode           |  11 ++
  target/riscv/insn32.decode              |  13 +++
  target/riscv/insn_trans/trans_rvv.inc.c | 138 ++++++++++++++++++++++
  target/riscv/vector_helper.c            | 147 ++++++++++++++++++++++++
 files changed, 339 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/vector_internals.c b/target/riscv/vector_internals.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/vector_internals.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/vector_internals.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vlhuff_v_w, void, ptr, ptr, tl, env, i32)
+@@ -XXX,XX +XXX,XX @@ void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
- DEF_HELPER_5(vlhuff_v_d, void, ptr, ptr, tl, env, i32)
+     if (tot - cnt == 0) {
- DEF_HELPER_5(vlwuff_v_w, void, ptr, ptr, tl, env, i32)
+         return ;
- DEF_HELPER_5(vlwuff_v_d, void, ptr, ptr, tl, env, i32)
+     }
 +#ifdef TARGET_RISCV64
 +DEF_HELPER_6(vamoswapw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoswapd_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoaddw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoaddd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoxorw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoxord_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoandw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoandd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoorw_v_d,   void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoord_v_d,   void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomind_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominuw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominud_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxuw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxud_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +#endif
 +DEF_HELPER_6(vamoswapw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoaddw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoxorw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoandw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoorw_v_w,   void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/internals.h
 +++ b/target/riscv/internals.h
@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, MLEN, 0, 8)
  FIELD(VDATA, VM, 8, 1)
  FIELD(VDATA, LMUL, 9, 2)
  FIELD(VDATA, NF, 11, 4)
 +FIELD(VDATA, WD, 11, 1)
  #endif
 diff --git a/target/riscv/insn32-64.decode b/target/riscv/insn32-64.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32-64.decode
 +++ b/target/riscv/insn32-64.decode
@@ -XXX,XX +XXX,XX @@ amomax_d   10100 . . ..... ..... 011 ..... 0101111 @atom_st
  amominu_d  11000 . . ..... ..... 011 ..... 0101111 @atom_st
  amomaxu_d  11100 . . ..... ..... 011 ..... 0101111 @atom_st
 +#*** Vector AMO operations (in addition to Zvamo) ***
 +vamoswapd_v     00001 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoaddd_v      00000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoxord_v      00100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoandd_v      01100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoord_v       01000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamomind_v      10000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamomaxd_v      10100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamominud_v     11000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamomaxud_v     11100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +
- # *** RV64F Standard Extension (in addition to RV32F) ***
++    if (HOST_BIG_ENDIAN) {
- fcvt_l_s   1100000  00010 ..... ... ..... 1010011 @r2_rm
++        /*
- fcvt_lu_s  1100000  00011 ..... ... ..... 1010011 @r2_rm
++         * Deal the situation when the elements are insdie
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++         * only one uint64 block including setting the
-index XXXXXXX..XXXXXXX 100644
++         * masked-off element.
---- a/target/riscv/insn32.decode
++         */
-+++ b/target/riscv/insn32.decode
++        if (((tot - 1) ^ cnt) < 8) {
-@@ -XXX,XX +XXX,XX @@
++            memset(base + H1(tot - 1), -1, tot - cnt);
- &u    imm rd
++            return;
  &shift     shamt rs1 rd
  &atomic    aq rl rs2 rs1 rd
 +&rwdvm     vm wd rd rs1 rs2
  &r2nfvm    vm rd rs1 nf
  &rnfvm     vm rd rs1 rs2 nf
@@ -XXX,XX +XXX,XX @@
  @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
  @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
  @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
 +@r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
  @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
  @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
@@ -XXX,XX +XXX,XX @@ vsxh_v     ... -11 . ..... ..... 101 ..... 0100111 @r_nfvm
  vsxw_v     ... -11 . ..... ..... 110 ..... 0100111 @r_nfvm
  vsxe_v     ... -11 . ..... ..... 111 ..... 0100111 @r_nfvm
 +#*** Vector AMO operations are encoded under the standard AMO major opcode ***
 +vamoswapw_v     00001 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoaddw_v      00000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoxorw_v      00100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoandw_v      01100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoorw_v       01000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamominw_v      10000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamomaxw_v      10100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamominuw_v     11000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamomaxuw_v     11100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +
  # *** new major opcode OP-V ***
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vleff_v, 3, r2nfvm, ldff_op, ld_us_check)
  GEN_VEXT_TRANS(vlbuff_v, 4, r2nfvm, ldff_op, ld_us_check)
  GEN_VEXT_TRANS(vlhuff_v, 5, r2nfvm, ldff_op, ld_us_check)
  GEN_VEXT_TRANS(vlwuff_v, 6, r2nfvm, ldff_op, ld_us_check)
 +
 +/*
 + *** vector atomic operation
 + */
 +typedef void gen_helper_amo(TCGv_ptr, TCGv_ptr, TCGv, TCGv_ptr,
 +                            TCGv_env, TCGv_i32);
 +
 +static bool amo_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
 +                      uint32_t data, gen_helper_amo *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, mask, index;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    index = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(index, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, index, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(index);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool amo_op(DisasContext *s, arg_rwdvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_amo *fn;
 +    static gen_helper_amo *const fnsw[9] = {
 +        /* no atomic operation */
 +        gen_helper_vamoswapw_v_w,
 +        gen_helper_vamoaddw_v_w,
 +        gen_helper_vamoxorw_v_w,
 +        gen_helper_vamoandw_v_w,
 +        gen_helper_vamoorw_v_w,
 +        gen_helper_vamominw_v_w,
 +        gen_helper_vamomaxw_v_w,
 +        gen_helper_vamominuw_v_w,
 +        gen_helper_vamomaxuw_v_w
 +    };
 +#ifdef TARGET_RISCV64
 +    static gen_helper_amo *const fnsd[18] = {
 +        gen_helper_vamoswapw_v_d,
 +        gen_helper_vamoaddw_v_d,
 +        gen_helper_vamoxorw_v_d,
 +        gen_helper_vamoandw_v_d,
 +        gen_helper_vamoorw_v_d,
 +        gen_helper_vamominw_v_d,
 +        gen_helper_vamomaxw_v_d,
 +        gen_helper_vamominuw_v_d,
 +        gen_helper_vamomaxuw_v_d,
 +        gen_helper_vamoswapd_v_d,
 +        gen_helper_vamoaddd_v_d,
 +        gen_helper_vamoxord_v_d,
 +        gen_helper_vamoandd_v_d,
 +        gen_helper_vamoord_v_d,
 +        gen_helper_vamomind_v_d,
 +        gen_helper_vamomaxd_v_d,
 +        gen_helper_vamominud_v_d,
 +        gen_helper_vamomaxud_v_d
 +    };
 +#endif
 +
 +    if (tb_cflags(s->base.tb) & CF_PARALLEL) {
 +        gen_helper_exit_atomic(cpu_env);
 +        s->base.is_jmp = DISAS_NORETURN;
 +        return true;
 +    } else {
 +        if (s->sew == 3) {
 +#ifdef TARGET_RISCV64
 +            fn = fnsd[seq];
 +#else
 +            /* Check done in amo_check(). */
 +            g_assert_not_reached();
 +#endif
 +        } else {
 +            fn = fnsw[seq];
 +        }
++        /*
++         * Otherwise, at least cross two uint64_t blocks.
++         * Set first unaligned block.
++         */
++        if (cnt % 8 != 0) {
++            uint32_t j = ROUND_UP(cnt, 8);
++            memset(base + H1(j - 1), -1, j - cnt);
++            cnt = j;
++        }
++        /* Set other 64bit aligend blocks */
 +    }
-+
+     memset(base + cnt, -1, tot - cnt);
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, WD, a->wd);
 +    return amo_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +/*
 + * There are two rules check here.
 + *
 + * 1. SEW must be at least as wide as the AMO memory element size.
 + *
 + * 2. If SEW is greater than XLEN, an illegal instruction exception is raised.
 + */
 +static bool amo_check(DisasContext *s, arg_rwdvm* a)
 +{
 +    return (!s->vill && has_ext(s, RVA) &&
 +            (!a->wd || vext_check_overlap_mask(s, a->rd, a->vm, false)) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            ((1 << s->sew) <= sizeof(target_ulong)) &&
 +            ((1 << s->sew) >= 4));
 +}
 +
 +GEN_VEXT_TRANS(vamoswapw_v, 0, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoaddw_v, 1, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoxorw_v, 2, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoandw_v, 3, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoorw_v, 4, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamominw_v, 5, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxw_v, 6, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamominuw_v, 7, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxuw_v, 8, rwdvm, amo_op, amo_check)
 +#ifdef TARGET_RISCV64
 +GEN_VEXT_TRANS(vamoswapd_v, 9, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoaddd_v, 10, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoxord_v, 11, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoandd_v, 12, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoord_v, 13, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomind_v, 14, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxd_v, 15, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamominud_v, 16, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxud_v, 17, rwdvm, amo_op, amo_check)
 +#endif
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t vext_lmul(uint32_t desc)
      return FIELD_EX32(simd_data(desc), VDATA, LMUL);
  }
-+static uint32_t vext_wd(uint32_t desc)
-+{
-+    return (simd_data(desc) >> 11) & 0x1;
-+}
-+
- /*
-  * Get vector group length in bytes. Its range is [64, 2048].
-  *
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_LDFF(vlhuff_v_w, uint16_t, uint32_t, ldhu_w, clearl)
- GEN_VEXT_LDFF(vlhuff_v_d, uint16_t, uint64_t, ldhu_d, clearq)
- GEN_VEXT_LDFF(vlwuff_v_w, uint32_t, uint32_t, ldwu_w, clearl)
- GEN_VEXT_LDFF(vlwuff_v_d, uint32_t, uint64_t, ldwu_d, clearq)
-+
-+/*
-+ *** Vector AMO Operations (Zvamo)
-+ */
-+typedef void vext_amo_noatomic_fn(void *vs3, target_ulong addr,
-+                                  uint32_t wd, uint32_t idx, CPURISCVState *env,
-+                                  uintptr_t retaddr);
-+
-+/* no atomic opreation for vector atomic insructions */
-+#define DO_SWAP(N, M) (M)
-+#define DO_AND(N, M)  (N & M)
-+#define DO_XOR(N, M)  (N ^ M)
-+#define DO_OR(N, M)   (N | M)
-+#define DO_ADD(N, M)  (N + M)
-+
-+#define GEN_VEXT_AMO_NOATOMIC_OP(NAME, ESZ, MSZ, H, DO_OP, SUF) \
-+static void                                                     \
-+vext_##NAME##_noatomic_op(void *vs3, target_ulong addr,         \
-+                          uint32_t wd, uint32_t idx,            \
-+                          CPURISCVState *env, uintptr_t retaddr)\
-+{                                                               \
-+    typedef int##ESZ##_t ETYPE;                                 \
-+    typedef int##MSZ##_t MTYPE;                                 \
-+    typedef uint##MSZ##_t UMTYPE __attribute__((unused));       \
-+    ETYPE *pe3 = (ETYPE *)vs3 + H(idx);                         \
-+    MTYPE  a = cpu_ld##SUF##_data(env, addr), b = *pe3;         \
-+                                                                \
-+    cpu_st##SUF##_data(env, addr, DO_OP(a, b));                 \
-+    if (wd) {                                                   \
-+        *pe3 = a;                                               \
-+    }                                                           \
-+}
-+
-+/* Signed min/max */
-+#define DO_MAX(N, M)  ((N) >= (M) ? (N) : (M))
-+#define DO_MIN(N, M)  ((N) >= (M) ? (M) : (N))
-+
-+/* Unsigned min/max */
-+#define DO_MAXU(N, M) DO_MAX((UMTYPE)N, (UMTYPE)M)
-+#define DO_MINU(N, M) DO_MIN((UMTYPE)N, (UMTYPE)M)
-+
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoswapw_v_w, 32, 32, H4, DO_SWAP, l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoaddw_v_w,  32, 32, H4, DO_ADD,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoxorw_v_w,  32, 32, H4, DO_XOR,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoandw_v_w,  32, 32, H4, DO_AND,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoorw_v_w,   32, 32, H4, DO_OR,   l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamominw_v_w,  32, 32, H4, DO_MIN,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomaxw_v_w,  32, 32, H4, DO_MAX,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamominuw_v_w, 32, 32, H4, DO_MINU, l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomaxuw_v_w, 32, 32, H4, DO_MAXU, l)
-+#ifdef TARGET_RISCV64
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoswapw_v_d, 64, 32, H8, DO_SWAP, l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoswapd_v_d, 64, 64, H8, DO_SWAP, q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoaddw_v_d,  64, 32, H8, DO_ADD,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoaddd_v_d,  64, 64, H8, DO_ADD,  q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoxorw_v_d,  64, 32, H8, DO_XOR,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoxord_v_d,  64, 64, H8, DO_XOR,  q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoandw_v_d,  64, 32, H8, DO_AND,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoandd_v_d,  64, 64, H8, DO_AND,  q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoorw_v_d,   64, 32, H8, DO_OR,   l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamoord_v_d,   64, 64, H8, DO_OR,   q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamominw_v_d,  64, 32, H8, DO_MIN,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomind_v_d,  64, 64, H8, DO_MIN,  q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomaxw_v_d,  64, 32, H8, DO_MAX,  l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomaxd_v_d,  64, 64, H8, DO_MAX,  q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamominuw_v_d, 64, 32, H8, DO_MINU, l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamominud_v_d, 64, 64, H8, DO_MINU, q)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomaxuw_v_d, 64, 32, H8, DO_MAXU, l)
-+GEN_VEXT_AMO_NOATOMIC_OP(vamomaxud_v_d, 64, 64, H8, DO_MAXU, q)
-+#endif
-+
-+static inline void
-+vext_amo_noatomic(void *vs3, void *v0, target_ulong base,
-+                  void *vs2, CPURISCVState *env, uint32_t desc,
-+                  vext_get_index_addr get_index_addr,
-+                  vext_amo_noatomic_fn *noatomic_op,
-+                  clear_fn *clear_elem,
-+                  uint32_t esz, uint32_t msz, uintptr_t ra)
-+{
-+    uint32_t i;
-+    target_long addr;
-+    uint32_t wd = vext_wd(desc);
-+    uint32_t vm = vext_vm(desc);
-+    uint32_t mlen = vext_mlen(desc);
-+    uint32_t vlmax = vext_maxsz(desc) / esz;
-+
-+    for (i = 0; i < env->vl; i++) {
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-+            continue;
-+        }
-+        probe_pages(env, get_index_addr(base, i, vs2), msz, ra, MMU_DATA_LOAD);
-+        probe_pages(env, get_index_addr(base, i, vs2), msz, ra, MMU_DATA_STORE);
-+    }
-+    for (i = 0; i < env->vl; i++) {
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-+            continue;
-+        }
-+        addr = get_index_addr(base, i, vs2);
-+        noatomic_op(vs3, addr, wd, i, env, ra);
-+    }
-+    clear_elem(vs3, env->vl, env->vl * esz, vlmax * esz);
-+}
-+
-+#define GEN_VEXT_AMO(NAME, MTYPE, ETYPE, INDEX_FN, CLEAR_FN)    \
-+void HELPER(NAME)(void *vs3, void *v0, target_ulong base,       \
-+                  void *vs2, CPURISCVState *env, uint32_t desc) \
-+{                                                               \
-+    vext_amo_noatomic(vs3, v0, base, vs2, env, desc,            \
-+                      INDEX_FN, vext_##NAME##_noatomic_op,      \
-+                      CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),   \
-+                      GETPC());                                 \
-+}
-+
-+#ifdef TARGET_RISCV64
-+GEN_VEXT_AMO(vamoswapw_v_d, int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoswapd_v_d, int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoaddw_v_d,  int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoaddd_v_d,  int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoxorw_v_d,  int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoxord_v_d,  int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoandw_v_d,  int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoandd_v_d,  int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoorw_v_d,   int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamoord_v_d,   int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamominw_v_d,  int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamomind_v_d,  int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamomaxw_v_d,  int32_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamomaxd_v_d,  int64_t,  int64_t,  idx_d, clearq)
-+GEN_VEXT_AMO(vamominuw_v_d, uint32_t, uint64_t, idx_d, clearq)
-+GEN_VEXT_AMO(vamominud_v_d, uint64_t, uint64_t, idx_d, clearq)
-+GEN_VEXT_AMO(vamomaxuw_v_d, uint32_t, uint64_t, idx_d, clearq)
-+GEN_VEXT_AMO(vamomaxud_v_d, uint64_t, uint64_t, idx_d, clearq)
-+#endif
-+GEN_VEXT_AMO(vamoswapw_v_w, int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamoaddw_v_w,  int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamoxorw_v_w,  int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamoandw_v_w,  int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamoorw_v_w,   int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamominw_v_w,  int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamomaxw_v_w,  int32_t,  int32_t,  idx_w, clearl)
-+GEN_VEXT_AMO(vamominuw_v_w, uint32_t, uint32_t, idx_w, clearl)
-+GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
 --
-.27.0
+.45.1

-[PULL 57/63] target/riscv: integer extract instruction
+[PULL 14/28] target/riscv/cpu.c: fix Zvkb extension config
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yangyu Chen <cyy@cyyself.name>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This code has a typo that writes zvkb to zvkg, causing users can't
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+enable zvkb through the config. This patch gets this fixed.
-Message-id: 20200623215920.2594-56-zhiwei_liu@c-sky.com
 Signed-off-by: Yangyu Chen <cyy@cyyself.name>
 Fixes: ea61ef7097d0 ("target/riscv: Move vector crypto extensions to riscv_cpu_extensions")
 Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Max Chou <max.chou@sifive.com>
 Reviewed-by:  Weiwei Li <liwei1518@gmail.com>
 Message-ID: <tencent_7E34EEF0F90B9A68BF38BEE09EC6D4877C0A@qq.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn32.decode              |   1 +
+ target/riscv/cpu.c | 2 +-
- target/riscv/insn_trans/trans_rvv.inc.c | 116 ++++++++++++++++++++++++
+file changed, 1 insertion(+), 1 deletion(-)
 files changed, 117 insertions(+)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
+@@ -XXX,XX +XXX,XX @@ const RISCVCPUMultiExtConfig riscv_cpu_extensions[] = {
- vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
+     /* Vector cryptography extensions */
- viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
+     MULTI_EXT_CFG_BOOL("zvbb", ext_zvbb, false),
- vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
+     MULTI_EXT_CFG_BOOL("zvbc", ext_zvbc, false),
-+vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
+-    MULTI_EXT_CFG_BOOL("zvkb", ext_zvkg, false),
++    MULTI_EXT_CFG_BOOL("zvkb", ext_zvkb, false),
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+     MULTI_EXT_CFG_BOOL("zvkg", ext_zvkg, false),
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+     MULTI_EXT_CFG_BOOL("zvkned", ext_zvkned, false),
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+     MULTI_EXT_CFG_BOOL("zvknha", ext_zvknha, false),
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
      }
      return false;
  }
 +
 +/*
 + *** Vector Permutation Instructions
 + */
 +
 +/* Integer Extract Instruction */
 +
 +static void load_element(TCGv_i64 dest, TCGv_ptr base,
 +                         int ofs, int sew)
 +{
 +    switch (sew) {
 +    case MO_8:
 +        tcg_gen_ld8u_i64(dest, base, ofs);
 +        break;
 +    case MO_16:
 +        tcg_gen_ld16u_i64(dest, base, ofs);
 +        break;
 +    case MO_32:
 +        tcg_gen_ld32u_i64(dest, base, ofs);
 +        break;
 +    case MO_64:
 +        tcg_gen_ld_i64(dest, base, ofs);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +        break;
 +    }
 +}
 +
 +/* offset of the idx element with base regsiter r */
 +static uint32_t endian_ofs(DisasContext *s, int r, int idx)
 +{
 +#ifdef HOST_WORDS_BIGENDIAN
 +    return vreg_ofs(s, r) + ((idx ^ (7 >> s->sew)) << s->sew);
 +#else
 +    return vreg_ofs(s, r) + (idx << s->sew);
 +#endif
 +}
 +
 +/* adjust the index according to the endian */
 +static void endian_adjust(TCGv_i32 ofs, int sew)
 +{
 +#ifdef HOST_WORDS_BIGENDIAN
 +    tcg_gen_xori_i32(ofs, ofs, 7 >> sew);
 +#endif
 +}
 +
 +/* Load idx >= VLMAX ? 0 : vreg[idx] */
 +static void vec_element_loadx(DisasContext *s, TCGv_i64 dest,
 +                              int vreg, TCGv idx, int vlmax)
 +{
 +    TCGv_i32 ofs = tcg_temp_new_i32();
 +    TCGv_ptr base = tcg_temp_new_ptr();
 +    TCGv_i64 t_idx = tcg_temp_new_i64();
 +    TCGv_i64 t_vlmax, t_zero;
 +
 +    /*
 +     * Mask the index to the length so that we do
 +     * not produce an out-of-range load.
 +     */
 +    tcg_gen_trunc_tl_i32(ofs, idx);
 +    tcg_gen_andi_i32(ofs, ofs, vlmax - 1);
 +
 +    /* Convert the index to an offset. */
 +    endian_adjust(ofs, s->sew);
 +    tcg_gen_shli_i32(ofs, ofs, s->sew);
 +
 +    /* Convert the index to a pointer. */
 +    tcg_gen_ext_i32_ptr(base, ofs);
 +    tcg_gen_add_ptr(base, base, cpu_env);
 +
 +    /* Perform the load. */
 +    load_element(dest, base,
 +                 vreg_ofs(s, vreg), s->sew);
 +    tcg_temp_free_ptr(base);
 +    tcg_temp_free_i32(ofs);
 +
 +    /* Flush out-of-range indexing to zero.  */
 +    t_vlmax = tcg_const_i64(vlmax);
 +    t_zero = tcg_const_i64(0);
 +    tcg_gen_extu_tl_i64(t_idx, idx);
 +
 +    tcg_gen_movcond_i64(TCG_COND_LTU, dest, t_idx,
 +                        t_vlmax, dest, t_zero);
 +
 +    tcg_temp_free_i64(t_vlmax);
 +    tcg_temp_free_i64(t_zero);
 +    tcg_temp_free_i64(t_idx);
 +}
 +
 +static void vec_element_loadi(DisasContext *s, TCGv_i64 dest,
 +                              int vreg, int idx)
 +{
 +    load_element(dest, cpu_env, endian_ofs(s, vreg, idx), s->sew);
 +}
 +
 +static bool trans_vext_x_v(DisasContext *s, arg_r *a)
 +{
 +    TCGv_i64 tmp = tcg_temp_new_i64();
 +    TCGv dest = tcg_temp_new();
 +
 +    if (a->rs1 == 0) {
 +        /* Special case vmv.x.s rd, vs2. */
 +        vec_element_loadi(s, tmp, a->rs2, 0);
 +    } else {
 +        /* This instruction ignores LMUL and vector register groups */
 +        int vlmax = s->vlen >> (3 + s->sew);
 +        vec_element_loadx(s, tmp, a->rs2, cpu_gpr[a->rs1], vlmax);
 +    }
 +    tcg_gen_trunc_i64_tl(dest, tmp);
 +    gen_set_gpr(a->rd, dest);
 +
 +    tcg_temp_free(dest);
 +    tcg_temp_free_i64(tmp);
 +    return true;
 +}
 --
-.27.0
+.45.1

-[PULL 08/63] target/riscv: add vector stride load and store instructions
+[PULL 15/28] target/riscv: Implement dynamic establishment of custom decoder
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Huang Tao <eric.huang@linux.alibaba.com>
-Vector strided operations access the first memory element at the base address,
+In this patch, we modify the decoder to be a freely composable data
-and then access subsequent elements at address increments given by the byte
+structure instead of a hardcoded one. It can be dynamically builded up
-offset contained in the x register specified by rs2.
+according to the extensions.
 This approach has several benefits:
 . Provides support for heterogeneous cpu architectures. As we add decoder in
    RISCVCPU, each cpu can have their own decoder, and the decoders can be
    different due to cpu's features.
 . Improve the decoding efficiency. We run the guard_func to see if the decoder
    can be added to the dynamic_decoder when building up the decoder. Therefore,
    there is no need to run the guard_func when decoding each instruction. It can
    improve the decoding efficiency
 . For vendor or dynamic cpus, it allows them to customize their own decoder
    functions to improve decoding efficiency, especially when vendor-defined
    instruction sets increase. Because of dynamic building up, it can skip the other
    decoder guard functions when decoding.
 . Pre patch for allowing adding a vendor decoder before decode_insn32() with minimal
    overhead for users that don't need this particular vendor decoder.
-Vector unit-stride operations access elements stored contiguously in memory
+Signed-off-by: Huang Tao <eric.huang@linux.alibaba.com>
-starting from the base effective address. It can been seen as a special
+Suggested-by: Christoph Muellner <christoph.muellner@vrull.eu>
-case of strided operations.
+Co-authored-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-7-zhiwei_liu@c-sky.com
+Message-ID: <20240506023607.29544-1-eric.huang@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 105 ++++++
+ target/riscv/cpu.h         |  1 +
- target/riscv/internals.h                |   5 +
+ target/riscv/tcg/tcg-cpu.h | 15 +++++++++++++++
- target/riscv/insn32.decode              |  32 ++
+ target/riscv/cpu.c         |  1 +
- target/riscv/insn_trans/trans_rvv.inc.c | 355 ++++++++++++++++++++
+ target/riscv/tcg/tcg-cpu.c | 15 +++++++++++++++
- target/riscv/translate.c                |   7 +
+ target/riscv/translate.c   | 31 +++++++++++++++----------------
- target/riscv/vector_helper.c            | 410 ++++++++++++++++++++++++
+files changed, 47 insertions(+), 16 deletions(-)
 files changed, 914 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(hyp_tlb_flush, void, env)
+@@ -XXX,XX +XXX,XX @@ struct ArchCPU {
+     uint32_t pmu_avail_ctrs;
- /* Vector functions */
+     /* Mapping of events to counters */
- DEF_HELPER_3(vsetvl, tl, env, tl, tl)
+     GHashTable *pmu_event_ctr_map;
-+DEF_HELPER_5(vlb_v_b, void, ptr, ptr, tl, env, i32)
++    const GPtrArray *decoders;
-+DEF_HELPER_5(vlb_v_b_mask, void, ptr, ptr, tl, env, i32)
+ };
-+DEF_HELPER_5(vlb_v_h, void, ptr, ptr, tl, env, i32)
-+DEF_HELPER_5(vlb_v_h_mask, void, ptr, ptr, tl, env, i32)
+ /**
-+DEF_HELPER_5(vlb_v_w, void, ptr, ptr, tl, env, i32)
+diff --git a/target/riscv/tcg/tcg-cpu.h b/target/riscv/tcg/tcg-cpu.h
 +DEF_HELPER_5(vlb_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlb_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlh_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsw_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsw_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlswu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlswu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssw_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssw_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_d, void, ptr, ptr, tl, tl, env, i32)
 diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/internals.h
+--- a/target/riscv/tcg/tcg-cpu.h
-+++ b/target/riscv/internals.h
++++ b/target/riscv/tcg/tcg-cpu.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp);
+ void riscv_tcg_cpu_finalize_features(RISCVCPU *cpu, Error **errp);
- #include "hw/registerfields.h"
+ bool riscv_cpu_tcg_compatible(RISCVCPU *cpu);
-+/* share data between vector helpers and decode code */
++struct DisasContext;
-+FIELD(VDATA, MLEN, 0, 8)
++struct RISCVCPUConfig;
-+FIELD(VDATA, VM, 8, 1)
++typedef struct RISCVDecoder {
-+FIELD(VDATA, LMUL, 9, 2)
++    bool (*guard_func)(const struct RISCVCPUConfig *);
-+FIELD(VDATA, NF, 11, 4)
++    bool (*riscv_cpu_decode_fn)(struct DisasContext *, uint32_t);
 +} RISCVDecoder;
 +
 +typedef bool (*riscv_cpu_decode_fn)(struct DisasContext *, uint32_t);
 +
 +extern const size_t decoder_table_size;
 +
 +extern const RISCVDecoder decoder_table[];
 +
 +void riscv_tcg_cpu_finalize_dynamic_decoder(RISCVCPU *cpu);
 +
  #endif
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_finalize_features(RISCVCPU *cpu, Error **errp)
- %sh10    20:10
+             error_propagate(errp, local_err);
- %csr    20:12
+             return;
- %rm     12:3
+         }
-+%nf     29:3                     !function=ex_plus_1
++        riscv_tcg_cpu_finalize_dynamic_decoder(cpu);
+     } else if (kvm_enabled()) {
- # immediates:
+         riscv_kvm_cpu_finalize_features(cpu, &local_err);
- %imm_i    20:s12
+         if (local_err != NULL) {
-@@ -XXX,XX +XXX,XX @@
+diff --git a/target/riscv/tcg/tcg-cpu.c b/target/riscv/tcg/tcg-cpu.c
- &u    imm rd
+index XXXXXXX..XXXXXXX 100644
- &shift     shamt rs1 rd
+--- a/target/riscv/tcg/tcg-cpu.c
- &atomic    aq rl rs2 rs1 rd
++++ b/target/riscv/tcg/tcg-cpu.c
-+&r2nfvm    vm rd rs1 nf
+@@ -XXX,XX +XXX,XX @@ void riscv_tcg_cpu_finalize_features(RISCVCPU *cpu, Error **errp)
-+&rnfvm     vm rd rs1 rs2 nf
+     }
+ }
- # Formats 32:
- @r       .......   ..... ..... ... ..... ....... &r                %rs2 %rs1 %rd
++void riscv_tcg_cpu_finalize_dynamic_decoder(RISCVCPU *cpu)
-@@ -XXX,XX +XXX,XX @@
++{
- @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
++    GPtrArray *dynamic_decoders;
- @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
++    dynamic_decoders = g_ptr_array_sized_new(decoder_table_size);
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
++    for (size_t i = 0; i < decoder_table_size; ++i) {
-+@r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
++        if (decoder_table[i].guard_func &&
-+@r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
++            decoder_table[i].guard_func(&cpu->cfg)) {
- @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
++            g_ptr_array_add(dynamic_decoders,
++                            (gpointer)decoder_table[i].riscv_cpu_decode_fn);
- @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
++        }
-@@ -XXX,XX +XXX,XX @@ hfence_gvma 0110001  .....  ..... 000 00000 1110011 @hfence_gvma
++    }
  hfence_vvma 0010001  .....  ..... 000 00000 1110011 @hfence_vvma
  # *** RV32V Extension ***
 +
-+# *** Vector loads and stores are encoded within LOADFP/STORE-FP ***
++    cpu->decoders = dynamic_decoders;
 +vlb_v      ... 100 . 00000 ..... 000 ..... 0000111 @r2_nfvm
 +vlh_v      ... 100 . 00000 ..... 101 ..... 0000111 @r2_nfvm
 +vlw_v      ... 100 . 00000 ..... 110 ..... 0000111 @r2_nfvm
 +vle_v      ... 000 . 00000 ..... 111 ..... 0000111 @r2_nfvm
 +vlbu_v     ... 000 . 00000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhu_v     ... 000 . 00000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwu_v     ... 000 . 00000 ..... 110 ..... 0000111 @r2_nfvm
 +vsb_v      ... 000 . 00000 ..... 000 ..... 0100111 @r2_nfvm
 +vsh_v      ... 000 . 00000 ..... 101 ..... 0100111 @r2_nfvm
 +vsw_v      ... 000 . 00000 ..... 110 ..... 0100111 @r2_nfvm
 +vse_v      ... 000 . 00000 ..... 111 ..... 0100111 @r2_nfvm
 +
 +vlsb_v     ... 110 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlsh_v     ... 110 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlsw_v     ... 110 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vlse_v     ... 010 . ..... ..... 111 ..... 0000111 @r_nfvm
 +vlsbu_v    ... 010 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlshu_v    ... 010 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlswu_v    ... 010 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vssb_v     ... 010 . ..... ..... 000 ..... 0100111 @r_nfvm
 +vssh_v     ... 010 . ..... ..... 101 ..... 0100111 @r_nfvm
 +vssw_v     ... 010 . ..... ..... 110 ..... 0100111 @r_nfvm
 +vsse_v     ... 010 . ..... ..... 111 ..... 0100111 @r_nfvm
 +
 +# *** new major opcode OP-V ***
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@
   * You should have received a copy of the GNU General Public License along with
   * this program.  If not, see <http://www.gnu.org/licenses/>.
   */
 +#include "tcg/tcg-op-gvec.h"
 +#include "tcg/tcg-gvec-desc.h"
 +#include "internals.h"
  static bool trans_vsetvl(DisasContext *ctx, arg_vsetvl *a)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_vsetvli(DisasContext *ctx, arg_vsetvli *a)
      tcg_temp_free(dst);
      return true;
  }
 +
 +/* vector register offset from env */
 +static uint32_t vreg_ofs(DisasContext *s, int reg)
 +{
 +    return offsetof(CPURISCVState, vreg) + reg * s->vlen / 8;
 +}
 +
-+/* check functions */
+ bool riscv_cpu_tcg_compatible(RISCVCPU *cpu)
-+
+ {
-+/*
+     return object_dynamic_cast(OBJECT(cpu), TYPE_RISCV_CPU_HOST) == NULL;
 + * In cpu_get_tb_cpu_state(), set VILL if RVV was not present.
 + * So RVV is also be checked in this function.
 + */
 +static bool vext_check_isa_ill(DisasContext *s)
 +{
 +    return !s->vill;
 +}
 +
 +/*
 + * There are two rules check here.
 + *
 + * 1. Vector register numbers are multiples of LMUL. (Section 3.2)
 + *
 + * 2. For all widening instructions, the destination LMUL value must also be
 + *    a supported LMUL value. (Section 11.2)
 + */
 +static bool vext_check_reg(DisasContext *s, uint32_t reg, bool widen)
 +{
 +    /*
 +     * The destination vector register group results are arranged as if both
 +     * SEW and LMUL were at twice their current settings. (Section 11.2).
 +     */
 +    int legal = widen ? 2 << s->lmul : 1 << s->lmul;
 +
 +    return !((s->lmul == 0x3 && widen) || (reg % legal));
 +}
 +
 +/*
 + * There are two rules check here.
 + *
 + * 1. The destination vector register group for a masked vector instruction can
 + *    only overlap the source mask register (v0) when LMUL=1. (Section 5.3)
 + *
 + * 2. In widen instructions and some other insturctions, like vslideup.vx,
 + *    there is no need to check whether LMUL=1.
 + */
 +static bool vext_check_overlap_mask(DisasContext *s, uint32_t vd, bool vm,
 +    bool force)
 +{
 +    return (vm != 0 || vd != 0) || (!force && (s->lmul == 0));
 +}
 +
 +/* The LMUL setting must be such that LMUL * NFIELDS <= 8. (Section 7.8) */
 +static bool vext_check_nf(DisasContext *s, uint32_t nf)
 +{
 +    return (1 << s->lmul) * nf <= 8;
 +}
 +
 +/* common translation macro */
 +#define GEN_VEXT_TRANS(NAME, SEQ, ARGTYPE, OP, CHECK)      \
 +static bool trans_##NAME(DisasContext *s, arg_##ARGTYPE *a)\
 +{                                                          \
 +    if (CHECK(s, a)) {                                     \
 +        return OP(s, a, SEQ);                              \
 +    }                                                      \
 +    return false;                                          \
 +}
 +
 +/*
 + *** unit stride load and store
 + */
 +typedef void gen_helper_ldst_us(TCGv_ptr, TCGv_ptr, TCGv,
 +                                TCGv_env, TCGv_i32);
 +
 +static bool ldst_us_trans(uint32_t vd, uint32_t rs1, uint32_t data,
 +                          gen_helper_ldst_us *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +
 +    /*
 +     * As simd_desc supports at most 256 bytes, and in this implementation,
 +     * the max vector group length is 2048 bytes. So split it into two parts.
 +     *
 +     * The first part is vlen in bytes, encoded in maxsz of simd_desc.
 +     * The second part is lmul, encoded in data of simd_desc.
 +     */
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_us_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[2][7][4] = {
 +        /* masked unit stride load */
 +        { { gen_helper_vlb_v_b_mask,  gen_helper_vlb_v_h_mask,
 +            gen_helper_vlb_v_w_mask,  gen_helper_vlb_v_d_mask },
 +          { NULL,                     gen_helper_vlh_v_h_mask,
 +            gen_helper_vlh_v_w_mask,  gen_helper_vlh_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vlw_v_w_mask,  gen_helper_vlw_v_d_mask },
 +          { gen_helper_vle_v_b_mask,  gen_helper_vle_v_h_mask,
 +            gen_helper_vle_v_w_mask,  gen_helper_vle_v_d_mask },
 +          { gen_helper_vlbu_v_b_mask, gen_helper_vlbu_v_h_mask,
 +            gen_helper_vlbu_v_w_mask, gen_helper_vlbu_v_d_mask },
 +          { NULL,                     gen_helper_vlhu_v_h_mask,
 +            gen_helper_vlhu_v_w_mask, gen_helper_vlhu_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vlwu_v_w_mask, gen_helper_vlwu_v_d_mask } },
 +        /* unmasked unit stride load */
 +        { { gen_helper_vlb_v_b,  gen_helper_vlb_v_h,
 +            gen_helper_vlb_v_w,  gen_helper_vlb_v_d },
 +          { NULL,                gen_helper_vlh_v_h,
 +            gen_helper_vlh_v_w,  gen_helper_vlh_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vlw_v_w,  gen_helper_vlw_v_d },
 +          { gen_helper_vle_v_b,  gen_helper_vle_v_h,
 +            gen_helper_vle_v_w,  gen_helper_vle_v_d },
 +          { gen_helper_vlbu_v_b, gen_helper_vlbu_v_h,
 +            gen_helper_vlbu_v_w, gen_helper_vlbu_v_d },
 +          { NULL,                gen_helper_vlhu_v_h,
 +            gen_helper_vlhu_v_w, gen_helper_vlhu_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vlwu_v_w, gen_helper_vlwu_v_d } }
 +    };
 +
 +    fn =  fns[a->vm][seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_us_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
 +static bool ld_us_check(DisasContext *s, arg_r2nfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlb_v, 0, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlh_v, 1, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlw_v, 2, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vle_v, 3, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlbu_v, 4, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhu_v, 5, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwu_v, 6, r2nfvm, ld_us_op, ld_us_check)
 +
 +static bool st_us_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[2][4][4] = {
 +        /* masked unit stride load and store */
 +        { { gen_helper_vsb_v_b_mask,  gen_helper_vsb_v_h_mask,
 +            gen_helper_vsb_v_w_mask,  gen_helper_vsb_v_d_mask },
 +          { NULL,                     gen_helper_vsh_v_h_mask,
 +            gen_helper_vsh_v_w_mask,  gen_helper_vsh_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vsw_v_w_mask,  gen_helper_vsw_v_d_mask },
 +          { gen_helper_vse_v_b_mask,  gen_helper_vse_v_h_mask,
 +            gen_helper_vse_v_w_mask,  gen_helper_vse_v_d_mask } },
 +        /* unmasked unit stride store */
 +        { { gen_helper_vsb_v_b,  gen_helper_vsb_v_h,
 +            gen_helper_vsb_v_w,  gen_helper_vsb_v_d },
 +          { NULL,                gen_helper_vsh_v_h,
 +            gen_helper_vsh_v_w,  gen_helper_vsh_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vsw_v_w,  gen_helper_vsw_v_d },
 +          { gen_helper_vse_v_b,  gen_helper_vse_v_h,
 +            gen_helper_vse_v_w,  gen_helper_vse_v_d } }
 +    };
 +
 +    fn =  fns[a->vm][seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_us_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
 +static bool st_us_check(DisasContext *s, arg_r2nfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vsb_v, 0, r2nfvm, st_us_op, st_us_check)
 +GEN_VEXT_TRANS(vsh_v, 1, r2nfvm, st_us_op, st_us_check)
 +GEN_VEXT_TRANS(vsw_v, 2, r2nfvm, st_us_op, st_us_check)
 +GEN_VEXT_TRANS(vse_v, 3, r2nfvm, st_us_op, st_us_check)
 +
 +/*
 + *** stride load and store
 + */
 +typedef void gen_helper_ldst_stride(TCGv_ptr, TCGv_ptr, TCGv,
 +                                    TCGv, TCGv_env, TCGv_i32);
 +
 +static bool ldst_stride_trans(uint32_t vd, uint32_t rs1, uint32_t rs2,
 +                              uint32_t data, gen_helper_ldst_stride *fn,
 +                              DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base, stride;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    stride = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    gen_get_gpr(stride, rs2);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, stride, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free(stride);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_stride_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_stride *fn;
 +    static gen_helper_ldst_stride * const fns[7][4] = {
 +        { gen_helper_vlsb_v_b,  gen_helper_vlsb_v_h,
 +          gen_helper_vlsb_v_w,  gen_helper_vlsb_v_d },
 +        { NULL,                 gen_helper_vlsh_v_h,
 +          gen_helper_vlsh_v_w,  gen_helper_vlsh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlsw_v_w,  gen_helper_vlsw_v_d },
 +        { gen_helper_vlse_v_b,  gen_helper_vlse_v_h,
 +          gen_helper_vlse_v_w,  gen_helper_vlse_v_d },
 +        { gen_helper_vlsbu_v_b, gen_helper_vlsbu_v_h,
 +          gen_helper_vlsbu_v_w, gen_helper_vlsbu_v_d },
 +        { NULL,                 gen_helper_vlshu_v_h,
 +          gen_helper_vlshu_v_w, gen_helper_vlshu_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlswu_v_w, gen_helper_vlswu_v_d },
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_stride_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool ld_stride_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlsb_v, 0, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsh_v, 1, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsw_v, 2, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlse_v, 3, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsbu_v, 4, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlshu_v, 5, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlswu_v, 6, rnfvm, ld_stride_op, ld_stride_check)
 +
 +static bool st_stride_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_stride *fn;
 +    static gen_helper_ldst_stride * const fns[4][4] = {
 +        /* masked stride store */
 +        { gen_helper_vssb_v_b,  gen_helper_vssb_v_h,
 +          gen_helper_vssb_v_w,  gen_helper_vssb_v_d },
 +        { NULL,                 gen_helper_vssh_v_h,
 +          gen_helper_vssh_v_w,  gen_helper_vssh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vssw_v_w,  gen_helper_vssw_v_d },
 +        { gen_helper_vsse_v_b,  gen_helper_vsse_v_h,
 +          gen_helper_vsse_v_w,  gen_helper_vsse_v_d }
 +    };
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    return ldst_stride_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool st_stride_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vssb_v, 0, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vssh_v, 1, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vssw_v, 2, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vsse_v, 3, rnfvm, st_stride_op, st_stride_check)
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
+@@ -XXX,XX +XXX,XX @@
+ #include "exec/helper-info.c.inc"
+ #undef  HELPER_H
++#include "tcg/tcg-cpu.h"
++
+ /* global register indices */
+ static TCGv cpu_gpr[32], cpu_gprh[32], cpu_pc, cpu_vl, cpu_vstart;
+ static TCGv_i64 cpu_fpr[32]; /* assume F and D extensions */
 @@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
-     uint8_t lmul;
+     /* FRM is known to contain a valid value. */
-     uint8_t sew;
+     bool frm_valid;
-     uint16_t vlen;
+     bool insn_start_updated;
-+    uint16_t mlen;
++    const GPtrArray *decoders;
      bool vl_eq_vlmax;
  } DisasContext;
-@@ -XXX,XX +XXX,XX @@ static void decode_RV32_64C(DisasContext *ctx, uint16_t opcode)
+ static inline bool has_ext(DisasContext *ctx, uint32_t ext)
-     }
+@@ -XXX,XX +XXX,XX @@ static inline int insn_len(uint16_t first_word)
      return (first_word & 3) == 3 ? 4 : 2;
  }
-+static int ex_plus_1(DisasContext *ctx, int nf)
++const RISCVDecoder decoder_table[] = {
-+{
++    { always_true_p, decode_insn32 },
-+    return nf + 1;
++    { has_xthead_p, decode_xthead},
-+}
++    { has_XVentanaCondOps_p, decode_XVentanaCodeOps},
 +};
 +
- #define EX_SH(amount) \
++const size_t decoder_table_size = ARRAY_SIZE(decoder_table);
-     static int ex_shift_##amount(DisasContext *ctx, int imm) \
++
-     {                                         \
+ static void decode_opc(CPURISCVState *env, DisasContext *ctx, uint16_t opcode)
  {
 -    /*
 -     * A table with predicate (i.e., guard) functions and decoder functions
 -     * that are tested in-order until a decoder matches onto the opcode.
 -     */
 -    static const struct {
 -        bool (*guard_func)(const RISCVCPUConfig *);
 -        bool (*decode_func)(DisasContext *, uint32_t);
 -    } decoders[] = {
 -        { always_true_p,  decode_insn32 },
 -        { has_xthead_p, decode_xthead },
 -        { has_XVentanaCondOps_p,  decode_XVentanaCodeOps },
 -    };
 -
      ctx->virt_inst_excp = false;
      ctx->cur_insn_len = insn_len(opcode);
      /* Check for compressed insn */
@@ -XXX,XX +XXX,XX @@ static void decode_opc(CPURISCVState *env, DisasContext *ctx, uint16_t opcode)
                                               ctx->base.pc_next + 2));
          ctx->opcode = opcode32;
 -        for (size_t i = 0; i < ARRAY_SIZE(decoders); ++i) {
 -            if (decoders[i].guard_func(ctx->cfg_ptr) &&
 -                decoders[i].decode_func(ctx, opcode32)) {
 +        for (guint i = 0; i < ctx->decoders->len; ++i) {
 +            riscv_cpu_decode_fn func = g_ptr_array_index(ctx->decoders, i);
 +            if (func(ctx, opcode32)) {
                  return;
              }
          }
 @@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
-     ctx->vill = FIELD_EX32(tb_flags, TB_FLAGS, VILL);
+     ctx->itrigger = FIELD_EX32(tb_flags, TB_FLAGS, ITRIGGER);
-     ctx->sew = FIELD_EX32(tb_flags, TB_FLAGS, SEW);
+     ctx->zero = tcg_constant_tl(0);
-     ctx->lmul = FIELD_EX32(tb_flags, TB_FLAGS, LMUL);
+     ctx->virt_inst_excp = false;
-+    ctx->mlen = 1 << (ctx->sew  + 3 - ctx->lmul);
++    ctx->decoders = cpu->decoders;
      ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
  }
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+ static void riscv_tr_tb_start(DisasContextBase *db, CPUState *cpu)
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "cpu.h"
 +#include "exec/memop.h"
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
 +#include "tcg/tcg-gvec-desc.h"
 +#include "internals.h"
  #include <math.h>
  target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
      env->vstart = 0;
      return vl;
  }
 +
 +/*
 + * Note that vector data is stored in host-endian 64-bit chunks,
 + * so addressing units smaller than that needs a host-endian fixup.
 + */
 +#ifdef HOST_WORDS_BIGENDIAN
 +#define H1(x)   ((x) ^ 7)
 +#define H1_2(x) ((x) ^ 6)
 +#define H1_4(x) ((x) ^ 4)
 +#define H2(x)   ((x) ^ 3)
 +#define H4(x)   ((x) ^ 1)
 +#define H8(x)   ((x))
 +#else
 +#define H1(x)   (x)
 +#define H1_2(x) (x)
 +#define H1_4(x) (x)
 +#define H2(x)   (x)
 +#define H4(x)   (x)
 +#define H8(x)   (x)
 +#endif
 +
 +static inline uint32_t vext_nf(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, NF);
 +}
 +
 +static inline uint32_t vext_mlen(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, MLEN);
 +}
 +
 +static inline uint32_t vext_vm(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, VM);
 +}
 +
 +static inline uint32_t vext_lmul(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, LMUL);
 +}
 +
 +/*
 + * Get vector group length in bytes. Its range is [64, 2048].
 + *
 + * As simd_desc support at most 256, the max vlen is 512 bits.
 + * So vlen in bytes is encoded as maxsz.
 + */
 +static inline uint32_t vext_maxsz(uint32_t desc)
 +{
 +    return simd_maxsz(desc) << vext_lmul(desc);
 +}
 +
 +/*
 + * This function checks watchpoint before real load operation.
 + *
 + * In softmmu mode, the TLB API probe_access is enough for watchpoint check.
 + * In user mode, there is no watchpoint support now.
 + *
 + * It will trigger an exception if there is no mapping in TLB
 + * and page table walk can't fill the TLB entry. Then the guest
 + * software can return here after process the exception or never return.
 + */
 +static void probe_pages(CPURISCVState *env, target_ulong addr,
 +                        target_ulong len, uintptr_t ra,
 +                        MMUAccessType access_type)
 +{
 +    target_ulong pagelen = -(addr | TARGET_PAGE_MASK);
 +    target_ulong curlen = MIN(pagelen, len);
 +
 +    probe_access(env, addr, curlen, access_type,
 +                 cpu_mmu_index(env, false), ra);
 +    if (len > curlen) {
 +        addr += curlen;
 +        curlen = len - curlen;
 +        probe_access(env, addr, curlen, access_type,
 +                     cpu_mmu_index(env, false), ra);
 +    }
 +}
 +
 +#ifdef HOST_WORDS_BIGENDIAN
 +static void vext_clear(void *tail, uint32_t cnt, uint32_t tot)
 +{
 +    /*
 +     * Split the remaining range to two parts.
 +     * The first part is in the last uint64_t unit.
 +     * The second part start from the next uint64_t unit.
 +     */
 +    int part1 = 0, part2 = tot - cnt;
 +    if (cnt % 8) {
 +        part1 = 8 - (cnt % 8);
 +        part2 = tot - cnt - part1;
 +        memset(tail & ~(7ULL), 0, part1);
 +        memset((tail + 8) & ~(7ULL), 0, part2);
 +    } else {
 +        memset(tail, 0, part2);
 +    }
 +}
 +#else
 +static void vext_clear(void *tail, uint32_t cnt, uint32_t tot)
 +{
 +    memset(tail, 0, tot - cnt);
 +}
 +#endif
 +
 +static void clearb(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int8_t *cur = ((int8_t *)vd + H1(idx));
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +static void clearh(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int16_t *cur = ((int16_t *)vd + H2(idx));
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +static void clearl(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int32_t *cur = ((int32_t *)vd + H4(idx));
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +static void clearq(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
 +{
 +    int64_t *cur = (int64_t *)vd + idx;
 +    vext_clear(cur, cnt, tot);
 +}
 +
 +
 +static inline int vext_elem_mask(void *v0, int mlen, int index)
 +{
 +    int idx = (index * mlen) / 64;
 +    int pos = (index * mlen) % 64;
 +    return (((uint64_t *)v0)[idx] >> pos) & 1;
 +}
 +
 +/* elements operations for load and store */
 +typedef void vext_ldst_elem_fn(CPURISCVState *env, target_ulong addr,
 +                               uint32_t idx, void *vd, uintptr_t retaddr);
 +typedef void clear_fn(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot);
 +
 +#define GEN_VEXT_LD_ELEM(NAME, MTYPE, ETYPE, H, LDSUF)     \
 +static void NAME(CPURISCVState *env, abi_ptr addr,         \
 +                 uint32_t idx, void *vd, uintptr_t retaddr)\
 +{                                                          \
 +    MTYPE data;                                            \
 +    ETYPE *cur = ((ETYPE *)vd + H(idx));                   \
 +    data = cpu_##LDSUF##_data_ra(env, addr, retaddr);      \
 +    *cur = data;                                           \
 +}                                                          \
 +
 +GEN_VEXT_LD_ELEM(ldb_b, int8_t,  int8_t,  H1, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_h, int8_t,  int16_t, H2, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_w, int8_t,  int32_t, H4, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_d, int8_t,  int64_t, H8, ldsb)
 +GEN_VEXT_LD_ELEM(ldh_h, int16_t, int16_t, H2, ldsw)
 +GEN_VEXT_LD_ELEM(ldh_w, int16_t, int32_t, H4, ldsw)
 +GEN_VEXT_LD_ELEM(ldh_d, int16_t, int64_t, H8, ldsw)
 +GEN_VEXT_LD_ELEM(ldw_w, int32_t, int32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(ldw_d, int32_t, int64_t, H8, ldl)
 +GEN_VEXT_LD_ELEM(lde_b, int8_t,  int8_t,  H1, ldsb)
 +GEN_VEXT_LD_ELEM(lde_h, int16_t, int16_t, H2, ldsw)
 +GEN_VEXT_LD_ELEM(lde_w, int32_t, int32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(lde_d, int64_t, int64_t, H8, ldq)
 +GEN_VEXT_LD_ELEM(ldbu_b, uint8_t,  uint8_t,  H1, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_h, uint8_t,  uint16_t, H2, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_w, uint8_t,  uint32_t, H4, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_d, uint8_t,  uint64_t, H8, ldub)
 +GEN_VEXT_LD_ELEM(ldhu_h, uint16_t, uint16_t, H2, lduw)
 +GEN_VEXT_LD_ELEM(ldhu_w, uint16_t, uint32_t, H4, lduw)
 +GEN_VEXT_LD_ELEM(ldhu_d, uint16_t, uint64_t, H8, lduw)
 +GEN_VEXT_LD_ELEM(ldwu_w, uint32_t, uint32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(ldwu_d, uint32_t, uint64_t, H8, ldl)
 +
 +#define GEN_VEXT_ST_ELEM(NAME, ETYPE, H, STSUF)            \
 +static void NAME(CPURISCVState *env, abi_ptr addr,         \
 +                 uint32_t idx, void *vd, uintptr_t retaddr)\
 +{                                                          \
 +    ETYPE data = *((ETYPE *)vd + H(idx));                  \
 +    cpu_##STSUF##_data_ra(env, addr, data, retaddr);       \
 +}
 +
 +GEN_VEXT_ST_ELEM(stb_b, int8_t,  H1, stb)
 +GEN_VEXT_ST_ELEM(stb_h, int16_t, H2, stb)
 +GEN_VEXT_ST_ELEM(stb_w, int32_t, H4, stb)
 +GEN_VEXT_ST_ELEM(stb_d, int64_t, H8, stb)
 +GEN_VEXT_ST_ELEM(sth_h, int16_t, H2, stw)
 +GEN_VEXT_ST_ELEM(sth_w, int32_t, H4, stw)
 +GEN_VEXT_ST_ELEM(sth_d, int64_t, H8, stw)
 +GEN_VEXT_ST_ELEM(stw_w, int32_t, H4, stl)
 +GEN_VEXT_ST_ELEM(stw_d, int64_t, H8, stl)
 +GEN_VEXT_ST_ELEM(ste_b, int8_t,  H1, stb)
 +GEN_VEXT_ST_ELEM(ste_h, int16_t, H2, stw)
 +GEN_VEXT_ST_ELEM(ste_w, int32_t, H4, stl)
 +GEN_VEXT_ST_ELEM(ste_d, int64_t, H8, stq)
 +
 +/*
 + *** stride: access vector element from strided memory
 + */
 +static void
 +vext_ldst_stride(void *vd, void *v0, target_ulong base,
 +                 target_ulong stride, CPURISCVState *env,
 +                 uint32_t desc, uint32_t vm,
 +                 vext_ldst_elem_fn *ldst_elem, clear_fn *clear_elem,
 +                 uint32_t esz, uint32_t msz, uintptr_t ra,
 +                 MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        probe_pages(env, base + stride * i, nf * msz, ra, access_type);
 +    }
 +    /* do real access */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            target_ulong addr = base + stride * i + k * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +#define GEN_VEXT_LD_STRIDE(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)       \
 +void HELPER(NAME)(void *vd, void * v0, target_ulong base,               \
 +                  target_ulong stride, CPURISCVState *env,              \
 +                  uint32_t desc)                                        \
 +{                                                                       \
 +    uint32_t vm = vext_vm(desc);                                        \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, vm, LOAD_FN,      \
 +                     CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),            \
 +                     GETPC(), MMU_DATA_LOAD);                           \
 +}
 +
 +GEN_VEXT_LD_STRIDE(vlsb_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LD_STRIDE(vlsb_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlsb_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsb_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsh_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlsh_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsh_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsw_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsw_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlse_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LD_STRIDE(vlse_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlse_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlse_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LD_STRIDE(vlshu_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LD_STRIDE(vlshu_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlshu_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LD_STRIDE(vlswu_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlswu_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_STRIDE(NAME, MTYPE, ETYPE, STORE_FN)                \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  target_ulong stride, CPURISCVState *env,              \
 +                  uint32_t desc)                                        \
 +{                                                                       \
 +    uint32_t vm = vext_vm(desc);                                        \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, vm, STORE_FN,     \
 +                     NULL, sizeof(ETYPE), sizeof(MTYPE),                \
 +                     GETPC(), MMU_DATA_STORE);                          \
 +}
 +
 +GEN_VEXT_ST_STRIDE(vssb_v_b, int8_t,  int8_t,  stb_b)
 +GEN_VEXT_ST_STRIDE(vssb_v_h, int8_t,  int16_t, stb_h)
 +GEN_VEXT_ST_STRIDE(vssb_v_w, int8_t,  int32_t, stb_w)
 +GEN_VEXT_ST_STRIDE(vssb_v_d, int8_t,  int64_t, stb_d)
 +GEN_VEXT_ST_STRIDE(vssh_v_h, int16_t, int16_t, sth_h)
 +GEN_VEXT_ST_STRIDE(vssh_v_w, int16_t, int32_t, sth_w)
 +GEN_VEXT_ST_STRIDE(vssh_v_d, int16_t, int64_t, sth_d)
 +GEN_VEXT_ST_STRIDE(vssw_v_w, int32_t, int32_t, stw_w)
 +GEN_VEXT_ST_STRIDE(vssw_v_d, int32_t, int64_t, stw_d)
 +GEN_VEXT_ST_STRIDE(vsse_v_b, int8_t,  int8_t,  ste_b)
 +GEN_VEXT_ST_STRIDE(vsse_v_h, int16_t, int16_t, ste_h)
 +GEN_VEXT_ST_STRIDE(vsse_v_w, int32_t, int32_t, ste_w)
 +GEN_VEXT_ST_STRIDE(vsse_v_d, int64_t, int64_t, ste_d)
 +
 +/*
 + *** unit-stride: access elements stored contiguously in memory
 + */
 +
 +/* unmasked unit-stride load and store operation*/
 +static void
 +vext_ldst_us(void *vd, target_ulong base, CPURISCVState *env, uint32_t desc,
 +             vext_ldst_elem_fn *ldst_elem, clear_fn *clear_elem,
 +             uint32_t esz, uint32_t msz, uintptr_t ra,
 +             MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access */
 +    probe_pages(env, base, env->vl * nf * msz, ra, access_type);
 +    /* load bytes from guest memory */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        while (k < nf) {
 +            target_ulong addr = base + (i * nf + k) * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +/*
 + * masked unit-stride load and store operation will be a special case of stride,
 + * stride = NF * sizeof (MTYPE)
 + */
 +
 +#define GEN_VEXT_LD_US(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)           \
 +void HELPER(NAME##_mask)(void *vd, void *v0, target_ulong base,         \
 +                         CPURISCVState *env, uint32_t desc)             \
 +{                                                                       \
 +    uint32_t stride = vext_nf(desc) * sizeof(MTYPE);                    \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, false, LOAD_FN,   \
 +                     CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),            \
 +                     GETPC(), MMU_DATA_LOAD);                           \
 +}                                                                       \
 +                                                                        \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  CPURISCVState *env, uint32_t desc)                    \
 +{                                                                       \
 +    vext_ldst_us(vd, base, env, desc, LOAD_FN, CLEAR_FN,                \
 +                 sizeof(ETYPE), sizeof(MTYPE), GETPC(), MMU_DATA_LOAD); \
 +}
 +
 +GEN_VEXT_LD_US(vlb_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LD_US(vlb_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LD_US(vlb_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LD_US(vlb_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LD_US(vlh_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LD_US(vlh_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LD_US(vlh_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LD_US(vlw_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LD_US(vlw_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LD_US(vle_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LD_US(vle_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LD_US(vle_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LD_US(vle_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LD_US(vlbu_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LD_US(vlbu_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LD_US(vlbu_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LD_US(vlbu_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LD_US(vlhu_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LD_US(vlhu_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LD_US(vlhu_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LD_US(vlwu_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LD_US(vlwu_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_US(NAME, MTYPE, ETYPE, STORE_FN)                    \
 +void HELPER(NAME##_mask)(void *vd, void *v0, target_ulong base,         \
 +                         CPURISCVState *env, uint32_t desc)             \
 +{                                                                       \
 +    uint32_t stride = vext_nf(desc) * sizeof(MTYPE);                    \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, false, STORE_FN,  \
 +                     NULL, sizeof(ETYPE), sizeof(MTYPE),                \
 +                     GETPC(), MMU_DATA_STORE);                          \
 +}                                                                       \
 +                                                                        \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  CPURISCVState *env, uint32_t desc)                    \
 +{                                                                       \
 +    vext_ldst_us(vd, base, env, desc, STORE_FN, NULL,                   \
 +                 sizeof(ETYPE), sizeof(MTYPE), GETPC(), MMU_DATA_STORE);\
 +}
 +
 +GEN_VEXT_ST_US(vsb_v_b, int8_t,  int8_t , stb_b)
 +GEN_VEXT_ST_US(vsb_v_h, int8_t,  int16_t, stb_h)
 +GEN_VEXT_ST_US(vsb_v_w, int8_t,  int32_t, stb_w)
 +GEN_VEXT_ST_US(vsb_v_d, int8_t,  int64_t, stb_d)
 +GEN_VEXT_ST_US(vsh_v_h, int16_t, int16_t, sth_h)
 +GEN_VEXT_ST_US(vsh_v_w, int16_t, int32_t, sth_w)
 +GEN_VEXT_ST_US(vsh_v_d, int16_t, int64_t, sth_d)
 +GEN_VEXT_ST_US(vsw_v_w, int32_t, int32_t, stw_w)
 +GEN_VEXT_ST_US(vsw_v_d, int32_t, int64_t, stw_d)
 +GEN_VEXT_ST_US(vse_v_b, int8_t,  int8_t , ste_b)
 +GEN_VEXT_ST_US(vse_v_h, int16_t, int16_t, ste_h)
 +GEN_VEXT_ST_US(vse_v_w, int32_t, int32_t, ste_w)
 +GEN_VEXT_ST_US(vse_v_d, int64_t, int64_t, ste_d)
 --
-.27.0
+.45.1

-[PULL 06/63] target/riscv: add vector configure instruction
+[PULL 16/28] riscv: thead: Add th.sxstatus CSR emulation
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Christoph Müllner <christoph.muellner@vrull.eu>
-vsetvl and vsetvli are two configure instructions for vl, vtype. TB flags
+The th.sxstatus CSR can be used to identify available custom extension
-should update after configure instructions. The (ill, lmul, sew ) of vtype
+on T-Head CPUs. The CSR is documented here:
-and the bit of (VSTART == 0 && VL == VLMAX) will be placed within tb_flags.
+  https://github.com/T-head-Semi/thead-extension-spec/blob/master/xtheadsxstatus.adoc
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+An important property of this patch is, that the th.sxstatus MAEE field
 is not set (indicating that XTheadMae is not available).
 XTheadMae is a memory attribute extension (similar to Svpbmt) which is
 implemented in many T-Head CPUs (C906, C910, etc.) and utilizes bits
 in PTEs that are marked as reserved. QEMU maintainers prefer to not
 implement XTheadMae, so we need give kernels a mechanism to identify
 if XTheadMae is available in a system or not. And this patch introduces
 this mechanism in QEMU in a way that's compatible with real HW
 (i.e., probing the th.sxstatus.MAEE bit).
 Further context can be found on the list:
 https://lists.gnu.org/archive/html/qemu-devel/2024-02/msg00775.html
 Reviewed-by: LIU Zhiwei <zhiwe_liu@linux.alibaba.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Christoph Müllner <christoph.muellner@vrull.eu>
-Message-id: 20200623215920.2594-5-zhiwei_liu@c-sky.com
+Message-ID: <20240429073656.2486732-1-christoph.muellner@vrull.eu>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h                      | 63 +++++++++++++++++---
+ MAINTAINERS              |  1 +
- target/riscv/helper.h                   |  3 +
+ target/riscv/cpu.h       |  3 ++
- target/riscv/insn32.decode              |  5 ++
+ target/riscv/cpu.c       |  1 +
- target/riscv/insn_trans/trans_rvv.inc.c | 79 +++++++++++++++++++++++++
+ target/riscv/th_csr.c    | 79 ++++++++++++++++++++++++++++++++++++++++
- target/riscv/translate.c                | 17 +++++-
+ target/riscv/meson.build |  1 +
- target/riscv/vector_helper.c            | 53 +++++++++++++++++
+files changed, 85 insertions(+)
- target/riscv/Makefile.objs              |  2 +-
+ create mode 100644 target/riscv/th_csr.c
 files changed, 210 insertions(+), 12 deletions(-)
  create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
  create mode 100644 target/riscv/vector_helper.c
+diff --git a/MAINTAINERS b/MAINTAINERS
+index XXXXXXX..XXXXXXX 100644
+--- a/MAINTAINERS
++++ b/MAINTAINERS
+@@ -XXX,XX +XXX,XX @@ L: qemu-riscv@nongnu.org
+ S: Supported
+ F: target/riscv/insn_trans/trans_xthead.c.inc
+ F: target/riscv/xthead*.decode
++F: target/riscv/th_*
+ F: disas/riscv-xthead*
+ RISC-V XVentanaCondOps extension
 diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.h
 +++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ target_ulong riscv_new_csr_seed(target_ulong new_value,
- #define RISCV_CPU_H
+ uint8_t satp_mode_max_from_map(uint32_t map);
+ const char *satp_mode_str(uint8_t satp_mode, bool is_32_bit);
- #include "hw/core/cpu.h"
-+#include "hw/registerfields.h"
++/* Implemented in th_csr.c */
- #include "exec/cpu-defs.h"
++void th_register_custom_csrs(RISCVCPU *cpu);
  #include "fpu/softfloat-types.h"
@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
  #define RV_VLEN_MAX 512
 +FIELD(VTYPE, VLMUL, 0, 2)
 +FIELD(VTYPE, VSEW, 2, 3)
 +FIELD(VTYPE, VEDIV, 5, 2)
 +FIELD(VTYPE, RESERVED, 7, sizeof(target_ulong) * 8 - 9)
 +FIELD(VTYPE, VILL, sizeof(target_ulong) * 8 - 2, 1)
 +
- struct CPURISCVState {
+ #endif /* RISCV_CPU_H */
-     target_ulong gpr[32];
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
-     uint64_t fpr[32]; /* assume both F and D extensions */
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ void riscv_cpu_set_fflags(CPURISCVState *env, target_ulong);
+--- a/target/riscv/cpu.c
- #define TB_FLAGS_MMU_MASK   3
++++ b/target/riscv/cpu.c
- #define TB_FLAGS_MSTATUS_FS MSTATUS_FS
+@@ -XXX,XX +XXX,XX @@ static void rv64_thead_c906_cpu_init(Object *obj)
+     cpu->cfg.mvendorid = THEAD_VENDOR_ID;
-+typedef CPURISCVState CPUArchState;
+ #ifndef CONFIG_USER_ONLY
-+typedef RISCVCPU ArchCPU;
+     set_satp_mode_max_supported(cpu, VM_1_10_SV39);
-+#include "exec/cpu-all.h"
++    th_register_custom_csrs(cpu);
 +
 +FIELD(TB_FLAGS, VL_EQ_VLMAX, 2, 1)
 +FIELD(TB_FLAGS, LMUL, 3, 2)
 +FIELD(TB_FLAGS, SEW, 5, 3)
 +FIELD(TB_FLAGS, VILL, 8, 1)
 +
 +/*
 + * A simplification for VLMAX
 + * = (1 << LMUL) * VLEN / (8 * (1 << SEW))
 + * = (VLEN << LMUL) / (8 << SEW)
 + * = (VLEN << LMUL) >> (SEW + 3)
 + * = VLEN >> (SEW + 3 - LMUL)
 + */
 +static inline uint32_t vext_get_vlmax(RISCVCPU *cpu, target_ulong vtype)
 +{
 +    uint8_t sew, lmul;
 +
 +    sew = FIELD_EX64(vtype, VTYPE, VSEW);
 +    lmul = FIELD_EX64(vtype, VTYPE, VLMUL);
 +    return cpu->cfg.vlen >> (sew + 3 - lmul);
 +}
 +
  static inline void cpu_get_tb_cpu_state(CPURISCVState *env, target_ulong *pc,
 -                                        target_ulong *cs_base, uint32_t *flags)
 +                                        target_ulong *cs_base, uint32_t *pflags)
  {
 +    uint32_t flags = 0;
 +
      *pc = env->pc;
      *cs_base = 0;
 +
 +    if (riscv_has_ext(env, RVV)) {
 +        uint32_t vlmax = vext_get_vlmax(env_archcpu(env), env->vtype);
 +        bool vl_eq_vlmax = (env->vstart == 0) && (vlmax == env->vl);
 +        flags = FIELD_DP32(flags, TB_FLAGS, VILL,
 +                    FIELD_EX64(env->vtype, VTYPE, VILL));
 +        flags = FIELD_DP32(flags, TB_FLAGS, SEW,
 +                    FIELD_EX64(env->vtype, VTYPE, VSEW));
 +        flags = FIELD_DP32(flags, TB_FLAGS, LMUL,
 +                    FIELD_EX64(env->vtype, VTYPE, VLMUL));
 +        flags = FIELD_DP32(flags, TB_FLAGS, VL_EQ_VLMAX, vl_eq_vlmax);
 +    } else {
 +        flags = FIELD_DP32(flags, TB_FLAGS, VILL, 1);
 +    }
 +
  #ifdef CONFIG_USER_ONLY
 -    *flags = TB_FLAGS_MSTATUS_FS;
 +    flags |= TB_FLAGS_MSTATUS_FS;
  #else
 -    *flags = cpu_mmu_index(env, 0);
 +    flags |= cpu_mmu_index(env, 0);
      if (riscv_cpu_fp_enabled(env)) {
 -        *flags |= env->mstatus & MSTATUS_FS;
 +        flags |= env->mstatus & MSTATUS_FS;
      }
  #endif
-+    *pflags = flags;
- }
+     /* inherited from parent obj via riscv_cpu_init() */
+diff --git a/target/riscv/th_csr.c b/target/riscv/th_csr.c
  int riscv_csrrw(CPURISCVState *env, int csrno, target_ulong *ret_value,
@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops);
  void riscv_cpu_register_gdb_regs_for_features(CPUState *cs);
 -typedef CPURISCVState CPUArchState;
 -typedef RISCVCPU ArchCPU;
 -
 -#include "exec/cpu-all.h"
 -
  #endif /* RISCV_CPU_H */
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(tlb_flush, void, env)
  #ifndef CONFIG_USER_ONLY
  DEF_HELPER_1(hyp_tlb_flush, void, env)
  #endif
 +
 +/* Vector functions */
 +DEF_HELPER_3(vsetvl, tl, env, tl, tl)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@
  @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
  @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
  @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
 +@r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
  @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
  @hfence_vvma ....... ..... .....   ... ..... ....... %rs2 %rs1
@@ -XXX,XX +XXX,XX @@ fcvt_d_wu  1101001  00001 ..... ... ..... 1010011 @r2_rm
  # *** RV32H Base Instruction Set ***
  hfence_gvma 0110001  .....  ..... 000 00000 1110011 @hfence_gvma
  hfence_vvma 0010001  .....  ..... 000 00000 1110011 @hfence_vvma
 +
 +# *** RV32V Extension ***
 +vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
 +vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/th_csr.c
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * RISC-V translation routines for the RVV Standard Extension.
++ * T-Head-specific CSRs.
 + *
-+ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
++ * Copyright (c) 2024 VRULL GmbH
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 + * This program is distributed in the hope it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
 + * more details.
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +static bool trans_vsetvl(DisasContext *ctx, arg_vsetvl *a)
 +{
 +    TCGv s1, s2, dst;
 +
 +    if (!has_ext(ctx, RVV)) {
 +        return false;
 +    }
 +
 +    s2 = tcg_temp_new();
 +    dst = tcg_temp_new();
 +
 +    /* Using x0 as the rs1 register specifier, encodes an infinite AVL */
 +    if (a->rs1 == 0) {
 +        /* As the mask is at least one bit, RV_VLEN_MAX is >= VLMAX */
 +        s1 = tcg_const_tl(RV_VLEN_MAX);
 +    } else {
 +        s1 = tcg_temp_new();
 +        gen_get_gpr(s1, a->rs1);
 +    }
 +    gen_get_gpr(s2, a->rs2);
 +    gen_helper_vsetvl(dst, cpu_env, s1, s2);
 +    gen_set_gpr(a->rd, dst);
 +    tcg_gen_movi_tl(cpu_pc, ctx->pc_succ_insn);
 +    lookup_and_goto_ptr(ctx);
 +    ctx->base.is_jmp = DISAS_NORETURN;
 +
 +    tcg_temp_free(s1);
 +    tcg_temp_free(s2);
 +    tcg_temp_free(dst);
 +    return true;
 +}
 +
 +static bool trans_vsetvli(DisasContext *ctx, arg_vsetvli *a)
 +{
 +    TCGv s1, s2, dst;
 +
 +    if (!has_ext(ctx, RVV)) {
 +        return false;
 +    }
 +
 +    s2 = tcg_const_tl(a->zimm);
 +    dst = tcg_temp_new();
 +
 +    /* Using x0 as the rs1 register specifier, encodes an infinite AVL */
 +    if (a->rs1 == 0) {
 +        /* As the mask is at least one bit, RV_VLEN_MAX is >= VLMAX */
 +        s1 = tcg_const_tl(RV_VLEN_MAX);
 +    } else {
 +        s1 = tcg_temp_new();
 +        gen_get_gpr(s1, a->rs1);
 +    }
 +    gen_helper_vsetvl(dst, cpu_env, s1, s2);
 +    gen_set_gpr(a->rd, dst);
 +    gen_goto_tb(ctx, 0, ctx->pc_succ_insn);
 +    ctx->base.is_jmp = DISAS_NORETURN;
 +
 +    tcg_temp_free(s1);
 +    tcg_temp_free(s2);
 +    tcg_temp_free(dst);
 +    return true;
 +}
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
         to reset this known value.  */
      int frm;
      bool ext_ifencei;
 +    /* vector extension */
 +    bool vill;
 +    uint8_t lmul;
 +    uint8_t sew;
 +    uint16_t vlen;
 +    bool vl_eq_vlmax;
  } DisasContext;
  #ifdef TARGET_RISCV64
@@ -XXX,XX +XXX,XX @@ static bool gen_shift(DisasContext *ctx, arg_r *a,
  #include "insn_trans/trans_rvf.inc.c"
  #include "insn_trans/trans_rvd.inc.c"
  #include "insn_trans/trans_rvh.inc.c"
 +#include "insn_trans/trans_rvv.inc.c"
  #include "insn_trans/trans_privileged.inc.c"
  /* Include the auto-generated decoder for 16 bit insn */
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      DisasContext *ctx = container_of(dcbase, DisasContext, base);
      CPURISCVState *env = cs->env_ptr;
      RISCVCPU *cpu = RISCV_CPU(cs);
 +    uint32_t tb_flags = ctx->base.tb->flags;
      ctx->pc_succ_insn = ctx->base.pc_first;
 -    ctx->mem_idx = ctx->base.tb->flags & TB_FLAGS_MMU_MASK;
 -    ctx->mstatus_fs = ctx->base.tb->flags & TB_FLAGS_MSTATUS_FS;
 +    ctx->mem_idx = tb_flags & TB_FLAGS_MMU_MASK;
 +    ctx->mstatus_fs = tb_flags & TB_FLAGS_MSTATUS_FS;
      ctx->priv_ver = env->priv_ver;
  #if !defined(CONFIG_USER_ONLY)
      if (riscv_has_ext(env, RVH)) {
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      ctx->misa = env->misa;
      ctx->frm = -1;  /* unknown rounding mode */
      ctx->ext_ifencei = cpu->cfg.ext_ifencei;
 +    ctx->vlen = cpu->cfg.vlen;
 +    ctx->vill = FIELD_EX32(tb_flags, TB_FLAGS, VILL);
 +    ctx->sew = FIELD_EX32(tb_flags, TB_FLAGS, SEW);
 +    ctx->lmul = FIELD_EX32(tb_flags, TB_FLAGS, LMUL);
 +    ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
  }
  static void riscv_tr_tb_start(DisasContextBase *db, CPUState *cpu)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * RISC-V Vector Extension Helpers for QEMU.
 + *
 + * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 ...
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "cpu.h"
-+#include "exec/exec-all.h"
++#include "cpu_vendorid.h"
 +#include "exec/helper-proto.h"
 +#include <math.h>
 +
-+target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
++#define CSR_TH_SXSTATUS 0x5c0
-+                            target_ulong s2)
++
 +/* TH_SXSTATUS bits */
 +#define TH_SXSTATUS_UCME        BIT(16)
 +#define TH_SXSTATUS_MAEE        BIT(21)
 +#define TH_SXSTATUS_THEADISAEE  BIT(22)
 +
 +typedef struct {
 +    int csrno;
 +    int (*insertion_test)(RISCVCPU *cpu);
 +    riscv_csr_operations csr_ops;
 +} riscv_csr;
 +
 +static RISCVException smode(CPURISCVState *env, int csrno)
 +{
-+    int vlmax, vl;
++    if (riscv_has_ext(env, RVS)) {
-+    RISCVCPU *cpu = env_archcpu(env);
++        return RISCV_EXCP_NONE;
 +    uint16_t sew = 8 << FIELD_EX64(s2, VTYPE, VSEW);
 +    uint8_t ediv = FIELD_EX64(s2, VTYPE, VEDIV);
 +    bool vill = FIELD_EX64(s2, VTYPE, VILL);
 +    target_ulong reserved = FIELD_EX64(s2, VTYPE, RESERVED);
 +
 +    if ((sew > cpu->cfg.elen) || vill || (ediv != 0) || (reserved != 0)) {
 +        /* only set vill bit. */
 +        env->vtype = FIELD_DP64(0, VTYPE, VILL, 1);
 +        env->vl = 0;
 +        env->vstart = 0;
 +        return 0;
 +    }
 +
-+    vlmax = vext_get_vlmax(cpu, s2);
++    return RISCV_EXCP_ILLEGAL_INST;
-+    if (s1 <= vlmax) {
++}
-+        vl = s1;
++
-+    } else {
++static int test_thead_mvendorid(RISCVCPU *cpu)
-+        vl = vlmax;
++{
 +    if (cpu->cfg.mvendorid != THEAD_VENDOR_ID) {
 +        return -1;
 +    }
-+    env->vl = vl;
++
-+    env->vtype = s2;
++    return 0;
 +    env->vstart = 0;
 +    return vl;
 +}
-diff --git a/target/riscv/Makefile.objs b/target/riscv/Makefile.objs
++
 +static RISCVException read_th_sxstatus(CPURISCVState *env, int csrno,
 +                                       target_ulong *val)
 +{
 +    /* We don't set MAEE here, because QEMU does not implement MAEE. */
 +    *val = TH_SXSTATUS_UCME | TH_SXSTATUS_THEADISAEE;
 +    return RISCV_EXCP_NONE;
 +}
 +
 +static riscv_csr th_csr_list[] = {
 +    {
 +        .csrno = CSR_TH_SXSTATUS,
 +        .insertion_test = test_thead_mvendorid,
 +        .csr_ops = { "th.sxstatus", smode, read_th_sxstatus }
 +    }
 +};
 +
 +void th_register_custom_csrs(RISCVCPU *cpu)
 +{
 +    for (size_t i = 0; i < ARRAY_SIZE(th_csr_list); i++) {
 +        int csrno = th_csr_list[i].csrno;
 +        riscv_csr_operations *csr_ops = &th_csr_list[i].csr_ops;
 +        if (!th_csr_list[i].insertion_test(cpu)) {
 +            riscv_set_csr_ops(csrno, csr_ops);
 +        }
 +    }
 +}
 diff --git a/target/riscv/meson.build b/target/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/Makefile.objs
+--- a/target/riscv/meson.build
-+++ b/target/riscv/Makefile.objs
++++ b/target/riscv/meson.build
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ riscv_system_ss.add(files(
--obj-y += translate.o op_helper.o cpu_helper.o cpu.o csr.o fpu_helper.o gdbstub.o
+   'monitor.c',
-+obj-y += translate.o op_helper.o cpu_helper.o cpu.o csr.o fpu_helper.o vector_helper.o gdbstub.o
+   'machine.c',
- obj-$(CONFIG_SOFTMMU) += pmp.o
+   'pmu.c',
++  'th_csr.c',
- ifeq ($(CONFIG_SOFTMMU),y)
+   'time_helper.c',
    'riscv-qmp-cmds.c',
  ))
 --
-.27.0
+.45.1

-[PULL 10/63] target/riscv: add fault-only-first unit stride load
+[PULL 17/28] target/riscv: rvv: Fix Zvfhmin checking for vfwcvt.f.f.v and vfncvt.f.f.w instructions
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-The unit-stride fault-only-fault load instructions are used to
+According v spec 18.4, only the vfwcvt.f.f.v and vfncvt.f.f.w
-vectorize loops with data-dependent exit conditions(while loops).
+instructions will be affected by Zvfhmin extension.
-These instructions execute as a regular load except that they
+And the vfwcvt.f.f.v and vfncvt.f.f.w instructions only support the
-will only take a trap on element 0.
+conversions of
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+* From 1*SEW(16/32) to 2*SEW(32/64)
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+* From 2*SEW(32/64) to 1*SEW(16/32)
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-9-zhiwei_liu@c-sky.com
+Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240322092600.1198921-2-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  22 +++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 20 ++++++++++++++++++--
- target/riscv/insn32.decode              |   7 ++
+file changed, 18 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c |  73 ++++++++++++++++
  target/riscv/vector_helper.c            | 110 ++++++++++++++++++++++++
 files changed, 212 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool require_rvf(DisasContext *s)
- DEF_HELPER_6(vsxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
+     }
- DEF_HELPER_6(vsxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
+ }
- DEF_HELPER_6(vsxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_5(vlbff_v_b, void, ptr, ptr, tl, env, i32)
++static bool require_rvfmin(DisasContext *s)
 +DEF_HELPER_5(vlbff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwuff_v_d, void, ptr, ptr, tl, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vle_v      ... 000 . 00000 ..... 111 ..... 0000111 @r2_nfvm
  vlbu_v     ... 000 . 00000 ..... 000 ..... 0000111 @r2_nfvm
  vlhu_v     ... 000 . 00000 ..... 101 ..... 0000111 @r2_nfvm
  vlwu_v     ... 000 . 00000 ..... 110 ..... 0000111 @r2_nfvm
 +vlbff_v    ... 100 . 10000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhff_v    ... 100 . 10000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwff_v    ... 100 . 10000 ..... 110 ..... 0000111 @r2_nfvm
 +vleff_v    ... 000 . 10000 ..... 111 ..... 0000111 @r2_nfvm
 +vlbuff_v   ... 000 . 10000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhuff_v   ... 000 . 10000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwuff_v   ... 000 . 10000 ..... 110 ..... 0000111 @r2_nfvm
  vsb_v      ... 000 . 00000 ..... 000 ..... 0100111 @r2_nfvm
  vsh_v      ... 000 . 00000 ..... 101 ..... 0100111 @r2_nfvm
  vsw_v      ... 000 . 00000 ..... 110 ..... 0100111 @r2_nfvm
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vsxb_v, 0, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxh_v, 1, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxw_v, 2, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxe_v, 3, rnfvm, st_index_op, st_index_check)
 +
 +/*
 + *** unit stride fault-only-first load
 + */
 +static bool ldff_trans(uint32_t vd, uint32_t rs1, uint32_t data,
 +                       gen_helper_ldst_us *fn, DisasContext *s)
 +{
-+    TCGv_ptr dest, mask;
++    if (s->mstatus_fs == EXT_STATUS_DISABLED) {
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ldff_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[7][4] = {
 +        { gen_helper_vlbff_v_b,  gen_helper_vlbff_v_h,
 +          gen_helper_vlbff_v_w,  gen_helper_vlbff_v_d },
 +        { NULL,                  gen_helper_vlhff_v_h,
 +          gen_helper_vlhff_v_w,  gen_helper_vlhff_v_d },
 +        { NULL,                  NULL,
 +          gen_helper_vlwff_v_w,  gen_helper_vlwff_v_d },
 +        { gen_helper_vleff_v_b,  gen_helper_vleff_v_h,
 +          gen_helper_vleff_v_w,  gen_helper_vleff_v_d },
 +        { gen_helper_vlbuff_v_b, gen_helper_vlbuff_v_h,
 +          gen_helper_vlbuff_v_w, gen_helper_vlbuff_v_d },
 +        { NULL,                  gen_helper_vlhuff_v_h,
 +          gen_helper_vlhuff_v_w, gen_helper_vlhuff_v_d },
 +        { NULL,                  NULL,
 +          gen_helper_vlwuff_v_w, gen_helper_vlwuff_v_d }
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
-+    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++    switch (s->sew) {
-+    data = FIELD_DP32(data, VDATA, VM, a->vm);
++    case MO_16:
-+    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++        return s->cfg_ptr->ext_zvfhmin;
-+    data = FIELD_DP32(data, VDATA, NF, a->nf);
++    case MO_32:
-+    return ldff_trans(a->rd, a->rs1, data, fn, s);
++        return s->cfg_ptr->ext_zve32f;
-+}
++    default:
-+
++        return false;
 +GEN_VEXT_TRANS(vlbff_v, 0, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhff_v, 1, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwff_v, 2, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vleff_v, 3, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlbuff_v, 4, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhuff_v, 5, r2nfvm, ldff_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwuff_v, 6, r2nfvm, ldff_op, ld_us_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_INDEX(vsxe_v_b, int8_t,  int8_t,  idx_b, ste_b)
  GEN_VEXT_ST_INDEX(vsxe_v_h, int16_t, int16_t, idx_h, ste_h)
  GEN_VEXT_ST_INDEX(vsxe_v_w, int32_t, int32_t, idx_w, ste_w)
  GEN_VEXT_ST_INDEX(vsxe_v_d, int64_t, int64_t, idx_d, ste_d)
 +
 +/*
 + *** unit-stride fault-only-fisrt load instructions
 + */
 +static inline void
 +vext_ldff(void *vd, void *v0, target_ulong base,
 +          CPURISCVState *env, uint32_t desc,
 +          vext_ldst_elem_fn *ldst_elem,
 +          clear_fn *clear_elem,
 +          uint32_t esz, uint32_t msz, uintptr_t ra)
 +{
 +    void *host;
 +    uint32_t i, k, vl = 0;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    target_ulong addr, offset, remain;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        addr = base + nf * i * msz;
 +        if (i == 0) {
 +            probe_pages(env, addr, nf * msz, ra, MMU_DATA_LOAD);
 +        } else {
 +            /* if it triggers an exception, no need to check watchpoint */
 +            remain = nf * msz;
 +            while (remain > 0) {
 +                offset = -(addr | TARGET_PAGE_MASK);
 +                host = tlb_vaddr_to_host(env, addr, MMU_DATA_LOAD,
 +                                         cpu_mmu_index(env, false));
 +                if (host) {
 +#ifdef CONFIG_USER_ONLY
 +                    if (page_check_range(addr, nf * msz, PAGE_READ) < 0) {
 +                        vl = i;
 +                        goto ProbeSuccess;
 +                    }
 +#else
 +                    probe_pages(env, addr, nf * msz, ra, MMU_DATA_LOAD);
 +#endif
 +                } else {
 +                    vl = i;
 +                    goto ProbeSuccess;
 +                }
 +                if (remain <=  offset) {
 +                    break;
 +                }
 +                remain -= offset;
 +                addr += offset;
 +            }
 +        }
 +    }
 +ProbeSuccess:
 +    /* load bytes from guest memory */
 +    if (vl != 0) {
 +        env->vl = vl;
 +    }
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            target_ulong addr = base + (i * nf + k) * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (vl != 0) {
 +        return;
 +    }
 +    for (k = 0; k < nf; k++) {
 +        clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +    }
 +}
 +
-+#define GEN_VEXT_LDFF(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)     \
+ static bool require_scale_rvf(DisasContext *s)
-+void HELPER(NAME)(void *vd, void *v0, target_ulong base,         \
+ {
-+                  CPURISCVState *env, uint32_t desc)             \
+     if (s->mstatus_fs == EXT_STATUS_DISABLED) {
-+{                                                                \
+@@ -XXX,XX +XXX,XX @@ static bool require_scale_rvfmin(DisasContext *s)
-+    vext_ldff(vd, v0, base, env, desc, LOAD_FN, CLEAR_FN,        \
+     }
-+              sizeof(ETYPE), sizeof(MTYPE), GETPC());            \
-+}
+     switch (s->sew) {
-+
+-    case MO_8:
-+GEN_VEXT_LDFF(vlbff_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
+-        return s->cfg_ptr->ext_zvfhmin;
-+GEN_VEXT_LDFF(vlbff_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
+     case MO_16:
-+GEN_VEXT_LDFF(vlbff_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
+         return s->cfg_ptr->ext_zve32f;
-+GEN_VEXT_LDFF(vlbff_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
+     case MO_32:
-+GEN_VEXT_LDFF(vlhff_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
+@@ -XXX,XX +XXX,XX @@ static bool opxfv_widen_check(DisasContext *s, arg_rmr *a)
-+GEN_VEXT_LDFF(vlhff_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
+ static bool opffv_widen_check(DisasContext *s, arg_rmr *a)
-+GEN_VEXT_LDFF(vlhff_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
+ {
-+GEN_VEXT_LDFF(vlwff_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
+     return opfv_widen_check(s, a) &&
-+GEN_VEXT_LDFF(vlwff_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
++           require_rvfmin(s) &&
-+GEN_VEXT_LDFF(vleff_v_b,  int8_t,   int8_t,   lde_b,  clearb)
+            require_scale_rvfmin(s) &&
-+GEN_VEXT_LDFF(vleff_v_h,  int16_t,  int16_t,  lde_h,  clearh)
+            (s->sew != MO_8);
-+GEN_VEXT_LDFF(vleff_v_w,  int32_t,  int32_t,  lde_w,  clearl)
+ }
-+GEN_VEXT_LDFF(vleff_v_d,  int64_t,  int64_t,  lde_d,  clearq)
+@@ -XXX,XX +XXX,XX @@ static bool opfxv_narrow_check(DisasContext *s, arg_rmr *a)
-+GEN_VEXT_LDFF(vlbuff_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
+ static bool opffv_narrow_check(DisasContext *s, arg_rmr *a)
-+GEN_VEXT_LDFF(vlbuff_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
+ {
-+GEN_VEXT_LDFF(vlbuff_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
+     return opfv_narrow_check(s, a) &&
-+GEN_VEXT_LDFF(vlbuff_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
++           require_rvfmin(s) &&
-+GEN_VEXT_LDFF(vlhuff_v_h, uint16_t, uint16_t, ldhu_h, clearh)
+            require_scale_rvfmin(s) &&
-+GEN_VEXT_LDFF(vlhuff_v_w, uint16_t, uint32_t, ldhu_w, clearl)
+            (s->sew != MO_8);
-+GEN_VEXT_LDFF(vlhuff_v_d, uint16_t, uint64_t, ldhu_d, clearq)
+ }
 +GEN_VEXT_LDFF(vlwuff_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LDFF(vlwuff_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 --
-.27.0
+.45.1

-[PULL 56/63] target/riscv: vector element index instruction
+[PULL 18/28] target/riscv: rvv: Check single width operator for vector fp widen instructions
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The require_scale_rvf function only checks the double width operator for
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+the vector floating point widen instructions, so most of the widen
-Message-id: 20200623215920.2594-55-zhiwei_liu@c-sky.com
+checking functions need to add require_rvf for single width operator.
 The vfwcvt.f.x.v and vfwcvt.f.xu.v instructions convert single width
 integer to double width float, so the opfxv_widen_check function doesn’t
 need require_rvf for the single width operator(integer).
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240322092600.1198921-3-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  5 +++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 5 +++++
- target/riscv/insn32.decode              |  2 ++
+file changed, 5 insertions(+)
  target/riscv/insn_trans/trans_rvv.inc.c | 25 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 24 ++++++++++++++++++++++++
 files changed, 56 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(viota_m_b, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
- DEF_HELPER_5(viota_m_h, void, ptr, ptr, ptr, env, i32)
+ static bool opfvv_widen_check(DisasContext *s, arg_rmrr *a)
- DEF_HELPER_5(viota_m_w, void, ptr, ptr, ptr, env, i32)
+ {
- DEF_HELPER_5(viota_m_d, void, ptr, ptr, ptr, env, i32)
+     return require_rvv(s) &&
-+
++           require_rvf(s) &&
-+DEF_HELPER_4(vid_v_b, void, ptr, ptr, env, i32)
+            require_scale_rvf(s) &&
-+DEF_HELPER_4(vid_v_h, void, ptr, ptr, env, i32)
+            (s->sew != MO_8) &&
-+DEF_HELPER_4(vid_v_w, void, ptr, ptr, env, i32)
+            vext_check_isa_ill(s) &&
-+DEF_HELPER_4(vid_v_d, void, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_WIDEN_TRANS(vfwsub_vv, opfvv_widen_check)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+ static bool opfvf_widen_check(DisasContext *s, arg_rmrr *a)
-index XXXXXXX..XXXXXXX 100644
+ {
---- a/target/riscv/insn32.decode
+     return require_rvv(s) &&
-+++ b/target/riscv/insn32.decode
++           require_rvf(s) &&
-@@ -XXX,XX +XXX,XX @@
+            require_scale_rvf(s) &&
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
+            (s->sew != MO_8) &&
- @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
+            vext_check_isa_ill(s) &&
- @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_WIDEN_TRANS(vfwsub_vf)
-+@r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
+ static bool opfwv_widen_check(DisasContext *s, arg_rmrr *a)
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+ {
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
+     return require_rvv(s) &&
- @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
++           require_rvf(s) &&
-@@ -XXX,XX +XXX,XX @@ vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
+            require_scale_rvf(s) &&
- vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
+            (s->sew != MO_8) &&
- vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
+            vext_check_isa_ill(s) &&
- viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
+@@ -XXX,XX +XXX,XX @@ GEN_OPFWV_WIDEN_TRANS(vfwsub_wv)
-+vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
+ static bool opfwf_widen_check(DisasContext *s, arg_rmrr *a)
+ {
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+     return require_rvv(s) &&
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++           require_rvf(s) &&
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+            require_scale_rvf(s) &&
-index XXXXXXX..XXXXXXX 100644
+            (s->sew != MO_8) &&
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+            vext_check_isa_ill(s) &&
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfredmin_vs, freduction_check)
-@@ -XXX,XX +XXX,XX @@ static bool trans_viota_m(DisasContext *s, arg_viota_m *a)
+ static bool freduction_widen_check(DisasContext *s, arg_rmrr *a)
-     }
+ {
-     return false;
+     return reduction_widen_check(s, a) &&
 +           require_rvf(s) &&
             require_scale_rvf(s) &&
             (s->sew != MO_8);
  }
-+
-+/* Vector Element Index Instruction */
-+static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
-+{
-+    if (vext_check_isa_ill(s) &&
-+        vext_check_reg(s, a->rd, false) &&
-+        vext_check_overlap_mask(s, a->rd, a->vm, false)) {
-+        uint32_t data = 0;
-+        TCGLabel *over = gen_new_label();
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+        static gen_helper_gvec_2_ptr * const fns[4] = {
-+            gen_helper_vid_v_b, gen_helper_vid_v_h,
-+            gen_helper_vid_v_w, gen_helper_vid_v_d,
-+        };
-+        tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
-+                           cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
-+        gen_set_label(over);
-+        return true;
-+    }
-+    return false;
-+}
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VIOTA_M(viota_m_b, uint8_t, H1, clearb)
- GEN_VEXT_VIOTA_M(viota_m_h, uint16_t, H2, clearh)
- GEN_VEXT_VIOTA_M(viota_m_w, uint32_t, H4, clearl)
- GEN_VEXT_VIOTA_M(viota_m_d, uint64_t, H8, clearq)
-+
-+/* Vector Element Index Instruction */
-+#define GEN_VEXT_VID_V(NAME, ETYPE, H, CLEAR_FN)                          \
-+void HELPER(NAME)(void *vd, void *v0, CPURISCVState *env, uint32_t desc)  \
-+{                                                                         \
-+    uint32_t mlen = vext_mlen(desc);                                      \
-+    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
-+    uint32_t vm = vext_vm(desc);                                          \
-+    uint32_t vl = env->vl;                                                \
-+    int i;                                                                \
-+                                                                          \
-+    for (i = 0; i < vl; i++) {                                            \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
-+            continue;                                                     \
-+        }                                                                 \
-+        *((ETYPE *)vd + H(i)) = i;                                        \
-+    }                                                                     \
-+    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
-+}
-+
-+GEN_VEXT_VID_V(vid_v_b, uint8_t, H1, clearb)
-+GEN_VEXT_VID_V(vid_v_h, uint16_t, H2, clearh)
-+GEN_VEXT_VID_V(vid_v_w, uint32_t, H4, clearl)
-+GEN_VEXT_VID_V(vid_v_d, uint64_t, H8, clearq)
 --
-.27.0
+.45.1

-[PULL 55/63] target/riscv: vector iota instruction
+[PULL 19/28] target/riscv: rvv: Check single width operator for vfncvt.rod.f.f.w
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The opfv_narrow_check needs to check the single width float operator by
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+require_rvf.
-Message-id: 20200623215920.2594-54-zhiwei_liu@c-sky.com
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240322092600.1198921-4-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  5 +++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 1 +
- target/riscv/insn32.decode              |  1 +
+file changed, 1 insertion(+)
  target/riscv/insn_trans/trans_rvv.inc.c | 27 +++++++++++++++++++++++
  target/riscv/vector_helper.c            | 29 +++++++++++++++++++++++++
 files changed, 62 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool opffv_narrow_check(DisasContext *s, arg_rmr *a)
- DEF_HELPER_5(vmsbf_m, void, ptr, ptr, ptr, env, i32)
+ static bool opffv_rod_narrow_check(DisasContext *s, arg_rmr *a)
  DEF_HELPER_5(vmsif_m, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_5(vmsof_m, void, ptr, ptr, ptr, env, i32)
 +
 +DEF_HELPER_5(viota_m_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(viota_m_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(viota_m_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(viota_m_d, void, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
  vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
  vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
  vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
 +viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
  GEN_M_TRANS(vmsbf_m)
  GEN_M_TRANS(vmsif_m)
  GEN_M_TRANS(vmsof_m)
 +
 +/* Vector Iota Instruction */
 +static bool trans_viota_m(DisasContext *s, arg_viota_m *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2, 1) &&
 +        (a->vm != 0 || a->rd != 0)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        static gen_helper_gvec_3_ptr * const fns[4] = {
 +            gen_helper_viota_m_b, gen_helper_viota_m_h,
 +            gen_helper_viota_m_w, gen_helper_viota_m_d,
 +        };
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,
 +                           s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vmsof_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
  {
-     vmsetm(vd, v0, vs2, env, desc, ONLY_FIRST);
+     return opfv_narrow_check(s, a) &&
 +           require_rvf(s) &&
             require_scale_rvf(s) &&
             (s->sew != MO_8);
  }
-+
-+/* Vector Iota Instruction */
-+#define GEN_VEXT_VIOTA_M(NAME, ETYPE, H, CLEAR_FN)                        \
-+void HELPER(NAME)(void *vd, void *v0, void *vs2, CPURISCVState *env,      \
-+                  uint32_t desc)                                          \
-+{                                                                         \
-+    uint32_t mlen = vext_mlen(desc);                                      \
-+    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
-+    uint32_t vm = vext_vm(desc);                                          \
-+    uint32_t vl = env->vl;                                                \
-+    uint32_t sum = 0;                                                     \
-+    int i;                                                                \
-+                                                                          \
-+    for (i = 0; i < vl; i++) {                                            \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
-+            continue;                                                     \
-+        }                                                                 \
-+        *((ETYPE *)vd + H(i)) = sum;                                      \
-+        if (vext_elem_mask(vs2, mlen, i)) {                               \
-+            sum++;                                                        \
-+        }                                                                 \
-+    }                                                                     \
-+    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
-+}
-+
-+GEN_VEXT_VIOTA_M(viota_m_b, uint8_t, H1, clearb)
-+GEN_VEXT_VIOTA_M(viota_m_h, uint16_t, H2, clearh)
-+GEN_VEXT_VIOTA_M(viota_m_w, uint32_t, H4, clearl)
-+GEN_VEXT_VIOTA_M(viota_m_d, uint64_t, H8, clearq)
 --
-.27.0
+.45.1

-[PULL 42/63] target/riscv: vector floating-point classify instructions
+[PULL 20/28] target/riscv: rvv: Remove redudant SEW checking for vector fp narrow/widen instructions
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+If the checking functions check both the single and double width
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+operators at the same time, then the single width operator checking
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+functions (require_rvf[min]) will check whether the SEW is 8.
-Message-id: 20200623215920.2594-41-zhiwei_liu@c-sky.com
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240322092600.1198921-5-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  4 ++
+ target/riscv/insn_trans/trans_rvv.c.inc | 16 ++++------------
- target/riscv/internals.h                |  5 ++
+file changed, 4 insertions(+), 12 deletions(-)
  target/riscv/insn32.decode              |  1 +
  target/riscv/fpu_helper.c               | 33 +--------
  target/riscv/insn_trans/trans_rvv.inc.c |  3 +
  target/riscv/vector_helper.c            | 91 +++++++++++++++++++++++++
 files changed, 107 insertions(+), 30 deletions(-)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmford_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool opfvv_widen_check(DisasContext *s, arg_rmrr *a)
- DEF_HELPER_6(vmford_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+     return require_rvv(s) &&
- DEF_HELPER_6(vmford_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+            require_rvf(s) &&
- DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+            require_scale_rvf(s) &&
-+
+-           (s->sew != MO_8) &&
-+DEF_HELPER_5(vfclass_v_h, void, ptr, ptr, ptr, env, i32)
+            vext_check_isa_ill(s) &&
-+DEF_HELPER_5(vfclass_v_w, void, ptr, ptr, ptr, env, i32)
+            vext_check_dss(s, a->rd, a->rs1, a->rs2, a->vm);
-+DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
+ }
-diff --git a/target/riscv/internals.h b/target/riscv/internals.h
+@@ -XXX,XX +XXX,XX @@ static bool opfvf_widen_check(DisasContext *s, arg_rmrr *a)
-index XXXXXXX..XXXXXXX 100644
+     return require_rvv(s) &&
---- a/target/riscv/internals.h
+            require_rvf(s) &&
-+++ b/target/riscv/internals.h
+            require_scale_rvf(s) &&
-@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, VM, 8, 1)
+-           (s->sew != MO_8) &&
- FIELD(VDATA, LMUL, 9, 2)
+            vext_check_isa_ill(s) &&
- FIELD(VDATA, NF, 11, 4)
+            vext_check_ds(s, a->rd, a->rs2, a->vm);
- FIELD(VDATA, WD, 11, 1)
+ }
-+
+@@ -XXX,XX +XXX,XX @@ static bool opfwv_widen_check(DisasContext *s, arg_rmrr *a)
-+/* float point classify helpers */
+     return require_rvv(s) &&
-+target_ulong fclass_h(uint64_t frs1);
+            require_rvf(s) &&
-+target_ulong fclass_s(uint64_t frs1);
+            require_scale_rvf(s) &&
-+target_ulong fclass_d(uint64_t frs1);
+-           (s->sew != MO_8) &&
- #endif
+            vext_check_isa_ill(s) &&
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+            vext_check_dds(s, a->rd, a->rs1, a->rs2, a->vm);
-index XXXXXXX..XXXXXXX 100644
+ }
---- a/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ static bool opfwf_widen_check(DisasContext *s, arg_rmrr *a)
-+++ b/target/riscv/insn32.decode
+     return require_rvv(s) &&
-@@ -XXX,XX +XXX,XX @@ vmfgt_vf        011101 . ..... ..... 101 ..... 1010111 @r_vm
+            require_rvf(s) &&
- vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
+            require_scale_rvf(s) &&
- vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
+-           (s->sew != MO_8) &&
- vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
+            vext_check_isa_ill(s) &&
-+vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
+            vext_check_dd(s, a->rd, a->rs2, a->vm);
+ }
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+@@ -XXX,XX +XXX,XX @@ static bool opffv_widen_check(DisasContext *s, arg_rmr *a)
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/fpu_helper.c b/target/riscv/fpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/fpu_helper.c
 +++ b/target/riscv/fpu_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
  #include "fpu/softfloat.h"
 +#include "internals.h"
  target_ulong riscv_cpu_get_fflags(CPURISCVState *env)
  {
-@@ -XXX,XX +XXX,XX @@ uint64_t helper_fcvt_s_lu(CPURISCVState *env, uint64_t rs1)
+     return opfv_widen_check(s, a) &&
+            require_rvfmin(s) &&
- target_ulong helper_fclass_s(uint64_t frs1)
+-           require_scale_rvfmin(s) &&
 -           (s->sew != MO_8);
 +           require_scale_rvfmin(s);
  }
  #define GEN_OPFV_WIDEN_TRANS(NAME, CHECK, HELPER, FRM)             \
@@ -XXX,XX +XXX,XX @@ static bool opffv_narrow_check(DisasContext *s, arg_rmr *a)
  {
--    float32 f = frs1;
+     return opfv_narrow_check(s, a) &&
--    bool sign = float32_is_neg(f);
+            require_rvfmin(s) &&
--
+-           require_scale_rvfmin(s) &&
--    if (float32_is_infinity(f)) {
+-           (s->sew != MO_8);
--        return sign ? 1 << 0 : 1 << 7;
++           require_scale_rvfmin(s);
 -    } else if (float32_is_zero(f)) {
 -        return sign ? 1 << 3 : 1 << 4;
 -    } else if (float32_is_zero_or_denormal(f)) {
 -        return sign ? 1 << 2 : 1 << 5;
 -    } else if (float32_is_any_nan(f)) {
 -        float_status s = { }; /* for snan_bit_is_one */
 -        return float32_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 -    } else {
 -        return sign ? 1 << 1 : 1 << 6;
 -    }
 +    return fclass_s(frs1);
  }
- uint64_t helper_fadd_d(CPURISCVState *env, uint64_t frs1, uint64_t frs2)
+ static bool opffv_rod_narrow_check(DisasContext *s, arg_rmr *a)
@@ -XXX,XX +XXX,XX @@ uint64_t helper_fcvt_d_lu(CPURISCVState *env, uint64_t rs1)
  target_ulong helper_fclass_d(uint64_t frs1)
  {
--    float64 f = frs1;
+     return opfv_narrow_check(s, a) &&
--    bool sign = float64_is_neg(f);
+            require_rvf(s) &&
--
+-           require_scale_rvf(s) &&
--    if (float64_is_infinity(f)) {
+-           (s->sew != MO_8);
--        return sign ? 1 << 0 : 1 << 7;
++           require_scale_rvf(s);
 -    } else if (float64_is_zero(f)) {
 -        return sign ? 1 << 3 : 1 << 4;
 -    } else if (float64_is_zero_or_denormal(f)) {
 -        return sign ? 1 << 2 : 1 << 5;
 -    } else if (float64_is_any_nan(f)) {
 -        float_status s = { }; /* for snan_bit_is_one */
 -        return float64_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 -    } else {
 -        return sign ? 1 << 1 : 1 << 6;
 -    }
 +    return fclass_d(frs1);
  }
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
+ #define GEN_OPFV_NARROW_TRANS(NAME, CHECK, HELPER, FRM)            \
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static bool freduction_widen_check(DisasContext *s, arg_rmrr *a)
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+ {
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vmfle_vf, opfvf_cmp_check)
+     return reduction_widen_check(s, a) &&
- GEN_OPFVF_TRANS(vmfgt_vf, opfvf_cmp_check)
+            require_rvf(s) &&
- GEN_OPFVF_TRANS(vmfge_vf, opfvf_cmp_check)
+-           require_scale_rvf(s) &&
- GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
+-           (s->sew != MO_8);
-+
++           require_scale_rvf(s);
-+/* Vector Floating-Point Classify Instruction */
+ }
-+GEN_OPFV_TRANS(vfclass_v, opfv_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+ GEN_OPFVV_WIDEN_TRANS(vfwredusum_vs, freduction_widen_check)
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VV_ENV(vmford_vv_d, uint64_t, H8, !float64_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_h, uint16_t, H2, !float16_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_w, uint32_t, H4, !float32_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_d, uint64_t, H8, !float64_unordered_quiet)
 +
 +/* Vector Floating-Point Classify Instruction */
 +#define OPIVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
 +static void do_##NAME(void *vd, void *vs2, int i)      \
 +{                                                      \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
 +    *((TD *)vd + HD(i)) = OP(s2);                      \
 +}
 +
 +#define GEN_VEXT_V(NAME, ESZ, DSZ, CLEAR_FN)           \
 +void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
 +                  CPURISCVState *env, uint32_t desc)   \
 +{                                                      \
 +    uint32_t vlmax = vext_maxsz(desc) / ESZ;           \
 +    uint32_t mlen = vext_mlen(desc);                   \
 +    uint32_t vm = vext_vm(desc);                       \
 +    uint32_t vl = env->vl;                             \
 +    uint32_t i;                                        \
 +                                                       \
 +    for (i = 0; i < vl; i++) {                         \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {     \
 +            continue;                                  \
 +        }                                              \
 +        do_##NAME(vd, vs2, i);                         \
 +    }                                                  \
 +    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);          \
 +}
 +
 +target_ulong fclass_h(uint64_t frs1)
 +{
 +    float16 f = frs1;
 +    bool sign = float16_is_neg(f);
 +
 +    if (float16_is_infinity(f)) {
 +        return sign ? 1 << 0 : 1 << 7;
 +    } else if (float16_is_zero(f)) {
 +        return sign ? 1 << 3 : 1 << 4;
 +    } else if (float16_is_zero_or_denormal(f)) {
 +        return sign ? 1 << 2 : 1 << 5;
 +    } else if (float16_is_any_nan(f)) {
 +        float_status s = { }; /* for snan_bit_is_one */
 +        return float16_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 +    } else {
 +        return sign ? 1 << 1 : 1 << 6;
 +    }
 +}
 +
 +target_ulong fclass_s(uint64_t frs1)
 +{
 +    float32 f = frs1;
 +    bool sign = float32_is_neg(f);
 +
 +    if (float32_is_infinity(f)) {
 +        return sign ? 1 << 0 : 1 << 7;
 +    } else if (float32_is_zero(f)) {
 +        return sign ? 1 << 3 : 1 << 4;
 +    } else if (float32_is_zero_or_denormal(f)) {
 +        return sign ? 1 << 2 : 1 << 5;
 +    } else if (float32_is_any_nan(f)) {
 +        float_status s = { }; /* for snan_bit_is_one */
 +        return float32_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 +    } else {
 +        return sign ? 1 << 1 : 1 << 6;
 +    }
 +}
 +
 +target_ulong fclass_d(uint64_t frs1)
 +{
 +    float64 f = frs1;
 +    bool sign = float64_is_neg(f);
 +
 +    if (float64_is_infinity(f)) {
 +        return sign ? 1 << 0 : 1 << 7;
 +    } else if (float64_is_zero(f)) {
 +        return sign ? 1 << 3 : 1 << 4;
 +    } else if (float64_is_zero_or_denormal(f)) {
 +        return sign ? 1 << 2 : 1 << 5;
 +    } else if (float64_is_any_nan(f)) {
 +        float_status s = { }; /* for snan_bit_is_one */
 +        return float64_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 +    } else {
 +        return sign ? 1 << 1 : 1 << 6;
 +    }
 +}
 +
 +RVVCALL(OPIVV1, vfclass_v_h, OP_UU_H, H2, H2, fclass_h)
 +RVVCALL(OPIVV1, vfclass_v_w, OP_UU_W, H4, H4, fclass_s)
 +RVVCALL(OPIVV1, vfclass_v_d, OP_UU_D, H8, H8, fclass_d)
 +GEN_VEXT_V(vfclass_v_h, 2, 2, clearh)
 +GEN_VEXT_V(vfclass_v_w, 4, 4, clearl)
 +GEN_VEXT_V(vfclass_v_d, 8, 8, clearq)
 --
-.27.0
+.45.1

-[PULL 53/63] target/riscv: vmfirst find-first-set mask bit
+[PULL 21/28] target/riscv: prioritize pmp errors in raise_mmu_exception()
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+raise_mmu_exception(), as is today, is prioritizing guest page faults by
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+checking first if virt_enabled && !first_stage, and then considering the
-Message-id: 20200623215920.2594-52-zhiwei_liu@c-sky.com
+regular inst/load/store faults.
 There's no mention in the spec about guest page fault being a higher
 priority that PMP faults. In fact, privileged spec section 3.7.1 says:
 "Attempting to fetch an instruction from a PMP region that does not have
 execute permissions raises an instruction access-fault exception.
 Attempting to execute a load or load-reserved instruction which accesses
 a physical address within a PMP region without read permissions raises a
 load access-fault exception. Attempting to execute a store,
 store-conditional, or AMO instruction which accesses a physical address
 within a PMP region without write permissions raises a store
 access-fault exception."
 So, in fact, we're doing it wrong - PMP faults should always be thrown,
 regardless of also being a first or second stage fault.
 The way riscv_cpu_tlb_fill() and get_physical_address() work is
 adequate: a TRANSLATE_PMP_FAIL error is immediately reported and
 reflected in the 'pmp_violation' flag. What we need is to change
 raise_mmu_exception() to prioritize it.
 Reported-by: Joseph Chan <jchan@ventanamicro.com>
 Fixes: 82d53adfbb ("target/riscv/cpu_helper.c: Invalid exception on MMU translation stage")
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20240413105929.7030-1-alexei.filippov@syntacore.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  2 ++
+ target/riscv/cpu_helper.c | 22 ++++++++++++----------
- target/riscv/insn32.decode              |  1 +
+file changed, 12 insertions(+), 10 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 19 +++++++++++++++
 files changed, 54 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu_helper.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu_helper.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void raise_mmu_exception(CPURISCVState *env, target_ulong address,
- DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+     switch (access_type) {
- DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
+     case MMU_INST_FETCH:
-+
+-        if (env->virt_enabled && !first_stage) {
-+DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
++        if (pmp_violation) {
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++            cs->exception_index = RISCV_EXCP_INST_ACCESS_FAULT;
-index XXXXXXX..XXXXXXX 100644
++        } else if (env->virt_enabled && !first_stage) {
---- a/target/riscv/insn32.decode
+             cs->exception_index = RISCV_EXCP_INST_GUEST_PAGE_FAULT;
-+++ b/target/riscv/insn32.decode
+         } else {
-@@ -XXX,XX +XXX,XX @@ vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
+-            cs->exception_index = pmp_violation ?
- vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+-                RISCV_EXCP_INST_ACCESS_FAULT : RISCV_EXCP_INST_PAGE_FAULT;
- vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
++            cs->exception_index = RISCV_EXCP_INST_PAGE_FAULT;
- vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
+         }
-+vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
+         break;
+     case MMU_DATA_LOAD:
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+-        if (two_stage && !first_stage) {
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++        if (pmp_violation) {
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++            cs->exception_index = RISCV_EXCP_LOAD_ACCESS_FAULT;
-index XXXXXXX..XXXXXXX 100644
++        } else if (two_stage && !first_stage) {
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+             cs->exception_index = RISCV_EXCP_LOAD_GUEST_ACCESS_FAULT;
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+         } else {
-@@ -XXX,XX +XXX,XX @@ static bool trans_vmpopc_m(DisasContext *s, arg_rmr *a)
+-            cs->exception_index = pmp_violation ?
-     }
+-                RISCV_EXCP_LOAD_ACCESS_FAULT : RISCV_EXCP_LOAD_PAGE_FAULT;
-     return false;
++            cs->exception_index = RISCV_EXCP_LOAD_PAGE_FAULT;
- }
+         }
-+
+         break;
-+/* vmfirst find-first-set mask bit */
+     case MMU_DATA_STORE:
-+static bool trans_vmfirst_m(DisasContext *s, arg_rmr *a)
+-        if (two_stage && !first_stage) {
-+{
++        if (pmp_violation) {
-+    if (vext_check_isa_ill(s)) {
++            cs->exception_index = RISCV_EXCP_STORE_AMO_ACCESS_FAULT;
-+        TCGv_ptr src2, mask;
++        } else if (two_stage && !first_stage) {
-+        TCGv dst;
+             cs->exception_index = RISCV_EXCP_STORE_GUEST_AMO_ACCESS_FAULT;
-+        TCGv_i32 desc;
+         } else {
-+        uint32_t data = 0;
+-            cs->exception_index = pmp_violation ?
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
+-                RISCV_EXCP_STORE_AMO_ACCESS_FAULT :
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);
+-                RISCV_EXCP_STORE_PAGE_FAULT;
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++            cs->exception_index = RISCV_EXCP_STORE_PAGE_FAULT;
-+
+         }
-+        mask = tcg_temp_new_ptr();
+         break;
-+        src2 = tcg_temp_new_ptr();
+     default:
 +        dst = tcg_temp_new();
 +        desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +        tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, a->rs2));
 +        tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +        gen_helper_vmfirst_m(dst, mask, src2, cpu_env, desc);
 +        gen_set_gpr(a->rd, dst);
 +
 +        tcg_temp_free_ptr(mask);
 +        tcg_temp_free_ptr(src2);
 +        tcg_temp_free(dst);
 +        tcg_temp_free_i32(desc);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vmpopc_m)(void *v0, void *vs2, CPURISCVState *env,
      }
      return cnt;
  }
 +
 +/* vmfirst find-first-set mask bit*/
 +target_ulong HELPER(vmfirst_m)(void *v0, void *vs2, CPURISCVState *env,
 +                               uint32_t desc)
 +{
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    int i;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (vm || vext_elem_mask(v0, mlen, i)) {
 +            if (vext_elem_mask(vs2, mlen, i)) {
 +                return i;
 +            }
 +        }
 +    }
 +    return -1LL;
 +}
 --
-.27.0
+.45.1

-[PULL 01/63] riscv: plic: Honour source priorities
+[PULL 22/28] target/riscv: do not set mtval2 for non guest-page faults
-From: Jessica Clarke <jrtc27@jrtc27.com>
+From: Alexei Filippov <alexei.filippov@syntacore.com>
-The source priorities can be used to order sources with respect to other
+Previous patch fixed the PMP priority in raise_mmu_exception() but we're still
-sources, not just as a way to enable/disable them based off a threshold.
+setting mtval2 incorrectly. In riscv_cpu_tlb_fill(), after pmp check in 2 stage
-We must therefore always claim the highest-priority source, rather than
+translation part, mtval2 will be set in case of successes 2 stage translation but
-the first source we find.
+failed pmp check.
-Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
+In this case we gonna set mtval2 via env->guest_phys_fault_addr in context of
 riscv_cpu_tlb_fill(), as this was a guest-page-fault, but it didn't and mtval2
 should be zero, according to RISCV privileged spec sect. 9.4.4: When a guest
 page-fault is taken into M-mode, mtval2 is written with either zero or guest
 physical address that faulted, shifted by 2 bits. *For other traps, mtval2
 is set to zero...*
 Signed-off-by: Alexei Filippov <alexei.filippov@syntacore.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <20200618202343.20455-1-jrtc27@jrtc27.com>
+Message-ID: <20240503103052.6819-1-alexei.filippov@syntacore.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/sifive_plic.c | 17 ++++++++++++-----
+ target/riscv/cpu_helper.c | 12 ++++++------
-file changed, 12 insertions(+), 5 deletions(-)
+file changed, 6 insertions(+), 6 deletions(-)
-diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
+diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_plic.c
+--- a/target/riscv/cpu_helper.c
-+++ b/hw/riscv/sifive_plic.c
++++ b/target/riscv/cpu_helper.c
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
+@@ -XXX,XX +XXX,XX @@ bool riscv_cpu_tlb_fill(CPUState *cs, vaddr address, int size,
- static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
+                               __func__, pa, ret, prot_pmp, tlb_size);
- {
-     int i, j;
+                 prot &= prot_pmp;
-+    uint32_t max_irq = 0;
+-            }
-+    uint32_t max_prio = plic->target_priority[addrid];
+-
-+
+-            if (ret != TRANSLATE_SUCCESS) {
-     for (i = 0; i < plic->bitfield_words; i++) {
++            } else {
-         uint32_t pending_enabled_not_claimed =
+                 /*
-             (plic->pending[i] & ~plic->claimed[i]) &
+                  * Guest physical address translation failed, this is a HS
-@@ -XXX,XX +XXX,XX @@ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
+                  * level exception
-             int irq = (i << 5) + j;
+                  */
-             uint32_t prio = plic->source_priority[irq];
+                 first_stage_error = false;
-             int enabled = pending_enabled_not_claimed & (1 << j);
+-                env->guest_phys_fault_addr = (im_address |
--            if (enabled && prio > plic->target_priority[addrid]) {
+-                                              (address &
--                sifive_plic_set_pending(plic, irq, false);
+-                                               (TARGET_PAGE_SIZE - 1))) >> 2;
--                sifive_plic_set_claimed(plic, irq, true);
++                if (ret != TRANSLATE_PMP_FAIL) {
--                return irq;
++                    env->guest_phys_fault_addr = (im_address |
-+            if (enabled && prio > max_prio) {
++                                                  (address &
-+                max_irq = irq;
++                                                   (TARGET_PAGE_SIZE - 1))) >> 2;
-+                max_prio = prio;
++                }
              }
          }
-     }
+     } else {
 -    return 0;
 +
 +    if (max_irq) {
 +        sifive_plic_set_pending(plic, max_irq, false);
 +        sifive_plic_set_claimed(plic, max_irq, true);
 +    }
 +    return max_irq;
  }
  static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
 --
-.27.0
+.45.1

-[PULL 63/63] target/riscv: configure and turn on vector extension from command line
+[PULL 23/28] target/riscv: Remove experimental prefix from "B" extension
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Rob Bradford <rbradford@rivosinc.com>
-Vector extension is default off. The only way to use vector extension is
+This extension has now been ratified:
-. use cpu rv32 or rv64
+https://jira.riscv.org/browse/RVS-2006 so the "x-" prefix can be
-. turn on it by command line
+removed.
    "-cpu rv64,x-v=true,vlen=128,elen=64,vext_spec=v0.7.1".
-vlen is the vector register length, default value is 128 bit.
+Since this is now a ratified extension add it to the list of extensions
-elen is the max operator size in bits, default value is 64 bit.
+included in the "max" CPU variant.
 vext_spec is the vector specification version, default value is v0.7.1.
 These properties can be specified with other values.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: Rob Bradford <rbradford@rivosinc.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20200623215920.2594-62-zhiwei_liu@c-sky.com
+Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Message-ID: <20240514110217.22516-1-rbradford@rivosinc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h |  4 +++-
+ target/riscv/cpu.c         | 2 +-
- target/riscv/cpu.c | 43 +++++++++++++++++++++++++++++++++++++++++++
+ target/riscv/tcg/tcg-cpu.c | 2 +-
-files changed, 46 insertions(+), 1 deletion(-)
+files changed, 2 insertions(+), 2 deletions(-)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
-+++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
- #include "pmp.h"
--#define RV_VLEN_MAX 512
-+#define RV_VLEN_MAX 256
- FIELD(VTYPE, VLMUL, 0, 2)
- FIELD(VTYPE, VSEW, 2, 3)
-@@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
-         bool ext_s;
-         bool ext_u;
-         bool ext_h;
-+        bool ext_v;
-         bool ext_counters;
-         bool ext_ifencei;
-         bool ext_icsr;
-         char *priv_spec;
-         char *user_spec;
-+        char *vext_spec;
-         uint16_t vlen;
-         uint16_t elen;
-         bool mmu;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@ static const MISAExtInfo misa_ext_info_arr[] = {
-         if (cpu->cfg.ext_h) {
+     MISA_EXT_INFO(RVJ, "x-j", "Dynamic translated languages"),
-             target_misa |= RVH;
+     MISA_EXT_INFO(RVV, "v", "Vector operations"),
-         }
+     MISA_EXT_INFO(RVG, "g", "General purpose (IMAFD_Zicsr_Zifencei)"),
-+        if (cpu->cfg.ext_v) {
+-    MISA_EXT_INFO(RVB, "x-b", "Bit manipulation (Zba_Zbb_Zbs)")
-+            target_misa |= RVV;
++    MISA_EXT_INFO(RVB, "b", "Bit manipulation (Zba_Zbb_Zbs)")
-+            if (!is_power_of_2(cpu->cfg.vlen)) {
+ };
-+                error_setg(errp,
-+                        "Vector extension VLEN must be power of 2");
+ static void riscv_cpu_validate_misa_mxl(RISCVCPUClass *mcc)
-+                return;
+diff --git a/target/riscv/tcg/tcg-cpu.c b/target/riscv/tcg/tcg-cpu.c
-+            }
+index XXXXXXX..XXXXXXX 100644
-+            if (cpu->cfg.vlen > RV_VLEN_MAX || cpu->cfg.vlen < 128) {
+--- a/target/riscv/tcg/tcg-cpu.c
-+                error_setg(errp,
++++ b/target/riscv/tcg/tcg-cpu.c
-+                        "Vector extension implementation only supports VLEN "
+@@ -XXX,XX +XXX,XX @@ static void riscv_init_max_cpu_extensions(Object *obj)
-+                        "in the range [128, %d]", RV_VLEN_MAX);
+     const RISCVCPUMultiExtConfig *prop;
-+                return;
-+            }
+     /* Enable RVG, RVJ and RVV that are disabled by default */
-+            if (!is_power_of_2(cpu->cfg.elen)) {
+-    riscv_cpu_set_misa_ext(env, env->misa_ext | RVG | RVJ | RVV);
-+                error_setg(errp,
++    riscv_cpu_set_misa_ext(env, env->misa_ext | RVB | RVG | RVJ | RVV);
-+                        "Vector extension ELEN must be power of 2");
-+                return;
+     for (prop = riscv_cpu_extensions; prop && prop->name; prop++) {
-+            }
+         isa_ext_update_enabled(cpu, prop->offset, true);
 +            if (cpu->cfg.elen > 64 || cpu->cfg.vlen < 8) {
 +                error_setg(errp,
 +                        "Vector extension implementation only supports ELEN "
 +                        "in the range [8, 64]");
 +                return;
 +            }
 +            if (cpu->cfg.vext_spec) {
 +                if (!g_strcmp0(cpu->cfg.vext_spec, "v0.7.1")) {
 +                    vext_version = VEXT_VERSION_0_07_1;
 +                } else {
 +                    error_setg(errp,
 +                           "Unsupported vector spec version '%s'",
 +                           cpu->cfg.vext_spec);
 +                    return;
 +                }
 +            } else {
 +                qemu_log("vector verison is not specified, "
 +                        "use the default value v0.7.1\n");
 +            }
 +            set_vext_version(env, vext_version);
 +        }
          set_misa(env, RVXLEN | target_misa);
      }
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
      DEFINE_PROP_BOOL("u", RISCVCPU, cfg.ext_u, true),
      /* This is experimental so mark with 'x-' */
      DEFINE_PROP_BOOL("x-h", RISCVCPU, cfg.ext_h, false),
 +    DEFINE_PROP_BOOL("x-v", RISCVCPU, cfg.ext_v, false),
      DEFINE_PROP_BOOL("Counters", RISCVCPU, cfg.ext_counters, true),
      DEFINE_PROP_BOOL("Zifencei", RISCVCPU, cfg.ext_ifencei, true),
      DEFINE_PROP_BOOL("Zicsr", RISCVCPU, cfg.ext_icsr, true),
      DEFINE_PROP_STRING("priv_spec", RISCVCPU, cfg.priv_spec),
 +    DEFINE_PROP_STRING("vext_spec", RISCVCPU, cfg.vext_spec),
 +    DEFINE_PROP_UINT16("vlen", RISCVCPU, cfg.vlen, 128),
 +    DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
      DEFINE_PROP_BOOL("mmu", RISCVCPU, cfg.mmu, true),
      DEFINE_PROP_BOOL("pmp", RISCVCPU, cfg.pmp, true),
      DEFINE_PROP_END_OF_LIST(),
 --
-.27.0
+.45.1

-[PULL 13/63] target/riscv: vector widening integer add and subtract
+[PULL 24/28] target/riscv: rvzicbo: Fixup CBO extension register calculation
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Alistair Francis <alistair23@gmail.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+When running the instruction
 ```
     cbo.flush 0(x0)
 ```
 QEMU would segfault.
 The issue was in cpu_gpr[a->rs1] as QEMU does not have cpu_gpr[0]
 allocated.
 In order to fix this let's use the existing get_address()
 helper. This also has the benefit of performing pointer mask
 calculations on the address specified in rs1.
 The pointer masking specificiation specifically states:
 """
 Cache Management Operations: All instructions in Zicbom, Zicbop and Zicboz
 """
 So this is the correct behaviour and we previously have been incorrectly
 not masking the address.
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 Reported-by: Fabian Thomas <fabian.thomas@cispa.de>
 Fixes: e05da09b7cfd ("target/riscv: implement Zicbom extension")
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Cc: qemu-stable <qemu-stable@nongnu.org>
-Message-id: 20200623215920.2594-12-zhiwei_liu@c-sky.com
+Message-ID: <20240514023910.301766-1-alistair.francis@wdc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  49 +++++++
+ target/riscv/insn_trans/trans_rvzicbo.c.inc | 16 ++++++++++++----
- target/riscv/insn32.decode              |  16 ++
+file changed, 12 insertions(+), 4 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 186 ++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 111 ++++++++++++++
 files changed, 362 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvzicbo.c.inc b/target/riscv/insn_trans/trans_rvzicbo.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvzicbo.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvzicbo.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(vec_rsubs8, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_FLAGS_4(vec_rsubs16, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ static bool trans_cbo_clean(DisasContext *ctx, arg_cbo_clean *a)
- DEF_HELPER_FLAGS_4(vec_rsubs32, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ {
- DEF_HELPER_FLAGS_4(vec_rsubs64, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+     REQUIRE_ZICBOM(ctx);
 -    gen_helper_cbo_clean_flush(tcg_env, cpu_gpr[a->rs1]);
 +    TCGv src = get_address(ctx, a->rs1, 0);
 +
-+DEF_HELPER_6(vwaddu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++    gen_helper_cbo_clean_flush(tcg_env, src);
-+DEF_HELPER_6(vwaddu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     return true;
 +DEF_HELPER_6(vwaddu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vsub_vv         000010 . ..... ..... 000 ..... 1010111 @r_vm
  vsub_vx         000010 . ..... ..... 100 ..... 1010111 @r_vm
  vrsub_vx        000011 . ..... ..... 100 ..... 1010111 @r_vm
  vrsub_vi        000011 . ..... ..... 011 ..... 1010111 @r_vm
 +vwaddu_vv       110000 . ..... ..... 010 ..... 1010111 @r_vm
 +vwaddu_vx       110000 . ..... ..... 110 ..... 1010111 @r_vm
 +vwadd_vv        110001 . ..... ..... 010 ..... 1010111 @r_vm
 +vwadd_vx        110001 . ..... ..... 110 ..... 1010111 @r_vm
 +vwsubu_vv       110010 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsubu_vx       110010 . ..... ..... 110 ..... 1010111 @r_vm
 +vwsub_vv        110011 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsub_vx        110011 . ..... ..... 110 ..... 1010111 @r_vm
 +vwaddu_wv       110100 . ..... ..... 010 ..... 1010111 @r_vm
 +vwaddu_wx       110100 . ..... ..... 110 ..... 1010111 @r_vm
 +vwadd_wv        110101 . ..... ..... 010 ..... 1010111 @r_vm
 +vwadd_wx        110101 . ..... ..... 110 ..... 1010111 @r_vm
 +vwsubu_wv       110110 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsubu_wx       110110 . ..... ..... 110 ..... 1010111 @r_vm
 +vwsub_wv        110111 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsub_wx        110111 . ..... ..... 110 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool vext_check_nf(DisasContext *s, uint32_t nf)
      return (1 << s->lmul) * nf <= 8;
  }
-+/*
+ static bool trans_cbo_flush(DisasContext *ctx, arg_cbo_flush *a)
-+ * The destination vector register group cannot overlap a source vector register
+ {
-+ * group of a different element width. (Section 11.2)
+     REQUIRE_ZICBOM(ctx);
-+ */
+-    gen_helper_cbo_clean_flush(tcg_env, cpu_gpr[a->rs1]);
-+static inline bool vext_check_overlap_group(int rd, int dlen, int rs, int slen)
++    TCGv src = get_address(ctx, a->rs1, 0);
-+{
++
-+    return ((rd >= rs + slen) || (rs >= rd + dlen));
++    gen_helper_cbo_clean_flush(tcg_env, src);
-+}
+     return true;
  /* common translation macro */
  #define GEN_VEXT_TRANS(NAME, SEQ, ARGTYPE, OP, CHECK)      \
  static bool trans_##NAME(DisasContext *s, arg_##ARGTYPE *a)\
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_gvec_rsubi(unsigned vece, uint32_t dofs, uint32_t aofs,
  }
- GEN_OPIVI_GVEC_TRANS(vrsub_vi, 0, vrsub_vx, rsubi)
+ static bool trans_cbo_inval(DisasContext *ctx, arg_cbo_inval *a)
  {
      REQUIRE_ZICBOM(ctx);
 -    gen_helper_cbo_inval(tcg_env, cpu_gpr[a->rs1]);
 +    TCGv src = get_address(ctx, a->rs1, 0);
 +
-+/* Vector Widening Integer Add/Subtract */
++    gen_helper_cbo_inval(tcg_env, src);
      return true;
  }
  static bool trans_cbo_zero(DisasContext *ctx, arg_cbo_zero *a)
  {
      REQUIRE_ZICBOZ(ctx);
 -    gen_helper_cbo_zero(tcg_env, cpu_gpr[a->rs1]);
 +    TCGv src = get_address(ctx, a->rs1, 0);
 +
-+/* OPIVV with WIDEN */
++    gen_helper_cbo_zero(tcg_env, src);
-+static bool opivv_widen_check(DisasContext *s, arg_rmrr *a)
+     return true;
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
 +                                     1 << s->lmul) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opivv_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_gvec_4_ptr *fn,
 +                           bool (*checkfn)(DisasContext *, arg_rmrr *))
 +{
 +    if (checkfn(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1),
 +                           vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8,
 +                           data, fn);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
 +#define GEN_OPIVV_WIDEN_TRANS(NAME, CHECK) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_gvec_4_ptr * const fns[3] = {          \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opivv_widen(s, a, fns[s->sew], CHECK);         \
 +}
 +
 +GEN_OPIVV_WIDEN_TRANS(vwaddu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwadd_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsubu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsub_vv, opivv_widen_check)
 +
 +/* OPIVX with WIDEN */
 +static bool opivx_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opivx_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_opivx *fn)
 +{
 +    if (opivx_widen_check(s, a)) {
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +    }
 +    return true;
 +}
 +
 +#define GEN_OPIVX_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_opivx * const fns[3] = {               \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opivx_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIVX_WIDEN_TRANS(vwaddu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwadd_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsubu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsub_vx)
 +
 +/* WIDEN OPIVV with WIDEN */
 +static bool opiwv_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opiwv_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_gvec_4_ptr *fn)
 +{
 +    if (opiwv_widen_check(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1),
 +                           vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8, data, fn);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
 +#define GEN_OPIWV_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_gvec_4_ptr * const fns[3] = {          \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opiwv_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIWV_WIDEN_TRANS(vwaddu_wv)
 +GEN_OPIWV_WIDEN_TRANS(vwadd_wv)
 +GEN_OPIWV_WIDEN_TRANS(vwsubu_wv)
 +GEN_OPIWV_WIDEN_TRANS(vwsub_wv)
 +
 +/* WIDEN OPIVX with WIDEN */
 +static bool opiwx_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opiwx_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_opivx *fn)
 +{
 +    if (opiwx_widen_check(s, a)) {
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +    }
 +    return false;
 +}
 +
 +#define GEN_OPIWX_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_opivx * const fns[3] = {               \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opiwx_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIWX_WIDEN_TRANS(vwaddu_wx)
 +GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
 +GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
 +GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vec_rsubs64)(void *d, void *a, uint64_t b, uint32_t desc)
          *(uint64_t *)(d + i) = b - *(uint64_t *)(a + i);
      }
  }
-+
-+/* Vector Widening Integer Add/Subtract */
-+#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
-+#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
-+#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
-+#define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
-+#define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
-+#define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
-+#define WOP_WUUU_B  uint16_t, uint8_t, uint16_t, uint16_t, uint16_t
-+#define WOP_WUUU_H  uint32_t, uint16_t, uint32_t, uint32_t, uint32_t
-+#define WOP_WUUU_W  uint64_t, uint32_t, uint64_t, uint64_t, uint64_t
-+#define WOP_WSSS_B  int16_t, int8_t, int16_t, int16_t, int16_t
-+#define WOP_WSSS_H  int32_t, int16_t, int32_t, int32_t, int32_t
-+#define WOP_WSSS_W  int64_t, int32_t, int64_t, int64_t, int64_t
-+RVVCALL(OPIVV2, vwaddu_vv_b, WOP_UUU_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_vv_h, WOP_UUU_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_vv_w, WOP_UUU_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsubu_vv_b, WOP_UUU_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_vv_h, WOP_UUU_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_vv_w, WOP_UUU_W, H8, H4, H4, DO_SUB)
-+RVVCALL(OPIVV2, vwadd_vv_b, WOP_SSS_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_vv_h, WOP_SSS_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_vv_w, WOP_SSS_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsub_vv_b, WOP_SSS_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_vv_h, WOP_SSS_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_vv_w, WOP_SSS_W, H8, H4, H4, DO_SUB)
-+RVVCALL(OPIVV2, vwaddu_wv_b, WOP_WUUU_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_wv_h, WOP_WUUU_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_wv_w, WOP_WUUU_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsubu_wv_b, WOP_WUUU_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_wv_h, WOP_WUUU_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_wv_w, WOP_WUUU_W, H8, H4, H4, DO_SUB)
-+RVVCALL(OPIVV2, vwadd_wv_b, WOP_WSSS_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_wv_h, WOP_WSSS_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_wv_w, WOP_WSSS_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsub_wv_b, WOP_WSSS_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_wv_h, WOP_WSSS_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_wv_w, WOP_WSSS_W, H8, H4, H4, DO_SUB)
-+GEN_VEXT_VV(vwaddu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwaddu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwaddu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsubu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsubu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsubu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwadd_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwadd_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwadd_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsub_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsub_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsub_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwaddu_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwaddu_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwaddu_wv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsubu_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsubu_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsubu_wv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwadd_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwadd_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwadd_wv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsub_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsub_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsub_wv_w, 4, 8, clearq)
-+
-+RVVCALL(OPIVX2, vwaddu_vx_b, WOP_UUU_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_vx_h, WOP_UUU_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_vx_w, WOP_UUU_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsubu_vx_b, WOP_UUU_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_vx_h, WOP_UUU_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_vx_w, WOP_UUU_W, H8, H4, DO_SUB)
-+RVVCALL(OPIVX2, vwadd_vx_b, WOP_SSS_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_vx_h, WOP_SSS_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_vx_w, WOP_SSS_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsub_vx_b, WOP_SSS_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_vx_h, WOP_SSS_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_vx_w, WOP_SSS_W, H8, H4, DO_SUB)
-+RVVCALL(OPIVX2, vwaddu_wx_b, WOP_WUUU_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_wx_h, WOP_WUUU_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_wx_w, WOP_WUUU_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsubu_wx_b, WOP_WUUU_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_wx_h, WOP_WUUU_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_wx_w, WOP_WUUU_W, H8, H4, DO_SUB)
-+RVVCALL(OPIVX2, vwadd_wx_b, WOP_WSSS_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_wx_h, WOP_WSSS_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_wx_w, WOP_WSSS_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsub_wx_b, WOP_WSSS_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_wx_h, WOP_WSSS_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_wx_w, WOP_WSSS_W, H8, H4, DO_SUB)
-+GEN_VEXT_VX(vwaddu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwaddu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwaddu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsubu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsubu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsubu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwadd_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwadd_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwadd_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsub_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsub_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsub_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwaddu_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwaddu_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwaddu_wx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsubu_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsubu_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsubu_wx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwadd_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwadd_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwadd_wx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsub_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsub_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsub_wx_w, 4, 8, clearq)
 --
-.27.0
+.45.1

-[PULL 09/63] target/riscv: add vector index load and store instructions
+[PULL 25/28] target/riscv/kvm.c: Fix the hart bit setting of AIA
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Vector indexed operations add the contents of each element of the
+In AIA spec, each hart (or each hart within a group) has a unique hart
-vector offset operand specified by vs2 to the base effective address
+number to locate the memory pages of interrupt files in the address
-to give the effective address of each element.
+space. The number of bits required to represent any hart number is equal
 to ceil(log2(hmax + 1)), where hmax is the largest hart number among
 groups.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+However, if the largest hart number among groups is a power of 2, QEMU
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+will pass an inaccurate hart-index-bit setting to Linux. For example, when
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+the guest OS has 4 harts, only ceil(log2(3 + 1)) = 2 bits are sufficient
-Message-id: 20200623215920.2594-8-zhiwei_liu@c-sky.com
+to represent 4 harts, but we passes 3 to Linux. The code needs to be
 updated to ensure accurate hart-index-bit settings.
 Additionally, a Linux patch[1] is necessary to correctly recover the hart
 index when the guest OS has only 1 hart, where the hart-index-bit is 0.
 [1] https://lore.kernel.org/lkml/20240415064905.25184-1-yongxuan.wang@sifive.com/t/
 Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240515091129.28116-1-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  35 +++++++
+ target/riscv/kvm/kvm-cpu.c | 9 ++++++++-
- target/riscv/insn32.decode              |  13 +++
+file changed, 8 insertions(+), 1 deletion(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 129 ++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 116 +++++++++++++++++++++
 files changed, 293 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/kvm/kvm-cpu.c b/target/riscv/kvm/kvm-cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/kvm/kvm-cpu.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/kvm/kvm-cpu.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsse_v_b, void, ptr, ptr, tl, tl, env, i32)
+@@ -XXX,XX +XXX,XX @@ void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
- DEF_HELPER_6(vsse_v_h, void, ptr, ptr, tl, tl, env, i32)
+         }
- DEF_HELPER_6(vsse_v_w, void, ptr, ptr, tl, tl, env, i32)
+     }
- DEF_HELPER_6(vsse_v_d, void, ptr, ptr, tl, tl, env, i32)
-+DEF_HELPER_6(vlxb_v_b, void, ptr, ptr, tl, ptr, env, i32)
+-    hart_bits = find_last_bit(&max_hart_per_socket, BITS_PER_LONG) + 1;
 +DEF_HELPER_6(vlxb_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxb_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxb_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxh_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxh_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxh_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxbu_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxhu_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxhu_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxhu_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxwu_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vlxwu_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxb_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxh_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxh_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxh_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vssh_v     ... 010 . ..... ..... 101 ..... 0100111 @r_nfvm
  vssw_v     ... 010 . ..... ..... 110 ..... 0100111 @r_nfvm
  vsse_v     ... 010 . ..... ..... 111 ..... 0100111 @r_nfvm
 +vlxb_v     ... 111 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlxh_v     ... 111 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlxw_v     ... 111 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vlxe_v     ... 011 . ..... ..... 111 ..... 0000111 @r_nfvm
 +vlxbu_v    ... 011 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlxhu_v    ... 011 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlxwu_v    ... 011 . ..... ..... 110 ..... 0000111 @r_nfvm
 +# Vector ordered-indexed and unordered-indexed store insns.
 +vsxb_v     ... -11 . ..... ..... 000 ..... 0100111 @r_nfvm
 +vsxh_v     ... -11 . ..... ..... 101 ..... 0100111 @r_nfvm
 +vsxw_v     ... -11 . ..... ..... 110 ..... 0100111 @r_nfvm
 +vsxe_v     ... -11 . ..... ..... 111 ..... 0100111 @r_nfvm
 +
- # *** new major opcode OP-V ***
++    if (max_hart_per_socket > 1) {
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
++        max_hart_per_socket--;
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++        hart_bits = find_last_bit(&max_hart_per_socket, BITS_PER_LONG) + 1;
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++    } else {
-index XXXXXXX..XXXXXXX 100644
++        hart_bits = 0;
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vssb_v, 0, rnfvm, st_stride_op, st_stride_check)
  GEN_VEXT_TRANS(vssh_v, 1, rnfvm, st_stride_op, st_stride_check)
  GEN_VEXT_TRANS(vssw_v, 2, rnfvm, st_stride_op, st_stride_check)
  GEN_VEXT_TRANS(vsse_v, 3, rnfvm, st_stride_op, st_stride_check)
 +
 +/*
 + *** index load and store
 + */
 +typedef void gen_helper_ldst_index(TCGv_ptr, TCGv_ptr, TCGv,
 +                                   TCGv_ptr, TCGv_env, TCGv_i32);
 +
 +static bool ldst_index_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
 +                             uint32_t data, gen_helper_ldst_index *fn,
 +                             DisasContext *s)
 +{
 +    TCGv_ptr dest, mask, index;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    index = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(index, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, index, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(index);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_index_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_index *fn;
 +    static gen_helper_ldst_index * const fns[7][4] = {
 +        { gen_helper_vlxb_v_b,  gen_helper_vlxb_v_h,
 +          gen_helper_vlxb_v_w,  gen_helper_vlxb_v_d },
 +        { NULL,                 gen_helper_vlxh_v_h,
 +          gen_helper_vlxh_v_w,  gen_helper_vlxh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlxw_v_w,  gen_helper_vlxw_v_d },
 +        { gen_helper_vlxe_v_b,  gen_helper_vlxe_v_h,
 +          gen_helper_vlxe_v_w,  gen_helper_vlxe_v_d },
 +        { gen_helper_vlxbu_v_b, gen_helper_vlxbu_v_h,
 +          gen_helper_vlxbu_v_w, gen_helper_vlxbu_v_d },
 +        { NULL,                 gen_helper_vlxhu_v_h,
 +          gen_helper_vlxhu_v_w, gen_helper_vlxhu_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlxwu_v_w, gen_helper_vlxwu_v_d },
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
-+    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
+     ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
-+    data = FIELD_DP32(data, VDATA, VM, a->vm);
+                             KVM_DEV_RISCV_AIA_CONFIG_HART_BITS,
-+    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
+                             &hart_bits, true, NULL);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_index_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool ld_index_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlxb_v, 0, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxh_v, 1, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxw_v, 2, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxe_v, 3, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxbu_v, 4, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxhu_v, 5, rnfvm, ld_index_op, ld_index_check)
 +GEN_VEXT_TRANS(vlxwu_v, 6, rnfvm, ld_index_op, ld_index_check)
 +
 +static bool st_index_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_index *fn;
 +    static gen_helper_ldst_index * const fns[4][4] = {
 +        { gen_helper_vsxb_v_b,  gen_helper_vsxb_v_h,
 +          gen_helper_vsxb_v_w,  gen_helper_vsxb_v_d },
 +        { NULL,                 gen_helper_vsxh_v_h,
 +          gen_helper_vsxh_v_w,  gen_helper_vsxh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vsxw_v_w,  gen_helper_vsxw_v_d },
 +        { gen_helper_vsxe_v_b,  gen_helper_vsxe_v_h,
 +          gen_helper_vsxe_v_w,  gen_helper_vsxe_v_d }
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_index_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool st_index_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vsxb_v, 0, rnfvm, st_index_op, st_index_check)
 +GEN_VEXT_TRANS(vsxh_v, 1, rnfvm, st_index_op, st_index_check)
 +GEN_VEXT_TRANS(vsxw_v, 2, rnfvm, st_index_op, st_index_check)
 +GEN_VEXT_TRANS(vsxe_v, 3, rnfvm, st_index_op, st_index_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_US(vse_v_b, int8_t,  int8_t , ste_b)
  GEN_VEXT_ST_US(vse_v_h, int16_t, int16_t, ste_h)
  GEN_VEXT_ST_US(vse_v_w, int32_t, int32_t, ste_w)
  GEN_VEXT_ST_US(vse_v_d, int64_t, int64_t, ste_d)
 +
 +/*
 + *** index: access vector element from indexed memory
 + */
 +typedef target_ulong vext_get_index_addr(target_ulong base,
 +        uint32_t idx, void *vs2);
 +
 +#define GEN_VEXT_GET_INDEX_ADDR(NAME, ETYPE, H)        \
 +static target_ulong NAME(target_ulong base,            \
 +                         uint32_t idx, void *vs2)      \
 +{                                                      \
 +    return (base + *((ETYPE *)vs2 + H(idx)));          \
 +}
 +
 +GEN_VEXT_GET_INDEX_ADDR(idx_b, int8_t,  H1)
 +GEN_VEXT_GET_INDEX_ADDR(idx_h, int16_t, H2)
 +GEN_VEXT_GET_INDEX_ADDR(idx_w, int32_t, H4)
 +GEN_VEXT_GET_INDEX_ADDR(idx_d, int64_t, H8)
 +
 +static inline void
 +vext_ldst_index(void *vd, void *v0, target_ulong base,
 +                void *vs2, CPURISCVState *env, uint32_t desc,
 +                vext_get_index_addr get_index_addr,
 +                vext_ldst_elem_fn *ldst_elem,
 +                clear_fn *clear_elem,
 +                uint32_t esz, uint32_t msz, uintptr_t ra,
 +                MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        probe_pages(env, get_index_addr(base, i, vs2), nf * msz, ra,
 +                    access_type);
 +    }
 +    /* load bytes from guest memory */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            abi_ptr addr = get_index_addr(base, i, vs2) + k * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +#define GEN_VEXT_LD_INDEX(NAME, MTYPE, ETYPE, INDEX_FN, LOAD_FN, CLEAR_FN) \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                   \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)            \
 +{                                                                          \
 +    vext_ldst_index(vd, v0, base, vs2, env, desc, INDEX_FN,                \
 +                    LOAD_FN, CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),       \
 +                    GETPC(), MMU_DATA_LOAD);                               \
 +}
 +
 +GEN_VEXT_LD_INDEX(vlxb_v_b,  int8_t,   int8_t,   idx_b, ldb_b,  clearb)
 +GEN_VEXT_LD_INDEX(vlxb_v_h,  int8_t,   int16_t,  idx_h, ldb_h,  clearh)
 +GEN_VEXT_LD_INDEX(vlxb_v_w,  int8_t,   int32_t,  idx_w, ldb_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxb_v_d,  int8_t,   int64_t,  idx_d, ldb_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxh_v_h,  int16_t,  int16_t,  idx_h, ldh_h,  clearh)
 +GEN_VEXT_LD_INDEX(vlxh_v_w,  int16_t,  int32_t,  idx_w, ldh_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxh_v_d,  int16_t,  int64_t,  idx_d, ldh_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxw_v_w,  int32_t,  int32_t,  idx_w, ldw_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxw_v_d,  int32_t,  int64_t,  idx_d, ldw_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxe_v_b,  int8_t,   int8_t,   idx_b, lde_b,  clearb)
 +GEN_VEXT_LD_INDEX(vlxe_v_h,  int16_t,  int16_t,  idx_h, lde_h,  clearh)
 +GEN_VEXT_LD_INDEX(vlxe_v_w,  int32_t,  int32_t,  idx_w, lde_w,  clearl)
 +GEN_VEXT_LD_INDEX(vlxe_v_d,  int64_t,  int64_t,  idx_d, lde_d,  clearq)
 +GEN_VEXT_LD_INDEX(vlxbu_v_b, uint8_t,  uint8_t,  idx_b, ldbu_b, clearb)
 +GEN_VEXT_LD_INDEX(vlxbu_v_h, uint8_t,  uint16_t, idx_h, ldbu_h, clearh)
 +GEN_VEXT_LD_INDEX(vlxbu_v_w, uint8_t,  uint32_t, idx_w, ldbu_w, clearl)
 +GEN_VEXT_LD_INDEX(vlxbu_v_d, uint8_t,  uint64_t, idx_d, ldbu_d, clearq)
 +GEN_VEXT_LD_INDEX(vlxhu_v_h, uint16_t, uint16_t, idx_h, ldhu_h, clearh)
 +GEN_VEXT_LD_INDEX(vlxhu_v_w, uint16_t, uint32_t, idx_w, ldhu_w, clearl)
 +GEN_VEXT_LD_INDEX(vlxhu_v_d, uint16_t, uint64_t, idx_d, ldhu_d, clearq)
 +GEN_VEXT_LD_INDEX(vlxwu_v_w, uint32_t, uint32_t, idx_w, ldwu_w, clearl)
 +GEN_VEXT_LD_INDEX(vlxwu_v_d, uint32_t, uint64_t, idx_d, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_INDEX(NAME, MTYPE, ETYPE, INDEX_FN, STORE_FN)\
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,         \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)  \
 +{                                                                \
 +    vext_ldst_index(vd, v0, base, vs2, env, desc, INDEX_FN,      \
 +                    STORE_FN, NULL, sizeof(ETYPE), sizeof(MTYPE),\
 +                    GETPC(), MMU_DATA_STORE);                    \
 +}
 +
 +GEN_VEXT_ST_INDEX(vsxb_v_b, int8_t,  int8_t,  idx_b, stb_b)
 +GEN_VEXT_ST_INDEX(vsxb_v_h, int8_t,  int16_t, idx_h, stb_h)
 +GEN_VEXT_ST_INDEX(vsxb_v_w, int8_t,  int32_t, idx_w, stb_w)
 +GEN_VEXT_ST_INDEX(vsxb_v_d, int8_t,  int64_t, idx_d, stb_d)
 +GEN_VEXT_ST_INDEX(vsxh_v_h, int16_t, int16_t, idx_h, sth_h)
 +GEN_VEXT_ST_INDEX(vsxh_v_w, int16_t, int32_t, idx_w, sth_w)
 +GEN_VEXT_ST_INDEX(vsxh_v_d, int16_t, int64_t, idx_d, sth_d)
 +GEN_VEXT_ST_INDEX(vsxw_v_w, int32_t, int32_t, idx_w, stw_w)
 +GEN_VEXT_ST_INDEX(vsxw_v_d, int32_t, int64_t, idx_d, stw_d)
 +GEN_VEXT_ST_INDEX(vsxe_v_b, int8_t,  int8_t,  idx_b, ste_b)
 +GEN_VEXT_ST_INDEX(vsxe_v_h, int16_t, int16_t, idx_h, ste_h)
 +GEN_VEXT_ST_INDEX(vsxe_v_w, int32_t, int32_t, idx_w, ste_w)
 +GEN_VEXT_ST_INDEX(vsxe_v_d, int64_t, int64_t, idx_d, ste_d)
 --
-.27.0
+.45.1

-[PULL 52/63] target/riscv: vector mask population count vmpopc
+[PULL 26/28] riscv, gdbstub.c: fix reg_width in ricsv_gen_dynamic_vector_feature()
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Commit 33a24910ae changed 'reg_width' to use 'vlenb', i.e. vector length
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+in bytes, when in this context we want 'reg_width' as the length in
-Message-id: 20200623215920.2594-51-zhiwei_liu@c-sky.com
+bits.
 Fix 'reg_width' back to the value in bits like 7cb59921c05a
 ("target/riscv/gdbstub.c: use 'vlenb' instead of shifting 'vlen'") set
 beforehand.
 While we're at it, rename 'reg_width' to 'bitsize' to provide a bit more
 clarity about what the variable represents. 'bitsize' is also used in
 riscv_gen_dynamic_csr_feature() with the same purpose, i.e. as an input to
 gdb_feature_builder_append_reg().
 Cc: Akihiko Odaki <akihiko.odaki@daynix.com>
 Cc: Alex Bennée <alex.bennee@linaro.org>
 Reported-by: Robin Dapp <rdapp.gcc@gmail.com>
 Fixes: 33a24910ae ("target/riscv: Use GDBFeature for dynamic XML")
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Acked-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Akihiko Odaki <akihiko.odaki@daynix.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240517203054.880861-2-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  2 ++
+ target/riscv/gdbstub.c | 6 +++---
- target/riscv/insn32.decode              |  1 +
+file changed, 3 insertions(+), 3 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 20 ++++++++++++++++
 files changed, 55 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/gdbstub.c b/target/riscv/gdbstub.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/gdbstub.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/gdbstub.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static GDBFeature *riscv_gen_dynamic_csr_feature(CPUState *cs, int base_reg)
- DEF_HELPER_6(vmnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+ static GDBFeature *ricsv_gen_dynamic_vector_feature(CPUState *cs, int base_reg)
- DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
+ {
- DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+     RISCVCPU *cpu = RISCV_CPU(cs);
-+
+-    int reg_width = cpu->cfg.vlenb;
-+DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
++    int bitsize = cpu->cfg.vlenb << 3;
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+     GDBFeatureBuilder builder;
-index XXXXXXX..XXXXXXX 100644
+     int i;
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ static GDBFeature *ricsv_gen_dynamic_vector_feature(CPUState *cs, int base_reg)
-@@ -XXX,XX +XXX,XX @@ vmor_mm         011010 - ..... ..... 010 ..... 1010111 @r
- vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
+     /* First define types and totals in a whole VL */
- vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+     for (i = 0; i < ARRAY_SIZE(vec_lanes); i++) {
- vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
+-        int count = reg_width / vec_lanes[i].size;
-+vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
++        int count = bitsize / vec_lanes[i].size;
+         gdb_feature_builder_append_tag(
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+             &builder, "<vector id=\"%s\" type=\"%s\" count=\"%d\"/>",
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+             vec_lanes[i].id, vec_lanes[i].gdb_type, count);
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static GDBFeature *ricsv_gen_dynamic_vector_feature(CPUState *cs, int base_reg)
-index XXXXXXX..XXXXXXX 100644
+     /* Define vector registers */
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+     for (i = 0; i < 32; i++) {
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+         gdb_feature_builder_append_reg(&builder, g_strdup_printf("v%d", i),
-@@ -XXX,XX +XXX,XX @@ GEN_MM_TRANS(vmor_mm)
+-                                       reg_width, i, "riscv_vector", "vector");
- GEN_MM_TRANS(vmnor_mm)
++                                       bitsize, i, "riscv_vector", "vector");
- GEN_MM_TRANS(vmornot_mm)
+     }
- GEN_MM_TRANS(vmxnor_mm)
-+
+     gdb_feature_builder_end(&builder);
 +/* Vector mask population count vmpopc */
 +static bool trans_vmpopc_m(DisasContext *s, arg_rmr *a)
 +{
 +    if (vext_check_isa_ill(s)) {
 +        TCGv_ptr src2, mask;
 +        TCGv dst;
 +        TCGv_i32 desc;
 +        uint32_t data = 0;
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +
 +        mask = tcg_temp_new_ptr();
 +        src2 = tcg_temp_new_ptr();
 +        dst = tcg_temp_new();
 +        desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +        tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, a->rs2));
 +        tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +        gen_helper_vmpopc_m(dst, mask, src2, cpu_env, desc);
 +        gen_set_gpr(a->rd, dst);
 +
 +        tcg_temp_free_ptr(mask);
 +        tcg_temp_free_ptr(src2);
 +        tcg_temp_free(dst);
 +        tcg_temp_free_i32(desc);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_MASK_VV(vmor_mm, DO_OR)
  GEN_VEXT_MASK_VV(vmnor_mm, DO_NOR)
  GEN_VEXT_MASK_VV(vmornot_mm, DO_ORNOT)
  GEN_VEXT_MASK_VV(vmxnor_mm, DO_XNOR)
 +
 +/* Vector mask population count vmpopc */
 +target_ulong HELPER(vmpopc_m)(void *v0, void *vs2, CPURISCVState *env,
 +                              uint32_t desc)
 +{
 +    target_ulong cnt = 0;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    int i;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (vm || vext_elem_mask(v0, mlen, i)) {
 +            if (vext_elem_mask(vs2, mlen, i)) {
 +                cnt++;
 +            }
 +        }
 +    }
 +    return cnt;
 +}
 --
-.27.0
+.45.1

-[PULL 51/63] target/riscv: vector mask-register logical instructions
+[PULL 27/28] disas/riscv: Decode all of the pmpcfg and pmpaddr CSRs
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Alistair Francis <alistair23@gmail.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Previously we only listed a single pmpcfg CSR and the first 16 pmpaddr
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+CSRs. This patch fixes this to list all 16 pmpcfg and all 64 pmpaddr
-Message-id: 20200623215920.2594-50-zhiwei_liu@c-sky.com
+CSRs are part of the disassembly.
 Reported-by: Eric DeVolder <eric_devolder@yahoo.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 Fixes: ea10325917 ("RISC-V Disassembler")
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Cc: qemu-stable <qemu-stable@nongnu.org>
 Message-ID: <20240514051615.330979-1-alistair.francis@wdc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  9 ++++++
+ disas/riscv.c | 65 ++++++++++++++++++++++++++++++++++++++++++++++++++-
- target/riscv/insn32.decode              |  8 +++++
+file changed, 64 insertions(+), 1 deletion(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 35 ++++++++++++++++++++++
  target/riscv/vector_helper.c            | 40 +++++++++++++++++++++++++
 files changed, 92 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/disas/riscv.c b/disas/riscv.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/disas/riscv.c
-+++ b/target/riscv/helper.h
++++ b/disas/riscv.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static const char *csr_name(int csrno)
+     case 0x0383: return "mibound";
- DEF_HELPER_6(vfwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
+     case 0x0384: return "mdbase";
- DEF_HELPER_6(vfwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+     case 0x0385: return "mdbound";
-+
+-    case 0x03a0: return "pmpcfg3";
-+DEF_HELPER_6(vmand_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a0: return "pmpcfg0";
-+DEF_HELPER_6(vmnand_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a1: return "pmpcfg1";
-+DEF_HELPER_6(vmandnot_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a2: return "pmpcfg2";
-+DEF_HELPER_6(vmxor_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a3: return "pmpcfg3";
-+DEF_HELPER_6(vmor_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a4: return "pmpcfg4";
-+DEF_HELPER_6(vmnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a5: return "pmpcfg5";
-+DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a6: return "pmpcfg6";
-+DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
++    case 0x03a7: return "pmpcfg7";
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++    case 0x03a8: return "pmpcfg8";
-index XXXXXXX..XXXXXXX 100644
++    case 0x03a9: return "pmpcfg9";
---- a/target/riscv/insn32.decode
++    case 0x03aa: return "pmpcfg10";
-+++ b/target/riscv/insn32.decode
++    case 0x03ab: return "pmpcfg11";
-@@ -XXX,XX +XXX,XX @@ vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
++    case 0x03ac: return "pmpcfg12";
- vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
++    case 0x03ad: return "pmpcfg13";
- # Vector widening ordered and unordered float reduction sum
++    case 0x03ae: return "pmpcfg14";
- vfwredsum_vs    1100-1 . ..... ..... 001 ..... 1010111 @r_vm
++    case 0x03af: return "pmpcfg15";
-+vmand_mm        011001 - ..... ..... 010 ..... 1010111 @r
+     case 0x03b0: return "pmpaddr0";
-+vmnand_mm       011101 - ..... ..... 010 ..... 1010111 @r
+     case 0x03b1: return "pmpaddr1";
-+vmandnot_mm     011000 - ..... ..... 010 ..... 1010111 @r
+     case 0x03b2: return "pmpaddr2";
-+vmxor_mm        011011 - ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@ static const char *csr_name(int csrno)
-+vmor_mm         011010 - ..... ..... 010 ..... 1010111 @r
+     case 0x03bd: return "pmpaddr13";
-+vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
+     case 0x03be: return "pmpaddr14";
-+vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+     case 0x03bf: return "pmpaddr15";
-+vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
++    case 0x03c0: return "pmpaddr16";
++    case 0x03c1: return "pmpaddr17";
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
++    case 0x03c2: return "pmpaddr18";
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++    case 0x03c3: return "pmpaddr19";
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++    case 0x03c4: return "pmpaddr20";
-index XXXXXXX..XXXXXXX 100644
++    case 0x03c5: return "pmpaddr21";
---- a/target/riscv/insn_trans/trans_rvv.inc.c
++    case 0x03c6: return "pmpaddr22";
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++    case 0x03c7: return "pmpaddr23";
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
++    case 0x03c8: return "pmpaddr24";
++    case 0x03c9: return "pmpaddr25";
- /* Vector Widening Floating-Point Reduction Instructions */
++    case 0x03ca: return "pmpaddr26";
- GEN_OPFVV_WIDEN_TRANS(vfwredsum_vs, reduction_check)
++    case 0x03cb: return "pmpaddr27";
-+
++    case 0x03cc: return "pmpaddr28";
-+/*
++    case 0x03cd: return "pmpaddr29";
-+ *** Vector Mask Operations
++    case 0x03ce: return "pmpaddr30";
-+ */
++    case 0x03cf: return "pmpaddr31";
-+
++    case 0x03d0: return "pmpaddr32";
-+/* Vector Mask-Register Logical Instructions */
++    case 0x03d1: return "pmpaddr33";
-+#define GEN_MM_TRANS(NAME)                                         \
++    case 0x03d2: return "pmpaddr34";
-+static bool trans_##NAME(DisasContext *s, arg_r *a)                \
++    case 0x03d3: return "pmpaddr35";
-+{                                                                  \
++    case 0x03d4: return "pmpaddr36";
-+    if (vext_check_isa_ill(s)) {                                   \
++    case 0x03d5: return "pmpaddr37";
-+        uint32_t data = 0;                                         \
++    case 0x03d6: return "pmpaddr38";
-+        gen_helper_gvec_4_ptr *fn = gen_helper_##NAME;             \
++    case 0x03d7: return "pmpaddr39";
-+        TCGLabel *over = gen_new_label();                          \
++    case 0x03d8: return "pmpaddr40";
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
++    case 0x03d9: return "pmpaddr41";
-+                                                                   \
++    case 0x03da: return "pmpaddr42";
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
++    case 0x03db: return "pmpaddr43";
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
++    case 0x03dc: return "pmpaddr44";
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
++    case 0x03dd: return "pmpaddr45";
-+                           vreg_ofs(s, a->rs1),                    \
++    case 0x03de: return "pmpaddr46";
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
++    case 0x03df: return "pmpaddr47";
-+                           s->vlen / 8, data, fn);                 \
++    case 0x03e0: return "pmpaddr48";
-+        gen_set_label(over);                                       \
++    case 0x03e1: return "pmpaddr49";
-+        return true;                                               \
++    case 0x03e2: return "pmpaddr50";
-+    }                                                              \
++    case 0x03e3: return "pmpaddr51";
-+    return false;                                                  \
++    case 0x03e4: return "pmpaddr52";
-+}
++    case 0x03e5: return "pmpaddr53";
-+
++    case 0x03e6: return "pmpaddr54";
-+GEN_MM_TRANS(vmand_mm)
++    case 0x03e7: return "pmpaddr55";
-+GEN_MM_TRANS(vmnand_mm)
++    case 0x03e8: return "pmpaddr56";
-+GEN_MM_TRANS(vmandnot_mm)
++    case 0x03e9: return "pmpaddr57";
-+GEN_MM_TRANS(vmxor_mm)
++    case 0x03ea: return "pmpaddr58";
-+GEN_MM_TRANS(vmor_mm)
++    case 0x03eb: return "pmpaddr59";
-+GEN_MM_TRANS(vmnor_mm)
++    case 0x03ec: return "pmpaddr60";
-+GEN_MM_TRANS(vmornot_mm)
++    case 0x03ed: return "pmpaddr61";
-+GEN_MM_TRANS(vmxnor_mm)
++    case 0x03ee: return "pmpaddr62";
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
++    case 0x03ef: return "pmpaddr63";
-index XXXXXXX..XXXXXXX 100644
+     case 0x0780: return "mtohost";
---- a/target/riscv/vector_helper.c
+     case 0x0781: return "mfromhost";
-+++ b/target/riscv/vector_helper.c
+     case 0x0782: return "mreset";
@@ -XXX,XX +XXX,XX @@ void HELPER(vfwredsum_vs_w)(void *vd, void *v0, void *vs1,
      *((uint64_t *)vd) = s1;
      clearq(vd, 1, sizeof(uint64_t), tot);
  }
 +
 +/*
 + *** Vector Mask Operations
 + */
 +/* Vector Mask-Register Logical Instructions */
 +#define GEN_VEXT_MASK_VV(NAME, OP)                        \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
 +    uint32_t mlen = vext_mlen(desc);                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;   \
 +    uint32_t vl = env->vl;                                \
 +    uint32_t i;                                           \
 +    int a, b;                                             \
 +                                                          \
 +    for (i = 0; i < vl; i++) {                            \
 +        a = vext_elem_mask(vs1, mlen, i);                 \
 +        b = vext_elem_mask(vs2, mlen, i);                 \
 +        vext_set_elem_mask(vd, mlen, i, OP(b, a));        \
 +    }                                                     \
 +    for (; i < vlmax; i++) {                              \
 +        vext_set_elem_mask(vd, mlen, i, 0);               \
 +    }                                                     \
 +}
 +
 +#define DO_NAND(N, M)  (!(N & M))
 +#define DO_ANDNOT(N, M)  (N & !M)
 +#define DO_NOR(N, M)  (!(N | M))
 +#define DO_ORNOT(N, M)  (N | !M)
 +#define DO_XNOR(N, M)  (!(N ^ M))
 +
 +GEN_VEXT_MASK_VV(vmand_mm, DO_AND)
 +GEN_VEXT_MASK_VV(vmnand_mm, DO_NAND)
 +GEN_VEXT_MASK_VV(vmandnot_mm, DO_ANDNOT)
 +GEN_VEXT_MASK_VV(vmxor_mm, DO_XOR)
 +GEN_VEXT_MASK_VV(vmor_mm, DO_OR)
 +GEN_VEXT_MASK_VV(vmnor_mm, DO_NOR)
 +GEN_VEXT_MASK_VV(vmornot_mm, DO_ORNOT)
 +GEN_VEXT_MASK_VV(vmxnor_mm, DO_XNOR)
 --
-.27.0
+.45.1

-[PULL 03/63] target/riscv: add vector extension field in CPURISCVState
+[PULL 28/28] target/riscv: raise an exception when CSRRS/CSRRC writes a read-only CSR
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yu-Ming Chang <yumin686@andestech.com>
-The 32 vector registers will be viewed as a continuous memory block.
+Both CSRRS and CSRRC always read the addressed CSR and cause any read side
-It avoids the convension between element index and (regno, offset).
+effects regardless of rs1 and rd fields. Note that if rs1 specifies a register
-Thus elements can be directly accessed by offset from the first vector
+holding a zero value other than x0, the instruction will still attempt to write
-base address.
+the unmodified value back to the CSR and will cause any attendant side effects.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+So if CSRRS or CSRRC tries to write a read-only CSR with rs1 which specifies
-Acked-by: Alistair Francis <alistair.francis@wdc.com>
+a register holding a zero value, an illegal instruction exception should be
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+raised.
-Message-id: 20200623215920.2594-2-zhiwei_liu@c-sky.com
 Signed-off-by: Yu-Ming Chang <yumin686@andestech.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20240403070823.80897-1-yumin686@andestech.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h       | 12 ++++++++++++
+ target/riscv/cpu.h       |  4 ++++
- target/riscv/translate.c |  3 ++-
+ target/riscv/csr.c       | 51 ++++++++++++++++++++++++++++++++++++----
-files changed, 14 insertions(+), 1 deletion(-)
+ target/riscv/op_helper.c |  6 ++---
 files changed, 53 insertions(+), 8 deletions(-)
 diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.h
 +++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ void cpu_get_tb_cpu_state(CPURISCVState *env, vaddr *pc,
- #define RVA RV('A')
+ void riscv_cpu_update_mask(CPURISCVState *env);
- #define RVF RV('F')
+ bool riscv_cpu_is_32bit(RISCVCPU *cpu);
- #define RVD RV('D')
-+#define RVV RV('V')
++RISCVException riscv_csrr(CPURISCVState *env, int csrno,
- #define RVC RV('C')
++                          target_ulong *ret_value);
- #define RVS RV('S')
+ RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
- #define RVU RV('U')
+                            target_ulong *ret_value,
-@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
+                            target_ulong new_value, target_ulong write_mask);
+@@ -XXX,XX +XXX,XX @@ typedef RISCVException (*riscv_csr_op_fn)(CPURISCVState *env, int csrno,
- #include "pmp.h"
+                                           target_ulong new_value,
+                                           target_ulong write_mask);
-+#define RV_VLEN_MAX 512
 +RISCVException riscv_csrr_i128(CPURISCVState *env, int csrno,
 +                               Int128 *ret_value);
  RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
                                  Int128 *ret_value,
                                  Int128 new_value, Int128 write_mask);
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
@@ -XXX,XX +XXX,XX @@ static RISCVException rmw_seed(CPURISCVState *env, int csrno,
  static inline RISCVException riscv_csrrw_check(CPURISCVState *env,
                                                 int csrno,
 -                                               bool write_mask)
 +                                               bool write)
  {
      /* check privileges and return RISCV_EXCP_ILLEGAL_INST if check fails */
      bool read_only = get_field(csrno, 0xC00) == 3;
@@ -XXX,XX +XXX,XX @@ static inline RISCVException riscv_csrrw_check(CPURISCVState *env,
      }
      /* read / write check */
 -    if (write_mask && read_only) {
 +    if (write && read_only) {
          return RISCV_EXCP_ILLEGAL_INST;
      }
@@ -XXX,XX +XXX,XX @@ static RISCVException riscv_csrrw_do64(CPURISCVState *env, int csrno,
      return RISCV_EXCP_NONE;
  }
 +RISCVException riscv_csrr(CPURISCVState *env, int csrno,
 +                           target_ulong *ret_value)
 +{
 +    RISCVException ret = riscv_csrrw_check(env, csrno, false);
 +    if (ret != RISCV_EXCP_NONE) {
 +        return ret;
 +    }
 +
- struct CPURISCVState {
++    return riscv_csrrw_do64(env, csrno, ret_value, 0, 0);
-     target_ulong gpr[32];
++}
      uint64_t fpr[32]; /* assume both F and D extensions */
 +
-+    /* vector coprocessor state. */
+ RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
-+    uint64_t vreg[32 * RV_VLEN_MAX / 64] QEMU_ALIGNED(16);
+                            target_ulong *ret_value,
-+    target_ulong vxrm;
+                            target_ulong new_value, target_ulong write_mask)
-+    target_ulong vxsat;
+ {
-+    target_ulong vl;
+-    RISCVException ret = riscv_csrrw_check(env, csrno, write_mask);
-+    target_ulong vstart;
++    RISCVException ret = riscv_csrrw_check(env, csrno, true);
-+    target_ulong vtype;
+     if (ret != RISCV_EXCP_NONE) {
          return ret;
      }
@@ -XXX,XX +XXX,XX @@ static RISCVException riscv_csrrw_do128(CPURISCVState *env, int csrno,
      return RISCV_EXCP_NONE;
  }
 +RISCVException riscv_csrr_i128(CPURISCVState *env, int csrno,
 +                               Int128 *ret_value)
 +{
 +    RISCVException ret;
 +
-     target_ulong pc;
++    ret = riscv_csrrw_check(env, csrno, false);
-     target_ulong load_res;
++    if (ret != RISCV_EXCP_NONE) {
-     target_ulong load_val;
++        return ret;
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
++    }
 +
 +    if (csr_ops[csrno].read128) {
 +        return riscv_csrrw_do128(env, csrno, ret_value,
 +                                 int128_zero(), int128_zero());
 +    }
 +
 +    /*
 +     * Fall back to 64-bit version for now, if the 128-bit alternative isn't
 +     * at all defined.
 +     * Note, some CSRs don't need to extend to MXLEN (64 upper bits non
 +     * significant), for those, this fallback is correctly handling the
 +     * accesses
 +     */
 +    target_ulong old_value;
 +    ret = riscv_csrrw_do64(env, csrno, &old_value,
 +                           (target_ulong)0,
 +                           (target_ulong)0);
 +    if (ret == RISCV_EXCP_NONE && ret_value) {
 +        *ret_value = int128_make64(old_value);
 +    }
 +    return ret;
 +}
 +
  RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
                                  Int128 *ret_value,
                                  Int128 new_value, Int128 write_mask)
  {
      RISCVException ret;
 -    ret = riscv_csrrw_check(env, csrno, int128_nz(write_mask));
 +    ret = riscv_csrrw_check(env, csrno, true);
      if (ret != RISCV_EXCP_NONE) {
          return ret;
      }
 diff --git a/target/riscv/op_helper.c b/target/riscv/op_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/op_helper.c
-+++ b/target/riscv/translate.c
++++ b/target/riscv/op_helper.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ target_ulong helper_csrr(CPURISCVState *env, int csr)
  #include "instmap.h"
  /* global register indices */
 -static TCGv cpu_gpr[32], cpu_pc;
 +static TCGv cpu_gpr[32], cpu_pc, cpu_vl;
  static TCGv_i64 cpu_fpr[32]; /* assume F and D extensions */
  static TCGv load_res;
  static TCGv load_val;
@@ -XXX,XX +XXX,XX @@ void riscv_translate_init(void)
      }
-     cpu_pc = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, pc), "pc");
+     target_ulong val = 0;
-+    cpu_vl = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, vl), "vl");
+-    RISCVException ret = riscv_csrrw(env, csr, &val, 0, 0);
-     load_res = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, load_res),
++    RISCVException ret = riscv_csrr(env, csr, &val);
-                              "load_res");
-     load_val = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, load_val),
+     if (ret != RISCV_EXCP_NONE) {
          riscv_raise_exception(env, ret, GETPC());
@@ -XXX,XX +XXX,XX @@ target_ulong helper_csrrw(CPURISCVState *env, int csr,
  target_ulong helper_csrr_i128(CPURISCVState *env, int csr)
  {
      Int128 rv = int128_zero();
 -    RISCVException ret = riscv_csrrw_i128(env, csr, &rv,
 -                                          int128_zero(),
 -                                          int128_zero());
 +    RISCVException ret = riscv_csrr_i128(env, csr, &rv);
      if (ret != RISCV_EXCP_NONE) {
          riscv_raise_exception(env, ret, GETPC());
 --
-.27.0
+.45.1

-[PULL 07/63] target/riscv: add an internals.h header
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-The internals.h keeps things that are not relevant to the actual architecture,
-only to the implementation, separate.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-6-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/internals.h | 24 ++++++++++++++++++++++++
-file changed, 24 insertions(+)
- create mode 100644 target/riscv/internals.h
-diff --git a/target/riscv/internals.h b/target/riscv/internals.h
-new file mode 100644
-index XXXXXXX..XXXXXXX
---- /dev/null
-+++ b/target/riscv/internals.h
-@@ -XXX,XX +XXX,XX @@
-+/*
-+ * QEMU RISC-V CPU -- internal functions and types
-+ *
-+ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
-+ *
-+ * This program is free software; you can redistribute it and/or modify it
-+ * under the terms and conditions of the GNU General Public License,
-+ * version 2 or later, as published by the Free Software Foundation.
-+ *
-+ * This program is distributed in the hope it will be useful, but WITHOUT
-+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
-+ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
-+ * more details.
-+ *
-+ * You should have received a copy of the GNU General Public License along with
-+ * this program.  If not, see <http://www.gnu.org/licenses/>.
-+ */
-+
-+#ifndef RISCV_CPU_INTERNALS_H
-+#define RISCV_CPU_INTERNALS_H
-+
-+#include "hw/registerfields.h"
-+
-+#endif
---
-.27.0

-[PULL 14/63] target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-13-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  33 ++++++
- target/riscv/insn32.decode              |  11 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 113 +++++++++++++++++++
- target/riscv/vector_helper.c            | 137 ++++++++++++++++++++++++
-files changed, 294 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwadd_wx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsub_wx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsub_wx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsub_wx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vadc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vadc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vadc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vadc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vadc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vadc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vadc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vadc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
- @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
-+@r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
- @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
- @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
-@@ -XXX,XX +XXX,XX @@ vwsubu_wv       110110 . ..... ..... 010 ..... 1010111 @r_vm
- vwsubu_wx       110110 . ..... ..... 110 ..... 1010111 @r_vm
- vwsub_wv        110111 . ..... ..... 010 ..... 1010111 @r_vm
- vwsub_wx        110111 . ..... ..... 110 ..... 1010111 @r_vm
-+vadc_vvm        010000 1 ..... ..... 000 ..... 1010111 @r_vm_1
-+vadc_vxm        010000 1 ..... ..... 100 ..... 1010111 @r_vm_1
-+vadc_vim        010000 1 ..... ..... 011 ..... 1010111 @r_vm_1
-+vmadc_vvm       010001 1 ..... ..... 000 ..... 1010111 @r_vm_1
-+vmadc_vxm       010001 1 ..... ..... 100 ..... 1010111 @r_vm_1
-+vmadc_vim       010001 1 ..... ..... 011 ..... 1010111 @r_vm_1
-+vsbc_vvm        010010 1 ..... ..... 000 ..... 1010111 @r_vm_1
-+vsbc_vxm        010010 1 ..... ..... 100 ..... 1010111 @r_vm_1
-+vmsbc_vvm       010011 1 ..... ..... 000 ..... 1010111 @r_vm_1
-+vmsbc_vxm       010011 1 ..... ..... 100 ..... 1010111 @r_vm_1
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIWX_WIDEN_TRANS(vwaddu_wx)
- GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
- GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
- GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
-+
-+/* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
-+/* OPIVV without GVEC IR */
-+#define GEN_OPIVV_TRANS(NAME, CHECK)                               \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+{                                                                  \
-+    if (CHECK(s, a)) {                                             \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_4_ptr * const fns[4] = {            \
-+            gen_helper_##NAME##_b, gen_helper_##NAME##_h,          \
-+            gen_helper_##NAME##_w, gen_helper_##NAME##_d,          \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs1),                    \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew]);        \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+
-+/*
-+ * For vadc and vsbc, an illegal instruction exception is raised if the
-+ * destination vector register is v0 and LMUL > 1. (Section 12.3)
-+ */
-+static bool opivv_vadc_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            ((a->rd != 0) || (s->lmul == 0)));
-+}
-+
-+GEN_OPIVV_TRANS(vadc_vvm, opivv_vadc_check)
-+GEN_OPIVV_TRANS(vsbc_vvm, opivv_vadc_check)
-+
-+/*
-+ * For vmadc and vmsbc, an illegal instruction exception is raised if the
-+ * destination vector register overlaps a source vector register group.
-+ */
-+static bool opivv_vmadc_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
-+            vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul));
-+}
-+
-+GEN_OPIVV_TRANS(vmadc_vvm, opivv_vmadc_check)
-+GEN_OPIVV_TRANS(vmsbc_vvm, opivv_vmadc_check)
-+
-+static bool opivx_vadc_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            ((a->rd != 0) || (s->lmul == 0)));
-+}
-+
-+/* OPIVX without GVEC IR */
-+#define GEN_OPIVX_TRANS(NAME, CHECK)                                     \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (CHECK(s, a)) {                                                   \
-+        static gen_helper_opivx * const fns[4] = {                       \
-+            gen_helper_##NAME##_b, gen_helper_##NAME##_h,                \
-+            gen_helper_##NAME##_w, gen_helper_##NAME##_d,                \
-+        };                                                               \
-+                                                                         \
-+        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVX_TRANS(vadc_vxm, opivx_vadc_check)
-+GEN_OPIVX_TRANS(vsbc_vxm, opivx_vadc_check)
-+
-+static bool opivx_vmadc_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul));
-+}
-+
-+GEN_OPIVX_TRANS(vmadc_vxm, opivx_vmadc_check)
-+GEN_OPIVX_TRANS(vmsbc_vxm, opivx_vmadc_check)
-+
-+/* OPIVI without GVEC IR */
-+#define GEN_OPIVI_TRANS(NAME, ZX, OPIVX, CHECK)                          \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (CHECK(s, a)) {                                                   \
-+        static gen_helper_opivx * const fns[4] = {                       \
-+            gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,              \
-+            gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,              \
-+        };                                                               \
-+        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm,                 \
-+                           fns[s->sew], s, ZX);                          \
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVI_TRANS(vadc_vim, 0, vadc_vxm, opivx_vadc_check)
-+GEN_OPIVI_TRANS(vmadc_vim, 0, vmadc_vxm, opivx_vmadc_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ static void clearq(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
-     vext_clear(cur, cnt, tot);
- }
-+static inline void vext_set_elem_mask(void *v0, int mlen, int index,
-+        uint8_t value)
-+{
-+    int idx = (index * mlen) / 64;
-+    int pos = (index * mlen) % 64;
-+    uint64_t old = ((uint64_t *)v0)[idx];
-+    ((uint64_t *)v0)[idx] = deposit64(old, pos, mlen, value);
-+}
- static inline int vext_elem_mask(void *v0, int mlen, int index)
- {
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwadd_wx_w, 4, 8, clearq)
- GEN_VEXT_VX(vwsub_wx_b, 1, 2, clearh)
- GEN_VEXT_VX(vwsub_wx_h, 2, 4, clearl)
- GEN_VEXT_VX(vwsub_wx_w, 4, 8, clearq)
-+
-+/* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
-+#define DO_VADC(N, M, C) (N + M + C)
-+#define DO_VSBC(N, M, C) (N - M - C)
-+
-+#define GEN_VEXT_VADC_VVM(NAME, ETYPE, H, DO_OP, CLEAR_FN)    \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)          \
-+{                                                             \
-+    uint32_t mlen = vext_mlen(desc);                          \
-+    uint32_t vl = env->vl;                                    \
-+    uint32_t esz = sizeof(ETYPE);                             \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                  \
-+    uint32_t i;                                               \
-+                                                              \
-+    for (i = 0; i < vl; i++) {                                \
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        uint8_t carry = vext_elem_mask(v0, mlen, i);          \
-+                                                              \
-+        *((ETYPE *)vd + H(i)) = DO_OP(s2, s1, carry);         \
-+    }                                                         \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                  \
-+}
-+
-+GEN_VEXT_VADC_VVM(vadc_vvm_b, uint8_t,  H1, DO_VADC, clearb)
-+GEN_VEXT_VADC_VVM(vadc_vvm_h, uint16_t, H2, DO_VADC, clearh)
-+GEN_VEXT_VADC_VVM(vadc_vvm_w, uint32_t, H4, DO_VADC, clearl)
-+GEN_VEXT_VADC_VVM(vadc_vvm_d, uint64_t, H8, DO_VADC, clearq)
-+
-+GEN_VEXT_VADC_VVM(vsbc_vvm_b, uint8_t,  H1, DO_VSBC, clearb)
-+GEN_VEXT_VADC_VVM(vsbc_vvm_h, uint16_t, H2, DO_VSBC, clearh)
-+GEN_VEXT_VADC_VVM(vsbc_vvm_w, uint32_t, H4, DO_VSBC, clearl)
-+GEN_VEXT_VADC_VVM(vsbc_vvm_d, uint64_t, H8, DO_VSBC, clearq)
-+
-+#define GEN_VEXT_VADC_VXM(NAME, ETYPE, H, DO_OP, CLEAR_FN)               \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,        \
-+                  CPURISCVState *env, uint32_t desc)                     \
-+{                                                                        \
-+    uint32_t mlen = vext_mlen(desc);                                     \
-+    uint32_t vl = env->vl;                                               \
-+    uint32_t esz = sizeof(ETYPE);                                        \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                             \
-+    uint32_t i;                                                          \
-+                                                                         \
-+    for (i = 0; i < vl; i++) {                                           \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                               \
-+        uint8_t carry = vext_elem_mask(v0, mlen, i);                     \
-+                                                                         \
-+        *((ETYPE *)vd + H(i)) = DO_OP(s2, (ETYPE)(target_long)s1, carry);\
-+    }                                                                    \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                             \
-+}
-+
-+GEN_VEXT_VADC_VXM(vadc_vxm_b, uint8_t,  H1, DO_VADC, clearb)
-+GEN_VEXT_VADC_VXM(vadc_vxm_h, uint16_t, H2, DO_VADC, clearh)
-+GEN_VEXT_VADC_VXM(vadc_vxm_w, uint32_t, H4, DO_VADC, clearl)
-+GEN_VEXT_VADC_VXM(vadc_vxm_d, uint64_t, H8, DO_VADC, clearq)
-+
-+GEN_VEXT_VADC_VXM(vsbc_vxm_b, uint8_t,  H1, DO_VSBC, clearb)
-+GEN_VEXT_VADC_VXM(vsbc_vxm_h, uint16_t, H2, DO_VSBC, clearh)
-+GEN_VEXT_VADC_VXM(vsbc_vxm_w, uint32_t, H4, DO_VSBC, clearl)
-+GEN_VEXT_VADC_VXM(vsbc_vxm_d, uint64_t, H8, DO_VSBC, clearq)
-+
-+#define DO_MADC(N, M, C) (C ? (__typeof(N))(N + M + 1) <= N :           \
-+                          (__typeof(N))(N + M) < N)
-+#define DO_MSBC(N, M, C) (C ? N <= M : N < M)
-+
-+#define GEN_VEXT_VMADC_VVM(NAME, ETYPE, H, DO_OP)             \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)          \
-+{                                                             \
-+    uint32_t mlen = vext_mlen(desc);                          \
-+    uint32_t vl = env->vl;                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
-+    uint32_t i;                                               \
-+                                                              \
-+    for (i = 0; i < vl; i++) {                                \
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        uint8_t carry = vext_elem_mask(v0, mlen, i);          \
-+                                                              \
-+        vext_set_elem_mask(vd, mlen, i, DO_OP(s2, s1, carry));\
-+    }                                                         \
-+    for (; i < vlmax; i++) {                                  \
-+        vext_set_elem_mask(vd, mlen, i, 0);                   \
-+    }                                                         \
-+}
-+
-+GEN_VEXT_VMADC_VVM(vmadc_vvm_b, uint8_t,  H1, DO_MADC)
-+GEN_VEXT_VMADC_VVM(vmadc_vvm_h, uint16_t, H2, DO_MADC)
-+GEN_VEXT_VMADC_VVM(vmadc_vvm_w, uint32_t, H4, DO_MADC)
-+GEN_VEXT_VMADC_VVM(vmadc_vvm_d, uint64_t, H8, DO_MADC)
-+
-+GEN_VEXT_VMADC_VVM(vmsbc_vvm_b, uint8_t,  H1, DO_MSBC)
-+GEN_VEXT_VMADC_VVM(vmsbc_vvm_h, uint16_t, H2, DO_MSBC)
-+GEN_VEXT_VMADC_VVM(vmsbc_vvm_w, uint32_t, H4, DO_MSBC)
-+GEN_VEXT_VMADC_VVM(vmsbc_vvm_d, uint64_t, H8, DO_MSBC)
-+
-+#define GEN_VEXT_VMADC_VXM(NAME, ETYPE, H, DO_OP)               \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1,          \
-+                  void *vs2, CPURISCVState *env, uint32_t desc) \
-+{                                                               \
-+    uint32_t mlen = vext_mlen(desc);                            \
-+    uint32_t vl = env->vl;                                      \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);          \
-+    uint32_t i;                                                 \
-+                                                                \
-+    for (i = 0; i < vl; i++) {                                  \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                      \
-+        uint8_t carry = vext_elem_mask(v0, mlen, i);            \
-+                                                                \
-+        vext_set_elem_mask(vd, mlen, i,                         \
-+                DO_OP(s2, (ETYPE)(target_long)s1, carry));      \
-+    }                                                           \
-+    for (; i < vlmax; i++) {                                    \
-+        vext_set_elem_mask(vd, mlen, i, 0);                     \
-+    }                                                           \
-+}
-+
-+GEN_VEXT_VMADC_VXM(vmadc_vxm_b, uint8_t,  H1, DO_MADC)
-+GEN_VEXT_VMADC_VXM(vmadc_vxm_h, uint16_t, H2, DO_MADC)
-+GEN_VEXT_VMADC_VXM(vmadc_vxm_w, uint32_t, H4, DO_MADC)
-+GEN_VEXT_VMADC_VXM(vmadc_vxm_d, uint64_t, H8, DO_MADC)
-+
-+GEN_VEXT_VMADC_VXM(vmsbc_vxm_b, uint8_t,  H1, DO_MSBC)
-+GEN_VEXT_VMADC_VXM(vmsbc_vxm_h, uint16_t, H2, DO_MSBC)
-+GEN_VEXT_VMADC_VXM(vmsbc_vxm_w, uint32_t, H4, DO_MSBC)
-+GEN_VEXT_VMADC_VXM(vmsbc_vxm_d, uint64_t, H8, DO_MSBC)
---
-.27.0

-[PULL 15/63] target/riscv: vector bitwise logical instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-14-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 25 ++++++++++++
- target/riscv/insn32.decode              |  9 +++++
- target/riscv/insn_trans/trans_rvv.inc.c | 11 ++++++
- target/riscv/vector_helper.c            | 51 +++++++++++++++++++++++++
-files changed, 96 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vand_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vsbc_vvm        010010 1 ..... ..... 000 ..... 1010111 @r_vm_1
- vsbc_vxm        010010 1 ..... ..... 100 ..... 1010111 @r_vm_1
- vmsbc_vvm       010011 1 ..... ..... 000 ..... 1010111 @r_vm_1
- vmsbc_vxm       010011 1 ..... ..... 100 ..... 1010111 @r_vm_1
-+vand_vv         001001 . ..... ..... 000 ..... 1010111 @r_vm
-+vand_vx         001001 . ..... ..... 100 ..... 1010111 @r_vm
-+vand_vi         001001 . ..... ..... 011 ..... 1010111 @r_vm
-+vor_vv          001010 . ..... ..... 000 ..... 1010111 @r_vm
-+vor_vx          001010 . ..... ..... 100 ..... 1010111 @r_vm
-+vor_vi          001010 . ..... ..... 011 ..... 1010111 @r_vm
-+vxor_vv         001011 . ..... ..... 000 ..... 1010111 @r_vm
-+vxor_vx         001011 . ..... ..... 100 ..... 1010111 @r_vm
-+vxor_vi         001011 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
- GEN_OPIVI_TRANS(vadc_vim, 0, vadc_vxm, opivx_vadc_check)
- GEN_OPIVI_TRANS(vmadc_vim, 0, vmadc_vxm, opivx_vmadc_check)
-+
-+/* Vector Bitwise Logical Instructions */
-+GEN_OPIVV_GVEC_TRANS(vand_vv, and)
-+GEN_OPIVV_GVEC_TRANS(vor_vv,  or)
-+GEN_OPIVV_GVEC_TRANS(vxor_vv, xor)
-+GEN_OPIVX_GVEC_TRANS(vand_vx, ands)
-+GEN_OPIVX_GVEC_TRANS(vor_vx,  ors)
-+GEN_OPIVX_GVEC_TRANS(vxor_vx, xors)
-+GEN_OPIVI_GVEC_TRANS(vand_vi, 0, vand_vx, andi)
-+GEN_OPIVI_GVEC_TRANS(vor_vi, 0, vor_vx,  ori)
-+GEN_OPIVI_GVEC_TRANS(vxor_vi, 0, vxor_vx, xori)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VMADC_VXM(vmsbc_vxm_b, uint8_t,  H1, DO_MSBC)
- GEN_VEXT_VMADC_VXM(vmsbc_vxm_h, uint16_t, H2, DO_MSBC)
- GEN_VEXT_VMADC_VXM(vmsbc_vxm_w, uint32_t, H4, DO_MSBC)
- GEN_VEXT_VMADC_VXM(vmsbc_vxm_d, uint64_t, H8, DO_MSBC)
-+
-+/* Vector Bitwise Logical Instructions */
-+RVVCALL(OPIVV2, vand_vv_b, OP_SSS_B, H1, H1, H1, DO_AND)
-+RVVCALL(OPIVV2, vand_vv_h, OP_SSS_H, H2, H2, H2, DO_AND)
-+RVVCALL(OPIVV2, vand_vv_w, OP_SSS_W, H4, H4, H4, DO_AND)
-+RVVCALL(OPIVV2, vand_vv_d, OP_SSS_D, H8, H8, H8, DO_AND)
-+RVVCALL(OPIVV2, vor_vv_b, OP_SSS_B, H1, H1, H1, DO_OR)
-+RVVCALL(OPIVV2, vor_vv_h, OP_SSS_H, H2, H2, H2, DO_OR)
-+RVVCALL(OPIVV2, vor_vv_w, OP_SSS_W, H4, H4, H4, DO_OR)
-+RVVCALL(OPIVV2, vor_vv_d, OP_SSS_D, H8, H8, H8, DO_OR)
-+RVVCALL(OPIVV2, vxor_vv_b, OP_SSS_B, H1, H1, H1, DO_XOR)
-+RVVCALL(OPIVV2, vxor_vv_h, OP_SSS_H, H2, H2, H2, DO_XOR)
-+RVVCALL(OPIVV2, vxor_vv_w, OP_SSS_W, H4, H4, H4, DO_XOR)
-+RVVCALL(OPIVV2, vxor_vv_d, OP_SSS_D, H8, H8, H8, DO_XOR)
-+GEN_VEXT_VV(vand_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vand_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vand_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vand_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vor_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vor_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vor_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vor_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vxor_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vxor_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vxor_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vxor_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vand_vx_b, OP_SSS_B, H1, H1, DO_AND)
-+RVVCALL(OPIVX2, vand_vx_h, OP_SSS_H, H2, H2, DO_AND)
-+RVVCALL(OPIVX2, vand_vx_w, OP_SSS_W, H4, H4, DO_AND)
-+RVVCALL(OPIVX2, vand_vx_d, OP_SSS_D, H8, H8, DO_AND)
-+RVVCALL(OPIVX2, vor_vx_b, OP_SSS_B, H1, H1, DO_OR)
-+RVVCALL(OPIVX2, vor_vx_h, OP_SSS_H, H2, H2, DO_OR)
-+RVVCALL(OPIVX2, vor_vx_w, OP_SSS_W, H4, H4, DO_OR)
-+RVVCALL(OPIVX2, vor_vx_d, OP_SSS_D, H8, H8, DO_OR)
-+RVVCALL(OPIVX2, vxor_vx_b, OP_SSS_B, H1, H1, DO_XOR)
-+RVVCALL(OPIVX2, vxor_vx_h, OP_SSS_H, H2, H2, DO_XOR)
-+RVVCALL(OPIVX2, vxor_vx_w, OP_SSS_W, H4, H4, DO_XOR)
-+RVVCALL(OPIVX2, vxor_vx_d, OP_SSS_D, H8, H8, DO_XOR)
-+GEN_VEXT_VX(vand_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vand_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vand_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vand_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vor_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vor_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vor_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vor_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vxor_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vxor_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vxor_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vxor_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 16/63] target/riscv: vector single-width bit shift instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-15-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 25 ++++++++
- target/riscv/insn32.decode              |  9 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 52 ++++++++++++++++
- target/riscv/vector_helper.c            | 79 +++++++++++++++++++++++++
-files changed, 165 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vxor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vxor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vxor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vxor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vsll_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsll_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsll_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsll_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsra_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsll_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsll_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsll_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsll_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsrl_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vor_vi          001010 . ..... ..... 011 ..... 1010111 @r_vm
- vxor_vv         001011 . ..... ..... 000 ..... 1010111 @r_vm
- vxor_vx         001011 . ..... ..... 100 ..... 1010111 @r_vm
- vxor_vi         001011 . ..... ..... 011 ..... 1010111 @r_vm
-+vsll_vv         100101 . ..... ..... 000 ..... 1010111 @r_vm
-+vsll_vx         100101 . ..... ..... 100 ..... 1010111 @r_vm
-+vsll_vi         100101 . ..... ..... 011 ..... 1010111 @r_vm
-+vsrl_vv         101000 . ..... ..... 000 ..... 1010111 @r_vm
-+vsrl_vx         101000 . ..... ..... 100 ..... 1010111 @r_vm
-+vsrl_vi         101000 . ..... ..... 011 ..... 1010111 @r_vm
-+vsra_vv         101001 . ..... ..... 000 ..... 1010111 @r_vm
-+vsra_vx         101001 . ..... ..... 100 ..... 1010111 @r_vm
-+vsra_vi         101001 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_TRANS(vxor_vx, xors)
- GEN_OPIVI_GVEC_TRANS(vand_vi, 0, vand_vx, andi)
- GEN_OPIVI_GVEC_TRANS(vor_vi, 0, vor_vx,  ori)
- GEN_OPIVI_GVEC_TRANS(vxor_vi, 0, vxor_vx, xori)
-+
-+/* Vector Single-Width Bit Shift Instructions */
-+GEN_OPIVV_GVEC_TRANS(vsll_vv,  shlv)
-+GEN_OPIVV_GVEC_TRANS(vsrl_vv,  shrv)
-+GEN_OPIVV_GVEC_TRANS(vsra_vv,  sarv)
-+
-+typedef void GVecGen2sFn32(unsigned, uint32_t, uint32_t, TCGv_i32,
-+                           uint32_t, uint32_t);
-+
-+static inline bool
-+do_opivx_gvec_shift(DisasContext *s, arg_rmrr *a, GVecGen2sFn32 *gvec_fn,
-+                    gen_helper_opivx *fn)
-+{
-+    if (!opivx_check(s, a)) {
-+        return false;
-+    }
-+
-+    if (a->vm && s->vl_eq_vlmax) {
-+        TCGv_i32 src1 = tcg_temp_new_i32();
-+        TCGv tmp = tcg_temp_new();
-+
-+        gen_get_gpr(tmp, a->rs1);
-+        tcg_gen_trunc_tl_i32(src1, tmp);
-+        tcg_gen_extract_i32(src1, src1, 0, s->sew + 3);
-+        gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
-+                src1, MAXSZ(s), MAXSZ(s));
-+
-+        tcg_temp_free_i32(src1);
-+        tcg_temp_free(tmp);
-+        return true;
-+    }
-+    return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
-+}
-+
-+#define GEN_OPIVX_GVEC_SHIFT_TRANS(NAME, SUF) \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
-+{                                                                         \
-+    static gen_helper_opivx * const fns[4] = {                            \
-+        gen_helper_##NAME##_b, gen_helper_##NAME##_h,                     \
-+        gen_helper_##NAME##_w, gen_helper_##NAME##_d,                     \
-+    };                                                                    \
-+                                                                          \
-+    return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);    \
-+}
-+
-+GEN_OPIVX_GVEC_SHIFT_TRANS(vsll_vx,  shls)
-+GEN_OPIVX_GVEC_SHIFT_TRANS(vsrl_vx,  shrs)
-+GEN_OPIVX_GVEC_SHIFT_TRANS(vsra_vx,  sars)
-+
-+GEN_OPIVI_GVEC_TRANS(vsll_vi, 1, vsll_vx,  shli)
-+GEN_OPIVI_GVEC_TRANS(vsrl_vi, 1, vsrl_vx,  shri)
-+GEN_OPIVI_GVEC_TRANS(vsra_vi, 1, vsra_vx,  sari)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vxor_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vxor_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vxor_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vxor_vx_d, 8, 8, clearq)
-+
-+/* Vector Single-Width Bit Shift Instructions */
-+#define DO_SLL(N, M)  (N << (M))
-+#define DO_SRL(N, M)  (N >> (M))
-+
-+/* generate the helpers for shift instructions with two vector operators */
-+#define GEN_VEXT_SHIFT_VV(NAME, TS1, TS2, HS1, HS2, OP, MASK, CLEAR_FN)   \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1,                          \
-+                  void *vs2, CPURISCVState *env, uint32_t desc)           \
-+{                                                                         \
-+    uint32_t mlen = vext_mlen(desc);                                      \
-+    uint32_t vm = vext_vm(desc);                                          \
-+    uint32_t vl = env->vl;                                                \
-+    uint32_t esz = sizeof(TS1);                                           \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                              \
-+    uint32_t i;                                                           \
-+                                                                          \
-+    for (i = 0; i < vl; i++) {                                            \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
-+            continue;                                                     \
-+        }                                                                 \
-+        TS1 s1 = *((TS1 *)vs1 + HS1(i));                                  \
-+        TS2 s2 = *((TS2 *)vs2 + HS2(i));                                  \
-+        *((TS1 *)vd + HS1(i)) = OP(s2, s1 & MASK);                        \
-+    }                                                                     \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                              \
-+}
-+
-+GEN_VEXT_SHIFT_VV(vsll_vv_b, uint8_t,  uint8_t, H1, H1, DO_SLL, 0x7, clearb)
-+GEN_VEXT_SHIFT_VV(vsll_vv_h, uint16_t, uint16_t, H2, H2, DO_SLL, 0xf, clearh)
-+GEN_VEXT_SHIFT_VV(vsll_vv_w, uint32_t, uint32_t, H4, H4, DO_SLL, 0x1f, clearl)
-+GEN_VEXT_SHIFT_VV(vsll_vv_d, uint64_t, uint64_t, H8, H8, DO_SLL, 0x3f, clearq)
-+
-+GEN_VEXT_SHIFT_VV(vsrl_vv_b, uint8_t, uint8_t, H1, H1, DO_SRL, 0x7, clearb)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_h, uint16_t, uint16_t, H2, H2, DO_SRL, 0xf, clearh)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_w, uint32_t, uint32_t, H4, H4, DO_SRL, 0x1f, clearl)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_d, uint64_t, uint64_t, H8, H8, DO_SRL, 0x3f, clearq)
-+
-+GEN_VEXT_SHIFT_VV(vsra_vv_b, uint8_t,  int8_t, H1, H1, DO_SRL, 0x7, clearb)
-+GEN_VEXT_SHIFT_VV(vsra_vv_h, uint16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
-+GEN_VEXT_SHIFT_VV(vsra_vv_w, uint32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
-+GEN_VEXT_SHIFT_VV(vsra_vv_d, uint64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
-+
-+/* generate the helpers for shift instructions with one vector and one scalar */
-+#define GEN_VEXT_SHIFT_VX(NAME, TD, TS2, HD, HS2, OP, MASK, CLEAR_FN) \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1,                \
-+        void *vs2, CPURISCVState *env, uint32_t desc)                 \
-+{                                                                     \
-+    uint32_t mlen = vext_mlen(desc);                                  \
-+    uint32_t vm = vext_vm(desc);                                      \
-+    uint32_t vl = env->vl;                                            \
-+    uint32_t esz = sizeof(TD);                                        \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                          \
-+    uint32_t i;                                                       \
-+                                                                      \
-+    for (i = 0; i < vl; i++) {                                        \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                    \
-+            continue;                                                 \
-+        }                                                             \
-+        TS2 s2 = *((TS2 *)vs2 + HS2(i));                              \
-+        *((TD *)vd + HD(i)) = OP(s2, s1 & MASK);                      \
-+    }                                                                 \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                          \
-+}
-+
-+GEN_VEXT_SHIFT_VX(vsll_vx_b, uint8_t, int8_t, H1, H1, DO_SLL, 0x7, clearb)
-+GEN_VEXT_SHIFT_VX(vsll_vx_h, uint16_t, int16_t, H2, H2, DO_SLL, 0xf, clearh)
-+GEN_VEXT_SHIFT_VX(vsll_vx_w, uint32_t, int32_t, H4, H4, DO_SLL, 0x1f, clearl)
-+GEN_VEXT_SHIFT_VX(vsll_vx_d, uint64_t, int64_t, H8, H8, DO_SLL, 0x3f, clearq)
-+
-+GEN_VEXT_SHIFT_VX(vsrl_vx_b, uint8_t, uint8_t, H1, H1, DO_SRL, 0x7, clearb)
-+GEN_VEXT_SHIFT_VX(vsrl_vx_h, uint16_t, uint16_t, H2, H2, DO_SRL, 0xf, clearh)
-+GEN_VEXT_SHIFT_VX(vsrl_vx_w, uint32_t, uint32_t, H4, H4, DO_SRL, 0x1f, clearl)
-+GEN_VEXT_SHIFT_VX(vsrl_vx_d, uint64_t, uint64_t, H8, H8, DO_SRL, 0x3f, clearq)
-+
-+GEN_VEXT_SHIFT_VX(vsra_vx_b, int8_t, int8_t, H1, H1, DO_SRL, 0x7, clearb)
-+GEN_VEXT_SHIFT_VX(vsra_vx_h, int16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
-+GEN_VEXT_SHIFT_VX(vsra_vx_w, int32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
-+GEN_VEXT_SHIFT_VX(vsra_vx_d, int64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
---
-.27.0

-[PULL 17/63] target/riscv: vector narrowing integer right shift instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-16-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 13 ++++
- target/riscv/insn32.decode              |  6 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 90 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 14 ++++
-files changed, 123 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vnsrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vsrl_vi         101000 . ..... ..... 011 ..... 1010111 @r_vm
- vsra_vv         101001 . ..... ..... 000 ..... 1010111 @r_vm
- vsra_vx         101001 . ..... ..... 100 ..... 1010111 @r_vm
- vsra_vi         101001 . ..... ..... 011 ..... 1010111 @r_vm
-+vnsrl_vv        101100 . ..... ..... 000 ..... 1010111 @r_vm
-+vnsrl_vx        101100 . ..... ..... 100 ..... 1010111 @r_vm
-+vnsrl_vi        101100 . ..... ..... 011 ..... 1010111 @r_vm
-+vnsra_vv        101101 . ..... ..... 000 ..... 1010111 @r_vm
-+vnsra_vx        101101 . ..... ..... 100 ..... 1010111 @r_vm
-+vnsra_vi        101101 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_SHIFT_TRANS(vsra_vx,  sars)
- GEN_OPIVI_GVEC_TRANS(vsll_vi, 1, vsll_vx,  shli)
- GEN_OPIVI_GVEC_TRANS(vsrl_vi, 1, vsrl_vx,  shri)
- GEN_OPIVI_GVEC_TRANS(vsra_vi, 1, vsra_vx,  sari)
-+
-+/* Vector Narrowing Integer Right Shift Instructions */
-+static bool opivv_narrow_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
-+                2 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3));
-+}
-+
-+/* OPIVV with NARROW */
-+#define GEN_OPIVV_NARROW_TRANS(NAME)                               \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+{                                                                  \
-+    if (opivv_narrow_check(s, a)) {                                \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_4_ptr * const fns[3] = {            \
-+            gen_helper_##NAME##_b,                                 \
-+            gen_helper_##NAME##_h,                                 \
-+            gen_helper_##NAME##_w,                                 \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs1),                    \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew]);        \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+GEN_OPIVV_NARROW_TRANS(vnsra_vv)
-+GEN_OPIVV_NARROW_TRANS(vnsrl_vv)
-+
-+static bool opivx_narrow_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
-+                2 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3));
-+}
-+
-+/* OPIVX with NARROW */
-+#define GEN_OPIVX_NARROW_TRANS(NAME)                                     \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (opivx_narrow_check(s, a)) {                                      \
-+        static gen_helper_opivx * const fns[3] = {                       \
-+            gen_helper_##NAME##_b,                                       \
-+            gen_helper_##NAME##_h,                                       \
-+            gen_helper_##NAME##_w,                                       \
-+        };                                                               \
-+        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVX_NARROW_TRANS(vnsra_vx)
-+GEN_OPIVX_NARROW_TRANS(vnsrl_vx)
-+
-+/* OPIVI with NARROW */
-+#define GEN_OPIVI_NARROW_TRANS(NAME, ZX, OPIVX)                          \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (opivx_narrow_check(s, a)) {                                      \
-+        static gen_helper_opivx * const fns[3] = {                       \
-+            gen_helper_##OPIVX##_b,                                      \
-+            gen_helper_##OPIVX##_h,                                      \
-+            gen_helper_##OPIVX##_w,                                      \
-+        };                                                               \
-+        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm,                 \
-+                           fns[s->sew], s, ZX);                          \
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVI_NARROW_TRANS(vnsra_vi, 1, vnsra_vx)
-+GEN_OPIVI_NARROW_TRANS(vnsrl_vi, 1, vnsrl_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_SHIFT_VX(vsra_vx_b, int8_t, int8_t, H1, H1, DO_SRL, 0x7, clearb)
- GEN_VEXT_SHIFT_VX(vsra_vx_h, int16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
- GEN_VEXT_SHIFT_VX(vsra_vx_w, int32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
- GEN_VEXT_SHIFT_VX(vsra_vx_d, int64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
-+
-+/* Vector Narrowing Integer Right Shift Instructions */
-+GEN_VEXT_SHIFT_VV(vnsrl_vv_b, uint8_t,  uint16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VV(vnsrl_vv_h, uint16_t, uint32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VV(vnsrl_vv_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+GEN_VEXT_SHIFT_VV(vnsra_vv_b, uint8_t,  int16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VV(vnsra_vv_h, uint16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VV(vnsra_vv_w, uint32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+GEN_VEXT_SHIFT_VX(vnsrl_vx_b, uint8_t, uint16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VX(vnsrl_vx_h, uint16_t, uint32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VX(vnsrl_vx_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+GEN_VEXT_SHIFT_VX(vnsra_vx_b, int8_t, int16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VX(vnsra_vx_h, int16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VX(vnsra_vx_w, int32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
---
-.27.0

-[PULL 18/63] target/riscv: vector integer comparison instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-17-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  57 +++++++++++
- target/riscv/insn32.decode              |  20 ++++
- target/riscv/insn_trans/trans_rvv.inc.c |  46 +++++++++
- target/riscv/vector_helper.c            | 123 ++++++++++++++++++++++++
-files changed, 246 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmseq_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vnsrl_vi        101100 . ..... ..... 011 ..... 1010111 @r_vm
- vnsra_vv        101101 . ..... ..... 000 ..... 1010111 @r_vm
- vnsra_vx        101101 . ..... ..... 100 ..... 1010111 @r_vm
- vnsra_vi        101101 . ..... ..... 011 ..... 1010111 @r_vm
-+vmseq_vv        011000 . ..... ..... 000 ..... 1010111 @r_vm
-+vmseq_vx        011000 . ..... ..... 100 ..... 1010111 @r_vm
-+vmseq_vi        011000 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsne_vv        011001 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsne_vx        011001 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsne_vi        011001 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsltu_vv       011010 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsltu_vx       011010 . ..... ..... 100 ..... 1010111 @r_vm
-+vmslt_vv        011011 . ..... ..... 000 ..... 1010111 @r_vm
-+vmslt_vx        011011 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsleu_vv       011100 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsleu_vx       011100 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsleu_vi       011100 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsle_vv        011101 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsle_vx        011101 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsle_vi        011101 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsgtu_vx       011110 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsgtu_vi       011110 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsgt_vx        011111 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsgt_vi        011111 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
- GEN_OPIVI_NARROW_TRANS(vnsra_vi, 1, vnsra_vx)
- GEN_OPIVI_NARROW_TRANS(vnsrl_vi, 1, vnsrl_vx)
-+
-+/* Vector Integer Comparison Instructions */
-+/*
-+ * For all comparison instructions, an illegal instruction exception is raised
-+ * if the destination vector register overlaps a source vector register group
-+ * and LMUL > 1.
-+ */
-+static bool opivv_cmp_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            ((vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
-+              vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul)) ||
-+             (s->lmul == 0)));
-+}
-+GEN_OPIVV_TRANS(vmseq_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsne_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsltu_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmslt_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsleu_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsle_vv, opivv_cmp_check)
-+
-+static bool opivx_cmp_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            (vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul) ||
-+             (s->lmul == 0)));
-+}
-+
-+GEN_OPIVX_TRANS(vmseq_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsne_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsltu_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmslt_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsleu_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsle_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsgtu_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsgt_vx, opivx_cmp_check)
-+
-+GEN_OPIVI_TRANS(vmseq_vi, 0, vmseq_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsne_vi, 0, vmsne_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsleu_vi, 1, vmsleu_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsle_vi, 0, vmsle_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsgtu_vi, 1, vmsgtu_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsgt_vi, 0, vmsgt_vx, opivx_cmp_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_SHIFT_VX(vnsrl_vx_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
- GEN_VEXT_SHIFT_VX(vnsra_vx_b, int8_t, int16_t, H1, H2, DO_SRL, 0xf, clearb)
- GEN_VEXT_SHIFT_VX(vnsra_vx_h, int16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
- GEN_VEXT_SHIFT_VX(vnsra_vx_w, int32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+
-+/* Vector Integer Comparison Instructions */
-+#define DO_MSEQ(N, M) (N == M)
-+#define DO_MSNE(N, M) (N != M)
-+#define DO_MSLT(N, M) (N < M)
-+#define DO_MSLE(N, M) (N <= M)
-+#define DO_MSGT(N, M) (N > M)
-+
-+#define GEN_VEXT_CMP_VV(NAME, ETYPE, H, DO_OP)                \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)          \
-+{                                                             \
-+    uint32_t mlen = vext_mlen(desc);                          \
-+    uint32_t vm = vext_vm(desc);                              \
-+    uint32_t vl = env->vl;                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
-+    uint32_t i;                                               \
-+                                                              \
-+    for (i = 0; i < vl; i++) {                                \
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {            \
-+            continue;                                         \
-+        }                                                     \
-+        vext_set_elem_mask(vd, mlen, i, DO_OP(s2, s1));       \
-+    }                                                         \
-+    for (; i < vlmax; i++) {                                  \
-+        vext_set_elem_mask(vd, mlen, i, 0);                   \
-+    }                                                         \
-+}
-+
-+GEN_VEXT_CMP_VV(vmseq_vv_b, uint8_t,  H1, DO_MSEQ)
-+GEN_VEXT_CMP_VV(vmseq_vv_h, uint16_t, H2, DO_MSEQ)
-+GEN_VEXT_CMP_VV(vmseq_vv_w, uint32_t, H4, DO_MSEQ)
-+GEN_VEXT_CMP_VV(vmseq_vv_d, uint64_t, H8, DO_MSEQ)
-+
-+GEN_VEXT_CMP_VV(vmsne_vv_b, uint8_t,  H1, DO_MSNE)
-+GEN_VEXT_CMP_VV(vmsne_vv_h, uint16_t, H2, DO_MSNE)
-+GEN_VEXT_CMP_VV(vmsne_vv_w, uint32_t, H4, DO_MSNE)
-+GEN_VEXT_CMP_VV(vmsne_vv_d, uint64_t, H8, DO_MSNE)
-+
-+GEN_VEXT_CMP_VV(vmsltu_vv_b, uint8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmsltu_vv_h, uint16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmsltu_vv_w, uint32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmsltu_vv_d, uint64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VV(vmslt_vv_b, int8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmslt_vv_h, int16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmslt_vv_w, int32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmslt_vv_d, int64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VV(vmsleu_vv_b, uint8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsleu_vv_h, uint16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsleu_vv_w, uint32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsleu_vv_d, uint64_t, H8, DO_MSLE)
-+
-+GEN_VEXT_CMP_VV(vmsle_vv_b, int8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsle_vv_h, int16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsle_vv_w, int32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsle_vv_d, int64_t, H8, DO_MSLE)
-+
-+#define GEN_VEXT_CMP_VX(NAME, ETYPE, H, DO_OP)                      \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)                \
-+{                                                                   \
-+    uint32_t mlen = vext_mlen(desc);                                \
-+    uint32_t vm = vext_vm(desc);                                    \
-+    uint32_t vl = env->vl;                                          \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);              \
-+    uint32_t i;                                                     \
-+                                                                    \
-+    for (i = 0; i < vl; i++) {                                      \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                          \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                  \
-+            continue;                                               \
-+        }                                                           \
-+        vext_set_elem_mask(vd, mlen, i,                             \
-+                DO_OP(s2, (ETYPE)(target_long)s1));                 \
-+    }                                                               \
-+    for (; i < vlmax; i++) {                                        \
-+        vext_set_elem_mask(vd, mlen, i, 0);                         \
-+    }                                                               \
-+}
-+
-+GEN_VEXT_CMP_VX(vmseq_vx_b, uint8_t,  H1, DO_MSEQ)
-+GEN_VEXT_CMP_VX(vmseq_vx_h, uint16_t, H2, DO_MSEQ)
-+GEN_VEXT_CMP_VX(vmseq_vx_w, uint32_t, H4, DO_MSEQ)
-+GEN_VEXT_CMP_VX(vmseq_vx_d, uint64_t, H8, DO_MSEQ)
-+
-+GEN_VEXT_CMP_VX(vmsne_vx_b, uint8_t,  H1, DO_MSNE)
-+GEN_VEXT_CMP_VX(vmsne_vx_h, uint16_t, H2, DO_MSNE)
-+GEN_VEXT_CMP_VX(vmsne_vx_w, uint32_t, H4, DO_MSNE)
-+GEN_VEXT_CMP_VX(vmsne_vx_d, uint64_t, H8, DO_MSNE)
-+
-+GEN_VEXT_CMP_VX(vmsltu_vx_b, uint8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmsltu_vx_h, uint16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmsltu_vx_w, uint32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmsltu_vx_d, uint64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VX(vmslt_vx_b, int8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmslt_vx_h, int16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmslt_vx_w, int32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmslt_vx_d, int64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VX(vmsleu_vx_b, uint8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsleu_vx_h, uint16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsleu_vx_w, uint32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsleu_vx_d, uint64_t, H8, DO_MSLE)
-+
-+GEN_VEXT_CMP_VX(vmsle_vx_b, int8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsle_vx_h, int16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsle_vx_w, int32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsle_vx_d, int64_t, H8, DO_MSLE)
-+
-+GEN_VEXT_CMP_VX(vmsgtu_vx_b, uint8_t,  H1, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgtu_vx_h, uint16_t, H2, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgtu_vx_w, uint32_t, H4, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgtu_vx_d, uint64_t, H8, DO_MSGT)
-+
-+GEN_VEXT_CMP_VX(vmsgt_vx_b, int8_t,  H1, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgt_vx_h, int16_t, H2, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgt_vx_w, int32_t, H4, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgt_vx_d, int64_t, H8, DO_MSGT)
---
-.27.0

-[PULL 19/63] target/riscv: vector integer min/max instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-18-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 ++++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 ++++
- target/riscv/vector_helper.c            | 71 +++++++++++++++++++++++++
-files changed, 122 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmsgt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsgt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsgt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsgt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vminu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmsgtu_vx       011110 . ..... ..... 100 ..... 1010111 @r_vm
- vmsgtu_vi       011110 . ..... ..... 011 ..... 1010111 @r_vm
- vmsgt_vx        011111 . ..... ..... 100 ..... 1010111 @r_vm
- vmsgt_vi        011111 . ..... ..... 011 ..... 1010111 @r_vm
-+vminu_vv        000100 . ..... ..... 000 ..... 1010111 @r_vm
-+vminu_vx        000100 . ..... ..... 100 ..... 1010111 @r_vm
-+vmin_vv         000101 . ..... ..... 000 ..... 1010111 @r_vm
-+vmin_vx         000101 . ..... ..... 100 ..... 1010111 @r_vm
-+vmaxu_vv        000110 . ..... ..... 000 ..... 1010111 @r_vm
-+vmaxu_vx        000110 . ..... ..... 100 ..... 1010111 @r_vm
-+vmax_vv         000111 . ..... ..... 000 ..... 1010111 @r_vm
-+vmax_vx         000111 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vmsleu_vi, 1, vmsleu_vx, opivx_cmp_check)
- GEN_OPIVI_TRANS(vmsle_vi, 0, vmsle_vx, opivx_cmp_check)
- GEN_OPIVI_TRANS(vmsgtu_vi, 1, vmsgtu_vx, opivx_cmp_check)
- GEN_OPIVI_TRANS(vmsgt_vi, 0, vmsgt_vx, opivx_cmp_check)
-+
-+/* Vector Integer Min/Max Instructions */
-+GEN_OPIVV_GVEC_TRANS(vminu_vv, umin)
-+GEN_OPIVV_GVEC_TRANS(vmin_vv,  smin)
-+GEN_OPIVV_GVEC_TRANS(vmaxu_vv, umax)
-+GEN_OPIVV_GVEC_TRANS(vmax_vv,  smax)
-+GEN_OPIVX_TRANS(vminu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmin_vx,  opivx_check)
-+GEN_OPIVX_TRANS(vmaxu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmax_vx,  opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
- #define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
- #define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
-+#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
-+#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
-+#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
-+#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VX(vmsgt_vx_b, int8_t,  H1, DO_MSGT)
- GEN_VEXT_CMP_VX(vmsgt_vx_h, int16_t, H2, DO_MSGT)
- GEN_VEXT_CMP_VX(vmsgt_vx_w, int32_t, H4, DO_MSGT)
- GEN_VEXT_CMP_VX(vmsgt_vx_d, int64_t, H8, DO_MSGT)
-+
-+/* Vector Integer Min/Max Instructions */
-+RVVCALL(OPIVV2, vminu_vv_b, OP_UUU_B, H1, H1, H1, DO_MIN)
-+RVVCALL(OPIVV2, vminu_vv_h, OP_UUU_H, H2, H2, H2, DO_MIN)
-+RVVCALL(OPIVV2, vminu_vv_w, OP_UUU_W, H4, H4, H4, DO_MIN)
-+RVVCALL(OPIVV2, vminu_vv_d, OP_UUU_D, H8, H8, H8, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_b, OP_SSS_B, H1, H1, H1, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_h, OP_SSS_H, H2, H2, H2, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_w, OP_SSS_W, H4, H4, H4, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_d, OP_SSS_D, H8, H8, H8, DO_MIN)
-+RVVCALL(OPIVV2, vmaxu_vv_b, OP_UUU_B, H1, H1, H1, DO_MAX)
-+RVVCALL(OPIVV2, vmaxu_vv_h, OP_UUU_H, H2, H2, H2, DO_MAX)
-+RVVCALL(OPIVV2, vmaxu_vv_w, OP_UUU_W, H4, H4, H4, DO_MAX)
-+RVVCALL(OPIVV2, vmaxu_vv_d, OP_UUU_D, H8, H8, H8, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_b, OP_SSS_B, H1, H1, H1, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_h, OP_SSS_H, H2, H2, H2, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_w, OP_SSS_W, H4, H4, H4, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_d, OP_SSS_D, H8, H8, H8, DO_MAX)
-+GEN_VEXT_VV(vminu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vminu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vminu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vminu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmin_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmin_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmin_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmin_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmaxu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmaxu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmaxu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmaxu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmax_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmax_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmax_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmax_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vminu_vx_b, OP_UUU_B, H1, H1, DO_MIN)
-+RVVCALL(OPIVX2, vminu_vx_h, OP_UUU_H, H2, H2, DO_MIN)
-+RVVCALL(OPIVX2, vminu_vx_w, OP_UUU_W, H4, H4, DO_MIN)
-+RVVCALL(OPIVX2, vminu_vx_d, OP_UUU_D, H8, H8, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_b, OP_SSS_B, H1, H1, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_h, OP_SSS_H, H2, H2, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_w, OP_SSS_W, H4, H4, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_d, OP_SSS_D, H8, H8, DO_MIN)
-+RVVCALL(OPIVX2, vmaxu_vx_b, OP_UUU_B, H1, H1, DO_MAX)
-+RVVCALL(OPIVX2, vmaxu_vx_h, OP_UUU_H, H2, H2, DO_MAX)
-+RVVCALL(OPIVX2, vmaxu_vx_w, OP_UUU_W, H4, H4, DO_MAX)
-+RVVCALL(OPIVX2, vmaxu_vx_d, OP_UUU_D, H8, H8, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_b, OP_SSS_B, H1, H1, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_h, OP_SSS_H, H2, H2, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_w, OP_SSS_W, H4, H4, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_d, OP_SSS_D, H8, H8, DO_MAX)
-+GEN_VEXT_VX(vminu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vminu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vminu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vminu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmin_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmin_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmin_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmin_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmaxu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmaxu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmaxu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmaxu_vx_d, 8, 8,  clearq)
-+GEN_VEXT_VX(vmax_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmax_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmax_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmax_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 20/63] target/riscv: vector single-width integer multiply instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-19-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  33 +++++
- target/riscv/insn32.decode              |   8 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  10 ++
- target/riscv/vector_helper.c            | 163 ++++++++++++++++++++++++
-files changed, 214 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmax_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmax_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmax_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmax_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmaxu_vv        000110 . ..... ..... 000 ..... 1010111 @r_vm
- vmaxu_vx        000110 . ..... ..... 100 ..... 1010111 @r_vm
- vmax_vv         000111 . ..... ..... 000 ..... 1010111 @r_vm
- vmax_vx         000111 . ..... ..... 100 ..... 1010111 @r_vm
-+vmul_vv         100101 . ..... ..... 010 ..... 1010111 @r_vm
-+vmul_vx         100101 . ..... ..... 110 ..... 1010111 @r_vm
-+vmulh_vv        100111 . ..... ..... 010 ..... 1010111 @r_vm
-+vmulh_vx        100111 . ..... ..... 110 ..... 1010111 @r_vm
-+vmulhu_vv       100100 . ..... ..... 010 ..... 1010111 @r_vm
-+vmulhu_vx       100100 . ..... ..... 110 ..... 1010111 @r_vm
-+vmulhsu_vv      100110 . ..... ..... 010 ..... 1010111 @r_vm
-+vmulhsu_vx      100110 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vminu_vx, opivx_check)
- GEN_OPIVX_TRANS(vmin_vx,  opivx_check)
- GEN_OPIVX_TRANS(vmaxu_vx, opivx_check)
- GEN_OPIVX_TRANS(vmax_vx,  opivx_check)
-+
-+/* Vector Single-Width Integer Multiply Instructions */
-+GEN_OPIVV_GVEC_TRANS(vmul_vv,  mul)
-+GEN_OPIVV_TRANS(vmulh_vv, opivv_check)
-+GEN_OPIVV_TRANS(vmulhu_vv, opivv_check)
-+GEN_OPIVV_TRANS(vmulhsu_vv, opivv_check)
-+GEN_OPIVX_GVEC_TRANS(vmul_vx,  muls)
-+GEN_OPIVX_TRANS(vmulh_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmulhu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmulhsu_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
- #define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
- #define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
-+#define OP_SUS_B int8_t, uint8_t, int8_t, uint8_t, int8_t
-+#define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
-+#define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
-+#define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vmax_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vmax_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vmax_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vmax_vx_d, 8, 8, clearq)
-+
-+/* Vector Single-Width Integer Multiply Instructions */
-+#define DO_MUL(N, M) (N * M)
-+RVVCALL(OPIVV2, vmul_vv_b, OP_SSS_B, H1, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vmul_vv_h, OP_SSS_H, H2, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vmul_vv_w, OP_SSS_W, H4, H4, H4, DO_MUL)
-+RVVCALL(OPIVV2, vmul_vv_d, OP_SSS_D, H8, H8, H8, DO_MUL)
-+GEN_VEXT_VV(vmul_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmul_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmul_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmul_vv_d, 8, 8, clearq)
-+
-+static int8_t do_mulh_b(int8_t s2, int8_t s1)
-+{
-+    return (int16_t)s2 * (int16_t)s1 >> 8;
-+}
-+
-+static int16_t do_mulh_h(int16_t s2, int16_t s1)
-+{
-+    return (int32_t)s2 * (int32_t)s1 >> 16;
-+}
-+
-+static int32_t do_mulh_w(int32_t s2, int32_t s1)
-+{
-+    return (int64_t)s2 * (int64_t)s1 >> 32;
-+}
-+
-+static int64_t do_mulh_d(int64_t s2, int64_t s1)
-+{
-+    uint64_t hi_64, lo_64;
-+
-+    muls64(&lo_64, &hi_64, s1, s2);
-+    return hi_64;
-+}
-+
-+static uint8_t do_mulhu_b(uint8_t s2, uint8_t s1)
-+{
-+    return (uint16_t)s2 * (uint16_t)s1 >> 8;
-+}
-+
-+static uint16_t do_mulhu_h(uint16_t s2, uint16_t s1)
-+{
-+    return (uint32_t)s2 * (uint32_t)s1 >> 16;
-+}
-+
-+static uint32_t do_mulhu_w(uint32_t s2, uint32_t s1)
-+{
-+    return (uint64_t)s2 * (uint64_t)s1 >> 32;
-+}
-+
-+static uint64_t do_mulhu_d(uint64_t s2, uint64_t s1)
-+{
-+    uint64_t hi_64, lo_64;
-+
-+    mulu64(&lo_64, &hi_64, s2, s1);
-+    return hi_64;
-+}
-+
-+static int8_t do_mulhsu_b(int8_t s2, uint8_t s1)
-+{
-+    return (int16_t)s2 * (uint16_t)s1 >> 8;
-+}
-+
-+static int16_t do_mulhsu_h(int16_t s2, uint16_t s1)
-+{
-+    return (int32_t)s2 * (uint32_t)s1 >> 16;
-+}
-+
-+static int32_t do_mulhsu_w(int32_t s2, uint32_t s1)
-+{
-+    return (int64_t)s2 * (uint64_t)s1 >> 32;
-+}
-+
-+/*
-+ * Let  A = signed operand,
-+ *      B = unsigned operand
-+ *      P = mulu64(A, B), unsigned product
-+ *
-+ * LET  X = 2 ** 64  - A, 2's complement of A
-+ *      SP = signed product
-+ * THEN
-+ *      IF A < 0
-+ *          SP = -X * B
-+ *             = -(2 ** 64 - A) * B
-+ *             = A * B - 2 ** 64 * B
-+ *             = P - 2 ** 64 * B
-+ *      ELSE
-+ *          SP = P
-+ * THEN
-+ *      HI_P -= (A < 0 ? B : 0)
-+ */
-+
-+static int64_t do_mulhsu_d(int64_t s2, uint64_t s1)
-+{
-+    uint64_t hi_64, lo_64;
-+
-+    mulu64(&lo_64, &hi_64, s2, s1);
-+
-+    hi_64 -= s2 < 0 ? s1 : 0;
-+    return hi_64;
-+}
-+
-+RVVCALL(OPIVV2, vmulh_vv_b, OP_SSS_B, H1, H1, H1, do_mulh_b)
-+RVVCALL(OPIVV2, vmulh_vv_h, OP_SSS_H, H2, H2, H2, do_mulh_h)
-+RVVCALL(OPIVV2, vmulh_vv_w, OP_SSS_W, H4, H4, H4, do_mulh_w)
-+RVVCALL(OPIVV2, vmulh_vv_d, OP_SSS_D, H8, H8, H8, do_mulh_d)
-+RVVCALL(OPIVV2, vmulhu_vv_b, OP_UUU_B, H1, H1, H1, do_mulhu_b)
-+RVVCALL(OPIVV2, vmulhu_vv_h, OP_UUU_H, H2, H2, H2, do_mulhu_h)
-+RVVCALL(OPIVV2, vmulhu_vv_w, OP_UUU_W, H4, H4, H4, do_mulhu_w)
-+RVVCALL(OPIVV2, vmulhu_vv_d, OP_UUU_D, H8, H8, H8, do_mulhu_d)
-+RVVCALL(OPIVV2, vmulhsu_vv_b, OP_SUS_B, H1, H1, H1, do_mulhsu_b)
-+RVVCALL(OPIVV2, vmulhsu_vv_h, OP_SUS_H, H2, H2, H2, do_mulhsu_h)
-+RVVCALL(OPIVV2, vmulhsu_vv_w, OP_SUS_W, H4, H4, H4, do_mulhsu_w)
-+RVVCALL(OPIVV2, vmulhsu_vv_d, OP_SUS_D, H8, H8, H8, do_mulhsu_d)
-+GEN_VEXT_VV(vmulh_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmulh_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmulh_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmulh_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmulhu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmulhu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmulhu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmulhu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmulhsu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmulhsu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmulhsu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmulhsu_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vmul_vx_b, OP_SSS_B, H1, H1, DO_MUL)
-+RVVCALL(OPIVX2, vmul_vx_h, OP_SSS_H, H2, H2, DO_MUL)
-+RVVCALL(OPIVX2, vmul_vx_w, OP_SSS_W, H4, H4, DO_MUL)
-+RVVCALL(OPIVX2, vmul_vx_d, OP_SSS_D, H8, H8, DO_MUL)
-+RVVCALL(OPIVX2, vmulh_vx_b, OP_SSS_B, H1, H1, do_mulh_b)
-+RVVCALL(OPIVX2, vmulh_vx_h, OP_SSS_H, H2, H2, do_mulh_h)
-+RVVCALL(OPIVX2, vmulh_vx_w, OP_SSS_W, H4, H4, do_mulh_w)
-+RVVCALL(OPIVX2, vmulh_vx_d, OP_SSS_D, H8, H8, do_mulh_d)
-+RVVCALL(OPIVX2, vmulhu_vx_b, OP_UUU_B, H1, H1, do_mulhu_b)
-+RVVCALL(OPIVX2, vmulhu_vx_h, OP_UUU_H, H2, H2, do_mulhu_h)
-+RVVCALL(OPIVX2, vmulhu_vx_w, OP_UUU_W, H4, H4, do_mulhu_w)
-+RVVCALL(OPIVX2, vmulhu_vx_d, OP_UUU_D, H8, H8, do_mulhu_d)
-+RVVCALL(OPIVX2, vmulhsu_vx_b, OP_SUS_B, H1, H1, do_mulhsu_b)
-+RVVCALL(OPIVX2, vmulhsu_vx_h, OP_SUS_H, H2, H2, do_mulhsu_h)
-+RVVCALL(OPIVX2, vmulhsu_vx_w, OP_SUS_W, H4, H4, do_mulhsu_w)
-+RVVCALL(OPIVX2, vmulhsu_vx_d, OP_SUS_D, H8, H8, do_mulhsu_d)
-+GEN_VEXT_VX(vmul_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmul_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmul_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmul_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmulh_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmulh_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmulh_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmulh_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmulhu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmulhu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmulhu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmulhu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmulhsu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmulhsu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmulhsu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmulhsu_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 21/63] target/riscv: vector integer divide instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-20-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 +++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 ++++
- target/riscv/vector_helper.c            | 74 +++++++++++++++++++++++++
-files changed, 125 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmulhsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmulhsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmulhsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmulhsu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vdivu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmulhu_vv       100100 . ..... ..... 010 ..... 1010111 @r_vm
- vmulhu_vx       100100 . ..... ..... 110 ..... 1010111 @r_vm
- vmulhsu_vv      100110 . ..... ..... 010 ..... 1010111 @r_vm
- vmulhsu_vx      100110 . ..... ..... 110 ..... 1010111 @r_vm
-+vdivu_vv        100000 . ..... ..... 010 ..... 1010111 @r_vm
-+vdivu_vx        100000 . ..... ..... 110 ..... 1010111 @r_vm
-+vdiv_vv         100001 . ..... ..... 010 ..... 1010111 @r_vm
-+vdiv_vx         100001 . ..... ..... 110 ..... 1010111 @r_vm
-+vremu_vv        100010 . ..... ..... 010 ..... 1010111 @r_vm
-+vremu_vx        100010 . ..... ..... 110 ..... 1010111 @r_vm
-+vrem_vv         100011 . ..... ..... 010 ..... 1010111 @r_vm
-+vrem_vx         100011 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_TRANS(vmul_vx,  muls)
- GEN_OPIVX_TRANS(vmulh_vx, opivx_check)
- GEN_OPIVX_TRANS(vmulhu_vx, opivx_check)
- GEN_OPIVX_TRANS(vmulhsu_vx, opivx_check)
-+
-+/* Vector Integer Divide Instructions */
-+GEN_OPIVV_TRANS(vdivu_vv, opivv_check)
-+GEN_OPIVV_TRANS(vdiv_vv, opivv_check)
-+GEN_OPIVV_TRANS(vremu_vv, opivv_check)
-+GEN_OPIVV_TRANS(vrem_vv, opivv_check)
-+GEN_OPIVX_TRANS(vdivu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vdiv_vx, opivx_check)
-+GEN_OPIVX_TRANS(vremu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vrem_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vmulhsu_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vmulhsu_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vmulhsu_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vmulhsu_vx_d, 8, 8, clearq)
-+
-+/* Vector Integer Divide Instructions */
-+#define DO_DIVU(N, M) (unlikely(M == 0) ? (__typeof(N))(-1) : N / M)
-+#define DO_REMU(N, M) (unlikely(M == 0) ? N : N % M)
-+#define DO_DIV(N, M)  (unlikely(M == 0) ? (__typeof(N))(-1) :\
-+        unlikely((N == -N) && (M == (__typeof(N))(-1))) ? N : N / M)
-+#define DO_REM(N, M)  (unlikely(M == 0) ? N :\
-+        unlikely((N == -N) && (M == (__typeof(N))(-1))) ? 0 : N % M)
-+
-+RVVCALL(OPIVV2, vdivu_vv_b, OP_UUU_B, H1, H1, H1, DO_DIVU)
-+RVVCALL(OPIVV2, vdivu_vv_h, OP_UUU_H, H2, H2, H2, DO_DIVU)
-+RVVCALL(OPIVV2, vdivu_vv_w, OP_UUU_W, H4, H4, H4, DO_DIVU)
-+RVVCALL(OPIVV2, vdivu_vv_d, OP_UUU_D, H8, H8, H8, DO_DIVU)
-+RVVCALL(OPIVV2, vdiv_vv_b, OP_SSS_B, H1, H1, H1, DO_DIV)
-+RVVCALL(OPIVV2, vdiv_vv_h, OP_SSS_H, H2, H2, H2, DO_DIV)
-+RVVCALL(OPIVV2, vdiv_vv_w, OP_SSS_W, H4, H4, H4, DO_DIV)
-+RVVCALL(OPIVV2, vdiv_vv_d, OP_SSS_D, H8, H8, H8, DO_DIV)
-+RVVCALL(OPIVV2, vremu_vv_b, OP_UUU_B, H1, H1, H1, DO_REMU)
-+RVVCALL(OPIVV2, vremu_vv_h, OP_UUU_H, H2, H2, H2, DO_REMU)
-+RVVCALL(OPIVV2, vremu_vv_w, OP_UUU_W, H4, H4, H4, DO_REMU)
-+RVVCALL(OPIVV2, vremu_vv_d, OP_UUU_D, H8, H8, H8, DO_REMU)
-+RVVCALL(OPIVV2, vrem_vv_b, OP_SSS_B, H1, H1, H1, DO_REM)
-+RVVCALL(OPIVV2, vrem_vv_h, OP_SSS_H, H2, H2, H2, DO_REM)
-+RVVCALL(OPIVV2, vrem_vv_w, OP_SSS_W, H4, H4, H4, DO_REM)
-+RVVCALL(OPIVV2, vrem_vv_d, OP_SSS_D, H8, H8, H8, DO_REM)
-+GEN_VEXT_VV(vdivu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vdivu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vdivu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vdivu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vdiv_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vdiv_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vdiv_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vdiv_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vremu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vremu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vremu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vremu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vrem_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vrem_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vrem_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vrem_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vdivu_vx_b, OP_UUU_B, H1, H1, DO_DIVU)
-+RVVCALL(OPIVX2, vdivu_vx_h, OP_UUU_H, H2, H2, DO_DIVU)
-+RVVCALL(OPIVX2, vdivu_vx_w, OP_UUU_W, H4, H4, DO_DIVU)
-+RVVCALL(OPIVX2, vdivu_vx_d, OP_UUU_D, H8, H8, DO_DIVU)
-+RVVCALL(OPIVX2, vdiv_vx_b, OP_SSS_B, H1, H1, DO_DIV)
-+RVVCALL(OPIVX2, vdiv_vx_h, OP_SSS_H, H2, H2, DO_DIV)
-+RVVCALL(OPIVX2, vdiv_vx_w, OP_SSS_W, H4, H4, DO_DIV)
-+RVVCALL(OPIVX2, vdiv_vx_d, OP_SSS_D, H8, H8, DO_DIV)
-+RVVCALL(OPIVX2, vremu_vx_b, OP_UUU_B, H1, H1, DO_REMU)
-+RVVCALL(OPIVX2, vremu_vx_h, OP_UUU_H, H2, H2, DO_REMU)
-+RVVCALL(OPIVX2, vremu_vx_w, OP_UUU_W, H4, H4, DO_REMU)
-+RVVCALL(OPIVX2, vremu_vx_d, OP_UUU_D, H8, H8, DO_REMU)
-+RVVCALL(OPIVX2, vrem_vx_b, OP_SSS_B, H1, H1, DO_REM)
-+RVVCALL(OPIVX2, vrem_vx_h, OP_SSS_H, H2, H2, DO_REM)
-+RVVCALL(OPIVX2, vrem_vx_w, OP_SSS_W, H4, H4, DO_REM)
-+RVVCALL(OPIVX2, vrem_vx_d, OP_SSS_D, H8, H8, DO_REM)
-+GEN_VEXT_VX(vdivu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vdivu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vdivu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vdivu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vdiv_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vdiv_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vdiv_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vdiv_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vremu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vremu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vremu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vremu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vrem_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vrem_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vrem_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vrem_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 22/63] target/riscv: vector widening integer multiply instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-21-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 19 +++++++++
- target/riscv/insn32.decode              |  6 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  8 ++++
- target/riscv/vector_helper.c            | 51 +++++++++++++++++++++++++
-files changed, 84 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vrem_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vrem_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vrem_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vrem_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vwmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vremu_vv        100010 . ..... ..... 010 ..... 1010111 @r_vm
- vremu_vx        100010 . ..... ..... 110 ..... 1010111 @r_vm
- vrem_vv         100011 . ..... ..... 010 ..... 1010111 @r_vm
- vrem_vx         100011 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmulu_vv       111000 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmulu_vx       111000 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmulsu_vv      111010 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmulsu_vx      111010 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmul_vv        111011 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmul_vx        111011 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vdivu_vx, opivx_check)
- GEN_OPIVX_TRANS(vdiv_vx, opivx_check)
- GEN_OPIVX_TRANS(vremu_vx, opivx_check)
- GEN_OPIVX_TRANS(vrem_vx, opivx_check)
-+
-+/* Vector Widening Integer Multiply Instructions */
-+GEN_OPIVV_WIDEN_TRANS(vwmul_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmulu_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
-+GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
- #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
- #define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
-+#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
-+#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
-+#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
-+#define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
-+#define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
-+#define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
-+#define WOP_SUS_B int16_t, uint8_t, int8_t, uint16_t, int16_t
-+#define WOP_SUS_H int32_t, uint16_t, int16_t, uint32_t, int32_t
-+#define WOP_SUS_W int64_t, uint32_t, int32_t, uint64_t, int64_t
-+#define WOP_SSU_B int16_t, int8_t, uint8_t, int16_t, uint16_t
-+#define WOP_SSU_H int32_t, int16_t, uint16_t, int32_t, uint32_t
-+#define WOP_SSU_W int64_t, int32_t, uint32_t, int64_t, uint64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vrem_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vrem_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vrem_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vrem_vx_d, 8, 8, clearq)
-+
-+/* Vector Widening Integer Multiply Instructions */
-+RVVCALL(OPIVV2, vwmul_vv_b, WOP_SSS_B, H2, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vwmul_vv_h, WOP_SSS_H, H4, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vwmul_vv_w, WOP_SSS_W, H8, H4, H4, DO_MUL)
-+RVVCALL(OPIVV2, vwmulu_vv_b, WOP_UUU_B, H2, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vwmulu_vv_h, WOP_UUU_H, H4, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vwmulu_vv_w, WOP_UUU_W, H8, H4, H4, DO_MUL)
-+RVVCALL(OPIVV2, vwmulsu_vv_b, WOP_SUS_B, H2, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vwmulsu_vv_h, WOP_SUS_H, H4, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vwmulsu_vv_w, WOP_SUS_W, H8, H4, H4, DO_MUL)
-+GEN_VEXT_VV(vwmul_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmul_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmul_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmulu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmulu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmulu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmulsu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmulsu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmulsu_vv_w, 4, 8, clearq)
-+
-+RVVCALL(OPIVX2, vwmul_vx_b, WOP_SSS_B, H2, H1, DO_MUL)
-+RVVCALL(OPIVX2, vwmul_vx_h, WOP_SSS_H, H4, H2, DO_MUL)
-+RVVCALL(OPIVX2, vwmul_vx_w, WOP_SSS_W, H8, H4, DO_MUL)
-+RVVCALL(OPIVX2, vwmulu_vx_b, WOP_UUU_B, H2, H1, DO_MUL)
-+RVVCALL(OPIVX2, vwmulu_vx_h, WOP_UUU_H, H4, H2, DO_MUL)
-+RVVCALL(OPIVX2, vwmulu_vx_w, WOP_UUU_W, H8, H4, DO_MUL)
-+RVVCALL(OPIVX2, vwmulsu_vx_b, WOP_SUS_B, H2, H1, DO_MUL)
-+RVVCALL(OPIVX2, vwmulsu_vx_h, WOP_SUS_H, H4, H2, DO_MUL)
-+RVVCALL(OPIVX2, vwmulsu_vx_w, WOP_SUS_W, H8, H4, DO_MUL)
-+GEN_VEXT_VX(vwmul_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmul_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmul_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmulu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmulu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmulu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmulsu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmulsu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmulsu_vx_w, 4, 8, clearq)
---
-.27.0

-[PULL 23/63] target/riscv: vector single-width integer multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-22-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 ++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 +++
- target/riscv/vector_helper.c            | 88 +++++++++++++++++++++++++
-files changed, 139 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwmulu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmulsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmulsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmulsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vwmulsu_vv      111010 . ..... ..... 010 ..... 1010111 @r_vm
- vwmulsu_vx      111010 . ..... ..... 110 ..... 1010111 @r_vm
- vwmul_vv        111011 . ..... ..... 010 ..... 1010111 @r_vm
- vwmul_vx        111011 . ..... ..... 110 ..... 1010111 @r_vm
-+vmacc_vv        101101 . ..... ..... 010 ..... 1010111 @r_vm
-+vmacc_vx        101101 . ..... ..... 110 ..... 1010111 @r_vm
-+vnmsac_vv       101111 . ..... ..... 010 ..... 1010111 @r_vm
-+vnmsac_vx       101111 . ..... ..... 110 ..... 1010111 @r_vm
-+vmadd_vv        101001 . ..... ..... 010 ..... 1010111 @r_vm
-+vmadd_vx        101001 . ..... ..... 110 ..... 1010111 @r_vm
-+vnmsub_vv       101011 . ..... ..... 010 ..... 1010111 @r_vm
-+vnmsub_vx       101011 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
- GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
-+
-+/* Vector Single-Width Integer Multiply-Add Instructions */
-+GEN_OPIVV_TRANS(vmacc_vv, opivv_check)
-+GEN_OPIVV_TRANS(vnmsac_vv, opivv_check)
-+GEN_OPIVV_TRANS(vmadd_vv, opivv_check)
-+GEN_OPIVV_TRANS(vnmsub_vv, opivv_check)
-+GEN_OPIVX_TRANS(vmacc_vx, opivx_check)
-+GEN_OPIVX_TRANS(vnmsac_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmadd_vx, opivx_check)
-+GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwmulu_vx_w, 4, 8, clearq)
- GEN_VEXT_VX(vwmulsu_vx_b, 1, 2, clearh)
- GEN_VEXT_VX(vwmulsu_vx_h, 2, 4, clearl)
- GEN_VEXT_VX(vwmulsu_vx_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Integer Multiply-Add Instructions */
-+#define OPIVV3(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)   \
-+static void do_##NAME(void *vd, void *vs1, void *vs2, int i)       \
-+{                                                                  \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(s2, s1, d);                           \
-+}
-+
-+#define DO_MACC(N, M, D) (M * N + D)
-+#define DO_NMSAC(N, M, D) (-(M * N) + D)
-+#define DO_MADD(N, M, D) (M * D + N)
-+#define DO_NMSUB(N, M, D) (-(M * D) + N)
-+RVVCALL(OPIVV3, vmacc_vv_b, OP_SSS_B, H1, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vmacc_vv_h, OP_SSS_H, H2, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vmacc_vv_w, OP_SSS_W, H4, H4, H4, DO_MACC)
-+RVVCALL(OPIVV3, vmacc_vv_d, OP_SSS_D, H8, H8, H8, DO_MACC)
-+RVVCALL(OPIVV3, vnmsac_vv_b, OP_SSS_B, H1, H1, H1, DO_NMSAC)
-+RVVCALL(OPIVV3, vnmsac_vv_h, OP_SSS_H, H2, H2, H2, DO_NMSAC)
-+RVVCALL(OPIVV3, vnmsac_vv_w, OP_SSS_W, H4, H4, H4, DO_NMSAC)
-+RVVCALL(OPIVV3, vnmsac_vv_d, OP_SSS_D, H8, H8, H8, DO_NMSAC)
-+RVVCALL(OPIVV3, vmadd_vv_b, OP_SSS_B, H1, H1, H1, DO_MADD)
-+RVVCALL(OPIVV3, vmadd_vv_h, OP_SSS_H, H2, H2, H2, DO_MADD)
-+RVVCALL(OPIVV3, vmadd_vv_w, OP_SSS_W, H4, H4, H4, DO_MADD)
-+RVVCALL(OPIVV3, vmadd_vv_d, OP_SSS_D, H8, H8, H8, DO_MADD)
-+RVVCALL(OPIVV3, vnmsub_vv_b, OP_SSS_B, H1, H1, H1, DO_NMSUB)
-+RVVCALL(OPIVV3, vnmsub_vv_h, OP_SSS_H, H2, H2, H2, DO_NMSUB)
-+RVVCALL(OPIVV3, vnmsub_vv_w, OP_SSS_W, H4, H4, H4, DO_NMSUB)
-+RVVCALL(OPIVV3, vnmsub_vv_d, OP_SSS_D, H8, H8, H8, DO_NMSUB)
-+GEN_VEXT_VV(vmacc_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmacc_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmacc_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmacc_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vnmsac_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vnmsac_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vnmsac_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vnmsac_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmadd_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmadd_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vnmsub_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vnmsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vnmsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vnmsub_vv_d, 8, 8, clearq)
-+
-+#define OPIVX3(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
-+static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
-+{                                                                   \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
-+    TD d = *((TD *)vd + HD(i));                                     \
-+    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, d);                   \
-+}
-+
-+RVVCALL(OPIVX3, vmacc_vx_b, OP_SSS_B, H1, H1, DO_MACC)
-+RVVCALL(OPIVX3, vmacc_vx_h, OP_SSS_H, H2, H2, DO_MACC)
-+RVVCALL(OPIVX3, vmacc_vx_w, OP_SSS_W, H4, H4, DO_MACC)
-+RVVCALL(OPIVX3, vmacc_vx_d, OP_SSS_D, H8, H8, DO_MACC)
-+RVVCALL(OPIVX3, vnmsac_vx_b, OP_SSS_B, H1, H1, DO_NMSAC)
-+RVVCALL(OPIVX3, vnmsac_vx_h, OP_SSS_H, H2, H2, DO_NMSAC)
-+RVVCALL(OPIVX3, vnmsac_vx_w, OP_SSS_W, H4, H4, DO_NMSAC)
-+RVVCALL(OPIVX3, vnmsac_vx_d, OP_SSS_D, H8, H8, DO_NMSAC)
-+RVVCALL(OPIVX3, vmadd_vx_b, OP_SSS_B, H1, H1, DO_MADD)
-+RVVCALL(OPIVX3, vmadd_vx_h, OP_SSS_H, H2, H2, DO_MADD)
-+RVVCALL(OPIVX3, vmadd_vx_w, OP_SSS_W, H4, H4, DO_MADD)
-+RVVCALL(OPIVX3, vmadd_vx_d, OP_SSS_D, H8, H8, DO_MADD)
-+RVVCALL(OPIVX3, vnmsub_vx_b, OP_SSS_B, H1, H1, DO_NMSUB)
-+RVVCALL(OPIVX3, vnmsub_vx_h, OP_SSS_H, H2, H2, DO_NMSUB)
-+RVVCALL(OPIVX3, vnmsub_vx_w, OP_SSS_W, H4, H4, DO_NMSUB)
-+RVVCALL(OPIVX3, vnmsub_vx_d, OP_SSS_D, H8, H8, DO_NMSUB)
-+GEN_VEXT_VX(vmacc_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmacc_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmacc_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmacc_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vnmsac_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vnmsac_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vnmsac_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vnmsac_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmadd_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmadd_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmadd_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmadd_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vnmsub_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vnmsub_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vnmsub_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vnmsub_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 24/63] target/riscv: vector widening integer multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-23-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 22 ++++++++++++
- target/riscv/insn32.decode              |  7 ++++
- target/riscv/insn_trans/trans_rvv.inc.c |  9 +++++
- target/riscv/vector_helper.c            | 45 +++++++++++++++++++++++++
-files changed, 83 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnmsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnmsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnmsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnmsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vwmaccu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmadd_vv        101001 . ..... ..... 010 ..... 1010111 @r_vm
- vmadd_vx        101001 . ..... ..... 110 ..... 1010111 @r_vm
- vnmsub_vv       101011 . ..... ..... 010 ..... 1010111 @r_vm
- vnmsub_vx       101011 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmaccu_vv      111100 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmaccu_vx      111100 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmacc_vv       111101 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmacc_vx       111101 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmaccsu_vv     111110 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmaccsu_vx     111110 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmaccus_vx     111111 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vmacc_vx, opivx_check)
- GEN_OPIVX_TRANS(vnmsac_vx, opivx_check)
- GEN_OPIVX_TRANS(vmadd_vx, opivx_check)
- GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
-+
-+/* Vector Widening Integer Multiply-Add Instructions */
-+GEN_OPIVV_WIDEN_TRANS(vwmaccu_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmacc_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmaccsu_vv, opivv_widen_check)
-+GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vnmsub_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vnmsub_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vnmsub_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vnmsub_vx_d, 8, 8, clearq)
-+
-+/* Vector Widening Integer Multiply-Add Instructions */
-+RVVCALL(OPIVV3, vwmaccu_vv_b, WOP_UUU_B, H2, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccu_vv_h, WOP_UUU_H, H4, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccu_vv_w, WOP_UUU_W, H8, H4, H4, DO_MACC)
-+RVVCALL(OPIVV3, vwmacc_vv_b, WOP_SSS_B, H2, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vwmacc_vv_h, WOP_SSS_H, H4, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vwmacc_vv_w, WOP_SSS_W, H8, H4, H4, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccsu_vv_b, WOP_SSU_B, H2, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccsu_vv_h, WOP_SSU_H, H4, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccsu_vv_w, WOP_SSU_W, H8, H4, H4, DO_MACC)
-+GEN_VEXT_VV(vwmaccu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmaccu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmaccu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmacc_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmacc_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmacc_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmaccsu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmaccsu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmaccsu_vv_w, 4, 8, clearq)
-+
-+RVVCALL(OPIVX3, vwmaccu_vx_b, WOP_UUU_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccu_vx_h, WOP_UUU_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccu_vx_w, WOP_UUU_W, H8, H4, DO_MACC)
-+RVVCALL(OPIVX3, vwmacc_vx_b, WOP_SSS_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmacc_vx_h, WOP_SSS_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmacc_vx_w, WOP_SSS_W, H8, H4, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccsu_vx_b, WOP_SSU_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccsu_vx_h, WOP_SSU_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccsu_vx_w, WOP_SSU_W, H8, H4, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccus_vx_b, WOP_SUS_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccus_vx_h, WOP_SUS_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccus_vx_w, WOP_SUS_W, H8, H4, DO_MACC)
-+GEN_VEXT_VX(vwmaccu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmaccu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmaccu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmacc_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmacc_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmacc_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmaccsu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmaccsu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmaccsu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmaccus_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmaccus_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmaccus_vx_w, 4, 8, clearq)
---
-.27.0

-[PULL 25/63] target/riscv: vector integer merge and move instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-24-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  17 ++++
- target/riscv/insn32.decode              |   7 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 113 ++++++++++++++++++++++++
- target/riscv/vector_helper.c            |  88 ++++++++++++++++++
-files changed, 225 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmerge_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_b, void, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_h, void, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_w, void, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_d, void, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_x_b, void, ptr, i64, env, i32)
-+DEF_HELPER_4(vmv_v_x_h, void, ptr, i64, env, i32)
-+DEF_HELPER_4(vmv_v_x_w, void, ptr, i64, env, i32)
-+DEF_HELPER_4(vmv_v_x_d, void, ptr, i64, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
- @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
-+@r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
- @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
- @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
-@@ -XXX,XX +XXX,XX @@ vwmacc_vx       111101 . ..... ..... 110 ..... 1010111 @r_vm
- vwmaccsu_vv     111110 . ..... ..... 010 ..... 1010111 @r_vm
- vwmaccsu_vx     111110 . ..... ..... 110 ..... 1010111 @r_vm
- vwmaccus_vx     111111 . ..... ..... 110 ..... 1010111 @r_vm
-+vmv_v_v         010111 1 00000 ..... 000 ..... 1010111 @r2
-+vmv_v_x         010111 1 00000 ..... 100 ..... 1010111 @r2
-+vmv_v_i         010111 1 00000 ..... 011 ..... 1010111 @r2
-+vmerge_vvm      010111 0 ..... ..... 000 ..... 1010111 @r_vm_0
-+vmerge_vxm      010111 0 ..... ..... 100 ..... 1010111 @r_vm_0
-+vmerge_vim      010111 0 ..... ..... 011 ..... 1010111 @r_vm_0
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
-+
-+/* Vector Integer Merge and Move Instructions */
-+static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
-+{
-+    if (vext_check_isa_ill(s) &&
-+        vext_check_reg(s, a->rd, false) &&
-+        vext_check_reg(s, a->rs1, false)) {
-+
-+        if (s->vl_eq_vlmax) {
-+            tcg_gen_gvec_mov(s->sew, vreg_ofs(s, a->rd),
-+                             vreg_ofs(s, a->rs1),
-+                             MAXSZ(s), MAXSZ(s));
-+        } else {
-+            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
-+            static gen_helper_gvec_2_ptr * const fns[4] = {
-+                gen_helper_vmv_v_v_b, gen_helper_vmv_v_v_h,
-+                gen_helper_vmv_v_v_w, gen_helper_vmv_v_v_d,
-+            };
-+            TCGLabel *over = gen_new_label();
-+            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+            tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
-+                               cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
-+            gen_set_label(over);
-+        }
-+        return true;
-+    }
-+    return false;
-+}
-+
-+typedef void gen_helper_vmv_vx(TCGv_ptr, TCGv_i64, TCGv_env, TCGv_i32);
-+static bool trans_vmv_v_x(DisasContext *s, arg_vmv_v_x *a)
-+{
-+    if (vext_check_isa_ill(s) &&
-+        vext_check_reg(s, a->rd, false)) {
-+
-+        TCGv s1;
-+        TCGLabel *over = gen_new_label();
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+        s1 = tcg_temp_new();
-+        gen_get_gpr(s1, a->rs1);
-+
-+        if (s->vl_eq_vlmax) {
-+            tcg_gen_gvec_dup_tl(s->sew, vreg_ofs(s, a->rd),
-+                                MAXSZ(s), MAXSZ(s), s1);
-+        } else {
-+            TCGv_i32 desc ;
-+            TCGv_i64 s1_i64 = tcg_temp_new_i64();
-+            TCGv_ptr dest = tcg_temp_new_ptr();
-+            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
-+            static gen_helper_vmv_vx * const fns[4] = {
-+                gen_helper_vmv_v_x_b, gen_helper_vmv_v_x_h,
-+                gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
-+            };
-+
-+            tcg_gen_ext_tl_i64(s1_i64, s1);
-+            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
-+            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
-+            fns[s->sew](dest, s1_i64, cpu_env, desc);
-+
-+            tcg_temp_free_ptr(dest);
-+            tcg_temp_free_i32(desc);
-+            tcg_temp_free_i64(s1_i64);
-+        }
-+
-+        tcg_temp_free(s1);
-+        gen_set_label(over);
-+        return true;
-+    }
-+    return false;
-+}
-+
-+static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
-+{
-+    if (vext_check_isa_ill(s) &&
-+        vext_check_reg(s, a->rd, false)) {
-+
-+        int64_t simm = sextract64(a->rs1, 0, 5);
-+        if (s->vl_eq_vlmax) {
-+            tcg_gen_gvec_dup_imm(s->sew, vreg_ofs(s, a->rd),
-+                                 MAXSZ(s), MAXSZ(s), simm);
-+        } else {
-+            TCGv_i32 desc;
-+            TCGv_i64 s1;
-+            TCGv_ptr dest;
-+            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
-+            static gen_helper_vmv_vx * const fns[4] = {
-+                gen_helper_vmv_v_x_b, gen_helper_vmv_v_x_h,
-+                gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
-+            };
-+            TCGLabel *over = gen_new_label();
-+            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+            s1 = tcg_const_i64(simm);
-+            dest = tcg_temp_new_ptr();
-+            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
-+            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
-+            fns[s->sew](dest, s1, cpu_env, desc);
-+
-+            tcg_temp_free_ptr(dest);
-+            tcg_temp_free_i32(desc);
-+            tcg_temp_free_i64(s1);
-+            gen_set_label(over);
-+        }
-+        return true;
-+    }
-+    return false;
-+}
-+
-+GEN_OPIVV_TRANS(vmerge_vvm, opivv_vadc_check)
-+GEN_OPIVX_TRANS(vmerge_vxm, opivx_vadc_check)
-+GEN_OPIVI_TRANS(vmerge_vim, 0, vmerge_vxm, opivx_vadc_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwmaccsu_vx_w, 4, 8, clearq)
- GEN_VEXT_VX(vwmaccus_vx_b, 1, 2, clearh)
- GEN_VEXT_VX(vwmaccus_vx_h, 2, 4, clearl)
- GEN_VEXT_VX(vwmaccus_vx_w, 4, 8, clearq)
-+
-+/* Vector Integer Merge and Move Instructions */
-+#define GEN_VEXT_VMV_VV(NAME, ETYPE, H, CLEAR_FN)                    \
-+void HELPER(NAME)(void *vd, void *vs1, CPURISCVState *env,           \
-+                  uint32_t desc)                                     \
-+{                                                                    \
-+    uint32_t vl = env->vl;                                           \
-+    uint32_t esz = sizeof(ETYPE);                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
-+    uint32_t i;                                                      \
-+                                                                     \
-+    for (i = 0; i < vl; i++) {                                       \
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                           \
-+        *((ETYPE *)vd + H(i)) = s1;                                  \
-+    }                                                                \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
-+}
-+
-+GEN_VEXT_VMV_VV(vmv_v_v_b, int8_t,  H1, clearb)
-+GEN_VEXT_VMV_VV(vmv_v_v_h, int16_t, H2, clearh)
-+GEN_VEXT_VMV_VV(vmv_v_v_w, int32_t, H4, clearl)
-+GEN_VEXT_VMV_VV(vmv_v_v_d, int64_t, H8, clearq)
-+
-+#define GEN_VEXT_VMV_VX(NAME, ETYPE, H, CLEAR_FN)                    \
-+void HELPER(NAME)(void *vd, uint64_t s1, CPURISCVState *env,         \
-+                  uint32_t desc)                                     \
-+{                                                                    \
-+    uint32_t vl = env->vl;                                           \
-+    uint32_t esz = sizeof(ETYPE);                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
-+    uint32_t i;                                                      \
-+                                                                     \
-+    for (i = 0; i < vl; i++) {                                       \
-+        *((ETYPE *)vd + H(i)) = (ETYPE)s1;                           \
-+    }                                                                \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
-+}
-+
-+GEN_VEXT_VMV_VX(vmv_v_x_b, int8_t,  H1, clearb)
-+GEN_VEXT_VMV_VX(vmv_v_x_h, int16_t, H2, clearh)
-+GEN_VEXT_VMV_VX(vmv_v_x_w, int32_t, H4, clearl)
-+GEN_VEXT_VMV_VX(vmv_v_x_d, int64_t, H8, clearq)
-+
-+#define GEN_VEXT_VMERGE_VV(NAME, ETYPE, H, CLEAR_FN)                 \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,          \
-+                  CPURISCVState *env, uint32_t desc)                 \
-+{                                                                    \
-+    uint32_t mlen = vext_mlen(desc);                                 \
-+    uint32_t vl = env->vl;                                           \
-+    uint32_t esz = sizeof(ETYPE);                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
-+    uint32_t i;                                                      \
-+                                                                     \
-+    for (i = 0; i < vl; i++) {                                       \
-+        ETYPE *vt = (!vext_elem_mask(v0, mlen, i) ? vs2 : vs1);      \
-+        *((ETYPE *)vd + H(i)) = *(vt + H(i));                        \
-+    }                                                                \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
-+}
-+
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_b, int8_t,  H1, clearb)
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_h, int16_t, H2, clearh)
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_w, int32_t, H4, clearl)
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_d, int64_t, H8, clearq)
-+
-+#define GEN_VEXT_VMERGE_VX(NAME, ETYPE, H, CLEAR_FN)                 \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1,               \
-+                  void *vs2, CPURISCVState *env, uint32_t desc)      \
-+{                                                                    \
-+    uint32_t mlen = vext_mlen(desc);                                 \
-+    uint32_t vl = env->vl;                                           \
-+    uint32_t esz = sizeof(ETYPE);                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
-+    uint32_t i;                                                      \
-+                                                                     \
-+    for (i = 0; i < vl; i++) {                                       \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                           \
-+        ETYPE d = (!vext_elem_mask(v0, mlen, i) ? s2 :               \
-+                   (ETYPE)(target_long)s1);                          \
-+        *((ETYPE *)vd + H(i)) = d;                                   \
-+    }                                                                \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
-+}
-+
-+GEN_VEXT_VMERGE_VX(vmerge_vxm_b, int8_t,  H1, clearb)
-+GEN_VEXT_VMERGE_VX(vmerge_vxm_h, int16_t, H2, clearh)
-+GEN_VEXT_VMERGE_VX(vmerge_vxm_w, int32_t, H4, clearl)
-+GEN_VEXT_VMERGE_VX(vmerge_vxm_d, int64_t, H8, clearq)
---
-.27.0

-[PULL 27/63] target/riscv: vector single-width averaging add and subtract
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-26-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  17 ++++
- target/riscv/insn32.decode              |   5 ++
- target/riscv/insn_trans/trans_rvv.inc.c |   7 ++
- target/riscv/vector_helper.c            | 100 ++++++++++++++++++++++++
-files changed, 129 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vssub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vaadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vasub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vasub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vasub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vasub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vaadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vasub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vasub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vasub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vasub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vssubu_vv       100010 . ..... ..... 000 ..... 1010111 @r_vm
- vssubu_vx       100010 . ..... ..... 100 ..... 1010111 @r_vm
- vssub_vv        100011 . ..... ..... 000 ..... 1010111 @r_vm
- vssub_vx        100011 . ..... ..... 100 ..... 1010111 @r_vm
-+vaadd_vv        100100 . ..... ..... 000 ..... 1010111 @r_vm
-+vaadd_vx        100100 . ..... ..... 100 ..... 1010111 @r_vm
-+vaadd_vi        100100 . ..... ..... 011 ..... 1010111 @r_vm
-+vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
-+vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vssubu_vx,  opivx_check)
- GEN_OPIVX_TRANS(vssub_vx,  opivx_check)
- GEN_OPIVI_TRANS(vsaddu_vi, 1, vsaddu_vx, opivx_check)
- GEN_OPIVI_TRANS(vsadd_vi, 0, vsadd_vx, opivx_check)
-+
-+/* Vector Single-Width Averaging Add and Subtract */
-+GEN_OPIVV_TRANS(vaadd_vv, opivv_check)
-+GEN_OPIVV_TRANS(vasub_vv, opivv_check)
-+GEN_OPIVX_TRANS(vaadd_vx,  opivx_check)
-+GEN_OPIVX_TRANS(vasub_vx,  opivx_check)
-+GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vssub_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vssub_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vssub_vx_w, 4, 4, clearl)
- GEN_VEXT_VX_RM(vssub_vx_d, 8, 8, clearq)
-+
-+/* Vector Single-Width Averaging Add and Subtract */
-+static inline uint8_t get_round(int vxrm, uint64_t v, uint8_t shift)
-+{
-+    uint8_t d = extract64(v, shift, 1);
-+    uint8_t d1;
-+    uint64_t D1, D2;
-+
-+    if (shift == 0 || shift > 64) {
-+        return 0;
-+    }
-+
-+    d1 = extract64(v, shift - 1, 1);
-+    D1 = extract64(v, 0, shift);
-+    if (vxrm == 0) { /* round-to-nearest-up (add +0.5 LSB) */
-+        return d1;
-+    } else if (vxrm == 1) { /* round-to-nearest-even */
-+        if (shift > 1) {
-+            D2 = extract64(v, 0, shift - 1);
-+            return d1 & ((D2 != 0) | d);
-+        } else {
-+            return d1 & d;
-+        }
-+    } else if (vxrm == 3) { /* round-to-odd (OR bits into LSB, aka "jam") */
-+        return !d & (D1 != 0);
-+    }
-+    return 0; /* round-down (truncate) */
-+}
-+
-+static inline int32_t aadd32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
-+{
-+    int64_t res = (int64_t)a + b;
-+    uint8_t round = get_round(vxrm, res, 1);
-+
-+    return (res >> 1) + round;
-+}
-+
-+static inline int64_t aadd64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+{
-+    int64_t res = a + b;
-+    uint8_t round = get_round(vxrm, res, 1);
-+    int64_t over = (res ^ a) & (res ^ b) & INT64_MIN;
-+
-+    /* With signed overflow, bit 64 is inverse of bit 63. */
-+    return ((res >> 1) ^ over) + round;
-+}
-+
-+RVVCALL(OPIVV2_RM, vaadd_vv_b, OP_SSS_B, H1, H1, H1, aadd32)
-+RVVCALL(OPIVV2_RM, vaadd_vv_h, OP_SSS_H, H2, H2, H2, aadd32)
-+RVVCALL(OPIVV2_RM, vaadd_vv_w, OP_SSS_W, H4, H4, H4, aadd32)
-+RVVCALL(OPIVV2_RM, vaadd_vv_d, OP_SSS_D, H8, H8, H8, aadd64)
-+GEN_VEXT_VV_RM(vaadd_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vaadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vaadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vaadd_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vaadd_vx_b, OP_SSS_B, H1, H1, aadd32)
-+RVVCALL(OPIVX2_RM, vaadd_vx_h, OP_SSS_H, H2, H2, aadd32)
-+RVVCALL(OPIVX2_RM, vaadd_vx_w, OP_SSS_W, H4, H4, aadd32)
-+RVVCALL(OPIVX2_RM, vaadd_vx_d, OP_SSS_D, H8, H8, aadd64)
-+GEN_VEXT_VX_RM(vaadd_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vaadd_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vaadd_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vaadd_vx_d, 8, 8, clearq)
-+
-+static inline int32_t asub32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
-+{
-+    int64_t res = (int64_t)a - b;
-+    uint8_t round = get_round(vxrm, res, 1);
-+
-+    return (res >> 1) + round;
-+}
-+
-+static inline int64_t asub64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+{
-+    int64_t res = (int64_t)a - b;
-+    uint8_t round = get_round(vxrm, res, 1);
-+    int64_t over = (res ^ a) & (a ^ b) & INT64_MIN;
-+
-+    /* With signed overflow, bit 64 is inverse of bit 63. */
-+    return ((res >> 1) ^ over) + round;
-+}
-+
-+RVVCALL(OPIVV2_RM, vasub_vv_b, OP_SSS_B, H1, H1, H1, asub32)
-+RVVCALL(OPIVV2_RM, vasub_vv_h, OP_SSS_H, H2, H2, H2, asub32)
-+RVVCALL(OPIVV2_RM, vasub_vv_w, OP_SSS_W, H4, H4, H4, asub32)
-+RVVCALL(OPIVV2_RM, vasub_vv_d, OP_SSS_D, H8, H8, H8, asub64)
-+GEN_VEXT_VV_RM(vasub_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vasub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vasub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vasub_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vasub_vx_b, OP_SSS_B, H1, H1, asub32)
-+RVVCALL(OPIVX2_RM, vasub_vx_h, OP_SSS_H, H2, H2, asub32)
-+RVVCALL(OPIVX2_RM, vasub_vx_w, OP_SSS_W, H4, H4, asub32)
-+RVVCALL(OPIVX2_RM, vasub_vx_d, OP_SSS_D, H8, H8, asub64)
-+GEN_VEXT_VX_RM(vasub_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vasub_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vasub_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vasub_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 28/63] target/riscv: vector single-width fractional multiply with rounding and saturation
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-27-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |   9 ++
- target/riscv/insn32.decode              |   2 +
- target/riscv/insn_trans/trans_rvv.inc.c |   4 +
- target/riscv/vector_helper.c            | 107 ++++++++++++++++++++++++
-files changed, 122 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vasub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vasub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vasub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vasub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vsmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vaadd_vx        100100 . ..... ..... 100 ..... 1010111 @r_vm
- vaadd_vi        100100 . ..... ..... 011 ..... 1010111 @r_vm
- vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
- vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
-+vsmul_vv        100111 . ..... ..... 000 ..... 1010111 @r_vm
-+vsmul_vx        100111 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vasub_vv, opivv_check)
- GEN_OPIVX_TRANS(vaadd_vx,  opivx_check)
- GEN_OPIVX_TRANS(vasub_vx,  opivx_check)
- GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
-+
-+/* Vector Single-Width Fractional Multiply with Rounding and Saturation */
-+GEN_OPIVV_TRANS(vsmul_vv, opivv_check)
-+GEN_OPIVX_TRANS(vsmul_vx,  opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vasub_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vasub_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vasub_vx_w, 4, 4, clearl)
- GEN_VEXT_VX_RM(vasub_vx_d, 8, 8, clearq)
-+
-+/* Vector Single-Width Fractional Multiply with Rounding and Saturation */
-+static inline int8_t vsmul8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
-+{
-+    uint8_t round;
-+    int16_t res;
-+
-+    res = (int16_t)a * (int16_t)b;
-+    round = get_round(vxrm, res, 7);
-+    res   = (res >> 7) + round;
-+
-+    if (res > INT8_MAX) {
-+        env->vxsat = 0x1;
-+        return INT8_MAX;
-+    } else if (res < INT8_MIN) {
-+        env->vxsat = 0x1;
-+        return INT8_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static int16_t vsmul16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
-+{
-+    uint8_t round;
-+    int32_t res;
-+
-+    res = (int32_t)a * (int32_t)b;
-+    round = get_round(vxrm, res, 15);
-+    res   = (res >> 15) + round;
-+
-+    if (res > INT16_MAX) {
-+        env->vxsat = 0x1;
-+        return INT16_MAX;
-+    } else if (res < INT16_MIN) {
-+        env->vxsat = 0x1;
-+        return INT16_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static int32_t vsmul32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
-+{
-+    uint8_t round;
-+    int64_t res;
-+
-+    res = (int64_t)a * (int64_t)b;
-+    round = get_round(vxrm, res, 31);
-+    res   = (res >> 31) + round;
-+
-+    if (res > INT32_MAX) {
-+        env->vxsat = 0x1;
-+        return INT32_MAX;
-+    } else if (res < INT32_MIN) {
-+        env->vxsat = 0x1;
-+        return INT32_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static int64_t vsmul64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+{
-+    uint8_t round;
-+    uint64_t hi_64, lo_64;
-+    int64_t res;
-+
-+    if (a == INT64_MIN && b == INT64_MIN) {
-+        env->vxsat = 1;
-+        return INT64_MAX;
-+    }
-+
-+    muls64(&lo_64, &hi_64, a, b);
-+    round = get_round(vxrm, lo_64, 63);
-+    /*
-+     * Cannot overflow, as there are always
-+     * 2 sign bits after multiply.
-+     */
-+    res = (hi_64 << 1) | (lo_64 >> 63);
-+    if (round) {
-+        if (res == INT64_MAX) {
-+            env->vxsat = 1;
-+        } else {
-+            res += 1;
-+        }
-+    }
-+    return res;
-+}
-+
-+RVVCALL(OPIVV2_RM, vsmul_vv_b, OP_SSS_B, H1, H1, H1, vsmul8)
-+RVVCALL(OPIVV2_RM, vsmul_vv_h, OP_SSS_H, H2, H2, H2, vsmul16)
-+RVVCALL(OPIVV2_RM, vsmul_vv_w, OP_SSS_W, H4, H4, H4, vsmul32)
-+RVVCALL(OPIVV2_RM, vsmul_vv_d, OP_SSS_D, H8, H8, H8, vsmul64)
-+GEN_VEXT_VV_RM(vsmul_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vsmul_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vsmul_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vsmul_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vsmul_vx_b, OP_SSS_B, H1, H1, vsmul8)
-+RVVCALL(OPIVX2_RM, vsmul_vx_h, OP_SSS_H, H2, H2, vsmul16)
-+RVVCALL(OPIVX2_RM, vsmul_vx_w, OP_SSS_W, H4, H4, vsmul32)
-+RVVCALL(OPIVX2_RM, vsmul_vx_d, OP_SSS_D, H8, H8, vsmul64)
-+GEN_VEXT_VX_RM(vsmul_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vsmul_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vsmul_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vsmul_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 29/63] target/riscv: vector widening saturating scaled multiply-add
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-28-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  22 +++
- target/riscv/insn32.decode              |   7 +
- target/riscv/insn_trans/trans_rvv.inc.c |   9 ++
- target/riscv/vector_helper.c            | 205 ++++++++++++++++++++++++
-files changed, 243 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vwsmaccu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
- vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
- vsmul_vv        100111 . ..... ..... 000 ..... 1010111 @r_vm
- vsmul_vx        100111 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmaccu_vv     111100 . ..... ..... 000 ..... 1010111 @r_vm
-+vwsmaccu_vx     111100 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmacc_vv      111101 . ..... ..... 000 ..... 1010111 @r_vm
-+vwsmacc_vx      111101 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmaccsu_vv    111110 . ..... ..... 000 ..... 1010111 @r_vm
-+vwsmaccsu_vx    111110 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmaccus_vx    111111 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
- /* Vector Single-Width Fractional Multiply with Rounding and Saturation */
- GEN_OPIVV_TRANS(vsmul_vv, opivv_check)
- GEN_OPIVX_TRANS(vsmul_vx,  opivx_check)
-+
-+/* Vector Widening Saturating Scaled Multiply-Add */
-+GEN_OPIVV_WIDEN_TRANS(vwsmaccu_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwsmacc_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwsmaccsu_vv, opivv_widen_check)
-+GEN_OPIVX_WIDEN_TRANS(vwsmaccu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwsmacc_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwsmaccsu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwsmaccus_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vsmul_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vsmul_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vsmul_vx_w, 4, 4, clearl)
- GEN_VEXT_VX_RM(vsmul_vx_d, 8, 8, clearq)
-+
-+/* Vector Widening Saturating Scaled Multiply-Add */
-+static inline uint16_t
-+vwsmaccu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b,
-+          uint16_t c)
-+{
-+    uint8_t round;
-+    uint16_t res = (uint16_t)a * b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return saddu16(env, vxrm, c, res);
-+}
-+
-+static inline uint32_t
-+vwsmaccu16(CPURISCVState *env, int vxrm, uint16_t a, uint16_t b,
-+           uint32_t c)
-+{
-+    uint8_t round;
-+    uint32_t res = (uint32_t)a * b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return saddu32(env, vxrm, c, res);
-+}
-+
-+static inline uint64_t
-+vwsmaccu32(CPURISCVState *env, int vxrm, uint32_t a, uint32_t b,
-+           uint64_t c)
-+{
-+    uint8_t round;
-+    uint64_t res = (uint64_t)a * b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return saddu64(env, vxrm, c, res);
-+}
-+
-+#define OPIVV3_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
-+static inline void                                                 \
-+do_##NAME(void *vd, void *vs1, void *vs2, int i,                   \
-+          CPURISCVState *env, int vxrm)                            \
-+{                                                                  \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, s1, d);                \
-+}
-+
-+RVVCALL(OPIVV3_RM, vwsmaccu_vv_b, WOP_UUU_B, H2, H1, H1, vwsmaccu8)
-+RVVCALL(OPIVV3_RM, vwsmaccu_vv_h, WOP_UUU_H, H4, H2, H2, vwsmaccu16)
-+RVVCALL(OPIVV3_RM, vwsmaccu_vv_w, WOP_UUU_W, H8, H4, H4, vwsmaccu32)
-+GEN_VEXT_VV_RM(vwsmaccu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV_RM(vwsmaccu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_RM(vwsmaccu_vv_w, 4, 8, clearq)
-+
-+#define OPIVX3_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)         \
-+static inline void                                                 \
-+do_##NAME(void *vd, target_long s1, void *vs2, int i,              \
-+          CPURISCVState *env, int vxrm)                            \
-+{                                                                  \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, (TX1)(T1)s1, d);       \
-+}
-+
-+RVVCALL(OPIVX3_RM, vwsmaccu_vx_b, WOP_UUU_B, H2, H1, vwsmaccu8)
-+RVVCALL(OPIVX3_RM, vwsmaccu_vx_h, WOP_UUU_H, H4, H2, vwsmaccu16)
-+RVVCALL(OPIVX3_RM, vwsmaccu_vx_w, WOP_UUU_W, H8, H4, vwsmaccu32)
-+GEN_VEXT_VX_RM(vwsmaccu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmaccu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmaccu_vx_w, 4, 8, clearq)
-+
-+static inline int16_t
-+vwsmacc8(CPURISCVState *env, int vxrm, int8_t a, int8_t b, int16_t c)
-+{
-+    uint8_t round;
-+    int16_t res = (int16_t)a * b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return sadd16(env, vxrm, c, res);
-+}
-+
-+static inline int32_t
-+vwsmacc16(CPURISCVState *env, int vxrm, int16_t a, int16_t b, int32_t c)
-+{
-+    uint8_t round;
-+    int32_t res = (int32_t)a * b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return sadd32(env, vxrm, c, res);
-+
-+}
-+
-+static inline int64_t
-+vwsmacc32(CPURISCVState *env, int vxrm, int32_t a, int32_t b, int64_t c)
-+{
-+    uint8_t round;
-+    int64_t res = (int64_t)a * b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return sadd64(env, vxrm, c, res);
-+}
-+
-+RVVCALL(OPIVV3_RM, vwsmacc_vv_b, WOP_SSS_B, H2, H1, H1, vwsmacc8)
-+RVVCALL(OPIVV3_RM, vwsmacc_vv_h, WOP_SSS_H, H4, H2, H2, vwsmacc16)
-+RVVCALL(OPIVV3_RM, vwsmacc_vv_w, WOP_SSS_W, H8, H4, H4, vwsmacc32)
-+GEN_VEXT_VV_RM(vwsmacc_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV_RM(vwsmacc_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_RM(vwsmacc_vv_w, 4, 8, clearq)
-+RVVCALL(OPIVX3_RM, vwsmacc_vx_b, WOP_SSS_B, H2, H1, vwsmacc8)
-+RVVCALL(OPIVX3_RM, vwsmacc_vx_h, WOP_SSS_H, H4, H2, vwsmacc16)
-+RVVCALL(OPIVX3_RM, vwsmacc_vx_w, WOP_SSS_W, H8, H4, vwsmacc32)
-+GEN_VEXT_VX_RM(vwsmacc_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmacc_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmacc_vx_w, 4, 8, clearq)
-+
-+static inline int16_t
-+vwsmaccsu8(CPURISCVState *env, int vxrm, uint8_t a, int8_t b, int16_t c)
-+{
-+    uint8_t round;
-+    int16_t res = a * (int16_t)b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return ssub16(env, vxrm, c, res);
-+}
-+
-+static inline int32_t
-+vwsmaccsu16(CPURISCVState *env, int vxrm, uint16_t a, int16_t b, uint32_t c)
-+{
-+    uint8_t round;
-+    int32_t res = a * (int32_t)b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return ssub32(env, vxrm, c, res);
-+}
-+
-+static inline int64_t
-+vwsmaccsu32(CPURISCVState *env, int vxrm, uint32_t a, int32_t b, int64_t c)
-+{
-+    uint8_t round;
-+    int64_t res = a * (int64_t)b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return ssub64(env, vxrm, c, res);
-+}
-+
-+RVVCALL(OPIVV3_RM, vwsmaccsu_vv_b, WOP_SSU_B, H2, H1, H1, vwsmaccsu8)
-+RVVCALL(OPIVV3_RM, vwsmaccsu_vv_h, WOP_SSU_H, H4, H2, H2, vwsmaccsu16)
-+RVVCALL(OPIVV3_RM, vwsmaccsu_vv_w, WOP_SSU_W, H8, H4, H4, vwsmaccsu32)
-+GEN_VEXT_VV_RM(vwsmaccsu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV_RM(vwsmaccsu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_RM(vwsmaccsu_vv_w, 4, 8, clearq)
-+RVVCALL(OPIVX3_RM, vwsmaccsu_vx_b, WOP_SSU_B, H2, H1, vwsmaccsu8)
-+RVVCALL(OPIVX3_RM, vwsmaccsu_vx_h, WOP_SSU_H, H4, H2, vwsmaccsu16)
-+RVVCALL(OPIVX3_RM, vwsmaccsu_vx_w, WOP_SSU_W, H8, H4, vwsmaccsu32)
-+GEN_VEXT_VX_RM(vwsmaccsu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmaccsu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmaccsu_vx_w, 4, 8, clearq)
-+
-+static inline int16_t
-+vwsmaccus8(CPURISCVState *env, int vxrm, int8_t a, uint8_t b, int16_t c)
-+{
-+    uint8_t round;
-+    int16_t res = (int16_t)a * b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return ssub16(env, vxrm, c, res);
-+}
-+
-+static inline int32_t
-+vwsmaccus16(CPURISCVState *env, int vxrm, int16_t a, uint16_t b, int32_t c)
-+{
-+    uint8_t round;
-+    int32_t res = (int32_t)a * b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return ssub32(env, vxrm, c, res);
-+}
-+
-+static inline int64_t
-+vwsmaccus32(CPURISCVState *env, int vxrm, int32_t a, uint32_t b, int64_t c)
-+{
-+    uint8_t round;
-+    int64_t res = (int64_t)a * b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return ssub64(env, vxrm, c, res);
-+}
-+
-+RVVCALL(OPIVX3_RM, vwsmaccus_vx_b, WOP_SUS_B, H2, H1, vwsmaccus8)
-+RVVCALL(OPIVX3_RM, vwsmaccus_vx_h, WOP_SUS_H, H4, H2, vwsmaccus16)
-+RVVCALL(OPIVX3_RM, vwsmaccus_vx_w, WOP_SUS_W, H8, H4, vwsmaccus32)
-+GEN_VEXT_VX_RM(vwsmaccus_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmaccus_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmaccus_vx_w, 4, 8, clearq)
---
-.27.0

-[PULL 30/63] target/riscv: vector single-width scaling shift instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-29-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  17 ++++
- target/riscv/insn32.decode              |   6 ++
- target/riscv/insn_trans/trans_rvv.inc.c |   8 ++
- target/riscv/vector_helper.c            | 117 ++++++++++++++++++++++++
-files changed, 148 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwsmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vssrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vwsmacc_vx      111101 . ..... ..... 100 ..... 1010111 @r_vm
- vwsmaccsu_vv    111110 . ..... ..... 000 ..... 1010111 @r_vm
- vwsmaccsu_vx    111110 . ..... ..... 100 ..... 1010111 @r_vm
- vwsmaccus_vx    111111 . ..... ..... 100 ..... 1010111 @r_vm
-+vssrl_vv        101010 . ..... ..... 000 ..... 1010111 @r_vm
-+vssrl_vx        101010 . ..... ..... 100 ..... 1010111 @r_vm
-+vssrl_vi        101010 . ..... ..... 011 ..... 1010111 @r_vm
-+vssra_vv        101011 . ..... ..... 000 ..... 1010111 @r_vm
-+vssra_vx        101011 . ..... ..... 100 ..... 1010111 @r_vm
-+vssra_vi        101011 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_WIDEN_TRANS(vwsmaccu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwsmacc_vx)
- GEN_OPIVX_WIDEN_TRANS(vwsmaccsu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwsmaccus_vx)
-+
-+/* Vector Single-Width Scaling Shift Instructions */
-+GEN_OPIVV_TRANS(vssrl_vv, opivv_check)
-+GEN_OPIVV_TRANS(vssra_vv, opivv_check)
-+GEN_OPIVX_TRANS(vssrl_vx,  opivx_check)
-+GEN_OPIVX_TRANS(vssra_vx,  opivx_check)
-+GEN_OPIVI_TRANS(vssrl_vi, 1, vssrl_vx, opivx_check)
-+GEN_OPIVI_TRANS(vssra_vi, 0, vssra_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX3_RM, vwsmaccus_vx_w, WOP_SUS_W, H8, H4, vwsmaccus32)
- GEN_VEXT_VX_RM(vwsmaccus_vx_b, 1, 2, clearh)
- GEN_VEXT_VX_RM(vwsmaccus_vx_h, 2, 4, clearl)
- GEN_VEXT_VX_RM(vwsmaccus_vx_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Scaling Shift Instructions */
-+static inline uint8_t
-+vssrl8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
-+{
-+    uint8_t round, shift = b & 0x7;
-+    uint8_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline uint16_t
-+vssrl16(CPURISCVState *env, int vxrm, uint16_t a, uint16_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    uint16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline uint32_t
-+vssrl32(CPURISCVState *env, int vxrm, uint32_t a, uint32_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    uint32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline uint64_t
-+vssrl64(CPURISCVState *env, int vxrm, uint64_t a, uint64_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    uint64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+RVVCALL(OPIVV2_RM, vssrl_vv_b, OP_UUU_B, H1, H1, H1, vssrl8)
-+RVVCALL(OPIVV2_RM, vssrl_vv_h, OP_UUU_H, H2, H2, H2, vssrl16)
-+RVVCALL(OPIVV2_RM, vssrl_vv_w, OP_UUU_W, H4, H4, H4, vssrl32)
-+RVVCALL(OPIVV2_RM, vssrl_vv_d, OP_UUU_D, H8, H8, H8, vssrl64)
-+GEN_VEXT_VV_RM(vssrl_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vssrl_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vssrl_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vssrl_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vssrl_vx_b, OP_UUU_B, H1, H1, vssrl8)
-+RVVCALL(OPIVX2_RM, vssrl_vx_h, OP_UUU_H, H2, H2, vssrl16)
-+RVVCALL(OPIVX2_RM, vssrl_vx_w, OP_UUU_W, H4, H4, vssrl32)
-+RVVCALL(OPIVX2_RM, vssrl_vx_d, OP_UUU_D, H8, H8, vssrl64)
-+GEN_VEXT_VX_RM(vssrl_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vssrl_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vssrl_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vssrl_vx_d, 8, 8, clearq)
-+
-+static inline int8_t
-+vssra8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
-+{
-+    uint8_t round, shift = b & 0x7;
-+    int8_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline int16_t
-+vssra16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    int16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline int32_t
-+vssra32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    int32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline int64_t
-+vssra64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    int64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+RVVCALL(OPIVV2_RM, vssra_vv_b, OP_SSS_B, H1, H1, H1, vssra8)
-+RVVCALL(OPIVV2_RM, vssra_vv_h, OP_SSS_H, H2, H2, H2, vssra16)
-+RVVCALL(OPIVV2_RM, vssra_vv_w, OP_SSS_W, H4, H4, H4, vssra32)
-+RVVCALL(OPIVV2_RM, vssra_vv_d, OP_SSS_D, H8, H8, H8, vssra64)
-+GEN_VEXT_VV_RM(vssra_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vssra_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vssra_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vssra_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vssra_vx_b, OP_SSS_B, H1, H1, vssra8)
-+RVVCALL(OPIVX2_RM, vssra_vx_h, OP_SSS_H, H2, H2, vssra16)
-+RVVCALL(OPIVX2_RM, vssra_vx_w, OP_SSS_W, H4, H4, vssra32)
-+RVVCALL(OPIVX2_RM, vssra_vx_d, OP_SSS_D, H8, H8, vssra64)
-+GEN_VEXT_VX_RM(vssra_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vssra_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vssra_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vssra_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 31/63] target/riscv: vector narrowing fixed-point clip instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-30-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  13 +++
- target/riscv/insn32.decode              |   6 +
- target/riscv/insn_trans/trans_rvv.inc.c |   8 ++
- target/riscv/vector_helper.c            | 141 ++++++++++++++++++++++++
-files changed, 168 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vssra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vnclip_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vssrl_vi        101010 . ..... ..... 011 ..... 1010111 @r_vm
- vssra_vv        101011 . ..... ..... 000 ..... 1010111 @r_vm
- vssra_vx        101011 . ..... ..... 100 ..... 1010111 @r_vm
- vssra_vi        101011 . ..... ..... 011 ..... 1010111 @r_vm
-+vnclipu_vv      101110 . ..... ..... 000 ..... 1010111 @r_vm
-+vnclipu_vx      101110 . ..... ..... 100 ..... 1010111 @r_vm
-+vnclipu_vi      101110 . ..... ..... 011 ..... 1010111 @r_vm
-+vnclip_vv       101111 . ..... ..... 000 ..... 1010111 @r_vm
-+vnclip_vx       101111 . ..... ..... 100 ..... 1010111 @r_vm
-+vnclip_vi       101111 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vssrl_vx,  opivx_check)
- GEN_OPIVX_TRANS(vssra_vx,  opivx_check)
- GEN_OPIVI_TRANS(vssrl_vi, 1, vssrl_vx, opivx_check)
- GEN_OPIVI_TRANS(vssra_vi, 0, vssra_vx, opivx_check)
-+
-+/* Vector Narrowing Fixed-Point Clip Instructions */
-+GEN_OPIVV_NARROW_TRANS(vnclipu_vv)
-+GEN_OPIVV_NARROW_TRANS(vnclip_vv)
-+GEN_OPIVX_NARROW_TRANS(vnclipu_vx)
-+GEN_OPIVX_NARROW_TRANS(vnclip_vx)
-+GEN_OPIVI_NARROW_TRANS(vnclipu_vi, 1, vnclipu_vx)
-+GEN_OPIVI_NARROW_TRANS(vnclip_vi, 1, vnclip_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define WOP_SSU_B int16_t, int8_t, uint8_t, int16_t, uint16_t
- #define WOP_SSU_H int32_t, int16_t, uint16_t, int32_t, uint32_t
- #define WOP_SSU_W int64_t, int32_t, uint32_t, int64_t, uint64_t
-+#define NOP_SSS_B int8_t, int8_t, int16_t, int8_t, int16_t
-+#define NOP_SSS_H int16_t, int16_t, int32_t, int16_t, int32_t
-+#define NOP_SSS_W int32_t, int32_t, int64_t, int32_t, int64_t
-+#define NOP_UUU_B uint8_t, uint8_t, uint16_t, uint8_t, uint16_t
-+#define NOP_UUU_H uint16_t, uint16_t, uint32_t, uint16_t, uint32_t
-+#define NOP_UUU_W uint32_t, uint32_t, uint64_t, uint32_t, uint64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ vssra64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-     res   = (a >> shift)  + round;
-     return res;
- }
-+
- RVVCALL(OPIVV2_RM, vssra_vv_b, OP_SSS_B, H1, H1, H1, vssra8)
- RVVCALL(OPIVV2_RM, vssra_vv_h, OP_SSS_H, H2, H2, H2, vssra16)
- RVVCALL(OPIVV2_RM, vssra_vv_w, OP_SSS_W, H4, H4, H4, vssra32)
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vssra_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vssra_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vssra_vx_w, 4, 4, clearl)
- GEN_VEXT_VX_RM(vssra_vx_d, 8, 8, clearq)
-+
-+/* Vector Narrowing Fixed-Point Clip Instructions */
-+static inline int8_t
-+vnclip8(CPURISCVState *env, int vxrm, int16_t a, int8_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    int16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > INT8_MAX) {
-+        env->vxsat = 0x1;
-+        return INT8_MAX;
-+    } else if (res < INT8_MIN) {
-+        env->vxsat = 0x1;
-+        return INT8_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline int16_t
-+vnclip16(CPURISCVState *env, int vxrm, int32_t a, int16_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    int32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > INT16_MAX) {
-+        env->vxsat = 0x1;
-+        return INT16_MAX;
-+    } else if (res < INT16_MIN) {
-+        env->vxsat = 0x1;
-+        return INT16_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline int32_t
-+vnclip32(CPURISCVState *env, int vxrm, int64_t a, int32_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    int64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > INT32_MAX) {
-+        env->vxsat = 0x1;
-+        return INT32_MAX;
-+    } else if (res < INT32_MIN) {
-+        env->vxsat = 0x1;
-+        return INT32_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+RVVCALL(OPIVV2_RM, vnclip_vv_b, NOP_SSS_B, H1, H2, H1, vnclip8)
-+RVVCALL(OPIVV2_RM, vnclip_vv_h, NOP_SSS_H, H2, H4, H2, vnclip16)
-+RVVCALL(OPIVV2_RM, vnclip_vv_w, NOP_SSS_W, H4, H8, H4, vnclip32)
-+GEN_VEXT_VV_RM(vnclip_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vnclip_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vnclip_vv_w, 4, 4, clearl)
-+
-+RVVCALL(OPIVX2_RM, vnclip_vx_b, NOP_SSS_B, H1, H2, vnclip8)
-+RVVCALL(OPIVX2_RM, vnclip_vx_h, NOP_SSS_H, H2, H4, vnclip16)
-+RVVCALL(OPIVX2_RM, vnclip_vx_w, NOP_SSS_W, H4, H8, vnclip32)
-+GEN_VEXT_VX_RM(vnclip_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vnclip_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vnclip_vx_w, 4, 4, clearl)
-+
-+static inline uint8_t
-+vnclipu8(CPURISCVState *env, int vxrm, uint16_t a, uint8_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    uint16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > UINT8_MAX) {
-+        env->vxsat = 0x1;
-+        return UINT8_MAX;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline uint16_t
-+vnclipu16(CPURISCVState *env, int vxrm, uint32_t a, uint16_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    uint32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > UINT16_MAX) {
-+        env->vxsat = 0x1;
-+        return UINT16_MAX;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline uint32_t
-+vnclipu32(CPURISCVState *env, int vxrm, uint64_t a, uint32_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    int64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > UINT32_MAX) {
-+        env->vxsat = 0x1;
-+        return UINT32_MAX;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+RVVCALL(OPIVV2_RM, vnclipu_vv_b, NOP_UUU_B, H1, H2, H1, vnclipu8)
-+RVVCALL(OPIVV2_RM, vnclipu_vv_h, NOP_UUU_H, H2, H4, H2, vnclipu16)
-+RVVCALL(OPIVV2_RM, vnclipu_vv_w, NOP_UUU_W, H4, H8, H4, vnclipu32)
-+GEN_VEXT_VV_RM(vnclipu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vnclipu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vnclipu_vv_w, 4, 4, clearl)
-+
-+RVVCALL(OPIVX2_RM, vnclipu_vx_b, NOP_UUU_B, H1, H2, vnclipu8)
-+RVVCALL(OPIVX2_RM, vnclipu_vx_h, NOP_UUU_H, H2, H4, vnclipu16)
-+RVVCALL(OPIVX2_RM, vnclipu_vx_w, NOP_UUU_W, H4, H8, vnclipu32)
-+GEN_VEXT_VX_RM(vnclipu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vnclipu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vnclipu_vx_w, 4, 4, clearl)
---
-.27.0

-[PULL 32/63] target/riscv: vector single-width floating-point add/subtract instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-31-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  16 ++++
- target/riscv/insn32.decode              |   5 +
- target/riscv/insn_trans/trans_rvv.inc.c | 118 ++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 111 ++++++++++++++++++++++
-files changed, 250 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnclipu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnclip_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnclip_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnclip_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vfadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vnclipu_vi      101110 . ..... ..... 011 ..... 1010111 @r_vm
- vnclip_vv       101111 . ..... ..... 000 ..... 1010111 @r_vm
- vnclip_vx       101111 . ..... ..... 100 ..... 1010111 @r_vm
- vnclip_vi       101111 . ..... ..... 011 ..... 1010111 @r_vm
-+vfadd_vv        000000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfadd_vf        000000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfsub_vv        000010 . ..... ..... 001 ..... 1010111 @r_vm
-+vfsub_vf        000010 . ..... ..... 101 ..... 1010111 @r_vm
-+vfrsub_vf       100111 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_NARROW_TRANS(vnclipu_vx)
- GEN_OPIVX_NARROW_TRANS(vnclip_vx)
- GEN_OPIVI_NARROW_TRANS(vnclipu_vi, 1, vnclipu_vx)
- GEN_OPIVI_NARROW_TRANS(vnclip_vi, 1, vnclip_vx)
-+
-+/*
-+ *** Vector Float Point Arithmetic Instructions
-+ */
-+/* Vector Single-Width Floating-Point Add/Subtract Instructions */
-+
-+/*
-+ * If the current SEW does not correspond to a supported IEEE floating-point
-+ * type, an illegal instruction exception is raised.
-+ */
-+static bool opfvv_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            (s->sew != 0));
-+}
-+
-+/* OPFVV without GVEC IR */
-+#define GEN_OPFVV_TRANS(NAME, CHECK)                               \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+{                                                                  \
-+    if (CHECK(s, a)) {                                             \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_4_ptr * const fns[3] = {            \
-+            gen_helper_##NAME##_h,                                 \
-+            gen_helper_##NAME##_w,                                 \
-+            gen_helper_##NAME##_d,                                 \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        gen_set_rm(s, 7);                                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs1),                    \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew - 1]);    \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+GEN_OPFVV_TRANS(vfadd_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfsub_vv, opfvv_check)
-+
-+typedef void gen_helper_opfvf(TCGv_ptr, TCGv_ptr, TCGv_i64, TCGv_ptr,
-+                              TCGv_env, TCGv_i32);
-+
-+static bool opfvf_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
-+                        uint32_t data, gen_helper_opfvf *fn, DisasContext *s)
-+{
-+    TCGv_ptr dest, src2, mask;
-+    TCGv_i32 desc;
-+
-+    TCGLabel *over = gen_new_label();
-+    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+    dest = tcg_temp_new_ptr();
-+    mask = tcg_temp_new_ptr();
-+    src2 = tcg_temp_new_ptr();
-+    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
-+
-+    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
-+    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
-+    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
-+
-+    fn(dest, mask, cpu_fpr[rs1], src2, cpu_env, desc);
-+
-+    tcg_temp_free_ptr(dest);
-+    tcg_temp_free_ptr(mask);
-+    tcg_temp_free_ptr(src2);
-+    tcg_temp_free_i32(desc);
-+    gen_set_label(over);
-+    return true;
-+}
-+
-+static bool opfvf_check(DisasContext *s, arg_rmrr *a)
-+{
-+/*
-+ * If the current SEW does not correspond to a supported IEEE floating-point
-+ * type, an illegal instruction exception is raised
-+ */
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            (s->sew != 0));
-+}
-+
-+/* OPFVF without GVEC IR */
-+#define GEN_OPFVF_TRANS(NAME, CHECK)                              \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)            \
-+{                                                                 \
-+    if (CHECK(s, a)) {                                            \
-+        uint32_t data = 0;                                        \
-+        static gen_helper_opfvf *const fns[3] = {                 \
-+            gen_helper_##NAME##_h,                                \
-+            gen_helper_##NAME##_w,                                \
-+            gen_helper_##NAME##_d,                                \
-+        };                                                        \
-+        gen_set_rm(s, 7);                                         \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);            \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);            \
-+        return opfvf_trans(a->rd, a->rs1, a->rs2, data,           \
-+                           fns[s->sew - 1], s);                   \
-+    }                                                             \
-+    return false;                                                 \
-+}
-+
-+GEN_OPFVF_TRANS(vfadd_vf,  opfvf_check)
-+GEN_OPFVF_TRANS(vfsub_vf,  opfvf_check)
-+GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@
- #include "exec/memop.h"
- #include "exec/exec-all.h"
- #include "exec/helper-proto.h"
-+#include "fpu/softfloat.h"
- #include "tcg/tcg-gvec-desc.h"
- #include "internals.h"
- #include <math.h>
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2_RM, vnclipu_vx_w, NOP_UUU_W, H4, H8, vnclipu32)
- GEN_VEXT_VX_RM(vnclipu_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vnclipu_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vnclipu_vx_w, 4, 4, clearl)
-+
-+/*
-+ *** Vector Float Point Arithmetic Instructions
-+ */
-+/* Vector Single-Width Floating-Point Add/Subtract Instructions */
-+#define OPFVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)   \
-+static void do_##NAME(void *vd, void *vs1, void *vs2, int i,   \
-+                      CPURISCVState *env)                      \
-+{                                                              \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                            \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                            \
-+    *((TD *)vd + HD(i)) = OP(s2, s1, &env->fp_status);         \
-+}
-+
-+#define GEN_VEXT_VV_ENV(NAME, ESZ, DSZ, CLEAR_FN)         \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
-+                  void *vs2, CPURISCVState *env,          \
-+                  uint32_t desc)                          \
-+{                                                         \
-+    uint32_t vlmax = vext_maxsz(desc) / ESZ;              \
-+    uint32_t mlen = vext_mlen(desc);                      \
-+    uint32_t vm = vext_vm(desc);                          \
-+    uint32_t vl = env->vl;                                \
-+    uint32_t i;                                           \
-+                                                          \
-+    for (i = 0; i < vl; i++) {                            \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
-+            continue;                                     \
-+        }                                                 \
-+        do_##NAME(vd, vs1, vs2, i, env);                  \
-+    }                                                     \
-+    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);             \
-+}
-+
-+RVVCALL(OPFVV2, vfadd_vv_h, OP_UUU_H, H2, H2, H2, float16_add)
-+RVVCALL(OPFVV2, vfadd_vv_w, OP_UUU_W, H4, H4, H4, float32_add)
-+RVVCALL(OPFVV2, vfadd_vv_d, OP_UUU_D, H8, H8, H8, float64_add)
-+GEN_VEXT_VV_ENV(vfadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfadd_vv_d, 8, 8, clearq)
-+
-+#define OPFVF2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)        \
-+static void do_##NAME(void *vd, uint64_t s1, void *vs2, int i, \
-+                      CPURISCVState *env)                      \
-+{                                                              \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                            \
-+    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, &env->fp_status);\
-+}
-+
-+#define GEN_VEXT_VF(NAME, ESZ, DSZ, CLEAR_FN)             \
-+void HELPER(NAME)(void *vd, void *v0, uint64_t s1,        \
-+                  void *vs2, CPURISCVState *env,          \
-+                  uint32_t desc)                          \
-+{                                                         \
-+    uint32_t vlmax = vext_maxsz(desc) / ESZ;              \
-+    uint32_t mlen = vext_mlen(desc);                      \
-+    uint32_t vm = vext_vm(desc);                          \
-+    uint32_t vl = env->vl;                                \
-+    uint32_t i;                                           \
-+                                                          \
-+    for (i = 0; i < vl; i++) {                            \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
-+            continue;                                     \
-+        }                                                 \
-+        do_##NAME(vd, s1, vs2, i, env);                   \
-+    }                                                     \
-+    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);             \
-+}
-+
-+RVVCALL(OPFVF2, vfadd_vf_h, OP_UUU_H, H2, H2, float16_add)
-+RVVCALL(OPFVF2, vfadd_vf_w, OP_UUU_W, H4, H4, float32_add)
-+RVVCALL(OPFVF2, vfadd_vf_d, OP_UUU_D, H8, H8, float64_add)
-+GEN_VEXT_VF(vfadd_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfadd_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfadd_vf_d, 8, 8, clearq)
-+
-+RVVCALL(OPFVV2, vfsub_vv_h, OP_UUU_H, H2, H2, H2, float16_sub)
-+RVVCALL(OPFVV2, vfsub_vv_w, OP_UUU_W, H4, H4, H4, float32_sub)
-+RVVCALL(OPFVV2, vfsub_vv_d, OP_UUU_D, H8, H8, H8, float64_sub)
-+GEN_VEXT_VV_ENV(vfsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfsub_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfsub_vf_h, OP_UUU_H, H2, H2, float16_sub)
-+RVVCALL(OPFVF2, vfsub_vf_w, OP_UUU_W, H4, H4, float32_sub)
-+RVVCALL(OPFVF2, vfsub_vf_d, OP_UUU_D, H8, H8, float64_sub)
-+GEN_VEXT_VF(vfsub_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfsub_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfsub_vf_d, 8, 8, clearq)
-+
-+static uint16_t float16_rsub(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float16_sub(b, a, s);
-+}
-+
-+static uint32_t float32_rsub(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float32_sub(b, a, s);
-+}
-+
-+static uint64_t float64_rsub(uint64_t a, uint64_t b, float_status *s)
-+{
-+    return float64_sub(b, a, s);
-+}
-+
-+RVVCALL(OPFVF2, vfrsub_vf_h, OP_UUU_H, H2, H2, float16_rsub)
-+RVVCALL(OPFVF2, vfrsub_vf_w, OP_UUU_W, H4, H4, float32_rsub)
-+RVVCALL(OPFVF2, vfrsub_vf_d, OP_UUU_D, H8, H8, float64_rsub)
-+GEN_VEXT_VF(vfrsub_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfrsub_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfrsub_vf_d, 8, 8, clearq)
---
-.27.0

-[PULL 33/63] target/riscv: vector widening floating-point add/subtract instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-32-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  17 +++
- target/riscv/insn32.decode              |   8 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 149 ++++++++++++++++++++++++
- target/riscv/vector_helper.c            |  83 +++++++++++++
-files changed, 257 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfwadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wf_w, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfadd_vf        000000 . ..... ..... 101 ..... 1010111 @r_vm
- vfsub_vv        000010 . ..... ..... 001 ..... 1010111 @r_vm
- vfsub_vf        000010 . ..... ..... 101 ..... 1010111 @r_vm
- vfrsub_vf       100111 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwadd_vv       110000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwadd_vf       110000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwadd_wv       110100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwadd_wf       110100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwsub_vv       110010 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwsub_vf       110010 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwsub_wv       110110 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwsub_wf       110110 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)            \
- GEN_OPFVF_TRANS(vfadd_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfsub_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
-+
-+/* Vector Widening Floating-Point Add/Subtract Instructions */
-+static bool opfvv_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
-+                                     1 << s->lmul) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* OPFVV with WIDEN */
-+#define GEN_OPFVV_WIDEN_TRANS(NAME, CHECK)                       \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
-+{                                                                \
-+    if (CHECK(s, a)) {                                           \
-+        uint32_t data = 0;                                       \
-+        static gen_helper_gvec_4_ptr * const fns[2] = {          \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
-+        };                                                       \
-+        TCGLabel *over = gen_new_label();                        \
-+        gen_set_rm(s, 7);                                        \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);        \
-+                                                                 \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),   \
-+                           vreg_ofs(s, a->rs1),                  \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,      \
-+                           s->vlen / 8, data, fns[s->sew - 1]);  \
-+        gen_set_label(over);                                     \
-+        return true;                                             \
-+    }                                                            \
-+    return false;                                                \
-+}
-+
-+GEN_OPFVV_WIDEN_TRANS(vfwadd_vv, opfvv_widen_check)
-+GEN_OPFVV_WIDEN_TRANS(vfwsub_vv, opfvv_widen_check)
-+
-+static bool opfvf_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* OPFVF with WIDEN */
-+#define GEN_OPFVF_WIDEN_TRANS(NAME)                              \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
-+{                                                                \
-+    if (opfvf_widen_check(s, a)) {                               \
-+        uint32_t data = 0;                                       \
-+        static gen_helper_opfvf *const fns[2] = {                \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
-+        };                                                       \
-+        gen_set_rm(s, 7);                                        \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
-+        return opfvf_trans(a->rd, a->rs1, a->rs2, data,          \
-+                           fns[s->sew - 1], s);                  \
-+    }                                                            \
-+    return false;                                                \
-+}
-+
-+GEN_OPFVF_WIDEN_TRANS(vfwadd_vf)
-+GEN_OPFVF_WIDEN_TRANS(vfwsub_vf)
-+
-+static bool opfwv_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* WIDEN OPFVV with WIDEN */
-+#define GEN_OPFWV_WIDEN_TRANS(NAME)                                \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+{                                                                  \
-+    if (opfwv_widen_check(s, a)) {                                 \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_4_ptr * const fns[2] = {            \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,          \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        gen_set_rm(s, 7);                                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs1),                    \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew - 1]);    \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+
-+GEN_OPFWV_WIDEN_TRANS(vfwadd_wv)
-+GEN_OPFWV_WIDEN_TRANS(vfwsub_wv)
-+
-+static bool opfwf_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* WIDEN OPFVF with WIDEN */
-+#define GEN_OPFWF_WIDEN_TRANS(NAME)                              \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
-+{                                                                \
-+    if (opfwf_widen_check(s, a)) {                               \
-+        uint32_t data = 0;                                       \
-+        static gen_helper_opfvf *const fns[2] = {                \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
-+        };                                                       \
-+        gen_set_rm(s, 7);                                        \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
-+        return opfvf_trans(a->rd, a->rs1, a->rs2, data,          \
-+                           fns[s->sew - 1], s);                  \
-+    }                                                            \
-+    return false;                                                \
-+}
-+
-+GEN_OPFWF_WIDEN_TRANS(vfwadd_wf)
-+GEN_OPFWF_WIDEN_TRANS(vfwsub_wf)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfrsub_vf_d, OP_UUU_D, H8, H8, float64_rsub)
- GEN_VEXT_VF(vfrsub_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfrsub_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfrsub_vf_d, 8, 8, clearq)
-+
-+/* Vector Widening Floating-Point Add/Subtract Instructions */
-+static uint32_t vfwadd16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float32_add(float16_to_float32(a, true, s),
-+            float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwadd32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float64_add(float32_to_float64(a, s),
-+            float32_to_float64(b, s), s);
-+
-+}
-+
-+RVVCALL(OPFVV2, vfwadd_vv_h, WOP_UUU_H, H4, H2, H2, vfwadd16)
-+RVVCALL(OPFVV2, vfwadd_vv_w, WOP_UUU_W, H8, H4, H4, vfwadd32)
-+GEN_VEXT_VV_ENV(vfwadd_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwadd_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwadd_vf_h, WOP_UUU_H, H4, H2, vfwadd16)
-+RVVCALL(OPFVF2, vfwadd_vf_w, WOP_UUU_W, H8, H4, vfwadd32)
-+GEN_VEXT_VF(vfwadd_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwadd_vf_w, 4, 8, clearq)
-+
-+static uint32_t vfwsub16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float32_sub(float16_to_float32(a, true, s),
-+            float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwsub32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float64_sub(float32_to_float64(a, s),
-+            float32_to_float64(b, s), s);
-+
-+}
-+
-+RVVCALL(OPFVV2, vfwsub_vv_h, WOP_UUU_H, H4, H2, H2, vfwsub16)
-+RVVCALL(OPFVV2, vfwsub_vv_w, WOP_UUU_W, H8, H4, H4, vfwsub32)
-+GEN_VEXT_VV_ENV(vfwsub_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwsub_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwsub_vf_h, WOP_UUU_H, H4, H2, vfwsub16)
-+RVVCALL(OPFVF2, vfwsub_vf_w, WOP_UUU_W, H8, H4, vfwsub32)
-+GEN_VEXT_VF(vfwsub_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwsub_vf_w, 4, 8, clearq)
-+
-+static uint32_t vfwaddw16(uint32_t a, uint16_t b, float_status *s)
-+{
-+    return float32_add(a, float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwaddw32(uint64_t a, uint32_t b, float_status *s)
-+{
-+    return float64_add(a, float32_to_float64(b, s), s);
-+}
-+
-+RVVCALL(OPFVV2, vfwadd_wv_h, WOP_WUUU_H, H4, H2, H2, vfwaddw16)
-+RVVCALL(OPFVV2, vfwadd_wv_w, WOP_WUUU_W, H8, H4, H4, vfwaddw32)
-+GEN_VEXT_VV_ENV(vfwadd_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwadd_wv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwadd_wf_h, WOP_WUUU_H, H4, H2, vfwaddw16)
-+RVVCALL(OPFVF2, vfwadd_wf_w, WOP_WUUU_W, H8, H4, vfwaddw32)
-+GEN_VEXT_VF(vfwadd_wf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwadd_wf_w, 4, 8, clearq)
-+
-+static uint32_t vfwsubw16(uint32_t a, uint16_t b, float_status *s)
-+{
-+    return float32_sub(a, float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwsubw32(uint64_t a, uint32_t b, float_status *s)
-+{
-+    return float64_sub(a, float32_to_float64(b, s), s);
-+}
-+
-+RVVCALL(OPFVV2, vfwsub_wv_h, WOP_WUUU_H, H4, H2, H2, vfwsubw16)
-+RVVCALL(OPFVV2, vfwsub_wv_w, WOP_WUUU_W, H8, H4, H4, vfwsubw32)
-+GEN_VEXT_VV_ENV(vfwsub_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwsub_wv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwsub_wf_h, WOP_WUUU_H, H4, H2, vfwsubw16)
-+RVVCALL(OPFVF2, vfwsub_wf_w, WOP_WUUU_W, H8, H4, vfwsubw32)
-+GEN_VEXT_VF(vfwsub_wf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwsub_wf_w, 4, 8, clearq)
---
-.27.0

-[PULL 34/63] target/riscv: vector single-width floating-point multiply/divide instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-33-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 16 ++++++++
- target/riscv/insn32.decode              |  5 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  7 ++++
- target/riscv/vector_helper.c            | 49 +++++++++++++++++++++++++
-files changed, 77 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwadd_wf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwadd_wf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwsub_wf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwsub_wf_w, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfwsub_vv       110010 . ..... ..... 001 ..... 1010111 @r_vm
- vfwsub_vf       110010 . ..... ..... 101 ..... 1010111 @r_vm
- vfwsub_wv       110110 . ..... ..... 001 ..... 1010111 @r_vm
- vfwsub_wf       110110 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmul_vv        100100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmul_vf        100100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfdiv_vv        100000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
- GEN_OPFWF_WIDEN_TRANS(vfwadd_wf)
- GEN_OPFWF_WIDEN_TRANS(vfwsub_wf)
-+
-+/* Vector Single-Width Floating-Point Multiply/Divide Instructions */
-+GEN_OPFVV_TRANS(vfmul_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfdiv_vv, opfvv_check)
-+GEN_OPFVF_TRANS(vfmul_vf,  opfvf_check)
-+GEN_OPFVF_TRANS(vfdiv_vf,  opfvf_check)
-+GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfwsub_wf_h, WOP_WUUU_H, H4, H2, vfwsubw16)
- RVVCALL(OPFVF2, vfwsub_wf_w, WOP_WUUU_W, H8, H4, vfwsubw32)
- GEN_VEXT_VF(vfwsub_wf_h, 2, 4, clearl)
- GEN_VEXT_VF(vfwsub_wf_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Floating-Point Multiply/Divide Instructions */
-+RVVCALL(OPFVV2, vfmul_vv_h, OP_UUU_H, H2, H2, H2, float16_mul)
-+RVVCALL(OPFVV2, vfmul_vv_w, OP_UUU_W, H4, H4, H4, float32_mul)
-+RVVCALL(OPFVV2, vfmul_vv_d, OP_UUU_D, H8, H8, H8, float64_mul)
-+GEN_VEXT_VV_ENV(vfmul_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmul_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmul_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfmul_vf_h, OP_UUU_H, H2, H2, float16_mul)
-+RVVCALL(OPFVF2, vfmul_vf_w, OP_UUU_W, H4, H4, float32_mul)
-+RVVCALL(OPFVF2, vfmul_vf_d, OP_UUU_D, H8, H8, float64_mul)
-+GEN_VEXT_VF(vfmul_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmul_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmul_vf_d, 8, 8, clearq)
-+
-+RVVCALL(OPFVV2, vfdiv_vv_h, OP_UUU_H, H2, H2, H2, float16_div)
-+RVVCALL(OPFVV2, vfdiv_vv_w, OP_UUU_W, H4, H4, H4, float32_div)
-+RVVCALL(OPFVV2, vfdiv_vv_d, OP_UUU_D, H8, H8, H8, float64_div)
-+GEN_VEXT_VV_ENV(vfdiv_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfdiv_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfdiv_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfdiv_vf_h, OP_UUU_H, H2, H2, float16_div)
-+RVVCALL(OPFVF2, vfdiv_vf_w, OP_UUU_W, H4, H4, float32_div)
-+RVVCALL(OPFVF2, vfdiv_vf_d, OP_UUU_D, H8, H8, float64_div)
-+GEN_VEXT_VF(vfdiv_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfdiv_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfdiv_vf_d, 8, 8, clearq)
-+
-+static uint16_t float16_rdiv(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float16_div(b, a, s);
-+}
-+
-+static uint32_t float32_rdiv(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float32_div(b, a, s);
-+}
-+
-+static uint64_t float64_rdiv(uint64_t a, uint64_t b, float_status *s)
-+{
-+    return float64_div(b, a, s);
-+}
-+
-+RVVCALL(OPFVF2, vfrdiv_vf_h, OP_UUU_H, H2, H2, float16_rdiv)
-+RVVCALL(OPFVF2, vfrdiv_vf_w, OP_UUU_W, H4, H4, float32_rdiv)
-+RVVCALL(OPFVF2, vfrdiv_vf_d, OP_UUU_D, H8, H8, float64_rdiv)
-+GEN_VEXT_VF(vfrdiv_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfrdiv_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfrdiv_vf_d, 8, 8, clearq)
---
-.27.0

-[PULL 35/63] target/riscv: vector widening floating-point multiply
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-34-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  5 +++++
- target/riscv/insn32.decode              |  2 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  4 ++++
- target/riscv/vector_helper.c            | 22 ++++++++++++++++++++++
-files changed, 33 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfmul_vf        100100 . ..... ..... 101 ..... 1010111 @r_vm
- vfdiv_vv        100000 . ..... ..... 001 ..... 1010111 @r_vm
- vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
- vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwmul_vv       111000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwmul_vf       111000 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfdiv_vv, opfvv_check)
- GEN_OPFVF_TRANS(vfmul_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfdiv_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
-+
-+/* Vector Widening Floating-Point Multiply */
-+GEN_OPFVV_WIDEN_TRANS(vfwmul_vv, opfvv_widen_check)
-+GEN_OPFVF_WIDEN_TRANS(vfwmul_vf)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfrdiv_vf_d, OP_UUU_D, H8, H8, float64_rdiv)
- GEN_VEXT_VF(vfrdiv_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfrdiv_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfrdiv_vf_d, 8, 8, clearq)
-+
-+/* Vector Widening Floating-Point Multiply */
-+static uint32_t vfwmul16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float32_mul(float16_to_float32(a, true, s),
-+            float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwmul32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float64_mul(float32_to_float64(a, s),
-+            float32_to_float64(b, s), s);
-+
-+}
-+RVVCALL(OPFVV2, vfwmul_vv_h, WOP_UUU_H, H4, H2, H2, vfwmul16)
-+RVVCALL(OPFVV2, vfwmul_vv_w, WOP_UUU_W, H8, H4, H4, vfwmul32)
-+GEN_VEXT_VV_ENV(vfwmul_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwmul_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwmul_vf_h, WOP_UUU_H, H4, H2, vfwmul16)
-+RVVCALL(OPFVF2, vfwmul_vf_w, WOP_UUU_W, H8, H4, vfwmul32)
-+GEN_VEXT_VF(vfwmul_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwmul_vf_w, 4, 8, clearq)
---
-.27.0

-[PULL 36/63] target/riscv: vector single-width floating-point fused multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-35-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  49 +++++
- target/riscv/insn32.decode              |  16 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  18 ++
- target/riscv/vector_helper.c            | 251 ++++++++++++++++++++++++
-files changed, 334 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfwmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
- vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
- vfwmul_vv       111000 . ..... ..... 001 ..... 1010111 @r_vm
- vfwmul_vf       111000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmacc_vv       101100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmacc_vv      101101 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmacc_vf      101101 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmacc_vf       101100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmsac_vv       101110 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmsac_vf       101110 . ..... ..... 101 ..... 1010111 @r_vm
-+vfnmsac_vv      101111 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmsac_vf      101111 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmadd_vv       101000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmadd_vf       101000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfnmadd_vv      101001 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmadd_vf      101001 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmsub_vv       101010 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmsub_vf       101010 . ..... ..... 101 ..... 1010111 @r_vm
-+vfnmsub_vv      101011 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmsub_vf      101011 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
- /* Vector Widening Floating-Point Multiply */
- GEN_OPFVV_WIDEN_TRANS(vfwmul_vv, opfvv_widen_check)
- GEN_OPFVF_WIDEN_TRANS(vfwmul_vf)
-+
-+/* Vector Single-Width Floating-Point Fused Multiply-Add Instructions */
-+GEN_OPFVV_TRANS(vfmacc_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmacc_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmsac_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmsac_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmadd_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmadd_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmsub_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmsub_vv, opfvv_check)
-+GEN_OPFVF_TRANS(vfmacc_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmacc_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmsac_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmsac_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmadd_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmadd_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmsub_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmsub_vf, opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfwmul_vf_h, WOP_UUU_H, H4, H2, vfwmul16)
- RVVCALL(OPFVF2, vfwmul_vf_w, WOP_UUU_W, H8, H4, vfwmul32)
- GEN_VEXT_VF(vfwmul_vf_h, 2, 4, clearl)
- GEN_VEXT_VF(vfwmul_vf_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Floating-Point Fused Multiply-Add Instructions */
-+#define OPFVV3(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)       \
-+static void do_##NAME(void *vd, void *vs1, void *vs2, int i,       \
-+        CPURISCVState *env)                                        \
-+{                                                                  \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(s2, s1, d, &env->fp_status);          \
-+}
-+
-+static uint16_t fmacc16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d, 0, s);
-+}
-+
-+static uint32_t fmacc32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d, 0, s);
-+}
-+
-+static uint64_t fmacc64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d, 0, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmacc_vv_h, OP_UUU_H, H2, H2, H2, fmacc16)
-+RVVCALL(OPFVV3, vfmacc_vv_w, OP_UUU_W, H4, H4, H4, fmacc32)
-+RVVCALL(OPFVV3, vfmacc_vv_d, OP_UUU_D, H8, H8, H8, fmacc64)
-+GEN_VEXT_VV_ENV(vfmacc_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmacc_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmacc_vv_d, 8, 8, clearq)
-+
-+#define OPFVF3(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)           \
-+static void do_##NAME(void *vd, uint64_t s1, void *vs2, int i,    \
-+        CPURISCVState *env)                                       \
-+{                                                                 \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                               \
-+    TD d = *((TD *)vd + HD(i));                                   \
-+    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, d, &env->fp_status);\
-+}
-+
-+RVVCALL(OPFVF3, vfmacc_vf_h, OP_UUU_H, H2, H2, fmacc16)
-+RVVCALL(OPFVF3, vfmacc_vf_w, OP_UUU_W, H4, H4, fmacc32)
-+RVVCALL(OPFVF3, vfmacc_vf_d, OP_UUU_D, H8, H8, fmacc64)
-+GEN_VEXT_VF(vfmacc_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmacc_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmacc_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmacc16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmacc32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmacc64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmacc_vv_h, OP_UUU_H, H2, H2, H2, fnmacc16)
-+RVVCALL(OPFVV3, vfnmacc_vv_w, OP_UUU_W, H4, H4, H4, fnmacc32)
-+RVVCALL(OPFVV3, vfnmacc_vv_d, OP_UUU_D, H8, H8, H8, fnmacc64)
-+GEN_VEXT_VV_ENV(vfnmacc_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmacc_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmacc_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmacc_vf_h, OP_UUU_H, H2, H2, fnmacc16)
-+RVVCALL(OPFVF3, vfnmacc_vf_w, OP_UUU_W, H4, H4, fnmacc32)
-+RVVCALL(OPFVF3, vfnmacc_vf_d, OP_UUU_D, H8, H8, fnmacc64)
-+GEN_VEXT_VF(vfnmacc_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmacc_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmacc_vf_d, 8, 8, clearq)
-+
-+static uint16_t fmsac16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d, float_muladd_negate_c, s);
-+}
-+
-+static uint32_t fmsac32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d, float_muladd_negate_c, s);
-+}
-+
-+static uint64_t fmsac64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d, float_muladd_negate_c, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmsac_vv_h, OP_UUU_H, H2, H2, H2, fmsac16)
-+RVVCALL(OPFVV3, vfmsac_vv_w, OP_UUU_W, H4, H4, H4, fmsac32)
-+RVVCALL(OPFVV3, vfmsac_vv_d, OP_UUU_D, H8, H8, H8, fmsac64)
-+GEN_VEXT_VV_ENV(vfmsac_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmsac_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmsac_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfmsac_vf_h, OP_UUU_H, H2, H2, fmsac16)
-+RVVCALL(OPFVF3, vfmsac_vf_w, OP_UUU_W, H4, H4, fmsac32)
-+RVVCALL(OPFVF3, vfmsac_vf_d, OP_UUU_D, H8, H8, fmsac64)
-+GEN_VEXT_VF(vfmsac_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmsac_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmsac_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmsac16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d, float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmsac32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d, float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmsac64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d, float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmsac_vv_h, OP_UUU_H, H2, H2, H2, fnmsac16)
-+RVVCALL(OPFVV3, vfnmsac_vv_w, OP_UUU_W, H4, H4, H4, fnmsac32)
-+RVVCALL(OPFVV3, vfnmsac_vv_d, OP_UUU_D, H8, H8, H8, fnmsac64)
-+GEN_VEXT_VV_ENV(vfnmsac_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmsac_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmsac_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmsac_vf_h, OP_UUU_H, H2, H2, fnmsac16)
-+RVVCALL(OPFVF3, vfnmsac_vf_w, OP_UUU_W, H4, H4, fnmsac32)
-+RVVCALL(OPFVF3, vfnmsac_vf_d, OP_UUU_D, H8, H8, fnmsac64)
-+GEN_VEXT_VF(vfnmsac_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmsac_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmsac_vf_d, 8, 8, clearq)
-+
-+static uint16_t fmadd16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a, 0, s);
-+}
-+
-+static uint32_t fmadd32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a, 0, s);
-+}
-+
-+static uint64_t fmadd64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a, 0, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmadd_vv_h, OP_UUU_H, H2, H2, H2, fmadd16)
-+RVVCALL(OPFVV3, vfmadd_vv_w, OP_UUU_W, H4, H4, H4, fmadd32)
-+RVVCALL(OPFVV3, vfmadd_vv_d, OP_UUU_D, H8, H8, H8, fmadd64)
-+GEN_VEXT_VV_ENV(vfmadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmadd_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfmadd_vf_h, OP_UUU_H, H2, H2, fmadd16)
-+RVVCALL(OPFVF3, vfmadd_vf_w, OP_UUU_W, H4, H4, fmadd32)
-+RVVCALL(OPFVF3, vfmadd_vf_d, OP_UUU_D, H8, H8, fmadd64)
-+GEN_VEXT_VF(vfmadd_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmadd_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmadd_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmadd16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmadd32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmadd64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmadd_vv_h, OP_UUU_H, H2, H2, H2, fnmadd16)
-+RVVCALL(OPFVV3, vfnmadd_vv_w, OP_UUU_W, H4, H4, H4, fnmadd32)
-+RVVCALL(OPFVV3, vfnmadd_vv_d, OP_UUU_D, H8, H8, H8, fnmadd64)
-+GEN_VEXT_VV_ENV(vfnmadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmadd_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmadd_vf_h, OP_UUU_H, H2, H2, fnmadd16)
-+RVVCALL(OPFVF3, vfnmadd_vf_w, OP_UUU_W, H4, H4, fnmadd32)
-+RVVCALL(OPFVF3, vfnmadd_vf_d, OP_UUU_D, H8, H8, fnmadd64)
-+GEN_VEXT_VF(vfnmadd_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmadd_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmadd_vf_d, 8, 8, clearq)
-+
-+static uint16_t fmsub16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a, float_muladd_negate_c, s);
-+}
-+
-+static uint32_t fmsub32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a, float_muladd_negate_c, s);
-+}
-+
-+static uint64_t fmsub64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a, float_muladd_negate_c, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmsub_vv_h, OP_UUU_H, H2, H2, H2, fmsub16)
-+RVVCALL(OPFVV3, vfmsub_vv_w, OP_UUU_W, H4, H4, H4, fmsub32)
-+RVVCALL(OPFVV3, vfmsub_vv_d, OP_UUU_D, H8, H8, H8, fmsub64)
-+GEN_VEXT_VV_ENV(vfmsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmsub_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfmsub_vf_h, OP_UUU_H, H2, H2, fmsub16)
-+RVVCALL(OPFVF3, vfmsub_vf_w, OP_UUU_W, H4, H4, fmsub32)
-+RVVCALL(OPFVF3, vfmsub_vf_d, OP_UUU_D, H8, H8, fmsub64)
-+GEN_VEXT_VF(vfmsub_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmsub_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmsub_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmsub16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a, float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmsub32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a, float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmsub64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a, float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmsub_vv_h, OP_UUU_H, H2, H2, H2, fnmsub16)
-+RVVCALL(OPFVV3, vfnmsub_vv_w, OP_UUU_W, H4, H4, H4, fnmsub32)
-+RVVCALL(OPFVV3, vfnmsub_vv_d, OP_UUU_D, H8, H8, H8, fnmsub64)
-+GEN_VEXT_VV_ENV(vfnmsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmsub_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmsub_vf_h, OP_UUU_H, H2, H2, fnmsub16)
-+RVVCALL(OPFVF3, vfnmsub_vf_w, OP_UUU_W, H4, H4, fnmsub32)
-+RVVCALL(OPFVF3, vfnmsub_vf_d, OP_UUU_D, H8, H8, fnmsub64)
-+GEN_VEXT_VF(vfnmsub_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmsub_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmsub_vf_d, 8, 8, clearq)
---
-.27.0

-[PULL 37/63] target/riscv: vector widening floating-point fused multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-36-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 17 +++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 +++
- target/riscv/vector_helper.c            | 91 +++++++++++++++++++++++++
-files changed, 126 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfnmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfnmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfnmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfwmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwnmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwnmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwnmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwnmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfmsub_vv       101010 . ..... ..... 001 ..... 1010111 @r_vm
- vfmsub_vf       101010 . ..... ..... 101 ..... 1010111 @r_vm
- vfnmsub_vv      101011 . ..... ..... 001 ..... 1010111 @r_vm
- vfnmsub_vf      101011 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwmacc_vv      111100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwmacc_vf      111100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwnmacc_vv     111101 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwnmacc_vf     111101 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwmsac_vv      111110 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfmadd_vf, opfvf_check)
- GEN_OPFVF_TRANS(vfnmadd_vf, opfvf_check)
- GEN_OPFVF_TRANS(vfmsub_vf, opfvf_check)
- GEN_OPFVF_TRANS(vfnmsub_vf, opfvf_check)
-+
-+/* Vector Widening Floating-Point Fused Multiply-Add Instructions */
-+GEN_OPFVV_WIDEN_TRANS(vfwmacc_vv, opfvv_widen_check)
-+GEN_OPFVV_WIDEN_TRANS(vfwnmacc_vv, opfvv_widen_check)
-+GEN_OPFVV_WIDEN_TRANS(vfwmsac_vv, opfvv_widen_check)
-+GEN_OPFVV_WIDEN_TRANS(vfwnmsac_vv, opfvv_widen_check)
-+GEN_OPFVF_WIDEN_TRANS(vfwmacc_vf)
-+GEN_OPFVF_WIDEN_TRANS(vfwnmacc_vf)
-+GEN_OPFVF_WIDEN_TRANS(vfwmsac_vf)
-+GEN_OPFVF_WIDEN_TRANS(vfwnmsac_vf)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF3, vfnmsub_vf_d, OP_UUU_D, H8, H8, fnmsub64)
- GEN_VEXT_VF(vfnmsub_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfnmsub_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfnmsub_vf_d, 8, 8, clearq)
-+
-+/* Vector Widening Floating-Point Fused Multiply-Add Instructions */
-+static uint32_t fwmacc16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(float16_to_float32(a, true, s),
-+                        float16_to_float32(b, true, s), d, 0, s);
-+}
-+
-+static uint64_t fwmacc32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(float32_to_float64(a, s),
-+                        float32_to_float64(b, s), d, 0, s);
-+}
-+
-+RVVCALL(OPFVV3, vfwmacc_vv_h, WOP_UUU_H, H4, H2, H2, fwmacc16)
-+RVVCALL(OPFVV3, vfwmacc_vv_w, WOP_UUU_W, H8, H4, H4, fwmacc32)
-+GEN_VEXT_VV_ENV(vfwmacc_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwmacc_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF3, vfwmacc_vf_h, WOP_UUU_H, H4, H2, fwmacc16)
-+RVVCALL(OPFVF3, vfwmacc_vf_w, WOP_UUU_W, H8, H4, fwmacc32)
-+GEN_VEXT_VF(vfwmacc_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwmacc_vf_w, 4, 8, clearq)
-+
-+static uint32_t fwnmacc16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(float16_to_float32(a, true, s),
-+                        float16_to_float32(b, true, s), d,
-+                        float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fwnmacc32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(float32_to_float64(a, s),
-+                        float32_to_float64(b, s), d,
-+                        float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfwnmacc_vv_h, WOP_UUU_H, H4, H2, H2, fwnmacc16)
-+RVVCALL(OPFVV3, vfwnmacc_vv_w, WOP_UUU_W, H8, H4, H4, fwnmacc32)
-+GEN_VEXT_VV_ENV(vfwnmacc_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwnmacc_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF3, vfwnmacc_vf_h, WOP_UUU_H, H4, H2, fwnmacc16)
-+RVVCALL(OPFVF3, vfwnmacc_vf_w, WOP_UUU_W, H8, H4, fwnmacc32)
-+GEN_VEXT_VF(vfwnmacc_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwnmacc_vf_w, 4, 8, clearq)
-+
-+static uint32_t fwmsac16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(float16_to_float32(a, true, s),
-+                        float16_to_float32(b, true, s), d,
-+                        float_muladd_negate_c, s);
-+}
-+
-+static uint64_t fwmsac32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(float32_to_float64(a, s),
-+                        float32_to_float64(b, s), d,
-+                        float_muladd_negate_c, s);
-+}
-+
-+RVVCALL(OPFVV3, vfwmsac_vv_h, WOP_UUU_H, H4, H2, H2, fwmsac16)
-+RVVCALL(OPFVV3, vfwmsac_vv_w, WOP_UUU_W, H8, H4, H4, fwmsac32)
-+GEN_VEXT_VV_ENV(vfwmsac_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwmsac_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF3, vfwmsac_vf_h, WOP_UUU_H, H4, H2, fwmsac16)
-+RVVCALL(OPFVF3, vfwmsac_vf_w, WOP_UUU_W, H8, H4, fwmsac32)
-+GEN_VEXT_VF(vfwmsac_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwmsac_vf_w, 4, 8, clearq)
-+
-+static uint32_t fwnmsac16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(float16_to_float32(a, true, s),
-+                        float16_to_float32(b, true, s), d,
-+                        float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fwnmsac32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(float32_to_float64(a, s),
-+                        float32_to_float64(b, s), d,
-+                        float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfwnmsac_vv_h, WOP_UUU_H, H4, H2, H2, fwnmsac16)
-+RVVCALL(OPFVV3, vfwnmsac_vv_w, WOP_UUU_W, H8, H4, H4, fwnmsac32)
-+GEN_VEXT_VV_ENV(vfwnmsac_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwnmsac_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF3, vfwnmsac_vf_h, WOP_UUU_H, H4, H2, fwnmsac16)
-+RVVCALL(OPFVF3, vfwnmsac_vf_w, WOP_UUU_W, H8, H4, fwnmsac32)
-+GEN_VEXT_VF(vfwnmsac_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwnmsac_vf_w, 4, 8, clearq)
---
-.27.0

-[PULL 38/63] target/riscv: vector floating-point square-root instruction
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-37-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  4 +++
- target/riscv/insn32.decode              |  3 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 43 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 43 +++++++++++++++++++++++++
-files changed, 93 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_5(vfsqrt_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfsqrt_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfsqrt_v_d, void, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
- &shift     shamt rs1 rd
- &atomic    aq rl rs2 rs1 rd
- &rmrr      vm rd rs1 rs2
-+&rmr       vm rd rs2
- &rwdvm     vm wd rd rs1 rs2
- &r2nfvm    vm rd rs1 nf
- &rnfvm     vm rd rs1 rs2 nf
-@@ -XXX,XX +XXX,XX @@
- @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
- @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
-+@r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
- @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
-@@ -XXX,XX +XXX,XX @@ vfwmsac_vv      111110 . ..... ..... 001 ..... 1010111 @r_vm
- vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
- vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
- vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
-+vfsqrt_v        100011 . ..... 00000 001 ..... 1010111 @r2_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_WIDEN_TRANS(vfwmacc_vf)
- GEN_OPFVF_WIDEN_TRANS(vfwnmacc_vf)
- GEN_OPFVF_WIDEN_TRANS(vfwmsac_vf)
- GEN_OPFVF_WIDEN_TRANS(vfwnmsac_vf)
-+
-+/* Vector Floating-Point Square-Root Instruction */
-+
-+/*
-+ * If the current SEW does not correspond to a supported IEEE floating-point
-+ * type, an illegal instruction exception is raised
-+ */
-+static bool opfv_check(DisasContext *s, arg_rmr *a)
-+{
-+   return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            (s->sew != 0));
-+}
-+
-+#define GEN_OPFV_TRANS(NAME, CHECK)                                \
-+static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
-+{                                                                  \
-+    if (CHECK(s, a)) {                                             \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_3_ptr * const fns[3] = {            \
-+            gen_helper_##NAME##_h,                                 \
-+            gen_helper_##NAME##_w,                                 \
-+            gen_helper_##NAME##_d,                                 \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        gen_set_rm(s, 7);                                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew - 1]);    \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+
-+GEN_OPFV_TRANS(vfsqrt_v, opfv_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF3, vfwnmsac_vf_h, WOP_UUU_H, H4, H2, fwnmsac16)
- RVVCALL(OPFVF3, vfwnmsac_vf_w, WOP_UUU_W, H8, H4, fwnmsac32)
- GEN_VEXT_VF(vfwnmsac_vf_h, 2, 4, clearl)
- GEN_VEXT_VF(vfwnmsac_vf_w, 4, 8, clearq)
-+
-+/* Vector Floating-Point Square-Root Instruction */
-+/* (TD, T2, TX2) */
-+#define OP_UU_H uint16_t, uint16_t, uint16_t
-+#define OP_UU_W uint32_t, uint32_t, uint32_t
-+#define OP_UU_D uint64_t, uint64_t, uint64_t
-+
-+#define OPFVV1(NAME, TD, T2, TX2, HD, HS2, OP)        \
-+static void do_##NAME(void *vd, void *vs2, int i,      \
-+        CPURISCVState *env)                            \
-+{                                                      \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
-+    *((TD *)vd + HD(i)) = OP(s2, &env->fp_status);     \
-+}
-+
-+#define GEN_VEXT_V_ENV(NAME, ESZ, DSZ, CLEAR_FN)       \
-+void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
-+        CPURISCVState *env, uint32_t desc)             \
-+{                                                      \
-+    uint32_t vlmax = vext_maxsz(desc) / ESZ;           \
-+    uint32_t mlen = vext_mlen(desc);                   \
-+    uint32_t vm = vext_vm(desc);                       \
-+    uint32_t vl = env->vl;                             \
-+    uint32_t i;                                        \
-+                                                       \
-+    if (vl == 0) {                                     \
-+        return;                                        \
-+    }                                                  \
-+    for (i = 0; i < vl; i++) {                         \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {     \
-+            continue;                                  \
-+        }                                              \
-+        do_##NAME(vd, vs2, i, env);                    \
-+    }                                                  \
-+    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);          \
-+}
-+
-+RVVCALL(OPFVV1, vfsqrt_v_h, OP_UU_H, H2, H2, float16_sqrt)
-+RVVCALL(OPFVV1, vfsqrt_v_w, OP_UU_W, H4, H4, float32_sqrt)
-+RVVCALL(OPFVV1, vfsqrt_v_d, OP_UU_D, H8, H8, float64_sqrt)
-+GEN_VEXT_V_ENV(vfsqrt_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfsqrt_v_w, 4, 4, clearl)
-+GEN_VEXT_V_ENV(vfsqrt_v_d, 8, 8, clearq)
---
-.27.0

-[PULL 40/63] target/riscv: vector floating-point sign-injection instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-39-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 19 ++++++
- target/riscv/insn32.decode              |  6 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  8 +++
- target/riscv/vector_helper.c            | 85 +++++++++++++++++++++++++
-files changed, 118 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfmin_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfmax_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfmax_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfmax_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfsgnj_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnj_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnj_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjn_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjn_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjn_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjx_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjx_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjx_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnj_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnj_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnj_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjn_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjn_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjn_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjx_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjx_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfsgnjx_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfmin_vv        000100 . ..... ..... 001 ..... 1010111 @r_vm
- vfmin_vf        000100 . ..... ..... 101 ..... 1010111 @r_vm
- vfmax_vv        000110 . ..... ..... 001 ..... 1010111 @r_vm
- vfmax_vf        000110 . ..... ..... 101 ..... 1010111 @r_vm
-+vfsgnj_vv       001000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfsgnj_vf       001000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfsgnjn_vv      001001 . ..... ..... 001 ..... 1010111 @r_vm
-+vfsgnjn_vf      001001 . ..... ..... 101 ..... 1010111 @r_vm
-+vfsgnjx_vv      001010 . ..... ..... 001 ..... 1010111 @r_vm
-+vfsgnjx_vf      001010 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfmin_vv, opfvv_check)
- GEN_OPFVV_TRANS(vfmax_vv, opfvv_check)
- GEN_OPFVF_TRANS(vfmin_vf, opfvf_check)
- GEN_OPFVF_TRANS(vfmax_vf, opfvf_check)
-+
-+/* Vector Floating-Point Sign-Injection Instructions */
-+GEN_OPFVV_TRANS(vfsgnj_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfsgnjn_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfsgnjx_vv, opfvv_check)
-+GEN_OPFVF_TRANS(vfsgnj_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfsgnjn_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfsgnjx_vf, opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfmax_vf_d, OP_UUU_D, H8, H8, float64_maxnum)
- GEN_VEXT_VF(vfmax_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfmax_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfmax_vf_d, 8, 8, clearq)
-+
-+/* Vector Floating-Point Sign-Injection Instructions */
-+static uint16_t fsgnj16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return deposit64(b, 0, 15, a);
-+}
-+
-+static uint32_t fsgnj32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return deposit64(b, 0, 31, a);
-+}
-+
-+static uint64_t fsgnj64(uint64_t a, uint64_t b, float_status *s)
-+{
-+    return deposit64(b, 0, 63, a);
-+}
-+
-+RVVCALL(OPFVV2, vfsgnj_vv_h, OP_UUU_H, H2, H2, H2, fsgnj16)
-+RVVCALL(OPFVV2, vfsgnj_vv_w, OP_UUU_W, H4, H4, H4, fsgnj32)
-+RVVCALL(OPFVV2, vfsgnj_vv_d, OP_UUU_D, H8, H8, H8, fsgnj64)
-+GEN_VEXT_VV_ENV(vfsgnj_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfsgnj_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfsgnj_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfsgnj_vf_h, OP_UUU_H, H2, H2, fsgnj16)
-+RVVCALL(OPFVF2, vfsgnj_vf_w, OP_UUU_W, H4, H4, fsgnj32)
-+RVVCALL(OPFVF2, vfsgnj_vf_d, OP_UUU_D, H8, H8, fsgnj64)
-+GEN_VEXT_VF(vfsgnj_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfsgnj_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfsgnj_vf_d, 8, 8, clearq)
-+
-+static uint16_t fsgnjn16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return deposit64(~b, 0, 15, a);
-+}
-+
-+static uint32_t fsgnjn32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return deposit64(~b, 0, 31, a);
-+}
-+
-+static uint64_t fsgnjn64(uint64_t a, uint64_t b, float_status *s)
-+{
-+    return deposit64(~b, 0, 63, a);
-+}
-+
-+RVVCALL(OPFVV2, vfsgnjn_vv_h, OP_UUU_H, H2, H2, H2, fsgnjn16)
-+RVVCALL(OPFVV2, vfsgnjn_vv_w, OP_UUU_W, H4, H4, H4, fsgnjn32)
-+RVVCALL(OPFVV2, vfsgnjn_vv_d, OP_UUU_D, H8, H8, H8, fsgnjn64)
-+GEN_VEXT_VV_ENV(vfsgnjn_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfsgnjn_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfsgnjn_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfsgnjn_vf_h, OP_UUU_H, H2, H2, fsgnjn16)
-+RVVCALL(OPFVF2, vfsgnjn_vf_w, OP_UUU_W, H4, H4, fsgnjn32)
-+RVVCALL(OPFVF2, vfsgnjn_vf_d, OP_UUU_D, H8, H8, fsgnjn64)
-+GEN_VEXT_VF(vfsgnjn_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfsgnjn_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfsgnjn_vf_d, 8, 8, clearq)
-+
-+static uint16_t fsgnjx16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return deposit64(b ^ a, 0, 15, a);
-+}
-+
-+static uint32_t fsgnjx32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return deposit64(b ^ a, 0, 31, a);
-+}
-+
-+static uint64_t fsgnjx64(uint64_t a, uint64_t b, float_status *s)
-+{
-+    return deposit64(b ^ a, 0, 63, a);
-+}
-+
-+RVVCALL(OPFVV2, vfsgnjx_vv_h, OP_UUU_H, H2, H2, H2, fsgnjx16)
-+RVVCALL(OPFVV2, vfsgnjx_vv_w, OP_UUU_W, H4, H4, H4, fsgnjx32)
-+RVVCALL(OPFVV2, vfsgnjx_vv_d, OP_UUU_D, H8, H8, H8, fsgnjx64)
-+GEN_VEXT_VV_ENV(vfsgnjx_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfsgnjx_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfsgnjx_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfsgnjx_vf_h, OP_UUU_H, H2, H2, fsgnjx16)
-+RVVCALL(OPFVF2, vfsgnjx_vf_w, OP_UUU_W, H4, H4, fsgnjx32)
-+RVVCALL(OPFVF2, vfsgnjx_vf_d, OP_UUU_D, H8, H8, fsgnjx64)
-+GEN_VEXT_VF(vfsgnjx_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfsgnjx_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfsgnjx_vf_d, 8, 8, clearq)
---
-.27.0

-[PULL 41/63] target/riscv: vector floating-point compare instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-40-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  37 +++++
- target/riscv/insn32.decode              |  12 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  35 +++++
- target/riscv/vector_helper.c            | 174 ++++++++++++++++++++++++
-files changed, 258 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfsgnjn_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfsgnjx_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfsgnjx_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfsgnjx_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vmfeq_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfeq_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfeq_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfne_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfne_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfne_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmflt_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmflt_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmflt_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfle_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfle_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfle_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmfeq_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfeq_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfeq_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfne_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfne_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfne_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmflt_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmflt_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmflt_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfle_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfle_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfle_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfgt_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfgt_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfgt_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfge_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfge_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmfge_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmford_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmford_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmford_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmford_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmford_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfsgnjn_vv      001001 . ..... ..... 001 ..... 1010111 @r_vm
- vfsgnjn_vf      001001 . ..... ..... 101 ..... 1010111 @r_vm
- vfsgnjx_vv      001010 . ..... ..... 001 ..... 1010111 @r_vm
- vfsgnjx_vf      001010 . ..... ..... 101 ..... 1010111 @r_vm
-+vmfeq_vv        011000 . ..... ..... 001 ..... 1010111 @r_vm
-+vmfeq_vf        011000 . ..... ..... 101 ..... 1010111 @r_vm
-+vmfne_vv        011100 . ..... ..... 001 ..... 1010111 @r_vm
-+vmfne_vf        011100 . ..... ..... 101 ..... 1010111 @r_vm
-+vmflt_vv        011011 . ..... ..... 001 ..... 1010111 @r_vm
-+vmflt_vf        011011 . ..... ..... 101 ..... 1010111 @r_vm
-+vmfle_vv        011001 . ..... ..... 001 ..... 1010111 @r_vm
-+vmfle_vf        011001 . ..... ..... 101 ..... 1010111 @r_vm
-+vmfgt_vf        011101 . ..... ..... 101 ..... 1010111 @r_vm
-+vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
-+vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
-+vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfsgnjx_vv, opfvv_check)
- GEN_OPFVF_TRANS(vfsgnj_vf, opfvf_check)
- GEN_OPFVF_TRANS(vfsgnjn_vf, opfvf_check)
- GEN_OPFVF_TRANS(vfsgnjx_vf, opfvf_check)
-+
-+/* Vector Floating-Point Compare Instructions */
-+static bool opfvv_cmp_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            (s->sew != 0) &&
-+            ((vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
-+              vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul)) ||
-+             (s->lmul == 0)));
-+}
-+
-+GEN_OPFVV_TRANS(vmfeq_vv, opfvv_cmp_check)
-+GEN_OPFVV_TRANS(vmfne_vv, opfvv_cmp_check)
-+GEN_OPFVV_TRANS(vmflt_vv, opfvv_cmp_check)
-+GEN_OPFVV_TRANS(vmfle_vv, opfvv_cmp_check)
-+GEN_OPFVV_TRANS(vmford_vv, opfvv_cmp_check)
-+
-+static bool opfvf_cmp_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            (s->sew != 0) &&
-+            (vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul) ||
-+             (s->lmul == 0)));
-+}
-+
-+GEN_OPFVF_TRANS(vmfeq_vf, opfvf_cmp_check)
-+GEN_OPFVF_TRANS(vmfne_vf, opfvf_cmp_check)
-+GEN_OPFVF_TRANS(vmflt_vf, opfvf_cmp_check)
-+GEN_OPFVF_TRANS(vmfle_vf, opfvf_cmp_check)
-+GEN_OPFVF_TRANS(vmfgt_vf, opfvf_cmp_check)
-+GEN_OPFVF_TRANS(vmfge_vf, opfvf_cmp_check)
-+GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfsgnjx_vf_d, OP_UUU_D, H8, H8, fsgnjx64)
- GEN_VEXT_VF(vfsgnjx_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfsgnjx_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfsgnjx_vf_d, 8, 8, clearq)
-+
-+/* Vector Floating-Point Compare Instructions */
-+#define GEN_VEXT_CMP_VV_ENV(NAME, ETYPE, H, DO_OP)            \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)          \
-+{                                                             \
-+    uint32_t mlen = vext_mlen(desc);                          \
-+    uint32_t vm = vext_vm(desc);                              \
-+    uint32_t vl = env->vl;                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
-+    uint32_t i;                                               \
-+                                                              \
-+    for (i = 0; i < vl; i++) {                                \
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {            \
-+            continue;                                         \
-+        }                                                     \
-+        vext_set_elem_mask(vd, mlen, i,                       \
-+                           DO_OP(s2, s1, &env->fp_status));   \
-+    }                                                         \
-+    for (; i < vlmax; i++) {                                  \
-+        vext_set_elem_mask(vd, mlen, i, 0);                   \
-+    }                                                         \
-+}
-+
-+static bool float16_eq_quiet(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare_quiet(a, b, s);
-+    return compare == float_relation_equal;
-+}
-+
-+GEN_VEXT_CMP_VV_ENV(vmfeq_vv_h, uint16_t, H2, float16_eq_quiet)
-+GEN_VEXT_CMP_VV_ENV(vmfeq_vv_w, uint32_t, H4, float32_eq_quiet)
-+GEN_VEXT_CMP_VV_ENV(vmfeq_vv_d, uint64_t, H8, float64_eq_quiet)
-+
-+#define GEN_VEXT_CMP_VF(NAME, ETYPE, H, DO_OP)                      \
-+void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2,       \
-+                  CPURISCVState *env, uint32_t desc)                \
-+{                                                                   \
-+    uint32_t mlen = vext_mlen(desc);                                \
-+    uint32_t vm = vext_vm(desc);                                    \
-+    uint32_t vl = env->vl;                                          \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);              \
-+    uint32_t i;                                                     \
-+                                                                    \
-+    for (i = 0; i < vl; i++) {                                      \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                          \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                  \
-+            continue;                                               \
-+        }                                                           \
-+        vext_set_elem_mask(vd, mlen, i,                             \
-+                           DO_OP(s2, (ETYPE)s1, &env->fp_status));  \
-+    }                                                               \
-+    for (; i < vlmax; i++) {                                        \
-+        vext_set_elem_mask(vd, mlen, i, 0);                         \
-+    }                                                               \
-+}
-+
-+GEN_VEXT_CMP_VF(vmfeq_vf_h, uint16_t, H2, float16_eq_quiet)
-+GEN_VEXT_CMP_VF(vmfeq_vf_w, uint32_t, H4, float32_eq_quiet)
-+GEN_VEXT_CMP_VF(vmfeq_vf_d, uint64_t, H8, float64_eq_quiet)
-+
-+static bool vmfne16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare_quiet(a, b, s);
-+    return compare != float_relation_equal;
-+}
-+
-+static bool vmfne32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    FloatRelation compare = float32_compare_quiet(a, b, s);
-+    return compare != float_relation_equal;
-+}
-+
-+static bool vmfne64(uint64_t a, uint64_t b, float_status *s)
-+{
-+    FloatRelation compare = float64_compare_quiet(a, b, s);
-+    return compare != float_relation_equal;
-+}
-+
-+GEN_VEXT_CMP_VV_ENV(vmfne_vv_h, uint16_t, H2, vmfne16)
-+GEN_VEXT_CMP_VV_ENV(vmfne_vv_w, uint32_t, H4, vmfne32)
-+GEN_VEXT_CMP_VV_ENV(vmfne_vv_d, uint64_t, H8, vmfne64)
-+GEN_VEXT_CMP_VF(vmfne_vf_h, uint16_t, H2, vmfne16)
-+GEN_VEXT_CMP_VF(vmfne_vf_w, uint32_t, H4, vmfne32)
-+GEN_VEXT_CMP_VF(vmfne_vf_d, uint64_t, H8, vmfne64)
-+
-+static bool float16_lt(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare(a, b, s);
-+    return compare == float_relation_less;
-+}
-+
-+GEN_VEXT_CMP_VV_ENV(vmflt_vv_h, uint16_t, H2, float16_lt)
-+GEN_VEXT_CMP_VV_ENV(vmflt_vv_w, uint32_t, H4, float32_lt)
-+GEN_VEXT_CMP_VV_ENV(vmflt_vv_d, uint64_t, H8, float64_lt)
-+GEN_VEXT_CMP_VF(vmflt_vf_h, uint16_t, H2, float16_lt)
-+GEN_VEXT_CMP_VF(vmflt_vf_w, uint32_t, H4, float32_lt)
-+GEN_VEXT_CMP_VF(vmflt_vf_d, uint64_t, H8, float64_lt)
-+
-+static bool float16_le(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare(a, b, s);
-+    return compare == float_relation_less ||
-+           compare == float_relation_equal;
-+}
-+
-+GEN_VEXT_CMP_VV_ENV(vmfle_vv_h, uint16_t, H2, float16_le)
-+GEN_VEXT_CMP_VV_ENV(vmfle_vv_w, uint32_t, H4, float32_le)
-+GEN_VEXT_CMP_VV_ENV(vmfle_vv_d, uint64_t, H8, float64_le)
-+GEN_VEXT_CMP_VF(vmfle_vf_h, uint16_t, H2, float16_le)
-+GEN_VEXT_CMP_VF(vmfle_vf_w, uint32_t, H4, float32_le)
-+GEN_VEXT_CMP_VF(vmfle_vf_d, uint64_t, H8, float64_le)
-+
-+static bool vmfgt16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare(a, b, s);
-+    return compare == float_relation_greater;
-+}
-+
-+static bool vmfgt32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    FloatRelation compare = float32_compare(a, b, s);
-+    return compare == float_relation_greater;
-+}
-+
-+static bool vmfgt64(uint64_t a, uint64_t b, float_status *s)
-+{
-+    FloatRelation compare = float64_compare(a, b, s);
-+    return compare == float_relation_greater;
-+}
-+
-+GEN_VEXT_CMP_VF(vmfgt_vf_h, uint16_t, H2, vmfgt16)
-+GEN_VEXT_CMP_VF(vmfgt_vf_w, uint32_t, H4, vmfgt32)
-+GEN_VEXT_CMP_VF(vmfgt_vf_d, uint64_t, H8, vmfgt64)
-+
-+static bool vmfge16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare(a, b, s);
-+    return compare == float_relation_greater ||
-+           compare == float_relation_equal;
-+}
-+
-+static bool vmfge32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    FloatRelation compare = float32_compare(a, b, s);
-+    return compare == float_relation_greater ||
-+           compare == float_relation_equal;
-+}
-+
-+static bool vmfge64(uint64_t a, uint64_t b, float_status *s)
-+{
-+    FloatRelation compare = float64_compare(a, b, s);
-+    return compare == float_relation_greater ||
-+           compare == float_relation_equal;
-+}
-+
-+GEN_VEXT_CMP_VF(vmfge_vf_h, uint16_t, H2, vmfge16)
-+GEN_VEXT_CMP_VF(vmfge_vf_w, uint32_t, H4, vmfge32)
-+GEN_VEXT_CMP_VF(vmfge_vf_d, uint64_t, H8, vmfge64)
-+
-+static bool float16_unordered_quiet(uint16_t a, uint16_t b, float_status *s)
-+{
-+    FloatRelation compare = float16_compare_quiet(a, b, s);
-+    return compare == float_relation_unordered;
-+}
-+
-+GEN_VEXT_CMP_VV_ENV(vmford_vv_h, uint16_t, H2, !float16_unordered_quiet)
-+GEN_VEXT_CMP_VV_ENV(vmford_vv_w, uint32_t, H4, !float32_unordered_quiet)
-+GEN_VEXT_CMP_VV_ENV(vmford_vv_d, uint64_t, H8, !float64_unordered_quiet)
-+GEN_VEXT_CMP_VF(vmford_vf_h, uint16_t, H2, !float16_unordered_quiet)
-+GEN_VEXT_CMP_VF(vmford_vf_w, uint32_t, H4, !float32_unordered_quiet)
-+GEN_VEXT_CMP_VF(vmford_vf_d, uint64_t, H8, !float64_unordered_quiet)
---
-.27.0

-[PULL 43/63] target/riscv: vector floating-point merge instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-42-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  4 +++
- target/riscv/insn32.decode              |  2 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 38 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 24 ++++++++++++++++
-files changed, 68 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_5(vfclass_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfclass_v_w, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_6(vfmerge_vfm_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmerge_vfm_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmerge_vfm_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
- vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
- vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
- vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
-+vfmerge_vfm     010111 0 ..... ..... 101 ..... 1010111 @r_vm_0
-+vfmv_v_f        010111 1 00000 ..... 101 ..... 1010111 @r2
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
- /* Vector Floating-Point Classify Instruction */
- GEN_OPFV_TRANS(vfclass_v, opfv_check)
-+
-+/* Vector Floating-Point Merge Instruction */
-+GEN_OPFVF_TRANS(vfmerge_vfm,  opfvf_check)
-+
-+static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
-+{
-+    if (vext_check_isa_ill(s) &&
-+        vext_check_reg(s, a->rd, false) &&
-+        (s->sew != 0)) {
-+
-+        if (s->vl_eq_vlmax) {
-+            tcg_gen_gvec_dup_i64(s->sew, vreg_ofs(s, a->rd),
-+                                 MAXSZ(s), MAXSZ(s), cpu_fpr[a->rs1]);
-+        } else {
-+            TCGv_ptr dest;
-+            TCGv_i32 desc;
-+            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
-+            static gen_helper_vmv_vx * const fns[3] = {
-+                gen_helper_vmv_v_x_h,
-+                gen_helper_vmv_v_x_w,
-+                gen_helper_vmv_v_x_d,
-+            };
-+            TCGLabel *over = gen_new_label();
-+            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+            dest = tcg_temp_new_ptr();
-+            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
-+            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
-+            fns[s->sew - 1](dest, cpu_fpr[a->rs1], cpu_env, desc);
-+
-+            tcg_temp_free_ptr(dest);
-+            tcg_temp_free_i32(desc);
-+            gen_set_label(over);
-+        }
-+        return true;
-+    }
-+    return false;
-+}
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV1, vfclass_v_d, OP_UU_D, H8, H8, fclass_d)
- GEN_VEXT_V(vfclass_v_h, 2, 2, clearh)
- GEN_VEXT_V(vfclass_v_w, 4, 4, clearl)
- GEN_VEXT_V(vfclass_v_d, 8, 8, clearq)
-+
-+/* Vector Floating-Point Merge Instruction */
-+#define GEN_VFMERGE_VF(NAME, ETYPE, H, CLEAR_FN)              \
-+void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2, \
-+                  CPURISCVState *env, uint32_t desc)          \
-+{                                                             \
-+    uint32_t mlen = vext_mlen(desc);                          \
-+    uint32_t vm = vext_vm(desc);                              \
-+    uint32_t vl = env->vl;                                    \
-+    uint32_t esz = sizeof(ETYPE);                             \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                  \
-+    uint32_t i;                                               \
-+                                                              \
-+    for (i = 0; i < vl; i++) {                                \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        *((ETYPE *)vd + H(i))                                 \
-+          = (!vm && !vext_elem_mask(v0, mlen, i) ? s2 : s1);  \
-+    }                                                         \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                  \
-+}
-+
-+GEN_VFMERGE_VF(vfmerge_vfm_h, int16_t, H2, clearh)
-+GEN_VFMERGE_VF(vfmerge_vfm_w, int32_t, H4, clearl)
-+GEN_VFMERGE_VF(vfmerge_vfm_d, int64_t, H8, clearq)
---
-.27.0

-[PULL 44/63] target/riscv: vector floating-point/integer type-convert instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-43-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 13 ++++++++++
- target/riscv/insn32.decode              |  4 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  6 +++++
- target/riscv/vector_helper.c            | 33 +++++++++++++++++++++++++
-files changed, 56 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfmerge_vfm_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfmerge_vfm_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfmerge_vfm_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_5(vfcvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_xu_f_v_d, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_x_f_v_d, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_f_xu_v_d, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_f_x_v_d, void, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
- vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
- vfmerge_vfm     010111 0 ..... ..... 101 ..... 1010111 @r_vm_0
- vfmv_v_f        010111 1 00000 ..... 101 ..... 1010111 @r2
-+vfcvt_xu_f_v    100010 . ..... 00000 001 ..... 1010111 @r2_vm
-+vfcvt_x_f_v     100010 . ..... 00001 001 ..... 1010111 @r2_vm
-+vfcvt_f_xu_v    100010 . ..... 00010 001 ..... 1010111 @r2_vm
-+vfcvt_f_x_v     100010 . ..... 00011 001 ..... 1010111 @r2_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
-     }
-     return false;
- }
-+
-+/* Single-Width Floating-Point/Integer Type-Convert Instructions */
-+GEN_OPFV_TRANS(vfcvt_xu_f_v, opfv_check)
-+GEN_OPFV_TRANS(vfcvt_x_f_v, opfv_check)
-+GEN_OPFV_TRANS(vfcvt_f_xu_v, opfv_check)
-+GEN_OPFV_TRANS(vfcvt_f_x_v, opfv_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2, \
- GEN_VFMERGE_VF(vfmerge_vfm_h, int16_t, H2, clearh)
- GEN_VFMERGE_VF(vfmerge_vfm_w, int32_t, H4, clearl)
- GEN_VFMERGE_VF(vfmerge_vfm_d, int64_t, H8, clearq)
-+
-+/* Single-Width Floating-Point/Integer Type-Convert Instructions */
-+/* vfcvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. */
-+RVVCALL(OPFVV1, vfcvt_xu_f_v_h, OP_UU_H, H2, H2, float16_to_uint16)
-+RVVCALL(OPFVV1, vfcvt_xu_f_v_w, OP_UU_W, H4, H4, float32_to_uint32)
-+RVVCALL(OPFVV1, vfcvt_xu_f_v_d, OP_UU_D, H8, H8, float64_to_uint64)
-+GEN_VEXT_V_ENV(vfcvt_xu_f_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfcvt_xu_f_v_w, 4, 4, clearl)
-+GEN_VEXT_V_ENV(vfcvt_xu_f_v_d, 8, 8, clearq)
-+
-+/* vfcvt.x.f.v vd, vs2, vm # Convert float to signed integer. */
-+RVVCALL(OPFVV1, vfcvt_x_f_v_h, OP_UU_H, H2, H2, float16_to_int16)
-+RVVCALL(OPFVV1, vfcvt_x_f_v_w, OP_UU_W, H4, H4, float32_to_int32)
-+RVVCALL(OPFVV1, vfcvt_x_f_v_d, OP_UU_D, H8, H8, float64_to_int64)
-+GEN_VEXT_V_ENV(vfcvt_x_f_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfcvt_x_f_v_w, 4, 4, clearl)
-+GEN_VEXT_V_ENV(vfcvt_x_f_v_d, 8, 8, clearq)
-+
-+/* vfcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to float. */
-+RVVCALL(OPFVV1, vfcvt_f_xu_v_h, OP_UU_H, H2, H2, uint16_to_float16)
-+RVVCALL(OPFVV1, vfcvt_f_xu_v_w, OP_UU_W, H4, H4, uint32_to_float32)
-+RVVCALL(OPFVV1, vfcvt_f_xu_v_d, OP_UU_D, H8, H8, uint64_to_float64)
-+GEN_VEXT_V_ENV(vfcvt_f_xu_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfcvt_f_xu_v_w, 4, 4, clearl)
-+GEN_VEXT_V_ENV(vfcvt_f_xu_v_d, 8, 8, clearq)
-+
-+/* vfcvt.f.x.v vd, vs2, vm # Convert integer to float. */
-+RVVCALL(OPFVV1, vfcvt_f_x_v_h, OP_UU_H, H2, H2, int16_to_float16)
-+RVVCALL(OPFVV1, vfcvt_f_x_v_w, OP_UU_W, H4, H4, int32_to_float32)
-+RVVCALL(OPFVV1, vfcvt_f_x_v_d, OP_UU_D, H8, H8, int64_to_float64)
-+GEN_VEXT_V_ENV(vfcvt_f_x_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfcvt_f_x_v_w, 4, 4, clearl)
-+GEN_VEXT_V_ENV(vfcvt_f_x_v_d, 8, 8, clearq)
---
-.27.0

-[PULL 45/63] target/riscv: widening floating-point/integer type-convert instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-44-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 11 ++++++
- target/riscv/insn32.decode              |  5 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 48 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 42 ++++++++++++++++++++++
-files changed, 106 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfcvt_f_xu_v_d, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfcvt_f_x_v_d, void, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_5(vfwcvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfcvt_xu_f_v    100010 . ..... 00000 001 ..... 1010111 @r2_vm
- vfcvt_x_f_v     100010 . ..... 00001 001 ..... 1010111 @r2_vm
- vfcvt_f_xu_v    100010 . ..... 00010 001 ..... 1010111 @r2_vm
- vfcvt_f_x_v     100010 . ..... 00011 001 ..... 1010111 @r2_vm
-+vfwcvt_xu_f_v   100010 . ..... 01000 001 ..... 1010111 @r2_vm
-+vfwcvt_x_f_v    100010 . ..... 01001 001 ..... 1010111 @r2_vm
-+vfwcvt_f_xu_v   100010 . ..... 01010 001 ..... 1010111 @r2_vm
-+vfwcvt_f_x_v    100010 . ..... 01011 001 ..... 1010111 @r2_vm
-+vfwcvt_f_f_v    100010 . ..... 01100 001 ..... 1010111 @r2_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFV_TRANS(vfcvt_xu_f_v, opfv_check)
- GEN_OPFV_TRANS(vfcvt_x_f_v, opfv_check)
- GEN_OPFV_TRANS(vfcvt_f_xu_v, opfv_check)
- GEN_OPFV_TRANS(vfcvt_f_x_v, opfv_check)
-+
-+/* Widening Floating-Point/Integer Type-Convert Instructions */
-+
-+/*
-+ * If the current SEW does not correspond to a supported IEEE floating-point
-+ * type, an illegal instruction exception is raised
-+ */
-+static bool opfv_widen_check(DisasContext *s, arg_rmr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+#define GEN_OPFV_WIDEN_TRANS(NAME)                                 \
-+static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
-+{                                                                  \
-+    if (opfv_widen_check(s, a)) {                                  \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_3_ptr * const fns[2] = {            \
-+            gen_helper_##NAME##_h,                                 \
-+            gen_helper_##NAME##_w,                                 \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        gen_set_rm(s, 7);                                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew - 1]);    \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_xu_f_v)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_f_xu_v)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_f_x_v)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfcvt_f_x_v_d, OP_UU_D, H8, H8, int64_to_float64)
- GEN_VEXT_V_ENV(vfcvt_f_x_v_h, 2, 2, clearh)
- GEN_VEXT_V_ENV(vfcvt_f_x_v_w, 4, 4, clearl)
- GEN_VEXT_V_ENV(vfcvt_f_x_v_d, 8, 8, clearq)
-+
-+/* Widening Floating-Point/Integer Type-Convert Instructions */
-+/* (TD, T2, TX2) */
-+#define WOP_UU_H uint32_t, uint16_t, uint16_t
-+#define WOP_UU_W uint64_t, uint32_t, uint32_t
-+/* vfwcvt.xu.f.v vd, vs2, vm # Convert float to double-width unsigned integer.*/
-+RVVCALL(OPFVV1, vfwcvt_xu_f_v_h, WOP_UU_H, H4, H2, float16_to_uint32)
-+RVVCALL(OPFVV1, vfwcvt_xu_f_v_w, WOP_UU_W, H8, H4, float32_to_uint64)
-+GEN_VEXT_V_ENV(vfwcvt_xu_f_v_h, 2, 4, clearl)
-+GEN_VEXT_V_ENV(vfwcvt_xu_f_v_w, 4, 8, clearq)
-+
-+/* vfwcvt.x.f.v vd, vs2, vm # Convert float to double-width signed integer. */
-+RVVCALL(OPFVV1, vfwcvt_x_f_v_h, WOP_UU_H, H4, H2, float16_to_int32)
-+RVVCALL(OPFVV1, vfwcvt_x_f_v_w, WOP_UU_W, H8, H4, float32_to_int64)
-+GEN_VEXT_V_ENV(vfwcvt_x_f_v_h, 2, 4, clearl)
-+GEN_VEXT_V_ENV(vfwcvt_x_f_v_w, 4, 8, clearq)
-+
-+/* vfwcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to double-width float */
-+RVVCALL(OPFVV1, vfwcvt_f_xu_v_h, WOP_UU_H, H4, H2, uint16_to_float32)
-+RVVCALL(OPFVV1, vfwcvt_f_xu_v_w, WOP_UU_W, H8, H4, uint32_to_float64)
-+GEN_VEXT_V_ENV(vfwcvt_f_xu_v_h, 2, 4, clearl)
-+GEN_VEXT_V_ENV(vfwcvt_f_xu_v_w, 4, 8, clearq)
-+
-+/* vfwcvt.f.x.v vd, vs2, vm # Convert integer to double-width float. */
-+RVVCALL(OPFVV1, vfwcvt_f_x_v_h, WOP_UU_H, H4, H2, int16_to_float32)
-+RVVCALL(OPFVV1, vfwcvt_f_x_v_w, WOP_UU_W, H8, H4, int32_to_float64)
-+GEN_VEXT_V_ENV(vfwcvt_f_x_v_h, 2, 4, clearl)
-+GEN_VEXT_V_ENV(vfwcvt_f_x_v_w, 4, 8, clearq)
-+
-+/*
-+ * vfwcvt.f.f.v vd, vs2, vm #
-+ * Convert single-width float to double-width float.
-+ */
-+static uint32_t vfwcvtffv16(uint16_t a, float_status *s)
-+{
-+    return float16_to_float32(a, true, s);
-+}
-+
-+RVVCALL(OPFVV1, vfwcvt_f_f_v_h, WOP_UU_H, H4, H2, vfwcvtffv16)
-+RVVCALL(OPFVV1, vfwcvt_f_f_v_w, WOP_UU_W, H8, H4, float32_to_float64)
-+GEN_VEXT_V_ENV(vfwcvt_f_f_v_h, 2, 4, clearl)
-+GEN_VEXT_V_ENV(vfwcvt_f_f_v_w, 4, 8, clearq)
---
-.27.0

-[PULL 46/63] target/riscv: narrowing floating-point/integer type-convert instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-45-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 11 ++++++
- target/riscv/insn32.decode              |  5 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 48 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 39 ++++++++++++++++++++
-files changed, 103 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfwcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfwcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfwcvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfwcvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_5(vfncvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfwcvt_x_f_v    100010 . ..... 01001 001 ..... 1010111 @r2_vm
- vfwcvt_f_xu_v   100010 . ..... 01010 001 ..... 1010111 @r2_vm
- vfwcvt_f_x_v    100010 . ..... 01011 001 ..... 1010111 @r2_vm
- vfwcvt_f_f_v    100010 . ..... 01100 001 ..... 1010111 @r2_vm
-+vfncvt_xu_f_v   100010 . ..... 10000 001 ..... 1010111 @r2_vm
-+vfncvt_x_f_v    100010 . ..... 10001 001 ..... 1010111 @r2_vm
-+vfncvt_f_xu_v   100010 . ..... 10010 001 ..... 1010111 @r2_vm
-+vfncvt_f_x_v    100010 . ..... 10011 001 ..... 1010111 @r2_vm
-+vfncvt_f_f_v    100010 . ..... 10100 001 ..... 1010111 @r2_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v)
- GEN_OPFV_WIDEN_TRANS(vfwcvt_f_xu_v)
- GEN_OPFV_WIDEN_TRANS(vfwcvt_f_x_v)
- GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v)
-+
-+/* Narrowing Floating-Point/Integer Type-Convert Instructions */
-+
-+/*
-+ * If the current SEW does not correspond to a supported IEEE floating-point
-+ * type, an illegal instruction exception is raised
-+ */
-+static bool opfv_narrow_check(DisasContext *s, arg_rmr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
-+                                     2 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+#define GEN_OPFV_NARROW_TRANS(NAME)                                \
-+static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
-+{                                                                  \
-+    if (opfv_narrow_check(s, a)) {                                 \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_3_ptr * const fns[2] = {            \
-+            gen_helper_##NAME##_h,                                 \
-+            gen_helper_##NAME##_w,                                 \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        gen_set_rm(s, 7);                                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew - 1]);    \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+
-+GEN_OPFV_NARROW_TRANS(vfncvt_xu_f_v)
-+GEN_OPFV_NARROW_TRANS(vfncvt_x_f_v)
-+GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_v)
-+GEN_OPFV_NARROW_TRANS(vfncvt_f_x_v)
-+GEN_OPFV_NARROW_TRANS(vfncvt_f_f_v)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfwcvt_f_f_v_h, WOP_UU_H, H4, H2, vfwcvtffv16)
- RVVCALL(OPFVV1, vfwcvt_f_f_v_w, WOP_UU_W, H8, H4, float32_to_float64)
- GEN_VEXT_V_ENV(vfwcvt_f_f_v_h, 2, 4, clearl)
- GEN_VEXT_V_ENV(vfwcvt_f_f_v_w, 4, 8, clearq)
-+
-+/* Narrowing Floating-Point/Integer Type-Convert Instructions */
-+/* (TD, T2, TX2) */
-+#define NOP_UU_H uint16_t, uint32_t, uint32_t
-+#define NOP_UU_W uint32_t, uint64_t, uint64_t
-+/* vfncvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. */
-+RVVCALL(OPFVV1, vfncvt_xu_f_v_h, NOP_UU_H, H2, H4, float32_to_uint16)
-+RVVCALL(OPFVV1, vfncvt_xu_f_v_w, NOP_UU_W, H4, H8, float64_to_uint32)
-+GEN_VEXT_V_ENV(vfncvt_xu_f_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfncvt_xu_f_v_w, 4, 4, clearl)
-+
-+/* vfncvt.x.f.v vd, vs2, vm # Convert double-width float to signed integer. */
-+RVVCALL(OPFVV1, vfncvt_x_f_v_h, NOP_UU_H, H2, H4, float32_to_int16)
-+RVVCALL(OPFVV1, vfncvt_x_f_v_w, NOP_UU_W, H4, H8, float64_to_int32)
-+GEN_VEXT_V_ENV(vfncvt_x_f_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfncvt_x_f_v_w, 4, 4, clearl)
-+
-+/* vfncvt.f.xu.v vd, vs2, vm # Convert double-width unsigned integer to float */
-+RVVCALL(OPFVV1, vfncvt_f_xu_v_h, NOP_UU_H, H2, H4, uint32_to_float16)
-+RVVCALL(OPFVV1, vfncvt_f_xu_v_w, NOP_UU_W, H4, H8, uint64_to_float32)
-+GEN_VEXT_V_ENV(vfncvt_f_xu_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfncvt_f_xu_v_w, 4, 4, clearl)
-+
-+/* vfncvt.f.x.v vd, vs2, vm # Convert double-width integer to float. */
-+RVVCALL(OPFVV1, vfncvt_f_x_v_h, NOP_UU_H, H2, H4, int32_to_float16)
-+RVVCALL(OPFVV1, vfncvt_f_x_v_w, NOP_UU_W, H4, H8, int64_to_float32)
-+GEN_VEXT_V_ENV(vfncvt_f_x_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfncvt_f_x_v_w, 4, 4, clearl)
-+
-+/* vfncvt.f.f.v vd, vs2, vm # Convert double float to single-width float. */
-+static uint16_t vfncvtffv16(uint32_t a, float_status *s)
-+{
-+    return float32_to_float16(a, true, s);
-+}
-+
-+RVVCALL(OPFVV1, vfncvt_f_f_v_h, NOP_UU_H, H2, H4, vfncvtffv16)
-+RVVCALL(OPFVV1, vfncvt_f_f_v_w, NOP_UU_W, H4, H8, float64_to_float32)
-+GEN_VEXT_V_ENV(vfncvt_f_f_v_h, 2, 2, clearh)
-+GEN_VEXT_V_ENV(vfncvt_f_f_v_w, 4, 4, clearl)
---
-.27.0

-[PULL 47/63] target/riscv: vector single-width integer reduction instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-46-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 +++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 18 ++++++
- target/riscv/vector_helper.c            | 74 +++++++++++++++++++++++++
-files changed, 133 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfncvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfncvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfncvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfncvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_6(vredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredsum_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmaxu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmaxu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmaxu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmaxu_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmax_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmax_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmax_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredminu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredminu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredminu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredminu_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmin_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredand_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredand_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredand_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredand_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredxor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredxor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredxor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vredxor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfncvt_x_f_v    100010 . ..... 10001 001 ..... 1010111 @r2_vm
- vfncvt_f_xu_v   100010 . ..... 10010 001 ..... 1010111 @r2_vm
- vfncvt_f_x_v    100010 . ..... 10011 001 ..... 1010111 @r2_vm
- vfncvt_f_f_v    100010 . ..... 10100 001 ..... 1010111 @r2_vm
-+vredsum_vs      000000 . ..... ..... 010 ..... 1010111 @r_vm
-+vredand_vs      000001 . ..... ..... 010 ..... 1010111 @r_vm
-+vredor_vs       000010 . ..... ..... 010 ..... 1010111 @r_vm
-+vredxor_vs      000011 . ..... ..... 010 ..... 1010111 @r_vm
-+vredminu_vs     000100 . ..... ..... 010 ..... 1010111 @r_vm
-+vredmin_vs      000101 . ..... ..... 010 ..... 1010111 @r_vm
-+vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
-+vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFV_NARROW_TRANS(vfncvt_x_f_v)
- GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_v)
- GEN_OPFV_NARROW_TRANS(vfncvt_f_x_v)
- GEN_OPFV_NARROW_TRANS(vfncvt_f_f_v)
-+
-+/*
-+ *** Vector Reduction Operations
-+ */
-+/* Vector Single-Width Integer Reduction Instructions */
-+static bool reduction_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return vext_check_isa_ill(s) && vext_check_reg(s, a->rs2, false);
-+}
-+
-+GEN_OPIVV_TRANS(vredsum_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredmaxu_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredmax_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredminu_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredmin_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredand_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredor_vs, reduction_check)
-+GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfncvt_f_f_v_h, NOP_UU_H, H2, H4, vfncvtffv16)
- RVVCALL(OPFVV1, vfncvt_f_f_v_w, NOP_UU_W, H4, H8, float64_to_float32)
- GEN_VEXT_V_ENV(vfncvt_f_f_v_h, 2, 2, clearh)
- GEN_VEXT_V_ENV(vfncvt_f_f_v_w, 4, 4, clearl)
-+
-+/*
-+ *** Vector Reduction Operations
-+ */
-+/* Vector Single-Width Integer Reduction Instructions */
-+#define GEN_VEXT_RED(NAME, TD, TS2, HD, HS2, OP, CLEAR_FN)\
-+void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
-+        void *vs2, CPURISCVState *env, uint32_t desc)     \
-+{                                                         \
-+    uint32_t mlen = vext_mlen(desc);                      \
-+    uint32_t vm = vext_vm(desc);                          \
-+    uint32_t vl = env->vl;                                \
-+    uint32_t i;                                           \
-+    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;        \
-+    TD s1 =  *((TD *)vs1 + HD(0));                        \
-+                                                          \
-+    for (i = 0; i < vl; i++) {                            \
-+        TS2 s2 = *((TS2 *)vs2 + HS2(i));                  \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
-+            continue;                                     \
-+        }                                                 \
-+        s1 = OP(s1, (TD)s2);                              \
-+    }                                                     \
-+    *((TD *)vd + HD(0)) = s1;                             \
-+    CLEAR_FN(vd, 1, sizeof(TD), tot);                     \
-+}
-+
-+/* vd[0] = sum(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredsum_vs_b, int8_t, int8_t, H1, H1, DO_ADD, clearb)
-+GEN_VEXT_RED(vredsum_vs_h, int16_t, int16_t, H2, H2, DO_ADD, clearh)
-+GEN_VEXT_RED(vredsum_vs_w, int32_t, int32_t, H4, H4, DO_ADD, clearl)
-+GEN_VEXT_RED(vredsum_vs_d, int64_t, int64_t, H8, H8, DO_ADD, clearq)
-+
-+/* vd[0] = maxu(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredmaxu_vs_b, uint8_t, uint8_t, H1, H1, DO_MAX, clearb)
-+GEN_VEXT_RED(vredmaxu_vs_h, uint16_t, uint16_t, H2, H2, DO_MAX, clearh)
-+GEN_VEXT_RED(vredmaxu_vs_w, uint32_t, uint32_t, H4, H4, DO_MAX, clearl)
-+GEN_VEXT_RED(vredmaxu_vs_d, uint64_t, uint64_t, H8, H8, DO_MAX, clearq)
-+
-+/* vd[0] = max(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredmax_vs_b, int8_t, int8_t, H1, H1, DO_MAX, clearb)
-+GEN_VEXT_RED(vredmax_vs_h, int16_t, int16_t, H2, H2, DO_MAX, clearh)
-+GEN_VEXT_RED(vredmax_vs_w, int32_t, int32_t, H4, H4, DO_MAX, clearl)
-+GEN_VEXT_RED(vredmax_vs_d, int64_t, int64_t, H8, H8, DO_MAX, clearq)
-+
-+/* vd[0] = minu(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredminu_vs_b, uint8_t, uint8_t, H1, H1, DO_MIN, clearb)
-+GEN_VEXT_RED(vredminu_vs_h, uint16_t, uint16_t, H2, H2, DO_MIN, clearh)
-+GEN_VEXT_RED(vredminu_vs_w, uint32_t, uint32_t, H4, H4, DO_MIN, clearl)
-+GEN_VEXT_RED(vredminu_vs_d, uint64_t, uint64_t, H8, H8, DO_MIN, clearq)
-+
-+/* vd[0] = min(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredmin_vs_b, int8_t, int8_t, H1, H1, DO_MIN, clearb)
-+GEN_VEXT_RED(vredmin_vs_h, int16_t, int16_t, H2, H2, DO_MIN, clearh)
-+GEN_VEXT_RED(vredmin_vs_w, int32_t, int32_t, H4, H4, DO_MIN, clearl)
-+GEN_VEXT_RED(vredmin_vs_d, int64_t, int64_t, H8, H8, DO_MIN, clearq)
-+
-+/* vd[0] = and(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredand_vs_b, int8_t, int8_t, H1, H1, DO_AND, clearb)
-+GEN_VEXT_RED(vredand_vs_h, int16_t, int16_t, H2, H2, DO_AND, clearh)
-+GEN_VEXT_RED(vredand_vs_w, int32_t, int32_t, H4, H4, DO_AND, clearl)
-+GEN_VEXT_RED(vredand_vs_d, int64_t, int64_t, H8, H8, DO_AND, clearq)
-+
-+/* vd[0] = or(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredor_vs_b, int8_t, int8_t, H1, H1, DO_OR, clearb)
-+GEN_VEXT_RED(vredor_vs_h, int16_t, int16_t, H2, H2, DO_OR, clearh)
-+GEN_VEXT_RED(vredor_vs_w, int32_t, int32_t, H4, H4, DO_OR, clearl)
-+GEN_VEXT_RED(vredor_vs_d, int64_t, int64_t, H8, H8, DO_OR, clearq)
-+
-+/* vd[0] = xor(vs1[0], vs2[*]) */
-+GEN_VEXT_RED(vredxor_vs_b, int8_t, int8_t, H1, H1, DO_XOR, clearb)
-+GEN_VEXT_RED(vredxor_vs_h, int16_t, int16_t, H2, H2, DO_XOR, clearh)
-+GEN_VEXT_RED(vredxor_vs_w, int32_t, int32_t, H4, H4, DO_XOR, clearl)
-+GEN_VEXT_RED(vredxor_vs_d, int64_t, int64_t, H8, H8, DO_XOR, clearq)
---
-.27.0

-[PULL 48/63] target/riscv: vector wideing integer reduction instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-47-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  7 +++++++
- target/riscv/insn32.decode              |  2 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  4 ++++
- target/riscv/vector_helper.c            | 11 +++++++++++
-files changed, 24 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vredxor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vredxor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vredxor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vredxor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_6(vwredsumu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwredsumu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwredsumu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vredminu_vs     000100 . ..... ..... 010 ..... 1010111 @r_vm
- vredmin_vs      000101 . ..... ..... 010 ..... 1010111 @r_vm
- vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
- vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
-+vwredsumu_vs    110000 . ..... ..... 000 ..... 1010111 @r_vm
-+vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vredmin_vs, reduction_check)
- GEN_OPIVV_TRANS(vredand_vs, reduction_check)
- GEN_OPIVV_TRANS(vredor_vs, reduction_check)
- GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
-+
-+/* Vector Widening Integer Reduction Instructions */
-+GEN_OPIVV_WIDEN_TRANS(vwredsum_vs, reduction_check)
-+GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_RED(vredxor_vs_b, int8_t, int8_t, H1, H1, DO_XOR, clearb)
- GEN_VEXT_RED(vredxor_vs_h, int16_t, int16_t, H2, H2, DO_XOR, clearh)
- GEN_VEXT_RED(vredxor_vs_w, int32_t, int32_t, H4, H4, DO_XOR, clearl)
- GEN_VEXT_RED(vredxor_vs_d, int64_t, int64_t, H8, H8, DO_XOR, clearq)
-+
-+/* Vector Widening Integer Reduction Instructions */
-+/* signed sum reduction into double-width accumulator */
-+GEN_VEXT_RED(vwredsum_vs_b, int16_t, int8_t, H2, H1, DO_ADD, clearh)
-+GEN_VEXT_RED(vwredsum_vs_h, int32_t, int16_t, H4, H2, DO_ADD, clearl)
-+GEN_VEXT_RED(vwredsum_vs_w, int64_t, int32_t, H8, H4, DO_ADD, clearq)
-+
-+/* Unsigned sum reduction into double-width accumulator */
-+GEN_VEXT_RED(vwredsumu_vs_b, uint16_t, uint8_t, H2, H1, DO_ADD, clearh)
-+GEN_VEXT_RED(vwredsumu_vs_h, uint32_t, uint16_t, H4, H2, DO_ADD, clearl)
-+GEN_VEXT_RED(vwredsumu_vs_w, uint64_t, uint32_t, H8, H4, DO_ADD, clearq)
---
-.27.0

-[PULL 49/63] target/riscv: vector single-width floating-point reduction instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-48-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 10 +++++++
- target/riscv/insn32.decode              |  4 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  5 ++++
- target/riscv/vector_helper.c            | 39 +++++++++++++++++++++++++
-files changed, 58 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwredsumu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vwredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_6(vfredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredsum_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredmax_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredmax_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
- vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
- vwredsumu_vs    110000 . ..... ..... 000 ..... 1010111 @r_vm
- vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
-+# Vector ordered and unordered reduction sum
-+vfredsum_vs     0000-1 . ..... ..... 001 ..... 1010111 @r_vm
-+vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
-+vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
- /* Vector Widening Integer Reduction Instructions */
- GEN_OPIVV_WIDEN_TRANS(vwredsum_vs, reduction_check)
- GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
-+
-+/* Vector Single-Width Floating-Point Reduction Instructions */
-+GEN_OPFVV_TRANS(vfredsum_vs, reduction_check)
-+GEN_OPFVV_TRANS(vfredmax_vs, reduction_check)
-+GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_RED(vwredsum_vs_w, int64_t, int32_t, H8, H4, DO_ADD, clearq)
- GEN_VEXT_RED(vwredsumu_vs_b, uint16_t, uint8_t, H2, H1, DO_ADD, clearh)
- GEN_VEXT_RED(vwredsumu_vs_h, uint32_t, uint16_t, H4, H2, DO_ADD, clearl)
- GEN_VEXT_RED(vwredsumu_vs_w, uint64_t, uint32_t, H8, H4, DO_ADD, clearq)
-+
-+/* Vector Single-Width Floating-Point Reduction Instructions */
-+#define GEN_VEXT_FRED(NAME, TD, TS2, HD, HS2, OP, CLEAR_FN)\
-+void HELPER(NAME)(void *vd, void *v0, void *vs1,           \
-+                  void *vs2, CPURISCVState *env,           \
-+                  uint32_t desc)                           \
-+{                                                          \
-+    uint32_t mlen = vext_mlen(desc);                       \
-+    uint32_t vm = vext_vm(desc);                           \
-+    uint32_t vl = env->vl;                                 \
-+    uint32_t i;                                            \
-+    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;         \
-+    TD s1 =  *((TD *)vs1 + HD(0));                         \
-+                                                           \
-+    for (i = 0; i < vl; i++) {                             \
-+        TS2 s2 = *((TS2 *)vs2 + HS2(i));                   \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {         \
-+            continue;                                      \
-+        }                                                  \
-+        s1 = OP(s1, (TD)s2, &env->fp_status);              \
-+    }                                                      \
-+    *((TD *)vd + HD(0)) = s1;                              \
-+    CLEAR_FN(vd, 1, sizeof(TD), tot);                      \
-+}
-+
-+/* Unordered sum */
-+GEN_VEXT_FRED(vfredsum_vs_h, uint16_t, uint16_t, H2, H2, float16_add, clearh)
-+GEN_VEXT_FRED(vfredsum_vs_w, uint32_t, uint32_t, H4, H4, float32_add, clearl)
-+GEN_VEXT_FRED(vfredsum_vs_d, uint64_t, uint64_t, H8, H8, float64_add, clearq)
-+
-+/* Maximum value */
-+GEN_VEXT_FRED(vfredmax_vs_h, uint16_t, uint16_t, H2, H2, float16_maxnum, clearh)
-+GEN_VEXT_FRED(vfredmax_vs_w, uint32_t, uint32_t, H4, H4, float32_maxnum, clearl)
-+GEN_VEXT_FRED(vfredmax_vs_d, uint64_t, uint64_t, H8, H8, float64_maxnum, clearq)
-+
-+/* Minimum value */
-+GEN_VEXT_FRED(vfredmin_vs_h, uint16_t, uint16_t, H2, H2, float16_minnum, clearh)
-+GEN_VEXT_FRED(vfredmin_vs_w, uint32_t, uint32_t, H4, H4, float32_minnum, clearl)
-+GEN_VEXT_FRED(vfredmin_vs_d, uint64_t, uint64_t, H8, H8, float64_minnum, clearq)
---
-.27.0

-[PULL 50/63] target/riscv: vector widening floating-point reduction instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-49-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  3 ++
- target/riscv/insn32.decode              |  2 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  3 ++
- target/riscv/vector_helper.c            | 46 +++++++++++++++++++++++++
-files changed, 54 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
-+
-+DEF_HELPER_6(vfwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
- vfredsum_vs     0000-1 . ..... ..... 001 ..... 1010111 @r_vm
- vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
- vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
-+# Vector widening ordered and unordered float reduction sum
-+vfwredsum_vs    1100-1 . ..... ..... 001 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
- GEN_OPFVV_TRANS(vfredsum_vs, reduction_check)
- GEN_OPFVV_TRANS(vfredmax_vs, reduction_check)
- GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
-+
-+/* Vector Widening Floating-Point Reduction Instructions */
-+GEN_OPFVV_WIDEN_TRANS(vfwredsum_vs, reduction_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_FRED(vfredmax_vs_d, uint64_t, uint64_t, H8, H8, float64_maxnum, clearq)
- GEN_VEXT_FRED(vfredmin_vs_h, uint16_t, uint16_t, H2, H2, float16_minnum, clearh)
- GEN_VEXT_FRED(vfredmin_vs_w, uint32_t, uint32_t, H4, H4, float32_minnum, clearl)
- GEN_VEXT_FRED(vfredmin_vs_d, uint64_t, uint64_t, H8, H8, float64_minnum, clearq)
-+
-+/* Vector Widening Floating-Point Reduction Instructions */
-+/* Unordered reduce 2*SEW = 2*SEW + sum(promote(SEW)) */
-+void HELPER(vfwredsum_vs_h)(void *vd, void *v0, void *vs1,
-+                            void *vs2, CPURISCVState *env, uint32_t desc)
-+{
-+    uint32_t mlen = vext_mlen(desc);
-+    uint32_t vm = vext_vm(desc);
-+    uint32_t vl = env->vl;
-+    uint32_t i;
-+    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;
-+    uint32_t s1 =  *((uint32_t *)vs1 + H4(0));
-+
-+    for (i = 0; i < vl; i++) {
-+        uint16_t s2 = *((uint16_t *)vs2 + H2(i));
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-+            continue;
-+        }
-+        s1 = float32_add(s1, float16_to_float32(s2, true, &env->fp_status),
-+                         &env->fp_status);
-+    }
-+    *((uint32_t *)vd + H4(0)) = s1;
-+    clearl(vd, 1, sizeof(uint32_t), tot);
-+}
-+
-+void HELPER(vfwredsum_vs_w)(void *vd, void *v0, void *vs1,
-+                            void *vs2, CPURISCVState *env, uint32_t desc)
-+{
-+    uint32_t mlen = vext_mlen(desc);
-+    uint32_t vm = vext_vm(desc);
-+    uint32_t vl = env->vl;
-+    uint32_t i;
-+    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;
-+    uint64_t s1 =  *((uint64_t *)vs1);
-+
-+    for (i = 0; i < vl; i++) {
-+        uint32_t s2 = *((uint32_t *)vs2 + H4(i));
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-+            continue;
-+        }
-+        s1 = float64_add(s1, float32_to_float64(s2, &env->fp_status),
-+                         &env->fp_status);
-+    }
-+    *((uint64_t *)vd) = s1;
-+    clearq(vd, 1, sizeof(uint64_t), tot);
-+}
---
-.27.0

The following changes since commit 553cf5d7c47bee05a3dec9461c1f8430316d516b:

Merge remote-tracking branch 'remotes/pmaydell/tags/pull-target-arm-20200626' into staging (2020-06-26 18:22:36 +0100)

are available in the Git repository at:

git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200626-1

for you to fetch changes up to b39d59434ea10649fdb9e0a339c30c76e38c5e17:

target/riscv: configure and turn on vector extension from command line (2020-06-26 14:22:15 -0700)

----------------------------------------------------------------
This PR contains two patches to improve PLIC support in QEMU.

The rest of the PR is adding support for the v0.7.1 RISC-V vector
extensions. This is experimental support as the vector extensions are
still in a draft state.

----------------------------------------------------------------
Jessica Clarke (2):
      riscv: plic: Honour source priorities
      riscv: plic: Add a couple of mising sifive_plic_update calls

LIU Zhiwei (61):
      target/riscv: add vector extension field in CPURISCVState
      target/riscv: implementation-defined constant parameters
      target/riscv: support vector extension csr
      target/riscv: add vector configure instruction
      target/riscv: add an internals.h header
      target/riscv: add vector stride load and store instructions
      target/riscv: add vector index load and store instructions
      target/riscv: add fault-only-first unit stride load
      target/riscv: add vector amo operations
      target/riscv: vector single-width integer add and subtract
      target/riscv: vector widening integer add and subtract
      target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
      target/riscv: vector bitwise logical instructions
      target/riscv: vector single-width bit shift instructions
      target/riscv: vector narrowing integer right shift instructions
      target/riscv: vector integer comparison instructions
      target/riscv: vector integer min/max instructions
      target/riscv: vector single-width integer multiply instructions
      target/riscv: vector integer divide instructions
      target/riscv: vector widening integer multiply instructions
      target/riscv: vector single-width integer multiply-add instructions
      target/riscv: vector widening integer multiply-add instructions
      target/riscv: vector integer merge and move instructions
      target/riscv: vector single-width saturating add and subtract
      target/riscv: vector single-width averaging add and subtract
      target/riscv: vector single-width fractional multiply with rounding and saturation
      target/riscv: vector widening saturating scaled multiply-add
      target/riscv: vector single-width scaling shift instructions
      target/riscv: vector narrowing fixed-point clip instructions
      target/riscv: vector single-width floating-point add/subtract instructions
      target/riscv: vector widening floating-point add/subtract instructions
      target/riscv: vector single-width floating-point multiply/divide instructions
      target/riscv: vector widening floating-point multiply
      target/riscv: vector single-width floating-point fused multiply-add instructions
      target/riscv: vector widening floating-point fused multiply-add instructions
      target/riscv: vector floating-point square-root instruction
      target/riscv: vector floating-point min/max instructions
      target/riscv: vector floating-point sign-injection instructions
      target/riscv: vector floating-point compare instructions
      target/riscv: vector floating-point classify instructions
      target/riscv: vector floating-point merge instructions
      target/riscv: vector floating-point/integer type-convert instructions
      target/riscv: widening floating-point/integer type-convert instructions
      target/riscv: narrowing floating-point/integer type-convert instructions
      target/riscv: vector single-width integer reduction instructions
      target/riscv: vector wideing integer reduction instructions
      target/riscv: vector single-width floating-point reduction instructions
      target/riscv: vector widening floating-point reduction instructions
      target/riscv: vector mask-register logical instructions
      target/riscv: vector mask population count vmpopc
      target/riscv: vmfirst find-first-set mask bit
      target/riscv: set-X-first mask bit
      target/riscv: vector iota instruction
      target/riscv: vector element index instruction
      target/riscv: integer extract instruction
      target/riscv: integer scalar move instruction
      target/riscv: floating-point scalar move instructions
      target/riscv: vector slide instructions
      target/riscv: vector register gather instruction
      target/riscv: vector compress instruction
      target/riscv: configure and turn on vector extension from command line

target/riscv/cpu.h                      |   82 +-
 target/riscv/cpu_bits.h                 |   15 +
 target/riscv/helper.h                   | 1069 +++++++
 target/riscv/internals.h                |   41 +
 target/riscv/insn32-64.decode           |   11 +
 target/riscv/insn32.decode              |  372 +++
 hw/riscv/sifive_plic.c                  |   20 +-
 target/riscv/cpu.c                      |   50 +
 target/riscv/csr.c                      |   75 +-
 target/riscv/fpu_helper.c               |   33 +-
 target/riscv/insn_trans/trans_rvv.inc.c | 2888 ++++++++++++++++++
 target/riscv/translate.c                |   27 +-
 target/riscv/vector_helper.c            | 4899 +++++++++++++++++++++++++++++++
 target/riscv/Makefile.objs              |    2 +-
 14 files changed, 9534 insertions(+), 50 deletions(-)
 create mode 100644 target/riscv/internals.h
 create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
 create mode 100644 target/riscv/vector_helper.c

From: Jessica Clarke <jrtc27@jrtc27.com>

The source priorities can be used to order sources with respect to other
sources, not just as a way to enable/disable them based off a threshold.
We must therefore always claim the highest-priority source, rather than
the first source we find.

Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20200618202343.20455-1-jrtc27@jrtc27.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_plic.c | 17 ++++++++++++-----
 1 file changed, 12 insertions(+), 5 deletions(-)

diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/riscv/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
 static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
 {
     int i, j;
+    uint32_t max_irq = 0;
+    uint32_t max_prio = plic->target_priority[addrid];
+
     for (i = 0; i < plic->bitfield_words; i++) {
         uint32_t pending_enabled_not_claimed =
             (plic->pending[i] & ~plic->claimed[i]) &
@@ -XXX,XX +XXX,XX @@ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
             int irq = (i << 5) + j;
             uint32_t prio = plic->source_priority[irq];
             int enabled = pending_enabled_not_claimed & (1 << j);
-            if (enabled && prio > plic->target_priority[addrid]) {
-                sifive_plic_set_pending(plic, irq, false);
-                sifive_plic_set_claimed(plic, irq, true);
-                return irq;
+            if (enabled && prio > max_prio) {
+                max_irq = irq;
+                max_prio = prio;
             }
         }
     }
-    return 0;
+
+    if (max_irq) {
+        sifive_plic_set_pending(plic, max_irq, false);
+        sifive_plic_set_claimed(plic, max_irq, true);
+    }
+    return max_irq;
 }
 
 static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
-- 
2.27.0

From: Jessica Clarke <jrtc27@jrtc27.com>

Claiming an interrupt and changing the source priority both potentially
affect whether an interrupt is pending, thus we must re-compute xEIP.
Note that we don't put the sifive_plic_update inside sifive_plic_claim
so that the logging of a claim (and the resulting IRQ) happens before
the state update, making the causal effect clear, and that we drop the
explicit call to sifive_plic_print_state when claiming since
sifive_plic_update already does that automatically at the end for us.

This can result in both spurious interrupt storms if you fail to
complete an IRQ before enabling interrupts (and no other actions occur
that result in a call to sifive_plic_update), but also more importantly
lost interrupts if a disabled interrupt is pending and then becomes
enabled.

Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200618210649.22451-1-jrtc27@jrtc27.com
Message-Id: <20200618210649.22451-1-jrtc27@jrtc27.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_plic.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/riscv/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
                     plic->addr_config[addrid].hartid,
                     mode_to_char(plic->addr_config[addrid].mode),
                     value);
-                sifive_plic_print_state(plic);
             }
+            sifive_plic_update(plic);
             return value;
         }
     }
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
             qemu_log("plic: write priority: irq=%d priority=%d\n",
                 irq, plic->source_priority[irq]);
         }
+        sifive_plic_update(plic);
         return;
     } else if (addr >= plic->pending_base && /* 1 bit per source */
                addr < plic->pending_base + (plic->num_sources >> 3))
-- 
2.27.0